プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 http://mevius.5ch.net/test/read.cgi/tech/1516629503/
文字コード総合スレ Part12
レス数が950を超えています。1000を超えると書き込みができなくなります。
1デフォルトの名無しさん
2018/12/17(月) 16:48:24.47ID:Pfqpaohb877デフォルトの名無しさん
2021/04/21(水) 22:29:47.38ID:nyleF7PB お堅くwin32API叩いて書かれたバイナリの互換性は驚異的だよな
MSが気まぐれに出しては忘れるフレームワーク叩いてたら知らんが
バイナリ配布文化を育ててしまった原因でもあるが、ここまで大事にしてきたのにエンコード対応なんかで折れてもらっては残念
win10(64bit)でoffice97が元気に動くのは誇っていい
MSが気まぐれに出しては忘れるフレームワーク叩いてたら知らんが
バイナリ配布文化を育ててしまった原因でもあるが、ここまで大事にしてきたのにエンコード対応なんかで折れてもらっては残念
win10(64bit)でoffice97が元気に動くのは誇っていい
878デフォルトの名無しさん
2021/04/21(水) 23:04:31.38ID:tWbCEelV >>876
ロケール指定する処理が省かれたC言語アプリ全般
ロケール指定する処理が省かれたC言語アプリ全般
879デフォルトの名無しさん
2021/04/21(水) 23:10:54.40ID:U7I+mJcY >>878
だからそれはどれかって聞いてる
だからそれはどれかって聞いてる
880デフォルトの名無しさん
2021/04/21(水) 23:11:26.55ID:U7I+mJcY 大部分と言う割に、事例を一個も思いつかないなら矛盾してる
881デフォルトの名無しさん
2021/04/21(水) 23:20:34.30ID:tWbCEelV Cで書かれたレガシープログラムほぼ全部なので挙げるまでもないんだけど、有名どころだとPerlだね
システムコード以外の文字を含むファイル名をperlに引数で渡せない
システムコード以外の文字を含むファイル名をperlに引数で渡せない
882デフォルトの名無しさん
2021/04/21(水) 23:26:30.87ID:tWbCEelV Cで書かれたmain()関数にはシステムコードページで引数が渡されるのだけど、その時点で文字化けしてるので復元不能。
883デフォルトの名無しさん
2021/04/22(木) 09:25:25.74ID:lWdVtKH+884デフォルトの名無しさん
2021/04/22(木) 11:05:09.03ID:24mwOh0d このスレ読んでるとハゲそう
885デフォルトの名無しさん
2021/04/22(木) 11:48:03.64ID:cA5EjL24 >>867
勿論普及してたからはあるだろうけど、そもそも変えるとかまた作り直すとかいう発想が無かったんじゃないかな。
ASCII制定→ISO 646制定→各国で変えられるのは10文字とか足りる訳無いだろ!→
ASCIIを拡張して8ビットフルに使おう→ISO 8859制定
とかそんな流れでしょ、増やして積んでけばいいと。当時のことは資料でしか知らないけどたぶん。
勿論普及してたからはあるだろうけど、そもそも変えるとかまた作り直すとかいう発想が無かったんじゃないかな。
ASCII制定→ISO 646制定→各国で変えられるのは10文字とか足りる訳無いだろ!→
ASCIIを拡張して8ビットフルに使おう→ISO 8859制定
とかそんな流れでしょ、増やして積んでけばいいと。当時のことは資料でしか知らないけどたぶん。
886デフォルトの名無しさん
2021/04/22(木) 20:15:21.29ID:H07mHdZr メールで添付ファイルを送ろうとしたらbase64でエンコードされたせいで容量オーバーした
ネットワークのトラフィックを減らすためにもメールでバイナリデータをエンコード無しで送れるのが標準化すればいいのに
ネットワークのトラフィックを減らすためにもメールでバイナリデータをエンコード無しで送れるのが標準化すればいいのに
887デフォルトの名無しさん
2021/04/22(木) 22:46:03.04ID:XWZJYEFR いち早く国際化はずのjavaもシステムのコードページでしか引数を受け取れない制約がある
888デフォルトの名無しさん
2021/04/23(金) 00:48:19.99ID:/P9+MOWj ほんまに?
Unicode対応していながら_wmain()とかGetCommandLineW()使ってないとは信じがたいが
Unicode対応していながら_wmain()とかGetCommandLineW()使ってないとは信じがたいが
889デフォルトの名無しさん
2021/04/23(金) 01:33:18.30ID:dmQwGyWy890デフォルトの名無しさん
2021/04/23(金) 03:25:56.54ID:z5iGgWRG Windows 専用ソフトでなくて、複数のOSに対応したソフトは当然そうなる。
特に Unix 系からの移植ならロケールをコードページに対応させるのは当たり前。
Windows独自の特殊APIで実装とか頭の悪いローカル変更は極力しない。
特に Unix 系からの移植ならロケールをコードページに対応させるのは当たり前。
Windows独自の特殊APIで実装とか頭の悪いローカル変更は極力しない。
891デフォルトの名無しさん
2021/04/23(金) 03:27:43.26ID:Apsl8RTN というか単にC言語がASCII互換の文字コードしか
対応できないんだよな
そこは言語側の問題だと思う
対応できないんだよな
そこは言語側の問題だと思う
892デフォルトの名無しさん
2021/04/23(金) 03:29:09.72ID:Apsl8RTN 例えばJavaとかはUnicode前提で設計されてるから
当然Javaで作った複数のOS対応のソフトは
WindowsでもUnicodeが使える
これは殆どの言語に当てはまると思う
C#、JavaScript、Ruby、Python、などなど
当然Javaで作った複数のOS対応のソフトは
WindowsでもUnicodeが使える
これは殆どの言語に当てはまると思う
C#、JavaScript、Ruby、Python、などなど
893デフォルトの名無しさん
2021/04/23(金) 03:30:29.26ID:Apsl8RTN そういやC言語はマルチバイト対応の機能は標準化されてないんだっけ?
流石にC++は標準化されてるよな?
流石にC++は標準化されてるよな?
894デフォルトの名無しさん
2021/04/23(金) 04:04:31.01ID:dmQwGyWy <locale>ヘッダがマルチバイト対応を実現してくれる
問題は誰もlocaleの機能を使ってないことだ
問題は誰もlocaleの機能を使ってないことだ
895デフォルトの名無しさん
2021/04/23(金) 07:26:19.86ID:Apsl8RTN おや?<locale>ヘッダとはなんのためにあるのでしょう?
使わなくても多言語対応できるのだったのでは?(苦笑)
使わなくても多言語対応できるのだったのでは?(苦笑)
896デフォルトの名無しさん
2021/04/23(金) 09:16:27.68ID:z5iGgWRG CがASCII互換じゃないと駄目ってどこの異世界。そんなもんコンパイラの実装次第。
規格では他の文字コードも考慮されてる。
実際 EBCDIC ですら動くやつあるのに。
規格では他の文字コードも考慮されてる。
実際 EBCDIC ですら動くやつあるのに。
897デフォルトの名無しさん
2021/04/23(金) 09:17:21.12ID:z5iGgWRG >>893
POSIX
POSIX
898デフォルトの名無しさん
2021/04/23(金) 13:53:41.29ID:z7/roYpD899デフォルトの名無しさん
2021/04/23(金) 22:37:45.17ID:z5iGgWRG >>898
意味わからない。wchar はC言語とは認めない主義の人かな?
意味わからない。wchar はC言語とは認めない主義の人かな?
900デフォルトの名無しさん
2021/04/23(金) 23:40:40.33ID:vWq/Hknp 別にnull終端文字列を使うのがスタンダードかつ標準ライブラリもそう期待しているというだけであって、好きに実装したらいいよ
ぶっちゃけ舐めないと文字列長決められないので性能がスケーラブルでないし、null文字衝突の問題もあるし筋が良くない
マトモなCで書かれたテキスト関連アプリ、特にエディタでヌル終端文字列使ってるのなんて皆無だろ
普通はrope、もう少しカジュアルならパスカルストリング
ぶっちゃけ舐めないと文字列長決められないので性能がスケーラブルでないし、null文字衝突の問題もあるし筋が良くない
マトモなCで書かれたテキスト関連アプリ、特にエディタでヌル終端文字列使ってるのなんて皆無だろ
普通はrope、もう少しカジュアルならパスカルストリング
901デフォルトの名無しさん
2021/04/23(金) 23:42:50.22ID:hyXGjiN1 wcharω
902デフォルトの名無しさん
2021/04/23(金) 23:45:37.62ID:vWq/Hknp そもそも今時ゴミstdlib引いてC書く時点でアッて感じだし(組み込み等以外)
903デフォルトの名無しさん
2021/04/24(土) 01:15:41.82ID:lum8vFBO904デフォルトの名無しさん
2021/04/24(土) 01:31:51.75ID:+S3huMNR wmain() ってC言語じゃないの?
905デフォルトの名無しさん
2021/04/24(土) 11:01:26.61ID:h7gEVqDL906デフォルトの名無しさん
2021/04/24(土) 11:04:54.55ID:fOHAtvcd OS l17n
907デフォルトの名無しさん
2021/04/24(土) 13:26:44.28ID:A8uXloOI C言語を捨てろと言ってるんだろ
他の言語に移ったところで文字コードから逃れることはできないがな
他の言語に移ったところで文字コードから逃れることはできないがな
908デフォルトの名無しさん
2021/04/24(土) 15:17:08.03ID:iyr+Gwkk >>905
アプリケーションの話
アプリケーションの話
909デフォルトの名無しさん
2021/04/24(土) 15:48:16.06ID:lum8vFBO >>907
他の言語はWindowsのUnicodeにちゃんと対応してる
他の言語はWindowsのUnicodeにちゃんと対応してる
910デフォルトの名無しさん
2021/04/24(土) 15:57:56.64ID:lkpB631F911デフォルトの名無しさん
2021/04/24(土) 16:15:59.56ID:lum8vFBO 結局の所Unicode対応ができてないのはC/C++の言語自体と
無能なC/C++プログラマが根本的な原因なんだよな
無能なくせにクソ言語を使うなと
無能なC/C++プログラマが根本的な原因なんだよな
無能なくせにクソ言語を使うなと
912デフォルトの名無しさん
2021/04/24(土) 17:52:30.16ID:h7gEVqDL OSなどの実行環境まで含めて全部をセルフ記述できる言語だけがC言語をけなして良い。
C言語の代わりになる高級アセンブラとか存在しないのが実情。
C言語の代わりになる高級アセンブラとか存在しないのが実情。
913デフォルトの名無しさん
2021/04/24(土) 19:43:48.66ID:lum8vFBO Windowsを全部セフル記述できる人だけが、Windowsをけなしていい
914デフォルトの名無しさん
2021/04/24(土) 19:44:10.19ID:lum8vFBO 訂正
Windowsを全部セルフ記述できる人だけが、Windowsをけなしていい
Windowsを全部セルフ記述できる人だけが、Windowsをけなしていい
915デフォルトの名無しさん
2021/04/25(日) 01:01:32.24ID:mV4e9R8D >>912
C言語(とその派生)が無くなると世の中のほぼ全ての言語が一緒に死ぬからなあ。
ハンドアセンブルのマシン語は残るとして他に生き残りそうなやつって何があるだろうか?
汎用機のCOBOLとかなら大丈夫か?
C言語で使えない文字コードとかあったらゴミだな。
C言語(とその派生)が無くなると世の中のほぼ全ての言語が一緒に死ぬからなあ。
ハンドアセンブルのマシン語は残るとして他に生き残りそうなやつって何があるだろうか?
汎用機のCOBOLとかなら大丈夫か?
C言語で使えない文字コードとかあったらゴミだな。
916デフォルトの名無しさん
2021/04/25(日) 09:44:53.64ID:5WfSbj4L Lisp MachineではFortranもCもlispで書かれていたのじゃよ、もうlisp専用ハードが無いけど…
今のハードがほぼC用に設計されているというだけ
それでもソフト資産が莫大だからCエミュレータは不滅だろうが
今のハードがほぼC用に設計されているというだけ
それでもソフト資産が莫大だからCエミュレータは不滅だろうが
917デフォルトの名無しさん
2021/04/25(日) 12:49:28.15ID:mV4e9R8D lispマシンは滅びたのじゃよ。
javaマシンは産まれもしなかった。
別に今のCPUがCに合わせて設計されてるわけではない。
Cのオプティマイザーが頑張って今のCPUにあわせてるだけ。
lisp で lisp コンパイラと CPU オプティマイザ書けば理論的には同じことができるはずだけど誰もしようとしないだけ。
これ以上はスレチだな。
javaマシンは産まれもしなかった。
別に今のCPUがCに合わせて設計されてるわけではない。
Cのオプティマイザーが頑張って今のCPUにあわせてるだけ。
lisp で lisp コンパイラと CPU オプティマイザ書けば理論的には同じことができるはずだけど誰もしようとしないだけ。
これ以上はスレチだな。
918デフォルトの名無しさん
2021/04/25(日) 13:07:14.30ID:FGclKzDI lispマシンのタグ付き思想はBOMに近いから関係ない事もないと思う
違うのは自動でオブジェクト=型+ワードから値だけ取り出す機構が(普及して)無いところだな
動的言語がこのまま持て囃され続ければ、ハードウェアGCの可能なlispマシン風ハードが出るかもしれん、何十年後になるか知らんが
違うのは自動でオブジェクト=型+ワードから値だけ取り出す機構が(普及して)無いところだな
動的言語がこのまま持て囃され続ければ、ハードウェアGCの可能なlispマシン風ハードが出るかもしれん、何十年後になるか知らんが
919デフォルトの名無しさん
2021/04/25(日) 13:18:17.37ID:FGclKzDI アドレス付け単位としてのバイトが8bitでは効率良く型(あるいはエンコ)情報付けるのは厳しいな
文字単位で付けると少なくとも16bitになってしまう
やっぱり36bit時代の話だね
文字単位で付けると少なくとも16bitになってしまう
やっぱり36bit時代の話だね
920デフォルトの名無しさん
2021/04/25(日) 13:47:52.95ID:y4+cdB21 Jazelle...
921デフォルトの名無しさん
2021/04/26(月) 14:21:24.82ID:REE9nEfp lispすげーの人は夢を語りすぎ
鏡観ろ
鏡観ろ
922デフォルトの名無しさん
2021/04/29(木) 14:26:38.37ID:Wx+1i7qD やっぱりヤンキーはASCIIのことしか考えてないのか
Copying non-ASCII characters from Windows to WSLg broken
https://github.com/microsoft/wslg/issues/20
Copying non-ASCII characters from Windows to WSLg broken
https://github.com/microsoft/wslg/issues/20
923デフォルトの名無しさん
2021/04/29(木) 22:05:53.91ID:aEwK4kMw WSLgはまだプレビュー版やろ
924デフォルトの名無しさん
2021/04/30(金) 19:55:54.85ID:m/tHuDzV ヨーロッパの人もびっくりといったところでしょうか
925デフォルトの名無しさん
2021/05/10(月) 21:21:31.93ID:dIUUxNIr CP932やUTF-8で保存されたテキストファイルをバイナリエディタで見る時、
0x0Dと0x0Aは常にCR・LFに対応するという理解であっていますか
例えば"東"は以下のように保存されますが、0x0Dや0x0Aが含まれる字が存在しない事を確かめたいです。
UTF-8: e6 9d b1
CP932: 93 8c
尚、ファイルは破損しておらず、デコードできない文字は含まれていません
0x0Dと0x0Aは常にCR・LFに対応するという理解であっていますか
例えば"東"は以下のように保存されますが、0x0Dや0x0Aが含まれる字が存在しない事を確かめたいです。
UTF-8: e6 9d b1
CP932: 93 8c
尚、ファイルは破損しておらず、デコードできない文字は含まれていません
926デフォルトの名無しさん
2021/05/10(月) 21:32:43.96ID:P0pDB+XT >>925
WikipediaのCP932とUTF-8の記事見てみ
WikipediaのCP932とUTF-8の記事見てみ
927デフォルトの名無しさん
2021/05/10(月) 21:51:44.48ID:dIUUxNIr928デフォルトの名無しさん
2021/05/10(月) 22:22:18.55ID:ViCp850r プログラミングのお題スレ Part18
https://mevius.5ch.net/test/read.cgi/tech/1594702426/453
UTF-8 では、先頭ニブル(4ビット)が0なのは、1バイト文字だけだから、
0x0D・0x0A は、1バイト文字だけしかない
https://mevius.5ch.net/test/read.cgi/tech/1594702426/453
UTF-8 では、先頭ニブル(4ビット)が0なのは、1バイト文字だけだから、
0x0D・0x0A は、1バイト文字だけしかない
929デフォルトの名無しさん
2021/05/10(月) 22:33:39.19ID:+j6JaQYv MSのCP932や、UTF8はASCIIの上位互換。
つまり 0x0A とかは同じ解釈でいける。
UTF16とかUTF32とかは上位互換じゃないので駄目。
つまり 0x0A とかは同じ解釈でいける。
UTF16とかUTF32とかは上位互換じゃないので駄目。
930デフォルトの名無しさん
2021/05/10(月) 23:26:10.90ID:P0pDB+XT >>927
どのあたりが難しかった? 煽りじゃなくて
どのあたりが難しかった? 煽りじゃなくて
931デフォルトの名無しさん
2021/05/11(火) 00:05:10.05ID:0t6JOZiV932デフォルトの名無しさん
2021/05/11(火) 00:06:36.86ID:0t6JOZiV 長すぎたので分割しました
>>930
うわ、どっちも文字がいっぱい……
UTF-8のページ
「エンコード体系」の表が関係しそうだなあ、でもよくわからんなあ。何故2進で書いたし……
今
あ、16進表記の列もあったのか。どれどれ…、あ、0x80以上なのか。じゃあ0D 0Aを含む文字はないんだなあ
CP932のページ
「構造」の表が関係しそうだなあ、でもこれはutf-8のサブセットのことを言っているのかな、それは知っているけどなあ
うーん、でも他に関連しそうな記載は見つけられないなあ
今
あ、CP932って必ず2バイトに収まるのか?そしたら第2バイトの0x00-0x3Fが未使用だから、0x0Dと0x0Aは常にCR・LFと対応すると言って良さそうだなあ
>>930
うわ、どっちも文字がいっぱい……
UTF-8のページ
「エンコード体系」の表が関係しそうだなあ、でもよくわからんなあ。何故2進で書いたし……
今
あ、16進表記の列もあったのか。どれどれ…、あ、0x80以上なのか。じゃあ0D 0Aを含む文字はないんだなあ
CP932のページ
「構造」の表が関係しそうだなあ、でもこれはutf-8のサブセットのことを言っているのかな、それは知っているけどなあ
うーん、でも他に関連しそうな記載は見つけられないなあ
今
あ、CP932って必ず2バイトに収まるのか?そしたら第2バイトの0x00-0x3Fが未使用だから、0x0Dと0x0Aは常にCR・LFと対応すると言って良さそうだなあ
933デフォルトの名無しさん
2021/05/11(火) 01:30:17.15ID:c3IDGufy CP932に依存するコードを車輪の再発明するのはやめたほうがいい
UTF16を介して処理するのが堅実だよ
UTF16を介して処理するのが堅実だよ
934デフォルトの名無しさん
2021/05/11(火) 02:38:12.81ID:1enRFFJU CP932だと絵文字が入ったファイル名とか扱えないからね
WindowsがUnicodeなんだからそれに従ったほうが良い
WindowsがUnicodeなんだからそれに従ったほうが良い
935デフォルトの名無しさん
2021/05/11(火) 06:46:10.57ID:InyAS07X936デフォルトの名無しさん
2021/05/11(火) 09:39:59.91ID:Gl0wmygZ937デフォルトの名無しさん
2021/05/11(火) 09:55:14.95ID:c3IDGufy >>936
プログラミングやったことない人は回答しなくていいから
プログラミングやったことない人は回答しなくていいから
938デフォルトの名無しさん
2021/05/11(火) 10:46:32.40ID:FWZS8iTB939デフォルトの名無しさん
2021/05/11(火) 10:47:04.26ID:FWZS8iTB940デフォルトの名無しさん
2021/05/11(火) 15:53:24.06ID:R6EacYeM941デフォルトの名無しさん
2021/05/11(火) 15:59:10.29ID:fJhAJw72 なんでUTF-8で全世界統一しないんですか?
2000年問題みたいにやっちゃやーいいのに
2000年問題みたいにやっちゃやーいいのに
942デフォルトの名無しさん
2021/05/11(火) 16:02:46.19ID:c3IDGufy >>940
WindowsのCライブラリはUTF-32には対応してないんだよ
WindowsのCライブラリはUTF-32には対応してないんだよ
943デフォルトの名無しさん
2021/05/11(火) 17:51:32.38ID:/14fii8B 2000年問題?
944デフォルトの名無しさん
2021/05/11(火) 18:03:59.53ID:jUIDYAvI >プログラムしたことがない
話や知識がかみあってない人は描いてる内容や雰囲気で判るけどな
プログラムしたことがあっても特定の分野に疎いとか
色々勘違いして覚えてるとか知識が偏ってるとかな
話や知識がかみあってない人は描いてる内容や雰囲気で判るけどな
プログラムしたことがあっても特定の分野に疎いとか
色々勘違いして覚えてるとか知識が偏ってるとかな
945デフォルトの名無しさん
2021/05/11(火) 18:12:43.26ID:c3IDGufy ICUはUTF-16がメインだよ。ソースとか見たことないの?
946デフォルトの名無しさん
2021/05/11(火) 19:09:36.09ID:fJhAJw72 >>943
2000年問題の時は全世界で一斉に改修しただろ
文字コードも同様に全世界で一斉にUTF-8にすればいい
SJISとかEUCとか使ってソフトはDeprecatedに指定して
もう二年したら使えなくなるぞ、(#゚Д゚) 凸ゴルァ!!、と伝えればすべての問題が解決
2000年問題の時は全世界で一斉に改修しただろ
文字コードも同様に全世界で一斉にUTF-8にすればいい
SJISとかEUCとか使ってソフトはDeprecatedに指定して
もう二年したら使えなくなるぞ、(#゚Д゚) 凸ゴルァ!!、と伝えればすべての問題が解決
947デフォルトの名無しさん
2021/05/11(火) 19:17:31.49ID:vh9Kat/q おまえ明日から使用言語は英語な
明日まで翻訳終えられなかった日本語の文書は破棄するように
明日まで翻訳終えられなかった日本語の文書は破棄するように
948デフォルトの名無しさん
2021/05/11(火) 19:31:09.73ID:fJhAJw72949デフォルトの名無しさん
2021/05/11(火) 19:51:27.17ID:6D07FFeW じゃあ二年後の正月から日本全体で電気は50Hzな
例外は認めない
例外は認めない
950デフォルトの名無しさん
2021/05/11(火) 20:07:39.07ID:fJhAJw72 >>947
OK, it doesn't matter to me.
I currently live on the 50Hz-side.
Seriously, what the fuck is the matter to change all charsets to UTF-8?
At least, we have to start writing all characters in UTF-8.
You guys are just procrastinating the problem to the later generation.
OK, it doesn't matter to me.
I currently live on the 50Hz-side.
Seriously, what the fuck is the matter to change all charsets to UTF-8?
At least, we have to start writing all characters in UTF-8.
You guys are just procrastinating the problem to the later generation.
951デフォルトの名無しさん
2021/05/11(火) 20:37:23.10ID:GFoNMADL 哎呀〜
952デフォルトの名無しさん
2021/05/11(火) 20:47:14.11ID:vh9Kat/q >>942
へんな言い方ですね
「Windows の C ライブラリ」ではなくて、Windows のシステムコール=win32api というべきなのでは?
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
へんな言い方ですね
「Windows の C ライブラリ」ではなくて、Windows のシステムコール=win32api というべきなのでは?
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
>>945
UTF-16 は Windows 等の特定用途なのでは?
むしろ正義は UTF-32 にあるでしょう
Shift-JIS や EUC は時代遅れだ、という意見には同意せざるを得ないのですが、だからといって、UTF-16 を提案するというのは、かえって悪手というか、頭が変なんじゃないかと私は考えます
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
UTF-16 は Windows 等の特定用途なのでは?
むしろ正義は UTF-32 にあるでしょう
Shift-JIS や EUC は時代遅れだ、という意見には同意せざるを得ないのですが、だからといって、UTF-16 を提案するというのは、かえって悪手というか、頭が変なんじゃないかと私は考えます
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
そんなんじゃ駄目だ
>>949
50Hz は当時のドイツの会社「アルゲマイネ・エレクトリツィテート・ゲゼルシャフト」社から、
60Hz は当時の米国の会社「ゼネラル・エレクトリック」社から来ています
もし英語を第一言語に主張するのならば、50Hz ではなくて 60Hz が本流でしょう‥‥
実際、今で合衆国・カナダ・メキシコは 60Hz の国ですし
50Hz は当時のドイツの会社「アルゲマイネ・エレクトリツィテート・ゲゼルシャフト」社から、
60Hz は当時の米国の会社「ゼネラル・エレクトリック」社から来ています
もし英語を第一言語に主張するのならば、50Hz ではなくて 60Hz が本流でしょう‥‥
実際、今で合衆国・カナダ・メキシコは 60Hz の国ですし
958デフォルトの名無しさん
2021/05/11(火) 21:41:17.35ID:fJhAJw72 >>952
No, no, no, no, ... YOU suggested first.
No, no, no, no, ... YOU suggested first.
959デフォルトの名無しさん
2021/05/11(火) 21:58:18.19ID:fJhAJw72 >>954
いいですよ、UTF-32は一度も使ったことないですけど、
全世界で文字コードが統一されるなら協力しますよ。
自分はマなんですけど(って、ここにいる全員そうか)、
毎回文字コードの問題が浮上するたびに統一しろよと思ってきました。
UTF-8が出た時は「これでやっと統一される!」と思ってたら、ちっとも変わってない。
どこの馬鹿が舵切ってないんですか?
こんなもん、トップダウンでやらんと意味が無い。
蛇足だが、50Hz/60Hzも本気で統一すればいい。
地デジでアナログテレビを駆逐したんだからやれないことはない。
車の左側/右側通行も世界共通で左側通行にすべき。
いいですよ、UTF-32は一度も使ったことないですけど、
全世界で文字コードが統一されるなら協力しますよ。
自分はマなんですけど(って、ここにいる全員そうか)、
毎回文字コードの問題が浮上するたびに統一しろよと思ってきました。
UTF-8が出た時は「これでやっと統一される!」と思ってたら、ちっとも変わってない。
どこの馬鹿が舵切ってないんですか?
こんなもん、トップダウンでやらんと意味が無い。
蛇足だが、50Hz/60Hzも本気で統一すればいい。
地デジでアナログテレビを駆逐したんだからやれないことはない。
車の左側/右側通行も世界共通で左側通行にすべき。
960デフォルトの名無しさん
2021/05/11(火) 22:01:33.58ID:62zfmCQO Ubuntu は、UTF-32 だけど、英語圏では後半の2バイトが無駄。
メモリ使用量が、UTF-16 の2倍
だからWindows などの昔のOS は、UTF-16・サロゲートペアを使っている
メモリ使用量が、UTF-16 の2倍
だからWindows などの昔のOS は、UTF-16・サロゲートペアを使っている
>>959
>50Hz/60Hzも本気で統一すればいい。
無理です……
変電・配電設備はどれも 50Hz/60Hz それぞれに専用で、もう一方の周波数には対応できません
仮に 60 Hz をやめて 50Hz に統一するとすると、西日本の電気設備は全部更新しないといけません、部品が全然足りなくて、多分西日本は3年くらい停電、電気なしの生活になりますね……
>50Hz/60Hzも本気で統一すればいい。
無理です……
変電・配電設備はどれも 50Hz/60Hz それぞれに専用で、もう一方の周波数には対応できません
仮に 60 Hz をやめて 50Hz に統一するとすると、西日本の電気設備は全部更新しないといけません、部品が全然足りなくて、多分西日本は3年くらい停電、電気なしの生活になりますね……
>>960
いまどき 32GiB RAM が常識な世の中で、後半の 2 バイトが無駄とかみみちいですね、そんなんじゃ駄目だ……
いまどき 32GiB RAM が常識な世の中で、後半の 2 バイトが無駄とかみみちいですね、そんなんじゃ駄目だ……
963デフォルトの名無しさん
2021/05/11(火) 22:35:13.63ID:6D07FFeW じゃあ明日から「円」は廃止「ドル」しか使えない
「メートル」は廃止してインチ、フィート、ヤード、マイルで
「摂氏」は廃止して華氏
「リットル」は廃止してガロン
これでアメリカと互換だぞ
便利だろ?
「メートル」は廃止してインチ、フィート、ヤード、マイルで
「摂氏」は廃止して華氏
「リットル」は廃止してガロン
これでアメリカと互換だぞ
便利だろ?
>>963
国民皆保険すらない後進国にあわせるのですか?
国民皆保険すらない後進国にあわせるのですか?
965デフォルトの名無しさん
2021/05/12(水) 00:04:08.19ID:XehBH/T/ >>962
組込み用途では相変わらず厳しい制限があるだろ
組込み用途では相変わらず厳しい制限があるだろ
966デフォルトの名無しさん
2021/05/12(水) 00:56:08.99ID:w4TAZAbA >>959
何をいってんの? Unicodeの目的は「これからは」単一の文字コードで
世界中の文字を表現すること
過去の資産を無くすためじゃない
それからUTF-8はな、せっかくUTF-16に統一しようとしていたのに
Unicode団体でな無い所が新たに追加した文字コードだぞ
UTF-8がでたときは「また文字コード増やしたのかよ」って思うはずなんだが
何をいってんの? Unicodeの目的は「これからは」単一の文字コードで
世界中の文字を表現すること
過去の資産を無くすためじゃない
それからUTF-8はな、せっかくUTF-16に統一しようとしていたのに
Unicode団体でな無い所が新たに追加した文字コードだぞ
UTF-8がでたときは「また文字コード増やしたのかよ」って思うはずなんだが
967デフォルトの名無しさん
2021/05/12(水) 01:47:55.23ID:VbRrwICc あーもー!結局次が決まらんならS-JIS使い続けようぜ!
968デフォルトの名無しさん
2021/05/12(水) 02:24:31.19ID:S+EDWDjz >>965
組み込み用途では制限が厳しいのでUTF16を使いますwww
お前、組み込みでどれだけ文字処理してんの?
いや、UTF8やUTF32じゃ駄目でUTF16じゃんないと制限に引っかる最近の実例があったの?
あったら具体例教えてほしい。
組み込み用途では制限が厳しいのでUTF16を使いますwww
お前、組み込みでどれだけ文字処理してんの?
いや、UTF8やUTF32じゃ駄目でUTF16じゃんないと制限に引っかる最近の実例があったの?
あったら具体例教えてほしい。
969デフォルトの名無しさん
2021/05/12(水) 02:26:01.47ID:Wqknze8k Cコンパイラがwchar_t型をUTF16とするかUTF32とするか次第じゃね
970デフォルトの名無しさん
2021/05/12(水) 02:35:18.26ID:S+EDWDjz >>966
だってUTF16がインターネットでの使用をまともに考慮して無かったので仕方ない。
unicode以前からインターネットは既に存在していて基本ASCIIベースだったので、それの上位互換がnetで普及するのは当然の流れ。
文字数が16ビットじゃ足りないことと、インターネットの普及を予測できなかったUnicodeコンソーシアムの不見識がUTF16の原因。
だってUTF16がインターネットでの使用をまともに考慮して無かったので仕方ない。
unicode以前からインターネットは既に存在していて基本ASCIIベースだったので、それの上位互換がnetで普及するのは当然の流れ。
文字数が16ビットじゃ足りないことと、インターネットの普及を予測できなかったUnicodeコンソーシアムの不見識がUTF16の原因。
971デフォルトの名無しさん
2021/05/12(水) 02:49:55.29ID:Wqknze8k UTF8を使うにしても、SJIS -> UTF16 or UTF32 -> UTF8 と変換するからやってることは同じなんだよ
972デフォルトの名無しさん
2021/05/12(水) 03:26:27.16ID:rVJ0Zld2 >>970
なんで文字コードがインターネットの使用を考慮しないといけないかもわからないし
インターネットでUTF-16が使えるのに、考慮してないというする理由もわからない
もしかしてネットサーフィン(笑)をインターネットという爺かお前
なんで文字コードがインターネットの使用を考慮しないといけないかもわからないし
インターネットでUTF-16が使えるのに、考慮してないというする理由もわからない
もしかしてネットサーフィン(笑)をインターネットという爺かお前
973デフォルトの名無しさん
2021/05/12(水) 03:27:38.25ID:rVJ0Zld2 ASCIIは7ビットなんだからUTF-8だって非対応なんだがw
974デフォルトの名無しさん
2021/05/12(水) 09:38:08.51ID:HCx7UYF5 >>959
言いたいことは判るが
君の発言はアーカイブとか文書の問題とすりかわってないか?
βのテープなんてまだあちこちにごろごろしてるだろ?
MO/MDなんかもまだあるだろ?
そのうちHDDもなくなってSSDばかりになるだろうがHDDはなくならないだろ?
新しいものはそっちで作っても古い方は面倒だから移動なんてしないだろ?
言いたいことは判るが
君の発言はアーカイブとか文書の問題とすりかわってないか?
βのテープなんてまだあちこちにごろごろしてるだろ?
MO/MDなんかもまだあるだろ?
そのうちHDDもなくなってSSDばかりになるだろうがHDDはなくならないだろ?
新しいものはそっちで作っても古い方は面倒だから移動なんてしないだろ?
975デフォルトの名無しさん
2021/05/12(水) 11:26:29.20ID:rw/WEf9V 馬鹿メリカ式だと今日がこんなのになってしまう
5.12.2021
こんなの混ぜたら5月12日なのか12月5日なのか判別できずに混乱が生じる
混乱の対象となるのは各月12日までで月≠日のパターン(12*12-12=132通り)
年のうち36%もの日で混乱が生じている
馬鹿メリカ式さえ排除すれば大体うまくいくのだ
5.12.2021
こんなの混ぜたら5月12日なのか12月5日なのか判別できずに混乱が生じる
混乱の対象となるのは各月12日までで月≠日のパターン(12*12-12=132通り)
年のうち36%もの日で混乱が生じている
馬鹿メリカ式さえ排除すれば大体うまくいくのだ
976デフォルトの名無しさん
2021/05/12(水) 11:31:17.70ID:S+EDWDjz >>973
プロトコルを拡張する時に上位互換の拡張が求められる、っていう常識すら知らないの?
まともに規格作ったり、実装したことないのかな。
一度動きだしたものは変更コストができるだけ小さい拡張が普及するんだよ。
プロトコルを拡張する時に上位互換の拡張が求められる、っていう常識すら知らないの?
まともに規格作ったり、実装したことないのかな。
一度動きだしたものは変更コストができるだけ小さい拡張が普及するんだよ。
レス数が950を超えています。1000を超えると書き込みができなくなります。
ニュース
- 【次の一手】台湾問題で小林よしのり氏が私見「まさに戦争前夜」「ただちに徴兵制を敷いて、高市支持者を最前線へ」… [BFU★]
- 【速報】中国、水産物輸入停止と通達 「処理水」理由、日本政府へ ★7 [おっさん友の会★]
- 【速報】中国外務省報道官 高市首相発言撤回なければ「断固たる対抗措置」 [蚤の市★]
- 高市首相答弁を“引き出した”立民・岡田克也氏が改めて説明「なぜ慎重な答弁をされなかったのか。非常に残念に思っている」 ★3 [ぐれ★]
- 「高市人気」どこに? 自民候補が福島市長選で大敗、葛飾区議選でも苦戦 衆院早期解散論に冷や水 [1ゲットロボ★]
- 【ホタテ】中国が水産物輸入停止を伝達「ビクビクしながら…」北海道の水産業者からは落胆の声 [おっさん友の会★]
- 日銀「利上げなんだけど」高市さん「そういうことね、よしなに🙂」 [881878332]
- 高市早苗「つい言い過ぎた」公邸で一人ひきこもる😲 [861717324]
- 【悲報】普通の日本人「総理が高市さんになって日本が正常化していく…!」 [714769305]
- 日本人、ついに気づく「あれ、日本が対中国で取れる対抗措置ってなくない…?」 [931948549]
- JAL、ANA「国内線赤字です」「新幹線に負けるので値上げどころかセール連発で値下げします」👈ビジネス的にもう厳しくね [943688309]
- 外務省局長「答弁撤回は拒否する。薛剣はクビにしろ。訪日自粛やめろ。あと在留邦人の安全確保しろ」 [834922174]
