Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
文字コード総合スレ Part12 https://mevius.5ch.net/test/read.cgi/tech/1544931495/
文字コード総合スレ part13
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
2020/07/03(金) 20:53:47.08ID:elbfDzqw681デフォルトの名無しさん
2022/12/11(日) 20:52:21.59ID:GglWfKZ4 Wikipedia のUTF-8 の所に、ビットパターンの規則が書いてある
1バイト目について、
先頭ビットが0なら、1バイト文字
110なら、2バイト文字
1110なら、3バイト文字
1111なら、4バイト文字
2バイト目以降は、先頭ビットが10で始まる
1バイト目について、
先頭ビットが0なら、1バイト文字
110なら、2バイト文字
1110なら、3バイト文字
1111なら、4バイト文字
2バイト目以降は、先頭ビットが10で始まる
682デフォルトの名無しさん
2022/12/14(水) 21:33:02.33ID:XhtdH9iq エイリアスも造れてしまうま
683デフォルトの名無しさん
2022/12/16(金) 23:16:00.71ID:iTKBT5gs ぃぇぃ
684デフォルトの名無しさん
2023/01/01(日) 02:08:29.39ID:2MmdlFyQ 🎍あけましておめでとう🎍
685デフォルトの名無しさん
2023/01/03(火) 15:41:42.10ID:oAfmTpf4 🐇🐰
686デフォルトの名無しさん
2023/01/03(火) 16:08:11.22ID:qWO3SNRU 全身verと顔verがある動物と無い動物があるのはどういうわけなんだぜ🦖🦕?
687デフォルトの名無しさん
2023/01/04(水) 14:20:36.08ID:s5vEki4C 履歴書にバストアップ写真貼付
っていうの観て豊胸写真貼るくらいおばかなレス
っていうの観て豊胸写真貼るくらいおばかなレス
688デフォルトの名無しさん
2023/01/04(水) 20:35:29.99ID:tq9Pt7xT 何それ
689デフォルトの名無しさん
2023/02/08(水) 21:44:37.67ID:SRtB9YNx au PAYプリペイドカードで取引履歴が表示されない不具合 中、朝、住、今、荻、塚などが含まれる加盟店で
https://www.itmedia.co.jp/news/articles/2302/08/news159.html
これはどういう原理?
https://www.itmedia.co.jp/news/articles/2302/08/news159.html
これはどういう原理?
690デフォルトの名無しさん
2023/02/09(木) 01:12:33.38ID:CT5MmAYO691デフォルトの名無しさん
2023/02/09(木) 01:16:30.66ID:CT5MmAYO >>690
訂正、UTF16じゃなくてSJIS/CP932だな。
訂正、UTF16じゃなくてSJIS/CP932だな。
692デフォルトの名無しさん
2023/02/09(木) 01:22:16.09ID:CT5MmAYO >>690
もいっこミス、CP1292はCP1252のタイポ。英語Windowsで使われるやつのつもり。
もいっこミス、CP1292はCP1252のタイポ。英語Windowsで使われるやつのつもり。
693デフォルトの名無しさん
2023/02/09(木) 05:00:43.74ID:UWV0mqex うーん不思議だな
694デフォルトの名無しさん
2023/02/11(土) 01:16:35.62ID:jExU8kfL マスターカード側(?)ってのがよくわからんね
695デフォルトの名無しさん
2023/02/11(土) 04:28:29.30ID:QY9lSOJI だからSJISを英語版Windows用のライブラリかフレームワークで処理しちゃったんだろ。
例に上がってるのがどれも該当文字。
例に上がってるのがどれも該当文字。
696デフォルトの名無しさん
2023/02/11(土) 19:52:44.79ID:eerDWvKt なるほろ
697デフォルトの名無しさん
2023/02/11(土) 21:12:31.28ID:a+HD9nM9 Windows, CP932, UTF16 を使っているシステムは、ヤバイ
その点、Linux はUTF8 だけ
その点、Linux はUTF8 だけ
698デフォルトの名無しさん
2023/02/11(土) 21:17:49.94ID:FZgft1te LinuxもUnicode文字のパースにはUTF32使ってるでしょ。じゃないと基本多言語面以外の文字を正しく使えないから。
699デフォルトの名無しさん
2023/02/12(日) 02:18:07.45ID:UD1CAstg パースパースってここは西オーストラリア州かよ🐨🇦🇺🏴🦘
700デフォルトの名無しさん
2023/02/12(日) 12:22:59.98ID:2oU17ty6 Linux は内部的には、UTF32 も使っているけど、外には出ない。
外部とはUTF8 で統一されている
Windows のCP 何々みたいなものは地獄。
他国語のCPを誰も知らない
例えば日本人だと、CP932 しか知らない。
逆に外人は、誰もCP932を知らない
つまり、外人同士が意思疎通できないシステム
ただし、Linuxでも、iconv を使うけど、
Ruby では非推奨になって、NKF を使う
今では、CP932とか日本語を扱えるのは、Rubyだけだろ。
外人は誰も、CP932など知らない
外部とはUTF8 で統一されている
Windows のCP 何々みたいなものは地獄。
他国語のCPを誰も知らない
例えば日本人だと、CP932 しか知らない。
逆に外人は、誰もCP932を知らない
つまり、外人同士が意思疎通できないシステム
ただし、Linuxでも、iconv を使うけど、
Ruby では非推奨になって、NKF を使う
今では、CP932とか日本語を扱えるのは、Rubyだけだろ。
外人は誰も、CP932など知らない
701デフォルトの名無しさん
2023/02/13(月) 13:42:49.90ID:B5eUc1df 中 9286 ← 判る
朝 92a9 ← 判る
住 8f5a ← 判らん
今 8da1 ← 判らん
荻 89ac ← 判らん
塚 92cb ← 判る
朝 92a9 ← 判る
住 8f5a ← 判らん
今 8da1 ← 判らん
荻 89ac ← 判らん
塚 92cb ← 判る
702デフォルトの名無しさん
2023/02/13(月) 16:52:17.70ID:JDbZ3Ijk 荻は 948b では?
cp1252 の 0x81 0x8d 0x8f 0x90 0x9d の5文字は未定義文字なので、ライブラリによってはエラーになる。
0x92 と 0x94 はクォートで特殊処理される可能性がある。
cp1252 の 0x81 0x8d 0x8f 0x90 0x9d の5文字は未定義文字なので、ライブラリによってはエラーになる。
0x92 と 0x94 はクォートで特殊処理される可能性がある。
703デフォルトの名無しさん
2023/02/14(火) 01:45:05.11ID:8zO3UUTI 互換性を簡単に切り捨てられたLinuxと、互換性を維持しなくてはならないMS-DOSとWindowsを比べるのはただの阿呆。
704デフォルトの名無しさん
2023/02/14(火) 08:08:42.98ID:XLVypbdR 当時ISO2022 という規格があったのに
CP932 などというふざけた規格を作ったのが悪い
CP932 などというふざけた規格を作ったのが悪い
705デフォルトの名無しさん
2023/02/14(火) 15:06:25.61ID:5oc02QiB 別にふざけてたわけじゃない
当時の日本のPCはJIS X 0201との互換性のほうが重要だったってだけ
当時の日本のPCはJIS X 0201との互換性のほうが重要だったってだけ
706デフォルトの名無しさん
2023/02/14(火) 18:56:57.73ID:XLVypbdR えっと、JISX0201 は ISO2022 に従ってますよ
CP932 なんていらんかったんや
CP932 なんていらんかったんや
707デフォルトの名無しさん
2023/02/14(火) 19:37:48.59ID:vjcTtMHg シフトJISの主目的はバイト数の節約なので、ISO2022系は許容できなかったんだよ。
当時のPCとしては1バイトでさえ貴重な資源だった。
メモリの容量が100万倍になった現在から見たら笑い話だけど。
当時のPCとしては1バイトでさえ貴重な資源だった。
メモリの容量が100万倍になった現在から見たら笑い話だけど。
708デフォルトの名無しさん
2023/02/15(水) 03:33:04.77ID:kNXNSVol 結局CP1252説はまだ正しいのかわからんのね
709デフォルトの名無しさん
2023/02/15(水) 22:31:23.74ID:rksMQLqK >>706
マイクロソフトは悪くいうのに、IBMは悪くいわないのか?
マイクロソフトは悪くいうのに、IBMは悪くいわないのか?
710デフォルトの名無しさん
2023/02/15(水) 22:32:45.87ID:rksMQLqK >>706
日本語がマルチバイトの先駆けだったので、中国は何もかも楽だった。
日本語がマルチバイトの先駆けだったので、中国は何もかも楽だった。
711デフォルトの名無しさん
2023/02/16(木) 04:27:13.71ID:yMbItoR2 >>710
中国語とかのコードって普通に片仮名平仮名入ってるよね
中国語とかのコードって普通に片仮名平仮名入ってるよね
712デフォルトの名無しさん
2023/02/16(木) 08:17:07.88ID:j+jLrvev713デフォルトの名無しさん
2023/02/16(木) 21:02:08.08ID:DNC5A3Ty EBCDICなんでアルファベットのコードの真ん中に穴を開けたのか?
714デフォルトの名無しさん
2023/02/16(木) 23:08:48.64ID:8O9Ip5X1 >>713
パンチカードがBCDだったから。16進数でいう A~F が使えなかった。
パンチカードがBCDだったから。16進数でいう A~F が使えなかった。
715デフォルトの名無しさん
2023/02/17(金) 22:53:38.58ID:ZaUKSTn6 >>712
IBM932は問題ないのか?
SJISは拡張部分の定義がバラバラ。
JISはもっとひどかったから、まだいいんだが、UTF-8とUTF-16の混在という問題はまだ解決していない。
マイクロソフトのSJISは日本語キャラクタセットの統一という成功を収めたが、UTF-8とSJISの相性が悪いのはどうにもならない。
日本人が日本語のキャラクタセットを決められない状況では、中国人が決める日本語キャラクタセットに日本人は従うしかない。
IBM932は問題ないのか?
SJISは拡張部分の定義がバラバラ。
JISはもっとひどかったから、まだいいんだが、UTF-8とUTF-16の混在という問題はまだ解決していない。
マイクロソフトのSJISは日本語キャラクタセットの統一という成功を収めたが、UTF-8とSJISの相性が悪いのはどうにもならない。
日本人が日本語のキャラクタセットを決められない状況では、中国人が決める日本語キャラクタセットに日本人は従うしかない。
716デフォルトの名無しさん
2023/02/17(金) 23:31:54.88ID:kr6q/udY SJIS は時代遅れ。結論が出てるんだから捨てれば良い。
何が統一なんだか。一瞬足りとも統一されたことなんて無かった。
何が統一なんだか。一瞬足りとも統一されたことなんて無かった。
717デフォルトの名無しさん
2023/02/18(土) 00:27:33.20ID:g6xF0Ha1718デフォルトの名無しさん
2023/02/18(土) 03:18:28.78ID:PB2jCVVO >>717
妄想乙
妄想乙
719デフォルトの名無しさん
2023/02/18(土) 05:11:11.00ID:Dm16ZxoG これは興味深いなり
720デフォルトの名無しさん
2023/02/18(土) 06:39:14.59ID:1+BLOhrf721デフォルトの名無しさん
2023/02/18(土) 12:24:41.58ID:ExpzrYMf722デフォルトの名無しさん
2023/02/18(土) 12:26:20.12ID:ExpzrYMf723デフォルトの名無しさん
2023/02/18(土) 13:59:14.80ID:g6xF0Ha1 >>721
それは逆だ。Windowsを使っていると無意識にSJISになるので、UNIX側をSJISにすればポンコツがいても問題は発生しにくい。
それは逆だ。Windowsを使っていると無意識にSJISになるので、UNIX側をSJISにすればポンコツがいても問題は発生しにくい。
724デフォルトの名無しさん
2023/02/18(土) 16:21:02.46ID:PB2jCVVO UTF8出来てから30年、RFCになってから20年にもなるのに未だにSJISとかアホか
お前らもう20世紀に帰れ。今の時代に不要な人材
お前らもう20世紀に帰れ。今の時代に不要な人材
725デフォルトの名無しさん
2023/02/19(日) 00:00:17.41ID:13adp8Nx この話の流れはともかくとして、SJIS人材は、必要。
726デフォルトの名無しさん
2023/02/19(日) 13:36:16.30ID:F5EkyCpB そう言えば eucjp-open と Unicode にはあるのに windows--31j に無い文字って結構沢山あるのな。
727デフォルトの名無しさん
2023/02/19(日) 13:38:43.70ID:F5EkyCpB Windows では環境依存文字扱いになってメモ帳に入力できるが UTF-8 にしないと保存出来ない。
728デフォルトの名無しさん
2023/02/19(日) 15:08:09.17ID:mdwW7xFX729デフォルトの名無しさん
2023/02/19(日) 15:10:04.88ID:mdwW7xFX >>727
メモ帳を進化させて、環境依存文字がないようにUTF-8の文字を使うようにしたから、自動的にUTF-8になる。
メモ帳を進化させて、環境依存文字がないようにUTF-8の文字を使うようにしたから、自動的にUTF-8になる。
730デフォルトの名無しさん
2023/02/20(月) 14:20:15.29ID:gWCCmRg9 これから先Windows上でテキストファイル作る時には
文字コード何にするのが一番いいの?BOM無しUTF-8?
文字コード何にするのが一番いいの?BOM無しUTF-8?
731デフォルトの名無しさん
2023/02/20(月) 14:31:01.70ID:ssy6UqTn 今のところSJISかBOM付きUTF8のどっちかだと思う
732デフォルトの名無しさん
2023/02/20(月) 14:38:38.30ID:yWl6H2Py これから先って言うならBOM無しUTF-8だろうな
メモ帳も前はUTF-8にするとBOMを強制的に付けてきたけど、今はBOM無しUTF-8が標準になったし
メモ帳も前はUTF-8にするとBOMを強制的に付けてきたけど、今はBOM無しUTF-8が標準になったし
733デフォルトの名無しさん
2023/02/20(月) 14:42:08.01ID:yWl6H2Py SJISが生き残ってるうちはBOM付きの方が自動判別が確実で便利だけど
734デフォルトの名無しさん
2023/02/20(月) 15:57:49.57ID:iLGtEctg SJISでしか動かないツールをメインに使ってるんじゃなければUTF-8に全面移行するのが正解。
当然BOMとかも不要。
当然BOMとかも不要。
735デフォルトの名無しさん
2023/02/20(月) 18:35:55.10ID:ssy6UqTn Windows環境でBOMを付けて困ることなんてないんだから、付けられるなら付けておいた方がいいでしょ
むしろBOMなしのメリットが思いつかない
ExcelとかBOMつけないとcsvが文字化けしたりするし
むしろBOMなしのメリットが思いつかない
ExcelとかBOMつけないとcsvが文字化けしたりするし
736デフォルトの名無しさん
2023/02/20(月) 19:00:28.39ID:OG9zY4WL UTF-8 にBOMとか最悪だな
737デフォルトの名無しさん
2023/02/20(月) 19:42:17.34ID:XGJQq71T 令和になってもう5年になるのにいまだにsjisなんてありえない
あとbomつきutfも2010年代ならともかくWin81もIE11も死に絶えてる現代で許されるわけがない
結論:BOMなしUTF8以外の選択肢はありえない
あとbomつきutfも2010年代ならともかくWin81もIE11も死に絶えてる現代で許されるわけがない
結論:BOMなしUTF8以外の選択肢はありえない
738デフォルトの名無しさん
2023/02/20(月) 19:44:40.63ID:XGJQq71T UTF16も内部処理コードとしての賞味期限は切れてるしな
2030年位には世の中すべてUTF8で統一されるだろう
2030年位には世の中すべてUTF8で統一されるだろう
739デフォルトの名無しさん
2023/02/20(月) 20:07:00.66ID:HgTGLFxo740デフォルトの名無しさん
2023/02/20(月) 21:29:57.22ID:iLGtEctg 日本語とか中国語が特にめんどうという話は聞いたことがない。どういうこと?
741デフォルトの名無しさん
2023/02/20(月) 22:49:24.50ID:eS5XTp7S UTF-16が持て囃されたのももはや4半世紀以上前なんだが
日本語も中国語もUTF-16の範疇で何ら問題なく処理できるはずなのに
どんな処理系でいまだに扱いが面倒なのか教えてほしいな
まあ具体例を聞いたら「そんなゴミとっとと廃棄処分しろ」という乾燥にしかならない気もするけど
日本語も中国語もUTF-16の範疇で何ら問題なく処理できるはずなのに
どんな処理系でいまだに扱いが面倒なのか教えてほしいな
まあ具体例を聞いたら「そんなゴミとっとと廃棄処分しろ」という乾燥にしかならない気もするけど
742デフォルトの名無しさん
2023/02/20(月) 23:56:20.10ID:ssy6UqTn UTF32にはUTF16同様にエンディアンの問題があるから入出力形式には向かない
まぁ、UTF8にはUTF8で冗長コードの問題があるわけだが……UTF8をコードポイント単位で読み込んで処理するのが一番確実と思う
まぁ、UTF8にはUTF8で冗長コードの問題があるわけだが……UTF8をコードポイント単位で読み込んで処理するのが一番確実と思う
743デフォルトの名無しさん
2023/02/21(火) 19:33:57.30ID:VTx8hARX >>740
UTF-8は文字によって1バイトで済むなら1バイトで表現する。
これはアルファベットを使用している欧米人には都合がいいが、漢字を使っている日本人、中国人などでは、その漢字は何バイトなのか常に意識しなくてはならなくなる。
近い将来、4バイトで統一した方が楽という話になる。
特に中国が世界の中心になると、中華人民共和国が推奨しているキャラクタセット GB2312は2バイトで一文字をあらわすキャラクタセット。
日本語のように1~2バイトで表現するから、UTF-8のように1バイト文字、2バイト文字、3バイト文字、4バイト文字、5バイト文字と何バイト使うのかわからないキャラクタセットは嫌う。
中国語EUCとUTF-8は相性が悪い。
UTF-8は文字によって1バイトで済むなら1バイトで表現する。
これはアルファベットを使用している欧米人には都合がいいが、漢字を使っている日本人、中国人などでは、その漢字は何バイトなのか常に意識しなくてはならなくなる。
近い将来、4バイトで統一した方が楽という話になる。
特に中国が世界の中心になると、中華人民共和国が推奨しているキャラクタセット GB2312は2バイトで一文字をあらわすキャラクタセット。
日本語のように1~2バイトで表現するから、UTF-8のように1バイト文字、2バイト文字、3バイト文字、4バイト文字、5バイト文字と何バイト使うのかわからないキャラクタセットは嫌う。
中国語EUCとUTF-8は相性が悪い。
744デフォルトの名無しさん
2023/02/21(火) 19:35:15.90ID:VTx8hARX GB2312をUTF-8に置き換えようとしても、面倒くせえだけだと思うは中華人民共和国も同じ。
745730
2023/02/21(火) 20:03:36.31ID:bx2YVvOk みんな言うことバラバラw 結局なにが良いんだよう?
746デフォルトの名無しさん
2023/02/21(火) 20:04:41.27ID:NFhPk2T2 >>743
寝ぼけるな。
欧米でもアクセント付きの文字やちゃんとしたクォートとか使えばバイト数増える。
さらに合成アクセント、合成文字、異体字セレクタ、絵文字合成、国旗とかもろもろあって固定長にはならない。UTF32使っても可変長。
寝ぼけるな。
欧米でもアクセント付きの文字やちゃんとしたクォートとか使えばバイト数増える。
さらに合成アクセント、合成文字、異体字セレクタ、絵文字合成、国旗とかもろもろあって固定長にはならない。UTF32使っても可変長。
747デフォルトの名無しさん
2023/02/21(火) 20:09:54.26ID:gmc1mmvr 文字をいろいろ表そうとリガチャ導入したのは失敗だと思う
748デフォルトの名無しさん
2023/02/21(火) 20:11:40.47ID:KCRD8vTD >>746
UTF-32は一文字が32ビットで、4バイト単位で文字を表現するから、漢字一文字を4バイトで表現している中国のキャラクタセットと相性がいい。
UTF-8は一文字が何バイトなのかわからないから困るんだぞ?
日本語や中国語は、UTF-8だと2バイト文字というものがほぼ存在しない。
1バイト文字か3~4バイト文字の混合だったから、UTF-8よりUTF-32の方がシンプルになる。
さすがに32ビットではなく、64ビットにしようというのは、かなり未来の話だろう。
UTF-32は一文字が32ビットで、4バイト単位で文字を表現するから、漢字一文字を4バイトで表現している中国のキャラクタセットと相性がいい。
UTF-8は一文字が何バイトなのかわからないから困るんだぞ?
日本語や中国語は、UTF-8だと2バイト文字というものがほぼ存在しない。
1バイト文字か3~4バイト文字の混合だったから、UTF-8よりUTF-32の方がシンプルになる。
さすがに32ビットではなく、64ビットにしようというのは、かなり未来の話だろう。
749デフォルトの名無しさん
2023/02/21(火) 20:13:32.50ID:KCRD8vTD >>746
話が矛盾しているぞ。UTF-8もUTF-32も同じ批判ができるなら、UTF-32の方がシンプルだろ?
話が矛盾しているぞ。UTF-8もUTF-32も同じ批判ができるなら、UTF-32の方がシンプルだろ?
750デフォルトの名無しさん
2023/02/21(火) 20:59:48.85ID:6Lh94JJt うわあ「GB2312」ときたかあ
2000年以前の知識からアップデートできてないゴミ以下の化石の認識なら、
まあ>743みたいなことを言い出すのも納得だわ
当の中国政府すら「GB2312までしか対応できないようなソフトウェア製品は流通禁止」なんて言い出してから
すでに15年以上経過してるのにいったいお前はどれだけぼーっと生きてきたんだ?
>>745 繰り返すけどBOMなしUTF8以外もはやありえない
2000年以前の知識からアップデートできてないゴミ以下の化石の認識なら、
まあ>743みたいなことを言い出すのも納得だわ
当の中国政府すら「GB2312までしか対応できないようなソフトウェア製品は流通禁止」なんて言い出してから
すでに15年以上経過してるのにいったいお前はどれだけぼーっと生きてきたんだ?
>>745 繰り返すけどBOMなしUTF8以外もはやありえない
751デフォルトの名無しさん
2023/02/21(火) 22:10:48.02ID:6Lh94JJt おそらくだけど>743は知識が古すぎて
>>746が挙げてる用語がそれぞれどういう意味を持ってるのか何一つ理解できていないだろう
これでは会話が成立しない
もしくは知識があるうえで>748や>749みたいなことを言い出してる可能性もないわけではないが
仮にそうであったとすれば頭が悪すぎてなおのこと会話が成立しないと思われる
>>746が挙げてる用語がそれぞれどういう意味を持ってるのか何一つ理解できていないだろう
これでは会話が成立しない
もしくは知識があるうえで>748や>749みたいなことを言い出してる可能性もないわけではないが
仮にそうであったとすれば頭が悪すぎてなおのこと会話が成立しないと思われる
752デフォルトの名無しさん
2023/02/22(水) 07:57:15.15ID:NZkCD/9S 正直、UTF-8にBOMつけるんなら
ISO2022 でいいやんと思う
ISO2022 でいいやんと思う
754デフォルトの名無しさん
2023/02/22(水) 20:25:50.37ID:yP74xxqg BOMはほしい
755デフォルトの名無しさん
2023/02/22(水) 21:44:23.38ID:Z5Yb2D9Z >>754
そのこころは?
そのこころは?
756デフォルトの名無しさん
2023/02/23(木) 02:06:56.75ID:CN6TeDKs あって損はない
757デフォルトの名無しさん
2023/02/23(木) 03:19:42.48ID:sj7+9G1y これからは UTF−8 に統一されるんだから BOM は不要
過去の遺物になることが確定してるんだがら、可能な限り早く BOM 無しに移行せよ
過去の遺物になることが確定してるんだがら、可能な限り早く BOM 無しに移行せよ
758デフォルトの名無しさん
2023/02/23(木) 08:50:00.45ID:2/POnIZR >>757
わかった、俺もあなたとマイクロソフトのメモ帳を信じることにするw
わかった、俺もあなたとマイクロソフトのメモ帳を信じることにするw
759デフォルトの名無しさん
2023/02/23(木) 10:27:37.47ID:4H8fy78d UTF-8にBOMは要らんし付けてはいけない
未だにBOM言うてるのは老害ゴミ
異体字セレクタとか観たら卒倒して死んじゃうんじゃないか
未だにBOM言うてるのは老害ゴミ
異体字セレクタとか観たら卒倒して死んじゃうんじゃないか
760デフォルトの名無しさん
2023/02/23(木) 10:39:46.94ID:A0wb20Dk いまだにBOM言ってるのはたしかに老害だな。signatureって言え。
761デフォルトの名無しさん
2023/02/23(木) 11:04:10.21ID:9YiKsc0f Excelにutf8食わすときに必要だし、Windows Searchもutf-8はBOM付き前提で、この状況は未だにかわってない
BOMなし教の人はWindow使ってないんじゃないの?w
BOMなし教の人はWindow使ってないんじゃないの?w
762デフォルトの名無しさん
2023/02/23(木) 12:50:39.71ID:WqT6xFqM 最終的にはBOM無しUTF-8に統一されるべきだと思うけど
移行期の今はまだBOM付きの方が現実的で無難
まずはWindowsやOffice等主要ツールがBOM無しUTF-8前提になってくれないと
移行期の今はまだBOM付きの方が現実的で無難
まずはWindowsやOffice等主要ツールがBOM無しUTF-8前提になってくれないと
763デフォルトの名無しさん
2023/02/23(木) 13:56:15.28ID:QgGws+lN764デフォルトの名無しさん
2023/02/23(木) 14:40:49.03ID:9YiKsc0f >>763
世の中から既存のものを含めた全てのSJISテキストファイルが消えてなくなればBOMなし対応になるだろうが、果たして何年かかるかな
世の中から既存のものを含めた全てのSJISテキストファイルが消えてなくなればBOMなし対応になるだろうが、果たして何年かかるかな
765デフォルトの名無しさん
2023/02/23(木) 14:42:16.10ID:TD+FtAmO レジストリスクリプトなど、windowsのユニコードが未だutf16leという現状で
utf8w/obomに統一とか時期尚早でしょ
utf8w/obomに統一とか時期尚早でしょ
766デフォルトの名無しさん
2023/02/23(木) 16:34:16.53ID:GQ/uFi0l BOMはSJISと関係なく作られたとおもうが?
767デフォルトの名無しさん
2023/02/23(木) 17:00:14.57ID:sj7+9G1y Windows のシステムロケールをUTF8に設定すればExcellとかOffice系もBOM無しでいけるんじゃないの?
768デフォルトの名無しさん
2023/02/23(木) 17:55:58.87ID:PPu7W9/5 Excel の先頭BOMとかいう愚かな仕様も早く無くなってほしい
テキスト開くときにエンコーディングを指定できればいいだけだよね
テキスト開くときにエンコーディングを指定できればいいだけだよね
769デフォルトの名無しさん
2023/02/23(木) 19:31:24.94ID:sj7+9G1y >>768
だからシステム・ロケール UTF8 に変更すれば BOM いらない。
お前らがシステム・ローケルをSJISに設定してSJIS優先にしてるから、それに従ってBOM無しをSJISとみなしてるだけ。
単に設定の問題。エクセルは悪くない
だからシステム・ロケール UTF8 に変更すれば BOM いらない。
お前らがシステム・ローケルをSJISに設定してSJIS優先にしてるから、それに従ってBOM無しをSJISとみなしてるだけ。
単に設定の問題。エクセルは悪くない
770デフォルトの名無しさん
2023/02/23(木) 22:06:54.24ID:lGgWFFZW BOMがあって困った経験はJavaしかないなあ
BOM付きを標準していいくらいじゃないかな
BOM付きを標準していいくらいじゃないかな
771デフォルトの名無しさん
2023/02/23(木) 22:09:58.66ID:lGgWFFZW Windowsの古い資源と共存するためにもUTF-8/16/32はBOM付きを必須にしたほうがいい
BOMを廃止して良いことなど何もないのが現実。今どきにBOMに対応してないほうがおかしい
BOMを廃止して良いことなど何もないのが現実。今どきにBOMに対応してないほうがおかしい
772デフォルトの名無しさん
2023/02/23(木) 22:30:34.98ID:sj7+9G1y そもそもネットの通信でも、MacでもLinuxでもUTF-8にBOMつけたりしない。
UTF-8にBOMつけたのは過去のWindowsだけって時点でゴミなのわかるだろ。そのWindowsだってデフォルトでは付けない方向に舵を切った。
今時BOM必要って言ってるのは時代の変化についてこれなくて、過去の環境に生き続けたいロートルだけ。
UTF-8にBOMつけたのは過去のWindowsだけって時点でゴミなのわかるだろ。そのWindowsだってデフォルトでは付けない方向に舵を切った。
今時BOM必要って言ってるのは時代の変化についてこれなくて、過去の環境に生き続けたいロートルだけ。
773デフォルトの名無しさん
2023/02/23(木) 22:59:31.84ID:lGgWFFZW774デフォルトの名無しさん
2023/02/23(木) 23:04:51.37ID:SB4P+kzn >>772
UTF-8なんて使っているのが過去の環境に生き続けたい(ASCIIが素通しになる)ロートルだけだろ。
UTF-8なんて使っているのが過去の環境に生き続けたい(ASCIIが素通しになる)ロートルだけだろ。
775デフォルトの名無しさん
2023/02/23(木) 23:09:41.34ID:lGgWFFZW エンジン開発での競争に敗れた国がこぞってEV化を推進しようとするのと似た構図。
シェアを持っているWindowsには業務アプリケーション遺産に対する責任がある。負け組のLinuxとMacにはそれがない。
シェアを持っているWindowsには業務アプリケーション遺産に対する責任がある。負け組のLinuxとMacにはそれがない。
776デフォルトの名無しさん
2023/02/23(木) 23:55:53.12ID:DZ2N6cRC うわあ頭がおかしいのが複数湧いてる(ひょっとして同一人物の別IDだったりして)
意図的に間違ったことをあえて逆張りで言ってるのか本気で信じてるのかどっちなんだろう
UTF8を使うのがロートルって、こいつの言ってる「過去」ってまさかWindows以前のMS-DOSの時代のことか
あとUTF-16やUTF-32のテキストファイルなんて
規格上定義されてることは知ってるけど現物にお目にかかったことなんかないし
そもそもUTF-16やUTF-32なんて元々BOM必須だろうよ
過去の負の遺産がある以上アプリケーションとしてはBOMありファイルの読み込みには対応しなきゃダメだろうけどさ
今後作成するファイルでUTF-16/32を選ぶのは論外だし、UTF-8で保存するならBOMをつける必要などどこにもないだろうよ
意図的に間違ったことをあえて逆張りで言ってるのか本気で信じてるのかどっちなんだろう
UTF8を使うのがロートルって、こいつの言ってる「過去」ってまさかWindows以前のMS-DOSの時代のことか
あとUTF-16やUTF-32のテキストファイルなんて
規格上定義されてることは知ってるけど現物にお目にかかったことなんかないし
そもそもUTF-16やUTF-32なんて元々BOM必須だろうよ
過去の負の遺産がある以上アプリケーションとしてはBOMありファイルの読み込みには対応しなきゃダメだろうけどさ
今後作成するファイルでUTF-16/32を選ぶのは論外だし、UTF-8で保存するならBOMをつける必要などどこにもないだろうよ
777デフォルトの名無しさん
2023/02/24(金) 00:16:53.98ID:/JDec9CR778デフォルトの名無しさん
2023/02/24(金) 00:17:46.23ID:/JDec9CR > UTF-8で保存するならBOMをつける必要などどこにもないだろうよ
BOMをつけないと他の文字コードとの区別ができなくて
文字化けしてしまう
BOMをつけないと他の文字コードとの区別ができなくて
文字化けしてしまう
779デフォルトの名無しさん
2023/02/24(金) 00:19:03.22ID:/JDec9CR だいたいUTF-8のBOMはUnicodeの正式な仕様なのだから
対応してないほうが悪い
対応してないほうが悪い
780デフォルトの名無しさん
2023/02/24(金) 00:22:30.88ID:/JDec9CR LinuxとかmacOSとかUnixはUnicodeの対応が遅れていて
LANG=C.UTF-8でさえPOSIXで標準化されていない
Unicodeを正しく扱えないコマンドがある
LANG=C.UTF-8でさえPOSIXで標準化されていない
Unicodeを正しく扱えないコマンドがある
781デフォルトの名無しさん
2023/02/24(金) 00:50:08.17ID:rqUoHIRk■ このスレッドは過去ログ倉庫に格納されています
