文字コード総合スレ part13

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2020/07/03(金) 20:53:47.08ID:elbfDzqw
Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
 (スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
 (隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
文字コード総合スレ Part12 https://mevius.5ch.net/test/read.cgi/tech/1544931495/
2022/12/11(日) 20:52:21.59ID:GglWfKZ4
Wikipedia のUTF-8 の所に、ビットパターンの規則が書いてある

1バイト目について、
先頭ビットが0なら、1バイト文字
110なら、2バイト文字
1110なら、3バイト文字
1111なら、4バイト文字

2バイト目以降は、先頭ビットが10で始まる
682デフォルトの名無しさん
垢版 |
2022/12/14(水) 21:33:02.33ID:XhtdH9iq
エイリアスも造れてしまうま
2022/12/16(金) 23:16:00.71ID:iTKBT5gs
ぃぇぃ
684デフォルトの名無しさん
垢版 |
2023/01/01(日) 02:08:29.39ID:2MmdlFyQ
🎍あけましておめでとう🎍
2023/01/03(火) 15:41:42.10ID:oAfmTpf4
🐇🐰
2023/01/03(火) 16:08:11.22ID:qWO3SNRU
全身verと顔verがある動物と無い動物があるのはどういうわけなんだぜ🦖🦕?
687デフォルトの名無しさん
垢版 |
2023/01/04(水) 14:20:36.08ID:s5vEki4C
履歴書にバストアップ写真貼付
っていうの観て豊胸写真貼るくらいおばかなレス
2023/01/04(水) 20:35:29.99ID:tq9Pt7xT
何それ
689デフォルトの名無しさん
垢版 |
2023/02/08(水) 21:44:37.67ID:SRtB9YNx
au PAYプリペイドカードで取引履歴が表示されない不具合 中、朝、住、今、荻、塚などが含まれる加盟店で
https://www.itmedia.co.jp/news/articles/2302/08/news159.html

これはどういう原理?
2023/02/09(木) 01:12:33.38ID:CT5MmAYO
>>689
完全に推測だけど、UTF16 にCP1292用とかの特殊処理をしたとか?
そのせいで 0x92 や 0x94 などを含む一部の文字が使えなくなった。
2023/02/09(木) 01:16:30.66ID:CT5MmAYO
>>690
訂正、UTF16じゃなくてSJIS/CP932だな。
2023/02/09(木) 01:22:16.09ID:CT5MmAYO
>>690
もいっこミス、CP1292はCP1252のタイポ。英語Windowsで使われるやつのつもり。
693デフォルトの名無しさん
垢版 |
2023/02/09(木) 05:00:43.74ID:UWV0mqex
うーん不思議だな
2023/02/11(土) 01:16:35.62ID:jExU8kfL
マスターカード側(?)ってのがよくわからんね
2023/02/11(土) 04:28:29.30ID:QY9lSOJI
だからSJISを英語版Windows用のライブラリかフレームワークで処理しちゃったんだろ。
例に上がってるのがどれも該当文字。
696デフォルトの名無しさん
垢版 |
2023/02/11(土) 19:52:44.79ID:eerDWvKt
なるほろ
2023/02/11(土) 21:12:31.28ID:a+HD9nM9
Windows, CP932, UTF16 を使っているシステムは、ヤバイ

その点、Linux はUTF8 だけ
698デフォルトの名無しさん
垢版 |
2023/02/11(土) 21:17:49.94ID:FZgft1te
LinuxもUnicode文字のパースにはUTF32使ってるでしょ。じゃないと基本多言語面以外の文字を正しく使えないから。
2023/02/12(日) 02:18:07.45ID:UD1CAstg
パースパースってここは西オーストラリア州かよ🐨🇦🇺🏴󠁡󠁵󠁷󠁡󠁿🦘
2023/02/12(日) 12:22:59.98ID:2oU17ty6
Linux は内部的には、UTF32 も使っているけど、外には出ない。
外部とはUTF8 で統一されている

Windows のCP 何々みたいなものは地獄。
他国語のCPを誰も知らない

例えば日本人だと、CP932 しか知らない。
逆に外人は、誰もCP932を知らない

つまり、外人同士が意思疎通できないシステム

ただし、Linuxでも、iconv を使うけど、
Ruby では非推奨になって、NKF を使う

今では、CP932とか日本語を扱えるのは、Rubyだけだろ。
外人は誰も、CP932など知らない
701デフォルトの名無しさん
垢版 |
2023/02/13(月) 13:42:49.90ID:B5eUc1df
中 9286 ← 判る
朝 92a9 ← 判る
住 8f5a ← 判らん
今 8da1 ← 判らん
荻 89ac ← 判らん
塚 92cb ← 判る
2023/02/13(月) 16:52:17.70ID:JDbZ3Ijk
荻は 948b では?
cp1252 の 0x81 0x8d 0x8f 0x90 0x9d の5文字は未定義文字なので、ライブラリによってはエラーになる。
0x92 と 0x94 はクォートで特殊処理される可能性がある。
703デフォルトの名無しさん
垢版 |
2023/02/14(火) 01:45:05.11ID:8zO3UUTI
互換性を簡単に切り捨てられたLinuxと、互換性を維持しなくてはならないMS-DOSとWindowsを比べるのはただの阿呆。
2023/02/14(火) 08:08:42.98ID:XLVypbdR
当時ISO2022 という規格があったのに
CP932 などというふざけた規格を作ったのが悪い
2023/02/14(火) 15:06:25.61ID:5oc02QiB
別にふざけてたわけじゃない
当時の日本のPCはJIS X 0201との互換性のほうが重要だったってだけ
2023/02/14(火) 18:56:57.73ID:XLVypbdR
えっと、JISX0201 は ISO2022 に従ってますよ
CP932 なんていらんかったんや
2023/02/14(火) 19:37:48.59ID:vjcTtMHg
シフトJISの主目的はバイト数の節約なので、ISO2022系は許容できなかったんだよ。
当時のPCとしては1バイトでさえ貴重な資源だった。
メモリの容量が100万倍になった現在から見たら笑い話だけど。
2023/02/15(水) 03:33:04.77ID:kNXNSVol
結局CP1252説はまだ正しいのかわからんのね
709デフォルトの名無しさん
垢版 |
2023/02/15(水) 22:31:23.74ID:rksMQLqK
>>706
マイクロソフトは悪くいうのに、IBMは悪くいわないのか?
710デフォルトの名無しさん
垢版 |
2023/02/15(水) 22:32:45.87ID:rksMQLqK
>>706
日本語がマルチバイトの先駆けだったので、中国は何もかも楽だった。
2023/02/16(木) 04:27:13.71ID:yMbItoR2
>>710
中国語とかのコードって普通に片仮名平仮名入ってるよね
2023/02/16(木) 08:17:07.88ID:j+jLrvev
>>709
EBCDICのこと?だってその頃はISO2022ないじゃん
でも、System 360 は素晴らしいと思うよ
2023/02/16(木) 21:02:08.08ID:DNC5A3Ty
EBCDICなんでアルファベットのコードの真ん中に穴を開けたのか?
2023/02/16(木) 23:08:48.64ID:8O9Ip5X1
>>713
パンチカードがBCDだったから。16進数でいう A~F が使えなかった。
715デフォルトの名無しさん
垢版 |
2023/02/17(金) 22:53:38.58ID:ZaUKSTn6
>>712
IBM932は問題ないのか?

SJISは拡張部分の定義がバラバラ。

JISはもっとひどかったから、まだいいんだが、UTF-8とUTF-16の混在という問題はまだ解決していない。

マイクロソフトのSJISは日本語キャラクタセットの統一という成功を収めたが、UTF-8とSJISの相性が悪いのはどうにもならない。

日本人が日本語のキャラクタセットを決められない状況では、中国人が決める日本語キャラクタセットに日本人は従うしかない。
2023/02/17(金) 23:31:54.88ID:kr6q/udY
SJIS は時代遅れ。結論が出てるんだから捨てれば良い。
何が統一なんだか。一瞬足りとも統一されたことなんて無かった。
717デフォルトの名無しさん
垢版 |
2023/02/18(土) 00:27:33.20ID:g6xF0Ha1
>>716
SJISで統一して成功したシステムは多い。
UNIXとWindowsの組み合わせではSJISでの統一が正解だった。
2023/02/18(土) 03:18:28.78ID:PB2jCVVO
>>717
妄想乙
2023/02/18(土) 05:11:11.00ID:Dm16ZxoG
これは興味深いなり
2023/02/18(土) 06:39:14.59ID:1+BLOhrf
>>715
時系列が無茶苦茶
CP932が作られたかIBM932が生まれた
何故わざわざ空けてあるC1領域を使ってしまったのか
721デフォルトの名無しさん
垢版 |
2023/02/18(土) 12:24:41.58ID:ExpzrYMf
>>717
UTF-8以前の話なら
UNIXとWindows混在ならEUCが正解
722デフォルトの名無しさん
垢版 |
2023/02/18(土) 12:26:20.12ID:ExpzrYMf
>>720
IBMは昔からわざとちょっと変な仕様追加するのが好きで
M$と不仲になってさらにその傾向が増長したのでは
723デフォルトの名無しさん
垢版 |
2023/02/18(土) 13:59:14.80ID:g6xF0Ha1
>>721
それは逆だ。Windowsを使っていると無意識にSJISになるので、UNIX側をSJISにすればポンコツがいても問題は発生しにくい。
2023/02/18(土) 16:21:02.46ID:PB2jCVVO
UTF8出来てから30年、RFCになってから20年にもなるのに未だにSJISとかアホか
お前らもう20世紀に帰れ。今の時代に不要な人材
2023/02/19(日) 00:00:17.41ID:13adp8Nx
この話の流れはともかくとして、SJIS人材は、必要。
726デフォルトの名無しさん
垢版 |
2023/02/19(日) 13:36:16.30ID:F5EkyCpB
そう言えば eucjp-open と Unicode にはあるのに windows--31j に無い文字って結構沢山あるのな。
727デフォルトの名無しさん
垢版 |
2023/02/19(日) 13:38:43.70ID:F5EkyCpB
Windows では環境依存文字扱いになってメモ帳に入力できるが UTF-8 にしないと保存出来ない。
728デフォルトの名無しさん
垢版 |
2023/02/19(日) 15:08:09.17ID:mdwW7xFX
>>724
Windowsは表面がSJIS、内部がUTF-16だ。

これをUTF-8にすべて置き換えるには、あと数十年はかかる。
729デフォルトの名無しさん
垢版 |
2023/02/19(日) 15:10:04.88ID:mdwW7xFX
>>727
メモ帳を進化させて、環境依存文字がないようにUTF-8の文字を使うようにしたから、自動的にUTF-8になる。
2023/02/20(月) 14:20:15.29ID:gWCCmRg9
これから先Windows上でテキストファイル作る時には
文字コード何にするのが一番いいの?BOM無しUTF-8?
2023/02/20(月) 14:31:01.70ID:ssy6UqTn
今のところSJISかBOM付きUTF8のどっちかだと思う
2023/02/20(月) 14:38:38.30ID:yWl6H2Py
これから先って言うならBOM無しUTF-8だろうな
メモ帳も前はUTF-8にするとBOMを強制的に付けてきたけど、今はBOM無しUTF-8が標準になったし
2023/02/20(月) 14:42:08.01ID:yWl6H2Py
SJISが生き残ってるうちはBOM付きの方が自動判別が確実で便利だけど
2023/02/20(月) 15:57:49.57ID:iLGtEctg
SJISでしか動かないツールをメインに使ってるんじゃなければUTF-8に全面移行するのが正解。
当然BOMとかも不要。
2023/02/20(月) 18:35:55.10ID:ssy6UqTn
Windows環境でBOMを付けて困ることなんてないんだから、付けられるなら付けておいた方がいいでしょ
むしろBOMなしのメリットが思いつかない
ExcelとかBOMつけないとcsvが文字化けしたりするし
2023/02/20(月) 19:00:28.39ID:OG9zY4WL
UTF-8 にBOMとか最悪だな
2023/02/20(月) 19:42:17.34ID:XGJQq71T
令和になってもう5年になるのにいまだにsjisなんてありえない
あとbomつきutfも2010年代ならともかくWin81もIE11も死に絶えてる現代で許されるわけがない

結論:BOMなしUTF8以外の選択肢はありえない
2023/02/20(月) 19:44:40.63ID:XGJQq71T
UTF16も内部処理コードとしての賞味期限は切れてるしな
2030年位には世の中すべてUTF8で統一されるだろう
739デフォルトの名無しさん
垢版 |
2023/02/20(月) 20:07:00.66ID:HgTGLFxo
>>737
日本語や中国語はUTF-8だと処理が面倒なんだよな

UTF-8は将来、UTF-32に置き換わるだろう。
2023/02/20(月) 21:29:57.22ID:iLGtEctg
日本語とか中国語が特にめんどうという話は聞いたことがない。どういうこと?
2023/02/20(月) 22:49:24.50ID:eS5XTp7S
UTF-16が持て囃されたのももはや4半世紀以上前なんだが

日本語も中国語もUTF-16の範疇で何ら問題なく処理できるはずなのに
どんな処理系でいまだに扱いが面倒なのか教えてほしいな
まあ具体例を聞いたら「そんなゴミとっとと廃棄処分しろ」という乾燥にしかならない気もするけど
2023/02/20(月) 23:56:20.10ID:ssy6UqTn
UTF32にはUTF16同様にエンディアンの問題があるから入出力形式には向かない
まぁ、UTF8にはUTF8で冗長コードの問題があるわけだが……UTF8をコードポイント単位で読み込んで処理するのが一番確実と思う
743デフォルトの名無しさん
垢版 |
2023/02/21(火) 19:33:57.30ID:VTx8hARX
>>740
UTF-8は文字によって1バイトで済むなら1バイトで表現する。

これはアルファベットを使用している欧米人には都合がいいが、漢字を使っている日本人、中国人などでは、その漢字は何バイトなのか常に意識しなくてはならなくなる。

近い将来、4バイトで統一した方が楽という話になる。
特に中国が世界の中心になると、中華人民共和国が推奨しているキャラクタセット GB2312は2バイトで一文字をあらわすキャラクタセット。

日本語のように1~2バイトで表現するから、UTF-8のように1バイト文字、2バイト文字、3バイト文字、4バイト文字、5バイト文字と何バイト使うのかわからないキャラクタセットは嫌う。

中国語EUCとUTF-8は相性が悪い。
744デフォルトの名無しさん
垢版 |
2023/02/21(火) 19:35:15.90ID:VTx8hARX
GB2312をUTF-8に置き換えようとしても、面倒くせえだけだと思うは中華人民共和国も同じ。
745730
垢版 |
2023/02/21(火) 20:03:36.31ID:bx2YVvOk
みんな言うことバラバラw 結局なにが良いんだよう?
2023/02/21(火) 20:04:41.27ID:NFhPk2T2
>>743
寝ぼけるな。
欧米でもアクセント付きの文字やちゃんとしたクォートとか使えばバイト数増える。
さらに合成アクセント、合成文字、異体字セレクタ、絵文字合成、国旗とかもろもろあって固定長にはならない。UTF32使っても可変長。
2023/02/21(火) 20:09:54.26ID:gmc1mmvr
文字をいろいろ表そうとリガチャ導入したのは失敗だと思う
748デフォルトの名無しさん
垢版 |
2023/02/21(火) 20:11:40.47ID:KCRD8vTD
>>746
UTF-32は一文字が32ビットで、4バイト単位で文字を表現するから、漢字一文字を4バイトで表現している中国のキャラクタセットと相性がいい。

UTF-8は一文字が何バイトなのかわからないから困るんだぞ?

日本語や中国語は、UTF-8だと2バイト文字というものがほぼ存在しない。

1バイト文字か3~4バイト文字の混合だったから、UTF-8よりUTF-32の方がシンプルになる。

さすがに32ビットではなく、64ビットにしようというのは、かなり未来の話だろう。
749デフォルトの名無しさん
垢版 |
2023/02/21(火) 20:13:32.50ID:KCRD8vTD
>>746
話が矛盾しているぞ。UTF-8もUTF-32も同じ批判ができるなら、UTF-32の方がシンプルだろ?
2023/02/21(火) 20:59:48.85ID:6Lh94JJt
うわあ「GB2312」ときたかあ
2000年以前の知識からアップデートできてないゴミ以下の化石の認識なら、
まあ>743みたいなことを言い出すのも納得だわ
当の中国政府すら「GB2312までしか対応できないようなソフトウェア製品は流通禁止」なんて言い出してから
すでに15年以上経過してるのにいったいお前はどれだけぼーっと生きてきたんだ?

>>745 繰り返すけどBOMなしUTF8以外もはやありえない
2023/02/21(火) 22:10:48.02ID:6Lh94JJt
おそらくだけど>743は知識が古すぎて
>>746が挙げてる用語がそれぞれどういう意味を持ってるのか何一つ理解できていないだろう
これでは会話が成立しない
もしくは知識があるうえで>748や>749みたいなことを言い出してる可能性もないわけではないが
仮にそうであったとすれば頭が悪すぎてなおのこと会話が成立しないと思われる
2023/02/22(水) 07:57:15.15ID:NZkCD/9S
正直、UTF-8にBOMつけるんなら
ISO2022 でいいやんと思う
753730
垢版 |
2023/02/22(水) 09:59:50.26ID:xbNdqyen
>>750
わかった、あなたとマイクロソフトのメモ帳を信じることにするw
2023/02/22(水) 20:25:50.37ID:yP74xxqg
BOMはほしい
2023/02/22(水) 21:44:23.38ID:Z5Yb2D9Z
>>754
そのこころは?
2023/02/23(木) 02:06:56.75ID:CN6TeDKs
あって損はない
2023/02/23(木) 03:19:42.48ID:sj7+9G1y
これからは UTF−8 に統一されるんだから BOM は不要
過去の遺物になることが確定してるんだがら、可能な限り早く BOM 無しに移行せよ
2023/02/23(木) 08:50:00.45ID:2/POnIZR
>>757
わかった、俺もあなたとマイクロソフトのメモ帳を信じることにするw
759デフォルトの名無しさん
垢版 |
2023/02/23(木) 10:27:37.47ID:4H8fy78d
UTF-8にBOMは要らんし付けてはいけない
未だにBOM言うてるのは老害ゴミ
異体字セレクタとか観たら卒倒して死んじゃうんじゃないか
2023/02/23(木) 10:39:46.94ID:A0wb20Dk
いまだにBOM言ってるのはたしかに老害だな。signatureって言え。
2023/02/23(木) 11:04:10.21ID:9YiKsc0f
Excelにutf8食わすときに必要だし、Windows Searchもutf-8はBOM付き前提で、この状況は未だにかわってない
BOMなし教の人はWindow使ってないんじゃないの?w
2023/02/23(木) 12:50:39.71ID:WqT6xFqM
最終的にはBOM無しUTF-8に統一されるべきだと思うけど
移行期の今はまだBOM付きの方が現実的で無難
まずはWindowsやOffice等主要ツールがBOM無しUTF-8前提になってくれないと
2023/02/23(木) 13:56:15.28ID:QgGws+lN
>>762
天下のMicrosoft様がメモ帳の初期値をBOM無しUTF-8になさっておられる
ExcelとかWindows Searchとかもいずれ追随するんじゃねーの?
2023/02/23(木) 14:40:49.03ID:9YiKsc0f
>>763
世の中から既存のものを含めた全てのSJISテキストファイルが消えてなくなればBOMなし対応になるだろうが、果たして何年かかるかな
2023/02/23(木) 14:42:16.10ID:TD+FtAmO
レジストリスクリプトなど、windowsのユニコードが未だutf16leという現状で
utf8w/obomに統一とか時期尚早でしょ
2023/02/23(木) 16:34:16.53ID:GQ/uFi0l
BOMはSJISと関係なく作られたとおもうが?
2023/02/23(木) 17:00:14.57ID:sj7+9G1y
Windows のシステムロケールをUTF8に設定すればExcellとかOffice系もBOM無しでいけるんじゃないの?
2023/02/23(木) 17:55:58.87ID:PPu7W9/5
Excel の先頭BOMとかいう愚かな仕様も早く無くなってほしい
テキスト開くときにエンコーディングを指定できればいいだけだよね
2023/02/23(木) 19:31:24.94ID:sj7+9G1y
>>768
だからシステム・ロケール UTF8 に変更すれば BOM いらない。
お前らがシステム・ローケルをSJISに設定してSJIS優先にしてるから、それに従ってBOM無しをSJISとみなしてるだけ。
単に設定の問題。エクセルは悪くない
770デフォルトの名無しさん
垢版 |
2023/02/23(木) 22:06:54.24ID:lGgWFFZW
BOMがあって困った経験はJavaしかないなあ
BOM付きを標準していいくらいじゃないかな
771デフォルトの名無しさん
垢版 |
2023/02/23(木) 22:09:58.66ID:lGgWFFZW
Windowsの古い資源と共存するためにもUTF-8/16/32はBOM付きを必須にしたほうがいい
BOMを廃止して良いことなど何もないのが現実。今どきにBOMに対応してないほうがおかしい
2023/02/23(木) 22:30:34.98ID:sj7+9G1y
そもそもネットの通信でも、MacでもLinuxでもUTF-8にBOMつけたりしない。
UTF-8にBOMつけたのは過去のWindowsだけって時点でゴミなのわかるだろ。そのWindowsだってデフォルトでは付けない方向に舵を切った。
今時BOM必要って言ってるのは時代の変化についてこれなくて、過去の環境に生き続けたいロートルだけ。
773デフォルトの名無しさん
垢版 |
2023/02/23(木) 22:59:31.84ID:lGgWFFZW
>>772
BOMがついているファイルを扱えないと機会損失にしかならない。
これは純粋なビジネス上の問題。LinuxとMacが少数派であることの理由のひとつにもなってる
774デフォルトの名無しさん
垢版 |
2023/02/23(木) 23:04:51.37ID:SB4P+kzn
>>772
UTF-8なんて使っているのが過去の環境に生き続けたい(ASCIIが素通しになる)ロートルだけだろ。
775デフォルトの名無しさん
垢版 |
2023/02/23(木) 23:09:41.34ID:lGgWFFZW
エンジン開発での競争に敗れた国がこぞってEV化を推進しようとするのと似た構図。
シェアを持っているWindowsには業務アプリケーション遺産に対する責任がある。負け組のLinuxとMacにはそれがない。
2023/02/23(木) 23:55:53.12ID:DZ2N6cRC
うわあ頭がおかしいのが複数湧いてる(ひょっとして同一人物の別IDだったりして)
意図的に間違ったことをあえて逆張りで言ってるのか本気で信じてるのかどっちなんだろう

UTF8を使うのがロートルって、こいつの言ってる「過去」ってまさかWindows以前のMS-DOSの時代のことか

あとUTF-16やUTF-32のテキストファイルなんて
規格上定義されてることは知ってるけど現物にお目にかかったことなんかないし
そもそもUTF-16やUTF-32なんて元々BOM必須だろうよ
過去の負の遺産がある以上アプリケーションとしてはBOMありファイルの読み込みには対応しなきゃダメだろうけどさ
今後作成するファイルでUTF-16/32を選ぶのは論外だし、UTF-8で保存するならBOMをつける必要などどこにもないだろうよ
2023/02/24(金) 00:16:53.98ID:/JDec9CR
>>700
Windowsは内部的にはUTF16で統一されてるよ
そこはLinuxよりも優れた設計
2023/02/24(金) 00:17:46.23ID:/JDec9CR
> UTF-8で保存するならBOMをつける必要などどこにもないだろうよ
BOMをつけないと他の文字コードとの区別ができなくて
文字化けしてしまう
2023/02/24(金) 00:19:03.22ID:/JDec9CR
だいたいUTF-8のBOMはUnicodeの正式な仕様なのだから
対応してないほうが悪い
2023/02/24(金) 00:22:30.88ID:/JDec9CR
LinuxとかmacOSとかUnixはUnicodeの対応が遅れていて
LANG=C.UTF-8でさえPOSIXで標準化されていない
Unicodeを正しく扱えないコマンドがある
2023/02/24(金) 00:50:08.17ID:rqUoHIRk
>>780
いったいいつの時代の話をしてるんだ
具体的なコマンド名とディストリビューションを挙げてみろや
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。