プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 http://mevius.5ch.net/test/read.cgi/tech/1516629503/
探検
文字コード総合スレ Part12
レス数が1000を超えています。これ以上書き込みはできません。
1デフォルトの名無しさん
2018/12/17(月) 16:48:24.47ID:Pfqpaohb985デフォルトの名無しさん
2021/05/12(水) 21:37:03.94ID:4TbGo10q ごめん誰か馬鹿な俺のために
(1) UTF16で表現できるがUTF32で表現できない文字
(2) UTF32で表現できるがUTF16で表現できない文字
を具体的に例示してもらえないだろうか
サロゲートペアなんてもう20年以上前には登場してたよね?
最大65536文字とか言ってる人は頭が平成1桁時代のまま取り残されてるの?
それとも、IVSや絵文字が絡むとUTF32で表現できない文字が出てきたりするんだっけ・・・?(こっちは自分が不勉強ゆえ自信なし)
(1) UTF16で表現できるがUTF32で表現できない文字
(2) UTF32で表現できるがUTF16で表現できない文字
を具体的に例示してもらえないだろうか
サロゲートペアなんてもう20年以上前には登場してたよね?
最大65536文字とか言ってる人は頭が平成1桁時代のまま取り残されてるの?
それとも、IVSや絵文字が絡むとUTF32で表現できない文字が出てきたりするんだっけ・・・?(こっちは自分が不勉強ゆえ自信なし)
986デフォルトの名無しさん
2021/05/12(水) 22:41:39.87ID:Be2Ur7pl987デフォルトの名無しさん
2021/05/12(水) 22:42:55.43ID:Be2Ur7pl >>974
βだろうがMO/MDだろうが、必要となったときに変換すりゃいいだけだろ。
少なくともその「必要となったとき」に吸い上げて変換した上で別の媒体に保存すればいい。
新しい文書は当然古い文字コードでは一切書かせてはいけない。
SJISなんぞ使った日にゃ秘密警察が見つけ出して206個ある骨をすべて砕く刑に処す。
>>975
その指摘は正しい。
ただ、一番正しい日付の表示法はヨーロッパ式で、
次に正しいのはお前が指摘しているアメリカ式で、一番馬鹿なのが日本式。
>>982
正確に数字で話せ。
で、真面目な話になるが、その中で最長の文字数を扱える文字コードはどれだ?
その最長の文字数でこの世のありとあらゆる文字は表現できるのか?
また、その最長の文字数を扱える文字コードだとデータ処理は遅くなってしまうのか?
βだろうがMO/MDだろうが、必要となったときに変換すりゃいいだけだろ。
少なくともその「必要となったとき」に吸い上げて変換した上で別の媒体に保存すればいい。
新しい文書は当然古い文字コードでは一切書かせてはいけない。
SJISなんぞ使った日にゃ秘密警察が見つけ出して206個ある骨をすべて砕く刑に処す。
>>975
その指摘は正しい。
ただ、一番正しい日付の表示法はヨーロッパ式で、
次に正しいのはお前が指摘しているアメリカ式で、一番馬鹿なのが日本式。
>>982
正確に数字で話せ。
で、真面目な話になるが、その中で最長の文字数を扱える文字コードはどれだ?
その最長の文字数でこの世のありとあらゆる文字は表現できるのか?
また、その最長の文字数を扱える文字コードだとデータ処理は遅くなってしまうのか?
988デフォルトの名無しさん
2021/05/12(水) 23:15:30.39ID:UT6XyfGi ISO8601よりヨーロッパ式を推すとはたまげたなあ
989デフォルトの名無しさん
2021/05/12(水) 23:28:53.01ID:LpmPGSmH 場末の掲示板の場末の板でイキってるんだから可愛いよね
990デフォルトの名無しさん
2021/05/12(水) 23:30:48.38ID:S+EDWDjz991デフォルトの名無しさん
2021/05/13(木) 00:55:59.37ID:bi8pzl4S >>978
C++のcwcharヘッダーからもわかるとおり、wchar_tは規格の一部
C++のcwcharヘッダーからもわかるとおり、wchar_tは規格の一部
992デフォルトの名無しさん
2021/05/13(木) 05:07:38.90ID:nrtxeueq >>990
https://www.cl.cam.ac.uk/~mgk25/ucs/utf-8-history.txt
> Looking around at some UTF-8 background, I see the same incorrect
> story being repeated over and over. The incorrect version is:
> 1. IBM designed UTF-8.
> 2. Plan 9 implemented it.
> That's not true. UTF-8 was designed, in front of my eyes, on a
> placemat in a New Jersey diner one night in September or so 1992.
>
> What happened was this. We had used the original UTF from ISO 10646
> to make Plan 9 support 16-bit characters, but we hated it.
要約 16bitのUTFを使っていたが嫌いだったからUTF-8を作った
https://www.cl.cam.ac.uk/~mgk25/ucs/utf-8-history.txt
> Looking around at some UTF-8 background, I see the same incorrect
> story being repeated over and over. The incorrect version is:
> 1. IBM designed UTF-8.
> 2. Plan 9 implemented it.
> That's not true. UTF-8 was designed, in front of my eyes, on a
> placemat in a New Jersey diner one night in September or so 1992.
>
> What happened was this. We had used the original UTF from ISO 10646
> to make Plan 9 support 16-bit characters, but we hated it.
要約 16bitのUTFを使っていたが嫌いだったからUTF-8を作った
993デフォルトの名無しさん
2021/05/13(木) 09:13:48.13ID:jPZ0z7Tj で、どこに 16bit の "UTF" って書いてあるの?
勝手に UTF を補完すんな。その頃は UTF-16 はまだ存在してない。
勝手に UTF を補完すんな。その頃は UTF-16 はまだ存在してない。
994デフォルトの名無しさん
2021/05/13(木) 11:09:24.10ID:0pD51twu995デフォルトの名無しさん
2021/05/13(木) 11:13:36.80ID:0pD51twu996デフォルトの名無しさん
2021/05/13(木) 13:46:00.24ID:oT9LP7EK 成立順
UCS-2(かつてのUnicode)→UCS-4→UTF-8→UTF-16→UTF-32
ってことかな?訂正よろ
UCS-2(かつてのUnicode)→UCS-4→UTF-8→UTF-16→UTF-32
ってことかな?訂正よろ
997デフォルトの名無しさん
2021/05/13(木) 13:51:48.50ID:pHijDXLB >>980
そのせいで shift_jis と同じ失敗を繰り返した訳だ
そのせいで shift_jis と同じ失敗を繰り返した訳だ
998デフォルトの名無しさん
2021/05/13(木) 14:28:18.42ID:oT9LP7EK999デフォルトの名無しさん
2021/05/13(木) 14:49:45.53ID:jPZ0z7Tj1000デフォルトの名無しさん
2021/05/13(木) 14:57:26.65ID:aKG1Dap7 文字コード総合スレ part13
https://mevius.5ch.net/test/read.cgi/tech/1593777227/
https://mevius.5ch.net/test/read.cgi/tech/1593777227/
10011001
Over 1000Thread このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 877日 22時間 9分 2秒
新しいスレッドを立ててください。
life time: 877日 22時間 9分 2秒
レス数が1000を超えています。これ以上書き込みはできません。
ニュース
- 【速報】山上徹也被告に無期懲役を求刑 ★6 [Hitzeschleier★]
- 年収の壁で総理と玉木代表が合意 178万円まで引き上げ 年収665万円以下が対象 ★2 [どどん★]
- 官邸幹部「日本は核兵器保有すべき」 政権内の議論は「ない」と説明 [どどん★]
- 胸を強調した女性アニメキャラをファミレスがコラボ企画で起用。「この表現はどうなのか」SNSで疑問の声 ★2 [少考さん★]
- 【芸能】笑い飯・哲夫 『THE W』の審査員「次からもう断ろうかな…」 粗品とのコメント回数の差にあ然 カンペで指示が出ている [冬月記者★]
- 中国外務省「日本への渡航を控えて」→高市内閣の支持率はとくに下がらず…なぜ日本国民がこれほど「高市内閣」を応援するのか★5 [♪♪♪★]
- 【速報】高市官邸幹部「日本は核兵器保有すべき」 [115996789]
- ちょっと待って!✋😠今とうすこしてる時間、本当に必要ですか?🤔🏡
- ほんこん「外野がうるさいのは それだけまともな事している証」高市早苗を応援 [834922174]
- 赤坂蒸し焼きサウナ夫婦「タオルを燃やせばこの火災報知器で異常が伝わるぞ!」👉ただの高温感知器で詰む [329329848]
- 【実況】博衣こよりのえちえちスーパーダンガンロンパ4🧪
- 国民「防衛費上げてほしい」高市早苗「増税します」 [834922174]
