Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
文字コード総合スレ Part12 https://mevius.5ch.net/test/read.cgi/tech/1544931495/
文字コード総合スレ part13
https://mevius.5ch.net/test/read.cgi/tech/1593777227/
文字コード総合スレ part14
■ このスレッドは過去ログ倉庫に格納されています
2023/03/03(金) 15:46:58.08ID:yKqwMGHT
261デフォルトの名無しさん
2023/05/14(日) 19:14:35.45ID:c+bjkz0t262デフォルトの名無しさん
2023/05/14(日) 19:22:00.23ID:sJ4QSX2k 使用が一切認められない「禁止」ではない。
そして「話を戻すと」、せいで衝突したんじゃないな。
そして「話を戻すと」、せいで衝突したんじゃないな。
263デフォルトの名無しさん
2023/05/14(日) 21:29:14.62ID:Rm+3qTCO 当用漢字表
https://www.bunka.go.jp/kokugo_nihongo/sisaku/joho/joho/kakuki/syusen/tosin02/index.html
使用上の注意事項
イ この表の漢字で書きあらわせないことばは,別のことばにかえるか,または,かな書きにする。
ロ 代名詞・副詞・接続詞・感動詞・助動詞・助詞は,なるべくかな書きにする。
ハ 外国(中華民国を除く)の地名・人名は,かな書きにする。
ただし,「米国」「英米」等の用例は,従来の慣習に従ってもさしつかえない。
ニ 外来語は,かな書きにする。
ホ 動植物の名称は,かな書きにする。
ヘ あて字は,かな書きにする。
ト ふりがなは,原則として使わない。
チ 専門用語については,この表を基準として,整理することが望ましい。
https://www.bunka.go.jp/kokugo_nihongo/sisaku/joho/joho/kakuki/syusen/tosin02/index.html
使用上の注意事項
イ この表の漢字で書きあらわせないことばは,別のことばにかえるか,または,かな書きにする。
ロ 代名詞・副詞・接続詞・感動詞・助動詞・助詞は,なるべくかな書きにする。
ハ 外国(中華民国を除く)の地名・人名は,かな書きにする。
ただし,「米国」「英米」等の用例は,従来の慣習に従ってもさしつかえない。
ニ 外来語は,かな書きにする。
ホ 動植物の名称は,かな書きにする。
ヘ あて字は,かな書きにする。
ト ふりがなは,原則として使わない。
チ 専門用語については,この表を基準として,整理することが望ましい。
264デフォルトの名無しさん
2023/05/14(日) 23:31:19.13ID:eRs+xSP8 原則となる調達基準が制定されてそれ以外が入りにくくなったみたいな話だよね
こういうの一言で言えば何なんだろう?「ルール」?
こういうの一言で言えば何なんだろう?「ルール」?
265デフォルトの名無しさん
2023/05/15(月) 00:45:03.74ID:ZXlC61aQ 簡略化は一貫性がない場合もあるのな。傳->伝、團->団とか
266デフォルトの名無しさん
2023/05/15(月) 15:41:30.69ID:/VJRgGP9 異体字はその定義があいまいだから、IT技術者の仕様都合でどうにかできる話ではないでしょ
267デフォルトの名無しさん
2023/05/19(金) 01:30:50.77ID:Gmj5KBEl UTF-8をよく見かけるけど
7とか6とかも昔はあったんですか?
7とか6とかも昔はあったんですか?
268デフォルトの名無しさん
2023/05/19(金) 02:14:03.40ID:yl46Wrbm 8ビットスルーでない経路が絶滅危惧種だし
HTTPで無駄にUTF-7なんて使っても知らんいわれるのがオチ
つかうにしてもプログラム書かないといけないならBase64のが筋がよさそう
HTTPで無駄にUTF-7なんて使っても知らんいわれるのがオチ
つかうにしてもプログラム書かないといけないならBase64のが筋がよさそう
269デフォルトの名無しさん
2023/05/19(金) 03:59:19.38ID:D8L3U8l/270デフォルトの名無しさん
2023/05/19(金) 05:56:35.73ID:EpqBRKGy UTF-1は美しそうだ
271デフォルトの名無しさん
2023/05/19(金) 06:20:44.06ID:Gmj5KBEl やっぱり色々あるんですね㌧
これからも増える可能性もありそうですねー
これからも増える可能性もありそうですねー
272デフォルトの名無しさん
2023/05/19(金) 07:22:38.06ID:8oPN6wuF ・・・ギャグで言ってるつもりなのか本気でそう思ってるのか判断がつかないんで一応補足しとくと
「UTF-#」の#はバージョン番号じゃなくて
Unicodeの文字を何ビットで表現するかを意味してる
基本的には16Bitで表現するUTF-16が一番楽
サロゲートペア文字もそうでない文字も同じデータ長として管理するなら32Bit表現のUTF-32がよい
だが現状はAsciiと互換性のある8Bit表現のUTF-8が事実上の標準となった
UTF-7はデータビット数を8⇒7に減らすことで少しでも通信速度を稼ごうとしてた昔の通信経路向けの規格
「UTF-#」の#はバージョン番号じゃなくて
Unicodeの文字を何ビットで表現するかを意味してる
基本的には16Bitで表現するUTF-16が一番楽
サロゲートペア文字もそうでない文字も同じデータ長として管理するなら32Bit表現のUTF-32がよい
だが現状はAsciiと互換性のある8Bit表現のUTF-8が事実上の標準となった
UTF-7はデータビット数を8⇒7に減らすことで少しでも通信速度を稼ごうとしてた昔の通信経路向けの規格
273デフォルトの名無しさん
2023/05/19(金) 07:55:58.41ID:Gmj5KBEl >>272
バージョンじゃないんですか、詳しくありがとうございます!
バージョンじゃないんですか、詳しくありがとうございます!
274デフォルトの名無しさん
2023/05/19(金) 08:47:03.32ID:rVwS6Z+x >>272
あんまり知ったかぶりすんな
>「UTF-#」の#はバージョン番号じゃなくて
虚偽、UTF-1 とか UTF-2 はバージョン
> 基本的には16Bitで表現するUTF-16が一番楽
虚偽、(もしくは個人の感想)
> UTF-7はデータビット数を8⇒7に減らすことで少しでも通信速度を稼ごうと
虚偽
あんまり知ったかぶりすんな
>「UTF-#」の#はバージョン番号じゃなくて
虚偽、UTF-1 とか UTF-2 はバージョン
> 基本的には16Bitで表現するUTF-16が一番楽
虚偽、(もしくは個人の感想)
> UTF-7はデータビット数を8⇒7に減らすことで少しでも通信速度を稼ごうと
虚偽
275デフォルトの名無しさん
2023/05/19(金) 12:13:32.86ID:clAdGtGh276デフォルトの名無しさん
2023/05/19(金) 12:33:17.95ID:clAdGtGh277デフォルトの名無しさん
2023/05/19(金) 13:28:13.37ID:1PFium2f 64bit版g++は、規定のstd::wstringがUTF-32だよ
278デフォルトの名無しさん
2023/05/19(金) 13:29:18.88ID:1PFium2f 規定じゃなくて既定だった
279デフォルトの名無しさん
2023/05/19(金) 15:02:22.21ID:clAdGtGh >同じデータ長
doubt
doubt
280デフォルトの名無しさん
2023/05/19(金) 16:15:02.50ID:DhYPerzk ネタとして楽しむためには正しい知識がいる、という
281デフォルトの名無しさん
2023/05/20(土) 00:06:13.39ID:Wgabc+Na 文字コード奥深過ぎだなアニメ化して欲しい
282デフォルトの名無しさん
2023/05/20(土) 13:16:12.40ID:QfLlK72x IVSなめんな
283デフォルトの名無しさん
2023/05/20(土) 13:31:47.35ID:XYoRKnAf ペロッ...これは、0xE0100で修飾された異体字!!
284デフォルトの名無しさん
2023/05/20(土) 13:52:04.98ID:HDVuLGIu 文字コードソムリエですね
285デフォルトの名無しさん
2023/05/21(日) 20:48:13.44ID:5peOv9L3 \ソムリエ
286デフォルトの名無しさん
2023/05/23(火) 23:24:40.51ID:R2ZlFyvy 漢字構成記述文字 IDSは何処かで有効活用されているのですか?
今の字体の見た目の直感と違うのですが
黒 →⿱里灬 ダメ?
https://kanji-database.sourceforge.net/ids/ids-analysis.html
>解字IDSデータは、UCS漢字を、字の成り立ちからIDS化する作業を行っています。
U+09ED1 黑 ⿱𡆧炎 會意 3840010
U+09ED2 黒 →黑
https://github.com/cjkvi/cjkvi-ids/blob/86b4d16159f0079437870408f0ca186e529015db/ids-analysis.txt#L18185
今の字体の見た目の直感と違うのですが
黒 →⿱里灬 ダメ?
https://kanji-database.sourceforge.net/ids/ids-analysis.html
>解字IDSデータは、UCS漢字を、字の成り立ちからIDS化する作業を行っています。
U+09ED1 黑 ⿱𡆧炎 會意 3840010
U+09ED2 黒 →黑
https://github.com/cjkvi/cjkvi-ids/blob/86b4d16159f0079437870408f0ca186e529015db/ids-analysis.txt#L18185
287デフォルトの名無しさん
2023/05/24(水) 23:52:15.53ID:nx1OpmdE 見た目じゃなくて成り立ちだから歴史的経緯からIDS化してるんじゃね
288デフォルトの名無しさん
2023/05/27(土) 01:16:15.20ID:JRhYMEVC 簡体字制定時にも過度の正規化に反対する良心的な人もいたみたいだけど…結果は文化継承お構い無しむしろ断絶こそ業績みたいな御用学者に押し切られた?わけで
一旦決まったからはあの面子の国、則天文字やルイセンコ学説宜しく滅ぶまで使い続けるんだろな
という訳で今すぐ滅びろ
一旦決まったからはあの面子の国、則天文字やルイセンコ学説宜しく滅ぶまで使い続けるんだろな
という訳で今すぐ滅びろ
289デフォルトの名無しさん
2023/05/27(土) 06:31:36.72ID:EKOWOt22 二簡字ぐらいいくとかっこよくも見えてくる
290デフォルトの名無しさん
2023/05/27(土) 14:22:30.10ID:Qh66ZSbX utf-8が標準だと思ってたけど昨日Excel見たらutf-8じゃなくてビックリした
291デフォルトの名無しさん
2023/05/27(土) 15:25:11.32ID:Iw6vgmTP メモリ上の内部コードはしらんけど
xlsxはXMLだからUTF-8じゃない?
xlsxはXMLだからUTF-8じゃない?
292デフォルトの名無しさん
2023/05/27(土) 19:18:50.92ID:4YJ0U8GR 文語で「じゃない」を使うおじさん
293デフォルトの名無しさん
2023/05/27(土) 22:18:54.32ID:Qh66ZSbX お姉さんの可能性あるで
俺もお姉さんだし( ・`ω・´)
俺もお姉さんだし( ・`ω・´)
294デフォルトの名無しさん
2023/05/27(土) 22:19:28.39ID:Qh66ZSbX >>291
他の人のExcelも今度確認してみるわ
他の人のExcelも今度確認してみるわ
295デフォルトの名無しさん
2023/05/28(日) 11:38:12.73ID:mveGBcKw XML は BOMつき UTF-16 も許されてるんじゃなかったっけ?
BOM無しなら UTF-8 だったか
BOM無しなら UTF-8 だったか
296デフォルトの名無しさん
2023/05/28(日) 21:52:09.12ID:YNYjEu0w excelは昔からさまざまな文字コードに対応してる
高い互換性を維持し続けてる
それがMSの強さ
こういうところはUnixとかLinuxとかOSSでは
太刀打ちできない
高い互換性を維持し続けてる
それがMSの強さ
こういうところはUnixとかLinuxとかOSSでは
太刀打ちできない
297デフォルトの名無しさん
2023/05/28(日) 22:53:12.34ID:mveGBcKw >>296
emacs だってexcel 以上に多種多様な文字コードに対応してるし、linux (glibc)の対応ロケールと文字コードの数は windows より多いぞ。
無知が擁護するとMSの格が下がるのでやめとけ。
emacs だってexcel 以上に多種多様な文字コードに対応してるし、linux (glibc)の対応ロケールと文字コードの数は windows より多いぞ。
無知が擁護するとMSの格が下がるのでやめとけ。
298デフォルトの名無しさん
2023/05/28(日) 23:26:13.89ID:ig5hb7tN299デフォルトの名無しさん
2023/05/29(月) 01:28:07.80ID:0ytXwqTB Microsoft が互換性重視とか最近のブラックユーモアは笑えないなぁ
ASCII との互換性を切捨てて UTF-16 にしようとして失敗したり
5年以上前のCPUは Windows 11 ではサポートしません、買い替えてくださいとか言い出したり
その頃 linux では33年前の CPU の 80486 の互換性はそろそろ切って良いのではという議論をしてた。
ASCII との互換性を切捨てて UTF-16 にしようとして失敗したり
5年以上前のCPUは Windows 11 ではサポートしません、買い替えてくださいとか言い出したり
その頃 linux では33年前の CPU の 80486 の互換性はそろそろ切って良いのではという議論をしてた。
300デフォルトの名無しさん
2023/05/29(月) 12:46:50.20ID:MCD4Vue8 2012年頃?
Windows10 が最後の Windows バージョンです(キリっ
Windows10 が最後の Windows バージョンです(キリっ
301デフォルトの名無しさん
2023/05/29(月) 13:52:34.19ID:M19znpYQ MSはJIS X 0213:2012のIVSに
Wordが早く対応したりしてそれほど悪い印象はない
しかしパス名が未だにCP932系なのは何とかならんのか
Wordが早く対応したりしてそれほど悪い印象はない
しかしパス名が未だにCP932系なのは何とかならんのか
302デフォルトの名無しさん
2023/05/29(月) 14:43:43.87ID:0ytXwqTB >>301
ロケール設定とアプリの問題じゃないの?
ロケール設定とアプリの問題じゃないの?
303デフォルトの名無しさん
2023/05/29(月) 15:27:55.29ID:hGly4rru 近年のMSは、昔からの独自仕様での高い互換性よりも、オープンソース&標準準拠を進めているのは良い
304デフォルトの名無しさん
2023/05/29(月) 21:29:10.05ID:NNOaBXNh >>302
日本ロケールだとNTFSのパス名がShift JIS
日本ロケールだとNTFSのパス名がShift JIS
305デフォルトの名無しさん
2023/05/29(月) 21:38:29.70ID:mH3oOe43 ファイル名で使用される文字セット
https://learn.microsoft.com/ja-jp/windows/win32/intl/character-sets-used-in-file-names
> NTFS では、Unicode にファイル名が格納されます。
https://learn.microsoft.com/ja-jp/windows/win32/intl/character-sets-used-in-file-names
> NTFS では、Unicode にファイル名が格納されます。
306デフォルトの名無しさん
2023/05/29(月) 21:41:41.73ID:1bms2IW3 >>304
そういうのはコンソールやアプリ側のエンコーディング設定であってな...
そういうのはコンソールやアプリ側のエンコーディング設定であってな...
307デフォルトの名無しさん
2023/05/29(月) 21:58:43.15ID:0DJ9XOU5 UTF16はMBCSと共存しており切り捨てた訳ではない
windows11で64bit版だけになるまで16bitアプリも動かせてたわけで
そもそもソースレベルでしか互換性を保てないのがLinux
Linuxは当初はEUCだったと思うけど当時の日本語対応ソフトが今のUTF8で動くかい?
windows11で64bit版だけになるまで16bitアプリも動かせてたわけで
そもそもソースレベルでしか互換性を保てないのがLinux
Linuxは当初はEUCだったと思うけど当時の日本語対応ソフトが今のUTF8で動くかい?
308デフォルトの名無しさん
2023/05/29(月) 23:12:48.07ID:0ytXwqTB309デフォルトの名無しさん
2023/05/30(火) 07:55:17.64ID:89IT6MB6 >>308
Linuxで20年前にコンパイルしたバイナリが今のLinuxで動く?
冗談はやめてほしい
百歩譲ってロケール切り替えで動くとして今のUTF8前提のアプリと共存出来ないでしょ
Windowsだったら20年前のMBCSのソフトもそのまま動くよ
当然Unicodeのソフトも動く
Ubuntuが32bitCPUのサポートカーをきったのは5年くらい前だっけ
Windows11より速いですね
あとマイクロソフトがMBCS切り捨ててUTF16一本にしようとしたってのは初耳ですが根拠を出してほしい
Linuxで20年前にコンパイルしたバイナリが今のLinuxで動く?
冗談はやめてほしい
百歩譲ってロケール切り替えで動くとして今のUTF8前提のアプリと共存出来ないでしょ
Windowsだったら20年前のMBCSのソフトもそのまま動くよ
当然Unicodeのソフトも動く
Ubuntuが32bitCPUのサポートカーをきったのは5年くらい前だっけ
Windows11より速いですね
あとマイクロソフトがMBCS切り捨ててUTF16一本にしようとしたってのは初耳ですが根拠を出してほしい
310デフォルトの名無しさん
2023/05/30(火) 08:50:00.67ID:ZT3eEMEM311デフォルトの名無しさん
2023/05/30(火) 09:40:11.60ID:ksZIMFia コンパイルしたなら文字コード関係なくそりゃ動くわな。
スクリプト言語なら知らんが。
スクリプト言語なら知らんが。
312デフォルトの名無しさん
2023/05/30(火) 10:48:25.25ID:sLlAlpBn スクリプト言語のが文字という概念があるから
ロケールみて外部入出力ちゃんと取り持ってくれそう
昔のプログラムはバイトストリームで処理してるから問題ないだけで
ロケールなんてgettextで文言変わるくらいにしか利用してない
ロケールみて外部入出力ちゃんと取り持ってくれそう
昔のプログラムはバイトストリームで処理してるから問題ないだけで
ロケールなんてgettextで文言変わるくらいにしか利用してない
313デフォルトの名無しさん
2023/05/30(火) 12:45:01.53ID:+VlMdD+Q314デフォルトの名無しさん
2023/06/07(水) 04:27:17.54ID:0FN/+S+x タイトルに付いていたらあ、クソだなと思うもの
異世界
チート
転生
のんびり
最強
スローライフ
無双
ギルド
追放
スキル
おっさん
勇者
魔王
賢者
魔術師
錬金術
聖女
奴隷
悪役令嬢
婚約破棄
異世界
チート
転生
のんびり
最強
スローライフ
無双
ギルド
追放
スキル
おっさん
勇者
魔王
賢者
魔術師
錬金術
聖女
奴隷
悪役令嬢
婚約破棄
315デフォルトの名無しさん
2023/06/07(水) 17:58:56.39ID:Xm2S+dHf 遅くとも<title>までにはエンコードを確定できるワードが欲しいね
316デフォルトの名無しさん
2023/06/18(日) 09:23:53.16ID:a4zjBeRN どす恋!
317デフォルトの名無しさん
2023/06/22(木) 20:17:25.79ID:u8IMi/jS >>312
> 昔のプログラムはバイトストリームで処理してるから問題ないだけで
> ロケールなんてgettextで文言変わるくらいにしか利用してない
あっさり言ってくれちゃってますが
Ken Thompson大先生の大発明UTF-8以前は
みんな処理系から実行系まで
USC-2対応に書き換えるつもりだったんですよ?
凄く簡単なアイデアだけど着眼点がシャープ
それから商業UNIXのm17nは徹底的なもので
grepなんかも各言語、各文字コード対応だった
> 昔のプログラムはバイトストリームで処理してるから問題ないだけで
> ロケールなんてgettextで文言変わるくらいにしか利用してない
あっさり言ってくれちゃってますが
Ken Thompson大先生の大発明UTF-8以前は
みんな処理系から実行系まで
USC-2対応に書き換えるつもりだったんですよ?
凄く簡単なアイデアだけど着眼点がシャープ
それから商業UNIXのm17nは徹底的なもので
grepなんかも各言語、各文字コード対応だった
318デフォルトの名無しさん
2023/06/22(木) 20:30:09.06ID:6hgABg1u 👁--------→
319デフォルトの名無しさん
2023/06/22(木) 23:18:43.47ID:xBwPkaNz 昔のプログラムはバイトストリームで処理してるから問題ない?
そんなわけないだろ
正規表現の.とかUTF-8の一文字に対応させんといかんから
ほとんどのプログラムに修正が必要だぞ
今も修正できてないコマンドはいくらでもある
そんなわけないだろ
正規表現の.とかUTF-8の一文字に対応させんといかんから
ほとんどのプログラムに修正が必要だぞ
今も修正できてないコマンドはいくらでもある
320デフォルトの名無しさん
2023/06/23(金) 00:24:16.74ID:M8BBIM3e 相手が変なこといってるなと感じたら
じぶんが拾えてない情報がないか確認するよねふつう
じぶんが拾えてない情報がないか確認するよねふつう
321デフォルトの名無しさん
2023/06/23(金) 00:39:25.84ID:31qk7hM1 ふわっとしてんな
322デフォルトの名無しさん
2023/06/23(金) 05:42:45.03ID:G2V4SBFP >>320
お前、もしかして相手が変なことを言っていると感じているのか?
お前、もしかして相手が変なことを言っていると感じているのか?
323デフォルトの名無しさん
2023/06/23(金) 11:06:55.50ID:wom6IAq0324デフォルトの名無しさん
2023/06/23(金) 11:12:13.58ID:yEQ18GoZ325デフォルトの名無しさん
2023/06/23(金) 13:39:13.07ID:fMNbteF1 なーんだ、てっきり南カリフォルニア大学ことかと思っちゃった
326デフォルトの名無しさん
2023/06/23(金) 13:40:28.91ID:fMNbteF1 のw
327デフォルトの名無しさん
2023/06/23(金) 16:35:16.14ID:RASP4hQI このスレに来る人はICUを集中治療室とか国際基督教大学とは思わないから安心しろ
328デフォルトの名無しさん
2023/06/23(金) 16:49:42.58ID:fJe7a8sc UTF-8がASCII互換っていうのはASCII部分のみが互換っていう意味で
ASCIIだけを使ってるなら動くってことだよ
ASCII以外の漢字部分までASCII互換になるわけがない
そもそもASCIIに漢字なんて無いんだから
漢字は別途対応、もちろん漢字だけじゃなくて絵文字とかも含むからね
ASCIIだけを使ってるなら動くってことだよ
ASCII以外の漢字部分までASCII互換になるわけがない
そもそもASCIIに漢字なんて無いんだから
漢字は別途対応、もちろん漢字だけじゃなくて絵文字とかも含むからね
329デフォルトの名無しさん
2023/06/24(土) 15:50:27.65ID:v2U7ONLO これで気兼ねなくATMの話ができます!
330デフォルトの名無しさん
2023/06/24(土) 15:54:00.59ID:xBNVjuxa331デフォルトの名無しさん
2023/06/24(土) 16:15:39.62ID:6718OB4j 昔のプログラムがバイトストリームで処理してると思っているあたりが素人くさい。
MS-DOSの話してるんだろうか?
MS-DOSの話してるんだろうか?
332デフォルトの名無しさん
2023/06/24(土) 17:49:25.13ID:mybFnLY5 >>330
ASCII以外の文字を扱う全てのプログラムに修正が必要
ASCII以外の文字を扱う全てのプログラムに修正が必要
333デフォルトの名無しさん
2023/06/25(日) 09:29:11.85ID:u4T7tXaY334デフォルトの名無しさん
2023/06/25(日) 11:58:16.15ID:0nHjw2pZ335デフォルトの名無しさん
2023/06/25(日) 13:42:41.66ID:gLBngrQA 多バイト文字の処理が念頭にあるんだろうけども
改行含めてASCIIの範囲でマッチできれば成立するプラグラムの方が大半な気がする
catやcpなんて文字コードなにそれだし
改行含めてASCIIの範囲でマッチできれば成立するプラグラムの方が大半な気がする
catやcpなんて文字コードなにそれだし
336デフォルトの名無しさん
2023/06/25(日) 17:28:04.26ID:ySKqPmeW うん。だからテキスト処理関係のフィルタコマンドだよ
grepとかsedとかawkとかtrとかcutとかsortとか
そこいらは全部修正が必要
grepとかsedとかawkとかtrとかcutとかsortとか
そこいらは全部修正が必要
337デフォルトの名無しさん
2023/06/25(日) 17:56:47.65ID:0nHjw2pZ338デフォルトの名無しさん
2023/06/25(日) 19:33:55.93ID:+QOmRgEX >>329
それは回線にモデルとかISBNとか使ってた頃の遺物だろww
それは回線にモデルとかISBNとか使ってた頃の遺物だろww
339デフォルトの名無しさん
2023/06/25(日) 19:53:24.27ID:s5vVSYDk ぼくは雑誌コード
340デフォルトの名無しさん
2023/06/25(日) 19:59:23.87ID:ySKqPmeW341デフォルトの名無しさん
2023/06/25(日) 20:41:53.62ID:0nHjw2pZ342デフォルトの名無しさん
2023/06/25(日) 21:34:04.71ID:nujrLvHq >>336
ほとんどのプログラムって言っていたのが随分と対象が減ったな
ほとんどのプログラムって言っていたのが随分と対象が減ったな
343デフォルトの名無しさん
2023/06/25(日) 21:49:59.79ID:ySKqPmeW344デフォルトの名無しさん
2023/06/25(日) 21:54:46.00ID:ySKqPmeW どうせ今の話しか知らんくせに
やってみたら動いているみたいだから
昔から対応していたみたいの思ってるんだろうけど
これとか読んだら?
GNU Coreutils - Multibyte/unicode support
https://crashcourse.housegordon.org/coreutils-multibyte-support.html
やってみたら動いているみたいだから
昔から対応していたみたいの思ってるんだろうけど
これとか読んだら?
GNU Coreutils - Multibyte/unicode support
https://crashcourse.housegordon.org/coreutils-multibyte-support.html
345デフォルトの名無しさん
2023/06/25(日) 21:56:04.00ID:ySKqPmeW 多くの人の努力によってようやくUTF-8に対応しつつあるというのに
ASCIIのままのプログラムでUTF-8でも動くとか
あーほみたいじゃなくて、あーほ
ASCIIのままのプログラムでUTF-8でも動くとか
あーほみたいじゃなくて、あーほ
346デフォルトの名無しさん
2023/06/25(日) 22:09:28.31ID:0nHjw2pZ347デフォルトの名無しさん
2023/06/25(日) 22:10:52.26ID:ySKqPmeW348デフォルトの名無しさん
2023/06/25(日) 22:18:03.54ID:ySKqPmeW だいたいASCIIにしか対応してないプログラムって言ってんだから
ロケールにも対応してないに決まってるだろ
頭悪そうじゃなくて、頭悪い。
ロケールにも対応してないに決まってるだろ
頭悪そうじゃなくて、頭悪い。
349デフォルトの名無しさん
2023/06/25(日) 22:22:23.09ID:0nHjw2pZ >>345
gnu や linux は商用unixの後追いで互換ツール作ってたんだよ。商用unixは皆対応できてた。
こっちとら linux の黎明期に glibc や gnu tool の locale 実装手伝ってたりしたんだが、お前何やったの?
gnu や linux は商用unixの後追いで互換ツール作ってたんだよ。商用unixは皆対応できてた。
こっちとら linux の黎明期に glibc や gnu tool の locale 実装手伝ってたりしたんだが、お前何やったの?
350デフォルトの名無しさん
2023/06/25(日) 22:24:10.92ID:ySKqPmeW351デフォルトの名無しさん
2023/06/25(日) 22:25:47.25ID:ySKqPmeW 俺が何をやったかだって?
お前よりすごいことをしていたよ
守秘義務があるから言えないけどなwww
お前よりすごいことをしていたよ
守秘義務があるから言えないけどなwww
352デフォルトの名無しさん
2023/06/25(日) 22:25:52.06ID:0nHjw2pZ >>348
336の話してるんだが、どこで言ったの? 脳内? ASCII しか対応してないって何時の時代の話? お前何か参加したの?
336の話してるんだが、どこで言ったの? 脳内? ASCII しか対応してないって何時の時代の話? お前何か参加したの?
353デフォルトの名無しさん
2023/06/25(日) 22:30:06.30ID:ySKqPmeW > ASCII しか対応してないって何時の時代の話?
まさか全アメリカ人がUTF-8に目覚めたとでも思ってるのか?w
まさか全アメリカ人がUTF-8に目覚めたとでも思ってるのか?w
354デフォルトの名無しさん
2023/06/25(日) 22:31:57.20ID:ySKqPmeW 今もUnicode・UTF-8に非対応で、
本当は一文字なのに三文字とか間違える実装を知らんのだろうな
本当は一文字なのに三文字とか間違える実装を知らんのだろうな
355デフォルトの名無しさん
2023/06/25(日) 22:34:23.36ID:ySKqPmeW 漢字1文字が最大8バイト、Unicodeの「IVS」とは?
https://xtech.nikkei.com/it/article/COLUMN/20100126/343783/
https://xtech.nikkei.com/it/article/COLUMN/20100126/343783/
356デフォルトの名無しさん
2023/06/25(日) 22:34:25.42ID:0nHjw2pZ UTF-8 が来た時には既に locale があった
locale に対応していたれば同じバイナリで UTF-8 も扱えたので、UTF-8 に対応するめの改修とかする必要なかった
locale に対応していたれば同じバイナリで UTF-8 も扱えたので、UTF-8 に対応するめの改修とかする必要なかった
357デフォルトの名無しさん
2023/06/25(日) 22:37:12.38ID:0nHjw2pZ 個々のツールを改修する必要はなくて、OS側のライブラリを改修することで対応するという基本的な考え方が理解できてないんだろうな。
358デフォルトの名無しさん
2023/06/25(日) 22:40:53.01ID:ySKqPmeW どうやらASCIIしか考慮してないプログラムは
そのOS側のライブラリを使ってないということに
思い至らないようだw
それともなにか?printfをロケール対応に
仕様変更するきかね?www
そのOS側のライブラリを使ってないということに
思い至らないようだw
それともなにか?printfをロケール対応に
仕様変更するきかね?www
359デフォルトの名無しさん
2023/06/25(日) 22:41:32.64ID:9S6fsVfv >>335
wc
wc
360デフォルトの名無しさん
2023/06/25(日) 22:42:37.03ID:ySKqPmeW UTF-8 が来た時には既に locale があった
だがlocale に対応していないプログラムがたくさんあった
だがlocale に対応していないプログラムがたくさんあった
361デフォルトの名無しさん
2023/06/25(日) 23:21:26.81ID:0nHjw2pZ >>360
で336のうちどれの話?
で336のうちどれの話?
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 中国、日本行き“50万人”キャンセル 渡航自粛でコロナ禍以来最大 [お断り★]
- 高市首相答弁を“引き出した”立民・岡田克也氏が改めて説明「なぜ慎重な答弁をされなかったのか。非常に残念に思っている」 ★5 [ぐれ★]
- 中国、日本行き“50万人”キャンセル 渡航自粛でコロナ禍以来最大 ★2 [お断り★]
- 【次の一手】台湾問題で小林よしのり氏が私見「まさに戦争前夜」「ただちに徴兵制を敷いて、高市支持者を最前線へ」… ★4 [BFU★]
- 【速報】日本産牛肉の対中国輸出再開協議が中止 ★2 [おっさん友の会★]
- 毛寧(もう・ねい)報道官「中国に日本の水産品の市場は無い」 高市首相の国会答弁に「中国民衆の強い怒り」 [ぐれ★]
- 【愛国者速報】フィフィ、中国の“日本産水産物輸入停止”措置に私見「中国依存しないとやっていけない企業は考えを改めて」 [856698234]
- 【ござる専🏡】風間🥷配信実況スレ🏯【風間いろは】
- 【速報】中国政府、ゲームを禁輸。原神やブルアカ、荒野行動が日本で影響 [347751896]
- 中国「私達が怒ってるのは日本の政治家に対してで、日本の観光客や日本企業はこれまで通り歓迎する。これこそが大国としての余裕」 [377482965]
- おさかなさんあつまれえ
- 高市コイン、ガチで156円突入へwwwwwwwwww [246620176]
