Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
文字コード総合スレ Part12 https://mevius.5ch.net/test/read.cgi/tech/1544931495/
文字コード総合スレ part13
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
2020/07/03(金) 20:53:47.08ID:elbfDzqw132デフォルトの名無しさん
2021/09/10(金) 11:27:58.08ID:us9/OBHL メーカーに聞きなよ
ファイル名順じゃなさそう
ファイル名順じゃなさそう
133デフォルトの名無しさん
2021/09/10(金) 11:35:19.75ID:fLqCHdah ファイルシステム(FAT32かexFAT?)のエントリー順だったりして
134デフォルトの名無しさん
2021/09/10(金) 14:35:19.70ID:EUHR/7at135デフォルトの名無しさん
2021/09/10(金) 14:38:02.56ID:QyVGfDLG そういうの困るよな
136デフォルトの名無しさん
2021/09/10(金) 15:09:19.40ID:us9/OBHL DAPに限らず、メディアプレーヤーって結構メタ情報見てるぜ?
トラック名とかトラック番号とか。
トラック名とかトラック番号とか。
137デフォルトの名無しさん
2021/09/10(金) 15:19:50.85ID:EUHR/7at138デフォルトの名無しさん
2021/09/10(金) 15:20:52.85ID:++MWMR1k どうせ全角半角とか、特殊数字とか使ってるだけでは?
ファイル名の数字付け直してみては?
ファイル名の数字付け直してみては?
139デフォルトの名無しさん
2021/09/10(金) 15:41:18.97ID:EUHR/7at >>138
すべて半角数字です
同じMP3をfoobarやandroidのpowerampに送った場合は問題なく数字順に再生されるので、ファイル名に問題はないと思います
ダミーで数字だけふったファイルを入れても同じでした
文字コード云々ではなくなにかDAP側での仕様なのかもしれませんね
みなさんスレ違いな話題にお返事くださりありがとうございました
すべて半角数字です
同じMP3をfoobarやandroidのpowerampに送った場合は問題なく数字順に再生されるので、ファイル名に問題はないと思います
ダミーで数字だけふったファイルを入れても同じでした
文字コード云々ではなくなにかDAP側での仕様なのかもしれませんね
みなさんスレ違いな話題にお返事くださりありがとうございました
140デフォルトの名無しさん
2021/09/11(土) 02:58:23.87ID:xBOfeQ/p たぶん別メーカーのDAPだけど、先頭に00を付けたら回避できるって書かれてる気がするから試してみては
https://www.amazon.co.uk/review/R1DDVSAU2A2YWL/
https://www.amazon.co.uk/review/R1DDVSAU2A2YWL/
141デフォルトの名無しさん
2021/09/13(月) 13:11:45.64ID:8JnEfLqC142デフォルトの名無しさん
2021/09/15(水) 08:05:37.54ID:BhVzDKVU Unicode 14.0.0
https://www.unicode.org/versions/Unicode14.0.0/
https://www.unicode.org/versions/Unicode14.0.0/
143デフォルトの名無しさん
2021/09/15(水) 16:54:13.89ID:fAeisqPm どんどんメジャー番号上がるなあ
144デフォルトの名無しさん
2021/09/16(木) 14:52:51.85ID:AiSajF/c 「Unicode Emoji 14.0」リリース──敬礼する顔や妊娠する男性など
https://www.itmedia.co.jp/news/articles/2109/16/news074.html
https://www.itmedia.co.jp/news/articles/2109/16/news074.html
145デフォルトの名無しさん
2021/09/16(木) 20:24:58.42ID:qSJtKW3p シティポップの野良のzipファイルを開くときに、韓国語のエンコーディングを選ぶと
日本語のファイル名が正しく展開された。その他のレガシーなエンコーディングでは
駄目。これってどうなってるのかな。
ちな韓国語の場合はEUCとMSのエンコーディングが基本的に同じ?
シティポップってやっぱ日本以外でも聴かれてるんだねーって、違うか。
日本語のファイル名が正しく展開された。その他のレガシーなエンコーディングでは
駄目。これってどうなってるのかな。
ちな韓国語の場合はEUCとMSのエンコーディングが基本的に同じ?
シティポップってやっぱ日本以外でも聴かれてるんだねーって、違うか。
146デフォルトの名無しさん
2021/09/16(木) 21:14:39.93ID:R13c8C0T gb2312なのに日本語で書かれたスパムを受け取ったこと無いかい?
ksx1001にも日本の文字は含まれている。
ksx1001にも日本の文字は含まれている。
147デフォルトの名無しさん
2021/09/16(木) 22:55:21.33ID:hrewid4q あれってなんでなん?
何か使い道あったん?
使わないけど精々100文字程度だから入れとくかーぐらいのこと?
何か使い道あったん?
使わないけど精々100文字程度だから入れとくかーぐらいのこと?
148デフォルトの名無しさん
2021/09/16(木) 23:46:44.00ID:oYfgSqnP 韓国は日本に併合された状態が30年以上続いてたわけで、その間に日本の文字が広まったんだろ
ksx1001制定時にも使われてたから入れたんじゃないか?
ksx1001制定時にも使われてたから入れたんじゃないか?
149デフォルトの名無しさん
2021/09/17(金) 00:25:33.08ID:Khs7lthH 入れた人、獄死してそうだね
150デフォルトの名無しさん
2021/09/17(金) 07:46:41.58ID:MfIJx2+6 JISのキリル文字よりは意味ありそうだな。
151デフォルトの名無しさん
2021/09/17(金) 16:12:38.90ID:XepSWu0d 平仮名と片仮名のワ行のウ、片仮名のヤ行のイ、片仮名のヤ行のエ(現代のエと区別する為に作られたイとエが合体したような字)
も追加されたんだな。
も追加されたんだな。
152デフォルトの名無しさん
2021/09/17(金) 16:48:38.12ID:fVFeSRx6 そういう変な文字が増えていくのなんかうれしいわw
153デフォルトの名無しさん
2021/09/17(金) 17:19:21.38ID:RINTXLOW154デフォルトの名無しさん
2021/09/17(金) 18:22:23.29ID:H28x+XeE 表音文字ですからね…
155デフォルトの名無しさん
2021/09/17(金) 18:24:50.47ID:EkFg3TOf 誰かぽげむたマーク申請して
156デフォルトの名無しさん
2021/09/17(金) 19:45:51.29ID:dA6826ix ぽげむたびげなみょ〜ん
157デフォルトの名無しさん
2021/09/17(金) 19:51:42.61ID:RINTXLOW がびんちょんぶー
158デフォルトの名無しさん
2021/09/17(金) 20:31:32.36ID:inv44Tua わ行は
ゐゑ
ヰヱ
や行のエ?
イとエの合体ってどんな字?
ゐゑ
ヰヱ
や行のエ?
イとエの合体ってどんな字?
159デフォルトの名無しさん
2021/09/17(金) 20:59:29.69ID:MfIJx2+6160デフォルトの名無しさん
2021/09/17(金) 21:25:09.08ID:inv44Tua ああ変態仮名か
thx
thx
161デフォルトの名無しさん
2021/09/18(土) 03:29:09.72ID:8cCB5H0x いや変体仮名と同じKana Extended-Aに押し込まれただけであって変体仮名扱いではない
主流の文字と重複した仮名のことを変体仮名って言ってるわけだから
既登録のやつとかぶってないYI/YE/WUはただの仮名
主流の文字と重複した仮名のことを変体仮名って言ってるわけだから
既登録のやつとかぶってないYI/YE/WUはただの仮名
162デフォルトの名無しさん
2021/09/18(土) 05:02:10.93ID:IGDtXFiL 越後とか会津あたりの、いとえが混ざった奴を表す平仮名はないの?
鉛筆がインピツになったり駅がイキになったりするやつ
鉛筆がインピツになったり駅がイキになったりするやつ
163デフォルトの名無しさん
2021/09/18(土) 06:03:15.06ID:iNoegsL2 変態かな?
164デフォルトの名無しさん
2021/09/18(土) 08:20:39.84ID:HKX409mh WU は見たことあるけどカタカナの YE とか YI って実例があるんだろうか? どの漢字由来か見当がつかない。
165デフォルトの名無しさん
2021/09/18(土) 09:10:43.24ID:KkDV+CVs 昔の文献
166デフォルトの名無しさん
2021/09/18(土) 09:48:46.78ID:owvkbREO Hentaiganaとはちゃんと区別されてHistoric Hiragana/Katakanaなんだな。
167デフォルトの名無しさん
2021/09/18(土) 11:27:32.09ID:urB35OC7 Wikipediaによると片仮名のヤ行イは「以」に由来、ヤ行エは「延」に由来するらしい。
ヤ行エは現代のエと同じ、ア行の方が違う形でU+1B000の「衣」に由来する字としてた事もあるらしい。
平仮名のヤ行イは「以」を崩した字でU+1B006,HENTAIGANA LETTER I-1と統合っぽい。
ヤ行エは現代のエと同じ、ア行の方が違う形でU+1B000の「衣」に由来する字としてた事もあるらしい。
平仮名のヤ行イは「以」を崩した字でU+1B006,HENTAIGANA LETTER I-1と統合っぽい。
168デフォルトの名無しさん
2021/09/18(土) 18:15:34.30ID:7WQTbyfT ARCHAICでは?
169デフォルトの名無しさん
2021/09/18(土) 18:18:20.29ID:7WQTbyfT 歴史文脈以外での使い方を考えよう
ウェーイ → ヱーイ
みたいに
イエーイに使えるか?
ウェーイ → ヱーイ
みたいに
イエーイに使えるか?
170デフォルトの名無しさん
2021/09/18(土) 19:00:28.80ID:9jLHXaUE 高島忠夫のはそっちかな
171デフォルトの名無しさん
2021/09/18(土) 20:03:19.72ID:0hOLMEcn 誰か今のうちに使っといて
172デフォルトの名無しさん
2021/09/19(日) 13:02:22.99ID:/yxUr6Cy 恵比寿
戎
恵比須
蛭子
夷
胡
どれが由来だろう
戎
恵比須
蛭子
夷
胡
どれが由来だろう
173デフォルトの名無しさん
2021/09/20(月) 02:00:22.59ID:9dkY59At 変体仮名が思うより変態で感心した。
私はくせ字だが日記を始め手書きも多く残すつもりだから、
遠い未来に自分のくせ字がひとつでも加わればこれ以上ない喜びだな。
私はくせ字だが日記を始め手書きも多く残すつもりだから、
遠い未来に自分のくせ字がひとつでも加わればこれ以上ない喜びだな。
174デフォルトの名無しさん
2021/09/20(月) 05:18:24.33ID:N9cWHXdB 元字が同じただの癖字じゃ無理だろw
それより慶応を广K广Oと書くようなやつのほうがよっぽど収録しがいがある
それより慶応を广K广Oと書くようなやつのほうがよっぽど収録しがいがある
175デフォルトの名無しさん
2021/09/20(月) 06:31:16.91ID:cwn/oiro 广マ法とか?
176デフォルトの名無しさん
2021/09/20(月) 06:32:35.49ID:onLWFfgA W
x
Y
x
Y
177デフォルトの名無しさん
2021/09/20(月) 10:07:43.39ID:z7blcdQn 葬祭の下側がアルファベットになってて
艹
死 タヌ
SO SAI
みたいなやつを見かけたことがあるんだけど
これもう文字じゃなくてロゴタイプじゃねと思った
艹
死 タヌ
SO SAI
みたいなやつを見かけたことがあるんだけど
これもう文字じゃなくてロゴタイプじゃねと思った
178デフォルトの名無しさん
2021/09/20(月) 10:08:04.72ID:rmuhdvcF OK狭間
179デフォルトの名無しさん
2021/09/20(月) 16:33:01.86ID:MIWZTagi あ𛀙よろし
生𛁛𛂦゙
生𛁛𛂦゙
180デフォルトの名無しさん
2021/09/20(月) 17:25:19.97ID:fWw3zdgc びろーん🏴
181デフォルトの名無しさん
2021/09/20(月) 17:32:48.55ID:WNFThOB/ ??
182デフォルトの名無しさん
2021/09/20(月) 17:33:17.54ID:WNFThOB/ 😀
183デフォルトの名無しさん
2021/09/20(月) 17:40:06.38ID:59l0WUiK 新しい絵文字出てもAndroidのバージョン古いと見れないのつらいわー
フォントだけなんだから絵文字だけ別枠で配信してくれないかしら
フォントだけなんだから絵文字だけ別枠で配信してくれないかしら
184デフォルトの名無しさん
2021/09/20(月) 18:04:52.52ID:MIWZTagi185デフォルトの名無しさん
2021/09/20(月) 18:13:01.74ID:onLWFfgA ふぉんとだよ
186デフォルトの名無しさん
2021/09/21(火) 01:32:25.68ID:4TsmTrOH うっそぴょん
187デフォルトの名無しさん
2021/09/21(火) 01:32:42.06ID:uT0Ufo0J そういやandroidはフォント入れ替えたり足したりできないのかな?
188デフォルトの名無しさん
2021/09/21(火) 15:56:07.39ID:9G4WCotR どう思う?
189デフォルトの名無しさん
2021/09/23(木) 14:38:45.46ID:+1CY5Q9Y おれのMeiryo UIを見てくれ
どう思う?
どう思う?
190デフォルトの名無しさん
2021/09/23(木) 17:05:48.69ID:d3rXCYAz 時代はYu Gothic UIだろjk
191デフォルトの名無しさん
2021/09/23(木) 17:17:37.59ID:s356ZNcw 字形なんて個人の好みに過ぎんよそでやれ( 文字コード原理主義)
192デフォルトの名無しさん
2021/09/23(木) 17:59:26.01ID:cmFu96z6 そそ
僕らは直が線対称だったり刃が切れなそうだったり反がハーイしそうでも気にならんよな?
僕らは直が線対称だったり刃が切れなそうだったり反がハーイしそうでも気にならんよな?
193デフォルトの名無しさん
2021/09/23(木) 18:01:40.49ID:73nshz3+ さすがにそれは字体の違いじゃすまん
194ハノン ◆QZaw55cn4c
2021/09/23(木) 18:29:00.18ID:HaJtCNmP >>192
CJK 漢字統合の悪い後遺症なんですが、なんで CJK 漢字統合とかやってしまったの?
CJK 漢字統合の悪い後遺症なんですが、なんで CJK 漢字統合とかやってしまったの?
195デフォルトの名無しさん
2021/09/23(木) 20:01:43.64ID:J2CwG+Vn でも統合しなかったらしなかったで
「見た目同じだけど検索に引っかからない文字」
がOCRとか素人入力とかで大量に使われてそれはそれでアレだったんだろうなあ
「見た目同じだけど検索に引っかからない文字」
がOCRとか素人入力とかで大量に使われてそれはそれでアレだったんだろうなあ
196デフォルトの名無しさん
2021/09/23(木) 20:51:24.74ID:8jxjFHXd197デフォルトの名無しさん
2021/09/23(木) 21:13:39.76ID:c1RLqe4u 漢字をあいまい検索するなら同義文字のデータベースを別途用意するのが正しい
CJK漢字統合では中途半端
バイオリンとヴァイオリンのように漢字に限らない問題だし
CJK漢字統合では中途半端
バイオリンとヴァイオリンのように漢字に限らない問題だし
198デフォルトの名無しさん
2021/09/23(木) 23:40:21.82ID:aPMb+uTW 正しいのはわかるが未だに
サンプル
サンプル
みたいなのさえ余裕で同一視してくれないやつ多いしなあ
統合なしだと現状と同レベルの利便性は特別な投資をしないと享受できないものになってた気がするんだよな
サンプル
サンプル
みたいなのさえ余裕で同一視してくれないやつ多いしなあ
統合なしだと現状と同レベルの利便性は特別な投資をしないと享受できないものになってた気がするんだよな
199デフォルトの名無しさん
2021/09/23(木) 23:47:24.09ID:8jxjFHXd プとふ゜を同一視しろと言われてもなあ
200デフォルトの名無しさん
2021/09/24(金) 01:03:35.59ID:VG+rYv0i ジャパニーズ絵文字をユニコードに入れまくったのは性犯罪と言える。
反省せよ!
反省せよ!
201デフォルトの名無しさん
2021/09/24(金) 02:32:55.61ID:LQ0rd/n8202デフォルトの名無しさん
2021/09/24(金) 02:35:08.29ID:LQ0rd/n8203デフォルトの名無しさん
2021/09/24(金) 02:38:51.59ID:LQ0rd/n8 >>200
世界統一基準のルールでやろうとすると実績ベースでやるしかない
Gmailの中の人が日本のキャリア携帯メールの絵文字対応する時に
Google独自の他社非互換の対応をするのではなくて標準に入れたのは英断
数千万人が使ってる文字の流通基盤作った
世界統一基準のルールでやろうとすると実績ベースでやるしかない
Gmailの中の人が日本のキャリア携帯メールの絵文字対応する時に
Google独自の他社非互換の対応をするのではなくて標準に入れたのは英断
数千万人が使ってる文字の流通基盤作った
204デフォルトの名無しさん
2021/09/24(金) 04:12:12.52ID:xJSRWXwX ヴィトンとゔぃとんをあいまい検索で同キーワード扱いするにはMecabのような分かちライブラリが必要になる
205デフォルトの名無しさん
2021/09/24(金) 04:21:14.03ID:xJSRWXwX Mecab用の新語辞書mecab-ipadic-NEologdの更新が2020年9月で止まってる
https://github.com/neologd/mecab-ipadic-neologd
https://github.com/neologd/mecab-ipadic-neologd
206デフォルトの名無しさん
2021/09/24(金) 07:16:32.42ID:LQ0rd/n8 >>205
Twitterも止まってるな
Twitterも止まってるな
207デフォルトの名無しさん
2021/09/24(金) 08:15:48.08ID:QlX8c1rH システムが英語設定のときに日本語を表示させると、中国語の字形で表示される
ことが多い気がする。Google先生に日本語の漢字を入力して検索しても、中国語の記事が
優先して出てくるような。
これはどういうことなんだ....
ことが多い気がする。Google先生に日本語の漢字を入力して検索しても、中国語の記事が
優先して出てくるような。
これはどういうことなんだ....
208デフォルトの名無しさん
2021/09/24(金) 09:53:35.98ID:IHKg493W 前半について言えば、日本語環境以外では中文フォントが優先利用されるようになっているからだろう。
209デフォルトの名無しさん
2021/09/24(金) 11:31:16.82ID:xJSRWXwX 中国人が天安門事件についてググりやすくするための配慮だろjk
210デフォルトの名無しさん
2021/10/01(金) 00:29:21.14ID:hXpOAmOJ 中国語って言っても繁体字でしょ?
フォールバック先としては適切では?
フォールバック先としては適切では?
211デフォルトの名無しさん
2021/10/01(金) 00:46:14.94ID:x0Z9nVhd 「直」とかが明らかに日中で形が違うのに同じコードポイントなのが問題で、誤字にしか見えない
許容範囲は「今」くらいまで
許容範囲は「今」くらいまで
212デフォルトの名無しさん
2021/10/01(金) 01:14:25.98ID:C9iYF2oS もはや「安」と「あ」を同じ文字だって言ってるレベルだもんな
213デフォルトの名無しさん
2021/10/01(金) 01:18:55.05ID:KGbDCwUx 形の問題で論じるとaとかgとかのバリエーションと同列の「字形が違うだけ」になってしまうような
214デフォルトの名無しさん
2021/10/01(金) 01:50:49.08ID:q6100VNR >>210
簡体字だけど
簡体字だけど
215デフォルトの名無しさん
2021/10/01(金) 02:22:30.83ID:Sv6vlKr2 泣いた
216デフォルトの名無しさん
2021/10/02(土) 00:21:19.15ID:mWEaacyi >>213
日本語において「令」の書き方が複数あるのは、どちらも使われていて同じものと認識されているから、字形が違うで済むし同じコードポイントで良い。aやgのバリエーションの違いに相当。
しかし中国語の「直」の字形は日本ではあまり一般的ではなく、同じものと認識できない可能性が高いから別にすべき。由来が同じでもすでに別物で、pとπのようなもの。
どこまでを同じものと認識するかは言語や文化が違えば当然異なるから、やはり統合漢字は無理がある。
もっと言えば、トルコ語アルファベットの大文字小文字の扱いや、全角半角の同一視の問題も根は同じ。
テキスト中に表を書くための罫線素片が全角と半角を統合とかアホとしか言いようがない。
日本語において「令」の書き方が複数あるのは、どちらも使われていて同じものと認識されているから、字形が違うで済むし同じコードポイントで良い。aやgのバリエーションの違いに相当。
しかし中国語の「直」の字形は日本ではあまり一般的ではなく、同じものと認識できない可能性が高いから別にすべき。由来が同じでもすでに別物で、pとπのようなもの。
どこまでを同じものと認識するかは言語や文化が違えば当然異なるから、やはり統合漢字は無理がある。
もっと言えば、トルコ語アルファベットの大文字小文字の扱いや、全角半角の同一視の問題も根は同じ。
テキスト中に表を書くための罫線素片が全角と半角を統合とかアホとしか言いようがない。
217デフォルトの名無しさん
2021/10/02(土) 03:12:57.27ID:AUpOKXgX >書き方が複数あるのは、どちらも使われていて同じものと認識されているから、字形が違うで済む
それがね、「人の名前を正確に書かないなんて失礼でしょ!」って、包摂されてるレベルの異体字を正確に表現することを求める人、結構いるんです…。
同じものだと認識してる人の範囲、実は案外狭くて、板挟みになってるところにしわ寄せがいってるだけかもしれません…。
それがね、「人の名前を正確に書かないなんて失礼でしょ!」って、包摂されてるレベルの異体字を正確に表現することを求める人、結構いるんです…。
同じものだと認識してる人の範囲、実は案外狭くて、板挟みになってるところにしわ寄せがいってるだけかもしれません…。
218デフォルトの名無しさん
2021/10/02(土) 15:31:50.03ID:a5sjMDOS219デフォルトの名無しさん
2021/10/02(土) 15:59:11.18ID:Sj1tG4Pu 先祖が字をちゃんと書かなかったせい
220デフォルトの名無しさん
2021/10/02(土) 16:02:15.81ID:lWVjrMOX だいたいの人の先祖は読み書きできないと思うが
221デフォルトの名無しさん
2021/10/02(土) 16:28:43.87ID:qz0ghb/n >>216
CJK統合が困るならサロゲートペアを使いなさい
CJK統合が困るならサロゲートペアを使いなさい
222デフォルトの名無しさん
2021/10/02(土) 16:30:41.53ID:qz0ghb/n223デフォルトの名無しさん
2021/10/02(土) 16:36:36.22ID:qz0ghb/n >>216
どの文字を同じとみなすかは
JIS X 0208の段階でも問題になってきたし
ISO-8859-*でさえ問題だった
応用ごとに同値関係を定義するしかない
たとえば
かちょう
がちょう
は索引で横並びかどうかなど
これは国ごとに応用ごとに違う
この辺りの知識はUnicodeのお陰で劇的に広まった
失敗がなかったなんて極端な事は言わないが
文字処理におけるUnicodeの貢献は大きい
唯一のテストベッド
最近のレスの知識レベルは20年前に戻ったかのようだ
どの文字を同じとみなすかは
JIS X 0208の段階でも問題になってきたし
ISO-8859-*でさえ問題だった
応用ごとに同値関係を定義するしかない
たとえば
かちょう
がちょう
は索引で横並びかどうかなど
これは国ごとに応用ごとに違う
この辺りの知識はUnicodeのお陰で劇的に広まった
失敗がなかったなんて極端な事は言わないが
文字処理におけるUnicodeの貢献は大きい
唯一のテストベッド
最近のレスの知識レベルは20年前に戻ったかのようだ
224デフォルトの名無しさん
2021/10/02(土) 16:40:36.25ID:qz0ghb/n >>217
しわ寄せなんてもないですよ
戸籍をデジタル化した時点で
後のUnicodeの文字集合採用ルールに従えば
異体字セレクタで全て扱えるべきですし
そうなっています
典拠がいまだ見つからない文字ですら扱えるべきなんです
どこかでもう使ってるかもしれないから
しわ寄せなんてもないですよ
戸籍をデジタル化した時点で
後のUnicodeの文字集合採用ルールに従えば
異体字セレクタで全て扱えるべきですし
そうなっています
典拠がいまだ見つからない文字ですら扱えるべきなんです
どこかでもう使ってるかもしれないから
225デフォルトの名無しさん
2021/10/02(土) 17:54:38.90ID:9xd0my2s226蟻人間 ◆T6xkBnTXz7B0
2021/10/02(土) 18:15:27.71ID:bUVac9NO 異体字セレクタ
https://ja.m.wikipedia.org/wiki/%E7%95%B0%E4%BD%93%E5%AD%97%E3%82%BB%E3%83%AC%E3%82%AF%E3%82%BF#:~:text=%E7%95%B0%E4%BD%93%E5%AD%97%E3%82%BB%E3%83%AC%E3%82%AF%E3%82%BF%20(%E8%8B%B1%3A%20Variation,(%E9%81%B8%E6%8A%9E%E5%AD%90)%20%E3%81%A7%E3%81%82%E3%82%8B%E3%80%82
https://ja.m.wikipedia.org/wiki/%E7%95%B0%E4%BD%93%E5%AD%97%E3%82%BB%E3%83%AC%E3%82%AF%E3%82%BF#:~:text=%E7%95%B0%E4%BD%93%E5%AD%97%E3%82%BB%E3%83%AC%E3%82%AF%E3%82%BF%20(%E8%8B%B1%3A%20Variation,(%E9%81%B8%E6%8A%9E%E5%AD%90)%20%E3%81%A7%E3%81%82%E3%82%8B%E3%80%82
227デフォルトの名無しさん
2021/10/02(土) 21:51:21.36ID:0KUEFcg9228デフォルトの名無しさん
2021/10/03(日) 01:40:13.18ID:7qrVNqxk229デフォルトの名無しさん
2021/10/03(日) 01:55:19.75ID:yBYg2wfE IPAの発音記号あたり、中途半端に特定の文字だけ専用に用意するよりIPA専用記号として全部一式きれいに揃えたほうがわかりやすいんじゃないかって思うわ
どこまで普通のラテンを使っていいのか直感的じゃなさすぎてつらい
どこまで普通のラテンを使っていいのか直感的じゃなさすぎてつらい
230デフォルトの名無しさん
2021/10/14(木) 22:08:20.62ID:4U8G8uJ7 IJ
231デフォルトの名無しさん
2021/10/22(金) 23:13:01.81ID:dHIUrNpa IEコンポーネントブラウザだと絵文字は基本的に白黒で表示されるイメージだったけど、
一部の絵文字はフルカラーになるのね。何が違うんだろう?
なんとなく、追加時期が新しいものがフルカラーになってそうなイメージ。
Unicode 6 😂
Unicode 7 🙂
Unicode 8 🤗
Unicode 9 🤧
Unicode 10 🤮
Unicode 11 🥺
Unicode 12 🥱
Unicode 13 🥲
一部の絵文字はフルカラーになるのね。何が違うんだろう?
なんとなく、追加時期が新しいものがフルカラーになってそうなイメージ。
Unicode 6 😂
Unicode 7 🙂
Unicode 8 🤗
Unicode 9 🤧
Unicode 10 🤮
Unicode 11 🥺
Unicode 12 🥱
Unicode 13 🥲
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【サッカー】U-17日本代表、激闘PK戦制す 北朝鮮撃破で6大会ぶり8強入り U17W杯 [久太郎★]
- 日本行き空路49万件キャンセル 中国自粛呼びかけ 日本行きチケット予約の約32%に相当 ★3 [ぐれ★]
- XやChatGPTで広範囲の通信障害 投稿や閲覧できず [蚤の市★]
- 【芸能】日中関係悪化でエンタメ業界に大ダメージ… JO1の中国でのイベント中止、邦画は公開延期、STARTOアイドルへの影響も [冬月記者★]
- 現役猟師・東出昌大、クマ被害続出も過熱する報道に「クマはそんな危ないもんじゃない」理由語る [muffin★]
- 【インバウンド】中国人観光客の日本での消費額は年間約2兆円超…中国政府は公務員の出張取り消し [1ゲットロボ★]
- ハゲがレジやってるコンビニって
- 4時だから窓から4回ちんこ出した
- クマどもが冬眠拒否
- Perfume・あ~ちゃんの結婚相手の一般男性、吉田カバンの社長と判明 [977261419]
- 自民党議員「高市は先人が築き上げた日中関係を壊した。外務省が謝罪に言ってるが自分で責任を取れ」 [834922174]
- 宇宙飛行士 vs 超天才数学者
