Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
文字コード総合スレ Part12 https://mevius.5ch.net/test/read.cgi/tech/1544931495/
文字コード総合スレ part13
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
2020/07/03(金) 20:53:47.08ID:elbfDzqw490デフォルトの名無しさん
2022/07/14(木) 23:55:27.47ID:dhZ0Z3m6 そもそも文字コードに絵文字は必要?
491デフォルトの名無しさん
2022/07/15(金) 00:59:26.68ID:o79mkU7V 必要でしょ
中央アジアで使われていた紋章タムガもUnicode登録すべきだと思うよ
それなら貴族や大名の家紋も登録しろみたいな話になるかもしれんが、タムガは別
中央アジアで使われていた紋章タムガもUnicode登録すべきだと思うよ
それなら貴族や大名の家紋も登録しろみたいな話になるかもしれんが、タムガは別
492デフォルトの名無しさん
2022/07/15(金) 01:46:43.92ID:o79mkU7V タムガは中国の漢字を元に考案されたという説がある
漢字からして絵文字のようなものだから、絵文字がダメなら漢字もダメだろう
さらに突き詰めれば、漢字を含む表意文字は広義の絵文字だから、表意文字も禁止しなければならなくなる
漢字からして絵文字のようなものだから、絵文字がダメなら漢字もダメだろう
さらに突き詰めれば、漢字を含む表意文字は広義の絵文字だから、表意文字も禁止しなければならなくなる
493デフォルトの名無しさん
2022/07/15(金) 04:09:44.38ID:8pcZ5oZc >>489
それは昔のauとjフォンに言ってあげて
それは昔のauとjフォンに言ってあげて
494デフォルトの名無しさん
2022/07/15(金) 04:48:32.08ID:o79mkU7V 色付き絵文字は、従来のANSI Colorのように色情報を捨てられる恐れがないという利点もある
わかりやすい例を挙げると、コピペすると色情報はあっさりと失われたりするけど、絵文字ならその心配がない
わかりやすい例を挙げると、コピペすると色情報はあっさりと失われたりするけど、絵文字ならその心配がない
495デフォルトの名無しさん
2022/07/15(金) 06:51:07.79ID:LI/vBnI5 絵文字は表意文字の発展形のようなものだと思えば
漢字は特定の物や概念を共通の文字で表現できる、この機能が進展したと
漢字は特定の物や概念を共通の文字で表現できる、この機能が進展したと
496デフォルトの名無しさん
2022/07/15(金) 20:43:12.57ID:eDVqQDWt 漢字と違うのは、書体がまだ確立されてないところかなあ
00年代の絵文字入りメールを今見るとガラケーでの表示とは別物に見える
今から20年後も、今のiOSやAndroidの絵文字デザインとは別物になってるだろう
アイコンとかのUIパーツは5年ぐらいのスパンで流行が変わっていってるし
00年代の絵文字入りメールを今見るとガラケーでの表示とは別物に見える
今から20年後も、今のiOSやAndroidの絵文字デザインとは別物になってるだろう
アイコンとかのUIパーツは5年ぐらいのスパンで流行が変わっていってるし
497デフォルトの名無しさん
2022/07/15(金) 20:52:16.46ID:w1A0sfi2 漢字の成り立ちを考えたら、絵文字は大幅な退化な気がする
498デフォルトの名無しさん
2022/07/15(金) 22:17:10.66ID:XzYs8QwT そもそも、架空の文字は登録しないとか言ってたのに絵文字はどうなのよ
499デフォルトの名無しさん
2022/07/15(金) 22:47:55.23ID:C1BojQ1G 妛とか袮は架空の文字じゃないんか
500デフォルトの名無しさん
2022/07/15(金) 22:52:27.74ID:DtYLfgjh その問いに答えるには「架空の文字」を明確に定義する必要がある
501デフォルトの名無しさん
2022/07/15(金) 23:09:06.29ID:1VgG+0ON ダンサーがオルガになったり汗が射精だったりして
あくまでも絵としか捉えられていないのが現実
あくまでも絵としか捉えられていないのが現実
502デフォルトの名無しさん
2022/07/15(金) 23:39:46.47ID:uuTe8dv5 文字として使われていなかったものを、勝手に作って文字と強弁して登録した罪。
それが絵文字。
だったら俺もクリンゴン文字とか山田文字とか作って登録できるし、CJK分離漢字も登録できる。
それが絵文字。
だったら俺もクリンゴン文字とか山田文字とか作って登録できるし、CJK分離漢字も登録できる。
503デフォルトの名無しさん
2022/07/15(金) 23:43:17.91ID:DtYLfgjh504デフォルトの名無しさん
2022/07/16(土) 00:10:50.08ID:V+kaf7mC ソビエト連邦旗の☭「鎌と槌」U+262Dがとっくの昔に絵文字登録されているのだから、クリミア・ハン国旗のタムガも絵文字登録されてしかるべき
https://en.wikipedia.org/wiki/Crimean_Khanate
https://en.wikipedia.org/wiki/Crimean_Khanate
505デフォルトの名無しさん
2022/07/16(土) 01:11:36.46ID:gUwlqT3Y 印籠の紋所はUnicodeに入らぬか?
506デフォルトの名無しさん
2022/07/16(土) 02:06:52.98ID:V+kaf7mC >>505
最強ロボ ダイオージャを知らない人にもわかるように書きなよ
最強ロボ ダイオージャを知らない人にもわかるように書きなよ
507デフォルトの名無しさん
2022/07/16(土) 04:22:29.98ID:6TWzUKaQ その界隈の人はクスリとくるジョークなのだろうけど理解できないのがもどかしいな
508デフォルトの名無しさん
2022/07/16(土) 04:47:30.81ID:V+kaf7mC509デフォルトの名無しさん
2022/07/20(水) 00:36:57.71ID:DKmMEeXx UIのテキストで「情報」を意味する小文字のiに○を使いたいんだけど、
U+1F6C8というのがどうもそれらしい。けどBMPじゃないし文字化けとかするかな?
BMPだとU+24D8がほぼ同じ文字だけど、やっぱ意味的にはU+1F6C8を使うべきかな?
さらにU+2139も"Information Source"という名で、VSのU+FE0Fを付けると四角で囲った
やつになるようだけど、絵文字に頼るのもあれかなあ
U+1F6C8というのがどうもそれらしい。けどBMPじゃないし文字化けとかするかな?
BMPだとU+24D8がほぼ同じ文字だけど、やっぱ意味的にはU+1F6C8を使うべきかな?
さらにU+2139も"Information Source"という名で、VSのU+FE0Fを付けると四角で囲った
やつになるようだけど、絵文字に頼るのもあれかなあ
510デフォルトの名無しさん
2022/07/20(水) 01:21:44.91ID:CPw89lWI Tcl/TkはBMP外つまりサロゲートペア領域に対応してないので移植時は要注意
511デフォルトの名無しさん
2022/07/20(水) 04:38:33.34ID:8Wa3pAaM 絵文字はいいぞ
512デフォルトの名無しさん
2022/07/20(水) 06:29:59.86ID:CPw89lWI ランドセル背負ったゴリラを思い出す言い回しだな
513デフォルトの名無しさん
2022/07/20(水) 14:22:20.66ID:tIQXO+Xm よくわからんがランドセル絵文字ないんか
514509
2022/07/21(木) 08:12:01.75ID:CyzMM+7q >>509
UIは実はAlexaだったのですが、U+1F6C8を使ってみたら見事にトーフが。ちょっと意外
テキストエンジンは何なんだろう。グリフをあまり持ってないとか?
とりあえずU+24D8は化けないようなのでこれでしのぎます
UIは実はAlexaだったのですが、U+1F6C8を使ってみたら見事にトーフが。ちょっと意外
テキストエンジンは何なんだろう。グリフをあまり持ってないとか?
とりあえずU+24D8は化けないようなのでこれでしのぎます
515デフォルトの名無しさん
2022/07/21(木) 13:33:51.02ID:zLG8F2Ab Hey, Siri🍑
516デフォルトの名無しさん
2022/07/21(木) 14:40:53.86ID:GvcP+xtO アレクサ 「Echo Showシリーズは、これまで作られた中で最も信頼のおける
スマートスピーカーです。 ミスなどありえません。」
スマートスピーカーです。 ミスなどありえません。」
517デフォルトの名無しさん
2022/07/21(木) 21:31:31.72ID:AssYeJ94 >>513
🎒 U+1F392
🎒 U+1F392
518デフォルトの名無しさん
2022/07/22(金) 01:43:04.94ID:59B4zCZN あるんか
これこそカラバリほしいわ
これこそカラバリほしいわ
519デフォルトの名無しさん
2022/07/22(金) 18:38:09.68ID:iW5ae+Pc 写真のようなリアリティ
https://unicode-table.com/jp/1F392/
https://unicode-table.com/jp/1F392/
520デフォルトの名無しさん
2022/07/22(金) 18:39:43.30ID:iaUAG8EO 鮑文字欲しい
521デフォルトの名無しさん
2022/07/23(土) 00:32:48.08ID:s/X/zNVK 鞄の話の次は鮑?
522デフォルトの名無しさん
2022/07/23(土) 11:19:33.99ID:tvAp0xTn 泡置いとくね
🫧
🫧
523デフォルトの名無しさん
2022/07/23(土) 14:08:22.93ID:F29cY8aJ 不審な豆腐が落ちている
524デフォルトの名無しさん
2022/07/23(土) 16:21:48.12ID:Soya9ZMU 酢豆腐です
525デフォルトの名無しさん
2022/07/23(土) 20:27:31.80ID:Mky4pirm あぶったほうがおいしいかも📛
526デフォルトの名無しさん
2022/07/24(日) 17:37:33.60ID:GMSYIMoG527デフォルトの名無しさん
2022/07/25(月) 00:19:28.22ID:/vBy9ug7 シジミは?
528デフォルトの名無しさん
2022/07/26(火) 00:17:39.57ID:ca5jRqNv いつの間にか全板で絵文字(や他のUnicode文字)が書き込めるようになってたのね
529デフォルトの名無しさん
2022/07/26(火) 08:06:45.62ID:7Tqe60a2 そもそも禁止してた理由って何だったの
530デフォルトの名無しさん
2022/07/26(火) 08:31:24.57ID:s47lqlR6 文字コードがSJISなので文字化けしてたってだけで、禁止されていたわけではなかったような
531デフォルトの名無しさん
2022/07/26(火) 11:01:14.08ID:SJaqZdjx はまぐりは?
532デフォルトの名無しさん
2022/07/26(火) 21:24:04.84ID:NQP/SI2g533デフォルトの名無しさん
2022/07/28(木) 01:01:11.47ID:yk9J+ZKC どの板でもスレタイに絵文字入れれるのかな
絵文字入ってるとかわいいよね
絵文字入ってるとかわいいよね
534デフォルトの名無しさん
2022/07/28(木) 12:28:31.82ID:DCbd1n5j 文字コードスレなんだから文字コードだろ
文字コードU+1F9AA総合スレ
文字コードU+1F9AA総合スレ
535デフォルトの名無しさん
2022/07/28(木) 12:37:51.66ID:YUqPgEN5 それはコードポイント
536デフォルトの名無しさん
2022/07/28(木) 12:38:16.73ID:rQVl/Liz 全文字、全単語に絵文字を作って割り当てるとどうなる
よく使われる単語ほどいい絵文字になるようにする
よく使われる単語ほどいい絵文字になるようにする
537デフォルトの名無しさん
2022/07/29(金) 10:39:19.93ID:nIcw6oQb スレタイに
森鷗外𠮟る
入れてみるか
森鷗外𠮟る
入れてみるか
538デフォルトの名無しさん
2022/07/30(土) 09:56:45.51ID:Gq7vfC3O 👨👩👧👦とか未だに未対応?
539デフォルトの名無しさん
2022/07/30(土) 09:57:43.09ID:Gq7vfC3O 普通にkakikometana!🇯🇵
540デフォルトの名無しさん
2022/07/30(土) 14:15:47.77ID:qUEsvGfx >>526
真珠貝のように見える
真珠貝のように見える
541デフォルトの名無しさん
2022/07/31(日) 02:20:53.15ID:EDJ4BvE5 なぜかパールっぽいものが乗っかってるんだよね
542デフォルトの名無しさん
2022/07/31(日) 02:22:53.24ID:EDJ4BvE5543デフォルトの名無しさん
2022/07/31(日) 09:56:30.71ID:gPPZPuim544デフォルトの名無しさん
2022/07/31(日) 12:49:19.36ID:EDJ4BvE5 今まで牡蠣の殻開けを何千個もやったけど真珠を見たことはないなあ
545デフォルトの名無しさん
2022/07/31(日) 16:03:34.57ID:7/NlTuud ・フリーランスに立ちはだかる「常駐」の壁。慣例を打ち壊し、
“テレワーク”案件3割→8割へと成長を遂げた「クラウドテック」の軌跡
・リモートワーク求人専門サイト「プロリモート」がリニューアルオープン、
業務委託契約の求職者と企業をマッチング
・1/3以上が採用につながる高マッチング率、リモートワーク×エンジニア・デザイナー専門の
人材紹介サービス「ReworkerAgent」正式リリース場所からも時間からも自由な働き方を実現!
・『ReWorks(リワークス)』リモートワーク特化型転職サイトとして 3月5日 リニューアル
・副業・兼業マッチングサービス「クラウドリンクス」登録者数2万人突破
中小企業で進む副業人材の採用、96%が継続採用を希望
・フリーランスが活用できる「最大1,000〜3,000万円・補助率50%〜75%」の
『ものづくり・商業・サービス補助金』とは?概要や条件を解説
・茨城県日立市、県外からの「テレワーク移住者」に最大151万円の助成金
・長野市、市内に移転・事業所設置し、移住することで最大550万円の支援金を支給
“テレワーク”案件3割→8割へと成長を遂げた「クラウドテック」の軌跡
・リモートワーク求人専門サイト「プロリモート」がリニューアルオープン、
業務委託契約の求職者と企業をマッチング
・1/3以上が採用につながる高マッチング率、リモートワーク×エンジニア・デザイナー専門の
人材紹介サービス「ReworkerAgent」正式リリース場所からも時間からも自由な働き方を実現!
・『ReWorks(リワークス)』リモートワーク特化型転職サイトとして 3月5日 リニューアル
・副業・兼業マッチングサービス「クラウドリンクス」登録者数2万人突破
中小企業で進む副業人材の採用、96%が継続採用を希望
・フリーランスが活用できる「最大1,000〜3,000万円・補助率50%〜75%」の
『ものづくり・商業・サービス補助金』とは?概要や条件を解説
・茨城県日立市、県外からの「テレワーク移住者」に最大151万円の助成金
・長野市、市内に移転・事業所設置し、移住することで最大550万円の支援金を支給
546デフォルトの名無しさん
2022/08/04(木) 17:09:44.85ID:ilLzPs3K パエリア食べたい
547デフォルトの名無しさん
2022/08/07(日) 02:26:54.79ID:q1GUZ6Ie >>536
ちょっとよくわからない
ちょっとよくわからない
548デフォルトの名無しさん
2022/08/07(日) 06:58:57.67ID:VW3DKuJ5 絵文字というのは象形文字への先祖返りみたいなものかもしれない
古代においては象形文字は書くのが大変で簡略化されて漢字になったが
その結果抽象的になりネイティブな言語利用者以外には理解しにくいものに
今なら絵文字のままの利用も可能で、ノンネイティブでも意味がわかるようなものに
なったり... しないか
古代においては象形文字は書くのが大変で簡略化されて漢字になったが
その結果抽象的になりネイティブな言語利用者以外には理解しにくいものに
今なら絵文字のままの利用も可能で、ノンネイティブでも意味がわかるようなものに
なったり... しないか
549デフォルトの名無しさん
2022/08/07(日) 11:47:28.30ID:DjsjW1Lz 視認性・可読性を無視してやたら細部に拘ってる辺り、象形文字未満だな
並べてみても中々違いが分からないような微妙なのが増えすぎ
子供が落書きを楽しんでる段階に見える
並べてみても中々違いが分からないような微妙なのが増えすぎ
子供が落書きを楽しんでる段階に見える
550デフォルトの名無しさん
2022/08/07(日) 17:15:40.76ID:LA5dvhjU まあ漢字でも柿落としみたいなのもあるしわからんもんはわからんよ
551デフォルトの名無しさん
2022/08/08(月) 08:46:52.76ID:2vuqHINW 絵文字と象形文字は違うものだよ。
象形文字は本物の文字なので意味だけでなく音を兼ね備えてていて、言葉や文章を一意に表現できる。
絵文字は名前に文字って入ってるけど、本物の文字としては不十分で絵文字だけ文章を表現するのは困難。
絵文字は象形文字以前の状態といえる。
象形文字は本物の文字なので意味だけでなく音を兼ね備えてていて、言葉や文章を一意に表現できる。
絵文字は名前に文字って入ってるけど、本物の文字としては不十分で絵文字だけ文章を表現するのは困難。
絵文字は象形文字以前の状態といえる。
552デフォルトの名無しさん
2022/08/08(月) 18:38:56.20ID:EJbQHD4d 音は必須ではないと思うが
553デフォルトの名無しさん
2022/08/08(月) 19:54:01.68ID:2vuqHINW 少なくとも三大古代文字の漢字、楔形文字、ヒエログリフのいずれも、そして意味が解読できているその他の象形文字も音と意味の両方から作られていることが明らかになっている。
554デフォルトの名無しさん
2022/08/10(水) 01:56:45.84ID:iD4Y1SYW 絵文字って漢字かななりアルファベットなりと組み合わせて使うわけだから単独で使えるかで評価する必要はなくない?
555デフォルトの名無しさん
2022/08/10(水) 23:31:45.45ID:nFYY+AJe >>553
数の概念を忘れていませんか?
数の概念を忘れていませんか?
556デフォルトの名無しさん
2022/08/10(水) 23:56:08.44ID:YW3nD3Rk ユニコードで文字コードを割り当てられるのは最大何文字で
現在割り当て済みなのは何文字で
どれくらいのペースで増え続けてるの?
現在割り当て済みなのは何文字で
どれくらいのペースで増え続けてるの?
557デフォルトの名無しさん
2022/08/11(木) 00:44:35.52ID:BDQw7LGG 牡蠣コードがあるのに雲丹コードがないのはおかしい
558デフォルトの名無しさん
2022/08/11(木) 08:15:19.15ID:dR8HgXjE 雲丹バーサル
559デフォルトの名無しさん
2022/08/11(木) 12:57:15.04ID:dClyCDz9 Unicode - Wikipedia
https://ja.m.wikipedia.org/wiki/Unicode#%E5%90%84%E3%83%90%E3%83%BC%E3%82%B8%E3%83%A7%E3%83%B3%E3%81%A8%E3%81%9D%E3%81%AE%E7%89%B9%E5%BE%B4
Unicode14.0(2021.10) - 144,697/1,112,064文字 (登録済み:約13%)
年平均4584文字増えていて、面を考慮せず単純な文字数ベースで考える且つこのままのペースで増え続けると仮定した場合、210年後(2231年)に全領域が埋まる計算になる
https://ja.m.wikipedia.org/wiki/Unicode#%E5%90%84%E3%83%90%E3%83%BC%E3%82%B8%E3%83%A7%E3%83%B3%E3%81%A8%E3%81%9D%E3%81%AE%E7%89%B9%E5%BE%B4
Unicode14.0(2021.10) - 144,697/1,112,064文字 (登録済み:約13%)
年平均4584文字増えていて、面を考慮せず単純な文字数ベースで考える且つこのままのペースで増え続けると仮定した場合、210年後(2231年)に全領域が埋まる計算になる
560デフォルトの名無しさん
2022/08/11(木) 13:44:05.70ID:MGah5dOT 未収録のマイナー文字体系が210年後まで続くかっていうとなさそう
絵文字とかもあと10年ぐらいしてめぼしいものが埋まると「もうさすがにいらんやろ」みたいな空気になって新設は細っていくんじゃね
絵文字とかもあと10年ぐらいしてめぼしいものが埋まると「もうさすがにいらんやろ」みたいな空気になって新設は細っていくんじゃね
561デフォルトの名無しさん
2022/08/11(木) 14:55:22.55ID:E9I00ai5 ほとんどが漢字だからな
562デフォルトの名無しさん
2022/08/11(木) 15:09:43.16ID:/k5aJ7yS 「こんだけ余裕がありゃあ大丈夫だろう」と思ってたものがあっという間に埋まってしまうことは良くある。歴史は繰り返す。
563デフォルトの名無しさん
2022/08/11(木) 20:13:56.60ID:jpYwMtC+ というとどういうのだろうか
①②③④…を(1000000)とかまで登録するとか?
①②③④…を(1000000)とかまで登録するとか?
564デフォルトの名無しさん
2022/08/11(木) 21:05:06.87ID:AMbuyrkD 配色じゃないの
ハートはいろんな色あるけど他はまだ色ないし
あとは肌の色のバリエーションがもっと細かく定義されるようになるとか
ハートはいろんな色あるけど他はまだ色ないし
あとは肌の色のバリエーションがもっと細かく定義されるようになるとか
565デフォルトの名無しさん
2022/08/12(金) 00:31:36.16ID:ZCgi2ef+566デフォルトの名無しさん
2022/08/12(金) 01:25:52.90ID:ijOecH2p GB18030が国際標準になるだけでは?
567デフォルトの名無しさん
2022/08/14(日) 11:22:08.74ID:VI2zLni0 UTF-8は可変長だからもう拡張する必要は無い
568デフォルトの名無しさん
2022/08/14(日) 13:15:35.13ID:GttZqyyI >>567
UTF-8 も、どこまでも可変長にできるわけではないですよ、
UTF-8 も、どこまでも可変長にできるわけではないですよ、
569デフォルトの名無しさん
2022/08/14(日) 18:33:41.24ID:YzvfyuVN UTF-8 は同じ方式でバイト数増やすとしたら6バイトまでで、6バイトにした場合は31bitまでしかビット数がない。
(第一バイトが 1111110x、第二バイト以降が 10xxxxxx なので 1+6*5 = 31)
素直にそのままの値を使うとしたら U+7FFFFFFF が限界になる。
幾らなんでもこんだけありゃ大丈夫だろう。
という考えは甘い。
(第一バイトが 1111110x、第二バイト以降が 10xxxxxx なので 1+6*5 = 31)
素直にそのままの値を使うとしたら U+7FFFFFFF が限界になる。
幾らなんでもこんだけありゃ大丈夫だろう。
という考えは甘い。
570デフォルトの名無しさん
2022/08/14(日) 21:21:55.32ID:ckMtCfKX もしものときにはShift_UTF-8みたいなのができるだろ
571デフォルトの名無しさん
2022/08/14(日) 21:48:08.99ID:VaUKKWtN 今の21bitですら使いきれずに持て余しているからあんな糞絵文字ばっかり追加しているわけだろう。
572デフォルトの名無しさん
2022/08/14(日) 22:37:52.07ID:KLzUuJOo573デフォルトの名無しさん
2022/08/14(日) 23:17:14.96ID:bHYBRaL8 糞絵文字は1つしかないぞ
574デフォルトの名無しさん
2022/08/15(月) 03:40:04.80ID:EupOFSdY 2007年当時の話だけど、毎年1000文字ずつエンコードしていっても
コードポイント使い切るまで800年以上かかるって
http://www.unicode.org/mail-arch/unicode-ml/y2007-m06/0034.html
これ書いた当時は年間944文字ペースで符号化していて文字数は減少傾向とも
コードポイント使い切るまで800年以上かかるって
http://www.unicode.org/mail-arch/unicode-ml/y2007-m06/0034.html
これ書いた当時は年間944文字ペースで符号化していて文字数は減少傾向とも
575デフォルトの名無しさん
2022/08/15(月) 09:07:29.00ID:5M5NpGCa UTF8だけならUTF16のサロゲート領域がまるまる空きなのでそこを先導バイトに使えば4000倍以上にはできる。
あとはUTF16とUTF32は捨ててUTF64を導入で。
あとはUTF16とUTF32は捨ててUTF64を導入で。
576デフォルトの名無しさん
2022/08/15(月) 09:27:51.58ID:u2HIEupu >>575
UTF64の導入か…現時点ではめんどくさくってしかたがないですねえ
UTF64の導入か…現時点ではめんどくさくってしかたがないですねえ
577デフォルトの名無しさん
2022/08/15(月) 09:34:53.03ID:5M5NpGCa 先頭のバイトで長さが判別できる特徴を残したいなら長くなるけど、先頭0xFEで12バイト、先頭0xFFで24バイト長とかにすれば、138ビットまで拡張できるな。
578デフォルトの名無しさん
2022/08/15(月) 09:47:13.51ID:5M5NpGCa >>576
心配するな現時点で今の21ビットが足りなくなる可能性は皆無。使用されている全部の文字を登録しても足りる。
絵文字増やしても個々の違いが判別できなくなるので文字として役に立たなくなるし、新たに創作文字を大量導入とか、単語に文字コード割当とか、アホなことしないと当面埋まることはない。
よし甲骨文字と金文と篆書と隷書の字体やその変化にも個別文字コード割当だとかやれば埋まりそうだが。
心配するな現時点で今の21ビットが足りなくなる可能性は皆無。使用されている全部の文字を登録しても足りる。
絵文字増やしても個々の違いが判別できなくなるので文字として役に立たなくなるし、新たに創作文字を大量導入とか、単語に文字コード割当とか、アホなことしないと当面埋まることはない。
よし甲骨文字と金文と篆書と隷書の字体やその変化にも個別文字コード割当だとかやれば埋まりそうだが。
579デフォルトの名無しさん
2022/08/15(月) 11:16:15.31ID:q8rBpYTm U+1D400..U+1D7FFみたいなのが収録されてるんだから
なんか理屈をでっち上げれば、明朝とゴシックと丸ゴシックと教科書体それぞれ3ウェイトずつぐらいはいけるのでは?
なんか理屈をでっち上げれば、明朝とゴシックと丸ゴシックと教科書体それぞれ3ウェイトずつぐらいはいけるのでは?
580デフォルトの名無しさん
2022/08/16(火) 11:08:43.06ID:2x3mrzZQ 地球外の惑星人の言語が見つかりだしたらあっという間に埋まるだろう
581デフォルトの名無しさん
2022/08/16(火) 16:32:26.25ID:Yjigu+Lf >>579
明朝体とゴシック体を丸ごと登録はありえないけど、甲骨文字、金文、篆書あたりの楷書より古い字体は古代文字扱いで丸ごと登録とか、可能性がゼロではないんだよな。
現在の漢字では失われて甲骨・金文にしかない文字とかもあるので。
明朝体とゴシック体を丸ごと登録はありえないけど、甲骨文字、金文、篆書あたりの楷書より古い字体は古代文字扱いで丸ごと登録とか、可能性がゼロではないんだよな。
現在の漢字では失われて甲骨・金文にしかない文字とかもあるので。
582デフォルトの名無しさん
2022/08/17(水) 01:36:20.68ID:0f27vmNE 音が出るコードが U+0007 以外にも沢山作られて・・・
583デフォルトの名無しさん
2022/08/17(水) 01:41:52.37ID:9A/D6zoB584デフォルトの名無しさん
2022/08/17(水) 01:47:12.74ID:afBzuANT 日本の変体仮名もマイナー過ぎるもの以外はあらかた登録されことを踏まえると、第三漢字面は甲骨文字等で埋まることになりそう(実際に登録された場合、今後数百年で最後の大規模登録になるはず)
585デフォルトの名無しさん
2022/08/17(水) 08:36:52.62ID:SBuYxxsF どれだけ文字が増えてもASCIIとの互換性は維持しなきゃいけないんだろうなぁ
586デフォルトの名無しさん
2022/08/17(水) 09:04:59.81ID:9A/D6zoB 甲骨文字はまだ研究中できちんと体系化できてなくて、これとあれは同じ文字だと思っていたが実は別の文字だったとか、見た目全然違うけど同じ文字とか、いまだにやってるし、研究者によって意見が違ったりする。
登録するとなるとかなり先になりそう、もしくは見切り発車的に現状の字形の見た目だけで登録するか。
登録するとなるとかなり先になりそう、もしくは見切り発車的に現状の字形の見た目だけで登録するか。
587デフォルトの名無しさん
2022/08/17(水) 12:03:40.31ID:75soL8XV >>577
スマートやね
スマートやね
588デフォルトの名無しさん
2022/08/18(木) 20:52:25.67ID:KZYn5ONA 任意多倍長文字コード…
589デフォルトの名無しさん
2022/08/20(土) 02:24:45.92ID:73/TEJ+c■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 中国国営メディア「沖縄は日本ではない」… ★6 [BFU★]
- ナイツ塙が指摘のローソンコーヒーカップ、ロゴ「L」で誤解生みデザイン変更へ 在庫使い切る3か月後にリニューアル [muffin★]
- 政府、株式の配当など金融所得を高齢者の医療保険料や窓口負担に反映する方針を固めた [バイト歴50年★]
- 【速報】 高市政権、「日本版DOGE」を立ち上げ 米国で歳出削減をした「政府効率化省(DOGE)」になぞらえたもの [お断り★]
- バービー、 台湾有事の発言の波紋で「たまったもんじゃない」「高市さんに真意は聞きたい」「国民に向けて説明してほしい」 [muffin★]
- 20代の3割が「テレビ見ない」現実…そして静かに広がる「究極のテレビ離れ」とは [muffin★]
