文字コード総合スレ Part12

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2018/12/17(月) 16:48:24.47ID:Pfqpaohb
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
 (スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
 (隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 http://mevius.5ch.net/test/read.cgi/tech/1516629503/
2020/10/03(土) 14:23:10.98ID:asw2Nmie
アンカミス。 322 → 332
336デフォルトの名無しさん
垢版 |
2020/10/03(土) 14:44:31.16ID:y5FkQ2yd
もちつけ
2020/10/05(月) 00:37:11.64ID:aYBNZcXd
>>323
どうなんだろうね。
確かにユニコード的には例えばNFDにしたときのベースの文字が正解かと。
一方 U+025X はIPAのブロックで、要は発音記号... ということは、文脈的に発音記号
として使われているならこっちだったりするのかも?
2020/10/08(木) 10:57:17.71ID:tD965ZiH
Rubyをやってるんだけど、分からないところあるから教えてほしいです…
クラスメソッド、インスタンスメソッド、インスタンス変数あたりの意味がさっぱりで…
339デフォルトの名無しさん
垢版 |
2020/10/08(木) 11:08:48.28ID:Riy1MZEi
説明読んでも意味が判らない間は無理に使う必要は無い
君にはまだ早いってこと
2020/10/08(木) 11:25:58.08ID:e+h9pet/
>>338
Ruby 初心者スレッド Part 66
https://mevius.5ch.net/test/read.cgi/tech/1578068134/
2020/10/08(木) 11:34:16.59ID:SMtYwKCf
個人的に普段は ruby は使わないんだけど、文字コードの実装は perl や python や java に比べると ruby は筋が良いんだよな。(個人の感想です)
2020/10/08(木) 21:30:15.81ID:24ftK7/Z
>>341
python使いの私に文字コード関連でのrubyの利点についてぜひご教示ください。
rubyはさわったこと無いです。
2020/10/09(金) 09:29:33.69ID:81dxs4Bx
ドキュメントを見ると結構マイナー(?)なエンコーディングもあるっぽいね。
ケータイ各社の絵文字入りSJISとかもあるんだ。
https://en.wikibooks.org/wiki/Ruby_Programming/Encoding
2020/10/09(金) 11:37:23.24ID:5kgt8bw0
>>342
Python は内部格納文字コードに unicode を固定で使用していて、unicode に変換できない文字は使えないし、
unicode に変換した場合に unify などで消える情報は保持できないけど、
ruby は特定の文字コードを仮定した内部コードを持たないため、programing や library の実装でどうにでもなる。
初心者には Python の実装がわかりやすいけど、文字コードそのものをいじりたいレベルになると嵌ることがある。
概要は ruby m17n とかで、検索してい関連しそうな記事を読んで見ると良いかと。
345デフォルトの名無しさん
垢版 |
2020/10/09(金) 11:44:47.75ID:vl+UDRkB
うそはいかんよ
python は binary も自由に扱える
2020/10/09(金) 12:08:49.92ID:8qJEmYsV
>>345
バイナリは文字じゃないので文字列の長さすらわからない
低機能なデータ形式でしかない
347デフォルトの名無しさん
垢版 |
2020/10/09(金) 12:37:20.08ID:vl+UDRkB
ruby は文字じゃないものの文字列長をどうやって計算してるのですか?
2020/10/09(金) 12:38:41.36ID:EjYkYVIx
>>347
文字じゃないものの文字列長なんて計算できるわけ無いでしょ(笑)
だからいろんな文字コードを文字として認識できるようになってる
それに対しPythonはバイナリだから文字列の長さが計算できない(大爆笑)
349デフォルトの名無しさん
垢版 |
2020/10/09(金) 12:44:19.84ID:vl+UDRkB
うそはいかんよ
馬鹿丸出しだから煽りは止めた方が良い
350342
垢版 |
2020/10/09(金) 12:45:15.41ID:hk0qQeVw
>>344
ありがとうございます。
個々の文字列オブジェクトにエンコーディング情報を持たせてるので
文字コードを変換せずにm17nを実現できてる感じですね。
2020/10/09(金) 20:40:06.43ID:phj7/P3X
漢字のようで漢字でないUnicodeの「康熙部首」と「CJK部首補助」
https://techracho.bpsinc.jp/hachi8833/2020_10_07/95257
2020/10/10(土) 09:48:22.75ID:mP3lsNpF
Unicode 3.0って1999年だろうに
2020/10/10(土) 22:38:12.17ID:vUhDQSk6
nuby からの流れで... nkf って今でもメンテされてるようで。
ネットニュースから shar で入手したのはいつの日か。
2020/10/10(土) 23:59:49.31ID:33g/v1Rs
Unicodeの文字の情報を見たいと思ったら
どれを参照すればいいの?
2020/10/11(日) 01:36:12.47ID:PkCT08SK
情報って?
2020/10/11(日) 01:53:31.67ID:QQ2vPcGT
Aという文字の小文字はaであるとか
2020/10/11(日) 02:42:43.61ID:Y6xs0w7V
Unicodeのcode chartにはいちいち文字の説明が書いてあるがそれ以上の説明が欲しいのか否か?

https://unicode.org/charts/
2020/10/11(日) 06:59:02.20ID:QQ2vPcGT
>>357
それらの情報を全て文字ごとに知りたいんだよ
2020/10/11(日) 07:21:36.62ID:X3noy0YM
>>358
"Find chart by hex code:" ってとこにコードポイントを入れてみようw
2020/10/11(日) 07:33:27.40ID:QQ2vPcGT
>>359
情報が全く足りません
2020/10/11(日) 07:34:05.33ID:QQ2vPcGT
Aは大文字であり、対応する小文字はaである
という情報はどこに書かれているのでしょうか?
2020/10/11(日) 08:36:01.64ID:9KwtZAoB
https://unicode.org/charts/PDF/U0000.pdf
これの
LATIN CAPITAL LETTER A
LATIN SMALL LETTER A
区別じゃ足りないかい?
2020/10/11(日) 08:49:30.81ID:biiSH/I3
> 0041 A LATIN CAPITAL LETTER A
少なくとも「Aは大文字」は明記されてるけど??

> 0061 a LATIN SMALL LETTER A
小文字aの定義の記述から対応する文字も分かると思うんだけど
それじゃわからないということであれば、
「大文字Aに対応する小文字はaである」みたいなことは
Unicodeの仕様書じゃなくて英語圏の小学生or幼稚園児向け教科書とかに書かれてるんじゃないかね
2020/10/11(日) 09:48:07.57ID:EIUTbwb3
何が欲しいか、もっと明確に書かないと伝わらないぞ。
例えばこれとかは使える?
https://unicode.org/Public/UNIDATA/UnicodeData.txt
2020/10/11(日) 10:11:43.02ID:X3noy0YM
>>364
使えるかどうかは能力の問題ですよねw
2020/10/11(日) 10:24:25.43ID:ieSx8e01
>>364
これは対応した項目があるねぇ
装飾のあるアルファベットについても参照番号が載ってる
367デフォルトの名無しさん
垢版 |
2020/10/11(日) 12:14:43.64ID:kZXFoyze
ほう
3041;HIRAGANA LETTER SMALL A;Lo;0;L;;;;;N;;;;;
3042;HIRAGANA LETTER A;Lo;0;L;;;;;N;;;;;
2020/10/11(日) 12:26:01.00ID:j5pFI3Yh
あ、あと文字の幅も知りたい
2020/10/11(日) 12:27:09.66ID:j5pFI3Yh
Aに対応する小文字がaなら
あに対応するカタカナはアという情報があっても
良いと思うのだがあるのか?
370デフォルトの名無しさん
垢版 |
2020/10/11(日) 12:33:22.48ID:kZXFoyze
>>369
曾礼多
2020/10/11(日) 12:36:42.03ID:j5pFI3Yh
>>370
嫁無い
2020/10/11(日) 13:23:05.62ID:a5ebPbEF
1,2,3
2020/10/11(日) 13:26:32.41ID:a5ebPbEF
3042;HIRAGANA LETTER A;Lo;0;L;;;;;N;;;;;
30A2;KATAKANA LETTER A;Lo;0;L;;;;;N;;;;;

ないようだ
2020/10/11(日) 18:56:47.77ID:lNYgVXzm
いい加減自分で調べられるだろ... 釣りか
Unicodeの他のデータとかUnicodeに関するAPIとかにある。

そうやって、全世界が「あーUnicodeでいいね」ってなるように
Unicodeの世界戦略は着々と進んでいるのであった。
2020/10/11(日) 20:41:30.45ID:EIUTbwb3
日本語のマップくらいは自分で作ればいいんじゃね?
https://unicode.org/charts/PDF/U1B000.pdf
2020/10/11(日) 21:37:26.96ID:wm510+AL
変体仮名も収録されてるんだな
2020/10/13(火) 00:47:23.21ID:tEy/04zZ
あをアに対応させるのはtransliterationのカテゴリーらしい、Unicode的には。
日本語だと翻字というのかー。
2020/10/13(火) 06:17:14.44ID:RnL4UaYd
漢字の読み方(複数)もUnicodeで定義されるべきではないのかな?
379デフォルトの名無しさん
垢版 |
2020/10/13(火) 09:57:18.23ID:FpFGKRx+
2020/10/13(火) 13:54:08.89ID:8ughZvwQ
Unicode は文字コードであって漢和辞典ではないし、読みとか何の役にも建たないw
2020/10/16(金) 00:51:17.29ID:zvezW4n7
>>361
大文字小文字を区別しない検索を行うためのデータという意味ならこれ
http://www.unicode.org/Public/UNIDATA/CaseFolding.txt

ある文字が大文字または小文字に該当するかを知りたいなら>>364のデータの
3番目のフィールドを見る。Luなら大文字でLlなら小文字
2020/10/20(火) 08:39:00.75ID:iDoXrFT4
rubyを勉強中の超初心者なのですが、時代遅れだ!みたいな記事をちらほら見かえます。
言語変えた方がいいのでしょうか…?
2020/10/20(火) 10:25:40.98ID:xAfCoP/O
なぜ、ここで、その質問を?
文字コード的には変えるほど意味はない気がする。(むしろ ruby が便利)
複数の言語が使えた方が便利なので、色々試すことはおすすめ。
384デフォルトの名無しさん
垢版 |
2020/10/20(火) 10:30:11.60ID:pHiz9StD
Yes, you can.
2020/10/20(火) 16:20:38.97ID:Nlf6zVNG
はい、あなたは管です。
2020/10/24(土) 21:01:49.65ID:ehxRee/D
いいえ、私は管(くだ)です
2020/10/25(日) 01:00:40.73ID:+b3TKvfL
いいえ、私は菅です。
388デフォルトの名無しさん
垢版 |
2020/12/07(月) 15:52:31.12ID:BlHR3DgB
櫻の絵文字🌸がPCやiPhoneだと花びら5枚なのに
Androidだと4枚ω
2020/12/07(月) 16:34:11.79ID:TmqbbT66
>>388
また友達に騙されちゃったんだね…
390デフォルトの名無しさん
垢版 |
2020/12/07(月) 21:30:49.12ID:8FTbf1dJ
utf8でshiftjisで言う
iskanji()
iskanji2()
ishira()
iskata()
みたいなイディオム教えてください
2020/12/08(火) 11:51:17.55ID:3Lge4PBr
>>390
utf8のコードがshiftjisに変換可能かチェックして、可能なら変換したコードに
そのイディオムとやらを使えばいいのでは?
2020/12/08(火) 12:25:05.31ID:no2frcgf
>>391
shiftjisは扱わないのでutf8での方法を教えてください
2020/12/08(火) 17:31:43.20ID:/pT3aml4
>>390
Unicodeプロパティがサポートされているなら
正規表現で\p{Hiragana}とかが使える
サポートされてないなら自分でコードポイントの範囲を調べて頑張る
2020/12/08(火) 18:36:17.22ID:E4wQPgos
長音(ー)とかの扱いがめんどくさい
395デフォルトの名無しさん
垢版 |
2020/12/09(水) 06:33:19.08ID:Hs7wcc9u
ちょっと疑問に思ったのだけど、
utf8 の iskanji を作るとしたら、繁体字とかも含めますか?
それとも今は JISx0213:2004(11233文字) だけ?
それともこれの次の標準化規格になるものってありましたっけ?
396デフォルトの名無しさん
垢版 |
2020/12/09(水) 06:43:54.04ID:Hs7wcc9u
ishankana() みたいなもの、javascript 版
if( /^[アイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホマミムメモヤユヨラリルレロワヲンァィゥェォャュョッ、。ー「」゙゚・]/.test('ア') )
{
console.log( '半角カタカナです');
}
2020/12/09(水) 07:34:03.35ID:qbXHpF4v
そのiskanjiとやらであなたが何を判定したいか次第だと思うんだけど・・
サロゲートペアの漢字とかも気にしなきゃだめだろうねえ
2020/12/09(水) 08:14:17.98ID:TKgHvdMy
>>396
半角カナは後ろの方の文字コードでかたまってるから簡単じゃろ。

漢字とか結構カオスでテーブル作ったほうが良さそうだね。
必要文字コード列挙してバイナリサーチするアルゴリズムがええのかな?

厳格でなくていいなら半角カナみたいに文字コードテーブルみて
ざっくり判定でも割と行けるとは思うけど。
399デフォルトの名無しさん
垢版 |
2020/12/09(水) 09:06:33.04ID:Hs7wcc9u
そういえば前に、amazon kindle端末用の電子書籍データ云々でここに書きこんだ記憶が、
と思い当って見直してみたら2か月前でした・・・、

私の方は KDP の仕様にあってるかどうかをチェックするのが目的だったのですが、
確かにカオスでしたね。ちなみに半角カナのコードを出しておいてあれなのですが、
JISx0213 規格的には半角カナは含まれてないっぽいです(x0208も同様です)。
チェック用のプログラムは結局普通の配列に規格の文字を全部入れておいて、
そこにあれば OK なければ NG という感じになりました。
サロゲートペアの扱いも面倒だったし。

あ、今気づいたけれど、JISx0213 的には全角英数記号ってもしかして NG なのでは?
いやでも wiki のページでは SJISコードは全角になってるし・・・、
400デフォルトの名無しさん
垢版 |
2020/12/09(水) 09:18:54.21ID:bCzZQrOf
ライブラリ内ではユニコードスカラー値についてのみ取り扱うと良いと思います。
2020/12/09(水) 13:23:38.64ID:y7KEYUhD
Ruby の古いNKF を使うと、片仮名・平仮名の変換もできるけど、
片仮名・平仮名を判定するメソッドはない

たぶん、NKF の内部では、そういう関数があるのだろけど、公開されていないのかも

module NKF
https://docs.ruby-lang.org/ja/latest/class/NKF.html

require 'nkf'

p NKF.nkf( '-m0 -h3 -w', 'あイ' )
#=> "アい"
2020/12/09(水) 13:25:03.81ID:rIU0lDlE
オプションそのまま文字列で渡すとか
ダッセェインターフェースだな
手抜きにも程がある
403401
垢版 |
2020/12/09(水) 14:41:10.37ID:y7KEYUhD
Ruby の正規表現・鬼雲で判別できた

re_hira = /\p{hiragana}{1}/ # 平仮名
re_kata = /\p{katakana}{1}/ # カタカナ

str = '愛あいカキうクx'

str.each_char do |ch|
ch.match( re_hira ){ |md| puts "平仮名 : #{ md[ 0 ] }" }
ch.match( re_kata ){ |md| puts "カタカナ : #{ md[ 0 ] }" }
end

出力
平仮名 : あ
平仮名 : い
カタカナ : カ
カタカナ : キ
平仮名 : う
カタカナ : ク
404デフォルトの名無しさん
垢版 |
2020/12/09(水) 15:27:54.98ID:tBDPYy0r
>>402
tcl/tk
2020/12/09(水) 16:19:55.89ID:H89RJ3R9
こゝろ
406401
垢版 |
2020/12/09(水) 17:51:11.38ID:y7KEYUhD
>>403
を修正

Ruby の正規表現・鬼雲で、平仮名・カタカナ・漢字を判別した

re_hira = /\p{Hiragana}{1}/ # 平仮名
re_kata = /\p{Katakana}{1}/ # カタカナ
re_han = /\p{Han}{1}/ # 漢字

str = 'Aあい善悪カキ愛うクx'
p str.encoding #=> <Encoding:UTF-8>

str.each_char do |ch| # 1文字ずつ処理する
ch.match( re_hira ){ |md| puts "平仮名 : #{ md[ 0 ] }" }
ch.match( re_kata ){ |md| puts "カタカナ : #{ md[ 0 ] }" }
ch.match( re_han ){ |md| puts "漢字 : #{ md[ 0 ] }" }
end

出力
平仮名 : あ
平仮名 : い
漢字 : 善
漢字 : 悪
カタカナ : カ
カタカナ : キ
漢字 : 愛
平仮名 : う
カタカナ : ク
2020/12/09(水) 18:21:03.27ID:L/x3uoyo
C++かC#でお願いします
408401
垢版 |
2020/12/09(水) 18:56:51.76ID:y7KEYUhD
鬼雲を、C++, C# など、他言語から使えないのか?
2020/12/09(水) 19:27:16.18ID:jODQKuwy
高性能高速ライブラリがあるのに、
なぜわざわざ、
低性能低速言語Rubyの、
低性能低速libraryを使う必要が、
あるんだ?、
2020/12/09(水) 19:45:05.56ID:ZEWfqGU4
C/C++は生産性が低いから
411401
垢版 |
2020/12/09(水) 19:59:27.39ID:y7KEYUhD
鬼雲は、C じゃないの?

https://github.com/k-takata/Onigmo
2020/12/10(木) 07:33:03.31ID:KWX3PjQ+
>>406
ruby を全然しらんのだが、 each_char ってのはどういう単位で文字を切り出してくるの?
上であったがサロゲートとか、絵文字とか、そのあたり特に。

Hanというプロパティは日本に限らず中国や韓国のも全部入り?
2020/12/10(木) 08:02:18.65ID:oexX+ZIk
>>407
グダグダいってるうちにスクラッチで車輪の再発明実装が終わる頃だな。
iskanjiはテーブル使うしかないかね?JISコードに変換して昔ながらの判定
するにもJISコード変換にテーブル
使うことになるだろうし。
どこかのページに色分けして中国専用の漢字の混ざり具合見せてたけどエグいねw
414デフォルトの名無しさん
垢版 |
2020/12/10(木) 10:34:51.08ID:RjOF8qIo
謎のタイ語判定コード , Javascript 版

strThai = "\u0e01\u0e51\u0e3f ทำงาน";
re = strThai.match(/([\u0E00-\u0E7F])+/g);
console.log( re );

参考ページ等
http://www.asahi-net.or.jp/~ax2s-kmtn/ref/unicode/u0e00.html
https://0g0.org/category/0E00-0E7F/1/

サロゲートペアを考慮しなくて良い言語はこのパターンでオーケーかな?
415401
垢版 |
2020/12/10(木) 12:43:53.30ID:HstTQkWC
>>412
Ruby の1文字は、バイトサイズと異なる

str = "👪θ💀Ω🄫"
p str.encoding #=> <Encoding:UTF-8>

str.each_char do |ch| # 1文字ずつ処理する
puts "#{ ch } : #{ ch.size }, #{ ch.bytesize }"
end

出力
👪 : 1, 4
θ : 1, 2
💀 : 1, 4
Ω : 1, 2
🄫 : 1, 4
416401
垢版 |
2020/12/10(木) 12:51:25.91ID:HstTQkWC
>>412
Han の範囲が気になるなら

>>411
の鬼雲のサイトか

>>406
の、str = 'Aあい善悪カキ愛うクx'
に、調べたい文字列を書いて、paiza などで実行してみれば?
2020/12/10(木) 20:31:09.89ID:CcbWokCZ
>>415
おお、すごい!

早速ローカルで試してみた... スキントーンがいけてなかった。おしい。

str = "👨🏻‍🦲"
p str.encoding #=> <Encoding:UTF-8>

str.each_char do |ch| # 1文字ずつ処理する
puts "#{ ch } : #{ ch.size }, #{ ch.bytesize }"
end

出力
👨 : 1, 4
;🏻 : 1, 4
;‍ : 1, 3
🦲 : 1, 4

ハゲが直った! みたいなw
2020/12/10(木) 20:34:43.12ID:CcbWokCZ
あ、出力が微妙に違うかも。5chブラウザにペーストしたせいかも。
あともしかしてスキントーンはあえて別キャラ扱いとか?
2020/12/10(木) 21:25:24.00ID:YXjbRyJb
オレオレ用語UZEEE!!
2020/12/11(金) 06:34:28.41ID:5L91jtkU
ん、何か変なこと書いてある?

しかし書き込む瞬間、絵文字が5chブラウザでちゃんと表示できるかちょっと不安に
なったが、一応いけるみたいね。少なくともオレオレ環境では。
5ch側はSJIS+数値参照を流しているだけかもしれんが。
421デフォルトの名無しさん
垢版 |
2020/12/14(月) 05:58:38.59ID:uAdA9GXf
機械学習関係とかで使う奴です。
なんとなく出来たので晒しときますね。

// PHP(UTF-8) での全角カタカナチェック(JISx0213網羅版)
$sKana = ''
. "カ\xE3\x82\x99" // 304B+3099 カに濁点 (Mac,NFD)
. "カ\xE3\x82\x9A" // 304B+309A カに半濁点(JISのセット文字の半濁点 or Mac,NFD 半濁点)
. "゛" // 309B 濁点 (主にWin,半カナから変換される奴?)
. "゜" // 309C 半濁点 (主にWin,同上)
. "ァアィイゥウェエォオカガキギクグケゲコゴサザシジスズセゼソゾタダチヂッツヅテデトドナニヌネノハバパヒビピフブプヘベペホボポ"
. "マミムメモャヤュユョヨラリルレヮワヲン"
. "ヴヵヶヰヱ・ーヽヾ"
. "\xE3\x82\xA0" // ダブルハイフン , 30A0
. "\xE3\x83\xB7" // ワに濁点
. "\xE3\x83\xB8" // ヰに濁点
. "\xE3\x83\xB9" // ヱに濁点
. "\xE3\x83\xBA" // ヲに濁点
;
if( 1 === preg_match("/^[\x{3099}-\x{309C}\x{30A0}-ヾ]+$/u",$sKana) )
{
echo "全てカナカナです。";
}
else
{
echo " NG";
}
2020/12/14(月) 09:18:41.31ID:dIR87NiF
0x31F0-F9のアイヌ語カナ拡張が抜けてるような
423デフォルトの名無しさん
垢版 |
2020/12/14(月) 12:36:10.35ID:uAdA9GXf
>>422
どんな文字か全く見てませんけど、コードが分かれば並べていくだけですね。
アイヌ語カナ拡張版?差し替え用ってことで。

"/^[\x{3099}-\x{309C}\x{30A0}-ヾ\x{31F0}-\x{31F9}]+$/u"
2020/12/15(火) 07:45:42.06ID:mpgmHFbH
Flag for Tokyo て何だよ

https://emojipedia.org/flag-for-tokyo-jp13/
2020/12/15(火) 12:56:15.02ID:vE8VpXlG
日本+都道府県番号?
2020/12/15(火) 13:41:07.26ID:OZzZpMYk
>>424
市役所とか行ったことないのか?
2020/12/15(火) 17:27:11.75ID:+Yh7x7Wy
ISO 3166-2:JP
2020/12/15(火) 18:17:13.23ID:Y7kqruGs
問題は東京みたいに旗が2種類あるところ

東京は歴史ある*みたいなほうになるのか銀杏の葉っぱみたいなほうになるのか
2020/12/22(火) 20:48:11.38ID:hjkCLTVe
ISO - ISO/IEC 10646:2020 - Information technology — Universal coded character set (UCS)
https://www.iso.org/standard/76835.html

2020年の内に完成した模様
ABSTRACTのとこが何か文字化けしてるけど。
2020/12/23(水) 00:48:02.18ID:r3ldn4Uo
何に時間がかかるの
2020/12/23(水) 14:15:22.80ID:dwGREUpD
ここでも行けるかな? 𝐁𝐨𝐥𝐝 𝐼𝑡𝑎𝑖𝑐 𝒮𝒸𝓇𝒾𝓅𝓉 𝔻𝕠𝕦𝕓𝕝𝕖 𝖲𝖺𝗇𝗌𝖾𝗋𝗂𝖿 𝙼𝚘𝚗𝚘𝚂𝚙𝚊𝚜𝚞
2020/12/23(水) 16:04:04.77ID:Yot4/iGO
��������������������
2020/12/23(水) 18:21:51.29ID:dwGREUpD
コード表一列読み間違えて16ズレた。
何かローマ字みたいになってるけど偶然。
2020/12/23(水) 20:48:10.24ID:nit2qqbj
SNSのアカウント名でこういう文字使ってる人いるよねえ
特に詳しそうには見えない人が多いが簡単入力できるツールかサイトがあるんだろうかね
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況