文字コード総合スレ Part11

1デフォルトの名無しさん2018/01/22(月) 22:58:23.45ID:UK/uqEp5
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
 (スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
 (隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/

18デフォルトの名無しさん2018/01/30(火) 17:01:26.26ID:Y7itdObJ
(´‥∀‥`)ほう

19デフォルトの名無しさん2018/01/30(火) 17:14:44.90ID:61BNvo+J
そばですか

20デフォルトの名無しさん2018/01/30(火) 21:38:00.04ID:1SBQJDTb
IPAmjはcmapを足しただけかな
濁点半濁点つき変体仮名のグリフを追加したわけではなさげ

21デフォルトの名無しさん2018/01/30(火) 22:58:48.17ID:wQODml7Q
きの𛀁【甲】
ひの𛀁【丙】
つちの𛀁【戊】
かの𛀁【庚】
みづの𛀁【壬】

22デフォルトの名無しさん2018/01/31(水) 12:22:08.15ID:jg2l5TuK
IPAmjのゴシック版って出ないのかな。

23デフォルトの名無しさん2018/01/31(水) 13:35:09.89ID:W90doUhw
えとって𛀁戸なのか

24デフォルトの名無しさん2018/02/01(木) 01:34:12.20ID:cOPRkGeS
そういえば変体仮名って絶対漢字のフォントバリエーションとして使われるな。

ラテン文字のところをキリル文字ギリシャ文字でちょっと異国情緒出したりするのと同じように

25デフォルトの名無しさん2018/02/01(木) 12:26:52.61ID:ypQwObPk
OS標準のフォントに変体仮名が入るのはまだ先の話かな。

26デフォルトの名無しさん2018/02/01(木) 21:02:21.65ID:JSLqqKka
Mac/iOSはAJ1準拠のフォントをバンドルしてるだけだから変体仮名のサポートもAJ1次第だろうな
AndroidもNoto CJKをバンドルしてるだけだからこっちもやはりフォントを作ってるAdobe次第か

Winはゴシック系フォントはUnicodeをフルカバーしようとしているようなんで可能性ありそうだけど
明朝系は1B000〜1もスルーしてるんで変体仮名も放置と予想

27デフォルトの名無しさん2018/02/02(金) 00:29:26.12ID:iiJ5+HcF
メイリオの変体仮名が来るのか

28デフォルトの名無しさん2018/02/02(金) 07:09:07.07
変態さんかな?

29デフォルトの名無しさん2018/02/02(金) 12:26:25.48ID:QpaXEFbV
変体仮名がOS標準のフォントに入ったら
ハンドルネームとかAAに使われるかな

30デフォルトの名無しさん2018/02/02(金) 13:12:45.95ID:XWVaw1+J
よく有料フォントに正規版とお試し版があるけど
この2つのフォントファイルってシステム的に共存できるの?
それとも後から入れたほうに上書きされちゃう?

31デフォルトの名無しさん2018/02/03(土) 01:07:32.21ID:PZ3vBGzx
Windowsの場合フォントの内部名が違えば共存
同じなら上書き

32デフォルトの名無しさん2018/02/03(土) 04:35:56.44ID:oZ9l3iOK
>>31
ありがと
いろいろなのね

33デフォルトの名無しさん2018/02/03(土) 04:52:04.58ID:pNC8Ba1v
名前変えてインスコするだけ

34デフォルトの名無しさん2018/02/03(土) 23:36:52.87ID:7YWK+QWP
上書きできたっけ?
先に入ってる方を消せって言われた気がする

35デフォルトの名無しさん2018/02/04(日) 14:42:43.04ID:ggk79Dnh
上書きしますかか更新しますかって聞かれる気がする

36デフォルトの名無しさん2018/02/04(日) 16:58:59.50ID:AtwA7TkY

37デフォルトの名無しさん2018/02/04(日) 17:57:43.36ID:F/J6Xayo
馬耳東風って本当に存在する現象なんだな

38デフォルトの名無しさん2018/02/04(日) 18:01:22.90ID:AtwA7TkY
それを言うなら馬のシカに念仏

39デフォルトの名無しさん2018/02/08(木) 08:34:15.23ID:9/5RomB7
Unicode Emoji 11.0 characters now final for 2018
http://blog.unicode.org/2018/02/unicode-emoji-110-characters-now-final.html
First look: All 150+ Emojis for 2018
https://www.youtube.com/watch?v=5qLDBQ583Y8

40デフォルトの名無しさん2018/02/08(木) 13:08:04.59ID:dB9qfKFM
思いついた絵文字を定期的に追加する文字コードになってしまったな

41デフォルトの名無しさん2018/02/08(木) 16:58:39.51ID:146Y2n+h
http://www.unicode.org/L2/L2018/18056-future-adds.pdf

日本の新元号はU+32FFに入れてもらえそう?

42デフォルトの名無しさん2018/02/09(金) 18:02:52.35ID:AUjtCL3B
そのコードポイントは昔、□デを入れる事が提案されたが
○ンとか他の重要な文字の為にとっておくべきとかでSMPに追いやられたなんて事があったな。
元号組文字が重要な文字だと認められればそこになるだろうけど。

43デフォルトの名無しさん2018/02/09(金) 18:32:17.19ID:iqzIZ4Vv
元号エリア用意して連番にするとして
何文字用意すれば良い?

44デフォルトの名無しさん2018/02/09(金) 19:31:27.80
>>43
とりあえず127個もあれば人類滅亡まで持つと思う

45デフォルトの名無しさん2018/02/09(金) 20:00:03.04ID:0E/oZJHb
既に250弱あるのに何言ってんだ

46デフォルトの名無しさん2018/02/09(金) 20:02:34.92ID:chnfArN4
U+32FF ??
U+337B 平成
U+337C 昭和
U+337D 大正
U+337E 明治

ここに入れるとコードポイント逆順でソートできるという利点が

47デフォルトの名無しさん2018/02/09(金) 20:33:41.59ID:tdu0vLnD
合成文字定義するんじゃないのか

48デフォルトの名無しさん2018/02/09(金) 22:26:47.14ID:/PLWE3G9
あくまでもあれらは他の規格との互換用で通常は使用する事が推奨されていないのだがな。
たとえば平成はU+337B(~)を使うのではなくU+5E73(平)とU+6210(成)を並べる事が推奨されている。
最近では昭和時代〜平成初期とは違ってワープロソフト等で任意の組み文字を表示、印刷するのが容易になったし、
使用出来る容量も多くなって1文字分のバイト数でも減らしたいなんて事は少なくなったし次の元号の組み文字は入るだろうか?
JIS X0213とかに入ればUnicodeにも追加せざるを得なくなるだろうが。

49デフォルトの名無しさん2018/02/09(金) 23:58:38.13ID:lYXDEjIZ
そういえば康熙部首とIDCに挟まれたU+2FE0〜U+2FEFって空いてたよな。
どうしてもBMPがいいならそこを元号専用ブロックにするのはダメなのかな?
名称はJapanese Era NameとかGengoとかで。
16個あればよほどの事が無い限り今生きてる世代が生きてる間は大丈夫だろう。

50デフォルトの名無しさん2018/02/10(土) 01:04:36.42ID:3N07jfB9
絵文字の一種としてなら完全に新しい組文字でもすんなり入れられそうな雰囲気ある

51デフォルトの名無しさん2018/02/10(土) 05:35:14.43ID:1vRRPdai
>>49
次の代で終わる鴨試練

52デフォルトの名無しさん2018/02/10(土) 14:28:40.69ID:55j4PhG1
BMPの必要性ないわな

53デフォルトの名無しさん2018/02/10(土) 23:46:14.13ID:V4kIiAX3
そもそも元号に限らず組文字のコードはあまり使われないよな。
昔から機種依存文字(環境依存文字)だから使うな言われてきたのもあるけど。
でも明治、大正、昭和、平成の組文字合紫順~はあるのに、
○○(新元号)が無いのはおかしい。UnicodeではBMPでないといかん。なんてゴネる人が出てくるのかな。

54デフォルトの名無しさん2018/02/11(日) 01:09:40.03ID:WMQeXuiD
そういうひとは明治以前の元号をスルーしてる

55デフォルトの名無しさん2018/02/11(日) 01:37:38.13ID:pE9MWmVE
チョン国人:慰安婦文字はまだですか?

56デフォルトの名無しさん2018/02/11(日) 02:58:01.54ID:+g/aG4zA
DNAの二重らせんがついに絵文字に…!→イラストの深刻なミスが発見される - Togetter
https://togetter.com/li/1197708

57デフォルトの名無しさん2018/02/11(日) 06:42:49.06ID:I57TUl59
>>53
Unicodeの日本部隊はルール無視してでもねじ込みたがりだからな
今後も考えた上で場所を決めてほしい

過去のがないのは元々がJIS定義の字を収録してるだけだから
JISがこれからどうするかに歩調を合わせるべきだと思うけどね

58デフォルトの名無しさん2018/02/11(日) 13:29:49.03ID:aLeqVhz7
>>56
そもそもなんでこんなもの入れたんだ

59デフォルトの名無しさん2018/02/11(日) 23:57:18.38ID:RlzDfzqO
CJK統合漢字拡張GはSIPに入り切らなくなったからTIP(第3面)になるんだな。
古代漢字等がU+30000〜に提案されてたが、それらはずれる事になるようだ。
で一昨年末に正式名称が決定したあのニホニウムを含む4元素の中国語名の漢字のうち
現時点でUnicode未収録なのは拡張GでなくURO末端部に追加する方針らしい。

60デフォルトの名無しさん2018/02/14(水) 16:24:24.38ID:1T5FcoPk
>>58
http://www.unicode.org/L2/L2017/17113-science-emoji.pdf

科学ファンサイト“I Fucking Love Science”のFacebookにはフォロワーが2500万人いるだの
3月のFacebookの科学グループには84万人のメンバーが活動してるだの書かれてるから
結局「Facebookで使ってみたかった」なのでは。

61デフォルトの名無しさん2018/02/15(木) 04:48:41.13ID:ra7E/PHQ
test

62デフォルトの名無しさん2018/02/15(木) 04:52:15.83ID:ra7E/PHQ
test

63デフォルトの名無しさん2018/02/15(木) 06:09:58.19ID:ZpZxpx4v
test2

64デフォルトの名無しさん2018/02/15(木) 06:10:24.31ID:ZpZxpx4v
test2

65デフォルトの名無しさん2018/02/15(木) 06:10:28.38ID:ZpZxpx4v
test2

66デフォルトの名無しさん2018/02/15(木) 06:14:40.45ID:lreHQ0M8
hage

67デフォルトの名無しさん2018/02/15(木) 06:27:48.90ID:y383ZoHX
テストてすと漢字

68デフォルトの名無しさん2018/02/18(日) 09:20:31.63
合字なんて百害あって一利なしと判明

新着レスの表示
レスを投稿する