文字コード総合スレ Part10 [転載禁止]©2ch.net

**デフォルトの名無しさん** · 2015/10/14(水) 20:29:00.08

プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
（スレ再利用）UnicodeとUTF-8の違いは？ http://pc12.2ch.net/test/read.cgi/tech/1177930957/
（隔離スレ）UnicodeとUTF-8の違いは？　その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/

**デフォルトの名無しさん** · 2016/02/06(土) 15:45:39.28

ビットマップのフォントデータ(16×16)を使って
レトロな電光掲示板を作ってみよう、と思う
http://i.imgur.com/owubbp4.png

**デフォルトの名無しさん** · 2016/02/06(土) 18:59:39.30

UTF-8なら漢字やかなに00-7Fは使わないけどな
って、そういう話をしてるわけじゃないのか。

**デフォルトの名無しさん** · 2016/02/06(土) 19:36:29.58

>>176
しかしShift JISはかなり質が悪い

**デフォルトの名無しさん** · 2016/02/06(土) 19:41:15.78

どうしてWindowsは出来の悪い方ばっかり選択するんだろうか
cp932といいUTF-16といい…

**デフォルトの名無しさん** · 2016/02/06(土) 20:34:21.53

>>178
そういう話をしてるつもりだけど、そうでない人もいるようだ。

**デフォルトの名無しさん** · 2016/02/07(日) 08:00:22.03

エスケープシーケンスよりCP932の方がまだマシだし、
CP932よりUCS-2の方が多少はマシだったからでしょ

**デフォルトの名無しさん** · 2016/02/07(日) 13:34:15.00

>>173
今更だけど、文字が分断される可能性についても公平を期すために触れておくよ。
単純にバイト数で分割する場合等を除けば、ほとんどはパターンマッチにおける誤マッチが原因だろう。
strchr や strstr 、あるいはもっと高度なライブラリを使った結果かもしれない。
探すパターンに [\100-\176] にマッチする文字が含まれているなら EUC では誤マッチは起こらない。
シフトＪＩＳではダメ文字のせいで誤マッチが起こりうる。
実際に問題になるのはほとんどがこのケース。
grep "\]"
などとやろうものなら悲惨なことになる。
探すパターンがマルチバイト文字だけなら EUC でもシフトＪＩＳと同程度には誤マッチが起こりうる。
しかし実際にはほとんど起こらない。
もちろん起こるときは起こるし対策も出来るが対策は速度の低下と引換だ。
30 年前の CPU クロックは 10MHz 程度だったので速度も重要だった。
ほとんど起こらない上に致命的でもないなら速度を犠牲にしてまで常に対策を講じる必要は無い。
ちなみに対策だが、EUC で grep する場合なら
egrep "^([\000-\177]|\216[\240-\337]|\217[\241-\376][\241-\376]|[\241-\376][\241-\376])*$pattern"
的なことをするプログラムを grep_euc とかそういう名前で作っておけばいい。
シフトＪＩＳの場合はこれに加えてシフトＪＩＳな部分を 8 進エスケープシーケンスに置き換える必要がある。
同じやり方で iso-2022-jp も処理できる。
シフトＪＩＳしか通さない grep など技術的には邪魔なだけだよ。

**デフォルトの名無しさん** · 2016/02/07(日) 13:49:06.41

>>183
長文の駄文乙
文字処理を文字単位でなくバイナリデータで行うのをやめた方がいいぞ

**デフォルトの名無しさん** · 2016/02/07(日) 15:37:08.80

>>183
"\]"←おおESC、これでアニメ作ったもんじゃ

>>184
ビット操作は頭の体操になるよ↓
http://i.imgur.com/ibjeaA8.png

**デフォルトの名無しさん** · 2016/02/07(日) 20:14:33.59

grepはいつutf16対応してくれるんじゃぁ
ふだんLinux使ってるんだがwinのソースコードはなぜかutf16なんでいつも困っとるんじゃぁ
nkfで変換するのめんどいんじゃあ

**デフォルトの名無しさん** · 2016/02/07(日) 21:05:14.46

utf16のそーすとか見たこと無いな

**デフォルトの名無しさん** · 2016/02/08(月) 01:36:20.73

>>180
UTF-16はそのころUCS-2しかなかったんだから仕方ないやろ

個人的にWindowsはAとWはそのままでもいいから
標準CライブラリとC++ライブラリはUTF-8を使ってくれるようにしてくれれば不満ないんだけどな。

**デフォルトの名無しさん** · 2016/02/08(月) 05:19:47.55

>>188
全然仕方なくないどころか、むしろまた先走ってやっちまったとしか

**デフォルトの名無しさん** · 2016/02/08(月) 09:34:53.73

UTF-16固定とか基地外沙汰
ackやagもUTF-16は華麗にスルー

**デフォルトの名無しさん** · 2016/02/08(月) 22:30:39.07

EUCは目糞鼻糞だし、当時の記録媒体でUTF-8とか頭おかしいレベルなのに
一体どうしたかったのか

**デフォルトの名無しさん** · 2016/02/08(月) 22:35:16.47

ただマイクロソフトを非難したいだけのキティGUYに何を。
こういうのは誰でもいいから攻撃対象を設けてガス抜きさせてやらないといかん。

**デフォルトの名無しさん** · 2016/02/08(月) 23:02:30.93

SHIFT_JISよりEUC-JPの方がマシ、UTF-16よりUTF-8の方がマシってだけでしょ
マイクロソフトを非難したいだけに見えるとしたら相当なバイアス掛かってると思うよ

**デフォルトの名無しさん** · 2016/02/09(火) 00:48:21.70

>>191
> 当時の記録媒体でUTF-8とか頭おかしいレベルなのに

kwsk

と言っても
> EUCは目糞鼻糞だしょ
なんて言ってる奴のいうことが理解できるかどうか…

**デフォルトの名無しさん** · 2016/02/09(火) 05:16:13.78

UTF-8のRFCが出たのは2003年
その頃には80GBのHDDを一般人が変える時代
テキストの容量が問題になるとか無いわ

個人的にはいつまで経ってもsetlocaleでUTF-8を指定出来ない、代替の方法も用意されないWindowsは非難されて当然だと思うけどな。

**デフォルトの名無しさん** · 2016/02/09(火) 07:15:08.73

Windowsの今の文字コードの設計のベースは1991年か1992年に
Unicode1.0.0をもとに作られたはず

ちなみにその頃から「～」はU+FF5Eに存在した

**デフォルトの名無しさん** · 2016/02/09(火) 07:20:39.41

当時の記録媒体言ってるのはWindowsNTの時代な
その当時にUTF-8みたいな実装してもｱﾎでしょ

それとUTF-8を率先して使用してる理由ってEUC環境が糞だったからでしょ
EUC環境の時代って外人様のソフトウェアで漢字の表示すらままならなかったよね

**デフォルトの名無しさん** · 2016/02/09(火) 07:37:26.98

まあなんにせよUnicodeでデータ交換できるようになって
EUCゴミ環境が消えテクノは良い事だわ
EUCありがとうバイバイ

**デフォルトの名無しさん** · 2016/02/09(火) 08:47:31.92

同じようにWindowsのCP932もさっさと消えてほしいんだけどな

**デフォルトの名無しさん** · 2016/02/09(火) 11:12:55.58

今でも新規作成の全文章を統計取ると、
cp932の方が多いんじゃないか。
結局全くプログラムかかないひとが
何の文字コード使ってるかが焦点で、
プログラム書く人間の文字コードなんざ焦点じゃないんだよね。

**デフォルトの名無しさん** · 2016/02/09(火) 11:31:59.64

>>200
最多はwordでunicodeでしょ
ちなみにwordをunicode化したのは日本人

**デフォルトの名無しさん** · 2016/02/09(火) 11:32:56.66

MSは昔からAPIを移行改善していくのが下手

**デフォルトの名無しさん** · 2016/02/09(火) 22:21:12.66

電話用のWindowsもCP932とUTF16ならそのまま安らかに死んでほしいんだけどどうなん？

**デフォルトの名無しさん** · 2016/02/09(火) 22:44:37.32

死ぬことはないよ
生まれてすらいないからね

**デフォルトの名無しさん** · 2016/02/10(水) 05:29:25.59

産まれる前に死ぬってあると思うけど？

**デフォルトの名無しさん** · 2016/02/10(水) 20:10:05.19

文字コードはUnicodeで統一されつつあるけど
改行コードが統一される動きはないよな

**デフォルトの名無しさん** · 2016/02/10(水) 20:11:34.12

>>187
英語だけなら問題ないが日本語でコメントかくととたんにやっかい
おそらくwinの内部処理がutf16なんでvcでコンパイラ作る→utf16しか受け付けない
になるんだと思う

**デフォルトの名無しさん** · 2016/02/10(水) 20:14:06.58

何言ってんだこいつ

**デフォルトの名無しさん** · 2016/02/10(水) 20:19:14.56

おまえはお馬鹿な発言する人にいつもくってかかるのか

**デフォルトの名無しさん** · 2016/02/10(水) 20:27:11.86

>>208>>209
バカ乙

**デフォルトの名無しさん** · 2016/02/10(水) 20:58:07.57

絵に描いたような「バカと言う奴がバカ」

**デフォルトの名無しさん** · 2016/02/10(水) 22:46:23.85

最近のMSVCはUTF-8のソースコード食ってくれるよ
新しくMSVCで読み込んだソースがUTF-8なのにBOMがないと自動判定に失敗して意味不明なコンパイルエラーになることも多いけど

**デフォルトの名無しさん** · 2016/02/11(木) 00:53:59.61

>>206
そうか?
ローカルデータで復帰付けてるのWindowsくらいじゃないか?
HTYP, SMTPなんかは復帰改行だけど

**デフォルトの名無しさん** · 2016/02/11(木) 21:55:56.34

1バイトの英数字を平仮名と同じ幅で表示するフォントがあれば
全角英数字は使わないと思うんだが全角英数字も互換性のためだけに残されていると考えていいのか

**デフォルトの名無しさん** · 2016/02/11(木) 23:11:32.22

>>214
JIS X 0208は、ASCIIやJIS X 0201と併用せずに使うことも想定されてる
だから文字集合に英数記号が含まれるのは当然
併用する場合ISO 2022的には重複符号化禁止だから本来使っちゃいけない
けど運用では守られてなかったし、併用前提の文字コードもあった
Unicodeは過去の利用例をほぼ取り込むのが前提だから
互換文字として全角文字を取り込んだ

**デフォルトの名無しさん** · 2016/02/11(木) 23:19:16.34

ではU+3000が互換文字領域に無いのは何故なんだぜ

**デフォルトの名無しさん** · 2016/02/11(木) 23:22:30.10

なんとか空白はどうしても入れたい奴があったから全部入れることにしたんじゃないのかね
最初から20種類くらいあったでしょ

**デフォルトの名無しさん** · 2016/02/12(金) 00:18:36.22

つまり全角を貫いたおおたさん大勝利ってことだな

**デフォルトの名無しさん** · 2016/02/12(金) 14:58:04.35

空白もそうだけど横棒も統合せずに放り込んだのが多すぎ
U+2015 HORIZONTAL BARってどこから生えて来たんだろ

**デフォルトの名無しさん** · 2016/02/12(金) 22:43:58.37

VERTICALなら生えてきそうだけどHORIZONTALに生えるイメージは無いな

**デフォルトの名無しさん** · 2016/02/13(土) 10:24:02.68

————
――――

**デフォルトの名無しさん** · 2016/02/13(土) 21:46:29.51

>>211
先に208でバカにしてきたのは208なんだが語るに落ちてねーか？
それとも「バカという単語は書いてないから自分はセーフ」ってことだろうか
バカの考えることはわからん

**デフォルトの名無しさん** · 2016/02/13(土) 21:50:44.90

バカの考えること=お前の考えること

自分が何考えてるかもわかんないなら救いようがないな。清原と一緒に逮捕されてろ

**デフォルトの名無しさん** · 2016/02/15(月) 00:32:04.19

>>212
もうすぐUpdate2で改善されるからそれまで待て

**デフォルトの名無しさん** · 2016/02/15(月) 16:58:33.36

>>221
上がU+2014 EM DASHで
下がU+2015 HORIZONTAL BAR？
EM DASHは並べても切れて見えるなフォント次第だろうけど

**デフォルトの名無しさん** · 2016/02/16(火) 07:17:36.55

>>223
なんだ適当に言葉並べてるだけか
人工無能の方がマシだなこりゃ
おバカさん

**デフォルトの名無しさん** · 2016/02/20(土) 22:49:46.68

MS-excelのcodeという関数の出力がShift-JISだと勘違いしていた初心者の俺。
あやうく大恥をかく前に気づいてセーフ。

**デフォルトの名無しさん** · 2016/02/24(水) 01:54:36.77

UNICODEが年々キモくなるんですけど、新しいモジコードは開発されていますか（´・ω・｀）？

**デフォルトの名無しさん** · 2016/02/24(水) 12:06:50.24

>>228
君の出番だよ
君が第二の坂村健だ

**デフォルトの名無しさん** · 2016/02/24(水) 17:55:57.73

完成してMicrosoftとAppleとGoogleとLinuxが採用したら知らせてくれ

**デフォルトの名無しさん** · 2016/02/24(水) 20:07:26.11

バイトオーダーがややこしいから1byteを1bitにするか
逆に1byteを64bitなどの大きい値にしたらどうよ？
コンピューターの黎明期は1byteが8bit以外の物もあったんだから
それも不可能ではないだろう。

**デフォルトの名無しさん** · 2016/02/24(水) 20:26:02.29

馬鹿って馬鹿だよね

**デフォルトの名無しさん** · 2016/02/25(木) 00:25:47.28

>>231
コンピュータの黎明期はbyteと云う単位ではなくて、Wordという単位だったと
思いますよ。１word何byteとかいっていて、コンピュータによって、Wordのbit数が
違っていたように思います。
大体１短Wordが20bit＋1符号bit,１長wordが短wordの２倍で40bit+1符号bitというのが
普通だったとおもいますが、CDCの3600は、１短wordが32bit、１長wordが64bitではなかった
かと思います。
なにしろ、1960年代のことなので、記憶違いがあるかもしれません。

**デフォルトの名無しさん** · 2016/02/25(木) 20:46:03.90

Unicodeに何が追加されようと大半の日本語フォントはAdobe-Japan1-6準拠だから
ほとんど恩恵がない
AdobeはPanCJKなんて漢字マニアしか喜ばないものを作ってないで
そろそろAJ17に取り掛かってくれ

**デフォルトの名無しさん** · 2016/02/26(金) 12:15:47.32

Wordは今でも使うだろ普通に。
昔あったのはWord機、生き残りがByte機。

**デフォルトの名無しさん** · 2016/02/26(金) 17:03:45.40

>>152
安岡センセイ大敗北ｗ
http://srad.jp/%7Eyasuoka/journal/600756

**デフォルトの名無しさん** · 2016/02/26(金) 19:35:56.60

>>235
byteかwordかというのは
アドレッシング
アクセス最小単位
アラインメント
と3つの軸があって
最後のはbyte単位でないのが主流

**デフォルトの名無しさん** · 2016/02/26(金) 19:54:30.62

キモはアルゴリズムでデータソースでしかないものに文句つけてもイチャモンでしかないだろう
知らんけど

**デフォルトの名無しさん** · 2016/02/26(金) 21:57:25.44

アルゴリズムもバグってるみたいよ

**デフォルトの名無しさん** · 2016/02/27(土) 01:15:53.58

>>237
アーキテクチャ上は最後のも大丈夫なんじゃないの？
メモリにアクセスするハードウェア側のインタフェースの話じゃないよね。

**デフォルトの名無しさん** · 2016/03/02(水) 11:22:17.92

カタカナが多すぎて頭こんがらんがってきた

**デフォルトの名無しさん** · 2016/03/02(水) 13:37:01.48

トゥゲザーしようぜ

**デフォルトの名無しさん** · 2016/03/02(水) 13:52:03.06

シェアしたいと思います

**デフォルトの名無しさん** · 2016/03/04(金) 11:07:29.81

1文字に32bit使うなら一般的な組み合わせの合成文字は
全て合成済み文字にしてコードを割り当てても足りるんじゃないだろうか
そうして合成文字は外字のようなオプション的な扱いにしたらいいと思うんだけどね

**デフォルトの名無しさん** · 2016/03/04(金) 11:29:46.53

何のいみがあるのかわからんなあ

**デフォルトの名無しさん** · 2016/03/04(金) 12:41:46.94

>>245
一般的な文字では32bit固定長にできる

**デフォルトの名無しさん** · 2016/03/04(金) 13:27:03.56

「一般的な組み合わせ」が不変ならいいけど、現実にはいくらでも流動しちゃうのが問題じゃないかな。
これまでにも「今の用途ならこれだけあれば十分」って感覚で半端に作られた負の遺産がたくさんあるよね。

合成文字の仕組み自体を全廃・強制力付きで禁止するのならともかく、
オプションとして残すのなら新たに余計なものを作っただけで終わるのが見えてる。

**デフォルトの名無しさん** · 2016/03/04(金) 18:21:11.26

ISO/IEC 6937対ISO/IEC 8859シリーズの戦いはもう勘弁

**デフォルトの名無しさん** · 2016/03/15(火) 10:56:22.12

>>228
Unicodeで得られた知見を基に反省を活かして新しいのを作ってほしいね。
Unicodeもコンセプトは賛成だし規格に例外は付き物だけど、あまりにも継ぎ接ぎだらけでスパゲティコードみたいになってるのは清算したいね。

**デフォルトの名無しさん** · 2016/04/02(土) 13:20:35.07

Unicodeはバージョンアップ時に精算するのが得意な方
切り捨てバンザイ主義
これ以上切り捨てたら誰も使ってはくれない

**デフォルトの名無しさん** · 2016/04/06(水) 17:49:51.21

UTS #52: Unicode Emoji Mechanisms
http://www.unicode.org/reports/tr52/tr52-1.html

> 3.5 Hair Attribute
>
> Syntax
>
> Tag-Base　　　Hair_Base
> Tag-Key 　　　Tag-H
> Tag-Value 　　Exactly one of the following tag-valueChars:
> 　　　　　　　tag-valueChar Description
> 　　　　　　　Tag-k Black-haired
> 　　　　　　　Tag-s Blonde (also sandy-haired)
> 　　　　　　　Tag-b Brown (Brunette)
> 　　　　　　　Tag-r Redhead (Ginger)
> 　　　　　　　Tag-g Gray-haired
> 　　　　　　　Tag-n Bald (no hair)

漫画・アニメキャラ用に赤髪、ピンク髪、緑髪、青髪、水髪、紫髪なんかも加えるべきじゃないですかね。

**デフォルトの名無しさん** · 2016/04/06(水) 18:29:57.08

＿人人人人人人人＿
＞　Bald　(no hair)　＜
￣Y^Y^Y^Y^Y^Y^Y￣

**デフォルトの名無しさん** · 2016/04/08(金) 13:36:54.32

Δ彡⌒ミΔ
ξ　･ェ･　ξ
ξ　　　　ξ
ξ　　　　ξ 　また髪の話してる。
ξ　　　　ξ
ξ　　　　彡⌒ミ
ξ　　　 (´･ω･`)〇
ξ　　　 (|　　　|)ξ
ξ　　　　(γ　/ ξ
　uu～～～し uu

**デフォルトの名無しさん** · 2016/04/09(土) 00:11:15.96

毛の色と量は別のパラメータだよね

**デフォルトの名無しさん** · 2016/04/09(土) 00:17:51.71

赤毛のつるっぱげと
黒髪のつるっぱげと
ブロンドのつるっぱげの
区別を付ける意味はあるのかなあ。

**デフォルトの名無しさん** · 2016/04/09(土) 01:58:16.39

眉毛の色も変わるんじゃね

**デフォルトの名無しさん** · 2016/04/11(月) 18:05:35.93

>>251
色はスタイルシートとか他の技術で実現しろよな
そのうちRGB指定とか出てくるぞこれ

**デフォルトの名無しさん** · 2016/04/19(火) 18:55:29.59

コンソーシアムはアホばっか。
結局駆け引きとかゲーム楽しんでるだけじゃん。

**デフォルトの名無しさん** · 2016/04/22(金) 16:03:00.18

ヘアスタイルや髪の色、眼鏡やら帽子やらはUnicodeの範囲の対象外だよとか言ってたのは何だったんだろう

**デフォルトの名無しさん** · 2016/04/28(木) 04:05:36.64

完全にMark Davisに振り回されてる

**デフォルトの名無しさん** · 2016/04/30(土) 16:00:17.78

禿は髪の色じゃなくてヘアスタイルだろ
てっぺん禿、後退禿、つるっ禿と種類もある
禿差別が凄い

**デフォルトの名無しさん** · 2016/04/30(土) 16:37:37.68

ちょんまげとか辮髪とかと同列のタグだよね

**デフォルトの名無しさん** · 2016/05/01(日) 09:46:27.59

イラストのための仕様拡張なんか合理的な理由が全くないわ
文字から切り離して絵のフォーマットにすればいいじゃん

**デフォルトの名無しさん** · 2016/05/01(日) 11:04:17.70

匿名通信（Tor、i2p等）ができるファイル共有ソフトBitComet（ビットコメット）みたいな、
BitTorrentがオープンソースで開発されています

言語は何でも大丈夫だそうなので、P2P書きたい！って人居ませんか？

Covenantの作者（Lyrise）がそういう人と話したいそうなので、よろしければツイートお願いします
https://twitter.com/Lyrise_al

ちなみにオイラはCovenantの完成が待ち遠しいプログラミングできないアスペルガーｗ

The Covenant Project
概要

Covenantは、純粋P2Pのファイル共有ソフトです

目的

インターネットにおける権力による抑圧を排除することが最終的な目標です。そのためにCovenantでは、中央に依存しない、高効率で検索能力の高いファイル共有の機能をユーザーに提供します

特徴

Covenant = Bittorrent + Abstract Network + DHT + (Search = WoT + PoW)

接続は抽象化されているので、I2P, Tor, TCP, Proxy, その他を利用可能です
DHTにはKademlia + コネクションプールを使用します
UPnPによってポートを解放することができますが、Port0でも利用可能です(接続数は少なくなります)
検索リクエスト、アップロード、ダウンロードなどのすべての通信はDHT的に分散され、特定のサーバーに依存しません
ｖ

**デフォルトの名無しさん** · 2016/05/18(水) 02:04:12.61

　
　　　　　彡 ⌒ ミ
　　　　　 (´・ω・｀)
　　　　Ｕ θ Ｕ　　
　　／￣￣Ⅰ￣￣＼
　　|二二二二二二二|
　　｜　　　　　　　　｜

**デフォルトの名無しさん** · 2016/06/07(火) 17:21:48.18

http://www.unicode.org/emoji/charts/emoji-released.html#food-prepared
たこ焼きはまだか?

**デフォルトの名無しさん** · 2016/06/08(水) 01:10:51.52

NAUSEATED FACEってなんや。
外人は体調悪くなるとみんな顔緑色になるんか。

**デフォルトの名無しさん** · 2016/06/08(水) 11:35:15.41

この調子でどんどん絵文字を追加していくと
ついには新しい表意文字の体系が出来上がるよね
だけどコンピュータで扱う上では表音文字の方が合理的だったってことは
我々は痛いほどよくわかっているから、なんだかなーって気持ちになる
全ての物を一文字で表すのは大変なので
将来的に絵文字の熟語とか編み出されて
絵文字で会話するようになったらいやだなぁ

**デフォルトの名無しさん** · 2016/06/09(木) 11:33:55.71

>>268
>全ての物を一文字で表すのは大変なので

中国人「歓」

>将来的に絵文字の熟語とか編み出されて
>絵文字で会話するようになったらいやだなぁ

中国人「可不是」日本人「成程ね」

**デフォルトの名無しさん** · 2016/06/20(月) 16:59:01.95

ttp://d.hatena.ne.jp/NAOI/20080623/1214211959

絵文字の人物の肌の色やら髪の色を区別するならこういうのも区別してほしいわ～。
バケツ頭かそうでないかは重要、俺的に

**デフォルトの名無しさん** · 2016/06/21(火) 12:33:04.97

unicode例示図形の画力の低さが光る

**デフォルトの名無しさん** · 2016/06/22(水) 14:24:00.61

The Unicode Blog: Announcing The Unicode® Standard, Version 9.0
http://blog.unicode.org/2016/06/announcing-unicode-standard-version-90.html

Unicode 9.0.0
http://www.unicode.org/versions/Unicode9.0.0/

**デフォルトの名無しさん** · 2016/06/22(水) 16:17:18.06

なんか最近どんどん数字上がってね？Chromeみたい。
どんどんメジャーバージョン上げていく理由って何？

**デフォルトの名無しさん** · 2016/06/24(金) 07:30:00.72

>>273
絵文字量産してるからな
ろくすっぽ審議もせずどんどん入れてる
絵文字専用コードにすればいいのに

**デフォルトの名無しさん** · 2016/06/24(金) 21:07:43.94

本当、Unicode 1.X でやめとけば世の中平和だったのに。

**デフォルトの名無しさん** · 2016/06/26(日) 01:00:56.43

まあ、サロゲートペアは無くても結合文字があるんですけどね……。