プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
探検
文字コード総合スレ Part10 [転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
2015/10/14(水) 20:29:00.08ID:xctG4AAd177デフォルトの名無しさん
2016/02/06(土) 15:45:39.28ID:P3+owK3w178デフォルトの名無しさん
2016/02/06(土) 18:59:39.30ID:Ps0oIAyd UTF-8なら漢字やかなに00-7Fは使わないけどな
って、そういう話をしてるわけじゃないのか。
って、そういう話をしてるわけじゃないのか。
179デフォルトの名無しさん
2016/02/06(土) 19:36:29.58ID:uSRKfZgb >>176
しかしShift JISはかなり質が悪い
しかしShift JISはかなり質が悪い
180デフォルトの名無しさん
2016/02/06(土) 19:41:15.78ID:MiOvJZDJ どうしてWindowsは出来の悪い方ばっかり選択するんだろうか
cp932といいUTF-16といい…
cp932といいUTF-16といい…
181デフォルトの名無しさん
2016/02/06(土) 20:34:21.53ID:sR9TSGCJ >>178
そういう話をしてるつもりだけど、そうでない人もいるようだ。
そういう話をしてるつもりだけど、そうでない人もいるようだ。
182デフォルトの名無しさん
2016/02/07(日) 08:00:22.03ID:+iI8pPYd エスケープシーケンスよりCP932の方がまだマシだし、
CP932よりUCS-2の方が多少はマシだったからでしょ
CP932よりUCS-2の方が多少はマシだったからでしょ
183デフォルトの名無しさん
2016/02/07(日) 13:34:15.00ID:COqNuXpv >>173
今更だけど、文字が分断される可能性についても公平を期すために触れておくよ。
単純にバイト数で分割する場合等を除けば、ほとんどはパターンマッチにおける誤マッチが原因だろう。
strchr や strstr 、あるいはもっと高度なライブラリを使った結果かもしれない。
探すパターンに [\100-\176] にマッチする文字が含まれているなら EUC では誤マッチは起こらない。
シフトJISではダメ文字のせいで誤マッチが起こりうる。
実際に問題になるのはほとんどがこのケース。
grep "\]"
などとやろうものなら悲惨なことになる。
探すパターンがマルチバイト文字だけなら EUC でもシフトJISと同程度には誤マッチが起こりうる。
しかし実際にはほとんど起こらない。
もちろん起こるときは起こるし対策も出来るが対策は速度の低下と引換だ。
30 年前の CPU クロックは 10MHz 程度だったので速度も重要だった。
ほとんど起こらない上に致命的でもないなら速度を犠牲にしてまで常に対策を講じる必要は無い。
ちなみに対策だが、EUC で grep する場合なら
egrep "^([\000-\177]|\216[\240-\337]|\217[\241-\376][\241-\376]|[\241-\376][\241-\376])*$pattern"
的なことをするプログラムを grep_euc とかそういう名前で作っておけばいい。
シフトJISの場合はこれに加えてシフトJISな部分を 8 進エスケープシーケンスに置き換える必要がある。
同じやり方で iso-2022-jp も処理できる。
シフトJISしか通さない grep など技術的には邪魔なだけだよ。
今更だけど、文字が分断される可能性についても公平を期すために触れておくよ。
単純にバイト数で分割する場合等を除けば、ほとんどはパターンマッチにおける誤マッチが原因だろう。
strchr や strstr 、あるいはもっと高度なライブラリを使った結果かもしれない。
探すパターンに [\100-\176] にマッチする文字が含まれているなら EUC では誤マッチは起こらない。
シフトJISではダメ文字のせいで誤マッチが起こりうる。
実際に問題になるのはほとんどがこのケース。
grep "\]"
などとやろうものなら悲惨なことになる。
探すパターンがマルチバイト文字だけなら EUC でもシフトJISと同程度には誤マッチが起こりうる。
しかし実際にはほとんど起こらない。
もちろん起こるときは起こるし対策も出来るが対策は速度の低下と引換だ。
30 年前の CPU クロックは 10MHz 程度だったので速度も重要だった。
ほとんど起こらない上に致命的でもないなら速度を犠牲にしてまで常に対策を講じる必要は無い。
ちなみに対策だが、EUC で grep する場合なら
egrep "^([\000-\177]|\216[\240-\337]|\217[\241-\376][\241-\376]|[\241-\376][\241-\376])*$pattern"
的なことをするプログラムを grep_euc とかそういう名前で作っておけばいい。
シフトJISの場合はこれに加えてシフトJISな部分を 8 進エスケープシーケンスに置き換える必要がある。
同じやり方で iso-2022-jp も処理できる。
シフトJISしか通さない grep など技術的には邪魔なだけだよ。
184デフォルトの名無しさん
2016/02/07(日) 13:49:06.41ID:GW5WZ8T2185デフォルトの名無しさん
2016/02/07(日) 15:37:08.80ID:F/ILMG/l186デフォルトの名無しさん
2016/02/07(日) 20:14:33.59ID:lDI02uIo grepはいつutf16対応してくれるんじゃぁ
ふだんLinux使ってるんだがwinのソースコードはなぜかutf16なんでいつも困っとるんじゃぁ
nkfで変換するのめんどいんじゃあ
ふだんLinux使ってるんだがwinのソースコードはなぜかutf16なんでいつも困っとるんじゃぁ
nkfで変換するのめんどいんじゃあ
187デフォルトの名無しさん
2016/02/07(日) 21:05:14.46ID:+iI8pPYd utf16のそーすとか見たこと無いな
188デフォルトの名無しさん
2016/02/08(月) 01:36:20.73ID:0XuKQtD5 >>180
UTF-16はそのころUCS-2しかなかったんだから仕方ないやろ
個人的にWindowsはAとWはそのままでもいいから
標準CライブラリとC++ライブラリはUTF-8を使ってくれるようにしてくれれば不満ないんだけどな。
UTF-16はそのころUCS-2しかなかったんだから仕方ないやろ
個人的にWindowsはAとWはそのままでもいいから
標準CライブラリとC++ライブラリはUTF-8を使ってくれるようにしてくれれば不満ないんだけどな。
189デフォルトの名無しさん
2016/02/08(月) 05:19:47.55ID:x/5r9wp6 >>188
全然仕方なくないどころか、むしろまた先走ってやっちまったとしか
全然仕方なくないどころか、むしろまた先走ってやっちまったとしか
190デフォルトの名無しさん
2016/02/08(月) 09:34:53.73ID:AxqrebA9 UTF-16固定とか基地外沙汰
ackやagもUTF-16は華麗にスルー
ackやagもUTF-16は華麗にスルー
191デフォルトの名無しさん
2016/02/08(月) 22:30:39.07ID:ti0XuUyR EUCは目糞鼻糞だし、当時の記録媒体でUTF-8とか頭おかしいレベルなのに
一体どうしたかったのか
一体どうしたかったのか
192デフォルトの名無しさん
2016/02/08(月) 22:35:16.47ID:HMUrPVh/ ただマイクロソフトを非難したいだけのキティGUYに何を。
こういうのは誰でもいいから攻撃対象を設けてガス抜きさせてやらないといかん。
こういうのは誰でもいいから攻撃対象を設けてガス抜きさせてやらないといかん。
193デフォルトの名無しさん
2016/02/08(月) 23:02:30.93ID:sawB/DI+ SHIFT_JISよりEUC-JPの方がマシ、UTF-16よりUTF-8の方がマシってだけでしょ
マイクロソフトを非難したいだけに見えるとしたら相当なバイアス掛かってると思うよ
マイクロソフトを非難したいだけに見えるとしたら相当なバイアス掛かってると思うよ
194デフォルトの名無しさん
2016/02/09(火) 00:48:21.70ID:TCPuRlam195デフォルトの名無しさん
2016/02/09(火) 05:16:13.78ID:K12Uxl59 UTF-8のRFCが出たのは2003年
その頃には80GBのHDDを一般人が変える時代
テキストの容量が問題になるとか無いわ
個人的にはいつまで経ってもsetlocaleでUTF-8を指定出来ない、代替の方法も用意されないWindowsは非難されて当然だと思うけどな。
その頃には80GBのHDDを一般人が変える時代
テキストの容量が問題になるとか無いわ
個人的にはいつまで経ってもsetlocaleでUTF-8を指定出来ない、代替の方法も用意されないWindowsは非難されて当然だと思うけどな。
196デフォルトの名無しさん
2016/02/09(火) 07:15:08.73ID:4WJVGAJH Windowsの今の文字コードの設計のベースは1991年か1992年に
Unicode1.0.0をもとに作られたはず
ちなみにその頃から「〜」はU+FF5Eに存在した
Unicode1.0.0をもとに作られたはず
ちなみにその頃から「〜」はU+FF5Eに存在した
197デフォルトの名無しさん
2016/02/09(火) 07:20:39.41ID:AjhTI0tJ 当時の記録媒体言ってるのはWindowsNTの時代な
その当時にUTF-8みたいな実装してもアホでしょ
それとUTF-8を率先して使用してる理由ってEUC環境が糞だったからでしょ
EUC環境の時代って外人様のソフトウェアで漢字の表示すらままならなかったよね
その当時にUTF-8みたいな実装してもアホでしょ
それとUTF-8を率先して使用してる理由ってEUC環境が糞だったからでしょ
EUC環境の時代って外人様のソフトウェアで漢字の表示すらままならなかったよね
198デフォルトの名無しさん
2016/02/09(火) 07:37:26.98ID:AjhTI0tJ まあなんにせよUnicodeでデータ交換できるようになって
EUCゴミ環境が消えテクノは良い事だわ
EUCありがとうバイバイ
EUCゴミ環境が消えテクノは良い事だわ
EUCありがとうバイバイ
199デフォルトの名無しさん
2016/02/09(火) 08:47:31.92ID:K12Uxl59 同じようにWindowsのCP932もさっさと消えてほしいんだけどな
200デフォルトの名無しさん
2016/02/09(火) 11:12:55.58ID:nhb546WZ 今でも新規作成の全文章を統計取ると、
cp932の方が多いんじゃないか。
結局全くプログラムかかないひとが
何の文字コード使ってるかが焦点で、
プログラム書く人間の文字コードなんざ焦点じゃないんだよね。
cp932の方が多いんじゃないか。
結局全くプログラムかかないひとが
何の文字コード使ってるかが焦点で、
プログラム書く人間の文字コードなんざ焦点じゃないんだよね。
201デフォルトの名無しさん
2016/02/09(火) 11:31:59.64ID:gJW4evIq202デフォルトの名無しさん
2016/02/09(火) 11:32:56.66ID:gJW4evIq MSは昔からAPIを移行改善していくのが下手
203デフォルトの名無しさん
2016/02/09(火) 22:21:12.66ID:K12Uxl59 電話用のWindowsもCP932とUTF16ならそのまま安らかに死んでほしいんだけどどうなん?
204デフォルトの名無しさん
2016/02/09(火) 22:44:37.32ID:AjhTI0tJ 死ぬことはないよ
生まれてすらいないからね
生まれてすらいないからね
205デフォルトの名無しさん
2016/02/10(水) 05:29:25.59ID:ShaMeiRT 産まれる前に死ぬってあると思うけど?
206デフォルトの名無しさん
2016/02/10(水) 20:10:05.19ID:NIAqtvX5 文字コードはUnicodeで統一されつつあるけど
改行コードが統一される動きはないよな
改行コードが統一される動きはないよな
207デフォルトの名無しさん
2016/02/10(水) 20:11:34.12ID:jTWkF3R0208デフォルトの名無しさん
2016/02/10(水) 20:14:06.58ID:DqOeVQNQ 何言ってんだこいつ
209デフォルトの名無しさん
2016/02/10(水) 20:19:14.56ID:urcLBA+T おまえはお馬鹿な発言する人にいつもくってかかるのか
210デフォルトの名無しさん
2016/02/10(水) 20:27:11.86ID:jTWkF3R0 >>208>>209
バカ乙
バカ乙
211デフォルトの名無しさん
2016/02/10(水) 20:58:07.57ID:DqOeVQNQ 絵に描いたような「バカと言う奴がバカ」
212デフォルトの名無しさん
2016/02/10(水) 22:46:23.85ID:MNP/EF3f 最近のMSVCはUTF-8のソースコード食ってくれるよ
新しくMSVCで読み込んだソースがUTF-8なのにBOMがないと自動判定に失敗して意味不明なコンパイルエラーになることも多いけど
新しくMSVCで読み込んだソースがUTF-8なのにBOMがないと自動判定に失敗して意味不明なコンパイルエラーになることも多いけど
213デフォルトの名無しさん
2016/02/11(木) 00:53:59.61ID:V6zkYN3z214デフォルトの名無しさん
2016/02/11(木) 21:55:56.34ID:xlY9kt9Q 1バイトの英数字を平仮名と同じ幅で表示するフォントがあれば
全角英数字は使わないと思うんだが全角英数字も互換性のためだけに残されていると考えていいのか
全角英数字は使わないと思うんだが全角英数字も互換性のためだけに残されていると考えていいのか
215デフォルトの名無しさん
2016/02/11(木) 23:11:32.22ID:e91ojKTo >>214
JIS X 0208は、ASCIIやJIS X 0201と併用せずに使うことも想定されてる
だから文字集合に英数記号が含まれるのは当然
併用する場合ISO 2022的には重複符号化禁止だから本来使っちゃいけない
けど運用では守られてなかったし、併用前提の文字コードもあった
Unicodeは過去の利用例をほぼ取り込むのが前提だから
互換文字として全角文字を取り込んだ
JIS X 0208は、ASCIIやJIS X 0201と併用せずに使うことも想定されてる
だから文字集合に英数記号が含まれるのは当然
併用する場合ISO 2022的には重複符号化禁止だから本来使っちゃいけない
けど運用では守られてなかったし、併用前提の文字コードもあった
Unicodeは過去の利用例をほぼ取り込むのが前提だから
互換文字として全角文字を取り込んだ
216デフォルトの名無しさん
2016/02/11(木) 23:19:16.34ID:sKuqfOHl ではU+3000が互換文字領域に無いのは何故なんだぜ
217デフォルトの名無しさん
2016/02/11(木) 23:22:30.10ID:e91ojKTo なんとか空白はどうしても入れたい奴があったから全部入れることにしたんじゃないのかね
最初から20種類くらいあったでしょ
最初から20種類くらいあったでしょ
218デフォルトの名無しさん
2016/02/12(金) 00:18:36.22ID:VRdJSDW+ つまり全角を貫いたおおたさん大勝利ってことだな
219デフォルトの名無しさん
2016/02/12(金) 14:58:04.35ID:E8URvzDX 空白もそうだけど横棒も統合せずに放り込んだのが多すぎ
U+2015 HORIZONTAL BARってどこから生えて来たんだろ
U+2015 HORIZONTAL BARってどこから生えて来たんだろ
220デフォルトの名無しさん
2016/02/12(金) 22:43:58.37ID:06flQvvq VERTICALなら生えてきそうだけどHORIZONTALに生えるイメージは無いな
221デフォルトの名無しさん
2016/02/13(土) 10:24:02.68ID:vrowrAaX ————
――――
――――
222デフォルトの名無しさん
2016/02/13(土) 21:46:29.51ID:UfGCg9+I223デフォルトの名無しさん
2016/02/13(土) 21:50:44.90ID:DWYdQVEl バカの考えること=お前の考えること
自分が何考えてるかもわかんないなら救いようがないな。清原と一緒に逮捕されてろ
自分が何考えてるかもわかんないなら救いようがないな。清原と一緒に逮捕されてろ
224デフォルトの名無しさん
2016/02/15(月) 00:32:04.19ID:ntkpNKWd >>212
もうすぐUpdate2で改善されるからそれまで待て
もうすぐUpdate2で改善されるからそれまで待て
225デフォルトの名無しさん
2016/02/15(月) 16:58:33.36ID:4pgZ8RvT226デフォルトの名無しさん
2016/02/16(火) 07:17:36.55ID:XdPvZNKx227デフォルトの名無しさん
2016/02/20(土) 22:49:46.68ID:2GCqu0fo MS-excelのcodeという関数の出力がShift-JISだと勘違いしていた初心者の俺。
あやうく大恥をかく前に気づいてセーフ。
あやうく大恥をかく前に気づいてセーフ。
228デフォルトの名無しさん
2016/02/24(水) 01:54:36.77ID:hnpOvXF7 UNICODEが年々キモくなるんですけど、新しいモジコードは開発されていますか(´・ω・`)?
229デフォルトの名無しさん
2016/02/24(水) 12:06:50.24ID:9rhAu1z5230デフォルトの名無しさん
2016/02/24(水) 17:55:57.73ID:zehZo7UI 完成してMicrosoftとAppleとGoogleとLinuxが採用したら知らせてくれ
231デフォルトの名無しさん
2016/02/24(水) 20:07:26.11ID:Tso1kbi5 バイトオーダーがややこしいから1byteを1bitにするか
逆に1byteを64bitなどの大きい値にしたらどうよ?
コンピューターの黎明期は1byteが8bit以外の物もあったんだから
それも不可能ではないだろう。
逆に1byteを64bitなどの大きい値にしたらどうよ?
コンピューターの黎明期は1byteが8bit以外の物もあったんだから
それも不可能ではないだろう。
232デフォルトの名無しさん
2016/02/24(水) 20:26:02.29ID:JXxoXIUe 馬鹿って馬鹿だよね
233デフォルトの名無しさん
2016/02/25(木) 00:25:47.28ID:loBITXzr >>231
コンピュータの黎明期はbyteと云う単位ではなくて、Wordという単位だったと
思いますよ。1word何byteとかいっていて、コンピュータによって、Wordのbit数が
違っていたように思います。
大体1短Wordが20bit+1符号bit,1長wordが短wordの2倍で40bit+1符号bitというのが
普通だったとおもいますが、CDCの3600は、1短wordが32bit、1長wordが64bitではなかった
かと思います。
なにしろ、1960年代のことなので、記憶違いがあるかもしれません。
コンピュータの黎明期はbyteと云う単位ではなくて、Wordという単位だったと
思いますよ。1word何byteとかいっていて、コンピュータによって、Wordのbit数が
違っていたように思います。
大体1短Wordが20bit+1符号bit,1長wordが短wordの2倍で40bit+1符号bitというのが
普通だったとおもいますが、CDCの3600は、1短wordが32bit、1長wordが64bitではなかった
かと思います。
なにしろ、1960年代のことなので、記憶違いがあるかもしれません。
234デフォルトの名無しさん
2016/02/25(木) 20:46:03.90ID:BzGy0Z9t Unicodeに何が追加されようと大半の日本語フォントはAdobe-Japan1-6準拠だから
ほとんど恩恵がない
AdobeはPanCJKなんて漢字マニアしか喜ばないものを作ってないで
そろそろAJ17に取り掛かってくれ
ほとんど恩恵がない
AdobeはPanCJKなんて漢字マニアしか喜ばないものを作ってないで
そろそろAJ17に取り掛かってくれ
235デフォルトの名無しさん
2016/02/26(金) 12:15:47.32ID:YTHIspbV Wordは今でも使うだろ普通に。
昔あったのはWord機、生き残りがByte機。
昔あったのはWord機、生き残りがByte機。
236デフォルトの名無しさん
2016/02/26(金) 17:03:45.40ID:iAHBb9xH237デフォルトの名無しさん
2016/02/26(金) 19:35:56.60ID:Ckpzri88238デフォルトの名無しさん
2016/02/26(金) 19:54:30.62ID:d58rhTQn キモはアルゴリズムでデータソースでしかないものに文句つけてもイチャモンでしかないだろう
知らんけど
知らんけど
239デフォルトの名無しさん
2016/02/26(金) 21:57:25.44ID:jlaESRTF アルゴリズムもバグってるみたいよ
240デフォルトの名無しさん
2016/02/27(土) 01:15:53.58ID:1kXiMiWp241デフォルトの名無しさん
2016/03/02(水) 11:22:17.92ID:5SSZmY+T カタカナが多すぎて頭こんがらんがってきた
242デフォルトの名無しさん
2016/03/02(水) 13:37:01.48ID:H2CN+/B0 トゥゲザーしようぜ
243デフォルトの名無しさん
2016/03/02(水) 13:52:03.06ID:Pi6Moa3o シェアしたいと思います
244デフォルトの名無しさん
2016/03/04(金) 11:07:29.81ID:aAJqKKxk 1文字に32bit使うなら一般的な組み合わせの合成文字は
全て合成済み文字にしてコードを割り当てても足りるんじゃないだろうか
そうして合成文字は外字のようなオプション的な扱いにしたらいいと思うんだけどね
全て合成済み文字にしてコードを割り当てても足りるんじゃないだろうか
そうして合成文字は外字のようなオプション的な扱いにしたらいいと思うんだけどね
245デフォルトの名無しさん
2016/03/04(金) 11:29:46.53ID:ex0V5X9T 何のいみがあるのかわからんなあ
246デフォルトの名無しさん
2016/03/04(金) 12:41:46.94ID:aAJqKKxk >>245
一般的な文字では32bit固定長にできる
一般的な文字では32bit固定長にできる
247デフォルトの名無しさん
2016/03/04(金) 13:27:03.56ID:qO6Wo8x7 「一般的な組み合わせ」が不変ならいいけど、現実にはいくらでも流動しちゃうのが問題じゃないかな。
これまでにも「今の用途ならこれだけあれば十分」って感覚で半端に作られた負の遺産がたくさんあるよね。
合成文字の仕組み自体を全廃・強制力付きで禁止するのならともかく、
オプションとして残すのなら新たに余計なものを作っただけで終わるのが見えてる。
これまでにも「今の用途ならこれだけあれば十分」って感覚で半端に作られた負の遺産がたくさんあるよね。
合成文字の仕組み自体を全廃・強制力付きで禁止するのならともかく、
オプションとして残すのなら新たに余計なものを作っただけで終わるのが見えてる。
248デフォルトの名無しさん
2016/03/04(金) 18:21:11.26ID:IERVyLvo ISO/IEC 6937対ISO/IEC 8859シリーズの戦いはもう勘弁
249デフォルトの名無しさん
2016/03/15(火) 10:56:22.12ID:ZYJuXZMf >>228
Unicodeで得られた知見を基に反省を活かして新しいのを作ってほしいね。
Unicodeもコンセプトは賛成だし規格に例外は付き物だけど、あまりにも継ぎ接ぎだらけでスパゲティコードみたいになってるのは清算したいね。
Unicodeで得られた知見を基に反省を活かして新しいのを作ってほしいね。
Unicodeもコンセプトは賛成だし規格に例外は付き物だけど、あまりにも継ぎ接ぎだらけでスパゲティコードみたいになってるのは清算したいね。
250デフォルトの名無しさん
2016/04/02(土) 13:20:35.07ID:raCNCQWh Unicodeはバージョンアップ時に精算するのが得意な方
切り捨てバンザイ主義
これ以上切り捨てたら誰も使ってはくれない
切り捨てバンザイ主義
これ以上切り捨てたら誰も使ってはくれない
251デフォルトの名無しさん
2016/04/06(水) 17:49:51.21ID:APP4s98L UTS #52: Unicode Emoji Mechanisms
http://www.unicode.org/reports/tr52/tr52-1.html
> 3.5 Hair Attribute
>
> Syntax
>
> Tag-Base Hair_Base
> Tag-Key Tag-H
> Tag-Value Exactly one of the following tag-valueChars:
> tag-valueChar Description
> Tag-k Black-haired
> Tag-s Blonde (also sandy-haired)
> Tag-b Brown (Brunette)
> Tag-r Redhead (Ginger)
> Tag-g Gray-haired
> Tag-n Bald (no hair)
漫画・アニメキャラ用に赤髪、ピンク髪、緑髪、青髪、水髪、紫髪なんかも加えるべきじゃないですかね。
http://www.unicode.org/reports/tr52/tr52-1.html
> 3.5 Hair Attribute
>
> Syntax
>
> Tag-Base Hair_Base
> Tag-Key Tag-H
> Tag-Value Exactly one of the following tag-valueChars:
> tag-valueChar Description
> Tag-k Black-haired
> Tag-s Blonde (also sandy-haired)
> Tag-b Brown (Brunette)
> Tag-r Redhead (Ginger)
> Tag-g Gray-haired
> Tag-n Bald (no hair)
漫画・アニメキャラ用に赤髪、ピンク髪、緑髪、青髪、水髪、紫髪なんかも加えるべきじゃないですかね。
252デフォルトの名無しさん
2016/04/06(水) 18:29:57.08ID:qW+LkY/S _人人人人人人人_
> Bald (no hair) <
 ̄Y^Y^Y^Y^Y^Y^Y ̄
> Bald (no hair) <
 ̄Y^Y^Y^Y^Y^Y^Y ̄
253デフォルトの名無しさん
2016/04/08(金) 13:36:54.32ID:9VpqQ38l Δ彡⌒ミΔ
ξ ・ェ・ ξ
ξ ξ
ξ ξ また髪の話してる。
ξ ξ
ξ 彡⌒ミ
ξ (´・ω・`)〇
ξ (| |)ξ
ξ (γ / ξ
uu〜〜〜し uu
ξ ・ェ・ ξ
ξ ξ
ξ ξ また髪の話してる。
ξ ξ
ξ 彡⌒ミ
ξ (´・ω・`)〇
ξ (| |)ξ
ξ (γ / ξ
uu〜〜〜し uu
254デフォルトの名無しさん
2016/04/09(土) 00:11:15.96ID:QiRGiLFx 毛の色と量は別のパラメータだよね
255デフォルトの名無しさん
2016/04/09(土) 00:17:51.71ID:EyctzspR 赤毛のつるっぱげと
黒髪のつるっぱげと
ブロンドのつるっぱげの
区別を付ける意味はあるのかなあ。
黒髪のつるっぱげと
ブロンドのつるっぱげの
区別を付ける意味はあるのかなあ。
256デフォルトの名無しさん
2016/04/09(土) 01:58:16.39ID:ncpORidQ 眉毛の色も変わるんじゃね
257デフォルトの名無しさん
2016/04/11(月) 18:05:35.93ID:qAYYUQ+e258デフォルトの名無しさん
2016/04/19(火) 18:55:29.59ID:y8aUhLXK コンソーシアムはアホばっか。
結局駆け引きとかゲーム楽しんでるだけじゃん。
結局駆け引きとかゲーム楽しんでるだけじゃん。
259デフォルトの名無しさん
2016/04/22(金) 16:03:00.18ID:20ytlDG9 ヘアスタイルや髪の色、眼鏡やら帽子やらはUnicodeの範囲の対象外だよとか言ってたのは何だったんだろう
260デフォルトの名無しさん
2016/04/28(木) 04:05:36.64ID:m6Hq/pUS 完全にMark Davisに振り回されてる
261デフォルトの名無しさん
2016/04/30(土) 16:00:17.78ID:Hd4l7uwV 禿は髪の色じゃなくてヘアスタイルだろ
てっぺん禿、後退禿、つるっ禿と種類もある
禿差別が凄い
てっぺん禿、後退禿、つるっ禿と種類もある
禿差別が凄い
262デフォルトの名無しさん
2016/04/30(土) 16:37:37.68ID:n4ETaU8X ちょんまげとか辮髪とかと同列のタグだよね
263デフォルトの名無しさん
2016/05/01(日) 09:46:27.59ID:w66eLaS8 イラストのための仕様拡張なんか合理的な理由が全くないわ
文字から切り離して絵のフォーマットにすればいいじゃん
文字から切り離して絵のフォーマットにすればいいじゃん
264デフォルトの名無しさん
2016/05/01(日) 11:04:17.70ID:tKi6j9CT 匿名通信(Tor、i2p等)ができるファイル共有ソフトBitComet(ビットコメット)みたいな、
BitTorrentがオープンソースで開発されています
言語は何でも大丈夫だそうなので、P2P書きたい!って人居ませんか?
Covenantの作者(Lyrise)がそういう人と話したいそうなので、よろしければツイートお願いします
https://twitter.com/Lyrise_al
ちなみにオイラはCovenantの完成が待ち遠しいプログラミングできないアスペルガーw
The Covenant Project
概要
Covenantは、純粋P2Pのファイル共有ソフトです
目的
インターネットにおける権力による抑圧を排除することが最終的な目標です。 そのためにCovenantでは、中央に依存しない、高効率で検索能力の高いファイル共有の機能をユーザーに提供します
特徴
Covenant = Bittorrent + Abstract Network + DHT + (Search = WoT + PoW)
接続は抽象化されているので、I2P, Tor, TCP, Proxy, その他を利用可能です
DHTにはKademlia + コネクションプールを使用します
UPnPによってポートを解放することができますが、Port0でも利用可能です(接続数は少なくなります)
検索リクエスト、アップロード、ダウンロードなどのすべての通信はDHT的に分散され、特定のサーバーに依存しません
v
BitTorrentがオープンソースで開発されています
言語は何でも大丈夫だそうなので、P2P書きたい!って人居ませんか?
Covenantの作者(Lyrise)がそういう人と話したいそうなので、よろしければツイートお願いします
https://twitter.com/Lyrise_al
ちなみにオイラはCovenantの完成が待ち遠しいプログラミングできないアスペルガーw
The Covenant Project
概要
Covenantは、純粋P2Pのファイル共有ソフトです
目的
インターネットにおける権力による抑圧を排除することが最終的な目標です。 そのためにCovenantでは、中央に依存しない、高効率で検索能力の高いファイル共有の機能をユーザーに提供します
特徴
Covenant = Bittorrent + Abstract Network + DHT + (Search = WoT + PoW)
接続は抽象化されているので、I2P, Tor, TCP, Proxy, その他を利用可能です
DHTにはKademlia + コネクションプールを使用します
UPnPによってポートを解放することができますが、Port0でも利用可能です(接続数は少なくなります)
検索リクエスト、アップロード、ダウンロードなどのすべての通信はDHT的に分散され、特定のサーバーに依存しません
v
265デフォルトの名無しさん
2016/05/18(水) 02:04:12.61ID:rFetSORz彡 ⌒ ミ
(´・ω・`)
U θ U
/ ̄ ̄T ̄ ̄\
|二二二二二二二|
| |
266デフォルトの名無しさん
2016/06/07(火) 17:21:48.18ID:zLlkZGBv267デフォルトの名無しさん
2016/06/08(水) 01:10:51.52ID:mh0+02By NAUSEATED FACEってなんや。
外人は体調悪くなるとみんな顔緑色になるんか。
外人は体調悪くなるとみんな顔緑色になるんか。
268デフォルトの名無しさん
2016/06/08(水) 11:35:15.41ID:XFtKz/Go この調子でどんどん絵文字を追加していくと
ついには新しい表意文字の体系が出来上がるよね
だけどコンピュータで扱う上では表音文字の方が合理的だったってことは
我々は痛いほどよくわかっているから、なんだかなーって気持ちになる
全ての物を一文字で表すのは大変なので
将来的に絵文字の熟語とか編み出されて
絵文字で会話するようになったらいやだなぁ
ついには新しい表意文字の体系が出来上がるよね
だけどコンピュータで扱う上では表音文字の方が合理的だったってことは
我々は痛いほどよくわかっているから、なんだかなーって気持ちになる
全ての物を一文字で表すのは大変なので
将来的に絵文字の熟語とか編み出されて
絵文字で会話するようになったらいやだなぁ
269デフォルトの名無しさん
2016/06/09(木) 11:33:55.71ID:QkRZyBjx270デフォルトの名無しさん
2016/06/20(月) 16:59:01.95ID:KYxI40Xs ttp://d.hatena.ne.jp/NAOI/20080623/1214211959
絵文字の人物の肌の色やら髪の色を区別するならこういうのも区別してほしいわ〜。
バケツ頭かそうでないかは重要、俺的に
絵文字の人物の肌の色やら髪の色を区別するならこういうのも区別してほしいわ〜。
バケツ頭かそうでないかは重要、俺的に
271デフォルトの名無しさん
2016/06/21(火) 12:33:04.97ID:hiJvGdgU unicode例示図形の画力の低さが光る
272デフォルトの名無しさん
2016/06/22(水) 14:24:00.61ID:veMK4+iv The Unicode Blog: Announcing The Unicode® Standard, Version 9.0
http://blog.unicode.org/2016/06/announcing-unicode-standard-version-90.html
Unicode 9.0.0
http://www.unicode.org/versions/Unicode9.0.0/
http://blog.unicode.org/2016/06/announcing-unicode-standard-version-90.html
Unicode 9.0.0
http://www.unicode.org/versions/Unicode9.0.0/
273デフォルトの名無しさん
2016/06/22(水) 16:17:18.06ID:VKcfRnsb なんか最近どんどん数字上がってね?Chromeみたい。
どんどんメジャーバージョン上げていく理由って何?
どんどんメジャーバージョン上げていく理由って何?
274デフォルトの名無しさん
2016/06/24(金) 07:30:00.72ID:DNjTkSpS275デフォルトの名無しさん
2016/06/24(金) 21:07:43.94ID:BJd4+ABn 本当、Unicode 1.X でやめとけば世の中平和だったのに。
276デフォルトの名無しさん
2016/06/26(日) 01:00:56.43ID:jrvEZcpa まあ、サロゲートペアは無くても結合文字があるんですけどね……。
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 習政権、高市首相への態度硬化 台湾有事発言で連日非難 中国 ★11 [ぐれ★]
- 日本損失1.7兆円に修正 中国渡航自粛の影響試算 [蚤の市★]
- NY円、一時1ユーロ=180円台まで下落…1999年のユーロ導入以来初 [蚤の市★]
- 国内ホテル、既にキャンセルも 訪日客関連業界、事態見守る ★3 [蚤の市★]
- 【外交】日中関係悪化、長期化の様相 2012年には自動車輸出80%減も ロイター★3 [1ゲットロボ★]
- 「どうしようもない」 ため息つくアジアの玄関口 中国の訪日自粛で−福岡市 [蚤の市★]
- 【実況】博衣こよりのえちえち朝こよ🧪 ★2
- 【実況】博衣こよりのえちえち朝こよ🧪
- カカロット、腰痛い
- 【悲報】高市早苗を妄信している今の日本人見ると80年前も市民は進んで戦争協力してたんだって理解出来るよね🥺 [616817505]
- 【超悲報】中国への武力行使、世論調査で「賛成」「どちらかといえば賛成」48.8% 「反対」「どちらかといえば反対」の44.2%を上回る [314039747]
- 中国「高市が頭を下げて謝罪しない限り、絶対に許さない」 [329329848]
