文字コード総合スレ Part10 [転載禁止]©2ch.net

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2015/10/14(水) 20:29:00.08ID:xctG4AAd
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
2017/07/12(水) 08:29:42.86ID:pZQyr2Pt
IVSとaj1、汎用の兼ね合いを聞くに、文字セットの粒度の違いって漢字に限らず全ての文字セットに共通の問題だな。
声の大きい人がいる漢字カテでしか語られないけど
2017/07/18(火) 12:07:21.65ID:Y15ZUQ7r
アップル、年内追加の絵文字を公開--恐竜やゾンビ、シマウマも - CNET Japan
https://japan.cnet.com/article/35104330/

追加するのは良いけど、新規ばっかり注力してないで仕様バグ直す努力して欲しい
2017/07/18(火) 19:43:33.65ID:cVXFU6mc
顔から緑のが出てるやつ、それ普通に吐いてる絵文字だったんだな
緑だから野菜嫌いな子供みたいな意味なのかなと思ってた。
2017/07/19(水) 22:46:24.80ID:vMGHf8tr
「外字」という言葉、使えなくなるかな。同音異義語の差別用語を連想するから。
これからは「ユーザ定義文字」や「ベンダ定義文字」、「私用文字」、「規格外文字」とかに置き換えるべきかな。
2017/07/19(水) 23:22:55.87ID:Zx0RLH/I
プア
2017/07/20(木) 03:43:36.69ID:Y+E7uZ+G
>>781
外人は外人だろうになあ
2017/07/20(木) 07:15:13.80ID:5rqzfieT
>>781
変な言葉狩りやめろ
2017/07/20(木) 12:32:55.14ID:IUJJzkHn
「外字」という表記はそのままで、
読みを変えて「そとじ」と言うことにしよう。
2017/07/20(木) 17:08:30.52ID:721tcuSC
タト字
2017/07/24(月) 19:30:26.36ID:SPeDMBVA
ISO 10646が「Publication date : 2017-07」になっている
そろそろ本気だす頃?
2017/07/25(火) 23:23:42.52ID:LLM1ZCjk
「がいじ」と聞くと昔から文字コードヲタの自分はやっぱりまず、
各ユーザがエディタで自作して定義する文字や、ベンダが空き領域に独自に定義した文字等の
規格外の文字であることを示す「外字」が思い浮かぶ。
まさか同音の差別用語が生まれるとは思わなかった。今日では2chの至る所で見かけるし。
2017/07/26(水) 01:34:53.99ID:NnPMbS6q
外事と外耳のこともたまには思い出してください
2017/07/26(水) 16:57:39.21ID:Pvb1ow9Q
外字フォント
2017/07/26(水) 23:29:07.92ID:ctIBmsHN
最近は外字あまり使われないよな。文字コードに無いのは画像にして貼り付ける事が多いし。
2017/07/27(木) 04:45:21.73ID:wpPsIhCe
ガイジという言葉を知っていますか

Twitterでガイジという言葉を見かけました。
呟いていた方に聞いてみたら、大学生位の方が言っていたと。
果たして、言葉の意味を理解して使っていたのでしょうか。
ガイジとは、障害児を略した言葉です。障害児に対する、強烈な差別意識を感じさせる、悪意を持った言葉です。
この言葉を使えば、それだけで特定の人々、つまり障害を持つお子さんを差別したことになります。
障害児を略しただけだ、言葉の意味は変わらない、と言われる方もいらっしゃるかと思います。
違います。障害児は区別する言葉、ガイジは差別する言葉です。
2017/07/27(木) 08:18:41.67ID:c6JgQN0e
どこかに区点が入っている気がした
2017/07/27(木) 12:52:52.60ID:OdPeHFfE
>>792
違いますよ。
ここで言うガイジとは外字のことで、ウィキペディアから引用すると「特定の文字集合(文字コードなど)に含まれない文字のこと」となります。
差別はあなたの心の中にあるのです。
2017/07/28(金) 12:48:01.85ID:dbHFcG6T
ISO/IEC 10646
前見た時はページ数

> Number of pages : 2697

だったのに今見たら

> Number of pages : 136

になってる? 何があった。
2017/07/28(金) 17:41:21.27ID:PaDDKq68
たんなる間違いじゃないの
Unicodeコア仕様書ですら1000ページあるのに
2017/07/28(金) 23:58:07.94ID:g7fuxxO4
可能性を推測するならコードチャートが本文のカウントから外されたとか
2017/07/30(日) 21:43:07.30ID:PsllIOC5
チャート本体はUnicode X.0.0を参照せよ
とかだったりして
2017/08/02(水) 07:35:28.28ID:ka6IexAb
架空文字(スタートレックとか)は頑なに却下するくせに、絵文字はどんどん創作して追加してるのダブスタだよな
架空文字も絵文字として申請すれば良いのか?
2017/08/02(水) 22:31:37.76ID:3UX7sSkR
ピカチュウとか申請したらドサクサに紛れていつの間にか入ってそう
2017/08/03(木) 07:42:40.67ID:DjKC+R0J
>>799
フィクションの文字はそうしちゃえばいいね
2017/08/05(土) 08:17:17.76ID:de8G3D2Z
Kangaroo, Softball, Frowning Poo Emojis Possible For 2018
http://blog.emojipedia.org/kangaroo-softball-frowning-poo-emojis-possible-for-2018/
2017/08/05(土) 09:23:06.46ID:o5e6vDfw
ウンコが増えるよ!やったね!
2017/08/05(土) 11:54:11.90ID:WO/v0A2W
はよう糞まみれになろうや
2017/08/05(土) 16:21:53.87ID:NtivcnXJ
世界中の文字セットを1つに扱うのが目的であって、新しい文字を創作するのはおかしいのにね
806デフォルトの名無しさん
垢版 |
2017/08/06(日) 09:56:20.49ID:qWN01ODb
>>800
ポケモン約800種類全てを全国図鑑番号順に割り当てられたりして。
♂♀の選択やフォルムチェンジはVSのような専用の符号を後ろに付けるとかで。
2017/08/06(日) 10:19:15.27ID:sla8IrYb
人の肌の色に対応するんだったら馬の毛色にも対応してほしい。
青毛、鹿毛、栗毛、芦毛とか。
2017/08/06(日) 19:19:25.07ID:q/iOXjTE
ピカチュウ入れたら
「ドラクエのスライム入れろ」「FFのチョコボ入れろ」「マリオ入れろ」
とかになっちゃうがな。
2017/08/06(日) 23:08:06.45ID:MiLcYytM
いずれ世界中の民族衣装が採用されるんじゃまいか?
2017/08/07(月) 12:31:51.02ID:eqFqtwmF
>>808
キャラクターや商標やら他の権利で守られてるものは無理でしょ
2017/08/07(月) 12:32:30.82ID:eqFqtwmF
>>807
確かにな
動物系は
2017/08/07(月) 13:23:43.13ID:9Mdxb5QD
絵文字は日本のケータイで使われていてベンダ間で
交換もされてたから入ったわけで、ポケモン等は意味不明
2017/08/08(火) 20:54:41.14ID:PndXgq1K
>>812
今や携帯由来の絵文字は極少数
Unicode独自定義の絵文字ばかりになった
法的な問題がクリアできれば需要はある
2017/08/09(水) 11:28:24.84ID:q+cnFBMg
あああ、もうめちゃくちゃだよ…
815デフォルトの名無しさん
垢版 |
2017/08/09(水) 18:15:40.27ID:5nByh/9q
ピカチュウは
U+1F401 U+200D U+26A1(鼠、マウスの絵文字 + ZWJ + 高電圧、雷マーク)
で表す事にしよう。
2017/08/09(水) 22:53:31.39ID:bp2xq1i0
emojiがエジプト神聖文字のように言語化しつつある。
817デフォルトの名無しさん
垢版 |
2017/08/09(水) 23:10:01.92ID:d92boKtE
>>807
サバトラとかキジトラ白とか三毛とか
2017/08/10(木) 15:51:43.81ID:/ua5Aw52
現代の象形文字、それがEmoji。
2017/08/10(木) 22:08:34.52ID:PKHYBccj
>>815
ライチュウとかピチューとか区別できる?
2017/08/10(木) 22:58:47.89ID:/XWrshI+
>>817
日本が提案してた
ケーキ+汎用の色セレクタ=チョコレートケーキ
案を復活させるべきだな
2017/08/16(水) 06:18:57.16ID:HvWTm0rv
上に何載せるかをセレクタにすべきだな
2017/08/17(木) 14:19:45.83ID:vMvhQSc5
上にのせるものは結合文字でいい
幾つでものせてよし
もちろんホイップにイチゴは合成済み文字で
2017/08/17(木) 18:03:41.72ID:NZeYtWs8
>>822
真に受けんなよ
2017/08/18(金) 12:09:15.45ID:FcTfUvNw
Jアラート訓練 メール電文が文字化けのトラブル
8月18日 11時51分

島根県で行われたJアラート=全国瞬時警報システムを使用した緊急情報の送受信訓練で、県の防災メールでテスト電文が配信されましたが、画面が文字化けして読めないというトラブルがありました。
島根県によりますと、防災メールにはおよそ1万5000人が登録しているということですが、どの程度の範囲で文字化けが起きたのかなど詳しい状況について確認を進めているということです。

島根県防災危機管理課は「きちんと情報が伝達できずに申し訳ない。現在、原因の究明を進めていて、今後こうしたことが起きないように努めたい」と話しています。 
http://www3.nhk.or.jp/news/html/20170818/k10011103391000.html
2017/08/18(金) 12:25:20.77ID:eIpnBeVf
MIMEエンコしてないとか
2017/08/18(金) 12:42:20.53ID:FcTfUvNw
文字化けメール画像
http://www3.nhk.or.jp/news/html/20170818/K10011103391_1708181154_1708181155_01_02.jpg
2017/08/18(金) 16:02:13.46ID:eIpnBeVf
どうせrubyωで作ったとか
2017/08/18(金) 16:20:36.62ID:RRX5RBja
>>826 を見るとこんな感じに化けてる

$ echo '2017年08月' | iconv -f SJIS -t UTF-8
2017蟷エ08譛

つまり、メール送信システムはSJISのテキストを受理するように作られていて
誤ってUTF-8のテキストを入れてしまった。ってことかな
2017/08/18(金) 16:28:58.20ID:f8KfeV+E
「即時音声合成」
2017年08月18日11時00分
これは、Jアラートのテストです。
これで、テストを終了します。
対象地域:
鳥取県 島根県 岡山県 広島県 山口県 徳島県 香川県 愛媛県 高知県



縲悟叉譎る浹螢ー蜷域・縲・
2017蟷エ08譛・8譌・11譎・0蛻・
縺薙l縺ッ縲゛繧「繝ゥ繝シ繝医・繝・せ繝医〒縺吶ゅ
縺薙l縺ァ縲√ユ繧ケ繝医r邨ゆコ・@縺セ縺吶ょ
蟇セ雎。蝨ー蝓滂シ夐
魑・蜿也恁縲蟲カ譬ケ逵後蟯。螻ア逵後蠎・ウカ逵後螻ア蜿」逵後蠕ウ蟲カ逵後鬥吝キ晉恁縲諢帛ェ帷恁縲鬮倡衍逵啓

か。
ヘッダとフッタが正常なのが泣ける
2017/08/18(金) 17:06:27.71ID:eIpnBeVf
iconvなんか使うなよ
2017/08/19(土) 04:28:22.39ID:8wK5LPmg
このスレに一般ニュースがかかわってくるとは珍しい
2017/08/19(土) 15:21:07.32ID:vQyZjPpv
島根クオリティのruby
2017/08/19(土) 21:29:17.88ID:PoJOAggC
ruby漏れの
2017/09/01(金) 18:44:22.34ID:kgVPWxeV
Unicode絵文字はどうなるんだろうね
2017/09/02(土) 00:16:19.15ID:jUAASW0y
絵文字はアラートにいるだろうか
2017/09/05(火) 23:47:25.10ID:CxjNlFkm
花園明朝バージョンアップ来た。
漢字拡張Fや変体仮名が追加されてた。
2017/09/13(水) 20:02:44.61ID:KWwY7/kL
iPhoneXで動く絵文字Animojiまで出てきた
最初からUnicodeとは別の仕様作ってバリバリ仕様改変していけば良かったのにな
2017/09/13(水) 23:58:47.08ID:i8DgB3mu
IPAmj明朝はバージョンアップまだかな?
変体仮名が内部に含まれてるけどこのままじゃ使えない。
cmapテーブル改変すりゃ使えるけど公式で使えるようになるのはいつになるかな。
2017/09/14(木) 20:00:42.99ID:olxB6Qiw
Japan New Era Name Support Blog – 日本マイクロソフトの新元号 (和暦) 対応に関するサポート情報のブログです
https://blogs.technet.microsoft.com/jperablog/

こんなん作ってたのかマイクロソフト
2017/09/15(金) 22:07:07.01ID:Eknhu6BK
MS自身が符号化提案するつもりなのかな
場所はどこになるんだろう
2017/09/17(日) 07:56:28.63ID:mseaw4po
新しい文字コード作るのか?
2017/09/17(日) 17:45:38.08ID:HcLQ0vfz
色々考えてんね
2017/09/17(日) 18:23:49.36ID:PNbDpzbo
UTF-1Mとかはどうよ?
1文字1Mbyteで1024x1024のビットイメージで1文字を現す。
2017/09/17(日) 22:48:01.62ID:bCKL0uvM
Shift_JIS/CP932にも追加するんだろうか新元号
2017/09/17(日) 23:39:25.78ID:f8iJT+1F
Unicodeは組文字指示子でも作れよ
2017/09/18(月) 07:57:38.05ID:Q2/IYiwb
CP932の元号ってなんでつながってないの?
2017/09/18(月) 11:14:04.62ID:pqj5nFKY
1文字目+ZWJ+2文字目でいいやん。
2017/09/18(月) 14:47:22.52ID:/S27bRBH
>>846
予め空けておくのは不敬罪
2017/09/18(月) 16:48:59.00ID:ygz3rI3S
>>846
後付けだからでは
いわゆるNEC特殊文字というのがいつ出来たか詳しく知らないけど1983年頃には使えたはずで
その頃は当然まだ昭和で平成は影も形もない
「~」が13区63点に入った理由もよく知らないけど一番外字で埋められてなさそうな端っこにしたとかだろうか
2017/09/18(月) 22:35:48.18ID:w6oSciVB
>NEC特殊文字というのがいつ出来たか詳しく知らないけど1983年頃には使えたはず

そんな本当のことを言うと、NEC特殊文字が1997年の
Shift_JISの拡張と妄信してる先生の世界に矛盾が生じてしまうだろ
2017/09/19(火) 01:31:34.53ID:bjGHvQqi
シフト符号化といわゆるShift-JISを混同すんな
2017/09/19(火) 03:05:46.20ID:qsNfDhHd
MSゴシック/MS明朝/メイリオとIPAって、
~は縦書きグリフでも横に並べたままなのね。

実際の使用現場では縦横どっちのほうが便利なんだろ。
2017/09/19(火) 05:07:32.07ID:33S+M35U
手元のフォントだと、~だと縦になるフォントと横のままのフォント両方あるけど、iとかは全部縦になる
ってことはデザイナーが意図して横のままにしてるんだろうな
2017/09/19(火) 15:42:33.57ID:k8wd+zqV
>>852
使わないのが定石
そう言う問題以前にフォントとして使い辛い
2017/09/20(水) 03:22:20.33ID:LjqpwHID
使わないなら誰のために追加するんや…
2017/09/20(水) 07:30:00.77ID:YPFC/x+p
とりあえずPCで表示できればいいやっていう需要に応えるため
2017/09/20(水) 07:34:34.62ID:ZYEvUxiN
InDesignやIllustratorの縦中横機能を使えない一般ピーポーのための“貧者の縦中横”じゃないの?
2017/09/22(金) 18:32:09.05ID:QCzCo6Xh
そのアホと仕様化メンバーのアホがコラボしてUnicodeの属性がむちゃくちゃになったからな
2017/09/26(火) 23:12:20.44ID:ZBZ84yRG
Unicodeが独断で絵文字を追加して、SC2/WG2の投票を通さず勝手にUnicodeチャートを
アップデートしてることにアイルランドNBから文句がついた(WG2 N4888)
2017/09/27(水) 01:58:12.86ID:QltraNmZ
そんなことしてたのか。
2017/09/27(水) 22:27:48.19ID:CfAOIjZ1
アイルランド代表ってファックサインとバルカン式挨拶の絵文字入れた件の印象しか無いな
真面目?な仕事もしてるんだなさすがに
2017/09/27(水) 22:55:01.58ID:PWLdOFze
もう一生Unicodeなのかな…
2017/09/28(木) 01:10:46.04ID:/8a1xhL4
Unicodeの代わりになる何かができたとして、
それには確実にUnicode互換文字がずらりと入っているはずだから一生Unicodeみたいなもんだ。
2017/09/28(木) 02:44:35.32ID:VjJJSlDU
>>862
俺は死ぬまでSJISと付き合うんだろうなあと思う。
2017/09/28(木) 10:29:24.48ID:PJxaABWy
朝鮮クオリティ
2017/09/28(木) 11:41:48.77ID:A+i/ub4B
大抵の人間はutf8で満足なんじゃないの?
2017/09/28(木) 18:50:29.30ID:L3o6siGJ
Unicodeで良いと思っちゃうんだよな
もし叶うならCJK周りを最適化したいね
2017/09/28(木) 19:38:34.40ID:yupWamhN
宇宙人との交信が普通になってくるとまたいろいろもめそう
2017/09/28(木) 23:51:52.20ID:XJXTBf+J
肌色セレクタを増やさないといけないからな
2017/09/29(金) 18:58:48.01ID:P52gO+TE
>>859の結果
http://www.unicode.org/wg2/docs/n4903-ProcessAdHocReport.pdf

shouldなんで表現としては弱めな気もするけど、UTC議長のLisa Mooreも
同席してるから今後はUTCも好き勝手にはできないかも
2017/09/30(土) 02:49:12.29ID:R0O9XLNW
Adobeは新グリフセットAdobe-KRを作ることにした模様
いつになったらAJ1-7に取り掛かるんだ…
2017/10/01(日) 23:26:06.97ID:0lGqZVhk
>>869
そもそも顔絵文字なんかは表情を記号化したものであって特定の人種を表現したものではない
差別がなかったところにあえて差別を持ち込んで差別をなくす方法論を議論する事自体おかしい

特定の人種の特徴を持たせたいなら書体と同様にフォントなどでフォローすべき
2017/10/02(月) 02:39:27.88ID:791wgfKq
レゴも昔はそういう感じで全部黄色い人だったけど、
いつの間にかリアル人種に合わせた色がたくさん出るようになってしまった
2017/10/04(水) 22:07:29.50ID:VRsAqAhr
世相を反映するUnicode
2017/10/05(木) 08:20:09.15ID:puXRBXzi
>>872
フェイスマーク系が全部黒人の絵文字のフォントがあったとしても仕様満たしてるしな
そのうち「絵文字では皮膚色選べるんだから通常文字に文字色選択子が必要」っていう逆の発想が出てきそう
2017/10/06(金) 21:44:06.11ID:EeCF6Ukp
なぜかPDAM2.2(n4904)から小書き"こ"が消えてるなあと思ったら
どうも日本NBが小書きのかな全般に文句つけたのが原因みたい(n4871)

調査するから一旦投票から外してほしいってことらしいが、コードポイントが
五十音順になるようreserveされてるんだから、順次追加していくのでも
問題ないだろうに日本NBは何が不満なんだか
2017/10/06(金) 23:21:55.38ID:FuaeRY5L
場合によってはそもそも作ってほしくないんじゃないの
2017/10/07(土) 20:47:59.42ID:8fNRGep5
Amazonによるミニスーファミキャンセル騒動 - Togetterまとめ
https://togetter.com/li/1158390

豪快に文字化けワラタ
罫線ぽいのが混ざってるからCP437かな?
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況