文字コード総合スレ Part10 [転載禁止]©2ch.net

レス数が950を超えています。1000を超えると書き込みができなくなります。
1デフォルトの名無しさん
垢版 |
2015/10/14(水) 20:29:00.08ID:xctG4AAd
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
2017/09/30(土) 02:49:12.29ID:R0O9XLNW
Adobeは新グリフセットAdobe-KRを作ることにした模様
いつになったらAJ1-7に取り掛かるんだ…
2017/10/01(日) 23:26:06.97ID:0lGqZVhk
>>869
そもそも顔絵文字なんかは表情を記号化したものであって特定の人種を表現したものではない
差別がなかったところにあえて差別を持ち込んで差別をなくす方法論を議論する事自体おかしい

特定の人種の特徴を持たせたいなら書体と同様にフォントなどでフォローすべき
2017/10/02(月) 02:39:27.88ID:791wgfKq
レゴも昔はそういう感じで全部黄色い人だったけど、
いつの間にかリアル人種に合わせた色がたくさん出るようになってしまった
2017/10/04(水) 22:07:29.50ID:VRsAqAhr
世相を反映するUnicode
2017/10/05(木) 08:20:09.15ID:puXRBXzi
>>872
フェイスマーク系が全部黒人の絵文字のフォントがあったとしても仕様満たしてるしな
そのうち「絵文字では皮膚色選べるんだから通常文字に文字色選択子が必要」っていう逆の発想が出てきそう
2017/10/06(金) 21:44:06.11ID:EeCF6Ukp
なぜかPDAM2.2(n4904)から小書き"こ"が消えてるなあと思ったら
どうも日本NBが小書きのかな全般に文句つけたのが原因みたい(n4871)

調査するから一旦投票から外してほしいってことらしいが、コードポイントが
五十音順になるようreserveされてるんだから、順次追加していくのでも
問題ないだろうに日本NBは何が不満なんだか
2017/10/06(金) 23:21:55.38ID:FuaeRY5L
場合によってはそもそも作ってほしくないんじゃないの
2017/10/07(土) 20:47:59.42ID:8fNRGep5
Amazonによるミニスーファミキャンセル騒動 - Togetterまとめ
https://togetter.com/li/1158390

豪快に文字化けワラタ
罫線ぽいのが混ざってるからCP437かな?
879デフォルトの名無しさん
垢版 |
2017/10/08(日) 21:40:08.74ID:BAjE4UNz
ガセかと思ったけどマジなんか
なんで誰も気付かなかったし
2017/10/13(金) 23:48:07.78ID:K2R51jFQ
伝票番号に予め配達の営業所までのデータ入っててバーコード読めりゃ営業所までスルーって事かな

>>878
これ勝手に転載してるんだろうがデコードできりゃ問題だよなあ…
2017/10/14(土) 10:57:44.21ID:RYv3j8m+
ISO 10646:2014って開発失敗したんか?
もう出ないよな?
2017/10/14(土) 14:53:48.95ID:TG6KQnkb
>>880
>デコード
たしかに
やってみてくれ
2017/10/15(日) 20:24:02.01ID:wfF3NLsX
>>881
Publication date : 2017-07

ってなってるんだし規格は完成してるのでは
サイトの更新が遅いだけじゃないの?
2017/10/18(水) 00:36:08.65ID:XwII08/d
2014出てるよ
http://standards.iso.org/ittf/PubliclyAvailableStandards/index.html
http://www.iso.org/standard/63182.html

もしdkuugが更新されていないことを見て言ってるならそこはもう放棄されてる
2017/10/24(火) 14:09:16.76ID:Jp5ETl7F
俺たちのEMOJIの実力を思い知れ

https://twitter.com/lavrton/status/922630292052967424
2017/10/24(火) 20:04:59.52ID:i5hhptUR
何で親子2人ずつの核家族なんだ
地域によっては大家族のサポートも求められるが
組み合わせ違いのグリフ全部作っていくのは天文学的になりそう
2017/10/25(水) 18:01:51.97ID:TxCrr8Dz
絵文字じゃなくて絵と解釈してるから混乱する
そういう奴らからのツッコミポイントなくした絵文字作ればいいけど、現状は屈してバリエーション作っちゃうんだよな
888デフォルトの名無しさん
垢版 |
2017/10/25(水) 18:14:16.54ID:NxsNik2t
頭悪そう
2017/10/25(水) 18:14:50.88ID:byKDMVHo
だって例示図形が絵なんだもん

絵ではないと考えてほしかったのなら例示図形をもっと抽象的にするか、
あるいは例示さえせずに (マンガのようなおおげさなウンコ) みたいに言語表現にするべきだったな
2017/10/25(水) 18:41:48.33ID:sAsgJLsM
カラーの時点で絵ではないは無理がある
絵ではないなら色は他のテキスト同様にテキストカラー使えよ
2017/10/30(月) 18:00:33.61ID:ZnP3Ol2c
>>890
カラーは実装依存だぞ
基本は白黒
2017/10/30(月) 18:57:12.83ID:KZpAr8Yx
>>891
色指定IVSはなんなんだ
2017/10/31(火) 12:58:58.32ID:KJARTkQB
色というより肌色(=人種)のセレクタじゃないの?
2017/10/31(火) 14:17:24.66ID:MybAfan2
EMOJIはどこに向かおうとしているのか

How Do You Like Your Burger Emoji?
https://blog.emojipedia.org/how-do-you-like-your-burger-emoji/
2017/11/02(木) 00:11:17.70ID:BZDz7XTE
具オーダーセレクターが誕生するフラグか
2017/11/02(木) 04:52:42.22ID:S5CQdMtg
人工乳房の形成に常滑焼の鋳型が新技術に貢献(NHK)
2017/11/02(木) 22:59:50.35ID:4h9B4mO8
ハンバーガーオーダーセレクタに使えそうなのは
U+1F345 TOMATO
U+1F952 CUCUMBER (PICKLE)
くらい?
最低でもバンズ、ハンバーグ、チーズ、レタスは登録しないとな。
2017/11/03(金) 01:17:50.06ID:6SzVRupm
フライドポテトとスマイルはすでに単独でオーダーできるな
2017/11/03(金) 16:09:36.09ID:rOBRj+Zt
一部以外、元々人種・ジェンダーレスの文字だったのに声の大きい人達のせいで見せかけの平等を捻じ込まれてホント嫌悪感しかないわ
900デフォルトの名無しさん
垢版 |
2017/11/03(金) 20:20:46.51ID:HuwGCmuD
うむ
2017/11/04(土) 16:12:16.61ID:hsDfLASV
>>899
そうやって仕様がめちゃくちゃになっていくんだろうな
2017/11/04(土) 21:28:22.44ID:NJtYjjHJ
そもそも今までどこにも使われていなかった「文字」を創り始めた時点でもう
2017/11/06(月) 08:58:06.05ID:jmQIkdel
Google makes the "Android Burger" a reality for its employees
https://www.neowin.net/news/google-makes-the-android-burger-a-reality-for-its-employees
2017/11/06(月) 16:14:18.07ID:Oz+5QplX
現実のほうで辻褄を合わせていくスタイル
2017/11/08(水) 21:11:00.50ID:OtipW7Ea
うんこ絵文字追加提案に異議あり
https://srad.jp/story/17/11/08/0528217/
2017/11/08(水) 21:44:31.71ID:7S3fHwbe
それよりも1F3E2 OFFICE BUILDINGとZWJでつなげてSHITAMACHIを表現したい
2017/11/08(水) 23:35:22.51ID:3K3ujviI
uncode
2017/11/09(木) 09:24:07.69ID:UInw5/Yz
これを貼れと言われた気がするので
ttp://cdn-ak.f.st-hatena.com/images/fotolife/n/noir555/20120325/20120325193503.jpg
2017/11/09(木) 21:26:42.48ID:p3pQfTpt
方角からして裏のマンションはうんこに日が沈むのか
2017/11/11(土) 10:21:56.51ID:6gNjPSTt
すばらしい
911デフォルトの名無しさん
垢版 |
2017/11/12(日) 01:32:45.14ID:H7C5gFJ5
>>908
浅草だよね?
しかも左から2つ目は墨田タワーか?
そういう位置関係なのか。
2017/11/12(日) 08:41:00.21ID:e5xLDhIK
全てがウンコ色に輝いている。
すばらしい。
2017/11/14(火) 20:01:47.04ID:rcEwUB0d
こんじきうんこ
914デフォルトの名無しさん
垢版 |
2017/11/22(水) 16:48:22.55ID:g+mfhWNq
Unicode 10.0 の仕様読んでて思ったんだけど
Core Specification のCJK統合漢字の数字、間違ってない?

20,902+69+6,582+42,711+4,149+222+5,762+7,473+1,014
= 88,884

にしかならないんだけど……。
仕様の合計↓では 88,932 らしいんだが。その差48、何だそれ。


The Unicode® Standard
Version 10.0 – Core Specification
Appendix D
Version History of the Standard

http://www.unicode.org/versions/Unicode10.0.0/appD.pdf#page=6
2017/11/22(水) 16:52:42.86ID:TZAtmSaI
win10
IME で 「こっき」 って変換すると
☪☭☫✡
日の丸出てこないぞ
2017/11/22(水) 17:44:22.62ID:gB9u/pWI
ってかその4つこっきか?
2017/11/23(木) 10:17:38.60ID:h7MW0ffb
>>915
IME捨てろ
2017/11/23(木) 12:20:50.57ID:eO5S+uX/
>>916
トルコ、ソ連、イラン、イスラエルか?
2017/11/23(木) 22:58:49.58ID:stYe0Oux
ISO/IEC 10646 - Information technology -- Universal Coded Character Set (UCS)
https://www.iso.org/standard/69119.html

Publication date : 2017-12

Number of pages : 2693

に更新されてた。
2017/11/24(金) 00:48:54.85ID:O5myFoBo
>>918
●●●★
日本、パラオ、バングラ、越南
2017/11/25(土) 15:25:35.45ID:unmm6CwQ
チョンも入れたれ
2017/11/27(月) 00:57:53.51ID:NURIqS8t
>>921
おまえは他所行ってな
2017/11/29(水) 14:53:47.04ID:UhXC0KGu
Googleのハンバーガー絵文字、Android 8.1でチーズの位置を修正
http://www.itmedia.co.jp/news/articles/1711/29/news078.html
2017/11/29(水) 23:06:09.33ID:CvPoQMbr
🍔食べたい
2017/11/29(水) 23:54:56.29ID:tk9E5aVC
なんで最近はハンバーガー押したらメニューが出てくるんだ

メニューから注文するんだから順序が逆じゃないか
2017/12/06(水) 08:48:45.84ID:6rXadv4l
ユニコードコンソーシアム、来年に追加予定の新しい絵文字の最新の候補リストを公開
ttps://taisy0.com/2017/12/06/89650.html
2017/12/06(水) 10:23:15.11ID:LlbO+WJR
もういいっ、もう休めっ
2017/12/06(水) 14:03:58.50ID:TJabUNNS
昔はUnicodeへの絵文字導入はガラパゴス国のデンワへの後方互換性のため仕方なくやってくれたんだと思ってました

ほんとは自分のおもちゃがほしかったんですね…
929デフォルトの名無しさん
垢版 |
2017/12/06(水) 17:30:16.47ID:oBvdSzU/
これはひどい
2017/12/07(木) 05:23:32.91ID:4IlO+z0O
もう認識が絵文字じゃなくて絵だよね
2017/12/07(木) 08:08:48.43ID:jxDfrp/1
悲しいウンチは候補リストからはずされたのか。
2017/12/07(木) 14:11:28.75ID:U5wmuQTN
ある意味今の状況を一番表している絵だったのに
2017/12/08(金) 13:03:34.59ID:0lzANth5
ホント糞だな
934デフォルトの名無しさん
垢版 |
2017/12/08(金) 13:40:05.51ID:6WtIjESa
>>931-932
他の物を通すための囮だったかもな
2017/12/15(金) 12:23:55.99ID:Mjdx4Jdk
No20のカップケーキがだいぶうんち
2017/12/21(木) 22:04:29.07ID:Pje/kUoS
ISO/IEC 10646:2017 - Information technology -- Universal Coded Character Set (UCS)
https://www.iso.org/standard/69119.html

やっと Published になった。
最初2016だったのが2017になったけど2018になるのはギリギリ避けられたか。
2017/12/22(金) 15:14:29.35ID:exw3lv6k
Android民「iPhone民から♂♀とか性別のアピールが送られてくるのはなぜ?」「流行りかと思った」
https://togetter.com/li/1182276
2017/12/22(金) 16:48:24.80ID:5h4hYzog
L2/17-429
Request to reserve the code point for square Japanese new era name (SC2 N4577)
Japan NB
2017-12-18
http://www.unicode.org/L2/L2017/17429-sc2-n4577-japan-new-era.pdf

"We noticed some legacy solutions still only support BMP."が泣ける。
939デフォルトの名無しさん
垢版 |
2017/12/23(土) 00:06:09.91ID:fYRtLYYp
https://twitter.com/luka_tarot/status/943831841420713984
 仕事関係の方からのメール、時々うんこマークの絵文字(これ→💩)が付いてくるので1年くらいモヤモヤしてやました。
 今日初めてググってみたら、DOCOMOからSOFT BANKにメールを送ると、音符マークがうんこに変換されるようです…‼
 ︎ DOCOMOの方、音符の絵文字にはくれぐれもご注意くださいね
2017/12/23(土) 17:51:33.27ID:tY6TFHQG
禿の嫌がらせωω
2017/12/24(日) 20:51:23.00ID:fAY4pJin
コンピューターで全漢字使用可に 6万字コード化
https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html
2017/12/24(日) 21:03:24.97ID:czMQ2Cnw
文字情報基盤の追加IVD登録と変体仮名の入った10646が出たことをもって
「完了した」ってことかな
2017/12/24(日) 22:27:08.09ID:G1OevDef
つちよしって2001年のCJK統合漢字拡張Bから使えるのでは……(U+20BB7)
Jソースが無いから日本の漢字じゃないとかそういう話?
2017/12/25(月) 14:28:26.87ID:vAchG11E
マスゴミ記者が間に入ると情報が可笑しくなる例
2017/12/25(月) 16:08:58.35ID:PLr6J7k5
プレス発表 「文字情報基盤整備事業」で推進していた漢字6万文字の国際規格化が完了:IPA 独立行政法人 情報処理推進機構
https://www.ipa.go.jp/about/press/20171225.html

>>941のIPA発表
2017/12/25(月) 16:39:31.09ID:od7irzxW
マイナ開始する前に完了させとけよ
2017/12/25(月) 21:26:50.34ID:bsx5SElH
PCで扱える漢字 6万文字に
http://www.itmedia.co.jp/news/articles/1712/25/news071.html
2017/12/25(月) 22:01:22.03ID:QOFkYfoX
itmediaのこの見出しはアウトだな
2017/12/26(火) 06:17:01.01ID:HWfT7fYR
>>942
それを知らない人に伝えるにはこう言うしかないかもね
2017/12/27(水) 15:43:36.55ID:RCW7nLI3
サヨク並みにアホ
2017/12/27(水) 18:58:01.47ID:pTOpkpNU
>>937
人の絵文字+ZWJ+性別

形式にしたのは対応してない環境でも最低限の意味は伝えられるだろうという配慮なのかね?
これ見る限り全く理解されてないのが悲しいが
2017/12/27(水) 21:38:26.15ID:K+2IikmJ
>>951
勝手に誤解して悲しがってるあなたのほうが悲しいが
2017/12/28(木) 00:39:28.23ID:ieNYico0
存在自体が見えないZWJじゃなくて
非対応の組み合わせでは+マークを表示するルールの新結合文字作ったほうがよかったんじゃないかね
954デフォルトの名無しさん
垢版 |
2017/12/30(土) 18:56:44.40ID:Ugth+Qnu
漢字6万字て、馬鹿か。
取るに足りない些細な違いをもって同じ文字と認めない。
最う駄目だ。
2017/12/30(土) 23:54:24.56ID:8RkbD7fK
>945
まあ、異字体を丹念に拾ってくれるのはありがたいけれど、
漢文をTeXで扱う場合に、Adobe Japan 1-5(20313字)にない
文字が時々出てくる(例えば『列子』など)時など、IPAMJに
その文字があると、助かる。
出来れば、中国の古典籍に出てくる文字を積極的に
IPAMJに収録するようにしてもらいたいとおもっている。

もっとも、戸籍用の文字を収録することは、行政上から
いえば、最優先事項であることは理解できるのだが。
2017/12/31(日) 10:25:58.42ID:rHg6Qc+M
超漢字で17万文字
2017/12/31(日) 10:27:32.66ID:hZnZn3Kf
>>954
>取るに足りない些細な違いをもって同じ文字と認めない

その手の議論はCJK統合漢字の時に散々やったんじゃないの?
2017/12/31(日) 11:52:08.16ID:KA+WHx0L
やったから、なに?
2017/12/31(日) 11:54:37.82ID:BxTIUPKK
>956
「超漢字」というのは東大で開発したGTフォントなのですが、
ただ、いかんせん。フォントが綺麗でないので、
例えば本文を「ヒラギノ」や「小塚明朝」で組んだ時に
GTフォントを入れると、かなり違和感を感じるので、
現在は、Adobe Japan 1-5やIPAMJにない字は、
Adobe Illustratorで作字している
2018/01/01(月) 13:59:19.71ID:Yzi7nKjn
テキストエンコードに詳しい方、教えてください


下記リンクは日本語サイトの日本語テキストファイルですが
「ファイル名」が文字化けして文字コードが不明です(ファイルの本文は Shift_JIS でした)
「正しいファイル名」および「ファイル名の言語」(外国語?)が分かれば教えてください

また言語不明のファイル名を簡単に判別する方法があれば教えてください

http://www.monzen.org/doc/fonts/free/all/%e3%81%a6%e3%81%82%e3%81%a8%e3%82%8b%ef%bc%91%ef%bc%96/%e9-%e9%e1%e9%e3%e9%da%e9P%e9U.TTF%e9+%e9-%e9%f3%e9-.txt
2018/01/01(月) 23:24:57.94ID:x9zbFP4w
明けましておめでとうございます
2018年の文字コード業界はどうなるやら(去年の使い回し)
2018/01/02(火) 12:20:49.37ID:Y/4ObyK1
>>960
て: e381a6
あ: e38182
と: e381a8
る: e3828b
1: efbc91
6: efbc96
/より後半は知らん
2018/01/02(火) 12:36:54.34ID:Y/4ObyK1
http://www.monzen.org/doc/fonts/free/all/てあとる16/
ここの中身見たけどファイルが5個あって

1)てあとる16/てあとる16.TTFについて.txt
2)てあとる16/てあとる16.TTF
3)てあとる16/(化けてる).TTF(化けてる).txt
4)てあとる16/(化けてる)16.TTF
5)てあとる16/Theatres16.zip

たぶん (3) をダウンロードしたんだと思うけど
zip の中をみると (1) と (2) しかないから
サイズも同じだし (1)-(3) と (2)-(4) は同じ名前(文字列)なんだろうね
2018/01/02(火) 12:49:17.66ID:Y/4ObyK1
コード見ると

てあとる: e92de9e1e9e3e9da
16: e950e955
について: e92be92de9f3e92d

なんだろうけど
e92d が「て」だけじゃなくて「つ」と思われる部分にも使われてるのが謎
2018/01/02(火) 13:15:02.16ID:Y/4ObyK1
あとは「てあとる」をどっかの言語のコードページとかで適当に変換してみて「e92de9e1e9e3e9da」のバイト純になるものを探せ
http://docs.python.jp/3/library/codecs.html#standard-encodings
2018/01/02(火) 22:57:59.20ID:5gV1mnpW
「16」の部分がE950 E955なのはShift_JISから来たのかなと思うけど(Shift_JISでは8250 8255)
「てあとる」「について」は謎だな
2018/01/03(水) 04:10:39.66ID:v5sFvWN4
>>962-966
レスありがとうございます>>960です

「てあとる16」というフリーフォントをググってこのURLに辿り着いたのですが
Firefoxのエンコード設定をいくら弄っても正規ファイル名がわからなかったので質問させていただきました

わざわざファイル名を変えてアップしてるということは何らかの意図があると思うのですが
中国語や韓国語でもなさそうだしUnicodeでも化けるので・・・ MacとWindowsを行き来して化けたとか?

管理者さんに聞くのが近道だと思いますがディレクトリ勝手に掘ったとか怒られても嫌なので放置しています
2018/01/03(水) 12:59:16.54ID:j114ZuXB
(>>967の続き)
あと素人臭い質問ですいませんが、下記テキストファイルをWindows環境で表示する方法はありますか?
同ディレクトリにあるotf(お試しフォント)はDLできるのですがテキストファイル3個は表示もDLもできませんでした

http://www.monzen.org/doc/fonts/free.next/%e3%83%a2%e3%83%88%e3%83%a4%e3%81%8a%e8%a9%a6%e3%81%97/UD%e3%83%a2%e3%83%88%e3%83%a4%e6%98%8e%e6%9c%9d2B/ntnum2bmst/%e6%96%87%e5%ad%97%e7%a8%ae%e4%b8%80%e8%a6%a7.txt
2018/01/04(木) 01:19:32.08ID:gDBGL8Zs
欧文環境かなんかで文字化けしたままzipばらしたっぽいな
2018/01/04(木) 01:35:20.16ID:1mKOov/G
>>968
403 Forbiddenが返ってきてるから、おそらくパーミッションの問題でWebサーバが
そのファイルを読み出せない
2018/01/04(木) 09:46:56.03ID:GKignaEj
>>969-970
ありがとうございます
TXTのみDLできない設定なのですね
レス数が950を超えています。1000を超えると書き込みができなくなります。
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況