文字コード総合スレ Part10 [転載禁止]©2ch.net
レス数が950を超えています。1000を超えると書き込みができなくなります。
何で親子2人ずつの核家族なんだ
地域によっては大家族のサポートも求められるが
組み合わせ違いのグリフ全部作っていくのは天文学的になりそう 絵文字じゃなくて絵と解釈してるから混乱する
そういう奴らからのツッコミポイントなくした絵文字作ればいいけど、現状は屈してバリエーション作っちゃうんだよな だって例示図形が絵なんだもん
絵ではないと考えてほしかったのなら例示図形をもっと抽象的にするか、
あるいは例示さえせずに (マンガのようなおおげさなウンコ) みたいに言語表現にするべきだったな カラーの時点で絵ではないは無理がある
絵ではないなら色は他のテキスト同様にテキストカラー使えよ 人工乳房の形成に常滑焼の鋳型が新技術に貢献(NHK) ハンバーガーオーダーセレクタに使えそうなのは
U+1F345 TOMATO
U+1F952 CUCUMBER (PICKLE)
くらい?
最低でもバンズ、ハンバーグ、チーズ、レタスは登録しないとな。 フライドポテトとスマイルはすでに単独でオーダーできるな 一部以外、元々人種・ジェンダーレスの文字だったのに声の大きい人達のせいで見せかけの平等を捻じ込まれてホント嫌悪感しかないわ >>899
そうやって仕様がめちゃくちゃになっていくんだろうな そもそも今までどこにも使われていなかった「文字」を創り始めた時点でもう それよりも1F3E2 OFFICE BUILDINGとZWJでつなげてSHITAMACHIを表現したい これを貼れと言われた気がするので
ttp://cdn-ak.f.st-hatena.com/images/fotolife/n/noir555/20120325/20120325193503.jpg >>908
浅草だよね?
しかも左から2つ目は墨田タワーか?
そういう位置関係なのか。 Unicode 10.0 の仕様読んでて思ったんだけど
Core Specification のCJK統合漢字の数字、間違ってない?
20,902+69+6,582+42,711+4,149+222+5,762+7,473+1,014
= 88,884
にしかならないんだけど……。
仕様の合計↓では 88,932 らしいんだが。その差48、何だそれ。
The Unicode® Standard
Version 10.0 – Core Specification
Appendix D
Version History of the Standard
http://www.unicode.org/versions/Unicode10.0.0/appD.pdf#page=6 win10
IME で 「こっき」 って変換すると
☪☭☫✡
日の丸出てこないぞ ISO/IEC 10646 - Information technology -- Universal Coded Character Set (UCS)
https://www.iso.org/standard/69119.html
Publication date : 2017-12
Number of pages : 2693
に更新されてた。 >>918
●●●★
日本、パラオ、バングラ、越南 なんで最近はハンバーガー押したらメニューが出てくるんだ
メニューから注文するんだから順序が逆じゃないか ユニコードコンソーシアム、来年に追加予定の新しい絵文字の最新の候補リストを公開
ttps://taisy0.com/2017/12/06/89650.html 昔はUnicodeへの絵文字導入はガラパゴス国のデンワへの後方互換性のため仕方なくやってくれたんだと思ってました
ほんとは自分のおもちゃがほしかったんですね… >>931-932
他の物を通すための囮だったかもな ISO/IEC 10646:2017 - Information technology -- Universal Coded Character Set (UCS)
https://www.iso.org/standard/69119.html
やっと Published になった。
最初2016だったのが2017になったけど2018になるのはギリギリ避けられたか。 Android民「iPhone民から♂♀とか性別のアピールが送られてくるのはなぜ?」「流行りかと思った」
https://togetter.com/li/1182276 L2/17-429
Request to reserve the code point for square Japanese new era name (SC2 N4577)
Japan NB
2017-12-18
http://www.unicode.org/L2/L2017/17429-sc2-n4577-japan-new-era.pdf
"We noticed some legacy solutions still only support BMP."が泣ける。 https://twitter.com/luka_tarot/status/943831841420713984
仕事関係の方からのメール、時々うんこマークの絵文字(これ→💩)が付いてくるので1年くらいモヤモヤしてやました。
今日初めてググってみたら、DOCOMOからSOFT BANKにメールを送ると、音符マークがうんこに変換されるようです…‼
︎ DOCOMOの方、音符の絵文字にはくれぐれもご注意くださいね 文字情報基盤の追加IVD登録と変体仮名の入った10646が出たことをもって
「完了した」ってことかな つちよしって2001年のCJK統合漢字拡張Bから使えるのでは……(U+20BB7)
Jソースが無いから日本の漢字じゃないとかそういう話? プレス発表 「文字情報基盤整備事業」で推進していた漢字6万文字の国際規格化が完了:IPA 独立行政法人 情報処理推進機構
https://www.ipa.go.jp/about/press/20171225.html
>>941のIPA発表 >>942
それを知らない人に伝えるにはこう言うしかないかもね >>937
人の絵文字+ZWJ+性別
形式にしたのは対応してない環境でも最低限の意味は伝えられるだろうという配慮なのかね?
これ見る限り全く理解されてないのが悲しいが >>951
勝手に誤解して悲しがってるあなたのほうが悲しいが 存在自体が見えないZWJじゃなくて
非対応の組み合わせでは+マークを表示するルールの新結合文字作ったほうがよかったんじゃないかね 漢字6万字て、馬鹿か。
取るに足りない些細な違いをもって同じ文字と認めない。
最う駄目だ。 >945
まあ、異字体を丹念に拾ってくれるのはありがたいけれど、
漢文をTeXで扱う場合に、Adobe Japan 1-5(20313字)にない
文字が時々出てくる(例えば『列子』など)時など、IPAMJに
その文字があると、助かる。
出来れば、中国の古典籍に出てくる文字を積極的に
IPAMJに収録するようにしてもらいたいとおもっている。
もっとも、戸籍用の文字を収録することは、行政上から
いえば、最優先事項であることは理解できるのだが。 >>954
>取るに足りない些細な違いをもって同じ文字と認めない
その手の議論はCJK統合漢字の時に散々やったんじゃないの? >956
「超漢字」というのは東大で開発したGTフォントなのですが、
ただ、いかんせん。フォントが綺麗でないので、
例えば本文を「ヒラギノ」や「小塚明朝」で組んだ時に
GTフォントを入れると、かなり違和感を感じるので、
現在は、Adobe Japan 1-5やIPAMJにない字は、
Adobe Illustratorで作字している テキストエンコードに詳しい方、教えてください
下記リンクは日本語サイトの日本語テキストファイルですが
「ファイル名」が文字化けして文字コードが不明です(ファイルの本文は Shift_JIS でした)
「正しいファイル名」および「ファイル名の言語」(外国語?)が分かれば教えてください
また言語不明のファイル名を簡単に判別する方法があれば教えてください
http://www.monzen.org/doc/fonts/free/all/%e3%81%a6%e3%81%82%e3%81%a8%e3%82%8b%ef%bc%91%ef%bc%96/%e9-%e9%e1%e9%e3%e9%da%e9P%e9U.TTF%e9+%e9-%e9%f3%e9-.txt 明けましておめでとうございます
2018年の文字コード業界はどうなるやら(去年の使い回し) >>960
て: e381a6
あ: e38182
と: e381a8
る: e3828b
1: efbc91
6: efbc96
/より後半は知らん http://www.monzen.org/doc/fonts/free/all/てあとる16/
ここの中身見たけどファイルが5個あって
1)てあとる16/てあとる16.TTFについて.txt
2)てあとる16/てあとる16.TTF
3)てあとる16/(化けてる).TTF(化けてる).txt
4)てあとる16/(化けてる)16.TTF
5)てあとる16/Theatres16.zip
たぶん (3) をダウンロードしたんだと思うけど
zip の中をみると (1) と (2) しかないから
サイズも同じだし (1)-(3) と (2)-(4) は同じ名前(文字列)なんだろうね コード見ると
てあとる: e92de9e1e9e3e9da
16: e950e955
について: e92be92de9f3e92d
なんだろうけど
e92d が「て」だけじゃなくて「つ」と思われる部分にも使われてるのが謎 あとは「てあとる」をどっかの言語のコードページとかで適当に変換してみて「e92de9e1e9e3e9da」のバイト純になるものを探せ
http://docs.python.jp/3/library/codecs.html#standard-encodings 「16」の部分がE950 E955なのはShift_JISから来たのかなと思うけど(Shift_JISでは8250 8255)
「てあとる」「について」は謎だな >>962-966
レスありがとうございます>>960です
「てあとる16」というフリーフォントをググってこのURLに辿り着いたのですが
Firefoxのエンコード設定をいくら弄っても正規ファイル名がわからなかったので質問させていただきました
わざわざファイル名を変えてアップしてるということは何らかの意図があると思うのですが
中国語や韓国語でもなさそうだしUnicodeでも化けるので・・・ MacとWindowsを行き来して化けたとか?
管理者さんに聞くのが近道だと思いますがディレクトリ勝手に掘ったとか怒られても嫌なので放置しています 欧文環境かなんかで文字化けしたままzipばらしたっぽいな >>968
403 Forbiddenが返ってきてるから、おそらくパーミッションの問題でWebサーバが
そのファイルを読み出せない >>969-970
ありがとうございます
TXTのみDLできない設定なのですね >>967
元はShift_JISで書かれたサイトっぽいけど「webサーバー側」の文字コード設定が間違ってて
HTMLとしてすでに正しくない文字コードというかバイト列が出力されてしまってる感じで
さらにfirefoxが文字コード検出を間違ったまま表示してる感じがする
ちなみに文字化けしたままでもfirefoxでマウスオーバーしたときに左下に出て来る日本語はたまに正常たったりする
文字化けにも色々あるけど文字通り壊れたバイト列だともうどうしようもない >>968
サーバー側の設定が間違ってると間違った文字コードでリクエストしてファイルは存在してても
違うバイト列だからファイルシステム上に見つからないとかいう状態になってそうなので
あとはだめもとでHTML側のURLを使わずに
判ってる方のファイル名
www.monzen.org/doc/fonts/free.next/モトヤお試し/UDモトヤ明朝2B/ntnum2bmst/文字種一覧.txt
を自分でURLエンコードしてリクエストしてみるとか 上の階層のntnum2bmst.zipなら落とせた。 >>972-974
ありがとうございます
該当のテキストがどうしても読みたいというよりも
<何故こういう現象が起きてるのか?>のほうに興味があって質問させていただきました
文字コードの世界って本当に奥が深いですね
文字フォントについても色々疑問があるのですが、それはフォントスレで質問するべきですね
(PCにインストールしていいフォント数の上限とか) 無理やり読ませるとそれなりの割合の人間に急性ショック症状を起こすスレでもある・・・ 40cmくらいのウンコード出た
長過ぎて一回で流れなかった
5回目くらいでやっと視界から消えた 【しつもん@A】
@Windowsで同一フォルダ内に全く同じファイル名+拡張子があって不審に思い
ファイル名をメモ帳にコピペしても瓜二つ
でもWordにコピペすると片方は「ジ」や「ペ」の後ろに空白文字が出てくる
Aニコニコ動画をDLしてるとたまに「グ」が「ク_ 」に文字化けする
@Aの発生原因は分りますか? (どれもネットから落としたファイルです) Wordを持ってるならその空白文字の後ろでAlt+Xしてみ
そしたら文字コードに変換されるから何がついてるか分かる >>983 ありがトン
@「ジ 」が「シ3099」に変わった
A「ク_ 」が「ク005F」に変わった
@は↓の「Unicode正規化」ってやつですかね? Aは分らないけど
http://tech.albert2005.co.jp/501/ レス数が950を超えています。1000を超えると書き込みができなくなります。