文字コード総合スレ Part10 [転載禁止]©2ch.net

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2015/10/14(水) 20:29:00.08ID:xctG4AAd
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
2017/02/22(水) 18:49:19.58ID:/iBgHjnm
>>679
絵と絵文字は別物やで
2017/02/22(水) 21:52:33.48ID:h5L2bR5S
>>682


言わんとすることがわからないけど、
基準があれば>>678みたいな場合に難しい判断しなくてすむでしょ?
2017/02/22(水) 22:31:09.15ID:j43AF9m9
もう憲法とか国境の位置もJIS規格で管理しちゃえよ
685デフォルトの名無しさん
垢版 |
2017/02/23(木) 13:21:45.70ID:eG9NqkD/
>>680
知らなかった
ありがとう
2ちゃんもたまには役に勃つな
2017/02/23(木) 13:22:51.89ID:eG9NqkD/
>>681
自分でやれ
2017/02/23(木) 18:33:49.17ID:g/wbAq9q
>>683
仕様書読もうな
688デフォルトの名無しさん
垢版 |
2017/02/23(木) 19:43:12.70ID:lh6GP4kZ
🏳️‍🌈
🏴‍☠️
2017/02/23(木) 23:02:08.28ID:Mc4LemLc
>>687
どうもかみ合ってない気がする。
仕様できっちり規定されてれば楽だけどそういうものじゃないよね、
なら代わりになる典拠があれば楽なんだけどな、って話してたつもりなんだけど。
2017/03/02(木) 13:04:44.68ID:Dk3HQyow
仕様を読んだ上でそんなこと言ってるなら、読解力が足りないとしか言えないわ
2017/03/02(木) 15:42:40.27ID:fgh+r4bY
せっかく亀レスするならもうちょっと具体的に言えたほうがいいと思う
2017/03/03(金) 19:38:34.87ID:r16C7uTR
もういくつ寝るとunicode10
ゾンビとか吸血鬼とかせっそうなさすぎ
こんな絵文字使われるのかよ
2017/03/03(金) 22:57:47.99ID:m0VSWGlS
もう幾つ寝るとISO 10646発売
あと一週間ぐらいで出るだろきっと
694デフォルトの名無しさん
垢版 |
2017/03/04(土) 12:37:47.12ID:GRvQ2lmz
>>692
他にやることあるのにね
無能なんだろ
2017/03/04(土) 17:17:33.70ID:eGgxEr5u
すべての文字を収めるが目的のはずが
新しいアイコンを作ろうになってるからな
2017/03/04(土) 23:52:53.04ID:+pEijc2g
絵文字なんか作ったってフォントごとに微妙に変わるし不毛だよ
何種類用意したって満足ってことはないし、無駄な仕事が増えるだけ
それならむしろ、エンコードしたビットマップかベクタグラフィックを
文字列の途中に文字として挿入できるようにしたほうがマシだろ
2017/03/05(日) 00:03:46.99ID:xrJm/RDc
100種類用意しました
1000種類用意しました
10000種類用意しました
・・・
どこまでいってもこんなものは・・・
絵文字っていわゆるラインスタンプみたいな使われ方を想定しているんだろ?
すべてのラインスタンプに文字コードを割り振るみたいなものだ
時代に合ってない
文字列の途中にビットマップかベクタグラフィックを挟み込める方が絶対良いって
そうすると当然絵文字職人みたいな人たちが出てきてにぎわうだろうから
それをコピペして使えばよいのだ
標準化委員会みたいな中央で絵の形とコードを取り決めて・・・ってスタイルは時代遅れだよ
ラインスタンプを見ろよ
698デフォルトの名無しさん
垢版 |
2017/03/05(日) 23:06:39.70ID:nindsAFW
たしかに
特定のコードとそれに続く何byteかでbitmap図形っていうのはありかもね
無駄多いけど
2017/03/06(月) 08:18:41.33ID:n/Fv95sm
最近の追加は絵文字じゃなくて絵になってるからな
文字コードに色を定義したり芯のない継接ぎ仕様でやりたい放題だよな
2017/03/14(火) 14:00:09.20ID:+au4v4OR
Unicode 10、変体仮名と縦書きレイアウト導入へ | マイナビニュース
http://news.mynavi.jp/news/2017/03/13/110/
2017/03/15(水) 08:13:46.98ID:eV3tx5Ei
縦書きテキストレイアウトってまたおかしなことになってんな
変体仮名は文字情報基盤の範囲ならいいんじゃね
2017/03/15(水) 08:24:44.07ID:oPhy6OQw
縦書きレイアウトって前からあるこれのアップデートのことじゃないの?
http://www.unicode.org/reports/tr50/tr50-18.html#Modifications
「導入」ってのはその記事の誤認っぽい
2017/03/15(水) 11:37:12.40ID:7YWEdixI
|のカーニングがおかしいとか
2017/03/15(水) 15:48:49.66ID:tq6fONxP
「導入」ってのは

> さらに、Unicode Vertical Text Layoutが標準の一部として取り込まれる点が注目される。

って本文に書いてあるんだから Unicode® Technical Report が Unicode® Standard Annex に昇格して
Unicode® Standard の一部になるってことでしょ。
2017/03/28(火) 20:45:37.67ID:2V3Jlzjb
おう吐・ゾンビ・授乳などUnicodeに新しい絵文字69種類が追加される
http://gigazine.net/news/20170328-69-new-emojis-announced/
2017/03/28(火) 22:50:13.41ID:ky5+niZ/
こんだけ増えてくると幾らアホなアメリカ人でも
UTF-16捨てたくなってくるだろ
2017/03/29(水) 08:08:48.71ID:81RbfoHk
こういう流行り廃りのあるものはMarkdown emojiのようなやり方で十分だしそっちの方が
便利だと思うがなぁ。そもそも欧米の連中、Unicode入力のためにIMEとか導入してるんだろうか?
2017/03/29(水) 12:59:49.14ID:v2ySqvAX
イングランド、スコットランド、ウェールズは入れたのに北アイルランドは入れなかったのか
しかし U+1F3F4 U+E0067 U+E0062 U+E0065 U+E006E U+E0067 U+E007F を一つの国旗として処理しろってそれは
2017/03/29(水) 14:50:05.48ID:IUBNo9UW
ほらもうこれ、いったい何に使うのっていう
ラインスタンプと比べるともはや・・・
まるで社会主義国家のようだし
今の時代の速度感と全然合ってないんですけど
2017/03/29(水) 17:07:28.23ID:WAel0act
>>706
UTF-8ならいいの?
2017/03/29(水) 18:47:22.40ID:pMdWiHKE
>>710
そういう意味じゃないでしょ
Unicodeに政治を持ち込むなっていう
2017/03/29(水) 21:14:02.55ID:81RbfoHk
「emojiが使えないUTF-16はオワコン」て意味かと思った。
2017/03/30(木) 01:24:25.07ID:4z103Fgo
iOS 10.3リリース、ファイルシステムがHFS+からAPFSに変更される
https://apple.srad.jp/story/17/03/29/0852227/

Apple、Unicode正規化(もどき)やめるってよ
2017/03/30(木) 07:57:02.00ID:HGkR55tR
U+41 U+0307 U+0308と
U+41 U+0308 U+0307のファイルが同時に作成できるのかな
2017/03/31(金) 16:24:48.85ID:jxXitrEX
http://www.taishukan.co.jp/kokugo/webkoku/series003_03.html

Windowsと同じ「がが」というフォルダを4つ作れるようになるのか
2017/03/31(金) 18:39:57.95ID:cAvSJqfg
> 少なくとも検索に関しては、「ガ」と「ガ」を同じにみなす必要があり、
> <U+FF76 U+FF9E>とU+30ACと<U+30AB U+3099>とを、 全て同じだとみなす必要があるということでしょう。

安岡は何当たり前のこと言ってんだ
JIS信者のクセに慣れないUnicodeについて語るとこういった低レベルな恥ずかしい記事になる
2017/04/01(土) 22:40:22.15ID:7/71KzK1
濁点は独立したコードポイントを持っていても結合文字みたいなものだし、
U+30AB U+309B の場合も「ガ」と同じにみなすべきだろうね、検索の場合
2017/04/01(土) 23:09:58.41ID:LH/rwisT
Unicode(NFKD)的には
「ガ」=「ガ」≠「カ゛」=「カ ゙」
だな
2017/04/07(金) 00:08:24.84ID:qNFTJj2D
U+10FFFFまで埋めないと死んじゃう病にでもかかってるのかね、粗製濫造してんのは
2017/04/07(金) 16:00:25.62ID:3NFvJvaJ
まだ丸々10面分空いてるからな
2017/04/12(水) 14:45:57.95ID:jhOW+nqF
正規化が悪なんじゃなくて、正規化を表に出す事が悪なんだよ
パソコンを裸族で使う様なもんだ
素人にはオススメできない
2017/04/13(木) 18:03:47.78ID:TzW03HI9
>>719
困った病気だねぇ。
埋めずに空きをたくさん残しておいた方が未来の子孫に感謝されるぞ。


多分。
723デフォルトの名無しさん
垢版 |
2017/04/25(火) 06:30:16.64ID:DObvS+Kg
>>712
UTF-16で使えるじゃん?UCS-2と勘違いしてる?
2017/04/26(水) 12:16:19.33ID:im3ukcX1
そうじゃない
2017/05/11(木) 08:21:06.84ID:49ESVgQe
多言語制定で見えてきた課題を一挙に解決してUnicode Neueでも立ち上げたらいいのに
バグをバグのまま残さなきゃいけないなんて仕様として不健全すぎるわ
2017/05/11(木) 22:00:06.44ID:wyUnsmEB
何故ドイツ語
2017/05/17(水) 12:41:42.49ID:EJfTNRw9
フォントでよく使うからね
2017/05/20(土) 12:07:31.13ID:GVSnCE+6
ISO 10646って2月に発行フェーズ入ったのにまだ発行できてないのは
何やってんだ?
2017/05/24(水) 16:48:47.75ID:u+M8iI76
ISO/IECの仕事が遅いのはいつものこと
2017/05/26(金) 12:00:03.39ID:4g2o9CtM
Unicode の Core Specification の日本の元号の説明(日付)が間違ってるのはいつ修正されるんだろう?
2017/05/26(金) 17:54:06.19ID:RyqPFjFC
>>730
知らんが参考までに説明箇所を教えて
2017/05/26(金) 22:00:22.89ID:mIO9asAV
>>731
ttps://techracho.bpsinc.jp/chiba-junichi/2016_09_27/25490

他にもあるかもしれませんが、自分はこのページで初めて知りました。
733デフォルトの名無しさん
垢版 |
2017/05/27(土) 03:01:17.90ID:V3ffhZkY
>>730-732
TZを間違って読んでるだけでは?
2017/05/27(土) 03:15:47.09ID:hVyPua6a
ヒカル TV出演「年間5億は稼ぐ勢いですね」
https://www.youtube.com/watch?v=G7qL6ftpets
第1回案件王ランキング!YouTuberで1番稼いでるのは誰だ!
https://www.youtube.com/watch?v=asF2wQ2xhjY&;t=61s
ユーチューバーの儲けのカラクリを徹底検証!
https://www.youtube.com/watch?v=FUSb4erJSXE&;t=504s
YouTuberになりたいのは馬鹿じゃない!YouTuberになる方法
https://www.youtube.com/watch?v=Fr0WXXZRMSQ

最高月収5000万円だとさ。年収じゃなくて「月収」な
おまえらもyoutubeに動画投稿したほうがいい
最低2年はやらないとここまではいかないだろうけど才能とアイデアと
企画力と継続力があればが大儲けできる可能性がなくもない
まだまだ他の職種に比べれば競争率は低いからオススメ
2017/05/29(月) 19:03:28.51ID:K4hEGofc
>>733
そうじゃないけど、定義としてTZは付与すべきだね
2017/05/31(水) 17:05:54.16ID:uv8MtfX4
TZってちんちんズルムケの略?
737デフォルトの名無しさん
垢版 |
2017/06/01(木) 03:44:11.18ID:82KsO+uD
time zone
738デフォルトの名無しさん
垢版 |
2017/06/01(木) 11:37:45.12ID:o/dQD8LP
thin skin zone
2017/06/02(金) 21:34:26.48ID:Hl9pjX1u
TZはこれ
http://pix.iemoji.com/images/emoji/apple/ios-9/256/regional-indicator-symbol-letters-tz.png
2017/06/03(土) 09:51:38.32ID:LcU0sJDm
寒いからもういいよ
2017/06/04(日) 21:55:56.10ID:mjDwcbxw
正直旗イメージより「伊」「蘭」「仏」とかで表示してくれたほうがわかりやすい国もある
2017/06/09(金) 22:09:35.50ID:PK+Q1cYY
WG2 N4825によると1B130〜1B16FはSmall Kana Extensionにすることにしたらしい
でもreserved forなんてやるくらいなら、使用例があるものはとっとと入れちゃえばいいのに
2017/06/09(金) 22:31:03.58ID:7OSi6V+4
何に使えるのかな
ちっちゃいウンコが書けるようになるぐらいしか思いつかなかった
2017/06/10(土) 01:15:56.46ID:g45QxHo0
http://www.unicode.org/wg2/docs/n4825-pdam2chart.pdf#page=15
annotationは消さない方がいいんじゃないかな…
2017/06/11(日) 14:49:02.11ID:GyEdwZPX
URLが2ちゃんねるアートだと?
2017/06/21(水) 08:20:53.06ID:GaxJdSrE
Announcing The Unicode Standard, Version 10.0
http://blog.unicode.org/2017/06/announcing-unicode-standard-version-100.html
2017/06/21(水) 10:16:00.01ID:bqANLNSg
mage
まげ
2017/06/21(水) 12:15:04.06ID:GUHwFNed
もう月次のバージョンアップでいいからCore specificationとUCDの改版を分離してくれ
2017/06/21(水) 16:48:48.95ID:Rg8XGBQ1
Unicode 10.0出たのね
CodeCharts.pdfが100MB超えして落とすの&開くのだるい
2017/06/23(金) 14:19:48.92ID:xOTwvtKW
例示字形でフォント作ってくれないかね
とりあえず表示できればいいっていう場面は意外と多いと思うんだけど
751デフォルトの名無しさん
垢版 |
2017/06/23(金) 14:44:56.43ID:0OdP20aK
2byte+任意の8x64byteみたいなbitmap造ってくれないかな
2017/06/23(金) 18:53:47.09ID:m93LamaP
>>750
Noto Fontって全部カバーしてるんじゃないの?
2017/06/23(金) 22:22:21.49ID:JgWE6lrM
Googleはそのつもりなのかもしれないけど、実際にはカバーできてないよ
符号化済みの漢字だけで1フォントの収納限界グリフ数(65535)を超えちゃってるから
全部カバーしようと思ったら漢字フォントだけでも2つ以上に分けないといけない

それなのにNoto CJKは、PanCJKという思想で漢字だけじゃなく仮名やハングルまで
1フォントに押し込んでしまった
おかげでUnicode 10で符号化された変体仮名なんかも入れるスペースがない
2017/06/23(金) 23:32:51.59ID:vCpZUNAe
変体仮名がついにUnicodeに追加されたんだな。
戸籍名に変体仮名が含まれてる可能性のある世代が存命中に間に合ってよかった。
戸籍名以外でも店の看板とかに使われてる事もあって、
うなぎ屋で「うなぎ」の「な」が「ふ」の真ん中を「ち」に変えたようなの(U+1B081)
になってるのは割りと良く見かける。
2017/06/25(日) 17:45:14.96ID:tWAgqwx7
筆記体をそのまま活字体にしちゃうって凄いよな
ハシゴ高もそうだけど
756デフォルトの名無しさん
垢版 |
2017/06/25(日) 18:02:05.37ID:gomAIGS/
ひらがな
2017/06/25(日) 22:38:53.97ID:zF3XL20Z
Unicodeに変体仮名が追加されても、使えるのはUnicode文書の中だけで
戸籍に使えるかは別
2017/06/26(月) 00:33:59.69ID:fDlZrHxT
とりあえずTwitterできもい絵文字の部品として使われることになるだろう
759デフォルトの名無しさん
垢版 |
2017/06/26(月) 02:51:52.22ID:rSD39/hr
テスト
👲👲🏻👲🏼👲🏽👲🏾👲🏿
2017/06/26(月) 03:23:15.72ID:gnk9fC9R
白黒絵文字だと昔のカルピスみたいになるな
2017/06/26(月) 17:57:52.21ID:sAGGquQo
変体仮名収録のフォントがOSに標準で搭載されるのはまだ先になりそうだな。
2chやツイッター等使われるのはそれからだな。
2017/06/26(月) 21:13:39.72ID:/feRpqyj
そんな先なん?
2017/06/26(月) 22:44:02.89ID:WlgsC+Eb
ハンドルネームに変体仮名使う人出てきそう。
2017/06/26(月) 23:10:27.44ID:Sqt2RVbj
Winはゴシックの方は対応しそうな気がする
Macは基本的にAJ1-6にないものはスルーだろうな
2017/06/27(火) 00:41:43.27ID:GjRmAHNy
Androidは
2017/06/27(火) 14:32:14.63ID:41er5Tk4
スレタイに使う人はまだか
2017/06/29(木) 19:09:37.83ID:iu0jBoKG
Android 6.0以降はNoto Sansだしすぐ対応するんじゃね
2017/06/30(金) 23:42:15.21ID:41SVCjyH
変体仮名には濁点や半濁点付きもあるけど、それらはやはり合成用濁点(U+3099)や半濁点(U+309A)を付けて表わせなのかな。
2017/07/01(土) 10:27:57.00ID:hIU8+r86
http://www.unicode.org/Public/10.0.0/ucd/UnicodeData.txt

UnicodeData.txt の Decomposition_Mapping フィールドに対応が書いてないから駄目です。
2017/07/01(土) 15:51:26.25ID:YT5a66Js
それは分解用じゃ…
2017/07/01(土) 17:04:49.87ID:SORKQB4S
全然違ったか、スレ汚してすまん(´・ω・`)
2017/07/01(土) 17:19:00.11ID:nV0voxDD
Decomposition_Mappingは結合の目的も兼ねるので
むしろ「書いてないからこそ自分で結合」
2017/07/01(土) 21:16:57.49ID:YT5a66Js
>>772
結合先ないじゃん
2017/07/02(日) 22:35:50.76ID:UYpoTCPe
合成先が定義されていないのでU+3099を用いて自分で結合
ではないだろうか
2017/07/03(月) 14:09:44.66ID:AyrgAZeL
最初からそう言ってるけど
2017/07/05(水) 11:51:24.01ID:Qpg00Afa
このようにしてバベルの塔は進捗しております
2017/07/06(木) 02:31:15.80ID:VUvDmuBp
絵文字をぶっ込んできたのは、神の御業ってことか
2017/07/12(水) 08:29:42.86ID:pZQyr2Pt
IVSとaj1、汎用の兼ね合いを聞くに、文字セットの粒度の違いって漢字に限らず全ての文字セットに共通の問題だな。
声の大きい人がいる漢字カテでしか語られないけど
2017/07/18(火) 12:07:21.65ID:Y15ZUQ7r
アップル、年内追加の絵文字を公開--恐竜やゾンビ、シマウマも - CNET Japan
https://japan.cnet.com/article/35104330/

追加するのは良いけど、新規ばっかり注力してないで仕様バグ直す努力して欲しい
2017/07/18(火) 19:43:33.65ID:cVXFU6mc
顔から緑のが出てるやつ、それ普通に吐いてる絵文字だったんだな
緑だから野菜嫌いな子供みたいな意味なのかなと思ってた。
2017/07/19(水) 22:46:24.80ID:vMGHf8tr
「外字」という言葉、使えなくなるかな。同音異義語の差別用語を連想するから。
これからは「ユーザ定義文字」や「ベンダ定義文字」、「私用文字」、「規格外文字」とかに置き換えるべきかな。
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況