文字コード総合スレ Part10 [転載禁止]©2ch.net

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2015/10/14(水) 20:29:00.08ID:xctG4AAd
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
2017/01/19(木) 23:41:32.39ID:L5ppZzRV
荒らしは去れ
ここはトイレの落書きやお前の日記ではない
2017/01/19(木) 23:58:14.21ID:xPn9j90t
佳那サプリメントでかいなあと思ってたのに足りなかったのか
2017/01/20(金) 01:09:17.45ID:1c/0Zcpc
>>656
女書ってなに?
660デフォルトの名無しさん
垢版 |
2017/01/20(金) 04:21:35.39ID:SuI25zgd
美乳
2017/01/20(金) 08:06:23.41ID:B05iL6IP
↑いまだにEUC使ってる奴
2017/01/20(金) 08:57:48.31ID:TRhLZIcU
芸柏l
663デフォルトの名無しさん
垢版 |
2017/01/20(金) 13:48:47.52ID:XOQ1SR2o
平成
2017/01/20(金) 16:02:46.66ID:HZJT4SPy
UTF-8と称しつつ実際はISO/IEC 8859-1(or Windows-1252)使ってるサイト早く絶滅しないかな〜。
2017/01/20(金) 23:22:01.31ID:2XlTkpSB
うむ
2017/01/22(日) 23:54:36.79ID:I5eFmZgm
シマンテックのインストーラー「Symantec? Veritas NetBackup?をインストールします」
俺「俺は今 何をインストールしているんだぜ…?」
2017/01/23(月) 13:38:14.82ID:vFvi2mPp
マカフィー()よりまし
2017/01/25(水) 14:44:24.88ID:/N/oPPcM
©と®が化けるのはあるある
2017/01/25(水) 15:54:19.97ID:O1e4fHbH
Windows 2000あたりのセットアップ画面(ブルースクリーン)は左上に

ソソソソソソソ

みたいなのが並んでた気がするんだけどあれは何が化けていたんだろう。
670237
垢版 |
2017/01/25(水) 22:09:22.42ID:gTVlV55T
>>669
CP437?
2017/01/25(水) 23:28:05.93ID:yhKKEJSl
CP237?
2017/02/03(金) 11:13:08.06ID:qUN7oehH
>>669
頭にオがあったんじゃないかな
2017/02/03(金) 15:53:54.77ID:AImPimr2
ソじゃなくてヘだな

Windows 2000 Setup
ヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘ
2017/02/06(月) 16:58:49.11ID:1iv5Awq0
>>669-673
なるほど、

https://en.wikipedia.org/wiki/Code_page_437
https://ja.wikipedia.org/wiki/JIS_X_0201

最初は CP437 の 0xCD “═” だったのが
何かの拍子にシフトJISとして解釈されて
JIS X 0201 の 0xCD “ヘ” に化けたということか。
2017/02/06(月) 21:27:31.96ID:oVOmv7r6
>>674
正体は罫線か。

こういう解明ってすっきりするし面白いね。
2017/02/19(日) 22:58:26.35ID:IU+vTkdD
ISO/IEC 10646 - Information technology -- Universal Coded Character Set (UCS)
http://www.iso.org/iso/catalogue_detail.htm?csnumber=69119

ISO/IEC 10646:2017 (5th Edition) がいつの間にか published になってた。
Publicly Available Standards へ追加マダァ-? (・∀・ )っ/凵⌒☆チンチン
2017/02/20(月) 22:24:53.34ID:coRAUu9w
>いつの間にか published になってた

文盲ってどうしようもないですねホント
2017/02/20(月) 23:48:25.19ID:SiY39E3I
regional flagsって日本の都道府県旗も追加されんの?
東京の旗が銀杏か肛門かで揉めそう
2017/02/21(火) 00:45:25.29ID:nlr0ZxeU
ってか日本の都道府県旗ってJISか何かで規格化されてるんだろうか
されてないなら根拠になる個別の条例を探して判断することになるのか
2017/02/21(火) 23:08:13.81ID:YiL5XD0V
東京のマンコマークと神奈川のチンチンびろーんは世界の恥
2017/02/22(水) 03:17:26.03ID:4ggKEg2C
旗の形ではなく県章部分だけでグリフ作ってもらえたらいろいろ独創的な応用が利きそうだ。
2017/02/22(水) 18:49:19.58ID:/iBgHjnm
>>679
絵と絵文字は別物やで
2017/02/22(水) 21:52:33.48ID:h5L2bR5S
>>682


言わんとすることがわからないけど、
基準があれば>>678みたいな場合に難しい判断しなくてすむでしょ?
2017/02/22(水) 22:31:09.15ID:j43AF9m9
もう憲法とか国境の位置もJIS規格で管理しちゃえよ
685デフォルトの名無しさん
垢版 |
2017/02/23(木) 13:21:45.70ID:eG9NqkD/
>>680
知らなかった
ありがとう
2ちゃんもたまには役に勃つな
2017/02/23(木) 13:22:51.89ID:eG9NqkD/
>>681
自分でやれ
2017/02/23(木) 18:33:49.17ID:g/wbAq9q
>>683
仕様書読もうな
688デフォルトの名無しさん
垢版 |
2017/02/23(木) 19:43:12.70ID:lh6GP4kZ
🏳️‍🌈
🏴‍☠️
2017/02/23(木) 23:02:08.28ID:Mc4LemLc
>>687
どうもかみ合ってない気がする。
仕様できっちり規定されてれば楽だけどそういうものじゃないよね、
なら代わりになる典拠があれば楽なんだけどな、って話してたつもりなんだけど。
2017/03/02(木) 13:04:44.68ID:Dk3HQyow
仕様を読んだ上でそんなこと言ってるなら、読解力が足りないとしか言えないわ
2017/03/02(木) 15:42:40.27ID:fgh+r4bY
せっかく亀レスするならもうちょっと具体的に言えたほうがいいと思う
2017/03/03(金) 19:38:34.87ID:r16C7uTR
もういくつ寝るとunicode10
ゾンビとか吸血鬼とかせっそうなさすぎ
こんな絵文字使われるのかよ
2017/03/03(金) 22:57:47.99ID:m0VSWGlS
もう幾つ寝るとISO 10646発売
あと一週間ぐらいで出るだろきっと
694デフォルトの名無しさん
垢版 |
2017/03/04(土) 12:37:47.12ID:GRvQ2lmz
>>692
他にやることあるのにね
無能なんだろ
2017/03/04(土) 17:17:33.70ID:eGgxEr5u
すべての文字を収めるが目的のはずが
新しいアイコンを作ろうになってるからな
2017/03/04(土) 23:52:53.04ID:+pEijc2g
絵文字なんか作ったってフォントごとに微妙に変わるし不毛だよ
何種類用意したって満足ってことはないし、無駄な仕事が増えるだけ
それならむしろ、エンコードしたビットマップかベクタグラフィックを
文字列の途中に文字として挿入できるようにしたほうがマシだろ
2017/03/05(日) 00:03:46.99ID:xrJm/RDc
100種類用意しました
1000種類用意しました
10000種類用意しました
・・・
どこまでいってもこんなものは・・・
絵文字っていわゆるラインスタンプみたいな使われ方を想定しているんだろ?
すべてのラインスタンプに文字コードを割り振るみたいなものだ
時代に合ってない
文字列の途中にビットマップかベクタグラフィックを挟み込める方が絶対良いって
そうすると当然絵文字職人みたいな人たちが出てきてにぎわうだろうから
それをコピペして使えばよいのだ
標準化委員会みたいな中央で絵の形とコードを取り決めて・・・ってスタイルは時代遅れだよ
ラインスタンプを見ろよ
698デフォルトの名無しさん
垢版 |
2017/03/05(日) 23:06:39.70ID:nindsAFW
たしかに
特定のコードとそれに続く何byteかでbitmap図形っていうのはありかもね
無駄多いけど
2017/03/06(月) 08:18:41.33ID:n/Fv95sm
最近の追加は絵文字じゃなくて絵になってるからな
文字コードに色を定義したり芯のない継接ぎ仕様でやりたい放題だよな
2017/03/14(火) 14:00:09.20ID:+au4v4OR
Unicode 10、変体仮名と縦書きレイアウト導入へ | マイナビニュース
http://news.mynavi.jp/news/2017/03/13/110/
2017/03/15(水) 08:13:46.98ID:eV3tx5Ei
縦書きテキストレイアウトってまたおかしなことになってんな
変体仮名は文字情報基盤の範囲ならいいんじゃね
2017/03/15(水) 08:24:44.07ID:oPhy6OQw
縦書きレイアウトって前からあるこれのアップデートのことじゃないの?
http://www.unicode.org/reports/tr50/tr50-18.html#Modifications
「導入」ってのはその記事の誤認っぽい
2017/03/15(水) 11:37:12.40ID:7YWEdixI
|のカーニングがおかしいとか
2017/03/15(水) 15:48:49.66ID:tq6fONxP
「導入」ってのは

> さらに、Unicode Vertical Text Layoutが標準の一部として取り込まれる点が注目される。

って本文に書いてあるんだから Unicode® Technical Report が Unicode® Standard Annex に昇格して
Unicode® Standard の一部になるってことでしょ。
2017/03/28(火) 20:45:37.67ID:2V3Jlzjb
おう吐・ゾンビ・授乳などUnicodeに新しい絵文字69種類が追加される
http://gigazine.net/news/20170328-69-new-emojis-announced/
2017/03/28(火) 22:50:13.41ID:ky5+niZ/
こんだけ増えてくると幾らアホなアメリカ人でも
UTF-16捨てたくなってくるだろ
2017/03/29(水) 08:08:48.71ID:81RbfoHk
こういう流行り廃りのあるものはMarkdown emojiのようなやり方で十分だしそっちの方が
便利だと思うがなぁ。そもそも欧米の連中、Unicode入力のためにIMEとか導入してるんだろうか?
2017/03/29(水) 12:59:49.14ID:v2ySqvAX
イングランド、スコットランド、ウェールズは入れたのに北アイルランドは入れなかったのか
しかし U+1F3F4 U+E0067 U+E0062 U+E0065 U+E006E U+E0067 U+E007F を一つの国旗として処理しろってそれは
2017/03/29(水) 14:50:05.48ID:IUBNo9UW
ほらもうこれ、いったい何に使うのっていう
ラインスタンプと比べるともはや・・・
まるで社会主義国家のようだし
今の時代の速度感と全然合ってないんですけど
2017/03/29(水) 17:07:28.23ID:WAel0act
>>706
UTF-8ならいいの?
2017/03/29(水) 18:47:22.40ID:pMdWiHKE
>>710
そういう意味じゃないでしょ
Unicodeに政治を持ち込むなっていう
2017/03/29(水) 21:14:02.55ID:81RbfoHk
「emojiが使えないUTF-16はオワコン」て意味かと思った。
2017/03/30(木) 01:24:25.07ID:4z103Fgo
iOS 10.3リリース、ファイルシステムがHFS+からAPFSに変更される
https://apple.srad.jp/story/17/03/29/0852227/

Apple、Unicode正規化(もどき)やめるってよ
2017/03/30(木) 07:57:02.00ID:HGkR55tR
U+41 U+0307 U+0308と
U+41 U+0308 U+0307のファイルが同時に作成できるのかな
2017/03/31(金) 16:24:48.85ID:jxXitrEX
http://www.taishukan.co.jp/kokugo/webkoku/series003_03.html

Windowsと同じ「がが」というフォルダを4つ作れるようになるのか
2017/03/31(金) 18:39:57.95ID:cAvSJqfg
> 少なくとも検索に関しては、「ガ」と「ガ」を同じにみなす必要があり、
> <U+FF76 U+FF9E>とU+30ACと<U+30AB U+3099>とを、 全て同じだとみなす必要があるということでしょう。

安岡は何当たり前のこと言ってんだ
JIS信者のクセに慣れないUnicodeについて語るとこういった低レベルな恥ずかしい記事になる
2017/04/01(土) 22:40:22.15ID:7/71KzK1
濁点は独立したコードポイントを持っていても結合文字みたいなものだし、
U+30AB U+309B の場合も「ガ」と同じにみなすべきだろうね、検索の場合
2017/04/01(土) 23:09:58.41ID:LH/rwisT
Unicode(NFKD)的には
「ガ」=「ガ」≠「カ゛」=「カ ゙」
だな
2017/04/07(金) 00:08:24.84ID:qNFTJj2D
U+10FFFFまで埋めないと死んじゃう病にでもかかってるのかね、粗製濫造してんのは
2017/04/07(金) 16:00:25.62ID:3NFvJvaJ
まだ丸々10面分空いてるからな
2017/04/12(水) 14:45:57.95ID:jhOW+nqF
正規化が悪なんじゃなくて、正規化を表に出す事が悪なんだよ
パソコンを裸族で使う様なもんだ
素人にはオススメできない
2017/04/13(木) 18:03:47.78ID:TzW03HI9
>>719
困った病気だねぇ。
埋めずに空きをたくさん残しておいた方が未来の子孫に感謝されるぞ。


多分。
723デフォルトの名無しさん
垢版 |
2017/04/25(火) 06:30:16.64ID:DObvS+Kg
>>712
UTF-16で使えるじゃん?UCS-2と勘違いしてる?
2017/04/26(水) 12:16:19.33ID:im3ukcX1
そうじゃない
2017/05/11(木) 08:21:06.84ID:49ESVgQe
多言語制定で見えてきた課題を一挙に解決してUnicode Neueでも立ち上げたらいいのに
バグをバグのまま残さなきゃいけないなんて仕様として不健全すぎるわ
2017/05/11(木) 22:00:06.44ID:wyUnsmEB
何故ドイツ語
2017/05/17(水) 12:41:42.49ID:EJfTNRw9
フォントでよく使うからね
2017/05/20(土) 12:07:31.13ID:GVSnCE+6
ISO 10646って2月に発行フェーズ入ったのにまだ発行できてないのは
何やってんだ?
2017/05/24(水) 16:48:47.75ID:u+M8iI76
ISO/IECの仕事が遅いのはいつものこと
2017/05/26(金) 12:00:03.39ID:4g2o9CtM
Unicode の Core Specification の日本の元号の説明(日付)が間違ってるのはいつ修正されるんだろう?
2017/05/26(金) 17:54:06.19ID:RyqPFjFC
>>730
知らんが参考までに説明箇所を教えて
2017/05/26(金) 22:00:22.89ID:mIO9asAV
>>731
ttps://techracho.bpsinc.jp/chiba-junichi/2016_09_27/25490

他にもあるかもしれませんが、自分はこのページで初めて知りました。
733デフォルトの名無しさん
垢版 |
2017/05/27(土) 03:01:17.90ID:V3ffhZkY
>>730-732
TZを間違って読んでるだけでは?
2017/05/27(土) 03:15:47.09ID:hVyPua6a
ヒカル TV出演「年間5億は稼ぐ勢いですね」
https://www.youtube.com/watch?v=G7qL6ftpets
第1回案件王ランキング!YouTuberで1番稼いでるのは誰だ!
https://www.youtube.com/watch?v=asF2wQ2xhjY&;t=61s
ユーチューバーの儲けのカラクリを徹底検証!
https://www.youtube.com/watch?v=FUSb4erJSXE&;t=504s
YouTuberになりたいのは馬鹿じゃない!YouTuberになる方法
https://www.youtube.com/watch?v=Fr0WXXZRMSQ

最高月収5000万円だとさ。年収じゃなくて「月収」な
おまえらもyoutubeに動画投稿したほうがいい
最低2年はやらないとここまではいかないだろうけど才能とアイデアと
企画力と継続力があればが大儲けできる可能性がなくもない
まだまだ他の職種に比べれば競争率は低いからオススメ
2017/05/29(月) 19:03:28.51ID:K4hEGofc
>>733
そうじゃないけど、定義としてTZは付与すべきだね
2017/05/31(水) 17:05:54.16ID:uv8MtfX4
TZってちんちんズルムケの略?
737デフォルトの名無しさん
垢版 |
2017/06/01(木) 03:44:11.18ID:82KsO+uD
time zone
738デフォルトの名無しさん
垢版 |
2017/06/01(木) 11:37:45.12ID:o/dQD8LP
thin skin zone
2017/06/02(金) 21:34:26.48ID:Hl9pjX1u
TZはこれ
http://pix.iemoji.com/images/emoji/apple/ios-9/256/regional-indicator-symbol-letters-tz.png
2017/06/03(土) 09:51:38.32ID:LcU0sJDm
寒いからもういいよ
2017/06/04(日) 21:55:56.10ID:mjDwcbxw
正直旗イメージより「伊」「蘭」「仏」とかで表示してくれたほうがわかりやすい国もある
2017/06/09(金) 22:09:35.50ID:PK+Q1cYY
WG2 N4825によると1B130〜1B16FはSmall Kana Extensionにすることにしたらしい
でもreserved forなんてやるくらいなら、使用例があるものはとっとと入れちゃえばいいのに
2017/06/09(金) 22:31:03.58ID:7OSi6V+4
何に使えるのかな
ちっちゃいウンコが書けるようになるぐらいしか思いつかなかった
2017/06/10(土) 01:15:56.46ID:g45QxHo0
http://www.unicode.org/wg2/docs/n4825-pdam2chart.pdf#page=15
annotationは消さない方がいいんじゃないかな…
2017/06/11(日) 14:49:02.11ID:GyEdwZPX
URLが2ちゃんねるアートだと?
2017/06/21(水) 08:20:53.06ID:GaxJdSrE
Announcing The Unicode Standard, Version 10.0
http://blog.unicode.org/2017/06/announcing-unicode-standard-version-100.html
2017/06/21(水) 10:16:00.01ID:bqANLNSg
mage
まげ
2017/06/21(水) 12:15:04.06ID:GUHwFNed
もう月次のバージョンアップでいいからCore specificationとUCDの改版を分離してくれ
2017/06/21(水) 16:48:48.95ID:Rg8XGBQ1
Unicode 10.0出たのね
CodeCharts.pdfが100MB超えして落とすの&開くのだるい
2017/06/23(金) 14:19:48.92ID:xOTwvtKW
例示字形でフォント作ってくれないかね
とりあえず表示できればいいっていう場面は意外と多いと思うんだけど
751デフォルトの名無しさん
垢版 |
2017/06/23(金) 14:44:56.43ID:0OdP20aK
2byte+任意の8x64byteみたいなbitmap造ってくれないかな
2017/06/23(金) 18:53:47.09ID:m93LamaP
>>750
Noto Fontって全部カバーしてるんじゃないの?
2017/06/23(金) 22:22:21.49ID:JgWE6lrM
Googleはそのつもりなのかもしれないけど、実際にはカバーできてないよ
符号化済みの漢字だけで1フォントの収納限界グリフ数(65535)を超えちゃってるから
全部カバーしようと思ったら漢字フォントだけでも2つ以上に分けないといけない

それなのにNoto CJKは、PanCJKという思想で漢字だけじゃなく仮名やハングルまで
1フォントに押し込んでしまった
おかげでUnicode 10で符号化された変体仮名なんかも入れるスペースがない
2017/06/23(金) 23:32:51.59ID:vCpZUNAe
変体仮名がついにUnicodeに追加されたんだな。
戸籍名に変体仮名が含まれてる可能性のある世代が存命中に間に合ってよかった。
戸籍名以外でも店の看板とかに使われてる事もあって、
うなぎ屋で「うなぎ」の「な」が「ふ」の真ん中を「ち」に変えたようなの(U+1B081)
になってるのは割りと良く見かける。
2017/06/25(日) 17:45:14.96ID:tWAgqwx7
筆記体をそのまま活字体にしちゃうって凄いよな
ハシゴ高もそうだけど
756デフォルトの名無しさん
垢版 |
2017/06/25(日) 18:02:05.37ID:gomAIGS/
ひらがな
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況