プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
2018/01/22(月) 22:58:23.45ID:UK/uqEp5287デフォルトの名無しさん
2018/05/21(月) 15:47:01.21ID:h7wqMmMV 取り敢えず>>266のリンク先の作者にぶつけるべきでは
288デフォルトの名無しさん
2018/05/21(月) 21:39:44.96ID:owdLx3Iu ㌀㌁㌂e㌄㌅㌆㌇㌈㌉
㌊㌋㌌i㌎㌏㌐㌑㌒㌓
`㌕㌖㌗c㌙㌚㌛㌜㌝
㌞㌟㌠㌡ak㌤㌥jd
㌨㌩㌪l㌬㌭㌮㌯㌰㌱
㌲㌳㌴㌵f㌷㌸㌹㌺n
㌼㌽㌾㌿㍀㍁㍂㍃㍄㍅
㍆㍇㍈_m㍋㍌b㍎㍏
㍐g㍒㍓㍔㍕㍖h㍘㍙
㍚㍛㍜㍝㍞㍟㍠㍡㍢㍣
㍤㍥㍦㍧㍨㍩㍪㍫㍬㍭
㍮㍯㍰㍱㍲㍳㍴㍵㍶㍷
㍸㍹㍺~順紫㍿
㌊㌋㌌i㌎㌏㌐㌑㌒㌓
`㌕㌖㌗c㌙㌚㌛㌜㌝
㌞㌟㌠㌡ak㌤㌥jd
㌨㌩㌪l㌬㌭㌮㌯㌰㌱
㌲㌳㌴㌵f㌷㌸㌹㌺n
㌼㌽㌾㌿㍀㍁㍂㍃㍄㍅
㍆㍇㍈_m㍋㍌b㍎㍏
㍐g㍒㍓㍔㍕㍖h㍘㍙
㍚㍛㍜㍝㍞㍟㍠㍡㍢㍣
㍤㍥㍦㍧㍨㍩㍪㍫㍬㍭
㍮㍯㍰㍱㍲㍳㍴㍵㍶㍷
㍸㍹㍺~順紫㍿
289デフォルトの名無しさん
2018/05/21(月) 21:42:15.10ID:owdLx3Iu ㎀㎁
㎂㎃㎄㎅㎆㎇㎈㎉㎊㎋
㎌㎍rs㎐㎑㎒㎓㎔㎕
㎖㎗㎘㎙㎚㎛opq㎟
㎠u㎢㎣㎤㎥㎦㎧㎨㎩
㎪㎫㎬㎭㎮㎯㎰㎱㎲㎳
㎴㎵㎶㎷㎸㎹㎺㎻㎼㎽
㎾㎿㏀㏁㏂㏃t㏅㏆㏇
㏈㏉㏊㏋㏌㏎㏏㏐㏑
㏒㏓㏔㏕㏖㏗㏘㏙㏚㏛
㏜㏝㏞㏟㏠㏡㏢㏣㏤㏥
㏦㏧㏨㏩㏪㏫㏬㏭㏮㏯
㏰㏱㏲㏳㏴㏵㏶㏷㏸㏹
㏺㏻㏼㏽㏾㏿
㎂㎃㎄㎅㎆㎇㎈㎉㎊㎋
㎌㎍rs㎐㎑㎒㎓㎔㎕
㎖㎗㎘㎙㎚㎛opq㎟
㎠u㎢㎣㎤㎥㎦㎧㎨㎩
㎪㎫㎬㎭㎮㎯㎰㎱㎲㎳
㎴㎵㎶㎷㎸㎹㎺㎻㎼㎽
㎾㎿㏀㏁㏂㏃t㏅㏆㏇
㏈㏉㏊㏋㏌㏎㏏㏐㏑
㏒㏓㏔㏕㏖㏗㏘㏙㏚㏛
㏜㏝㏞㏟㏠㏡㏢㏣㏤㏥
㏦㏧㏨㏩㏪㏫㏬㏭㏮㏯
㏰㏱㏲㏳㏴㏵㏶㏷㏸㏹
㏺㏻㏼㏽㏾㏿
290デフォルトの名無しさん
2018/05/21(月) 21:59:03.03ID:V+3Z+fIi 頭がおかしくなりそうだ
291デフォルトの名無しさん
2018/05/21(月) 22:38:58.14ID:x+xM1a4p 絵文字テスト😁
292デフォルトの名無しさん
2018/05/21(月) 22:58:22.68ID:kKTehq+9 >>288
2バイト文字ってやはり狂っているな
なぜこのようなものまで一字で表示しようと考えたのか…
一字にすることで容量を節約できると考えたのだろうが、
その節約のために無駄な手間暇がかかり結果的にマイナスにしかならないという
2バイト文字ってやはり狂っているな
なぜこのようなものまで一字で表示しようと考えたのか…
一字にすることで容量を節約できると考えたのだろうが、
その節約のために無駄な手間暇がかかり結果的にマイナスにしかならないという
293デフォルトの名無しさん
2018/05/21(月) 23:23:05.67ID:XnV9ry7u294デフォルトの名無しさん
2018/05/22(火) 00:22:22.07ID:3h/yZ372 肌色テスト👮
👮🏻👮🏼👮🏽👮🏾👮🏿
👮🏻👮🏼👮🏽👮🏾👮🏿
295デフォルトの名無しさん
2018/05/22(火) 00:47:54.81 ○囲み文字の1字版と2字版のテストもおながいします
296293
2018/05/22(火) 00:49:04.48ID:pl4uFglU 酔った勢いでレスしたら自演だった……恥ずかしい (いきなり酔いが覚めた)。
つまんないことしちゃってごめん、しばらく自重します。
つまんないことしちゃってごめん、しばらく自重します。
297デフォルトの名無しさん
2018/05/22(火) 04:36:23.18ID:XuSnYVx6 絵文字そのものはどうとも思ってないけど
通常の文章の中で使われる矢印がある種の入力環境だと絵文字で入力されるみたいで
「←このように」が「⬅このように」ってなるのがすごく気持ち悪い。UnicodeというよりIMEに対する不満。
通常の文章の中で使われる矢印がある種の入力環境だと絵文字で入力されるみたいで
「←このように」が「⬅このように」ってなるのがすごく気持ち悪い。UnicodeというよりIMEに対する不満。
298デフォルトの名無しさん
2018/05/22(火) 11:48:04.68ID:3h/yZ372 全角チルダがwindowsユーザーとmacユーザーで違うのも厄介
windows 〜
mac 〜
windows 〜
mac 〜
299デフォルトの名無しさん
2018/05/22(火) 11:57:18.21ID:xGwd/XeK @ABCDEFGHIJKLMNOPQRS
301デフォルトの名無しさん
2018/05/22(火) 13:35:03.46ID:d3LCNcLv オマエガナー
302デフォルトの名無しさん
2018/05/22(火) 13:36:25.53ID:1HkhrVs+ プッ
303デフォルトの名無しさん
2018/05/22(火) 14:15:36.11ID:3h/yZ372 化けてますよ。
👻 🎃 👹 👺 👽 💀 🧛 🧟
👻 🎃 👹 👺 👽 💀 🧛 🧟
304デフォルトの名無しさん
2018/05/22(火) 14:35:44.60ID:xGwd/XeK 🏇̪鹿
🐎鹿
🐴鹿
🐎鹿
🐴鹿
305デフォルトの名無しさん
2018/05/22(火) 14:45:39.70ID:3h/yZ372 ひょっとしてバカなの?
🏇🦌
🐎🦌
🐴🦌
🏇🦌
🐎🦌
🐴🦌
306デフォルトの名無しさん
2018/05/22(火) 18:00:59.35ID:KBN0pglL >>305
化けてんぞバーカwwwww
化けてんぞバーカwwwww
307デフォルトの名無しさん
2018/05/22(火) 18:47:42.14ID:XuSnYVx6 ということにしたいのですね
308デフォルトの名無しさん
2018/05/23(水) 02:23:03.50ID:Z0QXrqgL unicode と ISO10646 は互換性があるけど適用範囲とか微妙に違ったりする。
非推奨とかはISO/JISの方を念頭に置いた話ではなかろうか。
非推奨とかはISO/JISの方を念頭に置いた話ではなかろうか。
309デフォルトの名無しさん
2018/05/23(水) 18:48:25.05ID:2DlA2Ju+ ローマ数字の話だよね?
ISO/IEC 10646にもそんな規定は無いような……コードチャートはUnicodeと同じもの使ってるし。
JIS X 0221の方は真面目に読んでないからよく分からんが……
でもISO/IEC 10646の国際一致規格な以上日本独自でそんな規定は入ってないと思うけど。
ISO/IEC 10646にもそんな規定は無いような……コードチャートはUnicodeと同じもの使ってるし。
JIS X 0221の方は真面目に読んでないからよく分からんが……
でもISO/IEC 10646の国際一致規格な以上日本独自でそんな規定は入ってないと思うけど。
310デフォルトの名無しさん
2018/05/24(木) 01:13:38.27ID:Nk0sJPwS311デフォルトの名無しさん
2018/05/24(木) 01:29:22.08ID:fftgGS82 ここにはまだ来てないのか
312デフォルトの名無しさん
2018/05/24(木) 14:00:09.03ID:A4JtYMZ4 ローマ数字やCJK互換用文字が「推奨されない」という記述がブログやWikipediaに散見されるけど、それって根拠が無いよね? という話だと思って眺めてるよ。
こういう聞こえの良いデマを否定するのは体力がいるから面倒そうだよなー
こういう聞こえの良いデマを否定するのは体力がいるから面倒そうだよなー
313デフォルトの名無しさん
2018/05/24(木) 14:03:05.24ID:fftgGS82 TUVWXYZ[\]ⅪⅫ
Ⅽ
Ⅿ
ↂ
Ⅽ
Ⅿ
ↂ
314デフォルトの名無しさん
2018/05/25(金) 01:56:34.37ID:562g8vT6 >>312
いつものネット伝言ゲームじゃないか?
日本語での利用を前提として、うろ覚えだけど
1. ISO10646とユニコード規格は厳密に言えば同じではない(事実)
2. ISO10646 は部分実装を許しているための全ての文字が等価ではない(事実)
3. ISO/JIS は部分実装のために日本語向けの文字の組を決めてる(事実)
4. ユニコード実装するならば、日本語向けの文字の組のうち主要なもにには対応すべき(たんなる日本人の願望)
5. ネットなどで不特定多数との通信する前提の場合には、主要な組に入ってない文字は相手側で読めない可能性があるので推奨しない(どこかの個人の意見ならわからなくもない)
6. 日本語のための文字の組にはローマ数字は含まれていない(微妙、ISO規格本体にはまだ入ってないが、JISの参考になら含まれた気がする)
...
中略
...
99.ユニコード規格でローマ数字は推奨されない(デマ)
いつものネット伝言ゲームじゃないか?
日本語での利用を前提として、うろ覚えだけど
1. ISO10646とユニコード規格は厳密に言えば同じではない(事実)
2. ISO10646 は部分実装を許しているための全ての文字が等価ではない(事実)
3. ISO/JIS は部分実装のために日本語向けの文字の組を決めてる(事実)
4. ユニコード実装するならば、日本語向けの文字の組のうち主要なもにには対応すべき(たんなる日本人の願望)
5. ネットなどで不特定多数との通信する前提の場合には、主要な組に入ってない文字は相手側で読めない可能性があるので推奨しない(どこかの個人の意見ならわからなくもない)
6. 日本語のための文字の組にはローマ数字は含まれていない(微妙、ISO規格本体にはまだ入ってないが、JISの参考になら含まれた気がする)
...
中略
...
99.ユニコード規格でローマ数字は推奨されない(デマ)
315デフォルトの名無しさん
2018/05/26(土) 14:41:00.14ID:OAwkZ9ha > 6. 日本語のための文字の組にはローマ数字は含まれていない(微妙、ISO規格本体にはまだ入ってないが、JISの参考になら含まれた気がする)
昨年末の ISO10646の改訂でJISが参考で定義していた COMMON JAPANESE も正式にISO規格に取り込まれた模様。
ということでローマ数字は BASIC JAPANESE には含まれてないけど COMMON JAPANESE には含まれてるくらいの位置付け。
昨年末の ISO10646の改訂でJISが参考で定義していた COMMON JAPANESE も正式にISO規格に取り込まれた模様。
ということでローマ数字は BASIC JAPANESE には含まれてないけど COMMON JAPANESE には含まれてるくらいの位置付け。
316デフォルトの名無しさん
2018/05/26(土) 22:58:23.91ID:oSB4DgY3 285 BASIC JAPANESE と 287 COMMON JAPANESE が 10646 に入ったのは10年前の ISO/IEC 10646:2003/Amd 3:2008 じゃないの?
昨年末の改訂とか正式にISO規格にって何の話?
昨年末の改訂とか正式にISO規格にって何の話?
317デフォルトの名無しさん
2018/05/26(土) 23:54:42.44ID:OAwkZ9ha もう JIS参考でも、amd でもなくて、正式規格本体にあるよ。情報古かったという話。
Amd3:2008 にあるんなら正式規格 ISO/IEC 10646:2012 にもあるかもしれん。確認できんけど。
Amd3:2008 にあるんなら正式規格 ISO/IEC 10646:2012 にもあるかもしれん。確認できんけど。
318デフォルトの名無しさん
2018/05/27(日) 10:24:34.33ID:rLKmcl7g 規格本体に入ったのは ISO/IEC 10646:2011
319デフォルトの名無しさん
2018/05/28(月) 01:39:25.84ID:Ci0ddO0a >>286,312
CJK互換文字のラウンドトリップ用のものはUnicode規格書に明記されてる
> They are included in the Unicode Standard to provide full round-trip compatibility
> with the ideographic repertoire of ... and should not be used for any other purpose.
http://www.unicode.org/versions/Unicode10.0.0/ch18.pdf#page=21
CJK互換文字のラウンドトリップ用のものはUnicode規格書に明記されてる
> They are included in the Unicode Standard to provide full round-trip compatibility
> with the ideographic repertoire of ... and should not be used for any other purpose.
http://www.unicode.org/versions/Unicode10.0.0/ch18.pdf#page=21
320デフォルトの名無しさん
2018/05/28(月) 13:25:04.14ID:+smoTcYJ 「推奨しない」でたね
321デフォルトの名無しさん
2018/05/28(月) 14:52:12.71ID:AZENlZb2 素晴らしい。こういうちゃんとした情報は歓迎するよ。
そうか、CJK互換文字の利用は「推奨しない」と仕様書に明記されているんだね。覚えておこう。
そうか、CJK互換文字の利用は「推奨しない」と仕様書に明記されているんだね。覚えておこう。
322デフォルトの名無しさん
2018/05/28(月) 16:00:24.98ID:OZmKBhwA 「完全なラウンドトリップ互換性の為に提供するものであり、それ以外の使用は推奨しない」
だから問答無用で“should not be used”と言ってる訳じゃないけどね。
だから問答無用で“should not be used”と言ってる訳じゃないけどね。
323デフォルトの名無しさん
2018/05/28(月) 22:09:23.88 こまけえこたあいいんだよ
324デフォルトの名無しさん
2018/05/29(火) 11:31:12.88ID:gAWLYOTz325デフォルトの名無しさん
2018/05/29(火) 11:40:21.01ID:QKhV4oKb 伝聞デマの好例
326デフォルトの名無しさん
2018/05/29(火) 18:40:11.76ID:P35/pWO/ 結局デマじゃないんでしょ?
327デフォルトの名無しさん
2018/05/29(火) 22:34:44.54ID:j6aBPmpG 324は何を怒ってるんだ
319のフレーズは複数回出てきてその都度...の部分の規格書名が変わるだけだろうに
319のフレーズは複数回出てきてその都度...の部分の規格書名が変わるだけだろうに
328デフォルトの名無しさん
2018/05/30(水) 12:07:23.64ID:iPjSEnXB いやだからUnicode公式が推奨しないと言ってるのは事実なんだろ。デマじゃないじゃん。
なんでもかんでもデマ扱いすれば自分が偉くなったような錯覚になって気分が良いのかもしれないが
迷惑だよ、そういう態度は。
なんでもかんでもデマ扱いすれば自分が偉くなったような錯覚になって気分が良いのかもしれないが
迷惑だよ、そういう態度は。
329デフォルトの名無しさん
2018/05/30(水) 13:24:00.49ID:uOQbJF8C330デフォルトの名無しさん
2018/05/30(水) 14:33:31.86ID:glkZKJxk 復旧
🖕🏻🖕🏼🖕🏽🖕🏾🖕🏿🖕
🖕🏻🖕🏼🖕🏽🖕🏾🖕🏿🖕
331デフォルトの名無しさん
2018/05/30(水) 20:29:52.46ID:+kRmOuNK >>329
多分違う。
「CJK互換文字の一部には特定目的以外に使用すべきでない文字がある」が正しい。
318 はわざとか天然かは知らんが、CJK互換文字の一部にしか適用されないルールを、適用範囲の部分を抜かして引用して、あたかも全体に適用するルールであるかのように誤解する書き方をしてある。
あとは、それを鵜呑みした迂闊さんが「CJK互換文字は推奨されない(キリッ)」ってデマを広げる構図。
多分違う。
「CJK互換文字の一部には特定目的以外に使用すべきでない文字がある」が正しい。
318 はわざとか天然かは知らんが、CJK互換文字の一部にしか適用されないルールを、適用範囲の部分を抜かして引用して、あたかも全体に適用するルールであるかのように誤解する書き方をしてある。
あとは、それを鵜呑みした迂闊さんが「CJK互換文字は推奨されない(キリッ)」ってデマを広げる構図。
332デフォルトの名無しさん
2018/05/30(水) 20:46:20.24ID:/bFYrAtR だから「ラウンドトリップ用」って話だろ?
333デフォルトの名無しさん
2018/05/30(水) 20:50:56.47ID:+kRmOuNK >>331
タイプミス。318→319
タイプミス。318→319
334デフォルトの名無しさん
2018/05/30(水) 20:55:57.87ID:+kRmOuNK335デフォルトの名無しさん
2018/05/30(水) 21:06:09.88ID:JjJ1rb8T 気に入らないなら自分で満足の行くように書き直して貼り付ければ?
典拠示されてるんだから。
典拠示されてるんだから。
336デフォルトの名無しさん
2018/05/31(木) 00:48:48.00ID:Rt4SPplt そんな中途半端に書き直して貼り付けるからデマの元になるんだろ。反省しろ。
337デフォルトの名無しさん
2018/05/31(木) 05:31:03.12ID:fKyHNhNo デマはどっちだよ……「CJK互換文字は」という文脈からは「CJK互換文字に含まれる全ての文字は」という意味しか受け取れないのだが?
「一部」なんていう表現はどっから湧き出てきたんだよ……。
「一部」なんていう表現はどっから湧き出てきたんだよ……。
338デフォルトの名無しさん
2018/05/31(木) 09:53:50.67ID:Rt4SPplt339デフォルトの名無しさん
2018/05/31(木) 12:04:29.61 ケチ付けるんなら他人を納得させられる論拠と出典を出せよ
それができないんなら『CJK互換文字の利用は「推奨しない」』が正解だ
それができないんなら『CJK互換文字の利用は「推奨しない」』が正解だ
340デフォルトの名無しさん
2018/05/31(木) 15:11:25.68ID:LXR1oL3d 南京大虐殺は30万人アルニダ
341デフォルトの名無しさん
2018/05/31(木) 20:31:47.82ID:fKyHNhNo 誰か結論下さい(他力本願)。
342デフォルトの名無しさん
2018/05/31(木) 23:08:01.93ID:CO1u2co/ >>319のリンク先の規格書で、ラウンドトリップ用だから使用を推奨しないとされているのは以下の3種類だけ。
全体を非推奨とはしていないな。
・U+FA30〜U+FA6A (JIS X 0213:2000)
・U+FA6B〜U+FA6D (ARIB STD-B24)
・U+FA70〜U+FAD9 (KPS 10721-2000)
全体を非推奨とはしていないな。
・U+FA30〜U+FA6A (JIS X 0213:2000)
・U+FA6B〜U+FA6D (ARIB STD-B24)
・U+FA70〜U+FAD9 (KPS 10721-2000)
343デフォルトの名無しさん
2018/06/01(金) 05:30:12.89ID:vog2AnDp 誰が誰かよくわかんないけど少なくともCJK互換漢字の一部に関しては
非推奨の根拠はあったってことでしょ
不正確だと思ったならそうじゃなくてこうだって言えばそれで済んだ話だろうに
そうせずにネチネチ言うばっかだから無駄に荒れる
非推奨の根拠はあったってことでしょ
不正確だと思ったならそうじゃなくてこうだって言えばそれで済んだ話だろうに
そうせずにネチネチ言うばっかだから無駄に荒れる
344デフォルトの名無しさん
2018/06/01(金) 07:06:38.23ID:RdSMK5as345デフォルトの名無しさん
2018/06/01(金) 08:37:44.05ID:d/KZJvqH >>343
一部でしかないのを全部のように言うから伝聞デマって言われたんだろ。
一部でしかないのを全部のように言うから伝聞デマって言われたんだろ。
346デフォルトの名無しさん
2018/06/01(金) 11:58:37.96 >>342
一般の開発者やユーザーは「CJK互換文字の利用は推奨しない」で覚えておいた方が漏れがなくて安心だな
一般の開発者やユーザーは「CJK互換文字の利用は推奨しない」で覚えておいた方が漏れがなくて安心だな
347デフォルトの名無しさん
2018/06/01(金) 12:07:07.22ID:uCsHgk1n 規格書嫁とか無茶言うやつがいます。
あれは暗号で書いてあるので書いた人にも読めません。
あれは暗号で書いてあるので書いた人にも読めません。
348デフォルトの名無しさん
2018/06/01(金) 12:41:04.24ID:gevSrdmF あなたの能力の限界が人並み外れて低いからといって他人を同類扱いするのは良くない
349デフォルトの名無しさん
2018/06/01(金) 14:43:43.87ID:s/+fnCQL >>346
お前のような拡大解釈したいやつは「ユニコードの利用は推奨しない」で覚えておけば漏れがなくて完璧だな。
お前のような拡大解釈したいやつは「ユニコードの利用は推奨しない」で覚えておけば漏れがなくて完璧だな。
350デフォルトの名無しさん
2018/06/01(金) 22:29:28.35ID:/Zhh/Hrk351デフォルトの名無しさん
2018/06/01(金) 22:43:44.67352デフォルトの名無しさん
2018/06/01(金) 23:15:14.57ID:/Zhh/Hrk353デフォルトの名無しさん
2018/06/01(金) 23:19:16.78ID:d/KZJvqH 既にデマは溢れてるので、今さら少しくらいデマが増えたところで、どうってことないという見方もあるが
規格の話をするなら細かい点を無視するとかありえない。
あえて >>350 にさらに細かい点をつっこむと
U+3300 - U+33FF は CJK互換ブロック(CJK Compatibility Block)
U+F900 - U+FAFF は CJK互換漢字ブロック(CJK Compatibility Ideograph Block)
とするのが正しいはずで「CJK互換文字」というのは表現は規格にはなかったと思う。
他にも
CJK Compatibility Forms (U+FE30 - UFE4F)
CJK Compatibility Ideograph Supplement (U+2F800 - U+2FA1D)
とかもあるので、勝手な名前とか使い始めるのはデマの元。
規格の話をするなら細かい点を無視するとかありえない。
あえて >>350 にさらに細かい点をつっこむと
U+3300 - U+33FF は CJK互換ブロック(CJK Compatibility Block)
U+F900 - U+FAFF は CJK互換漢字ブロック(CJK Compatibility Ideograph Block)
とするのが正しいはずで「CJK互換文字」というのは表現は規格にはなかったと思う。
他にも
CJK Compatibility Forms (U+FE30 - UFE4F)
CJK Compatibility Ideograph Supplement (U+2F800 - U+2FA1D)
とかもあるので、勝手な名前とか使い始めるのはデマの元。
354デフォルトの名無しさん
2018/06/02(土) 03:00:41.99 弊社の開発プロジェクトでは「CJK互換」と名の付く文字は一律使用禁止とします
355デフォルトの名無しさん
2018/06/02(土) 05:43:50.91ID:6Boi961X Unicodeが公式に「利用を推奨しない」と明言しているのはCJK互換表意文字のそれも一部ってことはデマじゃないよね?
356デフォルトの名無しさん
2018/06/02(土) 06:07:25.49ID:23A3G5JH ここまでの議論読ませてもらったが
「利用を推奨しない」
と
「(他規格)との完全ラウンドトリップ互換を提供すためにユニコード規格に含まれている、それ以外の目的に使用すべきではない」
とだと規格上の意味が全然違う気がするんだが?
前者は利用の否定で、後者は利用目的の限定で利用は否定してない。
「利用を推奨しない」
と
「(他規格)との完全ラウンドトリップ互換を提供すためにユニコード規格に含まれている、それ以外の目的に使用すべきではない」
とだと規格上の意味が全然違う気がするんだが?
前者は利用の否定で、後者は利用目的の限定で利用は否定してない。
357デフォルトの名無しさん
2018/06/02(土) 08:33:48.72ID:6Boi961X358デフォルトの名無しさん
2018/06/02(土) 13:06:52.93ID:23A3G5JH 「これは食べられません」
と
「電子レンジ調理専用」
と
「電子レンジ調理専用」
359デフォルトの名無しさん
2018/06/02(土) 13:52:43.55ID:yUEJ+BJS Scheduled maintenance on June 2 and June 9 between 5am pst and 6pm pst. Expect down times of up to 5 hours while we upgrade the power feeds in our data center.
5ちゃんねるサーバ群が収容されているデータセンタにおいて給電装置の更新のため閲覧書き込みが出来なくなります
予定されている期間は以下の通りです
2018年6月2日(土)21時から2018年6月3日(日)10時
2018年6月9日(土)21時から2018年6月3日(日)10時
上記時間帯のうち最大5時間程度の停電が発生すると予想されています
不便をお掛けしますがよろしくお願い致します
5ちゃんねるサーバ群が収容されているデータセンタにおいて給電装置の更新のため閲覧書き込みが出来なくなります
予定されている期間は以下の通りです
2018年6月2日(土)21時から2018年6月3日(日)10時
2018年6月9日(土)21時から2018年6月3日(日)10時
上記時間帯のうち最大5時間程度の停電が発生すると予想されています
不便をお掛けしますがよろしくお願い致します
361デフォルトの名無しさん
2018/06/04(月) 17:00:48.61ID:pTAw0294 >>342
マジか、マジだ
つまり最初に入ったKS X 1001/Big5/IBMは仕様書上では何も言われてなくて
後から入ったJIS X 0213とかは「ラウンドトリップ以外の使用は推奨しない」と明記なのか。
こんなことならJIS X 0213も無理してBMPに入れずにCNS 11643の残りと一緒にCJK統合漢字拡張Bに入れてもらえばよかったのに
(それが可能だったのかどうかは知らない)。
マジか、マジだ
つまり最初に入ったKS X 1001/Big5/IBMは仕様書上では何も言われてなくて
後から入ったJIS X 0213とかは「ラウンドトリップ以外の使用は推奨しない」と明記なのか。
こんなことならJIS X 0213も無理してBMPに入れずにCNS 11643の残りと一緒にCJK統合漢字拡張Bに入れてもらえばよかったのに
(それが可能だったのかどうかは知らない)。
362デフォルトの名無しさん
2018/06/04(月) 23:13:57.26ID:M5dk3jbS 後半、ちょっと違うんでは? JIS X 0213 の追加漢字は別に無理して BMP に入ってない。普通に Exntend の方に入ってる。
JIS X 0213 と Unicode の包摂基準の違いから1対多対応の部分があって、ラウンドトリップを保証したかったら互換文字が必要になった。
そして必要な互換漢字は少数で、たまたまBMPのCJK 互換漢字漢字ブロックの後半がガラ空きだったので、そこにつっこまれた。
って話だったと思う。
JIS X 0213 と Unicode の包摂基準の違いから1対多対応の部分があって、ラウンドトリップを保証したかったら互換文字が必要になった。
そして必要な互換漢字は少数で、たまたまBMPのCJK 互換漢字漢字ブロックの後半がガラ空きだったので、そこにつっこまれた。
って話だったと思う。
363デフォルトの名無しさん
2018/06/04(月) 23:20:06.40ID:M5dk3jbS 規格がいってるのは CJK互換漢字ブロックはもともと複数の文字コードとのラウンドトリップ用なんだけど、
指定した一部の範囲は "JIS X 0213:2000" とのラウンドトリップ専用で、他の文字コードとのラウンドトリップにも使うべきではないということ。
指定した一部の範囲は "JIS X 0213:2000" とのラウンドトリップ専用で、他の文字コードとのラウンドトリップにも使うべきではないということ。
364デフォルトの名無しさん
2018/06/06(水) 14:26:39.66ID:R+kWiM6Z Announcing The Unicode Standard, Version 11.0
http://blog.unicode.org/2018/06/announcing-unicode-standard-version-110.html
http://blog.unicode.org/2018/06/announcing-unicode-standard-version-110.html
365デフォルトの名無しさん
2018/06/07(木) 22:48:02.08ID:YXHr2tyJ Unicode 11.0出たのか、つかもう一年経ったのか……。
> Five urgently needed CJK unified ideographs: three for newly standardized names of chemical elements, and two for Japan's government administration Moji Joho Kiban Project that includes ideographs for personal and place names
へー、これは知らなかった。
> Five urgently needed CJK unified ideographs: three for newly standardized names of chemical elements, and two for Japan's government administration Moji Joho Kiban Project that includes ideographs for personal and place names
へー、これは知らなかった。
366デフォルトの名無しさん
2018/06/07(木) 23:56:45.77ID:LqY2ZR0d 一昨年末に名称が正式決定したニホニウム等の元素を表す漢字がUROの末尾に追加になったんだな。
367デフォルトの名無しさん
2018/06/08(金) 00:10:00.49 そんなもんで漢字増やすなや!
368デフォルトの名無しさん
2018/06/08(金) 14:59:48.37ID:HNv18lZE 去年も書いたけど
Core Specification
Appendix D
Version History of the Standard
の漢字のとこの数字が足した数と合計で合わないんだよなぁ
48違うって何なんだろ。
Core Specification
Appendix D
Version History of the Standard
の漢字のとこの数字が足した数と合計で合わないんだよなぁ
48違うって何なんだろ。
369デフォルトの名無しさん
2018/06/08(金) 23:58:07.79ID:ljSzk/l3 CJK統合漢字のUROの空きコードポイントは残り16個か。次でとうとうU+9FF0番台になる。
それらも全部使い切ったらその次の少数の緊急に必要な漢字追加は拡張A末尾の空きU+40B6〜Fを使う事になるのかな。
でそこも使い切ったらBMPへの漢字追加は本当に終わりで拡張BやC、D…の末尾の空きを使用ってことになるんだろうな。
それらも全部使い切ったらその次の少数の緊急に必要な漢字追加は拡張A末尾の空きU+40B6〜Fを使う事になるのかな。
でそこも使い切ったらBMPへの漢字追加は本当に終わりで拡張BやC、D…の末尾の空きを使用ってことになるんだろうな。
370デフォルトの名無しさん
2018/06/09(土) 00:37:24.38ID:8sRiN6h8 文字列置換から除外するための一時退避の需要あるでしょ。
unicodeはプログラマが自由に使っていい領域ってどこだろう。
unicodeはプログラマが自由に使っていい領域ってどこだろう。
371デフォルトの名無しさん
2018/06/09(土) 01:02:14.54 「外字」でウィキれ
372デフォルトの名無しさん
2018/06/09(土) 09:13:51.52ID:8sRiN6h8373デフォルトの名無しさん
2018/06/09(土) 19:05:32.10ID:roRwdie6 curl 'http://www.unicode.org/Public/UCD/latest/ucd/UnicodeData.txt' | wc -l
とやると
32292
と返ってきたんだけど、つまり今現在Unicodeには32292文字が収録されていると思っていいのかな。
とやると
32292
と返ってきたんだけど、つまり今現在Unicodeには32292文字が収録されていると思っていいのかな。
374デフォルトの名無しさん
2018/06/10(日) 06:07:59.44ID:gv3HXRco 何?結局16バイトに収まってたという話?
375デフォルトの名無しさん
2018/06/10(日) 06:08:19.99ID:gv3HXRco ビットだ……恥ずかしい
376デフォルトの名無しさん
2018/06/10(日) 15:33:08.87ID:mkooDB8i377デフォルトの名無しさん
2018/06/10(日) 16:00:53.49ID:aEB47NCz Android P Beta 2、グリーンサラダの絵文字からゆで卵が消える | スラド デベロッパー
https://developers.srad.jp/story/18/06/09/0621201/
ゆで卵を入れる多様性は許されないのか
https://developers.srad.jp/story/18/06/09/0621201/
ゆで卵を入れる多様性は許されないのか
378デフォルトの名無しさん
2018/06/11(月) 13:52:38.76ID:HvQh9O78 ジェンダーの方もなんか過剰だよね。政治的な活動家でもいるのかね
サラダの絵文字からGoogle、「卵」を排除 生産者団体が異議、「卵を返せ」論争に
https://www.j-cast.com/2018/06/09330966.html?p=all
サラダの絵文字からGoogle、「卵」を排除 生産者団体が異議、「卵を返せ」論争に
https://www.j-cast.com/2018/06/09330966.html?p=all
379デフォルトの名無しさん
2018/06/11(月) 16:02:07.37ID:yunMmu3l なんか力抜けたわw
381デフォルトの名無しさん
2018/06/13(水) 00:45:51.71 どうなってんのこれ🤔
🌕🌔🌕🌕🌕🌕🌕🌕
🌕🌒🌕🌕🌕🌕🌕🌕
🌖🌓🌕🌕🌔🌕🌕🌕
🌖🌒🌕🌗🌑🌔🌕🌕
🌖🌑🌔🌘🌒🌕🌕🌕
🌕🌘🌑🌑🌑🌑🌒🌕
🌕🌕🌘🌑🌑🌑🌑🌒
🌕🌕🌖🌑🌑🌒🌗🌓
🌕🌕🌕🌘🌑🌑🌘🌔
🌕🌕🌖🌑🌑🌑🌘🌔
🌕🌕🌗🌑🌑🌑🌖🌔
🌕🌕🌕🌘🌑🌑🌕🌔
🌕🌕🌕🌗🌒🌘🌔🌕
🌕🌕🌕🌗🌒🌖🌒🌕
🌕🌕🌕🌗🌓🌕🌒🌕
🌕🌔🌕🌕🌕🌕🌕🌕
🌕🌒🌕🌕🌕🌕🌕🌕
🌖🌓🌕🌕🌔🌕🌕🌕
🌖🌒🌕🌗🌑🌔🌕🌕
🌖🌑🌔🌘🌒🌕🌕🌕
🌕🌘🌑🌑🌑🌑🌒🌕
🌕🌕🌘🌑🌑🌑🌑🌒
🌕🌕🌖🌑🌑🌒🌗🌓
🌕🌕🌕🌘🌑🌑🌘🌔
🌕🌕🌖🌑🌑🌑🌘🌔
🌕🌕🌗🌑🌑🌑🌖🌔
🌕🌕🌕🌘🌑🌑🌕🌔
🌕🌕🌕🌗🌒🌘🌔🌕
🌕🌕🌕🌗🌒🌖🌒🌕
🌕🌕🌕🌗🌓🌕🌒🌕
382デフォルトの名無しさん
2018/06/13(水) 00:55:38.87ID:ixGTG5kv 5ちゃんでemojiのAAは文字数制限が厳しいからどうしても小さくなりがちだな
383デフォルトの名無しさん
2018/06/13(水) 06:58:34.14ID:mbRQ9skB なにか問題でも?
🧙🧚🧛🧜🧝🧟
🧙🏻🧚🏻🧛🏻🧜🏻🧝🏻🧟🏻
🧙🏼🧚🏼🧛🏼🧜🏼🧝🏼🧟🏼
🧙🏽🧚🏽🧛🏽🧜🏽🧝🏽🧟🏽
🧙🏾🧚🏾🧛🏾🧜🏾🧝🏾🧟🏾
🧙🏿🧚🏿🧛🏿🧜🏿🧝🏿🧟🏿
🧙🧚🧛🧜🧝🧟
🧙🏻🧚🏻🧛🏻🧜🏻🧝🏻🧟🏻
🧙🏼🧚🏼🧛🏼🧜🏼🧝🏼🧟🏼
🧙🏽🧚🏽🧛🏽🧜🏽🧝🏽🧟🏽
🧙🏾🧚🏾🧛🏾🧜🏾🧝🏾🧟🏾
🧙🏿🧚🏿🧛🏿🧜🏿🧝🏿🧟🏿
384デフォルトの名無しさん
2018/06/17(日) 09:04:29.91ID:89kw/R7U ユニコードとUTF8は何が違うんでしょうか
どちらもユニコード?それとも別のコード?頭がおかしくなりそうです
SJISだけで全て丸く収まっていた平和な日本にとんだ黒船がやってきた・・・
どちらもユニコード?それとも別のコード?頭がおかしくなりそうです
SJISだけで全て丸く収まっていた平和な日本にとんだ黒船がやってきた・・・
385デフォルトの名無しさん
2018/06/17(日) 09:50:58.25ID:GftzeAnS アップル外字どうなの
386デフォルトの名無しさん
2018/06/17(日) 12:32:46.14ID:IMOrQ/Bc >>384
文字集合と文字符号の違いならわかる?
文字集合と文字符号の違いならわかる?
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【ひきこもり】「引き出し屋」の恐怖が今も消えない…着の身着のまま連行する「自立支援」の被害者たちの訴え [nita★]
- 【動物】オスザルの一部は同性へのマウンティング時に「挿入&射精」していたと判明 [おっさん友の会★]
- 印パ、互いに停戦違反主張 合意発表直後、履行に暗雲も [蚤の市★]
- 【文春】永野芽郁(25)&田中圭(40)燃え上がる不倫LINE ★41 [Ailuropoda melanoleuca★]
- 渡邊渚「私だから死んでないだけ」「私がちょっとでも変な気を起こしたら誰のせいになるんだろう」今も闘い続けるPTSD、SNS中傷 ★2 [muffin★]
- 【福岡】「うるさいから捕まえようと」パトカーから逃走中の2人乗りバイクに車で追突させた男(21)を逮捕 [おっさん友の会★]
- 【悲報】森ゆうこ元参院議員、積極財政論者によって完全に洗脳されるwww😂 [757644362]
- ワイ「この度カレー大臣に就任しました、これよりジャガイモを入れることを禁止します」
- 馬鹿「社会保障費を削減しろよぉ(泣)」👈あのさー、年々社会保障費が上がってもインフレしてこなかったやん😂 [757644362]
- 🏡💥🔨🥺💦んしょ…んしょ…
- 最新の全自動卓が凄い!点数計算もオートでやってくれるww
- 【爆笑】仮想通貨、もう笑いが止まらないw w w w w w w w w w w w w w w w w w w