プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
2018/01/22(月) 22:58:23.45ID:UK/uqEp5266デフォルトの名無しさん
2018/05/10(木) 13:12:41.31ID:MJdiSWqC >>265
もしかして、これかな?
以下のページに「ただし、Unicodeの仕様では、これらは互換性用の文字であり、対応するラテン文字を用いる方が良いとされています。」という記載がある。
ローマ数字 - CyberLibrarian
http://www.asahi-net.or.jp/~ax2s-kmtn/ref/roman_num.html
Unicode Chart で Roman numerals (U+2160とか) を見てみると Compatibility decomposition mapping としてラテン文字が記載されている。
これを以って上記ページの筆者が「ラテン文字を用いる方が良い」と記載しているのなら、それは解釈が正しくないように思う。
あくまでも互換性があるよ、というだけの注記だと思うのだがどうだろうか。
ちなみに Compatibility decomposition mapping の説明は、こちら。
↓
Code Charts - Help and Links
https://unicode.org/charts/About.html#Key
もしかして、これかな?
以下のページに「ただし、Unicodeの仕様では、これらは互換性用の文字であり、対応するラテン文字を用いる方が良いとされています。」という記載がある。
ローマ数字 - CyberLibrarian
http://www.asahi-net.or.jp/~ax2s-kmtn/ref/roman_num.html
Unicode Chart で Roman numerals (U+2160とか) を見てみると Compatibility decomposition mapping としてラテン文字が記載されている。
これを以って上記ページの筆者が「ラテン文字を用いる方が良い」と記載しているのなら、それは解釈が正しくないように思う。
あくまでも互換性があるよ、というだけの注記だと思うのだがどうだろうか。
ちなみに Compatibility decomposition mapping の説明は、こちら。
↓
Code Charts - Help and Links
https://unicode.org/charts/About.html#Key
267デフォルトの名無しさん
2018/05/10(木) 14:54:38.17ID:jFp8HxnE ふむ
268デフォルトの名無しさん
2018/05/10(木) 16:16:02.53ID:buMLMZ9N 互換分解が設定されてるだけか
270デフォルトの名無しさん
2018/05/13(日) 14:16:53.12ID:dvjI0llt 改元後も「平成」利用へ 納税や年金システム、混乱回避
https://www.asahi.com/articles/ASL5D4T75L5DUTFK004.html
https://www.asahi.com/articles/ASL5D4T75L5DUTFK004.html
271デフォルトの名無しさん
2018/05/15(火) 05:04:52.91ID:vxb29Zje Unicodeの漢字構成文字ってどういうときに使うか分かりますか?
272デフォルトの名無しさん
2018/05/15(火) 05:05:59.52ID:vxb29Zje すいません。漢字構成記述文字列のことです。
273デフォルトの名無しさん
2018/05/16(水) 16:21:48.39ID:MnaY7anS 18.2 表意の説明の文字
表意文字説明文字: U+2FF0–U+2FFB
Unicode Standardには75,000以上のCJK統一的な表意文字が含まれていますが、非常にまれなCJK表意文字の何千もの文字はエンコードされていません。
エンコードのための追加の表意文字の目録の研究は続けられているが、潜在的な符号化可能な表意文字のセット全体が完全に使い果たされることはないと予想される。
特に、表意文字は引き続き作成され、そのような新しい硬貨は常にエンコードされません。
表意文字記述ブロックの12文字は、符号化されていない表意文字を参照する必要があるテキストの標準的な交換の仕組みを提供します。
エンコードされていない表意文字は、これらの文字と符号化された表意文字を使用して記述できます。読者はその記述から表意文字の精神的な絵を作成することができる。
このプロセスは、表意文字の正式な符号化とは異なります。符号化されていない表意文字の標準的な記述はありません。
記述された表意文字に割り当てられた意味はない。記述された表意文字には同値が定義されていません。概念的には、表意文字の説明は、
文字列<U+0065、U+0301>より英語のフレーズ「an ‘e’」に鋭いアクセントを付けたものに近い。
特に、表意文字記述ブロック内の文字のサポートでは、レンダリングエンジンは記述された文字のグラフィック外観を再作成する必要はありません。
また、ユーザーが表意文字を使用して表す可能性のある表意文字の多くは、Unicode標準の将来のバージョンで正式にコード化されることにも注意してください。
表意文字説明文字: U+2FF0–U+2FFB
Unicode Standardには75,000以上のCJK統一的な表意文字が含まれていますが、非常にまれなCJK表意文字の何千もの文字はエンコードされていません。
エンコードのための追加の表意文字の目録の研究は続けられているが、潜在的な符号化可能な表意文字のセット全体が完全に使い果たされることはないと予想される。
特に、表意文字は引き続き作成され、そのような新しい硬貨は常にエンコードされません。
表意文字記述ブロックの12文字は、符号化されていない表意文字を参照する必要があるテキストの標準的な交換の仕組みを提供します。
エンコードされていない表意文字は、これらの文字と符号化された表意文字を使用して記述できます。読者はその記述から表意文字の精神的な絵を作成することができる。
このプロセスは、表意文字の正式な符号化とは異なります。符号化されていない表意文字の標準的な記述はありません。
記述された表意文字に割り当てられた意味はない。記述された表意文字には同値が定義されていません。概念的には、表意文字の説明は、
文字列<U+0065、U+0301>より英語のフレーズ「an ‘e’」に鋭いアクセントを付けたものに近い。
特に、表意文字記述ブロック内の文字のサポートでは、レンダリングエンジンは記述された文字のグラフィック外観を再作成する必要はありません。
また、ユーザーが表意文字を使用して表す可能性のある表意文字の多くは、Unicode標準の将来のバージョンで正式にコード化されることにも注意してください。
274デフォルトの名無しさん
2018/05/16(水) 16:22:58.76ID:MnaY7anS 表意記述アルゴリズムは、実質的に全てのCJK表意文字を、それ自体が表意文字であるより小さな部分に分解することができるという事実に依存する。
Unicode標準ですでにエンコードされている表意文字の広い範囲は、符号化されていない表意文字の大部分が表意文字を使用して表現できることを意味します。
表象記述シーケンスは、主に符号化されていない表意文字を表すことを目的としていますが、符号化された表意文字を表すためにデータ交換に使用すべきではありませんが、教育的および分析的用途もあります。
たとえば、研究者は、U+86D9 蛙を「虫圭」としてデータベースに表現して、U+5A03 娃などの音声を共有する他の文字との間のリンクを提供することができます。
IRGは、このような方法で表意記述シーケンスを使用して、現行の作業のための、機械によって生成された最初の近似を提供するのに役立てています。
Unicode標準ですでにエンコードされている表意文字の広い範囲は、符号化されていない表意文字の大部分が表意文字を使用して表現できることを意味します。
表象記述シーケンスは、主に符号化されていない表意文字を表すことを目的としていますが、符号化された表意文字を表すためにデータ交換に使用すべきではありませんが、教育的および分析的用途もあります。
たとえば、研究者は、U+86D9 蛙を「虫圭」としてデータベースに表現して、U+5A03 娃などの音声を共有する他の文字との間のリンクを提供することができます。
IRGは、このような方法で表意記述シーケンスを使用して、現行の作業のための、機械によって生成された最初の近似を提供するのに役立てています。
275デフォルトの名無しさん
2018/05/17(木) 01:28:29.13ID:zp+h7fJf Google翻訳ですか?
276デフォルトの名無しさん
2018/05/17(木) 12:27:06.84ID:HY+Xmele リンク貼るだけのレスの方がましだな
277デフォルトの名無しさん
2018/05/18(金) 14:45:32.55ID:Eucqc6d6 >>265 で「CJK互換用文字のように使用が推奨されない」とあるけど、その根拠ってどこにあるのか分かる方いますか?
日本語ウィキペディアには「後方互換性のために収録されており使用は推奨されない」と書かれてるけど、その根拠が明示されてないんですよね。
一応注釈も記載されてはいるんだけど、>>266と同じような資料なので「使用は推奨されない」とは読み取り難い気がする。
そこで英語ウィキペディアを見に行くと「for compatibility with east Asian character sets」とだけ書かれていて、「使用は推奨されない」という旨は一言も書いてない。
とまあ、こんなわけなので、この迷える子羊にどなたかご教示ください。
日本語ウィキペディアには「後方互換性のために収録されており使用は推奨されない」と書かれてるけど、その根拠が明示されてないんですよね。
一応注釈も記載されてはいるんだけど、>>266と同じような資料なので「使用は推奨されない」とは読み取り難い気がする。
そこで英語ウィキペディアを見に行くと「for compatibility with east Asian character sets」とだけ書かれていて、「使用は推奨されない」という旨は一言も書いてない。
とまあ、こんなわけなので、この迷える子羊にどなたかご教示ください。
278277
2018/05/18(金) 14:51:49.75ID:Eucqc6d6 いけね、URL を貼り忘れてた。
CJK互換用文字 - Wikipedia
https://ja.wikipedia.org/wiki/CJK%E4%BA%92%E6%8F%9B%E7%94%A8%E6%96%87%E5%AD%97
CJK Compatibility - Wikipedia
https://en.wikipedia.org/wiki/CJK_Compatibility
CJK互換用文字 - Wikipedia
https://ja.wikipedia.org/wiki/CJK%E4%BA%92%E6%8F%9B%E7%94%A8%E6%96%87%E5%AD%97
CJK Compatibility - Wikipedia
https://en.wikipedia.org/wiki/CJK_Compatibility
279デフォルトの名無しさん
2018/05/20(日) 21:42:19.91ID:k7uIgkh0 10646/Unicodeでは非推奨とまでは定めていないと思うよ
ローマ数字はShift_JISだと化けやすいんでローマ数字の使用そのものが悪みたいに
思ってる人がいるだけだと思う
ローマ数字はShift_JISだと化けやすいんでローマ数字の使用そのものが悪みたいに
思ってる人がいるだけだと思う
280デフォルトの名無しさん
2018/05/20(日) 22:44:23.30ID:SBKTPpMQ 0点、1点、2点、…とかMS明朝やゴシックに入ってるのを最初見た時、試合等の点数を表すためのものかと思ってた。
でも名称を調べて違う事を知った。そしてそれらは中国語のためのもので中国語では時刻の○時が○点になることも。
でも名称を調べて違う事を知った。そしてそれらは中国語のためのもので中国語では時刻の○時が○点になることも。
281デフォルトの名無しさん
2018/05/21(月) 10:10:37.23ID:PPw/imVw282デフォルトの名無しさん
2018/05/21(月) 10:11:23.00ID:PPw/imVw283デフォルトの名無しさん
2018/05/21(月) 10:13:27.36ID:6DKDYwaD 0点
やり直せ
やり直せ
284デフォルトの名無しさん
2018/05/21(月) 12:38:29.27ID:3MQFDVVp 日本語フォントの場合は点を時に
韓国語フォントの場合は시に
繁体字フォントの場合は點に
はダメなんだろうか。
韓国語フォントの場合は시に
繁体字フォントの場合は點に
はダメなんだろうか。
285デフォルトの名無しさん
2018/05/21(月) 13:07:55.25ID:5HdLEL73 日本語フォントの場合は時を時に
韓国語フォントの場合は時に
繁体字フォントの場合は時に
はダメなんだろうか。
韓国語フォントの場合は時に
繁体字フォントの場合は時に
はダメなんだろうか。
286デフォルトの名無しさん
2018/05/21(月) 15:22:15.07ID:XnV9ry7u CJK互換文字非推奨とかローマ数字非推奨とか、根拠の乏しいアピールがあちこちにあるのが気持ち悪い。
自分の好みを主張するのは構わないけど、Unicode でそのように提言されているかのように振る舞うのは気に入らない。
……という気持ちはどこにぶつければよいのだろうか?
自分の好みを主張するのは構わないけど、Unicode でそのように提言されているかのように振る舞うのは気に入らない。
……という気持ちはどこにぶつければよいのだろうか?
287デフォルトの名無しさん
2018/05/21(月) 15:47:01.21ID:h7wqMmMV 取り敢えず>>266のリンク先の作者にぶつけるべきでは
288デフォルトの名無しさん
2018/05/21(月) 21:39:44.96ID:owdLx3Iu ㌀㌁㌂e㌄㌅㌆㌇㌈㌉
㌊㌋㌌i㌎㌏㌐㌑㌒㌓
`㌕㌖㌗c㌙㌚㌛㌜㌝
㌞㌟㌠㌡ak㌤㌥jd
㌨㌩㌪l㌬㌭㌮㌯㌰㌱
㌲㌳㌴㌵f㌷㌸㌹㌺n
㌼㌽㌾㌿㍀㍁㍂㍃㍄㍅
㍆㍇㍈_m㍋㍌b㍎㍏
㍐g㍒㍓㍔㍕㍖h㍘㍙
㍚㍛㍜㍝㍞㍟㍠㍡㍢㍣
㍤㍥㍦㍧㍨㍩㍪㍫㍬㍭
㍮㍯㍰㍱㍲㍳㍴㍵㍶㍷
㍸㍹㍺~順紫㍿
㌊㌋㌌i㌎㌏㌐㌑㌒㌓
`㌕㌖㌗c㌙㌚㌛㌜㌝
㌞㌟㌠㌡ak㌤㌥jd
㌨㌩㌪l㌬㌭㌮㌯㌰㌱
㌲㌳㌴㌵f㌷㌸㌹㌺n
㌼㌽㌾㌿㍀㍁㍂㍃㍄㍅
㍆㍇㍈_m㍋㍌b㍎㍏
㍐g㍒㍓㍔㍕㍖h㍘㍙
㍚㍛㍜㍝㍞㍟㍠㍡㍢㍣
㍤㍥㍦㍧㍨㍩㍪㍫㍬㍭
㍮㍯㍰㍱㍲㍳㍴㍵㍶㍷
㍸㍹㍺~順紫㍿
289デフォルトの名無しさん
2018/05/21(月) 21:42:15.10ID:owdLx3Iu ㎀㎁
㎂㎃㎄㎅㎆㎇㎈㎉㎊㎋
㎌㎍rs㎐㎑㎒㎓㎔㎕
㎖㎗㎘㎙㎚㎛opq㎟
㎠u㎢㎣㎤㎥㎦㎧㎨㎩
㎪㎫㎬㎭㎮㎯㎰㎱㎲㎳
㎴㎵㎶㎷㎸㎹㎺㎻㎼㎽
㎾㎿㏀㏁㏂㏃t㏅㏆㏇
㏈㏉㏊㏋㏌㏎㏏㏐㏑
㏒㏓㏔㏕㏖㏗㏘㏙㏚㏛
㏜㏝㏞㏟㏠㏡㏢㏣㏤㏥
㏦㏧㏨㏩㏪㏫㏬㏭㏮㏯
㏰㏱㏲㏳㏴㏵㏶㏷㏸㏹
㏺㏻㏼㏽㏾㏿
㎂㎃㎄㎅㎆㎇㎈㎉㎊㎋
㎌㎍rs㎐㎑㎒㎓㎔㎕
㎖㎗㎘㎙㎚㎛opq㎟
㎠u㎢㎣㎤㎥㎦㎧㎨㎩
㎪㎫㎬㎭㎮㎯㎰㎱㎲㎳
㎴㎵㎶㎷㎸㎹㎺㎻㎼㎽
㎾㎿㏀㏁㏂㏃t㏅㏆㏇
㏈㏉㏊㏋㏌㏎㏏㏐㏑
㏒㏓㏔㏕㏖㏗㏘㏙㏚㏛
㏜㏝㏞㏟㏠㏡㏢㏣㏤㏥
㏦㏧㏨㏩㏪㏫㏬㏭㏮㏯
㏰㏱㏲㏳㏴㏵㏶㏷㏸㏹
㏺㏻㏼㏽㏾㏿
290デフォルトの名無しさん
2018/05/21(月) 21:59:03.03ID:V+3Z+fIi 頭がおかしくなりそうだ
291デフォルトの名無しさん
2018/05/21(月) 22:38:58.14ID:x+xM1a4p 絵文字テスト😁
292デフォルトの名無しさん
2018/05/21(月) 22:58:22.68ID:kKTehq+9 >>288
2バイト文字ってやはり狂っているな
なぜこのようなものまで一字で表示しようと考えたのか…
一字にすることで容量を節約できると考えたのだろうが、
その節約のために無駄な手間暇がかかり結果的にマイナスにしかならないという
2バイト文字ってやはり狂っているな
なぜこのようなものまで一字で表示しようと考えたのか…
一字にすることで容量を節約できると考えたのだろうが、
その節約のために無駄な手間暇がかかり結果的にマイナスにしかならないという
293デフォルトの名無しさん
2018/05/21(月) 23:23:05.67ID:XnV9ry7u294デフォルトの名無しさん
2018/05/22(火) 00:22:22.07ID:3h/yZ372 肌色テスト👮
👮🏻👮🏼👮🏽👮🏾👮🏿
👮🏻👮🏼👮🏽👮🏾👮🏿
295デフォルトの名無しさん
2018/05/22(火) 00:47:54.81 ○囲み文字の1字版と2字版のテストもおながいします
296293
2018/05/22(火) 00:49:04.48ID:pl4uFglU 酔った勢いでレスしたら自演だった……恥ずかしい (いきなり酔いが覚めた)。
つまんないことしちゃってごめん、しばらく自重します。
つまんないことしちゃってごめん、しばらく自重します。
297デフォルトの名無しさん
2018/05/22(火) 04:36:23.18ID:XuSnYVx6 絵文字そのものはどうとも思ってないけど
通常の文章の中で使われる矢印がある種の入力環境だと絵文字で入力されるみたいで
「←このように」が「⬅このように」ってなるのがすごく気持ち悪い。UnicodeというよりIMEに対する不満。
通常の文章の中で使われる矢印がある種の入力環境だと絵文字で入力されるみたいで
「←このように」が「⬅このように」ってなるのがすごく気持ち悪い。UnicodeというよりIMEに対する不満。
298デフォルトの名無しさん
2018/05/22(火) 11:48:04.68ID:3h/yZ372 全角チルダがwindowsユーザーとmacユーザーで違うのも厄介
windows 〜
mac 〜
windows 〜
mac 〜
299デフォルトの名無しさん
2018/05/22(火) 11:57:18.21ID:xGwd/XeK @ABCDEFGHIJKLMNOPQRS
301デフォルトの名無しさん
2018/05/22(火) 13:35:03.46ID:d3LCNcLv オマエガナー
302デフォルトの名無しさん
2018/05/22(火) 13:36:25.53ID:1HkhrVs+ プッ
303デフォルトの名無しさん
2018/05/22(火) 14:15:36.11ID:3h/yZ372 化けてますよ。
👻 🎃 👹 👺 👽 💀 🧛 🧟
👻 🎃 👹 👺 👽 💀 🧛 🧟
304デフォルトの名無しさん
2018/05/22(火) 14:35:44.60ID:xGwd/XeK 🏇̪鹿
🐎鹿
🐴鹿
🐎鹿
🐴鹿
305デフォルトの名無しさん
2018/05/22(火) 14:45:39.70ID:3h/yZ372 ひょっとしてバカなの?
🏇🦌
🐎🦌
🐴🦌
🏇🦌
🐎🦌
🐴🦌
306デフォルトの名無しさん
2018/05/22(火) 18:00:59.35ID:KBN0pglL >>305
化けてんぞバーカwwwww
化けてんぞバーカwwwww
307デフォルトの名無しさん
2018/05/22(火) 18:47:42.14ID:XuSnYVx6 ということにしたいのですね
308デフォルトの名無しさん
2018/05/23(水) 02:23:03.50ID:Z0QXrqgL unicode と ISO10646 は互換性があるけど適用範囲とか微妙に違ったりする。
非推奨とかはISO/JISの方を念頭に置いた話ではなかろうか。
非推奨とかはISO/JISの方を念頭に置いた話ではなかろうか。
309デフォルトの名無しさん
2018/05/23(水) 18:48:25.05ID:2DlA2Ju+ ローマ数字の話だよね?
ISO/IEC 10646にもそんな規定は無いような……コードチャートはUnicodeと同じもの使ってるし。
JIS X 0221の方は真面目に読んでないからよく分からんが……
でもISO/IEC 10646の国際一致規格な以上日本独自でそんな規定は入ってないと思うけど。
ISO/IEC 10646にもそんな規定は無いような……コードチャートはUnicodeと同じもの使ってるし。
JIS X 0221の方は真面目に読んでないからよく分からんが……
でもISO/IEC 10646の国際一致規格な以上日本独自でそんな規定は入ってないと思うけど。
310デフォルトの名無しさん
2018/05/24(木) 01:13:38.27ID:Nk0sJPwS311デフォルトの名無しさん
2018/05/24(木) 01:29:22.08ID:fftgGS82 ここにはまだ来てないのか
312デフォルトの名無しさん
2018/05/24(木) 14:00:09.03ID:A4JtYMZ4 ローマ数字やCJK互換用文字が「推奨されない」という記述がブログやWikipediaに散見されるけど、それって根拠が無いよね? という話だと思って眺めてるよ。
こういう聞こえの良いデマを否定するのは体力がいるから面倒そうだよなー
こういう聞こえの良いデマを否定するのは体力がいるから面倒そうだよなー
313デフォルトの名無しさん
2018/05/24(木) 14:03:05.24ID:fftgGS82 TUVWXYZ[\]ⅪⅫ
Ⅽ
Ⅿ
ↂ
Ⅽ
Ⅿ
ↂ
314デフォルトの名無しさん
2018/05/25(金) 01:56:34.37ID:562g8vT6 >>312
いつものネット伝言ゲームじゃないか?
日本語での利用を前提として、うろ覚えだけど
1. ISO10646とユニコード規格は厳密に言えば同じではない(事実)
2. ISO10646 は部分実装を許しているための全ての文字が等価ではない(事実)
3. ISO/JIS は部分実装のために日本語向けの文字の組を決めてる(事実)
4. ユニコード実装するならば、日本語向けの文字の組のうち主要なもにには対応すべき(たんなる日本人の願望)
5. ネットなどで不特定多数との通信する前提の場合には、主要な組に入ってない文字は相手側で読めない可能性があるので推奨しない(どこかの個人の意見ならわからなくもない)
6. 日本語のための文字の組にはローマ数字は含まれていない(微妙、ISO規格本体にはまだ入ってないが、JISの参考になら含まれた気がする)
...
中略
...
99.ユニコード規格でローマ数字は推奨されない(デマ)
いつものネット伝言ゲームじゃないか?
日本語での利用を前提として、うろ覚えだけど
1. ISO10646とユニコード規格は厳密に言えば同じではない(事実)
2. ISO10646 は部分実装を許しているための全ての文字が等価ではない(事実)
3. ISO/JIS は部分実装のために日本語向けの文字の組を決めてる(事実)
4. ユニコード実装するならば、日本語向けの文字の組のうち主要なもにには対応すべき(たんなる日本人の願望)
5. ネットなどで不特定多数との通信する前提の場合には、主要な組に入ってない文字は相手側で読めない可能性があるので推奨しない(どこかの個人の意見ならわからなくもない)
6. 日本語のための文字の組にはローマ数字は含まれていない(微妙、ISO規格本体にはまだ入ってないが、JISの参考になら含まれた気がする)
...
中略
...
99.ユニコード規格でローマ数字は推奨されない(デマ)
315デフォルトの名無しさん
2018/05/26(土) 14:41:00.14ID:OAwkZ9ha > 6. 日本語のための文字の組にはローマ数字は含まれていない(微妙、ISO規格本体にはまだ入ってないが、JISの参考になら含まれた気がする)
昨年末の ISO10646の改訂でJISが参考で定義していた COMMON JAPANESE も正式にISO規格に取り込まれた模様。
ということでローマ数字は BASIC JAPANESE には含まれてないけど COMMON JAPANESE には含まれてるくらいの位置付け。
昨年末の ISO10646の改訂でJISが参考で定義していた COMMON JAPANESE も正式にISO規格に取り込まれた模様。
ということでローマ数字は BASIC JAPANESE には含まれてないけど COMMON JAPANESE には含まれてるくらいの位置付け。
316デフォルトの名無しさん
2018/05/26(土) 22:58:23.91ID:oSB4DgY3 285 BASIC JAPANESE と 287 COMMON JAPANESE が 10646 に入ったのは10年前の ISO/IEC 10646:2003/Amd 3:2008 じゃないの?
昨年末の改訂とか正式にISO規格にって何の話?
昨年末の改訂とか正式にISO規格にって何の話?
317デフォルトの名無しさん
2018/05/26(土) 23:54:42.44ID:OAwkZ9ha もう JIS参考でも、amd でもなくて、正式規格本体にあるよ。情報古かったという話。
Amd3:2008 にあるんなら正式規格 ISO/IEC 10646:2012 にもあるかもしれん。確認できんけど。
Amd3:2008 にあるんなら正式規格 ISO/IEC 10646:2012 にもあるかもしれん。確認できんけど。
318デフォルトの名無しさん
2018/05/27(日) 10:24:34.33ID:rLKmcl7g 規格本体に入ったのは ISO/IEC 10646:2011
319デフォルトの名無しさん
2018/05/28(月) 01:39:25.84ID:Ci0ddO0a >>286,312
CJK互換文字のラウンドトリップ用のものはUnicode規格書に明記されてる
> They are included in the Unicode Standard to provide full round-trip compatibility
> with the ideographic repertoire of ... and should not be used for any other purpose.
http://www.unicode.org/versions/Unicode10.0.0/ch18.pdf#page=21
CJK互換文字のラウンドトリップ用のものはUnicode規格書に明記されてる
> They are included in the Unicode Standard to provide full round-trip compatibility
> with the ideographic repertoire of ... and should not be used for any other purpose.
http://www.unicode.org/versions/Unicode10.0.0/ch18.pdf#page=21
320デフォルトの名無しさん
2018/05/28(月) 13:25:04.14ID:+smoTcYJ 「推奨しない」でたね
321デフォルトの名無しさん
2018/05/28(月) 14:52:12.71ID:AZENlZb2 素晴らしい。こういうちゃんとした情報は歓迎するよ。
そうか、CJK互換文字の利用は「推奨しない」と仕様書に明記されているんだね。覚えておこう。
そうか、CJK互換文字の利用は「推奨しない」と仕様書に明記されているんだね。覚えておこう。
322デフォルトの名無しさん
2018/05/28(月) 16:00:24.98ID:OZmKBhwA 「完全なラウンドトリップ互換性の為に提供するものであり、それ以外の使用は推奨しない」
だから問答無用で“should not be used”と言ってる訳じゃないけどね。
だから問答無用で“should not be used”と言ってる訳じゃないけどね。
323デフォルトの名無しさん
2018/05/28(月) 22:09:23.88 こまけえこたあいいんだよ
324デフォルトの名無しさん
2018/05/29(火) 11:31:12.88ID:gAWLYOTz325デフォルトの名無しさん
2018/05/29(火) 11:40:21.01ID:QKhV4oKb 伝聞デマの好例
326デフォルトの名無しさん
2018/05/29(火) 18:40:11.76ID:P35/pWO/ 結局デマじゃないんでしょ?
327デフォルトの名無しさん
2018/05/29(火) 22:34:44.54ID:j6aBPmpG 324は何を怒ってるんだ
319のフレーズは複数回出てきてその都度...の部分の規格書名が変わるだけだろうに
319のフレーズは複数回出てきてその都度...の部分の規格書名が変わるだけだろうに
328デフォルトの名無しさん
2018/05/30(水) 12:07:23.64ID:iPjSEnXB いやだからUnicode公式が推奨しないと言ってるのは事実なんだろ。デマじゃないじゃん。
なんでもかんでもデマ扱いすれば自分が偉くなったような錯覚になって気分が良いのかもしれないが
迷惑だよ、そういう態度は。
なんでもかんでもデマ扱いすれば自分が偉くなったような錯覚になって気分が良いのかもしれないが
迷惑だよ、そういう態度は。
329デフォルトの名無しさん
2018/05/30(水) 13:24:00.49ID:uOQbJF8C330デフォルトの名無しさん
2018/05/30(水) 14:33:31.86ID:glkZKJxk 復旧
🖕🏻🖕🏼🖕🏽🖕🏾🖕🏿🖕
🖕🏻🖕🏼🖕🏽🖕🏾🖕🏿🖕
331デフォルトの名無しさん
2018/05/30(水) 20:29:52.46ID:+kRmOuNK >>329
多分違う。
「CJK互換文字の一部には特定目的以外に使用すべきでない文字がある」が正しい。
318 はわざとか天然かは知らんが、CJK互換文字の一部にしか適用されないルールを、適用範囲の部分を抜かして引用して、あたかも全体に適用するルールであるかのように誤解する書き方をしてある。
あとは、それを鵜呑みした迂闊さんが「CJK互換文字は推奨されない(キリッ)」ってデマを広げる構図。
多分違う。
「CJK互換文字の一部には特定目的以外に使用すべきでない文字がある」が正しい。
318 はわざとか天然かは知らんが、CJK互換文字の一部にしか適用されないルールを、適用範囲の部分を抜かして引用して、あたかも全体に適用するルールであるかのように誤解する書き方をしてある。
あとは、それを鵜呑みした迂闊さんが「CJK互換文字は推奨されない(キリッ)」ってデマを広げる構図。
332デフォルトの名無しさん
2018/05/30(水) 20:46:20.24ID:/bFYrAtR だから「ラウンドトリップ用」って話だろ?
333デフォルトの名無しさん
2018/05/30(水) 20:50:56.47ID:+kRmOuNK >>331
タイプミス。318→319
タイプミス。318→319
334デフォルトの名無しさん
2018/05/30(水) 20:55:57.87ID:+kRmOuNK335デフォルトの名無しさん
2018/05/30(水) 21:06:09.88ID:JjJ1rb8T 気に入らないなら自分で満足の行くように書き直して貼り付ければ?
典拠示されてるんだから。
典拠示されてるんだから。
336デフォルトの名無しさん
2018/05/31(木) 00:48:48.00ID:Rt4SPplt そんな中途半端に書き直して貼り付けるからデマの元になるんだろ。反省しろ。
337デフォルトの名無しさん
2018/05/31(木) 05:31:03.12ID:fKyHNhNo デマはどっちだよ……「CJK互換文字は」という文脈からは「CJK互換文字に含まれる全ての文字は」という意味しか受け取れないのだが?
「一部」なんていう表現はどっから湧き出てきたんだよ……。
「一部」なんていう表現はどっから湧き出てきたんだよ……。
338デフォルトの名無しさん
2018/05/31(木) 09:53:50.67ID:Rt4SPplt339デフォルトの名無しさん
2018/05/31(木) 12:04:29.61 ケチ付けるんなら他人を納得させられる論拠と出典を出せよ
それができないんなら『CJK互換文字の利用は「推奨しない」』が正解だ
それができないんなら『CJK互換文字の利用は「推奨しない」』が正解だ
340デフォルトの名無しさん
2018/05/31(木) 15:11:25.68ID:LXR1oL3d 南京大虐殺は30万人アルニダ
341デフォルトの名無しさん
2018/05/31(木) 20:31:47.82ID:fKyHNhNo 誰か結論下さい(他力本願)。
342デフォルトの名無しさん
2018/05/31(木) 23:08:01.93ID:CO1u2co/ >>319のリンク先の規格書で、ラウンドトリップ用だから使用を推奨しないとされているのは以下の3種類だけ。
全体を非推奨とはしていないな。
・U+FA30〜U+FA6A (JIS X 0213:2000)
・U+FA6B〜U+FA6D (ARIB STD-B24)
・U+FA70〜U+FAD9 (KPS 10721-2000)
全体を非推奨とはしていないな。
・U+FA30〜U+FA6A (JIS X 0213:2000)
・U+FA6B〜U+FA6D (ARIB STD-B24)
・U+FA70〜U+FAD9 (KPS 10721-2000)
343デフォルトの名無しさん
2018/06/01(金) 05:30:12.89ID:vog2AnDp 誰が誰かよくわかんないけど少なくともCJK互換漢字の一部に関しては
非推奨の根拠はあったってことでしょ
不正確だと思ったならそうじゃなくてこうだって言えばそれで済んだ話だろうに
そうせずにネチネチ言うばっかだから無駄に荒れる
非推奨の根拠はあったってことでしょ
不正確だと思ったならそうじゃなくてこうだって言えばそれで済んだ話だろうに
そうせずにネチネチ言うばっかだから無駄に荒れる
344デフォルトの名無しさん
2018/06/01(金) 07:06:38.23ID:RdSMK5as345デフォルトの名無しさん
2018/06/01(金) 08:37:44.05ID:d/KZJvqH >>343
一部でしかないのを全部のように言うから伝聞デマって言われたんだろ。
一部でしかないのを全部のように言うから伝聞デマって言われたんだろ。
346デフォルトの名無しさん
2018/06/01(金) 11:58:37.96 >>342
一般の開発者やユーザーは「CJK互換文字の利用は推奨しない」で覚えておいた方が漏れがなくて安心だな
一般の開発者やユーザーは「CJK互換文字の利用は推奨しない」で覚えておいた方が漏れがなくて安心だな
347デフォルトの名無しさん
2018/06/01(金) 12:07:07.22ID:uCsHgk1n 規格書嫁とか無茶言うやつがいます。
あれは暗号で書いてあるので書いた人にも読めません。
あれは暗号で書いてあるので書いた人にも読めません。
348デフォルトの名無しさん
2018/06/01(金) 12:41:04.24ID:gevSrdmF あなたの能力の限界が人並み外れて低いからといって他人を同類扱いするのは良くない
349デフォルトの名無しさん
2018/06/01(金) 14:43:43.87ID:s/+fnCQL >>346
お前のような拡大解釈したいやつは「ユニコードの利用は推奨しない」で覚えておけば漏れがなくて完璧だな。
お前のような拡大解釈したいやつは「ユニコードの利用は推奨しない」で覚えておけば漏れがなくて完璧だな。
350デフォルトの名無しさん
2018/06/01(金) 22:29:28.35ID:/Zhh/Hrk351デフォルトの名無しさん
2018/06/01(金) 22:43:44.67352デフォルトの名無しさん
2018/06/01(金) 23:15:14.57ID:/Zhh/Hrk353デフォルトの名無しさん
2018/06/01(金) 23:19:16.78ID:d/KZJvqH 既にデマは溢れてるので、今さら少しくらいデマが増えたところで、どうってことないという見方もあるが
規格の話をするなら細かい点を無視するとかありえない。
あえて >>350 にさらに細かい点をつっこむと
U+3300 - U+33FF は CJK互換ブロック(CJK Compatibility Block)
U+F900 - U+FAFF は CJK互換漢字ブロック(CJK Compatibility Ideograph Block)
とするのが正しいはずで「CJK互換文字」というのは表現は規格にはなかったと思う。
他にも
CJK Compatibility Forms (U+FE30 - UFE4F)
CJK Compatibility Ideograph Supplement (U+2F800 - U+2FA1D)
とかもあるので、勝手な名前とか使い始めるのはデマの元。
規格の話をするなら細かい点を無視するとかありえない。
あえて >>350 にさらに細かい点をつっこむと
U+3300 - U+33FF は CJK互換ブロック(CJK Compatibility Block)
U+F900 - U+FAFF は CJK互換漢字ブロック(CJK Compatibility Ideograph Block)
とするのが正しいはずで「CJK互換文字」というのは表現は規格にはなかったと思う。
他にも
CJK Compatibility Forms (U+FE30 - UFE4F)
CJK Compatibility Ideograph Supplement (U+2F800 - U+2FA1D)
とかもあるので、勝手な名前とか使い始めるのはデマの元。
354デフォルトの名無しさん
2018/06/02(土) 03:00:41.99 弊社の開発プロジェクトでは「CJK互換」と名の付く文字は一律使用禁止とします
355デフォルトの名無しさん
2018/06/02(土) 05:43:50.91ID:6Boi961X Unicodeが公式に「利用を推奨しない」と明言しているのはCJK互換表意文字のそれも一部ってことはデマじゃないよね?
356デフォルトの名無しさん
2018/06/02(土) 06:07:25.49ID:23A3G5JH ここまでの議論読ませてもらったが
「利用を推奨しない」
と
「(他規格)との完全ラウンドトリップ互換を提供すためにユニコード規格に含まれている、それ以外の目的に使用すべきではない」
とだと規格上の意味が全然違う気がするんだが?
前者は利用の否定で、後者は利用目的の限定で利用は否定してない。
「利用を推奨しない」
と
「(他規格)との完全ラウンドトリップ互換を提供すためにユニコード規格に含まれている、それ以外の目的に使用すべきではない」
とだと規格上の意味が全然違う気がするんだが?
前者は利用の否定で、後者は利用目的の限定で利用は否定してない。
357デフォルトの名無しさん
2018/06/02(土) 08:33:48.72ID:6Boi961X358デフォルトの名無しさん
2018/06/02(土) 13:06:52.93ID:23A3G5JH 「これは食べられません」
と
「電子レンジ調理専用」
と
「電子レンジ調理専用」
359デフォルトの名無しさん
2018/06/02(土) 13:52:43.55ID:yUEJ+BJS Scheduled maintenance on June 2 and June 9 between 5am pst and 6pm pst. Expect down times of up to 5 hours while we upgrade the power feeds in our data center.
5ちゃんねるサーバ群が収容されているデータセンタにおいて給電装置の更新のため閲覧書き込みが出来なくなります
予定されている期間は以下の通りです
2018年6月2日(土)21時から2018年6月3日(日)10時
2018年6月9日(土)21時から2018年6月3日(日)10時
上記時間帯のうち最大5時間程度の停電が発生すると予想されています
不便をお掛けしますがよろしくお願い致します
5ちゃんねるサーバ群が収容されているデータセンタにおいて給電装置の更新のため閲覧書き込みが出来なくなります
予定されている期間は以下の通りです
2018年6月2日(土)21時から2018年6月3日(日)10時
2018年6月9日(土)21時から2018年6月3日(日)10時
上記時間帯のうち最大5時間程度の停電が発生すると予想されています
不便をお掛けしますがよろしくお願い致します
361デフォルトの名無しさん
2018/06/04(月) 17:00:48.61ID:pTAw0294 >>342
マジか、マジだ
つまり最初に入ったKS X 1001/Big5/IBMは仕様書上では何も言われてなくて
後から入ったJIS X 0213とかは「ラウンドトリップ以外の使用は推奨しない」と明記なのか。
こんなことならJIS X 0213も無理してBMPに入れずにCNS 11643の残りと一緒にCJK統合漢字拡張Bに入れてもらえばよかったのに
(それが可能だったのかどうかは知らない)。
マジか、マジだ
つまり最初に入ったKS X 1001/Big5/IBMは仕様書上では何も言われてなくて
後から入ったJIS X 0213とかは「ラウンドトリップ以外の使用は推奨しない」と明記なのか。
こんなことならJIS X 0213も無理してBMPに入れずにCNS 11643の残りと一緒にCJK統合漢字拡張Bに入れてもらえばよかったのに
(それが可能だったのかどうかは知らない)。
362デフォルトの名無しさん
2018/06/04(月) 23:13:57.26ID:M5dk3jbS 後半、ちょっと違うんでは? JIS X 0213 の追加漢字は別に無理して BMP に入ってない。普通に Exntend の方に入ってる。
JIS X 0213 と Unicode の包摂基準の違いから1対多対応の部分があって、ラウンドトリップを保証したかったら互換文字が必要になった。
そして必要な互換漢字は少数で、たまたまBMPのCJK 互換漢字漢字ブロックの後半がガラ空きだったので、そこにつっこまれた。
って話だったと思う。
JIS X 0213 と Unicode の包摂基準の違いから1対多対応の部分があって、ラウンドトリップを保証したかったら互換文字が必要になった。
そして必要な互換漢字は少数で、たまたまBMPのCJK 互換漢字漢字ブロックの後半がガラ空きだったので、そこにつっこまれた。
って話だったと思う。
363デフォルトの名無しさん
2018/06/04(月) 23:20:06.40ID:M5dk3jbS 規格がいってるのは CJK互換漢字ブロックはもともと複数の文字コードとのラウンドトリップ用なんだけど、
指定した一部の範囲は "JIS X 0213:2000" とのラウンドトリップ専用で、他の文字コードとのラウンドトリップにも使うべきではないということ。
指定した一部の範囲は "JIS X 0213:2000" とのラウンドトリップ専用で、他の文字コードとのラウンドトリップにも使うべきではないということ。
364デフォルトの名無しさん
2018/06/06(水) 14:26:39.66ID:R+kWiM6Z Announcing The Unicode Standard, Version 11.0
http://blog.unicode.org/2018/06/announcing-unicode-standard-version-110.html
http://blog.unicode.org/2018/06/announcing-unicode-standard-version-110.html
365デフォルトの名無しさん
2018/06/07(木) 22:48:02.08ID:YXHr2tyJ Unicode 11.0出たのか、つかもう一年経ったのか……。
> Five urgently needed CJK unified ideographs: three for newly standardized names of chemical elements, and two for Japan's government administration Moji Joho Kiban Project that includes ideographs for personal and place names
へー、これは知らなかった。
> Five urgently needed CJK unified ideographs: three for newly standardized names of chemical elements, and two for Japan's government administration Moji Joho Kiban Project that includes ideographs for personal and place names
へー、これは知らなかった。
366デフォルトの名無しさん
2018/06/07(木) 23:56:45.77ID:LqY2ZR0d 一昨年末に名称が正式決定したニホニウム等の元素を表す漢字がUROの末尾に追加になったんだな。
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 日本行き空路49万件キャンセル 中国自粛呼びかけ 日本行きチケット予約の約32%に相当 ★4 [ぐれ★]
- 中国の局長は「両手をポケット」で対峙 宣伝戦で国民に示す ★3 [蚤の市★]
- 【音楽】Perfume・あ~ちゃんの結婚相手「一般男性」は吉田カバンの社長・吉田幸裕氏(41) 高身長で山本耕史似 [Ailuropoda melanoleuca★]
- 【大分】佐賀関で大規模火災、170棟以上が延焼中 70代男性1人と連絡取れず [ぐれ★]
- 【サッカー】U-17日本代表、激闘PK戦制す 北朝鮮撃破で6大会ぶり8強入り U17W杯 [久太郎★]
- 「クマはなるべく山に返す努力を」「クマと戦争は間違っている」動物保護活動家の主張 棲み分けと学習放獣でクマ被害なくなるのか?★7 [ぐれ★]
- とらせん IPあり
- 巨専】
- こいせん 全レス転載禁止
- 【DAZN】ワールドカップ欧州予選総合 ★5
- 侍ジャパンシリーズ2025「日本vs韓国」その12
- 【J SPORTS】FIFA U-17ワールドカップ ★10
- 「世の中、バカが多くて疲れません?」👉1991年日本人大発狂 [543236886]
- アンケート調査で「高市発言は問題なし」 93.5%wwwwwwwwwwwwwwwwwwwwwwwww [279254606]
- 自閉症が「んなっしょい」と連呼するお🏡
- 寒い寒い寒い寒い寒い寒い寒い寒い寒い寒い寒い寒い寒い寒い寒い寒い寒い寒い
- マクラーレン、女性ドライバー3名を加入 [462275543]
- 【悲報】大分市佐賀関の火事、20軒→170軒に延焼🔥 [481941988]
