X



文字コード総合スレ Part11

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2018/01/22(月) 22:58:23.45ID:UK/uqEp5
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
 (スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
 (隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
2018/05/21(月) 15:47:01.21ID:h7wqMmMV
取り敢えず>>266のリンク先の作者にぶつけるべきでは
2018/05/21(月) 21:39:44.96ID:owdLx3Iu
㌀㌁㌂e㌄㌅㌆㌇㌈㌉
㌊㌋㌌i㌎㌏㌐㌑㌒㌓
`㌕㌖㌗c㌙㌚㌛㌜㌝
㌞㌟㌠㌡ak㌤㌥jd
㌨㌩㌪l㌬㌭㌮㌯㌰㌱
㌲㌳㌴㌵f㌷㌸㌹㌺n
㌼㌽㌾㌿㍀㍁㍂㍃㍄㍅
㍆㍇㍈_m㍋㍌b㍎㍏
㍐g㍒㍓㍔㍕㍖h㍘㍙
㍚㍛㍜㍝㍞㍟㍠㍡㍢㍣
㍤㍥㍦㍧㍨㍩㍪㍫㍬㍭
㍮㍯㍰㍱㍲㍳㍴㍵㍶㍷
㍸㍹㍺~順紫㍿
2018/05/21(月) 21:42:15.10ID:owdLx3Iu
㎀㎁
㎂㎃㎄㎅㎆㎇㎈㎉㎊㎋
㎌㎍rs㎐㎑㎒㎓㎔㎕
㎖㎗㎘㎙㎚㎛opq㎟
㎠u㎢㎣㎤㎥㎦㎧㎨㎩
㎪㎫㎬㎭㎮㎯㎰㎱㎲㎳
㎴㎵㎶㎷㎸㎹㎺㎻㎼㎽
㎾㎿㏀㏁㏂㏃t㏅㏆㏇
㏈㏉㏊㏋㏌㏎㏏㏐㏑
㏒㏓㏔㏕㏖㏗㏘㏙㏚㏛
㏜㏝㏞㏟㏠㏡㏢㏣㏤㏥
㏦㏧㏨㏩㏪㏫㏬㏭㏮㏯
㏰㏱㏲㏳㏴㏵㏶㏷㏸㏹
㏺㏻㏼㏽㏾㏿
2018/05/21(月) 21:59:03.03ID:V+3Z+fIi
頭がおかしくなりそうだ
2018/05/21(月) 22:38:58.14ID:x+xM1a4p
絵文字テスト😁
292デフォルトの名無しさん
垢版 |
2018/05/21(月) 22:58:22.68ID:kKTehq+9
>>288
2バイト文字ってやはり狂っているな
なぜこのようなものまで一字で表示しようと考えたのか…
一字にすることで容量を節約できると考えたのだろうが、
その節約のために無駄な手間暇がかかり結果的にマイナスにしかならないという
2018/05/21(月) 23:23:05.67ID:XnV9ry7u
そんな餌で俺様が釣られクマ―― (AA略)

>>286
これは同意。都合良く乗っかているのは不快だね。
Unicodeを嫌ったりするのは個々の自由だけど、その概念を人々に誤認させるやり口は卑怯だ。

>>292
揚げ足だけど、話の流れ的には2バイトじゃないです……
あと互換文字の存在が許せない派の人々って、結合文字や絵文字も絶滅させたいと思っているのだろうか。
まあ絵文字が気に入らない人は多数いるのだろうとは思うw
2018/05/22(火) 00:22:22.07ID:3h/yZ372
肌色テスト👮
👮🏻👮🏼👮🏽👮🏾👮🏿
295デフォルトの名無しさん
垢版 |
2018/05/22(火) 00:47:54.81
○囲み文字の1字版と2字版のテストもおながいします
296293
垢版 |
2018/05/22(火) 00:49:04.48ID:pl4uFglU
酔った勢いでレスしたら自演だった……恥ずかしい (いきなり酔いが覚めた)。
つまんないことしちゃってごめん、しばらく自重します。
2018/05/22(火) 04:36:23.18ID:XuSnYVx6
絵文字そのものはどうとも思ってないけど
通常の文章の中で使われる矢印がある種の入力環境だと絵文字で入力されるみたいで
「←このように」が「⬅このように」ってなるのがすごく気持ち悪い。UnicodeというよりIMEに対する不満。
2018/05/22(火) 11:48:04.68ID:3h/yZ372
全角チルダがwindowsユーザーとmacユーザーで違うのも厄介
windows 〜
mac 〜
299デフォルトの名無しさん
垢版 |
2018/05/22(火) 11:57:18.21ID:xGwd/XeK
@ABCDEFGHIJKLMNOPQRS
300void
垢版 |
2018/05/22(火) 13:21:47.84ID:XuSnYVx6
>>299
〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓
文字化けしてますよ。
2018/05/22(火) 13:35:03.46ID:d3LCNcLv
オマエガナー
2018/05/22(火) 13:36:25.53ID:1HkhrVs+
プッ
2018/05/22(火) 14:15:36.11ID:3h/yZ372
化けてますよ。
👻 🎃 👹 👺 👽 💀 🧛 🧟
304デフォルトの名無しさん
垢版 |
2018/05/22(火) 14:35:44.60ID:xGwd/XeK
🏇̪鹿
🐎鹿
🐴鹿
2018/05/22(火) 14:45:39.70ID:3h/yZ372
ひょっとしてバカなの?
🏇🦌
🐎🦌
🐴🦌
2018/05/22(火) 18:00:59.35ID:KBN0pglL
>>305
化けてんぞバーカwwwww
2018/05/22(火) 18:47:42.14ID:XuSnYVx6
ということにしたいのですね
2018/05/23(水) 02:23:03.50ID:Z0QXrqgL
unicode と ISO10646 は互換性があるけど適用範囲とか微妙に違ったりする。
非推奨とかはISO/JISの方を念頭に置いた話ではなかろうか。
2018/05/23(水) 18:48:25.05ID:2DlA2Ju+
ローマ数字の話だよね?
ISO/IEC 10646にもそんな規定は無いような……コードチャートはUnicodeと同じもの使ってるし。
JIS X 0221の方は真面目に読んでないからよく分からんが……
でもISO/IEC 10646の国際一致規格な以上日本独自でそんな規定は入ってないと思うけど。
2018/05/24(木) 01:13:38.27ID:Nk0sJPwS
>>309
私は話題に割り込んだだけで、話題の出処がどこか知らないのでローマ数字限定かわからないけど、
「組」や「日本語文字レパートリ」とか、その辺の話が歪んでか大げさかで伝わってるじゃないかと。
311デフォルトの名無しさん
垢版 |
2018/05/24(木) 01:29:22.08ID:fftgGS82
ここにはまだ来てないのか
2018/05/24(木) 14:00:09.03ID:A4JtYMZ4
ローマ数字やCJK互換用文字が「推奨されない」という記述がブログやWikipediaに散見されるけど、それって根拠が無いよね? という話だと思って眺めてるよ。
こういう聞こえの良いデマを否定するのは体力がいるから面倒そうだよなー
313デフォルトの名無しさん
垢版 |
2018/05/24(木) 14:03:05.24ID:fftgGS82
TUVWXYZ[\]ⅪⅫ


2018/05/25(金) 01:56:34.37ID:562g8vT6
>>312
いつものネット伝言ゲームじゃないか?
日本語での利用を前提として、うろ覚えだけど
1. ISO10646とユニコード規格は厳密に言えば同じではない(事実)
2. ISO10646 は部分実装を許しているための全ての文字が等価ではない(事実)
3. ISO/JIS は部分実装のために日本語向けの文字の組を決めてる(事実)
4. ユニコード実装するならば、日本語向けの文字の組のうち主要なもにには対応すべき(たんなる日本人の願望)
5. ネットなどで不特定多数との通信する前提の場合には、主要な組に入ってない文字は相手側で読めない可能性があるので推奨しない(どこかの個人の意見ならわからなくもない)
6. 日本語のための文字の組にはローマ数字は含まれていない(微妙、ISO規格本体にはまだ入ってないが、JISの参考になら含まれた気がする)
...
中略
...
99.ユニコード規格でローマ数字は推奨されない(デマ)
2018/05/26(土) 14:41:00.14ID:OAwkZ9ha
> 6. 日本語のための文字の組にはローマ数字は含まれていない(微妙、ISO規格本体にはまだ入ってないが、JISの参考になら含まれた気がする)

昨年末の ISO10646の改訂でJISが参考で定義していた COMMON JAPANESE も正式にISO規格に取り込まれた模様。
ということでローマ数字は BASIC JAPANESE には含まれてないけど COMMON JAPANESE には含まれてるくらいの位置付け。
2018/05/26(土) 22:58:23.91ID:oSB4DgY3
285 BASIC JAPANESE と 287 COMMON JAPANESE が 10646 に入ったのは10年前の ISO/IEC 10646:2003/Amd 3:2008 じゃないの?
昨年末の改訂とか正式にISO規格にって何の話?
2018/05/26(土) 23:54:42.44ID:OAwkZ9ha
もう JIS参考でも、amd でもなくて、正式規格本体にあるよ。情報古かったという話。
Amd3:2008 にあるんなら正式規格 ISO/IEC 10646:2012 にもあるかもしれん。確認できんけど。
2018/05/27(日) 10:24:34.33ID:rLKmcl7g
規格本体に入ったのは ISO/IEC 10646:2011
2018/05/28(月) 01:39:25.84ID:Ci0ddO0a
>>286,312
CJK互換文字のラウンドトリップ用のものはUnicode規格書に明記されてる

> They are included in the Unicode Standard to provide full round-trip compatibility
> with the ideographic repertoire of ... and should not be used for any other purpose.
http://www.unicode.org/versions/Unicode10.0.0/ch18.pdf#page=21
2018/05/28(月) 13:25:04.14ID:+smoTcYJ
「推奨しない」でたね
2018/05/28(月) 14:52:12.71ID:AZENlZb2
素晴らしい。こういうちゃんとした情報は歓迎するよ。
そうか、CJK互換文字の利用は「推奨しない」と仕様書に明記されているんだね。覚えておこう。
2018/05/28(月) 16:00:24.98ID:OZmKBhwA
「完全なラウンドトリップ互換性の為に提供するものであり、それ以外の使用は推奨しない」
だから問答無用で“should not be used”と言ってる訳じゃないけどね。
323デフォルトの名無しさん
垢版 |
2018/05/28(月) 22:09:23.88
こまけえこたあいいんだよ
2018/05/29(火) 11:31:12.88ID:gAWLYOTz
>>319
お前、その省略酷くないか。わざとか?
ソースちゃんと確認せずに信じる奴が悪いのか。
こうやってネット伝言ゲームでデマが広まるのか。
325デフォルトの名無しさん
垢版 |
2018/05/29(火) 11:40:21.01ID:QKhV4oKb
伝聞デマの好例
2018/05/29(火) 18:40:11.76ID:P35/pWO/
結局デマじゃないんでしょ?
2018/05/29(火) 22:34:44.54ID:j6aBPmpG
324は何を怒ってるんだ
319のフレーズは複数回出てきてその都度...の部分の規格書名が変わるだけだろうに
2018/05/30(水) 12:07:23.64ID:iPjSEnXB
いやだからUnicode公式が推奨しないと言ってるのは事実なんだろ。デマじゃないじゃん。
なんでもかんでもデマ扱いすれば自分が偉くなったような錯覚になって気分が良いのかもしれないが
迷惑だよ、そういう態度は。
2018/05/30(水) 13:24:00.49ID:uOQbJF8C
>>328
CJK互換文字の使用が推奨されないのは事実だけど、ローマ数字が推奨されないのはデマってことなんじゃないの。
それと2行目以降は蛇足だろ。
2018/05/30(水) 14:33:31.86ID:glkZKJxk
復旧
🖕🏻🖕🏼🖕🏽🖕🏾🖕🏿🖕
2018/05/30(水) 20:29:52.46ID:+kRmOuNK
>>329
多分違う。
「CJK互換文字の一部には特定目的以外に使用すべきでない文字がある」が正しい。
318 はわざとか天然かは知らんが、CJK互換文字の一部にしか適用されないルールを、適用範囲の部分を抜かして引用して、あたかも全体に適用するルールであるかのように誤解する書き方をしてある。
あとは、それを鵜呑みした迂闊さんが「CJK互換文字は推奨されない(キリッ)」ってデマを広げる構図。
2018/05/30(水) 20:46:20.24ID:/bFYrAtR
だから「ラウンドトリップ用」って話だろ?
2018/05/30(水) 20:50:56.47ID:+kRmOuNK
>>331
タイプミス。318→319
2018/05/30(水) 20:55:57.87ID:+kRmOuNK
>>332
限定せずに「ラウンドトリップ用」って書いたらCJK互換文字全体だろ。
「JIS X 0213:2000のためのラウンドトリップ用」はその一部でしかない。
2018/05/30(水) 21:06:09.88ID:JjJ1rb8T
気に入らないなら自分で満足の行くように書き直して貼り付ければ?
典拠示されてるんだから。
2018/05/31(木) 00:48:48.00ID:Rt4SPplt
そんな中途半端に書き直して貼り付けるからデマの元になるんだろ。反省しろ。
2018/05/31(木) 05:31:03.12ID:fKyHNhNo
デマはどっちだよ……「CJK互換文字は」という文脈からは「CJK互換文字に含まれる全ての文字は」という意味しか受け取れないのだが?
「一部」なんていう表現はどっから湧き出てきたんだよ……。
2018/05/31(木) 09:53:50.67ID:Rt4SPplt
>>337
おまえはどこの「文脈」を読んだんだ?
とりあえず本物の規格読んでこい。
339デフォルトの名無しさん
垢版 |
2018/05/31(木) 12:04:29.61
ケチ付けるんなら他人を納得させられる論拠と出典を出せよ
それができないんなら『CJK互換文字の利用は「推奨しない」』が正解だ
340デフォルトの名無しさん
垢版 |
2018/05/31(木) 15:11:25.68ID:LXR1oL3d
南京大虐殺は30万人アルニダ
2018/05/31(木) 20:31:47.82ID:fKyHNhNo
誰か結論下さい(他力本願)。
2018/05/31(木) 23:08:01.93ID:CO1u2co/
>>319のリンク先の規格書で、ラウンドトリップ用だから使用を推奨しないとされているのは以下の3種類だけ。
全体を非推奨とはしていないな。
・U+FA30〜U+FA6A (JIS X 0213:2000)
・U+FA6B〜U+FA6D (ARIB STD-B24)
・U+FA70〜U+FAD9 (KPS 10721-2000)
2018/06/01(金) 05:30:12.89ID:vog2AnDp
誰が誰かよくわかんないけど少なくともCJK互換漢字の一部に関しては
非推奨の根拠はあったってことでしょ

不正確だと思ったならそうじゃなくてこうだって言えばそれで済んだ話だろうに
そうせずにネチネチ言うばっかだから無駄に荒れる
2018/06/01(金) 07:06:38.23ID:RdSMK5as
俺も>>320 >>321には違和感があったわ。
2018/06/01(金) 08:37:44.05ID:d/KZJvqH
>>343
一部でしかないのを全部のように言うから伝聞デマって言われたんだろ。
346デフォルトの名無しさん
垢版 |
2018/06/01(金) 11:58:37.96
>>342
一般の開発者やユーザーは「CJK互換文字の利用は推奨しない」で覚えておいた方が漏れがなくて安心だな
347デフォルトの名無しさん
垢版 |
2018/06/01(金) 12:07:07.22ID:uCsHgk1n
規格書嫁とか無茶言うやつがいます。
あれは暗号で書いてあるので書いた人にも読めません。
2018/06/01(金) 12:41:04.24ID:gevSrdmF
あなたの能力の限界が人並み外れて低いからといって他人を同類扱いするのは良くない
2018/06/01(金) 14:43:43.87ID:s/+fnCQL
>>346
お前のような拡大解釈したいやつは「ユニコードの利用は推奨しない」で覚えておけば漏れがなくて完璧だな。
2018/06/01(金) 22:29:28.35ID:/Zhh/Hrk
>>346
CJK互換漢字 (CJK Compatibility Ideographs) : U+F900〜U+FAFF と
CJK互換用文字 (CJK Compatibility) : U+3300〜U+33FF は別物。
>>319で非推奨とされたのはCJK互換漢字(の一部)で、CJK互換文字ではない。
351デフォルトの名無しさん
垢版 |
2018/06/01(金) 22:43:44.67
>>349-350
こまけえこたあいいんだよ
逆に覚えたらどうするんだよ
「CJK互換」と付いてる領域は非推奨と覚えれば簡単だろ
2018/06/01(金) 23:15:14.57ID:/Zhh/Hrk
>>351
何のためにこんな専門スレにいるんだろうな
いっその事「文字コードの利用は推奨しない」で覚えておけば漏れがなく簡単だな
2018/06/01(金) 23:19:16.78ID:d/KZJvqH
既にデマは溢れてるので、今さら少しくらいデマが増えたところで、どうってことないという見方もあるが
規格の話をするなら細かい点を無視するとかありえない。

あえて >>350 にさらに細かい点をつっこむと
U+3300 - U+33FF は CJK互換ブロック(CJK Compatibility Block)
U+F900 - U+FAFF は CJK互換漢字ブロック(CJK Compatibility Ideograph Block)
とするのが正しいはずで「CJK互換文字」というのは表現は規格にはなかったと思う。

他にも
CJK Compatibility Forms (U+FE30 - UFE4F)
CJK Compatibility Ideograph Supplement (U+2F800 - U+2FA1D)
とかもあるので、勝手な名前とか使い始めるのはデマの元。
354デフォルトの名無しさん
垢版 |
2018/06/02(土) 03:00:41.99
弊社の開発プロジェクトでは「CJK互換」と名の付く文字は一律使用禁止とします
2018/06/02(土) 05:43:50.91ID:6Boi961X
Unicodeが公式に「利用を推奨しない」と明言しているのはCJK互換表意文字のそれも一部ってことはデマじゃないよね?
2018/06/02(土) 06:07:25.49ID:23A3G5JH
ここまでの議論読ませてもらったが
「利用を推奨しない」

「(他規格)との完全ラウンドトリップ互換を提供すためにユニコード規格に含まれている、それ以外の目的に使用すべきではない」
とだと規格上の意味が全然違う気がするんだが?
前者は利用の否定で、後者は利用目的の限定で利用は否定してない。
2018/06/02(土) 08:33:48.72ID:6Boi961X
>>356
「全然」ではなくね?
少なくとも「利用を推奨しない」は後者の意味も含んでるでしょ。完全に数学的な含有じゃないにせよ。
2018/06/02(土) 13:06:52.93ID:23A3G5JH
「これは食べられません」

「電子レンジ調理専用」
359デフォルトの名無しさん
垢版 |
2018/06/02(土) 13:52:43.55ID:yUEJ+BJS
Scheduled maintenance on June 2 and June 9 between 5am pst and 6pm pst. Expect down times of up to 5 hours while we upgrade the power feeds in our data center.

5ちゃんねるサーバ群が収容されているデータセンタにおいて給電装置の更新のため閲覧書き込みが出来なくなります
予定されている期間は以下の通りです
2018年6月2日(土)21時から2018年6月3日(日)10時
2018年6月9日(土)21時から2018年6月3日(日)10時
上記時間帯のうち最大5時間程度の停電が発生すると予想されています

不便をお掛けしますがよろしくお願い致します
2018/06/02(土) 14:10:17.27ID:m4wz3xzo
>>359
?
>2018年6月9日(土)21時から2018年6月3日(日)10時
2018/06/04(月) 17:00:48.61ID:pTAw0294
>>342
マジか、マジだ
つまり最初に入ったKS X 1001/Big5/IBMは仕様書上では何も言われてなくて
後から入ったJIS X 0213とかは「ラウンドトリップ以外の使用は推奨しない」と明記なのか。

こんなことならJIS X 0213も無理してBMPに入れずにCNS 11643の残りと一緒にCJK統合漢字拡張Bに入れてもらえばよかったのに
(それが可能だったのかどうかは知らない)。
2018/06/04(月) 23:13:57.26ID:M5dk3jbS
後半、ちょっと違うんでは? JIS X 0213 の追加漢字は別に無理して BMP に入ってない。普通に Exntend の方に入ってる。
JIS X 0213 と Unicode の包摂基準の違いから1対多対応の部分があって、ラウンドトリップを保証したかったら互換文字が必要になった。
そして必要な互換漢字は少数で、たまたまBMPのCJK 互換漢字漢字ブロックの後半がガラ空きだったので、そこにつっこまれた。
って話だったと思う。
2018/06/04(月) 23:20:06.40ID:M5dk3jbS
規格がいってるのは CJK互換漢字ブロックはもともと複数の文字コードとのラウンドトリップ用なんだけど、
指定した一部の範囲は "JIS X 0213:2000" とのラウンドトリップ専用で、他の文字コードとのラウンドトリップにも使うべきではないということ。
2018/06/06(水) 14:26:39.66ID:R+kWiM6Z
Announcing The Unicode Standard, Version 11.0
http://blog.unicode.org/2018/06/announcing-unicode-standard-version-110.html
2018/06/07(木) 22:48:02.08ID:YXHr2tyJ
Unicode 11.0出たのか、つかもう一年経ったのか……。

> Five urgently needed CJK unified ideographs: three for newly standardized names of chemical elements, and two for Japan's government administration Moji Joho Kiban Project that includes ideographs for personal and place names

へー、これは知らなかった。
2018/06/07(木) 23:56:45.77ID:LqY2ZR0d
一昨年末に名称が正式決定したニホニウム等の元素を表す漢字がUROの末尾に追加になったんだな。
367デフォルトの名無しさん
垢版 |
2018/06/08(金) 00:10:00.49
そんなもんで漢字増やすなや!
2018/06/08(金) 14:59:48.37ID:HNv18lZE
去年も書いたけど
Core Specification
Appendix D
Version History of the Standard
の漢字のとこの数字が足した数と合計で合わないんだよなぁ
48違うって何なんだろ。
2018/06/08(金) 23:58:07.79ID:ljSzk/l3
CJK統合漢字のUROの空きコードポイントは残り16個か。次でとうとうU+9FF0番台になる。
それらも全部使い切ったらその次の少数の緊急に必要な漢字追加は拡張A末尾の空きU+40B6〜Fを使う事になるのかな。
でそこも使い切ったらBMPへの漢字追加は本当に終わりで拡張BやC、D…の末尾の空きを使用ってことになるんだろうな。
370デフォルトの名無しさん
垢版 |
2018/06/09(土) 00:37:24.38ID:8sRiN6h8
文字列置換から除外するための一時退避の需要あるでしょ。
unicodeはプログラマが自由に使っていい領域ってどこだろう。
371デフォルトの名無しさん
垢版 |
2018/06/09(土) 01:02:14.54
「外字」でウィキれ
2018/06/09(土) 09:13:51.52ID:8sRiN6h8
>>371
回答ありがとう。
UnicodeのU+E000からU+E757あたりを使えばSJISにも対応できそう。
2018/06/09(土) 19:05:32.10ID:roRwdie6
curl 'http://www.unicode.org/Public/UCD/latest/ucd/UnicodeData.txt' | wc -l
とやると
32292
と返ってきたんだけど、つまり今現在Unicodeには32292文字が収録されていると思っていいのかな。
2018/06/10(日) 06:07:59.44ID:gv3HXRco
何?結局16バイトに収まってたという話?
2018/06/10(日) 06:08:19.99ID:gv3HXRco
ビットだ……恥ずかしい
376デフォルトの名無しさん
垢版 |
2018/06/10(日) 15:33:08.87ID:mkooDB8i
>>373
中身を見ればわかるけど漢字領域 (4e00 から 9efe) とかは
飛ばしてあるから全然違う。
2018/06/10(日) 16:00:53.49ID:aEB47NCz
Android P Beta 2、グリーンサラダの絵文字からゆで卵が消える | スラド デベロッパー
https://developers.srad.jp/story/18/06/09/0621201/

ゆで卵を入れる多様性は許されないのか
2018/06/11(月) 13:52:38.76ID:HvQh9O78
ジェンダーの方もなんか過剰だよね。政治的な活動家でもいるのかね

サラダの絵文字からGoogle、「卵」を排除 生産者団体が異議、「卵を返せ」論争に
https://www.j-cast.com/2018/06/09330966.html?p=all
2018/06/11(月) 16:02:07.37ID:yunMmu3l
なんか力抜けたわw
380373
垢版 |
2018/06/12(火) 21:57:09.59ID:ZlrY5GZ7
>>376
収録されている全文字を取得するにはどうしたらいいかな…
381デフォルトの名無しさん
垢版 |
2018/06/13(水) 00:45:51.71
どうなってんのこれ🤔

🌕🌔🌕🌕🌕🌕🌕🌕
🌕🌒🌕🌕🌕🌕🌕🌕
🌖🌓🌕🌕🌔🌕🌕🌕
🌖🌒🌕🌗🌑🌔🌕🌕
🌖🌑🌔🌘🌒🌕🌕🌕
🌕🌘🌑🌑🌑🌑🌒🌕
🌕🌕🌘🌑🌑🌑🌑🌒
🌕🌕🌖🌑🌑🌒🌗🌓
🌕🌕🌕🌘🌑🌑🌘🌔
🌕🌕🌖🌑🌑🌑🌘🌔
🌕🌕🌗🌑🌑🌑🌖🌔
🌕🌕🌕🌘🌑🌑🌕🌔
🌕🌕🌕🌗🌒🌘🌔🌕
🌕🌕🌕🌗🌒🌖🌒🌕
🌕🌕🌕🌗🌓🌕🌒🌕
2018/06/13(水) 00:55:38.87ID:ixGTG5kv
5ちゃんでemojiのAAは文字数制限が厳しいからどうしても小さくなりがちだな
2018/06/13(水) 06:58:34.14ID:mbRQ9skB
なにか問題でも?
🧙🧚🧛🧜🧝🧟
🧙🏻🧚🏻🧛🏻🧜🏻🧝🏻🧟🏻
🧙🏼🧚🏼🧛🏼🧜🏼🧝🏼🧟🏼
🧙🏽🧚🏽🧛🏽🧜🏽🧝🏽🧟🏽
🧙🏾🧚🏾🧛🏾🧜🏾🧝🏾🧟🏾
🧙🏿🧚🏿🧛🏿🧜🏿🧝🏿🧟🏿
2018/06/17(日) 09:04:29.91ID:89kw/R7U
ユニコードとUTF8は何が違うんでしょうか
どちらもユニコード?それとも別のコード?頭がおかしくなりそうです
SJISだけで全て丸く収まっていた平和な日本にとんだ黒船がやってきた・・・
2018/06/17(日) 09:50:58.25ID:GftzeAnS
アップル外字どうなの
2018/06/17(日) 12:32:46.14ID:IMOrQ/Bc
>>384
文字集合と文字符号の違いならわかる?
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況