プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
2018/01/22(月) 22:58:23.45ID:UK/uqEp5186デフォルトの名無しさん
2018/04/12(木) 23:02:24.84ID:v5/HhBEu187デフォルトの名無しさん
2018/04/13(金) 16:59:26.64ID:l5EupZAQ >>183
あれ、確かUCS/Unicodeにも入ってなかったっけ?
……と思ったらUnicodeに入ってたのは三分割じゃなくて二分割だったか。うーん残念?
U+23B2 ⎲ SUMMATION TOP
U+23B3 ⎳ SUMMATION BOTTOM
あれ、確かUCS/Unicodeにも入ってなかったっけ?
……と思ったらUnicodeに入ってたのは三分割じゃなくて二分割だったか。うーん残念?
U+23B2 ⎲ SUMMATION TOP
U+23B3 ⎳ SUMMATION BOTTOM
188デフォルトの名無しさん
2018/04/14(土) 00:05:01.57ID:qkjW2EcF なんかわからんがすげーかっこいいな
189デフォルトの名無しさん
2018/04/14(土) 03:08:10.81ID:/xxepLwu UCS/Unicodeっていう表現はどういう意味?
190デフォルトの名無しさん
2018/04/14(土) 03:10:11.52ID:lnTeyTPJ ggrks
191デフォルトの名無しさん
2018/04/14(土) 09:40:32.83192デフォルトの名無しさん
2018/04/14(土) 16:05:24.15ID:1T8oabCl ISO-2022-JP/MIME
みたいなもんだと思ってた
みたいなもんだと思ってた
193デフォルトの名無しさん
2018/04/14(土) 21:53:33.44ID:PZtN90rS194デフォルトの名無しさん
2018/04/15(日) 10:32:04.48ID:E1b18XLI それはない
195デフォルトの名無しさん
2018/04/25(水) 16:00:07.45ID:5sIIQOD0 Yahoo!ニュースが突如「? ? ? ? ? 」しか書かれていない記事を公開、閲覧者の脳内が「? ? ? ? ?」になる【修正済み】 - Togetter
https://togetter.com/li/1220498
https://headlines.yahoo.co.jp/hl?a=20180422-00000028-yonh-kr
もう修正されちゃったけど、文字化けの記録として。
https://togetter.com/li/1220498
https://headlines.yahoo.co.jp/hl?a=20180422-00000028-yonh-kr
もう修正されちゃったけど、文字化けの記録として。
196デフォルトの名無しさん
2018/04/25(水) 16:01:07.60ID:5sIIQOD0 Windows 10 機能更新プログラム (2018 Spring Release) における元号のレジストリ更新について – Japan New Era Name Support Blog
https://blogs.technet.microsoft.com/jperablog/2018/04/20/rs4-registry/
「??」ってさあ……もうちょっと、こう、何か無かったのか。
https://blogs.technet.microsoft.com/jperablog/2018/04/20/rs4-registry/
「??」ってさあ……もうちょっと、こう、何か無かったのか。
197デフォルトの名無しさん
2018/04/26(木) 10:43:23.40ID:suNaxvFr Googleが銃の絵文字を水鉄砲へ変更
https://blog.emojipedia.org/google-updates-gun-emoji/
https://blog.emojipedia.org/google-updates-gun-emoji/
198デフォルトの名無しさん
2018/04/26(木) 15:21:01.42ID:dlfZTwzS >>196
でもどうしたらよかったんだろう
でもどうしたらよかったんだろう
199デフォルトの名無しさん
2018/04/26(木) 16:11:58.36ID:obVS20md >>197
これはひどい
これはひどい
200デフォルトの名無しさん
2018/04/26(木) 19:04:18.92ID:B7OLP04x 戦争の場が宇宙に移ったということだろう
水鉄砲というよりもSFにありそうなレーザーガンっぽいしw
水鉄砲というよりもSFにありそうなレーザーガンっぽいしw
201デフォルトの名無しさん
2018/04/26(木) 19:35:12.68ID:vM7mL5EC なぶるとかの漢字も狩られちゃうー
202デフォルトの名無しさん
2018/04/27(金) 04:11:19.93ID:W2h8WuA6 過去の文献のニュアンスが変わってしまいそうだが大丈夫か……
203デフォルトの名無しさん
2018/04/27(金) 07:59:57.84 卍が表示できなくなるのはいつですか?
204デフォルトの名無しさん
2018/04/27(金) 17:46:31.89ID:ash3pEtl 発電所の記号もだめか
205デフォルトの名無しさん
2018/04/27(金) 17:59:20.13ID:l9wD2n6W >>203
双輪にしたらどうかな?www
双輪にしたらどうかな?www
206デフォルトの名無しさん
2018/04/28(土) 14:21:23.68ID:sM690dJm 絵文字のデザインなんて前からコロコロ変わるゆるふわなものだってことじゃないの
U+1F3B1 BILLIARDS は例示ではキューと積まれたボールのデザインだったのに各メーカーは何が気に入らなかったのか知らんけど「8ボール」のデザインで実装
仕方ないので Unicode 12.0 では例示字形を変更し元々のキュー&ボールは U+1F93F BILLIARD GAMES として新たに追加(予定)とか
もう何でもありだなって思うわ。
U+1F3B1 BILLIARDS は例示ではキューと積まれたボールのデザインだったのに各メーカーは何が気に入らなかったのか知らんけど「8ボール」のデザインで実装
仕方ないので Unicode 12.0 では例示字形を変更し元々のキュー&ボールは U+1F93F BILLIARD GAMES として新たに追加(予定)とか
もう何でもありだなって思うわ。
207デフォルトの名無しさん
2018/04/28(土) 17:41:47.97ID:h8rwEw9O モヤイとか昔から出しな
208デフォルトの名無しさん
2018/04/29(日) 04:53:57.13ID:4Tl9MZgN 毛沢東とかもそうだが
馬鹿ほど文字を替えたがる
馬鹿ほど文字を替えたがる
209デフォルトの名無しさん
2018/04/29(日) 22:48:21.31ID:JU8sokja 元々auの絵文字が文字名はモヤイだけどグリフイメージがモアイだしなあ
そんでもってdocomo/Softbankへ送ると[モアイ]になるんだっけ?どっちだよw
そんでもってdocomo/Softbankへ送ると[モアイ]になるんだっけ?どっちだよw
210デフォルトの名無しさん
2018/04/30(月) 04:31:43.91ID:5AUwFsoY モヤモヤするなあ
211デフォルトの名無しさん
2018/04/30(月) 12:14:27.36ID:5HYSW1VB モアモア
212デフォルトの名無しさん
2018/05/01(火) 21:01:23.78ID:L301k72M 新元号への対応に向けた検証とテスト ケースについて
https://blogs.technet.microsoft.com/jperablog/2018/05/01/test-case/
現時点で新元号は発表されておりませんが、新元号に対しても合字を用意すべく、
弊社では Unicode コンソーシアムや日本政府、業界団体とともに
Unicode 上の文字コードの確保や新しい字形の作成、フォントの更新について準備を進めております。
新しい合字のコード ポイント等については未確定の状況でございますが、
今一度、下記のような合字の表示、入力に問題がないかご確認ください。
また新元号の発表後に追加される合字を正しく表示するためにはフォントの更新 (合字のグリフの追加) が必要となりますため、
アプリケーションにてご使用のフォントについても確認が必要と想定されます。
- ~ (U+337B)
- (U+337C)
- (U+337D)
- (U+337E)
また、合字を含めた検索や並べ替えについては、少々考慮が必要です。
弊社の Web 検索 "Bing" では、"~" を検索した際 ”~” と ”平成” の両方が検索されます。
一方、Word では "~" の検索の際には "~" のみが検索されます。
検索や並べ替えの動作についても正規化処理の状況によって異なる結果となることが予想されますため、
ご確認をいただくことをお勧めいたします。
https://blogs.technet.microsoft.com/jperablog/2018/05/01/test-case/
現時点で新元号は発表されておりませんが、新元号に対しても合字を用意すべく、
弊社では Unicode コンソーシアムや日本政府、業界団体とともに
Unicode 上の文字コードの確保や新しい字形の作成、フォントの更新について準備を進めております。
新しい合字のコード ポイント等については未確定の状況でございますが、
今一度、下記のような合字の表示、入力に問題がないかご確認ください。
また新元号の発表後に追加される合字を正しく表示するためにはフォントの更新 (合字のグリフの追加) が必要となりますため、
アプリケーションにてご使用のフォントについても確認が必要と想定されます。
- ~ (U+337B)
- (U+337C)
- (U+337D)
- (U+337E)
また、合字を含めた検索や並べ替えについては、少々考慮が必要です。
弊社の Web 検索 "Bing" では、"~" を検索した際 ”~” と ”平成” の両方が検索されます。
一方、Word では "~" の検索の際には "~" のみが検索されます。
検索や並べ替えの動作についても正規化処理の状況によって異なる結果となることが予想されますため、
ご確認をいただくことをお勧めいたします。
213デフォルトの名無しさん
2018/05/01(火) 21:40:31.70 年号に合字コード用意するのやめようぜ
普通に2文字使えばいいじゃん
どうしても組文字にしたければフォントじゃなくて
ワープロソフトとかDTPソフトにやらせてくれよ
普通に2文字使えばいいじゃん
どうしても組文字にしたければフォントじゃなくて
ワープロソフトとかDTPソフトにやらせてくれよ
214デフォルトの名無しさん
2018/05/02(水) 08:28:01.76ID:6hVpEKUT https://twitter.com/KawamataAkira/status/990740397490978816
そういえば、MSKKの社員だった時代(1990年頃)、自分のまわりにいた日本人の技術者は全員元号のサポートに反対だった。
元号を入れたがったのはアメリカ本社のアメリカ人技術者。
日本人はそんなものサポートしたって面倒が増えるだけだと分かっていたけど、
各国の伝統文化を尊重したというポーズを取って得点を稼ぎたいアメリカ人とは利害が違ったのだと思う。
そういえば、MSKKの社員だった時代(1990年頃)、自分のまわりにいた日本人の技術者は全員元号のサポートに反対だった。
元号を入れたがったのはアメリカ本社のアメリカ人技術者。
日本人はそんなものサポートしたって面倒が増えるだけだと分かっていたけど、
各国の伝統文化を尊重したというポーズを取って得点を稼ぎたいアメリカ人とは利害が違ったのだと思う。
215デフォルトの名無しさん
2018/05/02(水) 10:27:09.46ID:dVOVl8hd フォントで合字するのは別にいいよ
わざわざ文字コードに入れるのがアホなんや
わざわざ文字コードに入れるのがアホなんや
216デフォルトの名無しさん
2018/05/02(水) 15:41:15.94ID:GW3J9sAd 佳子のもはよ
>>214
アメリカ左翼の弊害は底知れないね
アメリカ左翼の弊害は底知れないね
218デフォルトの名無しさん
2018/05/03(木) 01:34:21.57ID:lB3Qws3m219デフォルトの名無しさん
2018/05/03(木) 22:41:08.91ID:zfa+xthz 合字に関しては、直前2文字の表示幅を半分にする制御文字を追加すればいい気がする。
絵文字で肌色指定する制御文字がすでにあるので、それと同じ。
システムにフォント表示幅を変える機能が必要ではあるけど。
絵文字で肌色指定する制御文字がすでにあるので、それと同じ。
システムにフォント表示幅を変える機能が必要ではあるけど。
220デフォルトの名無しさん
2018/05/03(木) 22:43:07.70ID:7QWVobnZ221デフォルトの名無しさん
2018/05/03(木) 22:49:28.42ID:zfa+xthz222デフォルトの名無しさん
2018/05/03(木) 23:02:39.59ID:zfa+xthz あー失礼。直前2文字ごとじゃなくて直前1文字ごとに設定すればいいだけか。
223デフォルトの名無しさん
2018/05/04(金) 00:29:10.94 >>219
ゼロ幅接合子が漢字を対象に使われた場合は、その漢字同士で合字を作るようにすればいい
ゼロ幅接合子が漢字を対象に使われた場合は、その漢字同士で合字を作るようにすればいい
224デフォルトの名無しさん
2018/05/04(金) 02:22:41.61ID:hkSS9FCA 1文字単位で半角幅化できれば合字いらなくなるでしょ。
225デフォルトの名無しさん
2018/05/04(金) 02:36:16.61ID:9i+OMC2T 峠か
226デフォルトの名無しさん
2018/05/04(金) 07:21:22.23ID:u9M1T9G6 文字幅セレクタなんてもんができてしまったら
EAWもfullwidth領域もなんだったんだってことになるだろw
EAWもfullwidth領域もなんだったんだってことになるだろw
227デフォルトの名無しさん
2018/05/04(金) 09:03:45.93 >>224
合字じゃないと縦書きのとき困る
合字じゃないと縦書きのとき困る
228デフォルトの名無しさん
2018/05/04(金) 11:52:27.49ID:J+Z5/byg 単純に幅半分にしたら縦と横の線の太さがチグハグになりそう
フォント屋が頑張って調整すればいいか
フォント屋が頑張って調整すればいいか
229デフォルトの名無しさん
2018/05/04(金) 18:46:40.30ID:hkSS9FCA ネ申 → 神
230デフォルトの名無しさん
2018/05/04(金) 18:55:49.29ID:hkSS9FCA >>228
白黒の2色じゃなくて中間色を使うアンチエリアスが必要。
フォント屋の仕事じゃなくてOSレベル(例:WindowsのClearType)の範疇。
印刷時の見栄えを一致させるには、当然、印刷機も中間色への対応が必要。
白黒の2色じゃなくて中間色を使うアンチエリアスが必要。
フォント屋の仕事じゃなくてOSレベル(例:WindowsのClearType)の範疇。
印刷時の見栄えを一致させるには、当然、印刷機も中間色への対応が必要。
231デフォルトの名無しさん
2018/05/04(金) 20:48:04.97ID:hEI+4DHq 縦倍角 横倍角 四倍角てのをふと思い出したわ
232デフォルトの名無しさん
2018/05/04(金) 21:04:25.47ID:SdH3E9b0 正体を単純に長体にすると視認性が落ちるからとCondensedやCompressedな書体を作ってるデザイナーが見たらガックリくるような話だな
233デフォルトの名無しさん
2018/05/04(金) 21:36:34.74ID:6o7jBY6i このネタいつまで引っ張っても元号に文字コード割り当てようという考えが如何に頭が悪いかということを思い知らされるだけだ
234デフォルトの名無しさん
2018/05/05(土) 04:12:58.69ID:fc3S9c8B 少なくとも期間情報も含めないと意味無いし
235デフォルトの名無しさん
2018/05/05(土) 09:14:26.61 これでその時点の元号を表示すればいいのか
<日本の元号を表すコード(共通)> <西暦年(100の位 : 6〜20)を表す制御コード> <西暦年(0〜99)を表す制御コード> <月(1〜12)を表す制御コード> <日(1〜31)を表す制御コード>
<日本の元号を表すコード(共通)> <西暦年(100の位 : 6〜20)を表す制御コード> <西暦年(0〜99)を表す制御コード> <月(1〜12)を表す制御コード> <日(1〜31)を表す制御コード>
236デフォルトの名無しさん
2018/05/05(土) 09:15:06.04ID:fc3S9c8B なるほど
237デフォルトの名無しさん
2018/05/05(土) 13:12:46.35ID:DMAq375N 文字コードとプログラミングの区別ができない人は、このスレに書き込まないほうがいい。
238デフォルトの名無しさん
2018/05/05(土) 17:28:35.54ID:JV+fv9fZ239デフォルトの名無しさん
2018/05/05(土) 21:59:51.63ID:BTViOdFG 南北朝時代どうすんだ
240デフォルトの名無しさん
2018/05/05(土) 22:12:48.38ID:DMAq375N 全角文字を半角の幅で表示したい潜在需要は、中国や韓国にもあると思うます。
241デフォルトの名無しさん
2018/05/05(土) 23:45:45.90ID:gS+4uwRv 全角文字という概念がそもそも頭悪い感じ
242デフォルトの名無しさん
2018/05/06(日) 00:56:49.53ID:jLP2IXjH 7pt文字から36pt文字までコードを割り当てれば十分だと思う。
243デフォルトの名無しさん
2018/05/06(日) 02:15:11.15 >>239
<日本の元号を表すコード(共通)> <王朝を表す制御コード> <西暦年(100の位 : 6〜20)を表す制御コード> <西暦年(0〜99)を表す制御コード> <月(1〜12)を表す制御コード> <日(1〜31)を表す制御コード>
<日本の元号を表すコード(共通)> <王朝を表す制御コード> <西暦年(100の位 : 6〜20)を表す制御コード> <西暦年(0〜99)を表す制御コード> <月(1〜12)を表す制御コード> <日(1〜31)を表す制御コード>
244デフォルトの名無しさん
2018/05/06(日) 05:44:27.92ID:1UjbZZkI 「制御コード」? 普通の2進コードじゃイカンのか?
245デフォルトの名無しさん
2018/05/06(日) 07:32:19.99 Unicodeの仕組みをよく知らないので
普通の2進コードを書けるならそれで
普通の2進コードを書けるならそれで
246デフォルトの名無しさん
2018/05/06(日) 08:53:27.43ID:xzPVvKwY そんなコード作ったところで検索もできないし、妄想の域にすらない
そもそも漢字で書ける元号に合字が必要かって話だし、まったく方向がおかしい
そもそも漢字で書ける元号に合字が必要かって話だし、まったく方向がおかしい
247デフォルトの名無しさん
2018/05/06(日) 09:21:27.15ID:p3sWeeXN ID隠してる奴なんてあぼーんしとけ
おかしなやつに構う奴も荒しだからな
おかしなやつに構う奴も荒しだからな
248デフォルトの名無しさん
2018/05/06(日) 16:41:35.33ID:89R5dh0N てすと(´・ω・`)
(´◉◞౪◟◉)
(´◉◞౪◟◉)
249デフォルトの名無しさん
2018/05/07(月) 01:07:40.66ID:POBoMmsZ Unicodeの次の概念とかはまだないのかな。それとももうみんなUnicodeに満足してしまっているのかね。
250デフォルトの名無しさん
2018/05/07(月) 01:12:52.35ID:JfD99IBd universeの次がmultiverseなんだから次はmulticodeだろうね。
それかikuracode
それかikuracode
2018/05/07(月) 02:29:48.88ID:UwQrgiVu
Progressive Unicode、略してPunicode
252デフォルトの名無しさん
2018/05/07(月) 02:33:09.58ID:/2aX4qzY glicoodeというやつが開発されてなんか賞取ってた気がする
253デフォルトの名無しさん
2018/05/07(月) 09:24:31.55ID:h5B8tWuv もう変な合成記号類は多数あるし、漢字合字開始、漢字合字終了の2文字だけ定義しとけばいいんじゃないかな。
そうすれば未来永劫大丈夫だ(フォントさえ準備すれば)。北の人とかでも使えるし、なんなら金印とかハンコとかも好きなだけ合成できる。
そうすれば未来永劫大丈夫だ(フォントさえ準備すれば)。北の人とかでも使えるし、なんなら金印とかハンコとかも好きなだけ合成できる。
254デフォルトの名無しさん
2018/05/07(月) 11:16:00.13ID:POBoMmsZ255デフォルトの名無しさん
2018/05/07(月) 13:40:44.12ID:HIVeR9DH >>252
> glicoodeというやつが開発されてなんか賞取ってた気がする
o が1つ多すぎる
正しくは glicode
ポッキーの並べ方でプログラミングするって奴ね
詳しくは次のページを参照
http://cp.glico.jp/glicode/
> glicoodeというやつが開発されてなんか賞取ってた気がする
o が1つ多すぎる
正しくは glicode
ポッキーの並べ方でプログラミングするって奴ね
詳しくは次のページを参照
http://cp.glico.jp/glicode/
256デフォルトの名無しさん
2018/05/07(月) 14:05:14.59ID:QMgv+0U5 「祇園」のフォントというかグリフって間違ってるよね?
Win10とAndroidは同じっぽいけどどっちも間違いの気がする
Win10とAndroidは同じっぽいけどどっちも間違いの気がする
257デフォルトの名無しさん
2018/05/07(月) 15:39:21.55ID:tXPpG5gL >>239
20年以上前にとあるDBマネジメントシステムに関わっていたんだけど、和暦対応を導入しようかって話が出てときに南北朝の話で揉めたよw
あの時はどうやって解決したんだっけかな……西暦→和暦変換の関数にオプションを付けたんだっけかな? (覚えてないやゴメン)
20年以上前にとあるDBマネジメントシステムに関わっていたんだけど、和暦対応を導入しようかって話が出てときに南北朝の話で揉めたよw
あの時はどうやって解決したんだっけかな……西暦→和暦変換の関数にオプションを付けたんだっけかな? (覚えてないやゴメン)
258デフォルトの名無しさん
2018/05/07(月) 16:11:49.95ID:owHHQ9fb259デフォルトの名無しさん
2018/05/07(月) 19:00:55.62ID:tXPpG5gL スレ違い気味の自覚はあるのでほどほどにしときます……
>>258
和暦と西暦の相互変換が出来れば十分という要件だったので、それほど困らなかった気が。
西暦→和暦の変換は問題ないよね?
んで、和暦→西暦の変換では存在しない日付を指定したらエラーにしていたんじゃなかったかな。
(例:明治5年12月3日は存在しないため、西暦に変換しようとしてもエラー)
なお上記では西暦と表記してるけど、実際にはグレゴリオ暦とユリウス暦の違いを意識していた記憶がある。
ただし、どうやって解決していたのか思い出せない…… (使えなくてすみません)。
>>258
和暦と西暦の相互変換が出来れば十分という要件だったので、それほど困らなかった気が。
西暦→和暦の変換は問題ないよね?
んで、和暦→西暦の変換では存在しない日付を指定したらエラーにしていたんじゃなかったかな。
(例:明治5年12月3日は存在しないため、西暦に変換しようとしてもエラー)
なお上記では西暦と表記してるけど、実際にはグレゴリオ暦とユリウス暦の違いを意識していた記憶がある。
ただし、どうやって解決していたのか思い出せない…… (使えなくてすみません)。
260デフォルトの名無しさん
2018/05/08(火) 16:23:34.87ID:75TKeVia どうせスレチなら現代でも太陰暦に変換するツールが必要
261デフォルトの名無しさん
2018/05/08(火) 17:04:12.21ID:K6jgn725 例えば1月30日が存在するかどうかは年ごとに違っていたそうな
https://ja.wikipedia.org/wiki/%E9%96%8F%E6%9C%88
>太陰太陽暦では月の満ち欠けに基づく「30日」と「29日」の二つであり、
>「30日」を「大の月」、「29日」を「小の月」とする。
>しかもこの月の大小は、月の満ち欠けの仕方などによってその順番が年ごとに変わる。
>太陰太陽暦ではこの太陰暦の12ヶ月に、約3年に一度、1ヶ月を加え13ヶ月とし、
>季節とのずれをなるべく少なくする調整をする。この挿入された月を「閏月」という。
>しかしながら閏月をどの時期に入れるかについては、同じ時代でも地域によって食い違うことがあった。
>例えば日本では古来より西日本では伊勢暦、東日本では三島暦が主に用いられたが、
>時として閏月を挿入する時期が異なっていたので、日本国内で日付の異なる暦を使っていた事がある。
https://ja.wikipedia.org/wiki/%E9%96%8F%E6%9C%88
>太陰太陽暦では月の満ち欠けに基づく「30日」と「29日」の二つであり、
>「30日」を「大の月」、「29日」を「小の月」とする。
>しかもこの月の大小は、月の満ち欠けの仕方などによってその順番が年ごとに変わる。
>太陰太陽暦ではこの太陰暦の12ヶ月に、約3年に一度、1ヶ月を加え13ヶ月とし、
>季節とのずれをなるべく少なくする調整をする。この挿入された月を「閏月」という。
>しかしながら閏月をどの時期に入れるかについては、同じ時代でも地域によって食い違うことがあった。
>例えば日本では古来より西日本では伊勢暦、東日本では三島暦が主に用いられたが、
>時として閏月を挿入する時期が異なっていたので、日本国内で日付の異なる暦を使っていた事がある。
262デフォルトの名無しさん
2018/05/08(火) 17:15:53.32ID:75TKeVia 今年は閏月抜いた方が良いくらい季節ずれてる
263デフォルトの名無しさん
2018/05/08(火) 22:52:47.16ID:kruQSPFC 結局Alternative Unicodeはまだ存在しないのか……。
Unicodeの制定が1993年なことを考えると、そろそろ別の規格が立ち上がってもいい筈なんだけどな。
Unicodeの仕組みが余程完璧ならいざしらず。
Unicodeの制定が1993年なことを考えると、そろそろ別の規格が立ち上がってもいい筈なんだけどな。
Unicodeの仕組みが余程完璧ならいざしらず。
264デフォルトの名無しさん
2018/05/08(火) 23:24:51.35ID:91gJGUDl Adobe、Apple、Facebook、Google、IBM、Microsoftといったコンピュータ業界の大会社がUnicode作ってるからなぁ
(実際あるのか知らないけど)他の方面からの立ち上がりに期待するしかないかと。
(実際あるのか知らないけど)他の方面からの立ち上がりに期待するしかないかと。
265デフォルトの名無しさん
2018/05/10(木) 04:31:42.39ID:zLx1ZI77 ローマ数字グリフはUnicodeではCJK互換用文字のように使用が推奨されないとどこかで読んだ記憶があるのですが、間違いでしょうか。
Wikipediaの当該項目を見てもそんなことは書いておらず、困惑してます。
もしも間違いなら積極的にローマ数字グリフを使っていきたいのですが……。
Wikipediaの当該項目を見てもそんなことは書いておらず、困惑してます。
もしも間違いなら積極的にローマ数字グリフを使っていきたいのですが……。
266デフォルトの名無しさん
2018/05/10(木) 13:12:41.31ID:MJdiSWqC >>265
もしかして、これかな?
以下のページに「ただし、Unicodeの仕様では、これらは互換性用の文字であり、対応するラテン文字を用いる方が良いとされています。」という記載がある。
ローマ数字 - CyberLibrarian
http://www.asahi-net.or.jp/~ax2s-kmtn/ref/roman_num.html
Unicode Chart で Roman numerals (U+2160とか) を見てみると Compatibility decomposition mapping としてラテン文字が記載されている。
これを以って上記ページの筆者が「ラテン文字を用いる方が良い」と記載しているのなら、それは解釈が正しくないように思う。
あくまでも互換性があるよ、というだけの注記だと思うのだがどうだろうか。
ちなみに Compatibility decomposition mapping の説明は、こちら。
↓
Code Charts - Help and Links
https://unicode.org/charts/About.html#Key
もしかして、これかな?
以下のページに「ただし、Unicodeの仕様では、これらは互換性用の文字であり、対応するラテン文字を用いる方が良いとされています。」という記載がある。
ローマ数字 - CyberLibrarian
http://www.asahi-net.or.jp/~ax2s-kmtn/ref/roman_num.html
Unicode Chart で Roman numerals (U+2160とか) を見てみると Compatibility decomposition mapping としてラテン文字が記載されている。
これを以って上記ページの筆者が「ラテン文字を用いる方が良い」と記載しているのなら、それは解釈が正しくないように思う。
あくまでも互換性があるよ、というだけの注記だと思うのだがどうだろうか。
ちなみに Compatibility decomposition mapping の説明は、こちら。
↓
Code Charts - Help and Links
https://unicode.org/charts/About.html#Key
267デフォルトの名無しさん
2018/05/10(木) 14:54:38.17ID:jFp8HxnE ふむ
268デフォルトの名無しさん
2018/05/10(木) 16:16:02.53ID:buMLMZ9N 互換分解が設定されてるだけか
270デフォルトの名無しさん
2018/05/13(日) 14:16:53.12ID:dvjI0llt 改元後も「平成」利用へ 納税や年金システム、混乱回避
https://www.asahi.com/articles/ASL5D4T75L5DUTFK004.html
https://www.asahi.com/articles/ASL5D4T75L5DUTFK004.html
271デフォルトの名無しさん
2018/05/15(火) 05:04:52.91ID:vxb29Zje Unicodeの漢字構成文字ってどういうときに使うか分かりますか?
272デフォルトの名無しさん
2018/05/15(火) 05:05:59.52ID:vxb29Zje すいません。漢字構成記述文字列のことです。
273デフォルトの名無しさん
2018/05/16(水) 16:21:48.39ID:MnaY7anS 18.2 表意の説明の文字
表意文字説明文字: U+2FF0–U+2FFB
Unicode Standardには75,000以上のCJK統一的な表意文字が含まれていますが、非常にまれなCJK表意文字の何千もの文字はエンコードされていません。
エンコードのための追加の表意文字の目録の研究は続けられているが、潜在的な符号化可能な表意文字のセット全体が完全に使い果たされることはないと予想される。
特に、表意文字は引き続き作成され、そのような新しい硬貨は常にエンコードされません。
表意文字記述ブロックの12文字は、符号化されていない表意文字を参照する必要があるテキストの標準的な交換の仕組みを提供します。
エンコードされていない表意文字は、これらの文字と符号化された表意文字を使用して記述できます。読者はその記述から表意文字の精神的な絵を作成することができる。
このプロセスは、表意文字の正式な符号化とは異なります。符号化されていない表意文字の標準的な記述はありません。
記述された表意文字に割り当てられた意味はない。記述された表意文字には同値が定義されていません。概念的には、表意文字の説明は、
文字列<U+0065、U+0301>より英語のフレーズ「an ‘e’」に鋭いアクセントを付けたものに近い。
特に、表意文字記述ブロック内の文字のサポートでは、レンダリングエンジンは記述された文字のグラフィック外観を再作成する必要はありません。
また、ユーザーが表意文字を使用して表す可能性のある表意文字の多くは、Unicode標準の将来のバージョンで正式にコード化されることにも注意してください。
表意文字説明文字: U+2FF0–U+2FFB
Unicode Standardには75,000以上のCJK統一的な表意文字が含まれていますが、非常にまれなCJK表意文字の何千もの文字はエンコードされていません。
エンコードのための追加の表意文字の目録の研究は続けられているが、潜在的な符号化可能な表意文字のセット全体が完全に使い果たされることはないと予想される。
特に、表意文字は引き続き作成され、そのような新しい硬貨は常にエンコードされません。
表意文字記述ブロックの12文字は、符号化されていない表意文字を参照する必要があるテキストの標準的な交換の仕組みを提供します。
エンコードされていない表意文字は、これらの文字と符号化された表意文字を使用して記述できます。読者はその記述から表意文字の精神的な絵を作成することができる。
このプロセスは、表意文字の正式な符号化とは異なります。符号化されていない表意文字の標準的な記述はありません。
記述された表意文字に割り当てられた意味はない。記述された表意文字には同値が定義されていません。概念的には、表意文字の説明は、
文字列<U+0065、U+0301>より英語のフレーズ「an ‘e’」に鋭いアクセントを付けたものに近い。
特に、表意文字記述ブロック内の文字のサポートでは、レンダリングエンジンは記述された文字のグラフィック外観を再作成する必要はありません。
また、ユーザーが表意文字を使用して表す可能性のある表意文字の多くは、Unicode標準の将来のバージョンで正式にコード化されることにも注意してください。
274デフォルトの名無しさん
2018/05/16(水) 16:22:58.76ID:MnaY7anS 表意記述アルゴリズムは、実質的に全てのCJK表意文字を、それ自体が表意文字であるより小さな部分に分解することができるという事実に依存する。
Unicode標準ですでにエンコードされている表意文字の広い範囲は、符号化されていない表意文字の大部分が表意文字を使用して表現できることを意味します。
表象記述シーケンスは、主に符号化されていない表意文字を表すことを目的としていますが、符号化された表意文字を表すためにデータ交換に使用すべきではありませんが、教育的および分析的用途もあります。
たとえば、研究者は、U+86D9 蛙を「虫圭」としてデータベースに表現して、U+5A03 娃などの音声を共有する他の文字との間のリンクを提供することができます。
IRGは、このような方法で表意記述シーケンスを使用して、現行の作業のための、機械によって生成された最初の近似を提供するのに役立てています。
Unicode標準ですでにエンコードされている表意文字の広い範囲は、符号化されていない表意文字の大部分が表意文字を使用して表現できることを意味します。
表象記述シーケンスは、主に符号化されていない表意文字を表すことを目的としていますが、符号化された表意文字を表すためにデータ交換に使用すべきではありませんが、教育的および分析的用途もあります。
たとえば、研究者は、U+86D9 蛙を「虫圭」としてデータベースに表現して、U+5A03 娃などの音声を共有する他の文字との間のリンクを提供することができます。
IRGは、このような方法で表意記述シーケンスを使用して、現行の作業のための、機械によって生成された最初の近似を提供するのに役立てています。
275デフォルトの名無しさん
2018/05/17(木) 01:28:29.13ID:zp+h7fJf Google翻訳ですか?
276デフォルトの名無しさん
2018/05/17(木) 12:27:06.84ID:HY+Xmele リンク貼るだけのレスの方がましだな
277デフォルトの名無しさん
2018/05/18(金) 14:45:32.55ID:Eucqc6d6 >>265 で「CJK互換用文字のように使用が推奨されない」とあるけど、その根拠ってどこにあるのか分かる方いますか?
日本語ウィキペディアには「後方互換性のために収録されており使用は推奨されない」と書かれてるけど、その根拠が明示されてないんですよね。
一応注釈も記載されてはいるんだけど、>>266と同じような資料なので「使用は推奨されない」とは読み取り難い気がする。
そこで英語ウィキペディアを見に行くと「for compatibility with east Asian character sets」とだけ書かれていて、「使用は推奨されない」という旨は一言も書いてない。
とまあ、こんなわけなので、この迷える子羊にどなたかご教示ください。
日本語ウィキペディアには「後方互換性のために収録されており使用は推奨されない」と書かれてるけど、その根拠が明示されてないんですよね。
一応注釈も記載されてはいるんだけど、>>266と同じような資料なので「使用は推奨されない」とは読み取り難い気がする。
そこで英語ウィキペディアを見に行くと「for compatibility with east Asian character sets」とだけ書かれていて、「使用は推奨されない」という旨は一言も書いてない。
とまあ、こんなわけなので、この迷える子羊にどなたかご教示ください。
278277
2018/05/18(金) 14:51:49.75ID:Eucqc6d6 いけね、URL を貼り忘れてた。
CJK互換用文字 - Wikipedia
https://ja.wikipedia.org/wiki/CJK%E4%BA%92%E6%8F%9B%E7%94%A8%E6%96%87%E5%AD%97
CJK Compatibility - Wikipedia
https://en.wikipedia.org/wiki/CJK_Compatibility
CJK互換用文字 - Wikipedia
https://ja.wikipedia.org/wiki/CJK%E4%BA%92%E6%8F%9B%E7%94%A8%E6%96%87%E5%AD%97
CJK Compatibility - Wikipedia
https://en.wikipedia.org/wiki/CJK_Compatibility
279デフォルトの名無しさん
2018/05/20(日) 21:42:19.91ID:k7uIgkh0 10646/Unicodeでは非推奨とまでは定めていないと思うよ
ローマ数字はShift_JISだと化けやすいんでローマ数字の使用そのものが悪みたいに
思ってる人がいるだけだと思う
ローマ数字はShift_JISだと化けやすいんでローマ数字の使用そのものが悪みたいに
思ってる人がいるだけだと思う
280デフォルトの名無しさん
2018/05/20(日) 22:44:23.30ID:SBKTPpMQ 0点、1点、2点、…とかMS明朝やゴシックに入ってるのを最初見た時、試合等の点数を表すためのものかと思ってた。
でも名称を調べて違う事を知った。そしてそれらは中国語のためのもので中国語では時刻の○時が○点になることも。
でも名称を調べて違う事を知った。そしてそれらは中国語のためのもので中国語では時刻の○時が○点になることも。
281デフォルトの名無しさん
2018/05/21(月) 10:10:37.23ID:PPw/imVw282デフォルトの名無しさん
2018/05/21(月) 10:11:23.00ID:PPw/imVw283デフォルトの名無しさん
2018/05/21(月) 10:13:27.36ID:6DKDYwaD 0点
やり直せ
やり直せ
284デフォルトの名無しさん
2018/05/21(月) 12:38:29.27ID:3MQFDVVp 日本語フォントの場合は点を時に
韓国語フォントの場合は시に
繁体字フォントの場合は點に
はダメなんだろうか。
韓国語フォントの場合は시に
繁体字フォントの場合は點に
はダメなんだろうか。
285デフォルトの名無しさん
2018/05/21(月) 13:07:55.25ID:5HdLEL73 日本語フォントの場合は時を時に
韓国語フォントの場合は時に
繁体字フォントの場合は時に
はダメなんだろうか。
韓国語フォントの場合は時に
繁体字フォントの場合は時に
はダメなんだろうか。
286デフォルトの名無しさん
2018/05/21(月) 15:22:15.07ID:XnV9ry7u CJK互換文字非推奨とかローマ数字非推奨とか、根拠の乏しいアピールがあちこちにあるのが気持ち悪い。
自分の好みを主張するのは構わないけど、Unicode でそのように提言されているかのように振る舞うのは気に入らない。
……という気持ちはどこにぶつければよいのだろうか?
自分の好みを主張するのは構わないけど、Unicode でそのように提言されているかのように振る舞うのは気に入らない。
……という気持ちはどこにぶつければよいのだろうか?
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【ひきこもり】「引き出し屋」の恐怖が今も消えない…着の身着のまま連行する「自立支援」の被害者たちの訴え [nita★]
- 【京都】ハチが巣くった3年放置の迷惑バイク 撤去したマンション管理会社に「違法」と賠償命令 [香味焙煎★]
- 【速報】首相は消費税減税について「国の財政はどうなるのか」と慎重姿勢を示した [ぐれ★]
- 【動物】オスザルの一部は同性へのマウンティング時に「挿入&射精」していたと判明 ★2 [おっさん友の会★]
- 【MLB】ヤンキース・ジャッジか止まらない… 2打席連発13号&14号 大谷翔平を引き離し単独トップ 敵地騒然 [冬月記者★]
- 「富士山を甘く見ている。隊員は命懸け」 富士宮市長が怒り 閉山期の救助費用は自己負担にすべきと主張 県にルール作りを要請する考え [ぐれ★]
- 🏡💥🔨🥺💦んしょ…んしょ…
- トヨタ純利益35%減😱・・・トランプ関税で1800億円減益🤮 [441660812]
- カンニング竹山「大屋根リングは凄くて圧巻!絶対に見た方がよい」「3850円のえきそばめちゃめちゃウマい!😲万博の感想述べる [521921834]
- 【動画】チャリカスまんさんに天罰が下る🚴‍♀💥 [632966346]
- 【画像】ヘビいた
- 少女「夜中にこっそり食べるカップラーメンって何故こんな犯罪的に美味しいのかしら・・・」