文字コード総合スレ Part11

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2018/01/22(月) 22:58:23.45ID:UK/uqEp5
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
 (スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
 (隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
2018/04/08(日) 18:16:37.26ID:nFQIU7l5
>>156
「写植記号BA-90」のことなら、一応ユニコード上では「U+1F31D FULL MOON WITH FACE」に相当するっぽいけど、そのままのデザインで収録しているフォントは無さげ

「GL-アンチックPlus」というフォントには私用領域のU+E012に収録されてるみたい

違う文字の話だったらゴメンね
2018/04/08(日) 18:21:46.58ID:ikNNlzZg
>>157
顔文字?絵文字だろ
2018/04/08(日) 18:52:03.01ID:xmyFoIZI
>>158
それそれw
満月だったのか。
2018/04/08(日) 23:57:50.48ID:JmR0EgV6
質問させてください。
http://www.birdland.co.jp/wordpress/?p=377
↑このWebページに,
「今ではよく意味が通じないですが半角漢字というサイズが1の、ひらがななんてのもありました。」
とあるのですが,“半角漢字”や“1バイトひらかな”などでWeb検索してもそれらしきものが見つかりません。
ご存知のかた,どうか半角漢字≠ノついて教えていただけないでしょうか……。
2018/04/09(月) 01:39:30.08ID:8NSSH6sZ
MSXかな?
http://www.geocities.jp/hiroshikoubou/page006.html#CHR$
2018/04/09(月) 14:30:25.25ID:jnBi1DXA
兀ってなんや?
2018/04/09(月) 14:41:43.67ID:PipQdxBZ
πじゃないか?
2018/04/09(月) 14:45:34.68ID:dmgfmkci
日立のベーシックマスターもひらがな表示できたよね。

>>161
もしかして、EUC-JP の半角カタカナのことを言ってるのかな? と思いながら元記事を見たけどよく分からん。
少なくとも「サイズが1」というのは「文字幅が1 (いわゆる半角文字)」と言いたいのだと感じた。
2018/04/09(月) 15:10:27.34ID:I4uUee7c
https://ja.wikipedia.org/wiki/%E3%83%99%E3%83%BC%E3%82%B7%E3%83%83%E3%82%AF%E3%83%9E%E3%82%B9%E3%82%BF%E3%83%BC
>ベーシックマスターレベル3
>標準でひらがなの表示が可能。
>ひらがなモードでは8×16ドットによってキャラクターを表現する関係から
>インタレーススキャンを利用するため、ちらつきを防止するために
>専用ディスプレイは長残光仕様であった。

後継機のS1を持っていた
S1でも同様にひらがな表示は出来たが、持っていたディスプレイが
長残光仕様じゃなかったので、ちらつきがひどくてひらがなは使えなかった
2018/04/09(月) 15:28:37.48ID:jnBi1DXA
あーπだったか
πにしてもこの限られたなかに入ってるのはちょっとふしぎだ
2018/04/09(月) 16:14:45.29ID:I4uUee7c
>>162
MSXにはバッククォート ` もあるんだな
S1にはなかった…
2018/04/09(月) 16:34:52.32ID:pWi/1Ey6
98でもVMやUVの前期型にゃ無いぜ
2018/04/09(月) 16:54:46.77ID:zc1O7Ylo
>>163
"こつ"じゃないのそれ
171161
垢版 |
2018/04/10(火) 04:41:14.65ID:UW6YFgPq
みなさんありがとうございました。
恐らくMSXの日本語文字のことのようですね。
確かにJISの「半角カタカナ」(というと某氏に粘着されそうですが^^;)は良く聞くのですが
ひらかなやまして漢字が1バイトで表現されていた時代もあったとは知りませんでした。
勉強になりました。
2018/04/10(火) 08:23:49.31ID:RtdAOiVx
ブログなんだから直接聞けよksg
2018/04/11(水) 00:04:25.91ID:ENYgqsM2
兀突骨(ごつとつこつ)
2018/04/11(水) 02:15:14.13ID:YTgAqaXH
>>172
どうせ過疎スレなんだから答えてやれよハゲ
2018/04/11(水) 02:52:22.38ID:n/11ITTj
俺ははげてない
176デフォルトの名無しさん
垢版 |
2018/04/11(水) 08:02:05.13
俺はハゲてる(´・ω・`)
2018/04/11(水) 11:22:21.45ID:/0jCMe99
禿=大+π=大きいパイ
禿は巨乳
2018/04/11(水) 18:45:36.90ID:/dmo8H9H
あの時代はVRAMに直接アクセスしてフォント書き換えるのが可能だったから漢字作るのも可能だったよね
まぁデフォルトて漢字用意してたのはMSXくらいしか知らないけど

普段使わないasciiコード255に「笑」を割り当てていたのを思い出してちょっと恥ずかしくなってみたり
2018/04/11(水) 19:23:42.70ID:7GMVgRs0
>>171
PC-6000シリーズにもあった
http://p6ers.net/hashi/furoku5.html
2018/04/11(水) 19:39:19.41ID:CjJoJUeK
>>178
そりゃPCGだろ。書き換えるための仕組みとして用意してたんだよ。
VRAMに書けるからどんな文字も表示できるってことなら今だって同じだ。
2018/04/11(水) 20:05:21.67ID:ZpIvtemd
>>179
月火水…とかはMSXのと文字コードは違うけど並び方は同じだし
ひらがなとかは文字コードも同じだな >>162
2018/04/12(木) 01:10:36.70ID:d8+40H+h
>>180
細かいこと端折ってしまったみたいで済まなんだ
VPOKE命令だからてっきりVRAM直なのかと思ってたよ
2018/04/12(木) 09:42:00.51ID:vE9telBE
>>179
セミグラフィックの文字,今じゃほとんどUnicodeに収録されてるなぁ(もちろんUnicodeがPC-6000を念頭に置いてる訳ではないけども)
と思って眺めてたら,Unicodeに無さそうな文字が。
1/8-7,8,9の総和記号を三分割した文字は多分未来永劫Unicodeには収録されないだろうから,
完全にPC-6000独自の文字として歴史に残るねw そこまで大袈裟に言う必要があるかどうかは不問にするとしてさ。
2018/04/12(木) 11:32:41.51ID:wSM7wjKl
セミグラフィックス
http://illustrain.com/img/work/2016/illustrain09-musi5.png
2018/04/12(木) 12:23:04.48ID:vE9telBE
>>184
こんなのでフフッってなってしまった。
まだ4月始まったばっかりなのに疲れてるのかな…
2018/04/12(木) 23:02:24.84ID:v5/HhBEu
>>181
同じCGROM使ってたとか何か理由ありそう

P6の方は60の`を欠いてたけど
2018/04/13(金) 16:59:26.64ID:l5EupZAQ
>>183
あれ、確かUCS/Unicodeにも入ってなかったっけ?
……と思ったらUnicodeに入ってたのは三分割じゃなくて二分割だったか。うーん残念?

U+23B2 ⎲ SUMMATION TOP
U+23B3 ⎳ SUMMATION BOTTOM
2018/04/14(土) 00:05:01.57ID:qkjW2EcF
なんかわからんがすげーかっこいいな
2018/04/14(土) 03:08:10.81ID:/xxepLwu
UCS/Unicodeっていう表現はどういう意味?
190デフォルトの名無しさん
垢版 |
2018/04/14(土) 03:10:11.52ID:lnTeyTPJ
ggrks
191デフォルトの名無しさん
垢版 |
2018/04/14(土) 09:40:32.83
>>189
GNU/Linux みたいなもんだろ

知らんけど
192デフォルトの名無しさん
垢版 |
2018/04/14(土) 16:05:24.15ID:1T8oabCl
ISO-2022-JP/MIME
みたいなもんだと思ってた
2018/04/14(土) 21:53:33.44ID:PZtN90rS
>>189
微妙な違いはあれど「ucsやunicodeなどと呼ばれてるもの」みたいな意味で使ってるんじゃないかなー。
x64/amd64みたいな?
194デフォルトの名無しさん
垢版 |
2018/04/15(日) 10:32:04.48ID:E1b18XLI
それはない
2018/04/25(水) 16:00:07.45ID:5sIIQOD0
Yahoo!ニュースが突如「? ? ? ? ? 」しか書かれていない記事を公開、閲覧者の脳内が「? ? ? ? ?」になる【修正済み】 - Togetter
https://togetter.com/li/1220498

https://headlines.yahoo.co.jp/hl?a=20180422-00000028-yonh-kr

もう修正されちゃったけど、文字化けの記録として。
2018/04/25(水) 16:01:07.60ID:5sIIQOD0
Windows 10 機能更新プログラム (2018 Spring Release) における元号のレジストリ更新について – Japan New Era Name Support Blog
https://blogs.technet.microsoft.com/jperablog/2018/04/20/rs4-registry/

「??」ってさあ……もうちょっと、こう、何か無かったのか。
2018/04/26(木) 10:43:23.40ID:suNaxvFr
Googleが銃の絵文字を水鉄砲へ変更
https://blog.emojipedia.org/google-updates-gun-emoji/
2018/04/26(木) 15:21:01.42ID:dlfZTwzS
>>196
でもどうしたらよかったんだろう
199デフォルトの名無しさん
垢版 |
2018/04/26(木) 16:11:58.36ID:obVS20md
>>197
これはひどい
2018/04/26(木) 19:04:18.92ID:B7OLP04x
戦争の場が宇宙に移ったということだろう
水鉄砲というよりもSFにありそうなレーザーガンっぽいしw
2018/04/26(木) 19:35:12.68ID:vM7mL5EC
なぶるとかの漢字も狩られちゃうー
2018/04/27(金) 04:11:19.93ID:W2h8WuA6
過去の文献のニュアンスが変わってしまいそうだが大丈夫か……
203デフォルトの名無しさん
垢版 |
2018/04/27(金) 07:59:57.84
卍が表示できなくなるのはいつですか?
204デフォルトの名無しさん
垢版 |
2018/04/27(金) 17:46:31.89ID:ash3pEtl
発電所の記号もだめか
2018/04/27(金) 17:59:20.13ID:l9wD2n6W
>>203
双輪にしたらどうかな?www
2018/04/28(土) 14:21:23.68ID:sM690dJm
絵文字のデザインなんて前からコロコロ変わるゆるふわなものだってことじゃないの
U+1F3B1 BILLIARDS は例示ではキューと積まれたボールのデザインだったのに各メーカーは何が気に入らなかったのか知らんけど「8ボール」のデザインで実装
仕方ないので Unicode 12.0 では例示字形を変更し元々のキュー&ボールは U+1F93F BILLIARD GAMES として新たに追加(予定)とか
もう何でもありだなって思うわ。
2018/04/28(土) 17:41:47.97ID:h8rwEw9O
モヤイとか昔から出しな
208デフォルトの名無しさん
垢版 |
2018/04/29(日) 04:53:57.13ID:4Tl9MZgN
毛沢東とかもそうだが
馬鹿ほど文字を替えたがる
2018/04/29(日) 22:48:21.31ID:JU8sokja
元々auの絵文字が文字名はモヤイだけどグリフイメージがモアイだしなあ
そんでもってdocomo/Softbankへ送ると[モアイ]になるんだっけ?どっちだよw
2018/04/30(月) 04:31:43.91ID:5AUwFsoY
モヤモヤするなあ
2018/04/30(月) 12:14:27.36ID:5HYSW1VB
モアモア
2018/05/01(火) 21:01:23.78ID:L301k72M
新元号への対応に向けた検証とテスト ケースについて
https://blogs.technet.microsoft.com/jperablog/2018/05/01/test-case/

現時点で新元号は発表されておりませんが、新元号に対しても合字を用意すべく、
弊社では Unicode コンソーシアムや日本政府、業界団体とともに
Unicode 上の文字コードの確保や新しい字形の作成、フォントの更新について準備を進めております。

新しい合字のコード ポイント等については未確定の状況でございますが、
今一度、下記のような合字の表示、入力に問題がないかご確認ください。
また新元号の発表後に追加される合字を正しく表示するためにはフォントの更新 (合字のグリフの追加) が必要となりますため、
アプリケーションにてご使用のフォントについても確認が必要と想定されます。

- ~ (U+337B)
- (U+337C)
- (U+337D)
- (U+337E)

また、合字を含めた検索や並べ替えについては、少々考慮が必要です。
弊社の Web 検索 "Bing" では、"~" を検索した際 ”~” と ”平成” の両方が検索されます。
一方、Word では "~" の検索の際には "~" のみが検索されます。
検索や並べ替えの動作についても正規化処理の状況によって異なる結果となることが予想されますため、
ご確認をいただくことをお勧めいたします。
213デフォルトの名無しさん
垢版 |
2018/05/01(火) 21:40:31.70
年号に合字コード用意するのやめようぜ
普通に2文字使えばいいじゃん
どうしても組文字にしたければフォントじゃなくて
ワープロソフトとかDTPソフトにやらせてくれよ
2018/05/02(水) 08:28:01.76ID:6hVpEKUT
https://twitter.com/KawamataAkira/status/990740397490978816

そういえば、MSKKの社員だった時代(1990年頃)、自分のまわりにいた日本人の技術者は全員元号のサポートに反対だった。
元号を入れたがったのはアメリカ本社のアメリカ人技術者。

日本人はそんなものサポートしたって面倒が増えるだけだと分かっていたけど、
各国の伝統文化を尊重したというポーズを取って得点を稼ぎたいアメリカ人とは利害が違ったのだと思う。
2018/05/02(水) 10:27:09.46ID:dVOVl8hd
フォントで合字するのは別にいいよ
わざわざ文字コードに入れるのがアホなんや
216デフォルトの名無しさん
垢版 |
2018/05/02(水) 15:41:15.94ID:GW3J9sAd
佳子のもはよ
2018/05/02(水) 18:53:41.71ID:R3g8E+PO
>>214
アメリカ左翼の弊害は底知れないね
2018/05/03(木) 01:34:21.57ID:lB3Qws3m
>>214
その「元号のサポート」って機種依存文字エリアに合字の年号を入れることを指してる?
時刻の表示形式の「平成XX年XX月XX日」みたいなののことじゃ・・・

合字は伝統文化じゃないよね別に
2018/05/03(木) 22:41:08.91ID:zfa+xthz
合字に関しては、直前2文字の表示幅を半分にする制御文字を追加すればいい気がする。
絵文字で肌色指定する制御文字がすでにあるので、それと同じ。
システムにフォント表示幅を変える機能が必要ではあるけど。
2018/05/03(木) 22:43:07.70ID:7QWVobnZ
>>219

>絵文字で肌色指定する制御文字がすでにある

そんなものあるの?Unicodeの理念からどんどん遠ざかっている気がする
2018/05/03(木) 22:49:28.42ID:zfa+xthz
>>220
肌の黒い中国人とか表示可能。
👲👲🏻👲🏼👲🏽👲🏾👲🏿
2018/05/03(木) 23:02:39.59ID:zfa+xthz
あー失礼。直前2文字ごとじゃなくて直前1文字ごとに設定すればいいだけか。
223デフォルトの名無しさん
垢版 |
2018/05/04(金) 00:29:10.94
>>219
ゼロ幅接合子が漢字を対象に使われた場合は、その漢字同士で合字を作るようにすればいい
224デフォルトの名無しさん
垢版 |
2018/05/04(金) 02:22:41.61ID:hkSS9FCA
1文字単位で半角幅化できれば合字いらなくなるでしょ。
225デフォルトの名無しさん
垢版 |
2018/05/04(金) 02:36:16.61ID:9i+OMC2T
峠か
2018/05/04(金) 07:21:22.23ID:u9M1T9G6
文字幅セレクタなんてもんができてしまったら
EAWもfullwidth領域もなんだったんだってことになるだろw
227デフォルトの名無しさん
垢版 |
2018/05/04(金) 09:03:45.93
>>224
合字じゃないと縦書きのとき困る
2018/05/04(金) 11:52:27.49ID:J+Z5/byg
単純に幅半分にしたら縦と横の線の太さがチグハグになりそう
フォント屋が頑張って調整すればいいか
2018/05/04(金) 18:46:40.30ID:hkSS9FCA
ネ申 → 神
2018/05/04(金) 18:55:49.29ID:hkSS9FCA
>>228
白黒の2色じゃなくて中間色を使うアンチエリアスが必要。
フォント屋の仕事じゃなくてOSレベル(例:WindowsのClearType)の範疇。
印刷時の見栄えを一致させるには、当然、印刷機も中間色への対応が必要。
2018/05/04(金) 20:48:04.97ID:hEI+4DHq
縦倍角 横倍角 四倍角てのをふと思い出したわ
2018/05/04(金) 21:04:25.47ID:SdH3E9b0
正体を単純に長体にすると視認性が落ちるからとCondensedやCompressedな書体を作ってるデザイナーが見たらガックリくるような話だな
2018/05/04(金) 21:36:34.74ID:6o7jBY6i
このネタいつまで引っ張っても元号に文字コード割り当てようという考えが如何に頭が悪いかということを思い知らされるだけだ
234デフォルトの名無しさん
垢版 |
2018/05/05(土) 04:12:58.69ID:fc3S9c8B
少なくとも期間情報も含めないと意味無いし
235デフォルトの名無しさん
垢版 |
2018/05/05(土) 09:14:26.61
これでその時点の元号を表示すればいいのか
<日本の元号を表すコード(共通)> <西暦年(100の位 : 6〜20)を表す制御コード> <西暦年(0〜99)を表す制御コード> <月(1〜12)を表す制御コード> <日(1〜31)を表す制御コード>
236デフォルトの名無しさん
垢版 |
2018/05/05(土) 09:15:06.04ID:fc3S9c8B
なるほど
2018/05/05(土) 13:12:46.35ID:DMAq375N
文字コードとプログラミングの区別ができない人は、このスレに書き込まないほうがいい。
238デフォルトの名無しさん
垢版 |
2018/05/05(土) 17:28:35.54ID:JV+fv9fZ
>>235
順序はあるんだから
日本の元号を表すコード(共通)> <順序数コード>
で済むよね
2018/05/05(土) 21:59:51.63ID:BTViOdFG
南北朝時代どうすんだ
240デフォルトの名無しさん
垢版 |
2018/05/05(土) 22:12:48.38ID:DMAq375N
全角文字を半角の幅で表示したい潜在需要は、中国や韓国にもあると思うます。
2018/05/05(土) 23:45:45.90ID:gS+4uwRv
全角文字という概念がそもそも頭悪い感じ
242デフォルトの名無しさん
垢版 |
2018/05/06(日) 00:56:49.53ID:jLP2IXjH
7pt文字から36pt文字までコードを割り当てれば十分だと思う。
243デフォルトの名無しさん
垢版 |
2018/05/06(日) 02:15:11.15
>>239
<日本の元号を表すコード(共通)> <王朝を表す制御コード> <西暦年(100の位 : 6〜20)を表す制御コード> <西暦年(0〜99)を表す制御コード> <月(1〜12)を表す制御コード> <日(1〜31)を表す制御コード>
2018/05/06(日) 05:44:27.92ID:1UjbZZkI
「制御コード」? 普通の2進コードじゃイカンのか?
245デフォルトの名無しさん
垢版 |
2018/05/06(日) 07:32:19.99
Unicodeの仕組みをよく知らないので

普通の2進コードを書けるならそれで
2018/05/06(日) 08:53:27.43ID:xzPVvKwY
そんなコード作ったところで検索もできないし、妄想の域にすらない
そもそも漢字で書ける元号に合字が必要かって話だし、まったく方向がおかしい
2018/05/06(日) 09:21:27.15ID:p3sWeeXN
ID隠してる奴なんてあぼーんしとけ
おかしなやつに構う奴も荒しだからな
248デフォルトの名無しさん
垢版 |
2018/05/06(日) 16:41:35.33ID:89R5dh0N
てすと(´・ω・`)
(´◉◞౪◟◉)
2018/05/07(月) 01:07:40.66ID:POBoMmsZ
Unicodeの次の概念とかはまだないのかな。それとももうみんなUnicodeに満足してしまっているのかね。
2018/05/07(月) 01:12:52.35ID:JfD99IBd
universeの次がmultiverseなんだから次はmulticodeだろうね。
それかikuracode
2018/05/07(月) 02:29:48.88ID:UwQrgiVu
Progressive Unicode、略してPunicode
2018/05/07(月) 02:33:09.58ID:/2aX4qzY
glicoodeというやつが開発されてなんか賞取ってた気がする
2018/05/07(月) 09:24:31.55ID:h5B8tWuv
もう変な合成記号類は多数あるし、漢字合字開始、漢字合字終了の2文字だけ定義しとけばいいんじゃないかな。

そうすれば未来永劫大丈夫だ(フォントさえ準備すれば)。北の人とかでも使えるし、なんなら金印とかハンコとかも好きなだけ合成できる。
2018/05/07(月) 11:16:00.13ID:POBoMmsZ
>>252
グリコが開発したプログラミング言語じゃないの?
文字コードと関係なくね?
2018/05/07(月) 13:40:44.12ID:HIVeR9DH
>>252
> glicoodeというやつが開発されてなんか賞取ってた気がする

o が1つ多すぎる
正しくは glicode
ポッキーの並べ方でプログラミングするって奴ね
詳しくは次のページを参照

http://cp.glico.jp/glicode/
256デフォルトの名無しさん
垢版 |
2018/05/07(月) 14:05:14.59ID:QMgv+0U5
「祇園」のフォントというかグリフって間違ってるよね?
Win10とAndroidは同じっぽいけどどっちも間違いの気がする
2018/05/07(月) 15:39:21.55ID:tXPpG5gL
>>239
20年以上前にとあるDBマネジメントシステムに関わっていたんだけど、和暦対応を導入しようかって話が出てときに南北朝の話で揉めたよw
あの時はどうやって解決したんだっけかな……西暦→和暦変換の関数にオプションを付けたんだっけかな? (覚えてないやゴメン)
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況