文字コード総合スレ Part11

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2018/01/22(月) 22:58:23.45ID:UK/uqEp5
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
 (スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
 (隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
118デフォルトの名無しさん
垢版 |
2018/03/22(木) 12:21:22.23ID:o6o53GFc
まぎらわしいから5ちゃんじゃなくて005cHか0x5Cって書いてくれ
2018/03/22(木) 15:53:15.85ID:UF/XC/99
0x5c に限らず、ASCII 文字列は国によってフォント上さまざまに実装されてきた
Unicode の時代には、そんなフォントは存在してはいけないし、使用してもいけない
2018/03/23(金) 00:09:04.87ID:VqVxJ9uP
何原理主義だろう
2018/03/23(金) 16:08:24.29ID:aSD4raKW
ASCIIもISO/IEC 646もJIS X 0201も
よもや半世紀50年(以上)も使い続けることになるとは思うまいて
2018/03/23(金) 17:18:23.98ID:0DDzAR5J
22世紀でも使われてるよ
2018/03/23(金) 20:13:42.24ID:cDUKcJ53
ISO-2022シリーズはとっとと滅びてほしいんですが
2018/03/23(金) 23:59:10.11ID:2n1onn8y
21世紀の現在でもメモ帳のデフォはANSI (CP932) だし
うにコードはおとなしく寿司ネタにでもなってるがいいにょ
https://b2v8w6eq1p1erh.cdn.jp.idcfcloud.com/menu/img/999660362_PCL.jpg


【参考】 寿司の絵文字はOSによって表示が異なる
https://iwb.jp/unicode-sushi-mac-windows/

【参考】 あなたのデバイスで寿司の絵文字がどのように表示されるか確認
https://iwb.jp/s/unicode-sushi-mac-windows/
2018/03/24(土) 08:40:08.55ID:XLuW03jy
また新しいemojiが提案されたぞ

Apple Proposes New Accessibility Emojis
https://blog.emojipedia.org/apple-proposes-new-accessibility-emojis/
126デフォルトの名無しさん
垢版 |
2018/03/24(土) 11:29:39.85ID:5hh+Vua5
モンスター利用者の匂いがプンプン😡😠する
2018/03/24(土) 13:16:29.93ID:OxOc4HMA
寿司、卵焼きだったわ
128デフォルトの名無しさん
垢版 |
2018/03/24(土) 19:36:01.34ID:48/rgK9T
>>115
本人だけど深読みし過ぎ
ガラケーだからユニコ(即ちバックスラッシュ)打てないだけです
2018/03/24(土) 21:33:57.21ID:sOpHkhnz
\と打ちたかったけどガラケーなので入力できなかったということか?
>>107は Macの日本語キーボードで\と入力するつもりだったのに
\になってたということか?
130デフォルトの名無しさん
垢版 |
2018/03/24(土) 21:52:09.74ID:48/rgK9T
>>129
ああ全角の\ならガラケーで打てたな
US仕様では当然半角\キーで素直に半角\が出て表示される、但しASCII環境ならASCIIで、ユニコならユニコで
長く日本仕様を離れていたので、昔の半角\=半角¥という読み替えの古い常識で考えてしまい、
エスケープ用に半角\の代用として半角¥記号を用いてしまった
しかし今やIDEもユニコで保存される時代(少なくともうちのは)、半角¥と半角\はもはや違う文字なので別に扱われてしまった、と

ほんのつぶやき気分で書き込んだのになんか紛糾させてしまってて申し訳ない…
131デフォルトの名無しさん
垢版 |
2018/03/24(土) 22:10:16.18
結局、業務でプログラミングするためのデスクトップ環境はWindows一択ってこと
2018/03/24(土) 23:58:50.00ID:N+9D7Vpq
日本語版ではキーボードの \ 打っても \ 打っても出るのは円記号だし
フォントも U+005C は全部円記号に直してあるから徹底してはいるよな……>Windows
2018/03/25(日) 01:12:37.34ID:Xbb+EzoJ
このスレのMac使いは何%くらい?
134デフォルトの名無しさん
垢版 |
2018/03/25(日) 08:12:07.62
>>133
業務はWindows一択
個人でのプログラミング・ゲーム・動画編集はWindows
個人でのインターネット閲覧はMac
Macだと住所入力とかでシステムが求める全角ハイフンが入力できなくて困ることもあるけどそういうときはコピペで何とかしてる
135デフォルトの名無しさん
垢版 |
2018/03/25(日) 08:37:33.87ID:U5SlEUJl
ウェブ屋さんはMac率200%くらいじゃないだろかね。
2018/03/25(日) 08:59:39.70ID:iml51cux
昔はWebObjects使うからMac、なんてのも聞いたけど、今はなんでMac選ぶんだろうね。
137デフォルトの名無しさん
垢版 |
2018/03/25(日) 09:15:36.40ID:2683qfFE
全員にMACBOOK一括支給されてるけど供給が大手で滞らないし管理しやすいからだろう
新品の充電器と本体のストックあり
138デフォルトの名無しさん
垢版 |
2018/03/25(日) 09:16:54.83ID:2683qfFE
家ではもちろんWindows
2018/04/02(月) 20:37:29.23ID:x4wG72eH
新元号への対応についてのアップデート
https://blogs.technet.microsoft.com/jperablog/2018/04/02/新元号への対応についてのアップデート/ 👀
Rock54: Caution(BBR-MD5:0be15ced7fbdb9fdb4d0ce1929c1b82f)
2018/04/03(火) 19:33:36.58ID:oHE3S4VB
せっかく準備期間を十分確保できる改元なのに新元号の公表を
極力遅らせようとするなんてどうかしてる
141デフォルトの名無しさん
垢版 |
2018/04/04(水) 02:30:00.47ID:h2UR4/YM
新元号があらかじめわかる方が可笑しい
2018/04/04(水) 09:22:34.11ID:XmvaXIwt
>>139
>Shift-JIS 対応に関するお問い合わせも複数頂戴しており

Shift_JISは滅びぬ!何度でも甦るさ!
143デフォルトの名無しさん
垢版 |
2018/04/04(水) 15:14:07.82ID:Pmay6Vdj
昭和のときは平成の文字コードあらかじめ空けてあったんだよな
UNICODEではその辺のセンスないのか
144デフォルトの名無しさん
垢版 |
2018/04/04(水) 17:37:38.50
>>143
ん?200個くらい空けてあるって確かこのスレで教えてもらったけど?
145デフォルトの名無しさん
垢版 |
2018/04/04(水) 17:39:15.43
>>43-48だった
250個も空きがあるんなら問題ないっしょ
2018/04/04(水) 18:07:49.51ID:rXkfBXRy
空きが250あるかどうか知らないが日本の元号は既にそのくらいあるな
2018/04/06(金) 19:44:03.07ID:eeERSjFP
空けてあったんじゃなくて当時のJISコードがスカスカだっただけ
今回だって別にBMPにこだわらなければ場所はいくらでもある
2018/04/06(金) 20:30:23.32ID:9uxpFeFd
>>146
どうせ良くも悪くも元号合字があるなら、せっかくだから過去のも入れてほしいなあ。南北朝のをどういう順番にするのがいいのかわからないけど。
149デフォルトの名無しさん
垢版 |
2018/04/07(土) 12:03:23.81ID:BRhgC8GS
>>148
南北朝のはスレッド二つにするべき
そこまでするならコードだけじゃなくて期間の情報も欲しい
2018/04/07(土) 12:40:24.25ID:uudWMLk6
文字以外のものを平気で文字コードに入れようとするような奴がいるからUNICODEが糞になったんだろうな
151デフォルトの名無しさん
垢版 |
2018/04/07(土) 21:58:57.93
それな🙋絵文字を増やす動きは馬鹿すぎだわ🤔
絵文字なんざ煽るときとかおちょくるときにしか使わないんだから🤣
2018/04/08(日) 08:28:28.54ID:rpv5P472
そんなこと言ってないで🍣喰え😋

とかやるわけだ
153デフォルトの名無しさん
垢版 |
2018/04/08(日) 12:11:16.44ID:YK+KPtHu
歴代天皇の顔を全部顔文字にするべき
154デフォルトの名無しさん
垢版 |
2018/04/08(日) 12:38:11.74
そんなん差別だろ😡全人類の顔を入れろや😤
2018/04/08(日) 13:46:13.79ID:2ig97iWV
>>153
どの天皇よりも聖徳太子のほうが使える気がする
2018/04/08(日) 14:22:35.48ID:xmyFoIZI
そういえば、たまにみかけるヨコハマタイヤのマークみたいな顔の活字ってUNICODEには入ってないのかな。
157デフォルトの名無しさん
垢版 |
2018/04/08(日) 15:13:40.81ID:nkM5b3tX
国旗が顔文字になる時代
2018/04/08(日) 18:16:37.26ID:nFQIU7l5
>>156
「写植記号BA-90」のことなら、一応ユニコード上では「U+1F31D FULL MOON WITH FACE」に相当するっぽいけど、そのままのデザインで収録しているフォントは無さげ

「GL-アンチックPlus」というフォントには私用領域のU+E012に収録されてるみたい

違う文字の話だったらゴメンね
2018/04/08(日) 18:21:46.58ID:ikNNlzZg
>>157
顔文字?絵文字だろ
2018/04/08(日) 18:52:03.01ID:xmyFoIZI
>>158
それそれw
満月だったのか。
2018/04/08(日) 23:57:50.48ID:JmR0EgV6
質問させてください。
http://www.birdland.co.jp/wordpress/?p=377
↑このWebページに,
「今ではよく意味が通じないですが半角漢字というサイズが1の、ひらがななんてのもありました。」
とあるのですが,“半角漢字”や“1バイトひらかな”などでWeb検索してもそれらしきものが見つかりません。
ご存知のかた,どうか半角漢字≠ノついて教えていただけないでしょうか……。
2018/04/09(月) 01:39:30.08ID:8NSSH6sZ
MSXかな?
http://www.geocities.jp/hiroshikoubou/page006.html#CHR$
2018/04/09(月) 14:30:25.25ID:jnBi1DXA
兀ってなんや?
2018/04/09(月) 14:41:43.67ID:PipQdxBZ
πじゃないか?
2018/04/09(月) 14:45:34.68ID:dmgfmkci
日立のベーシックマスターもひらがな表示できたよね。

>>161
もしかして、EUC-JP の半角カタカナのことを言ってるのかな? と思いながら元記事を見たけどよく分からん。
少なくとも「サイズが1」というのは「文字幅が1 (いわゆる半角文字)」と言いたいのだと感じた。
2018/04/09(月) 15:10:27.34ID:I4uUee7c
https://ja.wikipedia.org/wiki/%E3%83%99%E3%83%BC%E3%82%B7%E3%83%83%E3%82%AF%E3%83%9E%E3%82%B9%E3%82%BF%E3%83%BC
>ベーシックマスターレベル3
>標準でひらがなの表示が可能。
>ひらがなモードでは8×16ドットによってキャラクターを表現する関係から
>インタレーススキャンを利用するため、ちらつきを防止するために
>専用ディスプレイは長残光仕様であった。

後継機のS1を持っていた
S1でも同様にひらがな表示は出来たが、持っていたディスプレイが
長残光仕様じゃなかったので、ちらつきがひどくてひらがなは使えなかった
2018/04/09(月) 15:28:37.48ID:jnBi1DXA
あーπだったか
πにしてもこの限られたなかに入ってるのはちょっとふしぎだ
2018/04/09(月) 16:14:45.29ID:I4uUee7c
>>162
MSXにはバッククォート ` もあるんだな
S1にはなかった…
2018/04/09(月) 16:34:52.32ID:pWi/1Ey6
98でもVMやUVの前期型にゃ無いぜ
2018/04/09(月) 16:54:46.77ID:zc1O7Ylo
>>163
"こつ"じゃないのそれ
171161
垢版 |
2018/04/10(火) 04:41:14.65ID:UW6YFgPq
みなさんありがとうございました。
恐らくMSXの日本語文字のことのようですね。
確かにJISの「半角カタカナ」(というと某氏に粘着されそうですが^^;)は良く聞くのですが
ひらかなやまして漢字が1バイトで表現されていた時代もあったとは知りませんでした。
勉強になりました。
2018/04/10(火) 08:23:49.31ID:RtdAOiVx
ブログなんだから直接聞けよksg
2018/04/11(水) 00:04:25.91ID:ENYgqsM2
兀突骨(ごつとつこつ)
2018/04/11(水) 02:15:14.13ID:YTgAqaXH
>>172
どうせ過疎スレなんだから答えてやれよハゲ
2018/04/11(水) 02:52:22.38ID:n/11ITTj
俺ははげてない
176デフォルトの名無しさん
垢版 |
2018/04/11(水) 08:02:05.13
俺はハゲてる(´・ω・`)
2018/04/11(水) 11:22:21.45ID:/0jCMe99
禿=大+π=大きいパイ
禿は巨乳
2018/04/11(水) 18:45:36.90ID:/dmo8H9H
あの時代はVRAMに直接アクセスしてフォント書き換えるのが可能だったから漢字作るのも可能だったよね
まぁデフォルトて漢字用意してたのはMSXくらいしか知らないけど

普段使わないasciiコード255に「笑」を割り当てていたのを思い出してちょっと恥ずかしくなってみたり
2018/04/11(水) 19:23:42.70ID:7GMVgRs0
>>171
PC-6000シリーズにもあった
http://p6ers.net/hashi/furoku5.html
2018/04/11(水) 19:39:19.41ID:CjJoJUeK
>>178
そりゃPCGだろ。書き換えるための仕組みとして用意してたんだよ。
VRAMに書けるからどんな文字も表示できるってことなら今だって同じだ。
2018/04/11(水) 20:05:21.67ID:ZpIvtemd
>>179
月火水…とかはMSXのと文字コードは違うけど並び方は同じだし
ひらがなとかは文字コードも同じだな >>162
2018/04/12(木) 01:10:36.70ID:d8+40H+h
>>180
細かいこと端折ってしまったみたいで済まなんだ
VPOKE命令だからてっきりVRAM直なのかと思ってたよ
2018/04/12(木) 09:42:00.51ID:vE9telBE
>>179
セミグラフィックの文字,今じゃほとんどUnicodeに収録されてるなぁ(もちろんUnicodeがPC-6000を念頭に置いてる訳ではないけども)
と思って眺めてたら,Unicodeに無さそうな文字が。
1/8-7,8,9の総和記号を三分割した文字は多分未来永劫Unicodeには収録されないだろうから,
完全にPC-6000独自の文字として歴史に残るねw そこまで大袈裟に言う必要があるかどうかは不問にするとしてさ。
2018/04/12(木) 11:32:41.51ID:wSM7wjKl
セミグラフィックス
http://illustrain.com/img/work/2016/illustrain09-musi5.png
2018/04/12(木) 12:23:04.48ID:vE9telBE
>>184
こんなのでフフッってなってしまった。
まだ4月始まったばっかりなのに疲れてるのかな…
2018/04/12(木) 23:02:24.84ID:v5/HhBEu
>>181
同じCGROM使ってたとか何か理由ありそう

P6の方は60の`を欠いてたけど
2018/04/13(金) 16:59:26.64ID:l5EupZAQ
>>183
あれ、確かUCS/Unicodeにも入ってなかったっけ?
……と思ったらUnicodeに入ってたのは三分割じゃなくて二分割だったか。うーん残念?

U+23B2 ⎲ SUMMATION TOP
U+23B3 ⎳ SUMMATION BOTTOM
2018/04/14(土) 00:05:01.57ID:qkjW2EcF
なんかわからんがすげーかっこいいな
2018/04/14(土) 03:08:10.81ID:/xxepLwu
UCS/Unicodeっていう表現はどういう意味?
190デフォルトの名無しさん
垢版 |
2018/04/14(土) 03:10:11.52ID:lnTeyTPJ
ggrks
191デフォルトの名無しさん
垢版 |
2018/04/14(土) 09:40:32.83
>>189
GNU/Linux みたいなもんだろ

知らんけど
192デフォルトの名無しさん
垢版 |
2018/04/14(土) 16:05:24.15ID:1T8oabCl
ISO-2022-JP/MIME
みたいなもんだと思ってた
2018/04/14(土) 21:53:33.44ID:PZtN90rS
>>189
微妙な違いはあれど「ucsやunicodeなどと呼ばれてるもの」みたいな意味で使ってるんじゃないかなー。
x64/amd64みたいな?
194デフォルトの名無しさん
垢版 |
2018/04/15(日) 10:32:04.48ID:E1b18XLI
それはない
2018/04/25(水) 16:00:07.45ID:5sIIQOD0
Yahoo!ニュースが突如「? ? ? ? ? 」しか書かれていない記事を公開、閲覧者の脳内が「? ? ? ? ?」になる【修正済み】 - Togetter
https://togetter.com/li/1220498

https://headlines.yahoo.co.jp/hl?a=20180422-00000028-yonh-kr

もう修正されちゃったけど、文字化けの記録として。
2018/04/25(水) 16:01:07.60ID:5sIIQOD0
Windows 10 機能更新プログラム (2018 Spring Release) における元号のレジストリ更新について – Japan New Era Name Support Blog
https://blogs.technet.microsoft.com/jperablog/2018/04/20/rs4-registry/

「??」ってさあ……もうちょっと、こう、何か無かったのか。
2018/04/26(木) 10:43:23.40ID:suNaxvFr
Googleが銃の絵文字を水鉄砲へ変更
https://blog.emojipedia.org/google-updates-gun-emoji/
2018/04/26(木) 15:21:01.42ID:dlfZTwzS
>>196
でもどうしたらよかったんだろう
199デフォルトの名無しさん
垢版 |
2018/04/26(木) 16:11:58.36ID:obVS20md
>>197
これはひどい
2018/04/26(木) 19:04:18.92ID:B7OLP04x
戦争の場が宇宙に移ったということだろう
水鉄砲というよりもSFにありそうなレーザーガンっぽいしw
2018/04/26(木) 19:35:12.68ID:vM7mL5EC
なぶるとかの漢字も狩られちゃうー
2018/04/27(金) 04:11:19.93ID:W2h8WuA6
過去の文献のニュアンスが変わってしまいそうだが大丈夫か……
203デフォルトの名無しさん
垢版 |
2018/04/27(金) 07:59:57.84
卍が表示できなくなるのはいつですか?
204デフォルトの名無しさん
垢版 |
2018/04/27(金) 17:46:31.89ID:ash3pEtl
発電所の記号もだめか
2018/04/27(金) 17:59:20.13ID:l9wD2n6W
>>203
双輪にしたらどうかな?www
2018/04/28(土) 14:21:23.68ID:sM690dJm
絵文字のデザインなんて前からコロコロ変わるゆるふわなものだってことじゃないの
U+1F3B1 BILLIARDS は例示ではキューと積まれたボールのデザインだったのに各メーカーは何が気に入らなかったのか知らんけど「8ボール」のデザインで実装
仕方ないので Unicode 12.0 では例示字形を変更し元々のキュー&ボールは U+1F93F BILLIARD GAMES として新たに追加(予定)とか
もう何でもありだなって思うわ。
2018/04/28(土) 17:41:47.97ID:h8rwEw9O
モヤイとか昔から出しな
208デフォルトの名無しさん
垢版 |
2018/04/29(日) 04:53:57.13ID:4Tl9MZgN
毛沢東とかもそうだが
馬鹿ほど文字を替えたがる
2018/04/29(日) 22:48:21.31ID:JU8sokja
元々auの絵文字が文字名はモヤイだけどグリフイメージがモアイだしなあ
そんでもってdocomo/Softbankへ送ると[モアイ]になるんだっけ?どっちだよw
2018/04/30(月) 04:31:43.91ID:5AUwFsoY
モヤモヤするなあ
2018/04/30(月) 12:14:27.36ID:5HYSW1VB
モアモア
2018/05/01(火) 21:01:23.78ID:L301k72M
新元号への対応に向けた検証とテスト ケースについて
https://blogs.technet.microsoft.com/jperablog/2018/05/01/test-case/

現時点で新元号は発表されておりませんが、新元号に対しても合字を用意すべく、
弊社では Unicode コンソーシアムや日本政府、業界団体とともに
Unicode 上の文字コードの確保や新しい字形の作成、フォントの更新について準備を進めております。

新しい合字のコード ポイント等については未確定の状況でございますが、
今一度、下記のような合字の表示、入力に問題がないかご確認ください。
また新元号の発表後に追加される合字を正しく表示するためにはフォントの更新 (合字のグリフの追加) が必要となりますため、
アプリケーションにてご使用のフォントについても確認が必要と想定されます。

- ~ (U+337B)
- (U+337C)
- (U+337D)
- (U+337E)

また、合字を含めた検索や並べ替えについては、少々考慮が必要です。
弊社の Web 検索 "Bing" では、"~" を検索した際 ”~” と ”平成” の両方が検索されます。
一方、Word では "~" の検索の際には "~" のみが検索されます。
検索や並べ替えの動作についても正規化処理の状況によって異なる結果となることが予想されますため、
ご確認をいただくことをお勧めいたします。
213デフォルトの名無しさん
垢版 |
2018/05/01(火) 21:40:31.70
年号に合字コード用意するのやめようぜ
普通に2文字使えばいいじゃん
どうしても組文字にしたければフォントじゃなくて
ワープロソフトとかDTPソフトにやらせてくれよ
2018/05/02(水) 08:28:01.76ID:6hVpEKUT
https://twitter.com/KawamataAkira/status/990740397490978816

そういえば、MSKKの社員だった時代(1990年頃)、自分のまわりにいた日本人の技術者は全員元号のサポートに反対だった。
元号を入れたがったのはアメリカ本社のアメリカ人技術者。

日本人はそんなものサポートしたって面倒が増えるだけだと分かっていたけど、
各国の伝統文化を尊重したというポーズを取って得点を稼ぎたいアメリカ人とは利害が違ったのだと思う。
2018/05/02(水) 10:27:09.46ID:dVOVl8hd
フォントで合字するのは別にいいよ
わざわざ文字コードに入れるのがアホなんや
216デフォルトの名無しさん
垢版 |
2018/05/02(水) 15:41:15.94ID:GW3J9sAd
佳子のもはよ
2018/05/02(水) 18:53:41.71ID:R3g8E+PO
>>214
アメリカ左翼の弊害は底知れないね
2018/05/03(木) 01:34:21.57ID:lB3Qws3m
>>214
その「元号のサポート」って機種依存文字エリアに合字の年号を入れることを指してる?
時刻の表示形式の「平成XX年XX月XX日」みたいなののことじゃ・・・

合字は伝統文化じゃないよね別に
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況