X



文字コード総合スレ Part11
■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん
垢版 |
2018/01/22(月) 22:58:23.45ID:UK/uqEp5
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
 (スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
 (隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
0069デフォルトの名無しさん
垢版 |
2018/02/19(月) 14:39:31.27ID:tWGaYfLB
macOS 10.13.3/iOS 11.2.5でアプリが特定のテルグ語でクラッシュするバグはゼロ幅非接合子の処理の不具合によるもので、iOS 10にも影響。
ttps://applech2.com/archives/20180216-macos-and-ios-telugu-crash.html
0070デフォルトの名無しさん
垢版 |
2018/02/20(火) 00:53:22.06
たかが文字のために複雑な処理を強いるからこういうことになる
合字なんてやめてビットマップで用意すりゃいいだろ
今の時代、そのくらいのリソースの余裕はあるだろう
0073デフォルトの名無しさん
垢版 |
2018/02/21(水) 16:48:25.28ID:1FmFnhWu
単純な絵文字ならLINEスタンプの如く画像でもいいけど
そのテルグ語というのは文字を画像にしたところでどれほど処理が簡便になるのやら
0077デフォルトの名無しさん
垢版 |
2018/02/28(水) 11:10:39.29ID:8h6/NeTB
>>76
UTF-32 でも全漢字を収録するわけではない
(文献学・学術用途には足りない)
のが悲しいところです
0079デフォルトの名無しさん
垢版 |
2018/02/28(水) 16:24:29.00ID:Ow51LBi3
UTF-8でもUTF-16でもUTF-32でも表せる文字数は同じはずだが
UTF-16の限界に合わせてUTF-8とUTF-32を途中から制限したというべきか。
0080デフォルトの名無しさん
垢版 |
2018/02/28(水) 17:38:48.54ID:F8/eMdWm
>>75
BOMなしのUTF-8が選べればベスト
無理ならbigendian
0081デフォルトの名無しさん
垢版 |
2018/02/28(水) 21:23:27.95
>>79
ハァ?
UTF-32ならUTF-8の4倍の文字を表せるはずだろ
0084デフォルトの名無しさん
垢版 |
2018/03/01(木) 10:30:25.87ID:K+j/zXtz
>>80
あんがとー


> Windows付属のメモ帳では標準でBOMが追加されてしまうらしい

うにコード 詰んどるやんけ…
0087デフォルトの名無しさん
垢版 |
2018/03/02(金) 05:14:51.39ID:29NVX3N7
>>76>>77
語りたくてしょうがない具合がキモいな
0088デフォルトの名無しさん
垢版 |
2018/03/02(金) 08:24:39.34ID:qP0hZxcg
wchar_t楽チンでいいんだけどなあ
UTF8なんてアメリカ人はASCIIと区別してないだろ
0092デフォルトの名無しさん
垢版 |
2018/03/10(土) 10:32:38.62ID:TTti/WSS
官公庁でも使えないのか
0093デフォルトの名無しさん
垢版 |
2018/03/10(土) 10:33:43.40ID:TTti/WSS
ああ要するに撒き餌記事だな
誘導されたら負け
0095デフォルトの名無しさん
垢版 |
2018/03/10(土) 22:32:59.43ID:XvEndXTa
教育漢字フォントはわりと色んなメーカーから出てるが
>>92-94の反応を見ると知らない奴は知らない模様
0101デフォルトの名無しさん
垢版 |
2018/03/17(土) 16:42:18.12ID:cWw1OMJa
ほんそれ
0104デフォルトの名無しさん
垢版 |
2018/03/18(日) 03:54:48.28ID:HsPk0IuW
KCL
0107デフォルトの名無しさん
垢版 |
2018/03/21(水) 10:48:26.27ID:4NRc1cWQ
先日日本語キーボードに変えたら\でエスケープ出来なくて焦った
そして今まで知らぬうちにUnicodeでコード書いてたのに気付いた
もうバックスラッシュ=\の時代で無いんだな…
0108デフォルトの名無しさん
垢版 |
2018/03/21(水) 10:50:01.21ID:4NRc1cWQ
ちなみにMACだけどバックスラッシュはオプション+\で出せる
こんなアホ他に居るか分からんので役に立つか分からんが…
0109デフォルトの名無しさん
垢版 |
2018/03/21(水) 11:33:06.21ID:9aBHV4ji
何言ってんだこいつ
0110デフォルトの名無しさん
垢版 |
2018/03/21(水) 11:37:08.42ID:0twXSax5
具体的に反論できないならレスすんなよ
0111デフォルトの名無しさん
垢版 |
2018/03/22(木) 04:56:13.36ID:uJd//Z6A
>>107
俺には「\でエスケープ出来なくて焦った」の\が本来言いたいであろうU+A5ではなく
ちゃんと5Cになっているように見えるんだが……
0112デフォルトの名無しさん
垢版 |
2018/03/22(木) 06:22:34.04
>>111
ここは5chだからな
¥と¥の区別が付いてたまるか
0114デフォルトの名無しさん
垢版 |
2018/03/22(木) 09:43:21.18ID:Q2/ylW7b
5Chわろた
0115デフォルトの名無しさん
垢版 |
2018/03/22(木) 10:27:40.75ID:mcQm+qkM
>>111
試してみたら専ブラからでもFirefoxからでも
円記号を書き込むとバックスラッシュに変えられてしまう
http://mevius.2ch.net/test/read.cgi/tech/1402617355/254-255
>>107のもそういうことなんだろうと思う

>>112が円記号を書き込めているのは謎だけど
> \と\の区別が付いてたまるか
これもバックスラッシュに変わるはず
0117デフォルトの名無しさん
垢版 |
2018/03/22(木) 12:06:59.42
2chブラウザの実装によるとしか

ちな>>112はBathyScapheからの書き込み
0118デフォルトの名無しさん
垢版 |
2018/03/22(木) 12:21:22.23ID:o6o53GFc
まぎらわしいから5ちゃんじゃなくて005cHか0x5Cって書いてくれ
0119デフォルトの名無しさん
垢版 |
2018/03/22(木) 15:53:15.85ID:UF/XC/99
0x5c に限らず、ASCII 文字列は国によってフォント上さまざまに実装されてきた
Unicode の時代には、そんなフォントは存在してはいけないし、使用してもいけない
0121デフォルトの名無しさん
垢版 |
2018/03/23(金) 16:08:24.29ID:aSD4raKW
ASCIIもISO/IEC 646もJIS X 0201も
よもや半世紀50年(以上)も使い続けることになるとは思うまいて
0124デフォルトの名無しさん
垢版 |
2018/03/23(金) 23:59:10.11ID:2n1onn8y
21世紀の現在でもメモ帳のデフォはANSI (CP932) だし
うにコードはおとなしく寿司ネタにでもなってるがいいにょ
https://b2v8w6eq1p1erh.cdn.jp.idcfcloud.com/menu/img/999660362_PCL.jpg


【参考】 寿司の絵文字はOSによって表示が異なる
https://iwb.jp/unicode-sushi-mac-windows/

【参考】 あなたのデバイスで寿司の絵文字がどのように表示されるか確認
https://iwb.jp/s/unicode-sushi-mac-windows/
0126デフォルトの名無しさん
垢版 |
2018/03/24(土) 11:29:39.85ID:5hh+Vua5
モンスター利用者の匂いがプンプン😡😠する
0128デフォルトの名無しさん
垢版 |
2018/03/24(土) 19:36:01.34ID:48/rgK9T
>>115
本人だけど深読みし過ぎ
ガラケーだからユニコ(即ちバックスラッシュ)打てないだけです
0129デフォルトの名無しさん
垢版 |
2018/03/24(土) 21:33:57.21ID:sOpHkhnz
\と打ちたかったけどガラケーなので入力できなかったということか?
>>107は Macの日本語キーボードで\と入力するつもりだったのに
\になってたということか?
0130デフォルトの名無しさん
垢版 |
2018/03/24(土) 21:52:09.74ID:48/rgK9T
>>129
ああ全角の\ならガラケーで打てたな
US仕様では当然半角\キーで素直に半角\が出て表示される、但しASCII環境ならASCIIで、ユニコならユニコで
長く日本仕様を離れていたので、昔の半角\=半角¥という読み替えの古い常識で考えてしまい、
エスケープ用に半角\の代用として半角¥記号を用いてしまった
しかし今やIDEもユニコで保存される時代(少なくともうちのは)、半角¥と半角\はもはや違う文字なので別に扱われてしまった、と

ほんのつぶやき気分で書き込んだのになんか紛糾させてしまってて申し訳ない…
0131デフォルトの名無しさん
垢版 |
2018/03/24(土) 22:10:16.18
結局、業務でプログラミングするためのデスクトップ環境はWindows一択ってこと
0132デフォルトの名無しさん
垢版 |
2018/03/24(土) 23:58:50.00ID:N+9D7Vpq
日本語版ではキーボードの \ 打っても \ 打っても出るのは円記号だし
フォントも U+005C は全部円記号に直してあるから徹底してはいるよな……>Windows
0134デフォルトの名無しさん
垢版 |
2018/03/25(日) 08:12:07.62
>>133
業務はWindows一択
個人でのプログラミング・ゲーム・動画編集はWindows
個人でのインターネット閲覧はMac
Macだと住所入力とかでシステムが求める全角ハイフンが入力できなくて困ることもあるけどそういうときはコピペで何とかしてる
0135デフォルトの名無しさん
垢版 |
2018/03/25(日) 08:37:33.87ID:U5SlEUJl
ウェブ屋さんはMac率200%くらいじゃないだろかね。
0136デフォルトの名無しさん
垢版 |
2018/03/25(日) 08:59:39.70ID:iml51cux
昔はWebObjects使うからMac、なんてのも聞いたけど、今はなんでMac選ぶんだろうね。
0137デフォルトの名無しさん
垢版 |
2018/03/25(日) 09:15:36.40ID:2683qfFE
全員にMACBOOK一括支給されてるけど供給が大手で滞らないし管理しやすいからだろう
新品の充電器と本体のストックあり
0138デフォルトの名無しさん
垢版 |
2018/03/25(日) 09:16:54.83ID:2683qfFE
家ではもちろんWindows
0140デフォルトの名無しさん
垢版 |
2018/04/03(火) 19:33:36.58ID:oHE3S4VB
せっかく準備期間を十分確保できる改元なのに新元号の公表を
極力遅らせようとするなんてどうかしてる
0141デフォルトの名無しさん
垢版 |
2018/04/04(水) 02:30:00.47ID:h2UR4/YM
新元号があらかじめわかる方が可笑しい
0142デフォルトの名無しさん
垢版 |
2018/04/04(水) 09:22:34.11ID:XmvaXIwt
>>139
>Shift-JIS 対応に関するお問い合わせも複数頂戴しており

Shift_JISは滅びぬ!何度でも甦るさ!
0143デフォルトの名無しさん
垢版 |
2018/04/04(水) 15:14:07.82ID:Pmay6Vdj
昭和のときは平成の文字コードあらかじめ空けてあったんだよな
UNICODEではその辺のセンスないのか
0144デフォルトの名無しさん
垢版 |
2018/04/04(水) 17:37:38.50
>>143
ん?200個くらい空けてあるって確かこのスレで教えてもらったけど?
0145デフォルトの名無しさん
垢版 |
2018/04/04(水) 17:39:15.43
>>43-48だった
250個も空きがあるんなら問題ないっしょ
0147デフォルトの名無しさん
垢版 |
2018/04/06(金) 19:44:03.07ID:eeERSjFP
空けてあったんじゃなくて当時のJISコードがスカスカだっただけ
今回だって別にBMPにこだわらなければ場所はいくらでもある
0148デフォルトの名無しさん
垢版 |
2018/04/06(金) 20:30:23.32ID:9uxpFeFd
>>146
どうせ良くも悪くも元号合字があるなら、せっかくだから過去のも入れてほしいなあ。南北朝のをどういう順番にするのがいいのかわからないけど。
0149デフォルトの名無しさん
垢版 |
2018/04/07(土) 12:03:23.81ID:BRhgC8GS
>>148
南北朝のはスレッド二つにするべき
そこまでするならコードだけじゃなくて期間の情報も欲しい
0150デフォルトの名無しさん
垢版 |
2018/04/07(土) 12:40:24.25ID:uudWMLk6
文字以外のものを平気で文字コードに入れようとするような奴がいるからUNICODEが糞になったんだろうな
0151デフォルトの名無しさん
垢版 |
2018/04/07(土) 21:58:57.93
それな🙋絵文字を増やす動きは馬鹿すぎだわ🤔
絵文字なんざ煽るときとかおちょくるときにしか使わないんだから🤣
0153デフォルトの名無しさん
垢版 |
2018/04/08(日) 12:11:16.44ID:YK+KPtHu
歴代天皇の顔を全部顔文字にするべき
0154デフォルトの名無しさん
垢版 |
2018/04/08(日) 12:38:11.74
そんなん差別だろ😡全人類の顔を入れろや😤
0156デフォルトの名無しさん
垢版 |
2018/04/08(日) 14:22:35.48ID:xmyFoIZI
そういえば、たまにみかけるヨコハマタイヤのマークみたいな顔の活字ってUNICODEには入ってないのかな。
0157デフォルトの名無しさん
垢版 |
2018/04/08(日) 15:13:40.81ID:nkM5b3tX
国旗が顔文字になる時代
0158デフォルトの名無しさん
垢版 |
2018/04/08(日) 18:16:37.26ID:nFQIU7l5
>>156
「写植記号BA-90」のことなら、一応ユニコード上では「U+1F31D FULL MOON WITH FACE」に相当するっぽいけど、そのままのデザインで収録しているフォントは無さげ

「GL-アンチックPlus」というフォントには私用領域のU+E012に収録されてるみたい

違う文字の話だったらゴメンね
0161デフォルトの名無しさん
垢版 |
2018/04/08(日) 23:57:50.48ID:JmR0EgV6
質問させてください。
http://www.birdland.co.jp/wordpress/?p=377
↑このWebページに,
「今ではよく意味が通じないですが半角漢字というサイズが1の、ひらがななんてのもありました。」
とあるのですが,“半角漢字”や“1バイトひらかな”などでWeb検索してもそれらしきものが見つかりません。
ご存知のかた,どうか半角漢字≠ノついて教えていただけないでしょうか……。
0165デフォルトの名無しさん
垢版 |
2018/04/09(月) 14:45:34.68ID:dmgfmkci
日立のベーシックマスターもひらがな表示できたよね。

>>161
もしかして、EUC-JP の半角カタカナのことを言ってるのかな? と思いながら元記事を見たけどよく分からん。
少なくとも「サイズが1」というのは「文字幅が1 (いわゆる半角文字)」と言いたいのだと感じた。
0166デフォルトの名無しさん
垢版 |
2018/04/09(月) 15:10:27.34ID:I4uUee7c
https://ja.wikipedia.org/wiki/%E3%83%99%E3%83%BC%E3%82%B7%E3%83%83%E3%82%AF%E3%83%9E%E3%82%B9%E3%82%BF%E3%83%BC
>ベーシックマスターレベル3
>標準でひらがなの表示が可能。
>ひらがなモードでは8×16ドットによってキャラクターを表現する関係から
>インタレーススキャンを利用するため、ちらつきを防止するために
>専用ディスプレイは長残光仕様であった。

後継機のS1を持っていた
S1でも同様にひらがな表示は出来たが、持っていたディスプレイが
長残光仕様じゃなかったので、ちらつきがひどくてひらがなは使えなかった
0167デフォルトの名無しさん
垢版 |
2018/04/09(月) 15:28:37.48ID:jnBi1DXA
あーπだったか
πにしてもこの限られたなかに入ってるのはちょっとふしぎだ
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況