プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 [転載禁止]©2ch.net
レス数が1000を超えています。これ以上書き込みはできません。
1デフォルトの名無しさん
2015/10/14(水) 20:29:00.08ID:xctG4AAd971デフォルトの名無しさん
2018/01/04(木) 09:46:56.03ID:GKignaEj972デフォルトの名無しさん
2018/01/04(木) 20:41:42.26ID:LRBrKk4Y >>967
元はShift_JISで書かれたサイトっぽいけど「webサーバー側」の文字コード設定が間違ってて
HTMLとしてすでに正しくない文字コードというかバイト列が出力されてしまってる感じで
さらにfirefoxが文字コード検出を間違ったまま表示してる感じがする
ちなみに文字化けしたままでもfirefoxでマウスオーバーしたときに左下に出て来る日本語はたまに正常たったりする
文字化けにも色々あるけど文字通り壊れたバイト列だともうどうしようもない
元はShift_JISで書かれたサイトっぽいけど「webサーバー側」の文字コード設定が間違ってて
HTMLとしてすでに正しくない文字コードというかバイト列が出力されてしまってる感じで
さらにfirefoxが文字コード検出を間違ったまま表示してる感じがする
ちなみに文字化けしたままでもfirefoxでマウスオーバーしたときに左下に出て来る日本語はたまに正常たったりする
文字化けにも色々あるけど文字通り壊れたバイト列だともうどうしようもない
973デフォルトの名無しさん
2018/01/04(木) 21:05:29.96ID:LRBrKk4Y >>968
サーバー側の設定が間違ってると間違った文字コードでリクエストしてファイルは存在してても
違うバイト列だからファイルシステム上に見つからないとかいう状態になってそうなので
あとはだめもとでHTML側のURLを使わずに
判ってる方のファイル名
www.monzen.org/doc/fonts/free.next/モトヤお試し/UDモトヤ明朝2B/ntnum2bmst/文字種一覧.txt
を自分でURLエンコードしてリクエストしてみるとか
サーバー側の設定が間違ってると間違った文字コードでリクエストしてファイルは存在してても
違うバイト列だからファイルシステム上に見つからないとかいう状態になってそうなので
あとはだめもとでHTML側のURLを使わずに
判ってる方のファイル名
www.monzen.org/doc/fonts/free.next/モトヤお試し/UDモトヤ明朝2B/ntnum2bmst/文字種一覧.txt
を自分でURLエンコードしてリクエストしてみるとか
974デフォルトの名無しさん
2018/01/04(木) 22:02:18.09ID:LUbaT8ef 上の階層のntnum2bmst.zipなら落とせた。
975デフォルトの名無しさん
2018/01/04(木) 23:05:06.84ID:7OOzLizu >>972-974
ありがとうございます
該当のテキストがどうしても読みたいというよりも
<何故こういう現象が起きてるのか?>のほうに興味があって質問させていただきました
文字コードの世界って本当に奥が深いですね
文字フォントについても色々疑問があるのですが、それはフォントスレで質問するべきですね
(PCにインストールしていいフォント数の上限とか)
ありがとうございます
該当のテキストがどうしても読みたいというよりも
<何故こういう現象が起きてるのか?>のほうに興味があって質問させていただきました
文字コードの世界って本当に奥が深いですね
文字フォントについても色々疑問があるのですが、それはフォントスレで質問するべきですね
(PCにインストールしていいフォント数の上限とか)
976デフォルトの名無しさん
2018/01/05(金) 00:49:01.50ID:76HunQx1 ためになるスレだなあ
977デフォルトの名無しさん
2018/01/05(金) 17:51:46.56ID:GkCjRoy7 無理やり読ませるとそれなりの割合の人間に急性ショック症状を起こすスレでもある・・・
978デフォルトの名無しさん
2018/01/08(月) 12:30:50.80ID:6qORCJqP 今年でJIS漢字制定40周年なんだな。
979デフォルトの名無しさん
2018/01/08(月) 13:20:24.34ID:g3wGVkXu 40cmくらいのウンコード出た
長過ぎて一回で流れなかった
5回目くらいでやっと視界から消えた
長過ぎて一回で流れなかった
5回目くらいでやっと視界から消えた
980デフォルトの名無しさん
2018/01/09(火) 07:25:31.13ID:4jYqaTLN ウンコ駆動ですね判ります
981デフォルトの名無しさん
2018/01/09(火) 11:13:21.97ID:SxMgaYrJ ためになるスレだなあ
982デフォルトの名無しさん
2018/01/11(木) 01:29:58.58ID:8ozacBxV 【しつもん@A】
@Windowsで同一フォルダ内に全く同じファイル名+拡張子があって不審に思い
ファイル名をメモ帳にコピペしても瓜二つ
でもWordにコピペすると片方は「ジ」や「ペ」の後ろに空白文字が出てくる
Aニコニコ動画をDLしてるとたまに「グ」が「ク_ 」に文字化けする
@Aの発生原因は分りますか? (どれもネットから落としたファイルです)
@Windowsで同一フォルダ内に全く同じファイル名+拡張子があって不審に思い
ファイル名をメモ帳にコピペしても瓜二つ
でもWordにコピペすると片方は「ジ」や「ペ」の後ろに空白文字が出てくる
Aニコニコ動画をDLしてるとたまに「グ」が「ク_ 」に文字化けする
@Aの発生原因は分りますか? (どれもネットから落としたファイルです)
983デフォルトの名無しさん
2018/01/11(木) 01:41:04.05ID:0E6TKJI8 Wordを持ってるならその空白文字の後ろでAlt+Xしてみ
そしたら文字コードに変換されるから何がついてるか分かる
そしたら文字コードに変換されるから何がついてるか分かる
984デフォルトの名無しさん
2018/01/11(木) 02:16:47.71ID:8ozacBxV >>983 ありがトン
@「ジ 」が「シ3099」に変わった
A「ク_ 」が「ク005F」に変わった
@は↓の「Unicode正規化」ってやつですかね? Aは分らないけど
http://tech.albert2005.co.jp/501/
@「ジ 」が「シ3099」に変わった
A「ク_ 」が「ク005F」に変わった
@は↓の「Unicode正規化」ってやつですかね? Aは分らないけど
http://tech.albert2005.co.jp/501/
985デフォルトの名無しさん
2018/01/11(木) 12:49:11.03ID:F0gXla1d 2は、ダウンロードするソフトがファイル名に使えなさそうな文字をアンダースコアに変えてるのでは
986デフォルトの名無しさん
2018/01/11(木) 16:02:48.08ID:rE/gsUWL 合成済み文字と結合文字列の違いは
Windowsとmacでデータのやりとりをしていると稀によくある
Windowsとmacでデータのやりとりをしていると稀によくある
987デフォルトの名無しさん
2018/01/11(木) 17:06:01.77ID:WekjUxUo >>985-986 ありがトン
A ニコニコ動画の無料アニメ2本 上の「グルグル」は文字化けしないが、下のは化ける
http://www.nico video.jp/watch/1499326505
魔法陣グルグル PV
http://www.nico video.jp/watch/1500538647
魔法陣ク?ルク?ル 第1話「旅立ち!ジミナ村!」
下の動画タイトルをWordにコピペ&Alt+Xすると「ク3099」なので、上とは違った文字コードで書かれてる模様
ブラウザ上では見分けがつかないが、DLすると「ク_ 」=「ク005F」に化ける
ニコ動はブラウザで見ることを前提にしてるのでクレームをつけるわけにもいかないが
バラバラの文字コードで書かれるとモヤッとする
A ニコニコ動画の無料アニメ2本 上の「グルグル」は文字化けしないが、下のは化ける
http://www.nico video.jp/watch/1499326505
魔法陣グルグル PV
http://www.nico video.jp/watch/1500538647
魔法陣ク?ルク?ル 第1話「旅立ち!ジミナ村!」
下の動画タイトルをWordにコピペ&Alt+Xすると「ク3099」なので、上とは違った文字コードで書かれてる模様
ブラウザ上では見分けがつかないが、DLすると「ク_ 」=「ク005F」に化ける
ニコ動はブラウザで見ることを前提にしてるのでクレームをつけるわけにもいかないが
バラバラの文字コードで書かれるとモヤッとする
988デフォルトの名無しさん
2018/01/13(土) 18:28:46.68 >>987
「魔法陣グルグル 」だけを抜き出してみると
魔法陣グルグル PV
¥u9b54¥u6cd5¥u9663¥u30b0¥u30eb¥u30b0¥u30eb¥u3000
魔法陣グルグル 第1話「旅立ち!ジミナ村!」
¥u9b54¥u6cd5¥u9663¥u30af¥u3099¥u30eb¥u30af¥u3099¥u30eb¥u3000
下の方は半角カナ(グルグル)から変換したとかかなあ
ウェブブラウザでは一見区別が付かないのも困りものだ
「魔法陣グルグル 」だけを抜き出してみると
魔法陣グルグル PV
¥u9b54¥u6cd5¥u9663¥u30b0¥u30eb¥u30b0¥u30eb¥u3000
魔法陣グルグル 第1話「旅立ち!ジミナ村!」
¥u9b54¥u6cd5¥u9663¥u30af¥u3099¥u30eb¥u30af¥u3099¥u30eb¥u3000
下の方は半角カナ(グルグル)から変換したとかかなあ
ウェブブラウザでは一見区別が付かないのも困りものだ
989デフォルトの名無しさん
2018/01/13(土) 19:15:50.63ID:kgVvsCNy MacとかiPhoneとか、Apple製品は濁点を結合文字列で扱うのがデフォだったはず
990デフォルトの名無しさん
2018/01/13(土) 19:16:22.00ID:bGec8C/6 半角カナから単純に変換したのであればク゛(30af 309b)になってそうだけど
991デフォルトの名無しさん
2018/01/14(日) 06:16:21.53ID:piPpz4p9 ものかのとかいう奴がそんな訳語を提唱してたっけw
992デフォルトの名無しさん
2018/01/16(火) 16:24:03.09ID:gClSSJeQ Combining Character Sequence
公式日本語訳の「結合文字の並び」は何だか使いにくいし
公式日本語訳の「結合文字の並び」は何だか使いにくいし
993デフォルトの名無しさん
2018/01/16(火) 21:25:09.69ID:LbNJCNQU 単一の文字を表すくせに文字列と呼ぶのもいまいちだし悩ましいところだな
994デフォルトの名無しさん
2018/01/16(火) 21:58:19.78 「結合文字列」って、「合州国」みたいなもんか
995デフォルトの名無しさん
2018/01/17(水) 15:56:04.49ID:9Sws3XK1 合衆国の誤字だっけ
996デフォルトの名無しさん
2018/01/20(土) 12:33:26.67ID:4AOaXNlF997デフォルトの名無しさん
2018/01/21(日) 14:15:27.16ID:zFm0SEQ6 ttp://ufcpp.net/blog/2018/1/getunicodecategory/
ASCII 圏の人、ほんとに Unicode 追加面を知らない
・「こんなのほっといてもすぐに追加されるだろう」とか甘い
・たぶん、日本人か中国人が言い出さないと進まない
ASCII 圏の人、ほんとに Unicode 追加面を知らない
・「こんなのほっといてもすぐに追加されるだろう」とか甘い
・たぶん、日本人か中国人が言い出さないと進まない
998デフォルトの名無しさん
2018/01/21(日) 22:23:53.16ID:b31s5s8Q Unicodeはただの絵文字コードに成り下がったよ
999デフォルトの名無しさん
2018/01/22(月) 02:43:08.18ID:NUz81bxR ユニコードにきちんと対応してほしいフリーソフトは多い
IrfanView
Lhaz
FileSum
IrfanView
Lhaz
FileSum
1000デフォルトの名無しさん
2018/01/22(月) 02:44:17.64ID:NUz81bxR ついでに埋め
次スレが立ったらまたよろしく
次スレが立ったらまたよろしく
10011001
Over 1000Thread このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 830日 6時間 15分 17秒
新しいスレッドを立ててください。
life time: 830日 6時間 15分 17秒
レス数が1000を超えています。これ以上書き込みはできません。
ニュース
- NY円、一時1ユーロ=180円台まで下落…1999年のユーロ導入以来初 [蚤の市★]
- 国内ホテル、既にキャンセルも 訪日客関連業界、事態見守る ★3 [蚤の市★]
- 「どうしようもない」 ため息つくアジアの玄関口 中国の訪日自粛で−福岡市 [蚤の市★]
- 【外交】日中関係悪化、長期化の様相 2012年には自動車輸出80%減も ロイター★3 [1ゲットロボ★]
- NHK、受信料の未払い世帯に督促強化へ 民事手続きの新組織を設置 差し押さえなどの強制執行も ★2 [1ゲットロボ★]
- 橋下徹氏 外務省幹部の訪中受け「口だけ番長」へ痛烈指摘 「喧嘩は日本の完敗…なんとかっこ悪い日本か」★2 [冬月記者★]
- んなっても良いお🏡
- 【悲報】高市早苗を妄信している今の日本人見ると80年前も市民は進んで戦争協力してたんだって理解出来るよね🥺 [616817505]
- 【超悲報】中国への武力行使、世論調査で「賛成」「どちらかといえば賛成」48.8% 「反対」「どちらかといえば反対」の44.2%を上回る [314039747]
- 日本人、歴史も経済も分からず貧乏に耐えかねて第二次日中戦争を求めてしまう…ヤバイよ [819729701]
- パンダ 危機感なし [399583221]
- 【悲報】けんもめん、含蓄が読めない [389326466]
