プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 [転載禁止]©2ch.net
レス数が1000を超えています。これ以上書き込みはできません。
1デフォルトの名無しさん
2015/10/14(水) 20:29:00.08ID:xctG4AAd917デフォルトの名無しさん
2017/11/23(木) 10:17:38.60ID:h7MW0ffb >>915
IME捨てろ
IME捨てろ
918デフォルトの名無しさん
2017/11/23(木) 12:20:50.57ID:eO5S+uX/ >>916
トルコ、ソ連、イラン、イスラエルか?
トルコ、ソ連、イラン、イスラエルか?
919デフォルトの名無しさん
2017/11/23(木) 22:58:49.58ID:stYe0Oux ISO/IEC 10646 - Information technology -- Universal Coded Character Set (UCS)
https://www.iso.org/standard/69119.html
Publication date : 2017-12
Number of pages : 2693
に更新されてた。
https://www.iso.org/standard/69119.html
Publication date : 2017-12
Number of pages : 2693
に更新されてた。
920デフォルトの名無しさん
2017/11/24(金) 00:48:54.85ID:O5myFoBo921デフォルトの名無しさん
2017/11/25(土) 15:25:35.45ID:unmm6CwQ チョンも入れたれ
922デフォルトの名無しさん
2017/11/27(月) 00:57:53.51ID:NURIqS8t >>921
おまえは他所行ってな
おまえは他所行ってな
923デフォルトの名無しさん
2017/11/29(水) 14:53:47.04ID:UhXC0KGu Googleのハンバーガー絵文字、Android 8.1でチーズの位置を修正
http://www.itmedia.co.jp/news/articles/1711/29/news078.html
http://www.itmedia.co.jp/news/articles/1711/29/news078.html
924デフォルトの名無しさん
2017/11/29(水) 23:06:09.33ID:CvPoQMbr 🍔食べたい
925デフォルトの名無しさん
2017/11/29(水) 23:54:56.29ID:tk9E5aVC なんで最近はハンバーガー押したらメニューが出てくるんだ
メニューから注文するんだから順序が逆じゃないか
メニューから注文するんだから順序が逆じゃないか
926デフォルトの名無しさん
2017/12/06(水) 08:48:45.84ID:6rXadv4l ユニコードコンソーシアム、来年に追加予定の新しい絵文字の最新の候補リストを公開
ttps://taisy0.com/2017/12/06/89650.html
ttps://taisy0.com/2017/12/06/89650.html
927デフォルトの名無しさん
2017/12/06(水) 10:23:15.11ID:LlbO+WJR もういいっ、もう休めっ
928デフォルトの名無しさん
2017/12/06(水) 14:03:58.50ID:TJabUNNS 昔はUnicodeへの絵文字導入はガラパゴス国のデンワへの後方互換性のため仕方なくやってくれたんだと思ってました
ほんとは自分のおもちゃがほしかったんですね…
ほんとは自分のおもちゃがほしかったんですね…
929デフォルトの名無しさん
2017/12/06(水) 17:30:16.47ID:oBvdSzU/ これはひどい
930デフォルトの名無しさん
2017/12/07(木) 05:23:32.91ID:4IlO+z0O もう認識が絵文字じゃなくて絵だよね
931デフォルトの名無しさん
2017/12/07(木) 08:08:48.43ID:jxDfrp/1 悲しいウンチは候補リストからはずされたのか。
932デフォルトの名無しさん
2017/12/07(木) 14:11:28.75ID:U5wmuQTN ある意味今の状況を一番表している絵だったのに
933デフォルトの名無しさん
2017/12/08(金) 13:03:34.59ID:0lzANth5 ホント糞だな
934デフォルトの名無しさん
2017/12/08(金) 13:40:05.51ID:6WtIjESa >>931-932
他の物を通すための囮だったかもな
他の物を通すための囮だったかもな
935デフォルトの名無しさん
2017/12/15(金) 12:23:55.99ID:Mjdx4Jdk No20のカップケーキがだいぶうんち
936デフォルトの名無しさん
2017/12/21(木) 22:04:29.07ID:Pje/kUoS ISO/IEC 10646:2017 - Information technology -- Universal Coded Character Set (UCS)
https://www.iso.org/standard/69119.html
やっと Published になった。
最初2016だったのが2017になったけど2018になるのはギリギリ避けられたか。
https://www.iso.org/standard/69119.html
やっと Published になった。
最初2016だったのが2017になったけど2018になるのはギリギリ避けられたか。
937デフォルトの名無しさん
2017/12/22(金) 15:14:29.35ID:exw3lv6k Android民「iPhone民から♂♀とか性別のアピールが送られてくるのはなぜ?」「流行りかと思った」
https://togetter.com/li/1182276
https://togetter.com/li/1182276
938デフォルトの名無しさん
2017/12/22(金) 16:48:24.80ID:5h4hYzog L2/17-429
Request to reserve the code point for square Japanese new era name (SC2 N4577)
Japan NB
2017-12-18
http://www.unicode.org/L2/L2017/17429-sc2-n4577-japan-new-era.pdf
"We noticed some legacy solutions still only support BMP."が泣ける。
Request to reserve the code point for square Japanese new era name (SC2 N4577)
Japan NB
2017-12-18
http://www.unicode.org/L2/L2017/17429-sc2-n4577-japan-new-era.pdf
"We noticed some legacy solutions still only support BMP."が泣ける。
939デフォルトの名無しさん
2017/12/23(土) 00:06:09.91ID:fYRtLYYp https://twitter.com/luka_tarot/status/943831841420713984
仕事関係の方からのメール、時々うんこマークの絵文字(これ→💩)が付いてくるので1年くらいモヤモヤしてやました。
今日初めてググってみたら、DOCOMOからSOFT BANKにメールを送ると、音符マークがうんこに変換されるようです…‼
︎ DOCOMOの方、音符の絵文字にはくれぐれもご注意くださいね
仕事関係の方からのメール、時々うんこマークの絵文字(これ→💩)が付いてくるので1年くらいモヤモヤしてやました。
今日初めてググってみたら、DOCOMOからSOFT BANKにメールを送ると、音符マークがうんこに変換されるようです…‼
︎ DOCOMOの方、音符の絵文字にはくれぐれもご注意くださいね
940デフォルトの名無しさん
2017/12/23(土) 17:51:33.27ID:tY6TFHQG 禿の嫌がらせωω
941デフォルトの名無しさん
2017/12/24(日) 20:51:23.00ID:fAY4pJin コンピューターで全漢字使用可に 6万字コード化
https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html
https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html
942デフォルトの名無しさん
2017/12/24(日) 21:03:24.97ID:czMQ2Cnw 文字情報基盤の追加IVD登録と変体仮名の入った10646が出たことをもって
「完了した」ってことかな
「完了した」ってことかな
943デフォルトの名無しさん
2017/12/24(日) 22:27:08.09ID:G1OevDef つちよしって2001年のCJK統合漢字拡張Bから使えるのでは……(U+20BB7)
Jソースが無いから日本の漢字じゃないとかそういう話?
Jソースが無いから日本の漢字じゃないとかそういう話?
944デフォルトの名無しさん
2017/12/25(月) 14:28:26.87ID:vAchG11E マスゴミ記者が間に入ると情報が可笑しくなる例
945デフォルトの名無しさん
2017/12/25(月) 16:08:58.35ID:PLr6J7k5 プレス発表 「文字情報基盤整備事業」で推進していた漢字6万文字の国際規格化が完了:IPA 独立行政法人 情報処理推進機構
https://www.ipa.go.jp/about/press/20171225.html
>>941のIPA発表
https://www.ipa.go.jp/about/press/20171225.html
>>941のIPA発表
946デフォルトの名無しさん
2017/12/25(月) 16:39:31.09ID:od7irzxW マイナ開始する前に完了させとけよ
947デフォルトの名無しさん
2017/12/25(月) 21:26:50.34ID:bsx5SElH PCで扱える漢字 6万文字に
http://www.itmedia.co.jp/news/articles/1712/25/news071.html
http://www.itmedia.co.jp/news/articles/1712/25/news071.html
948デフォルトの名無しさん
2017/12/25(月) 22:01:22.03ID:QOFkYfoX itmediaのこの見出しはアウトだな
949デフォルトの名無しさん
2017/12/26(火) 06:17:01.01ID:HWfT7fYR >>942
それを知らない人に伝えるにはこう言うしかないかもね
それを知らない人に伝えるにはこう言うしかないかもね
950デフォルトの名無しさん
2017/12/27(水) 15:43:36.55ID:RCW7nLI3 サヨク並みにアホ
951デフォルトの名無しさん
2017/12/27(水) 18:58:01.47ID:pTOpkpNU952デフォルトの名無しさん
2017/12/27(水) 21:38:26.15ID:K+2IikmJ >>951
勝手に誤解して悲しがってるあなたのほうが悲しいが
勝手に誤解して悲しがってるあなたのほうが悲しいが
953デフォルトの名無しさん
2017/12/28(木) 00:39:28.23ID:ieNYico0 存在自体が見えないZWJじゃなくて
非対応の組み合わせでは+マークを表示するルールの新結合文字作ったほうがよかったんじゃないかね
非対応の組み合わせでは+マークを表示するルールの新結合文字作ったほうがよかったんじゃないかね
954デフォルトの名無しさん
2017/12/30(土) 18:56:44.40ID:Ugth+Qnu 漢字6万字て、馬鹿か。
取るに足りない些細な違いをもって同じ文字と認めない。
最う駄目だ。
取るに足りない些細な違いをもって同じ文字と認めない。
最う駄目だ。
955デフォルトの名無しさん
2017/12/30(土) 23:54:24.56ID:8RkbD7fK >945
まあ、異字体を丹念に拾ってくれるのはありがたいけれど、
漢文をTeXで扱う場合に、Adobe Japan 1-5(20313字)にない
文字が時々出てくる(例えば『列子』など)時など、IPAMJに
その文字があると、助かる。
出来れば、中国の古典籍に出てくる文字を積極的に
IPAMJに収録するようにしてもらいたいとおもっている。
もっとも、戸籍用の文字を収録することは、行政上から
いえば、最優先事項であることは理解できるのだが。
まあ、異字体を丹念に拾ってくれるのはありがたいけれど、
漢文をTeXで扱う場合に、Adobe Japan 1-5(20313字)にない
文字が時々出てくる(例えば『列子』など)時など、IPAMJに
その文字があると、助かる。
出来れば、中国の古典籍に出てくる文字を積極的に
IPAMJに収録するようにしてもらいたいとおもっている。
もっとも、戸籍用の文字を収録することは、行政上から
いえば、最優先事項であることは理解できるのだが。
956デフォルトの名無しさん
2017/12/31(日) 10:25:58.42ID:rHg6Qc+M 超漢字で17万文字
957デフォルトの名無しさん
2017/12/31(日) 10:27:32.66ID:hZnZn3Kf958デフォルトの名無しさん
2017/12/31(日) 11:52:08.16ID:KA+WHx0L やったから、なに?
959デフォルトの名無しさん
2017/12/31(日) 11:54:37.82ID:BxTIUPKK >956
「超漢字」というのは東大で開発したGTフォントなのですが、
ただ、いかんせん。フォントが綺麗でないので、
例えば本文を「ヒラギノ」や「小塚明朝」で組んだ時に
GTフォントを入れると、かなり違和感を感じるので、
現在は、Adobe Japan 1-5やIPAMJにない字は、
Adobe Illustratorで作字している
「超漢字」というのは東大で開発したGTフォントなのですが、
ただ、いかんせん。フォントが綺麗でないので、
例えば本文を「ヒラギノ」や「小塚明朝」で組んだ時に
GTフォントを入れると、かなり違和感を感じるので、
現在は、Adobe Japan 1-5やIPAMJにない字は、
Adobe Illustratorで作字している
960デフォルトの名無しさん
2018/01/01(月) 13:59:19.71ID:Yzi7nKjn テキストエンコードに詳しい方、教えてください
下記リンクは日本語サイトの日本語テキストファイルですが
「ファイル名」が文字化けして文字コードが不明です(ファイルの本文は Shift_JIS でした)
「正しいファイル名」および「ファイル名の言語」(外国語?)が分かれば教えてください
また言語不明のファイル名を簡単に判別する方法があれば教えてください
http://www.monzen.org/doc/fonts/free/all/%e3%81%a6%e3%81%82%e3%81%a8%e3%82%8b%ef%bc%91%ef%bc%96/%e9-%e9%e1%e9%e3%e9%da%e9P%e9U.TTF%e9+%e9-%e9%f3%e9-.txt
下記リンクは日本語サイトの日本語テキストファイルですが
「ファイル名」が文字化けして文字コードが不明です(ファイルの本文は Shift_JIS でした)
「正しいファイル名」および「ファイル名の言語」(外国語?)が分かれば教えてください
また言語不明のファイル名を簡単に判別する方法があれば教えてください
http://www.monzen.org/doc/fonts/free/all/%e3%81%a6%e3%81%82%e3%81%a8%e3%82%8b%ef%bc%91%ef%bc%96/%e9-%e9%e1%e9%e3%e9%da%e9P%e9U.TTF%e9+%e9-%e9%f3%e9-.txt
961デフォルトの名無しさん
2018/01/01(月) 23:24:57.94ID:x9zbFP4w 明けましておめでとうございます
2018年の文字コード業界はどうなるやら(去年の使い回し)
2018年の文字コード業界はどうなるやら(去年の使い回し)
962デフォルトの名無しさん
2018/01/02(火) 12:20:49.37ID:Y/4ObyK1963デフォルトの名無しさん
2018/01/02(火) 12:36:54.34ID:Y/4ObyK1 http://www.monzen.org/doc/fonts/free/all/てあとる16/
ここの中身見たけどファイルが5個あって
1)てあとる16/てあとる16.TTFについて.txt
2)てあとる16/てあとる16.TTF
3)てあとる16/(化けてる).TTF(化けてる).txt
4)てあとる16/(化けてる)16.TTF
5)てあとる16/Theatres16.zip
たぶん (3) をダウンロードしたんだと思うけど
zip の中をみると (1) と (2) しかないから
サイズも同じだし (1)-(3) と (2)-(4) は同じ名前(文字列)なんだろうね
ここの中身見たけどファイルが5個あって
1)てあとる16/てあとる16.TTFについて.txt
2)てあとる16/てあとる16.TTF
3)てあとる16/(化けてる).TTF(化けてる).txt
4)てあとる16/(化けてる)16.TTF
5)てあとる16/Theatres16.zip
たぶん (3) をダウンロードしたんだと思うけど
zip の中をみると (1) と (2) しかないから
サイズも同じだし (1)-(3) と (2)-(4) は同じ名前(文字列)なんだろうね
964デフォルトの名無しさん
2018/01/02(火) 12:49:17.66ID:Y/4ObyK1 コード見ると
てあとる: e92de9e1e9e3e9da
16: e950e955
について: e92be92de9f3e92d
なんだろうけど
e92d が「て」だけじゃなくて「つ」と思われる部分にも使われてるのが謎
てあとる: e92de9e1e9e3e9da
16: e950e955
について: e92be92de9f3e92d
なんだろうけど
e92d が「て」だけじゃなくて「つ」と思われる部分にも使われてるのが謎
965デフォルトの名無しさん
2018/01/02(火) 13:15:02.16ID:Y/4ObyK1 あとは「てあとる」をどっかの言語のコードページとかで適当に変換してみて「e92de9e1e9e3e9da」のバイト純になるものを探せ
http://docs.python.jp/3/library/codecs.html#standard-encodings
http://docs.python.jp/3/library/codecs.html#standard-encodings
966デフォルトの名無しさん
2018/01/02(火) 22:57:59.20ID:5gV1mnpW 「16」の部分がE950 E955なのはShift_JISから来たのかなと思うけど(Shift_JISでは8250 8255)
「てあとる」「について」は謎だな
「てあとる」「について」は謎だな
967デフォルトの名無しさん
2018/01/03(水) 04:10:39.66ID:v5sFvWN4968デフォルトの名無しさん
2018/01/03(水) 12:59:16.54ID:j114ZuXB (>>967の続き)
あと素人臭い質問ですいませんが、下記テキストファイルをWindows環境で表示する方法はありますか?
同ディレクトリにあるotf(お試しフォント)はDLできるのですがテキストファイル3個は表示もDLもできませんでした
http://www.monzen.org/doc/fonts/free.next/%e3%83%a2%e3%83%88%e3%83%a4%e3%81%8a%e8%a9%a6%e3%81%97/UD%e3%83%a2%e3%83%88%e3%83%a4%e6%98%8e%e6%9c%9d2B/ntnum2bmst/%e6%96%87%e5%ad%97%e7%a8%ae%e4%b8%80%e8%a6%a7.txt
あと素人臭い質問ですいませんが、下記テキストファイルをWindows環境で表示する方法はありますか?
同ディレクトリにあるotf(お試しフォント)はDLできるのですがテキストファイル3個は表示もDLもできませんでした
http://www.monzen.org/doc/fonts/free.next/%e3%83%a2%e3%83%88%e3%83%a4%e3%81%8a%e8%a9%a6%e3%81%97/UD%e3%83%a2%e3%83%88%e3%83%a4%e6%98%8e%e6%9c%9d2B/ntnum2bmst/%e6%96%87%e5%ad%97%e7%a8%ae%e4%b8%80%e8%a6%a7.txt
969デフォルトの名無しさん
2018/01/04(木) 01:19:32.08ID:gDBGL8Zs 欧文環境かなんかで文字化けしたままzipばらしたっぽいな
970デフォルトの名無しさん
2018/01/04(木) 01:35:20.16ID:1mKOov/G971デフォルトの名無しさん
2018/01/04(木) 09:46:56.03ID:GKignaEj972デフォルトの名無しさん
2018/01/04(木) 20:41:42.26ID:LRBrKk4Y >>967
元はShift_JISで書かれたサイトっぽいけど「webサーバー側」の文字コード設定が間違ってて
HTMLとしてすでに正しくない文字コードというかバイト列が出力されてしまってる感じで
さらにfirefoxが文字コード検出を間違ったまま表示してる感じがする
ちなみに文字化けしたままでもfirefoxでマウスオーバーしたときに左下に出て来る日本語はたまに正常たったりする
文字化けにも色々あるけど文字通り壊れたバイト列だともうどうしようもない
元はShift_JISで書かれたサイトっぽいけど「webサーバー側」の文字コード設定が間違ってて
HTMLとしてすでに正しくない文字コードというかバイト列が出力されてしまってる感じで
さらにfirefoxが文字コード検出を間違ったまま表示してる感じがする
ちなみに文字化けしたままでもfirefoxでマウスオーバーしたときに左下に出て来る日本語はたまに正常たったりする
文字化けにも色々あるけど文字通り壊れたバイト列だともうどうしようもない
973デフォルトの名無しさん
2018/01/04(木) 21:05:29.96ID:LRBrKk4Y >>968
サーバー側の設定が間違ってると間違った文字コードでリクエストしてファイルは存在してても
違うバイト列だからファイルシステム上に見つからないとかいう状態になってそうなので
あとはだめもとでHTML側のURLを使わずに
判ってる方のファイル名
www.monzen.org/doc/fonts/free.next/モトヤお試し/UDモトヤ明朝2B/ntnum2bmst/文字種一覧.txt
を自分でURLエンコードしてリクエストしてみるとか
サーバー側の設定が間違ってると間違った文字コードでリクエストしてファイルは存在してても
違うバイト列だからファイルシステム上に見つからないとかいう状態になってそうなので
あとはだめもとでHTML側のURLを使わずに
判ってる方のファイル名
www.monzen.org/doc/fonts/free.next/モトヤお試し/UDモトヤ明朝2B/ntnum2bmst/文字種一覧.txt
を自分でURLエンコードしてリクエストしてみるとか
974デフォルトの名無しさん
2018/01/04(木) 22:02:18.09ID:LUbaT8ef 上の階層のntnum2bmst.zipなら落とせた。
975デフォルトの名無しさん
2018/01/04(木) 23:05:06.84ID:7OOzLizu >>972-974
ありがとうございます
該当のテキストがどうしても読みたいというよりも
<何故こういう現象が起きてるのか?>のほうに興味があって質問させていただきました
文字コードの世界って本当に奥が深いですね
文字フォントについても色々疑問があるのですが、それはフォントスレで質問するべきですね
(PCにインストールしていいフォント数の上限とか)
ありがとうございます
該当のテキストがどうしても読みたいというよりも
<何故こういう現象が起きてるのか?>のほうに興味があって質問させていただきました
文字コードの世界って本当に奥が深いですね
文字フォントについても色々疑問があるのですが、それはフォントスレで質問するべきですね
(PCにインストールしていいフォント数の上限とか)
976デフォルトの名無しさん
2018/01/05(金) 00:49:01.50ID:76HunQx1 ためになるスレだなあ
977デフォルトの名無しさん
2018/01/05(金) 17:51:46.56ID:GkCjRoy7 無理やり読ませるとそれなりの割合の人間に急性ショック症状を起こすスレでもある・・・
978デフォルトの名無しさん
2018/01/08(月) 12:30:50.80ID:6qORCJqP 今年でJIS漢字制定40周年なんだな。
979デフォルトの名無しさん
2018/01/08(月) 13:20:24.34ID:g3wGVkXu 40cmくらいのウンコード出た
長過ぎて一回で流れなかった
5回目くらいでやっと視界から消えた
長過ぎて一回で流れなかった
5回目くらいでやっと視界から消えた
980デフォルトの名無しさん
2018/01/09(火) 07:25:31.13ID:4jYqaTLN ウンコ駆動ですね判ります
981デフォルトの名無しさん
2018/01/09(火) 11:13:21.97ID:SxMgaYrJ ためになるスレだなあ
982デフォルトの名無しさん
2018/01/11(木) 01:29:58.58ID:8ozacBxV 【しつもん@A】
@Windowsで同一フォルダ内に全く同じファイル名+拡張子があって不審に思い
ファイル名をメモ帳にコピペしても瓜二つ
でもWordにコピペすると片方は「ジ」や「ペ」の後ろに空白文字が出てくる
Aニコニコ動画をDLしてるとたまに「グ」が「ク_ 」に文字化けする
@Aの発生原因は分りますか? (どれもネットから落としたファイルです)
@Windowsで同一フォルダ内に全く同じファイル名+拡張子があって不審に思い
ファイル名をメモ帳にコピペしても瓜二つ
でもWordにコピペすると片方は「ジ」や「ペ」の後ろに空白文字が出てくる
Aニコニコ動画をDLしてるとたまに「グ」が「ク_ 」に文字化けする
@Aの発生原因は分りますか? (どれもネットから落としたファイルです)
983デフォルトの名無しさん
2018/01/11(木) 01:41:04.05ID:0E6TKJI8 Wordを持ってるならその空白文字の後ろでAlt+Xしてみ
そしたら文字コードに変換されるから何がついてるか分かる
そしたら文字コードに変換されるから何がついてるか分かる
984デフォルトの名無しさん
2018/01/11(木) 02:16:47.71ID:8ozacBxV >>983 ありがトン
@「ジ 」が「シ3099」に変わった
A「ク_ 」が「ク005F」に変わった
@は↓の「Unicode正規化」ってやつですかね? Aは分らないけど
http://tech.albert2005.co.jp/501/
@「ジ 」が「シ3099」に変わった
A「ク_ 」が「ク005F」に変わった
@は↓の「Unicode正規化」ってやつですかね? Aは分らないけど
http://tech.albert2005.co.jp/501/
985デフォルトの名無しさん
2018/01/11(木) 12:49:11.03ID:F0gXla1d 2は、ダウンロードするソフトがファイル名に使えなさそうな文字をアンダースコアに変えてるのでは
986デフォルトの名無しさん
2018/01/11(木) 16:02:48.08ID:rE/gsUWL 合成済み文字と結合文字列の違いは
Windowsとmacでデータのやりとりをしていると稀によくある
Windowsとmacでデータのやりとりをしていると稀によくある
987デフォルトの名無しさん
2018/01/11(木) 17:06:01.77ID:WekjUxUo >>985-986 ありがトン
A ニコニコ動画の無料アニメ2本 上の「グルグル」は文字化けしないが、下のは化ける
http://www.nico video.jp/watch/1499326505
魔法陣グルグル PV
http://www.nico video.jp/watch/1500538647
魔法陣ク?ルク?ル 第1話「旅立ち!ジミナ村!」
下の動画タイトルをWordにコピペ&Alt+Xすると「ク3099」なので、上とは違った文字コードで書かれてる模様
ブラウザ上では見分けがつかないが、DLすると「ク_ 」=「ク005F」に化ける
ニコ動はブラウザで見ることを前提にしてるのでクレームをつけるわけにもいかないが
バラバラの文字コードで書かれるとモヤッとする
A ニコニコ動画の無料アニメ2本 上の「グルグル」は文字化けしないが、下のは化ける
http://www.nico video.jp/watch/1499326505
魔法陣グルグル PV
http://www.nico video.jp/watch/1500538647
魔法陣ク?ルク?ル 第1話「旅立ち!ジミナ村!」
下の動画タイトルをWordにコピペ&Alt+Xすると「ク3099」なので、上とは違った文字コードで書かれてる模様
ブラウザ上では見分けがつかないが、DLすると「ク_ 」=「ク005F」に化ける
ニコ動はブラウザで見ることを前提にしてるのでクレームをつけるわけにもいかないが
バラバラの文字コードで書かれるとモヤッとする
988デフォルトの名無しさん
2018/01/13(土) 18:28:46.68 >>987
「魔法陣グルグル 」だけを抜き出してみると
魔法陣グルグル PV
¥u9b54¥u6cd5¥u9663¥u30b0¥u30eb¥u30b0¥u30eb¥u3000
魔法陣グルグル 第1話「旅立ち!ジミナ村!」
¥u9b54¥u6cd5¥u9663¥u30af¥u3099¥u30eb¥u30af¥u3099¥u30eb¥u3000
下の方は半角カナ(グルグル)から変換したとかかなあ
ウェブブラウザでは一見区別が付かないのも困りものだ
「魔法陣グルグル 」だけを抜き出してみると
魔法陣グルグル PV
¥u9b54¥u6cd5¥u9663¥u30b0¥u30eb¥u30b0¥u30eb¥u3000
魔法陣グルグル 第1話「旅立ち!ジミナ村!」
¥u9b54¥u6cd5¥u9663¥u30af¥u3099¥u30eb¥u30af¥u3099¥u30eb¥u3000
下の方は半角カナ(グルグル)から変換したとかかなあ
ウェブブラウザでは一見区別が付かないのも困りものだ
989デフォルトの名無しさん
2018/01/13(土) 19:15:50.63ID:kgVvsCNy MacとかiPhoneとか、Apple製品は濁点を結合文字列で扱うのがデフォだったはず
990デフォルトの名無しさん
2018/01/13(土) 19:16:22.00ID:bGec8C/6 半角カナから単純に変換したのであればク゛(30af 309b)になってそうだけど
991デフォルトの名無しさん
2018/01/14(日) 06:16:21.53ID:piPpz4p9 ものかのとかいう奴がそんな訳語を提唱してたっけw
992デフォルトの名無しさん
2018/01/16(火) 16:24:03.09ID:gClSSJeQ Combining Character Sequence
公式日本語訳の「結合文字の並び」は何だか使いにくいし
公式日本語訳の「結合文字の並び」は何だか使いにくいし
993デフォルトの名無しさん
2018/01/16(火) 21:25:09.69ID:LbNJCNQU 単一の文字を表すくせに文字列と呼ぶのもいまいちだし悩ましいところだな
994デフォルトの名無しさん
2018/01/16(火) 21:58:19.78 「結合文字列」って、「合州国」みたいなもんか
995デフォルトの名無しさん
2018/01/17(水) 15:56:04.49ID:9Sws3XK1 合衆国の誤字だっけ
996デフォルトの名無しさん
2018/01/20(土) 12:33:26.67ID:4AOaXNlF997デフォルトの名無しさん
2018/01/21(日) 14:15:27.16ID:zFm0SEQ6 ttp://ufcpp.net/blog/2018/1/getunicodecategory/
ASCII 圏の人、ほんとに Unicode 追加面を知らない
・「こんなのほっといてもすぐに追加されるだろう」とか甘い
・たぶん、日本人か中国人が言い出さないと進まない
ASCII 圏の人、ほんとに Unicode 追加面を知らない
・「こんなのほっといてもすぐに追加されるだろう」とか甘い
・たぶん、日本人か中国人が言い出さないと進まない
998デフォルトの名無しさん
2018/01/21(日) 22:23:53.16ID:b31s5s8Q Unicodeはただの絵文字コードに成り下がったよ
999デフォルトの名無しさん
2018/01/22(月) 02:43:08.18ID:NUz81bxR ユニコードにきちんと対応してほしいフリーソフトは多い
IrfanView
Lhaz
FileSum
IrfanView
Lhaz
FileSum
1000デフォルトの名無しさん
2018/01/22(月) 02:44:17.64ID:NUz81bxR ついでに埋め
次スレが立ったらまたよろしく
次スレが立ったらまたよろしく
10011001
Over 1000Thread このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 830日 6時間 15分 17秒
新しいスレッドを立ててください。
life time: 830日 6時間 15分 17秒
レス数が1000を超えています。これ以上書き込みはできません。
ニュース
- 橋下徹氏 外務省幹部の訪中受け「口だけ番長」へ痛烈指摘 「喧嘩は日本の完敗…なんとかっこ悪い日本か」 [冬月記者★]
- 【外国人問題】小野田紀美担当相「不法就労や不法滞在は許さない」 [シャチ★]
- 【野球】井端監督 大谷翔平、山本由伸らのWBCへの参加 「1日も早く返事ほしい」「待っててといっても、国内組が遅くなってしまう」★3 [冬月記者★]
- 経団連会長、日中は建設的対話を 経済3団体が高市首相と初会談も日中関係は話題に登らず… [BFU★]
- 中国で「クレしん」公開延期 対日報復、エンタメに波及 [蚤の市★]
- 東京株式市場 インバウンド関連株が下落 中国政府の渡航自粛要請で [バイト歴50年★]
- 有識者「高市総理が発言を撤回したり、辞職するしかないと言っている人は、それで日中関係が今まで通りになると思ってる?」 [834922174]
- 戦争は無くならないし殺人は起きるし女はレイプされるし子供は餓死するし
- ケンモメンが思うケンモメンの生態を述べるスレ [866936191]
- 中共は台湾を自分の領土と思ってるから外国が「侵略するな」と警告しても意味ないんだよね
- ( ´・ω・` )朝ですぞー
- 日経時間外、5万円割れ 垂直落下始まる [402859164]
