プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
2018/01/22(月) 22:58:23.45ID:UK/uqEp5759デフォルトの名無しさん
2018/08/24(金) 18:42:02.68ID:NFTQhSIK 65536-256
760デフォルトの名無しさん
2018/08/24(金) 18:46:30.51ID:qhlQ/zrJ >>758
正直なところ何を言いたいのか理解できないのだが、Unicode で定義されている文字なら公式サイトで全部見られるよ。
Code Charts
http://unicode.org/charts/
正直なところ何を言いたいのか理解できないのだが、Unicode で定義されている文字なら公式サイトで全部見られるよ。
Code Charts
http://unicode.org/charts/
761デフォルトの名無しさん
2018/08/24(金) 19:19:57.24ID:wXpFbMeR >>758
基本多言語面
https://ja.wikipedia.org/wiki/%E9%9D%A2_(%E6%96%87%E5%AD%97%E3%82%B3%E3%83%BC%E3%83%89)#%E5%9F%BA%E6%9C%AC%E5%A4%9A%E8%A8%80%E8%AA%9E%E9%9D%A2
Unicodeは似てる文字を一つにまとめて約6万5000文字(16bit)に収めるぞーって
言っていたのが、案の定無理だと破綻し(だから言っただろうがバカメリケンが)、
21bitを使い最大で約111万文字収録可能になってる
最新のUnicode 11.0 では13万7439文字が収録されてる
基本多言語面
https://ja.wikipedia.org/wiki/%E9%9D%A2_(%E6%96%87%E5%AD%97%E3%82%B3%E3%83%BC%E3%83%89)#%E5%9F%BA%E6%9C%AC%E5%A4%9A%E8%A8%80%E8%AA%9E%E9%9D%A2
Unicodeは似てる文字を一つにまとめて約6万5000文字(16bit)に収めるぞーって
言っていたのが、案の定無理だと破綻し(だから言っただろうがバカメリケンが)、
21bitを使い最大で約111万文字収録可能になってる
最新のUnicode 11.0 では13万7439文字が収録されてる
762デフォルトの名無しさん
2018/08/24(金) 19:24:24.02ID:wXpFbMeR Unicodeはもはや文字コードじゃない
文字シーケンスというべきだろう
複数の文字を使って1文字を表している
文字シーケンスというべきだろう
複数の文字を使って1文字を表している
763デフォルトの名無しさん
2018/08/24(金) 20:11:02.68ID:mVdVBkdF >>761
「基本多言語面」
ありがとうございます! すみません。言い方がボケナスで余計な労力をお掛けしました。
この言葉が知りたかったのです。
ちなみに極めてどうでもいいことですが
マインクラフトというゲームのフォントを変えたいと思っており
その為のフォントおよび文字コードの勉強していこうとしていたところでした。
「基本多言語面」
ありがとうございます! すみません。言い方がボケナスで余計な労力をお掛けしました。
この言葉が知りたかったのです。
ちなみに極めてどうでもいいことですが
マインクラフトというゲームのフォントを変えたいと思っており
その為のフォントおよび文字コードの勉強していこうとしていたところでした。
764デフォルトの名無しさん
2018/08/25(土) 06:50:31.16ID:gxBSyOuw HTML のフォント指定は、こういう感じ。
「html フォント指定」で検索!
HTMLの文字コードは、UTF-8
<font face="候補1,候補2,候補3">フォントを変更します</font>
<p><font face="MS P明朝,MS 明朝">これは明朝体を指定</font></p>
それとも、マインクラフトはHTMLじゃないのか?
「html フォント指定」で検索!
HTMLの文字コードは、UTF-8
<font face="候補1,候補2,候補3">フォントを変更します</font>
<p><font face="MS P明朝,MS 明朝">これは明朝体を指定</font></p>
それとも、マインクラフトはHTMLじゃないのか?
765デフォルトの名無しさん
2018/08/25(土) 07:11:24.89ID:5ar3I1wr >>762
合字はそうすることが自然だからそうなってるんだと思ってるんだけど、全部個別に文字コードを割り当てたほうがいいってこと?
合字はそうすることが自然だからそうなってるんだと思ってるんだけど、全部個別に文字コードを割り当てたほうがいいってこと?
766デフォルトの名無しさん
2018/08/25(土) 09:10:13.50ID:2/0/KxdV >>764
マインクラフトのフォントは
./assets/minecraft/textures/font
というディレクトリに16ドットフォントが16列16行配置されたPNG形式の画像が0xFF枚格納されてる
というような仕様になってますね
HTMLはあんまり関係ないです。
マインクラフトのフォントは
./assets/minecraft/textures/font
というディレクトリに16ドットフォントが16列16行配置されたPNG形式の画像が0xFF枚格納されてる
というような仕様になってますね
HTMLはあんまり関係ないです。
767デフォルトの名無しさん
2018/09/07(金) 14:01:42.05ID:NnTKHa0h ♥
768デフォルトの名無しさん
2018/09/10(月) 17:53:51.80ID:wWJP5KoS Unicodeの公式サイト(http://unicode.org/)で,Unicodeの最新安定バージョンがなにかを調べるにはどこを見ればいいんですかね。
今11.0だそうですが,他サイトの情報なので,なるべく本家本元の情報が欲しいんです。
今11.0だそうですが,他サイトの情報なので,なるべく本家本元の情報が欲しいんです。
769デフォルトの名無しさん
2018/09/10(月) 19:07:05.53ID:Xr++yj7Q >>768
ちゃんとメニューを見よう。
サイトの左側のメニューから The Unicode Standard プルダウンの中にある Latest Version を選べばよい。
というわけで、現時点では 11.0 が最新という認識で正解です。
ちゃんとメニューを見よう。
サイトの左側のメニューから The Unicode Standard プルダウンの中にある Latest Version を選べばよい。
というわけで、現時点では 11.0 が最新という認識で正解です。
770デフォルトの名無しさん
2018/09/11(火) 03:10:58.81ID:zLtJmO+E771デフォルトの名無しさん
2018/09/12(水) 15:59:00.59ID:DAmcAY4y Unicodeって,なんで初めに多バイト文字のことを考えなかったんだろう。
そもそも多バイト文字を統一するために設立したようなもんなんだから,
2^16では済まないことくらい予測できた筈なのにね
そもそも多バイト文字を統一するために設立したようなもんなんだから,
2^16では済まないことくらい予測できた筈なのにね
772デフォルトの名無しさん
2018/09/12(水) 16:00:08.88ID:3JFFS4nO The Unicode Blog: New Japanese Era
http://blog.unicode.org/2018/09/new-japanese-era.html
Unicodeの方でも記事になってたのか。
http://blog.unicode.org/2018/09/new-japanese-era.html
Unicodeの方でも記事になってたのか。
773デフォルトの名無しさん
2018/09/12(水) 16:39:35.87ID:1j3hWxX7774デフォルトの名無しさん
2018/09/12(水) 17:33:44.29ID:lrlSblfi775デフォルトの名無しさん
2018/09/12(水) 22:23:14.60ID:DAmcAY4y >>774
まあ正直,日本人でも特段勉強してなかったらそういう感覚やろうしな
まあ正直,日本人でも特段勉強してなかったらそういう感覚やろうしな
776デフォルトの名無しさん
2018/09/12(水) 22:25:38.00ID:yfKtIfo2 で、バカは5マンの漢字全部読めるの?
で、バカは5マンの漢字全部書けるの?
で、バカは5マンの漢字全部使えるの?
で、バカは5マンの漢字全部使ってるの?
で、バカは5マンの漢字全部書けるの?
で、バカは5マンの漢字全部使えるの?
で、バカは5マンの漢字全部使ってるの?
777デフォルトの名無しさん
2018/09/12(水) 22:30:26.22ID:yfKtIfo2 卜部の卜
トナカイの卜
見た目でも違いなんかまったくわからない
トナカイの卜
見た目でも違いなんかまったくわからない
778デフォルトの名無しさん
2018/09/13(木) 02:31:52.28ID:cMp+qWRQ でもコンピュータに合わせて世界を
作り変えることができるなら、
65535文字に抑えるだろうな
サマータイムもない世の中
文字も16進数が基本かな
電気の流れもマイナスからプラスへだ
作り変えることができるなら、
65535文字に抑えるだろうな
サマータイムもない世の中
文字も16進数が基本かな
電気の流れもマイナスからプラスへだ
779デフォルトの名無しさん
2018/09/13(木) 08:51:11.89ID:wI3BpnoI 君が代によれば、天皇の世は八千代続くので、
元号の合字も8000個必要になる。
Unicodeのどこかの面にまとめて確保できないものだろうか。
元号の合字も8000個必要になる。
Unicodeのどこかの面にまとめて確保できないものだろうか。
780デフォルトの名無しさん
2018/09/13(木) 09:03:45.21ID:1sKEH3Wo781デフォルトの名無しさん
2018/09/13(木) 09:54:19.07ID:l9KSlvFS >>774
宇宙人と交信する予定は無かったのか
宇宙人と交信する予定は無かったのか
782デフォルトの名無しさん
2018/09/13(木) 09:56:12.02ID:l9KSlvFS >電気の流れもマイナスからプラスへだ
これいつかやっても良いと思うけど
どこにどんな影響が出るんやろね
数学の外積の定義とかも変えたくなりそう
これいつかやっても良いと思うけど
どこにどんな影響が出るんやろね
数学の外積の定義とかも変えたくなりそう
783デフォルトの名無しさん
2018/09/13(木) 16:01:34.38ID:Mtznb6SP >>782
電子がマイナスからプラスへと流れると電流がプラスからマイナスへ流れるという理解で問題ない
電子がマイナスからプラスへと流れると電流がプラスからマイナスへ流れるという理解で問題ない
784デフォルトの名無しさん
2018/09/13(木) 17:09:43.69ID:1sKEH3Wo 数字が連続してない符号化文字集合ってあるのかな。
EBCDICとかは英語が連続してないことで有名だけど。
EBCDICとかは英語が連続してないことで有名だけど。
785デフォルトの名無しさん
2018/09/13(木) 19:23:35.05ID:U1nKZv8x C言語の規格で'0'から'9'は連続していることになってたと思うから
そうじゃない文字コードがあったとしてもとっくに淘汰されてるのでは
そうじゃない文字コードがあったとしてもとっくに淘汰されてるのでは
786デフォルトの名無しさん
2018/09/13(木) 19:34:24.00ID:l9KSlvFS どうせ文字集合じゃねーって言われるけど
漢数字
漢数字
787デフォルトの名無しさん
2018/09/13(木) 19:47:56.84ID:QXoXnqLA 0〜9は世界共通文字
どの国でも同じ文字が使える
どの国でも同じ文字が使える
788デフォルトの名無しさん
2018/09/13(木) 20:25:28.42ID:U1nKZv8x 世界共通になる前に6と9のどちらかを変更しておいて欲しかった
789デフォルトの名無しさん
2018/09/13(木) 21:10:29.13ID:1sKEH3Wo790デフォルトの名無しさん
2018/09/13(木) 21:35:44.08ID:1sKEH3Wo 漢数字がそれが表わす数字順に並ばないって結構有名だったのか……恥かしい
791デフォルトの名無しさん
2018/09/14(金) 06:35:40.18ID:gu26jl1+792デフォルトの名無しさん
2018/09/14(金) 07:22:37.60ID:jXQgdfuV793デフォルトの名無しさん
2018/09/14(金) 12:40:21.98ID:5xDSXwp0 >>788
RとЯ
RとЯ
794デフォルトの名無しさん
2018/09/14(金) 15:58:06.01ID:V0YFlSa+ 1960年代1970年代では、
コーディングシート上で「O(オー)」」と「0(ゼロ9)とを
区別するために
Fortranは「「O(オー)」の上に傍線を書いたし、
COBOLでは、「0(ゼロ)」に斜線を引いて区別
してたような気がする。
「I(あい)」と「1(いち)」の場合は、「I(アイ)」を
小文字の「i」を使っていたような気がする。
なにぶん、古い話なので、間違っているかもしれないが
一応参考までに
コーディングシート上で「O(オー)」」と「0(ゼロ9)とを
区別するために
Fortranは「「O(オー)」の上に傍線を書いたし、
COBOLでは、「0(ゼロ)」に斜線を引いて区別
してたような気がする。
「I(あい)」と「1(いち)」の場合は、「I(アイ)」を
小文字の「i」を使っていたような気がする。
なにぶん、古い話なので、間違っているかもしれないが
一応参考までに
795デフォルトの名無しさん
2018/09/14(金) 16:10:40.01ID:cGEdpT46 斜線入りの0
VS使ってU+0030 U+FE00で表せるように
なってたんだな。
VS使ってU+0030 U+FE00で表せるように
なってたんだな。
796デフォルトの名無しさん
2018/09/14(金) 16:32:11.43ID:jXQgdfuV797デフォルトの名無しさん
2018/09/14(金) 18:22:58.68ID:q3l06dS7 まーーた「異字体」という概念を欧米のやつらがめちゃめちゃにしやがったな
798デフォルトの名無しさん
2018/09/14(金) 19:03:02.27ID:YqXme0/t799デフォルトの名無しさん
2018/09/14(金) 19:03:15.35ID:TqoCD1dQ Unicodeをめちゃくちゃにしてるのは大昔の馬鹿な中国人
800デフォルトの名無しさん
2018/09/14(金) 21:49:17.28ID:J5fDz/kR 斜線入りゼロの全角版もU+FF10 U+FE00で規定しようとしてるな。
もうアホかと。
もうアホかと。
801デフォルトの名無しさん
2018/09/14(金) 22:09:46.77ID:zZtMiOUI あーあもうめちゃくちゃだよ…
802デフォルトの名無しさん
2018/09/14(金) 22:50:34.15ID:G7suMYm4 21bitも使わせるからそんな浪費するんだよ。16bitで我慢させておくべきだった。
803デフォルトの名無しさん
2018/09/15(土) 00:35:10.02ID:RLWLi0Yo 多コードポイント文字(←?)なのでビット数関係ない
むしろ、16bitに詰め込むために合成やVS、ZWJのような小細工が作られてしまって
それが乱用されてる
むしろ、16bitに詰め込むために合成やVS、ZWJのような小細工が作られてしまって
それが乱用されてる
804デフォルトの名無しさん
2018/09/15(土) 00:49:16.31ID:KIanXBkQ UCS-4でコードポイントで利用できる領域は21bitまでときまってる
コードのレンジはMSBを除く31bitまで
コードポイントのビット数とエンコードのビット数は関係ない
相変わらず低学歴知恵遅れは
意味不明なことばっかりいう
コードのレンジはMSBを除く31bitまで
コードポイントのビット数とエンコードのビット数は関係ない
相変わらず低学歴知恵遅れは
意味不明なことばっかりいう
805デフォルトの名無しさん
2018/09/15(土) 08:00:03.75ID:JGlclHBn806デフォルトの名無しさん
2018/09/15(土) 10:09:57.93ID:RLWLi0Yo お、おう……ありがとう
「誰一人エンコーディングの話はしてねーだろ幻視かそれともセレクタ知らんのか」ぐらいは書こうとしたんだが
「誰一人エンコーディングの話はしてねーだろ幻視かそれともセレクタ知らんのか」ぐらいは書こうとしたんだが
807デフォルトの名無しさん
2018/09/16(日) 22:47:16.05ID:R5KpyTLY >>796
U+0030 U+FE00は標準化されてるけどU+0030 U+0338の方はそうじゃない
スラッシュ0っぽいものになるかもしれないという程度
あとVSは検索時には無視されるんで0030と等価になる
U+0030 U+FE00は標準化されてるけどU+0030 U+0338の方はそうじゃない
スラッシュ0っぽいものになるかもしれないという程度
あとVSは検索時には無視されるんで0030と等価になる
808デフォルトの名無しさん
2018/09/18(火) 13:57:58.92ID:5qlr0JT7 >>807
従来のやり方に合わせるとU+0030 U+0338に対応するNFC形式を用意して検索は互換分解で対応ってならね?
逆にVSを検索時無視するという仕様を活用するなら、互換分解よりもそっちが良かったって文字が他に沢山ない?
まあ、今更言ってもなんだ
従来のやり方に合わせるとU+0030 U+0338に対応するNFC形式を用意して検索は互換分解で対応ってならね?
逆にVSを検索時無視するという仕様を活用するなら、互換分解よりもそっちが良かったって文字が他に沢山ない?
まあ、今更言ってもなんだ
809デフォルトの名無しさん
2018/09/18(火) 13:58:59.04ID:5qlr0JT7 訂正、合成文字の方が先だからU+0338 U+0030
810デフォルトの名無しさん
2018/09/18(火) 22:20:07.57ID:rWjVnVL/ なんで混同している人がいるのかえあからないけど合字と変種は別のものだよ。
合字はもとの文字と別物として扱われるのに対して、変種はあくまで同じ文字の字形違い。
合字はもとの文字と別物として扱われるのに対して、変種はあくまで同じ文字の字形違い。
811デフォルトの名無しさん
2018/09/21(金) 03:58:13.13ID:dtC8HZuo すいません
「�����������d」
という文字列を解読したいです。
$ echo '<当該文字列>' | od -A xn -t x1
の結果は
000000 ef bf bd ef bf bd ef bf bd ef bf bd ef bf bd ef
000010 bf bd ef bf bd ef bf bd ef bf bd ef bf bd ef bf
000020 bd 64
のような感じです。
個人的には\0x0eや\0x0fが多く登場しているのでUTF-16あたりをUTF-8で解釈しているのかなとも思いまして
iconv(1)などでどうにかしようとしました(iconv -c -f utf16 -t utf8)が 駄目でした。
どうかよろしくおねがいします。
「�����������d」
という文字列を解読したいです。
$ echo '<当該文字列>' | od -A xn -t x1
の結果は
000000 ef bf bd ef bf bd ef bf bd ef bf bd ef bf bd ef
000010 bf bd ef bf bd ef bf bd ef bf bd ef bf bd ef bf
000020 bd 64
のような感じです。
個人的には\0x0eや\0x0fが多く登場しているのでUTF-16あたりをUTF-8で解釈しているのかなとも思いまして
iconv(1)などでどうにかしようとしました(iconv -c -f utf16 -t utf8)が 駄目でした。
どうかよろしくおねがいします。
812デフォルトの名無しさん
2018/09/21(金) 06:10:45.73ID:v8LFlyn0 >>811
無理です
無理です
813デフォルトの名無しさん
2018/09/21(金) 08:54:48.61ID:YSf5+rmt814デフォルトの名無しさん
2018/09/21(金) 16:14:43.03ID:dtC8HZuo >>813
なるほど。復元は無理ってことですね。thx
なるほど。復元は無理ってことですね。thx
815デフォルトの名無しさん
2018/09/21(金) 22:27:01.36ID:VETs/R35 URLエンコードとか16進文字列で表示してほしいよね。
文字化け文字列を表示されても途方に暮れる。
文字化け文字列を表示されても途方に暮れる。
816デフォルトの名無しさん
2018/09/22(土) 12:49:11.01ID:xOVRbYWf >>815
表示したい文字とそれ以外をどうやって区別させる?
表示したい文字とそれ以外をどうやって区別させる?
817デフォルトの名無しさん
2018/09/22(土) 13:55:53.33ID:PGp2AKzL 低学歴知恵遅れの世界ではグリフが違うように見えれば
その字じたいがもつ意味もかわる
その字じたいがもつ意味もかわる
818デフォルトの名無しさん
2018/09/22(土) 16:15:38.71ID:lyt/iYyi φと Φ の小さい字が小文字 ɸ だと一緒のはずなんだが環境によって違うのが困る unicode のくせに
819デフォルトの名無しさん
2018/09/23(日) 04:36:37.16ID:D4/zD5nR https://github.com/JuliaStrings/utf8proc
これすばらしいね。
UTF8の煩雑な処理がC89という極めて汎用で互換性の高い言語で扱えるなんて。
ただUnicode11対応を謳ってる割には曖昧文字幅が考慮されてないのが難点
issueやPRを見てるとそれっぽい対応がされてるのかどうなのか……。
https://github.com/JuliaStrings/utf8proc/pull/83 👀
Rock54: Caution(BBR-MD5:1341adc37120578f18dba9451e6c8c3b)
これすばらしいね。
UTF8の煩雑な処理がC89という極めて汎用で互換性の高い言語で扱えるなんて。
ただUnicode11対応を謳ってる割には曖昧文字幅が考慮されてないのが難点
issueやPRを見てるとそれっぽい対応がされてるのかどうなのか……。
https://github.com/JuliaStrings/utf8proc/pull/83 👀
Rock54: Caution(BBR-MD5:1341adc37120578f18dba9451e6c8c3b)
820デフォルトの名無しさん
2018/09/23(日) 13:00:23.58ID:7oyGtio1821デフォルトの名無しさん
2018/09/25(火) 01:23:30.21ID:lmrEE7TE https://www.softek.co.jp/SPG/Pgi/performance52.html
ここのページのエンコーディングって分かる?
EUC-JPで読みこむと漢字だらけ
Shift JISで読みこむと半角カナの「ス」だらけ
UTF-8で読みこむと非文字だらけ
ここのページのエンコーディングって分かる?
EUC-JPで読みこむと漢字だらけ
Shift JISで読みこむと半角カナの「ス」だらけ
UTF-8で読みこむと非文字だらけ
822デフォルトの名無しさん
2018/09/25(火) 11:23:08.18ID:Ldj267OX chrome で開いたけど問題なく日本語出るぞ
おまいのブラウザが糞なんじゃね
ブラウザ経由せずに python でダウソしたら中身 UTF-8 のファイルが出来た
<META http-equiv="Content-Type" content="text/html; charset=EUC-JP">
EUC-JP ってことになってるな
おまいのブラウザが糞なんじゃね
ブラウザ経由せずに python でダウソしたら中身 UTF-8 のファイルが出来た
<META http-equiv="Content-Type" content="text/html; charset=EUC-JP">
EUC-JP ってことになってるな
823デフォルトの名無しさん
2018/09/25(火) 12:50:25.51ID:lmrEE7TE やっぱFirefoxはゴミですね
824デフォルトの名無しさん
2018/09/25(火) 13:50:17.89ID:O6wzDQwM そのサイトうちのffタソは普通に日本語出してる
825デフォルトの名無しさん
2018/09/25(火) 15:39:49.76ID:po7dXpcK 夜に見たときはFirefoxでもChromiumでもWaterfoxでも
ID:lmrEE7TEが言うような文字化けになってたけど
今はFirefoxでもChromiumでもWaterfoxでも文字化けせずに見られる
そのサイトのほうがおかしくなってたんじゃないか?
ID:lmrEE7TEが言うような文字化けになってたけど
今はFirefoxでもChromiumでもWaterfoxでも文字化けせずに見られる
そのサイトのほうがおかしくなってたんじゃないか?
826デフォルトの名無しさん
2018/09/25(火) 15:45:45.33ID:O6wzDQwM apacheとかデフォでutf-8に強制変更とかあるからな
827デフォルトの名無しさん
2018/09/25(火) 16:40:21.10ID:hDTNQGQ/828デフォルトの名無しさん
2018/09/25(火) 16:45:52.15ID:EqDfiqim 奇遇ですね
私もちょうど昨日そのサイト見てました
私もちょうど昨日そのサイト見てました
829デフォルトの名無しさん
2018/09/25(火) 17:23:14.79ID:lmrEE7TE あっっれ。
まさかなと思ってもう一度行ったら なんかちゃんと読めるようになってたわ。
うーん。向こうの不具合かな。とりあえずFirefoxに濡れ衣を着せてしまったことをお詫びします。
ただしFirefoxには
http://www.am.ics.keio.ac.jp/~keisuke/lab/ptex218.html
↑このページが読めないという前科があるんだよね。
まさかなと思ってもう一度行ったら なんかちゃんと読めるようになってたわ。
うーん。向こうの不具合かな。とりあえずFirefoxに濡れ衣を着せてしまったことをお詫びします。
ただしFirefoxには
http://www.am.ics.keio.ac.jp/~keisuke/lab/ptex218.html
↑このページが読めないという前科があるんだよね。
830デフォルトの名無しさん
2018/09/25(火) 17:33:32.27ID:EqDfiqim 最近のブラウザは一時的に文字コード指定するメニュー無くなった
831デフォルトの名無しさん
2018/09/25(火) 17:41:54.78ID:UWcApuPo832デフォルトの名無しさん
2018/09/25(火) 18:07:13.36ID:po7dXpcK http://www.am.ics.keio.ac.jp/~keisuke/lab/ptex218.htmlは
WaterfoxやChromiumでも文字化けする
Waterfoxだと文字コードの手動切り替えで対応できるけど
自動判定できない状況に陥っているのだからサイト側の問題なんだろうね
WaterfoxやChromiumでも文字化けする
Waterfoxだと文字コードの手動切り替えで対応できるけど
自動判定できない状況に陥っているのだからサイト側の問題なんだろうね
833デフォルトの名無しさん
2018/09/25(火) 18:35:00.27ID:EqDfiqim HTTPはheaderみてそっち優先のブラウザばっかになってつまらんぬ
834デフォルトの名無しさん
2018/09/25(火) 18:40:37.62ID:YBMAwOu6 そういえば、昔おまじない文字ってあったよな
「京」とか
「京」とか
835デフォルトの名無しさん
2018/09/25(火) 19:00:03.09ID:lmrEE7TE だいたい日本語TeXを使ってるのなら文字コードに関する知識はそれなりにある筈なんだけどなぁ
836デフォルトの名無しさん
2018/09/25(火) 19:01:52.45ID:EqDfiqim >>834
美乳
美乳
837デフォルトの名無しさん
2018/09/25(火) 23:09:37.69ID:dH/9GcKQ838デフォルトの名無しさん
2018/10/01(月) 00:48:09.88ID:MJnLVykJ これってよくあるよな
839デフォルトの名無しさん
2018/10/01(月) 06:54:49.15ID:lrLCBstk なにが?
840デフォルトの名無しさん
2018/10/01(月) 09:18:19.81ID:CSe7Ol42 サーバーが余計なこといってるやつ
841デフォルトの名無しさん
2018/10/02(火) 15:20:38.65ID:YIYqcJyy RedHat や CentOS のパッケージで Apache をインストールするとデフォルトで AddDefaultCharset UTF-8 が有効になっているのが原因。
この設定をコメントアウトし忘れると今回のようなことが起きてしまう。
これ、わりと迷惑度合いの高いデフォルト設定なんだよねえ……
この設定をコメントアウトし忘れると今回のようなことが起きてしまう。
これ、わりと迷惑度合いの高いデフォルト設定なんだよねえ……
842デフォルトの名無しさん
2018/10/02(火) 15:47:12.77ID:yDKwoLm6 何を今更
843デフォルトの名無しさん
2018/10/03(水) 08:04:57.07ID:ej0n10jM UTF-8デフォルトはそれこそLinux機にとっては嬉しいんだけどねぇ
ちなみにnghttp2というHTTP/2に特化したWebサーバーは
HTTP/2の既定エンコーディングがUTF-8であるにもかかわらずなんとASCII。
いつの時代だよ……。しかも古いプロジェクトじゃなくてめっちゃ新しいのに……。
ちなみにnghttp2というHTTP/2に特化したWebサーバーは
HTTP/2の既定エンコーディングがUTF-8であるにもかかわらずなんとASCII。
いつの時代だよ……。しかも古いプロジェクトじゃなくてめっちゃ新しいのに……。
844デフォルトの名無しさん
2018/10/09(火) 21:29:38.61ID:cJ7fFqob 最近またUnicodeが分からなくなってしまった。
単にShift_JISのような
「一部コードを拡張マップ専用の文字にして後続のコードを
その拡張マップ専用の文字のコードと連続した(つまり2次元的な配置の)コードとして
処理する」
っていう方法ではないのか。
単にShift_JISのような
「一部コードを拡張マップ専用の文字にして後続のコードを
その拡張マップ専用の文字のコードと連続した(つまり2次元的な配置の)コードとして
処理する」
っていう方法ではないのか。
845デフォルトの名無しさん
2018/10/10(水) 01:30:32.33ID:cxHjn/W/ 違う
846デフォルトの名無しさん
2018/10/10(水) 02:38:09.95ID:cuDZW5pF サロゲートペアの話?
847デフォルトの名無しさん
2018/10/10(水) 16:28:58.28ID:WmZeX0g1 ISOのダウンロードサイトがもう何年も
本文はちゃんとcharset=ISO-8859-1だと書いてるのに
HTTPヘッダでcharset=UTF-8宣言してて台無しになってる。
ASCIIはいいけどフランス語のとこがずっと文字化けしてるんだけど誰も気付かないのかね。
……と書き込もうと思って確認したらいつの間にか直ってたわ、ちっ
本文はちゃんとcharset=ISO-8859-1だと書いてるのに
HTTPヘッダでcharset=UTF-8宣言してて台無しになってる。
ASCIIはいいけどフランス語のとこがずっと文字化けしてるんだけど誰も気付かないのかね。
……と書き込もうと思って確認したらいつの間にか直ってたわ、ちっ
848デフォルトの名無しさん
2018/10/15(月) 00:47:51.51ID:FbFcpKzK 実際に使用されていた、おもしろい文字コードとかない?
例えばBaudot Codeは英数字がバラバラの順番で出現する、非直感的な配置になってる。
例えばBaudot Codeは英数字がバラバラの順番で出現する、非直感的な配置になってる。
849デフォルトの名無しさん
2018/10/15(月) 04:39:56.62ID:/DZZgAIK EBSDICのことか
850デフォルトの名無しさん
2018/10/15(月) 04:40:51.83ID:/DZZgAIK EBCDICだったすまそ
851デフォルトの名無しさん
2018/10/16(火) 14:17:09.82ID:lPgoIDQ1 Apple、「ベーグル」の絵文字にクリームチーズを追加──要望を受け
http://www.itmedia.co.jp/news/articles/1810/16/news086.html
http://www.itmedia.co.jp/news/articles/1810/16/news086.html
852デフォルトの名無しさん
2018/10/16(火) 21:00:39.00ID:+1MBTbsX IEC646を使う事ももやめてUS-ASCIIに統一した方がいいよな。
それで問題が起きる時はフォントの方を変えて対処すればいい
それで問題が起きる時はフォントの方を変えて対処すればいい
853デフォルトの名無しさん
2018/10/16(火) 22:29:11.24ID:xkS5MTi4 絵文字はどんどん規格にない不文律が増えていくんだな
855デフォルトの名無しさん
2018/10/18(木) 09:37:48.19ID:9Pcdnt1S >>854
Google Japan Blog: 絵文字のユニコード符号化: 符号化提案用のオープンソースデータ
https://japan.googleblog.com/2008/11/blog-post_27.html
Google Japan Blog: 絵文字のユニコード符号化: 符号化提案用のオープンソースデータ
https://japan.googleblog.com/2008/11/blog-post_27.html
856デフォルトの名無しさん
2018/10/21(日) 02:11:42.72ID:fBvnF/D1 つまり結局のところどうしたらええんじゃ?
857デフォルトの名無しさん
2018/10/21(日) 11:20:10.64ID:sjXodBVw 見
858デフォルトの名無しさん
2018/10/21(日) 21:31:47.23ID:8BH3p2hm https://en.wikipedia.org/wiki/Template:Smiley
ここの絵文字のソースコードを見ると<abbr>要素を使ってマークアップしてるんだけど
こういうのって一般的なのかな。
ここの絵文字のソースコードを見ると<abbr>要素を使ってマークアップしてるんだけど
こういうのって一般的なのかな。
859デフォルトの名無しさん
2018/10/21(日) 23:19:14.44ID:j+lXdzx1 Wikipediaはある種独特じゃね
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【次の一手】台湾問題で小林よしのり氏が私見「まさに戦争前夜」「ただちに徴兵制を敷いて、高市支持者を最前線へ」… ★5 [BFU★]
- 「母の部屋に安倍氏が表紙の機関誌が」「(安倍氏が被害者なのは)不思議に思いませんでした」山上被告の妹が証言 [おっさん友の会★]
- 【野球】大谷翔平、佐々木朗希、山本由伸らがWBC辞退なら広がる不協和音… 『過去イチ盛り上がらない大会』になる可能性も★2 [冬月記者★]
- 【news23】小川彩佳アナ「ここまでの広がりになるということを、高市総理はどれだけ想像できていたんでしょうね」 日中問題特集で [冬月記者★]
- 【国際】ロシアはすでに戦争準備段階――ポーランド軍トップが警告 [ぐれ★]
- 「町中華」の“息切れ倒産”が増加 ブームにも支えられ職人技で踏ん張ってきたが… 大手チェーンは値上げでも絶好調 [ぐれ★]
- 「韓国人の高市早苗評」、限界突破。 [592058334]
- 【高市売り】円安、止まらず!凄い勢いで暴落中。157円へ [219241683]
- 【悲報】サッカー北朝鮮代表、日本代表に思いっきりグーパン。想像以上に殴ってるやつが居る [483862913]
- 1,000万円のBMWに擦ってしまった札幌のガキ、捕らえられてガチで詰む [329329848]
- 青森のラーメン店、ライス・メンマ無料サービスを始める→ありえない残し方をした人が100人になったら即終了→すでに2人残してあと98人 [808139444]
- 【悲報】ヤフコメ民「中国が水産物を輸入禁止にするなら、日本国民向けに安く販売すればいい。中国依存から脱するべき」 [153736977]
