HTMLの文字コードなににしてる?
以前は何も考えずShift_JISにしてたが、Linuxを使い始めて気にするようになった。
お前ら何にしてるの? 以前は何も考えずShift_JISにしてたが、Linuxを使い始めて気にするようになった。
お前ら何にしてるの? ,,,,_
/,'3 `ァ
`ー-‐`
"
_,,..,∩,, タカイタカーイ
/ ,' 3∩`ヽーっ
l ⌒_つ
`'ー---‐'''''"
,,,,_ ポム
_,,../,'3 `ァ
/ ,' 3∩‐''ーっ
l ⌒_つ
`'ー---‐'''''"
文字コードと電気コードって違うの?
文字コードがからまりそうなときに、便利なタップとかある?
文字コードって、追う時期と同じコンセントで使える?
ここって、最高に馬鹿な発言してくださいスレだっけ? なんかUTF-8が多いな。
文字化けがしにくいんだっけ?
俺EUCだけど、UTF-8の利点教えてくれろ UTF-8で記述すると、多国語混在は当然として、EUCで使ったら怒られる可能性のある丸付き数字 @ 等を
使用しても問題ない。
UTF-8の場合、XML宣言 <?xml version="1.0"?> でエンコーディングを省略しても
良いように、事実上、XHTMLの標準の文字コード。対応しているアプリ等も多い。
(当然、EUCにしか対応していないものもあるけど)
http://www.google.co.jp/search?q=site%3Aja.wikipedia.org
で検索してもわかるように、UTF-8のURLが結構あるけど、ページがUTF-8で
記述されていれば、URLエンコードすることなくリンクが貼れる。
(例)
EUCの場合: <a href="http://ja.wikipedia.org/wiki/%E3%83%AC%E3%83%B3%E3%82%BA">レンズ</a>
UTF-8の場合: <a href="ja.wikipedia.org/wiki/レンズ">レンズ</a>
Ajaxを利用したページを作り始めて以来、UTF-8。
それ以前はEUC-JPでした。 wzエディタ使ってた時は、メタタグが
iso-2022-jp
だった。Shift_JISで書いてたけど。 IE6の過去互換モードを避ける為には、XML宣言を省略する必要がある。
そしてその為には、文字コードをUTF-8かUTF-16にする必要がある。
・・・と、ここまではいいんだけど、最近どこかのblogだかで、何かのVer,?だかが特定の時は
Shift_JISにしても良い、みたいな投稿を見かけたんだ。
アドレスを控えておくのをうっかり忘れてしまったんだけど、誰かしりませんか? とにかくこれからはxhtml1.1で製作して、文字コードはutf-8にしとけば良いってこと? XHTML1.1はMIME Typeをapplication/xml+xhtmlにすべきだけど
IE7でもまだ未対応なんだよね。
HTML4.01かXHTML1.0で制作して
そこにRSSみたいに別のXMLを定義する時代がしばらく続くように思う。
UTF-8の場合のiniとかconfとかのサーバー設定教えて >>35
>IE7でもまだ未対応なんだよね。
マジですか? UTF-8多いな。という自分もUTF-8。一部ブラウザで文字化けするが。 Windows付属のメモ帳でも、文字コードをUTF-8にできるということに今日気が付いた。
これならXHTML1.0を標準モードでレンダリングさせられるからちょっと嬉しい。 shift_jisだけど、ページにGoogleマップを組み込むと文字化けしたから、
Googleマップだけutf-8のページに組み込んでiframeで挿入してる。
丸々utf-8に変えたいけどページ数が膨大でなかなか・・・。 自分まUTFになってました
で、サイト制作にHTMLやXHTMLを使用してもパソコンでは反映するが携帯からみると文字化けになり、
再度パソコンから接続すると化けたまんまになっている。
理由が全くわかりません。同じような方いますか? >>48
基本的に携帯用ページはShift_JISでエンコードすべき。
携帯で見た後パソコンでも化ける理由は不明。 >>49
レスを戴いてありがとうございます。
説明不足ですいません。
正確にはJisをエンコード(head間注入)してはいます
しかし、絵文字コードやXHTMLや顔文字を埋め込むと文字化けして表記されるのです。
参考にしたウラルが悪いのかと思い、おタグや月下美人等を参考にしても駄目でGoogleで検索してもエンコードにする(一部は化けたりもする)位の情報しか得られませんでした。
て、IEのエンコードはUTFです。
必要であるばサイトのタグを晒しますので宜しければ対策があればご掲示お願いしたいのですが… DW3で文字コードをShift_JIS→UTF-8に一括置換させると文字化けするのは俺だけ?
「開いてるドキュメントを置換」なら化けない・・・
ケイタイ懸賞サイトを作りたいが、どういった記述をにすんだ。 >>50
ウラルはこの際どうでもいい。
文字コード関係は、ソースだけではちとわかり辛いんで、
どっかにファイルごとUPした方が良さげ。
>>52
置換の場合、保存方法が普通のメモ帳と同じなんじゃね? >>57
http://ja.wikipedia.org/wiki/UTF-8
> 1バイト目の上位ビットの1の個数でその文字のバイト数が判るようになっている。
> また、 2バイト目以降は10で始まり、 1バイト目と2バイト目以降では値の範囲が重ならないので、
> 文字境界を確実に判定できる。 そのため以下のようなメリットがある。
>
> ・ バイトストリーム中の任意の位置から、 その文字、 前の文字、 あるいは次の文字の先頭バイトを容易に判定することができる。
> ・ 文字列の検索を単なるバイト列の検索として行っても、 文字境界と異なる個所でマッチしてしまうことがない。
スクリプトを書くときには、 これらのことが非常に大きなメリットになるのです。 ShiftJISの方がUTF-8よりもファイルが軽くなるらしいからShiftJISだな HTML、スクリプト(PHP)、DB(MySQL)の全てをEUCで構築してるサイトが
あるんだけど、これを今からUTF-8に変換していくのって絶望的に面倒くさいかな?
●危惧してる点
・スクリプト内での各種変換(入力時や出力時に必要に応じてmb_系の変換を多用してる)
・DB内にあるEUCデータをどうやってUTF-8に一括変換するか。 >>63
俺も同じ。
EUCで構築したけど、UTFのほうがいいみたいだね……。
俺はヘッダをテンプレ化してるから、文字コードの宣言は全ページで簡単に変えられるんだけど……。
Grepに文字コード変換って付いてなかったっけ。 UTFなんて日本をバカにした規格を使うな売国奴共。 >>63
.htaccessでhttp_outputとhttp_inputをUTF-8,internal_encodingをEUC-JPにすればおk。
DBの文字コードなんかも変えなくて良いよ。 わざわざトラブル生むようなことする必要はなかろうて
放置でもいいだろう UTF-8で文字化けするのなら何度も見てるけど
シフトジスで文字化けするの? むしろ、SJISで文字化けするのは何度も見てきたが、
UTF-8で文字化けは今まで無いPerl使い metaタグじゃなくて、httpヘッダで正しい文字コードを指定すれば
文字化けなどしない。
metaだけ指定して満足してるのを見かけるが、
静的ページなら.htaccessで1行だし、動的ページでも
phpでもaspでもその他でも1行で指定できるんだからしろよな。 perlならEUCかシフトジスだろ。
SJISってシフトジスか?文字化けしてるサイトあったら教えてくれ。
UTF-8なら腐るほどあるけど Shift_JISで文字化けしてるサイトなんて見たことないぞ 日本のサイトでShift_JISで文字化けしてるのなんて見たことが無い。
てかperlつーかCGI使っててもjcode系のライブラリ抜いてまともに
済ませれるのって結局Shift_JISしかないよね。
>UTF-8で文字化けは今まで無いPerl使い
あーコレ何もわかってない設置できればperl使えると思ってる典型的な奴だな。
その辺のHTML的に駄目なコードの配布スクリプト拾ってきて
西ヨーロッパ言語とかになってるのに気が付いてない奴っぽいw コードはGB18030だがコンテンツは全て数値実体参照。 Internet Archive はUTF-8じゃないと文字化けするよね
http://www.archive.org/
しないよ。UTF-8なんてサイトマップ以外いらなくね? UTF-8だろうがなんだろうがDOCTYPE宣言すらしてない糞ソースだと
大概charsetも指定してないから西ヨーロッパ言語とかになるのが
Internet Archive
文字コードは関係無いよ。 Internet Archive のHTTPレスポンスヘッダがUTF-8なんでないの? サイトを始めて作り始めた人は何も分からずシフトジスだろな
少し慣れてきてphpやjavaスクリプトをいじりだすと自然とutf-8になる。
いろんな人のウェブサイトをみててだいたいそれが当てはまる。
俺の現行サイトはゴタマゼだな。
静的ページにCMSやブログをまぜこぜにした構成もムチャクチャだが。
静的ページ: DreamweaverCS3で制作、Shift-JIS
お絵描き掲示板: Shift-JIS (Perlベース、データはファイル保存、DB無し)
文字掲示板: EUC (PHPベース、データはMySQLに保存)
WordPress(メインブログ), Drupal(アグリゲータとサブブログ), Gallery2: UTF-8 公開用の鯖がlinuxでカーネル2.4系だから自然とEUC使ってる。
カーネル2.6系がもう少し年数たって信用できるようになったらUTFに切替える。
末端の開発用言語なんかどうにでもなるから気にしない。 カーネルと文字コードに関係なんかあるかボケ。
むしろ末端の開発用言語処理系がどうマルチバイト対応してるかが大切。 >>89
それでいいんじゃない?強制ではないんだから。
よく分からない人は適当にすれば。