文字コードの種類は何故複数あるのでしょうか?
1つにしてくれればPGが苦労することはなくて
、ミンナうれしいはずなのに。 >>1
アニメの世界であれば、そういう迷惑なことをするのは悪の組織ですよね?
現実の社会ではどうでしょう?
クリーンなイメージのあの組織も、もしかすると悪の組織なのかもしれませんね。
私は、大義名分を振りかざすこと、常に勝つことが重要であると考えています。 ?
おまえら、まだ文字コード使ってるの?
俺はだいぶ前から文字しか使ってないよ。 >>15
所詮は「なんでアルファベット以外が存在してんだよ」と思ってる連中が作った規格。 1.0と比べると3.2はずいぶんマシになってるし
あと20年もすれば納得いくものになるんじゃないの http://www005.upp.so-net.ne.jp/p-move_h/constitution.htm
本来神聖なる日本国憲法を記載するに当たり一字一句変える
ことなく記載しなければならないところですが、コンピューター
通信上の禁則文字(JISコードに含まれていない文字)があり、
読み方は一緒なのですが例えば「わゐうゑを」2番目の「ゐ」を「い」
に4番目の「ゑ」を「得」に変更させていただきました。
あしからずご了承下さい。
「ゐ」「ゑ」はJISコードに無い文字なのか? >>21
「禁則文字」の用語にも誤解があるようでつね
>>22
昔々、テレタイプという通信機には
プラテンを1行分進めるラインフィードという制御コードと
印字ヘッドを左に戻すキャリッジリターンという制御コードが別々にあった
そんでこいつは初期のコンピュータにつないで端末として使ったりもした。
それが今の改行コードの元になったわけだが
MS−DOS,->Windows系列では律儀に上記二つペアを改行コード
としてそのまま引き継いだ
UNIX系だとニューライン(ラインフィード)LFだけになり
Mac系はキャリッジリターンだけを改行コードとして採用した。
ネットワークプロトコルではCRLFが今でも
改行コードの標準だが、
これは
テレタイプ->ダム端末->telnet,rloginの流れで改行コードも
引き継がれたからだ。 >>25
答えキタ━━━━━━(゚∀゚)━━━━━━ !!!!
ありがとう
UNIXがLFなのになんでネットワークがCRLFになっちまったのかと思ってたんだよ ttp://satosan.jp/ClangStudy.html
> 遠隔地同士の通信手段としてテレタイプ(通信機能をもった
> タイプライター) が使われていた頃は、ヘッドが行の端まで
> 行ったとき次の行の先頭に戻るま で、2文字分通信するのと
> 同じ時間がかかった。
> そこで改行の文字コードをCR(復帰:キャリッジリターン '\r')と
> LF(改行: ラインフィード '\n')の2つに割り当てた。
「qwerty配列はタイピングが早すぎてキーが絡まないようにわざと打ちにくくした」
って都市伝説もあったな キーが絡むなら都市伝説だな。
絡むのはハンマーだから。
>>32
適度に打ちにくくしたのは確かだよ。
最悪に打ちにくくしたわけではない。
最高に打ちやすくしたわけでもない。
最適に打ちにくくしたんだよ。
機械とセールスの拮抗点で。 そもそも、自然言語が複数あるんだから、
文字コードが複数出来るのも自然な流れだと思われ >>1
すべて Unicode Consortium が悪い。
そうに決まってる。 >>28
普通の答えは、big-endian と little-endianの2種類だが、
3-4-1-2 や 2-1-4-3 など順序になる不可解なシステムが、過去のミニコン時代にありますた。
それらは、middle-endian と呼ばれている。
よって、32ビットでのエンディアンの種類は4種類という事になる。
実在が確認されているのが4種類、可能性としては24種類、ということで。 XMLの仕様書に書かれてる3-4-1-2や2-1-4-3って実在したのか
>>37
ワロス >>1
容量制限のため用途に応じた使い分けをせざるを得なかった歴史があるからだよ。
たしかに文字コードの乱立はうざい。
こんなに大容量化が進んでマシンのスペックも向上しているにもかかわらず
文字コードが未だに乱立している原因として考えられることは
面倒くさがり屋、変化を恐れる愚かな老人達が我々の行動を阻もうとしていることがあげられる。
日本国内でオブジェクト指向が普及しない原因も、自分の立場を維持したい愚かな老人が
妨害しているのが原因かもしれない。
かつて、ある企業が独自規格を作って大儲けを
たくらんだために文字コードが乱立した可能性もありうる。
今ではUnicodeがあるというのにほとんどの新しい言語、OSは
Unicodeが標準だというのに
頭の古い連中は大したコストパフォーマンスにならないにもかかわらず
容量制限が・・・
既存のリソースが・・・・
などといってUnicodeを採用しようとしない。
既存のリソースならUnicodeに変換すればいいことだろう。
まったく愚かだ。Unicodeに鞍替えできない老舗顧客も老舗プログラマも。
「俺たちはどうして何でもUnicodeのせいにするのだろう?」
文字鏡関係者とTRON関係者とGTプロジェクト関係者が何人か集まって考えた。
しかしいくら考えても結論が出ない。その時、一人がひらめいた。
「それもUnicodeのせいだ!」
関係者は全員それで納得した。 Windowsもとっととunicodeに移行して欲しいよ してるじゃん
出来てないのはiniファイルくらいだろ? どうか教えてください。
[1] 授業単元:プログラム概論
[2] 問題文(含コード&リンク):
シフトJISからEUCへの文字コード変換プログラムを作りたい(余裕があればその逆も)
http://tokyo.cool.ne.jp/kuonnnokizunanbalivetehe/programming/prog1.txt
[3] 環境
[3.1] OS: WindowsXP,NT Solaris2.0
[3.2] コンパイラ(バージョン):富士通fcc,Cygwin(gcc)
[3.3] 言語:C
[4] 期限:2005年2月28日12:00まで
[5] その他の制限: この問題文の意図だと引数をunsigned int型にするべきかどうか分からない >>49
#include <stdlib.h>
main()
{
return system("nkf -e from > to");
}
つーかスレ違い >>41
3-4-1-2ってのは、最小アクセス単位が16 bitでbig-endianなCPU
(3-4)-(1-2) 別名middle endian
wordにpackするとこの形になった。(Cの先祖のBCPL、初期のpascal等)
>>27
それは嘘。(そもそも復帰は物凄く時間がかかる)
タイプライター時代から、(行先頭に)復帰して文字を進めて重ね打ち、例えば _ を、
ってのがあって、それをプリンタにも持ち込んだのが最初。
>>50
ワラ
幾らなんでもそれはないから
> return system("iconv -f shift_jis -t euc-jp < from > to");
でどうだ? >>53
何故一つの質問をあっちこっちで聞きまくるんだ
頭おかしいんじゃないか? あちこちで聞けば、たくさんの人が並行して考えてくれるので、
答えが早くでると思いました。
どこか答えが出てるスレッドがありましたら教えてください。 無理じゃ無いよ
ちゃんとユニコードなファイル名も表示されるし > あちこちで聞けば、たくさんの人が並行して考えてくれるので、
> 答えが早くでると思いました。
> どこか答えが出てるスレッドがありましたら教えてください。
・・・こういう心理をどう表現すればいいのだ?
自己中心的か
ゲーム脳か ちなみに55はボクではありません。今さらどうでもいいけど >>59
全員から同時に返事が来たらどうするつもりなんだろうね >>57
localeモデルにしとけば、Shift_JIS→UTF-8移行も楽だったね。 UNICODEだってごちゃごちゃの固まりジャン
こんな気味悪い文字コードにしなくちゃいけないのはいやだ UTF-8は使用するメモリが1.5倍になるからいやだ 漢字のコードポイントのとこなら1文字3バイトだけどね。
そこでシフトJISですよ。JIS第3水準、第4水準も難なく扱えるし、な。
つうか、そろそろJIS廃止してくれんかの。
シフトコードウザイ。 UCS-4ってのが最後のUnicode?
Javaだとint型なんだっけ?よーわからんけど、早く統一して欲しい。 UTF-8でいいんでしょ?〜とか@とか大丈夫なんでしょ? >>75
いまのWord、ExcelはUCS-2だから、その世界に収まっている
仕事ならUTF-8でおけですよ。
でもオヤクソとかは… やっぱり生き残るのはシフトJIS系。
将来的には半角カナの領域を1バイト目にして可変長のコードにして
UnicodeやTRONコード、JEF、KEISを丸呑み。
絶対そうなる。
>>76
じゃあUCS-4でいいから今すぐ統一して( ノ><)ノ 常用漢字とJISが食い違ってるというのもそもそもどんな縦割り行政
しちょるのかと 竜の旧字体? だった
龍じゃそのまんまじゃんorz 「龍」の点の向きのこと?
そんなもん包摂の範囲内だしどっちだっていいやん。
表外漢字字体表にがちがちにあわせたJIS X 0213:2004のほうが異常。 だって常用漢字の数とJIS漢字の数とそもそもぜんぜん違うじゃん
たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
それより写植の文字がJISに入ってないせいで電話記号とか
ポゲムタとかが簡単に出せなくてラムちゃん語も満足に表記できやしない。
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>>87 夜に数えると増えてるよ。
うちの家の階段も昼間は12段だけど
夜数えると13段ある。 たしかJISにあって常用漢字にない漢字とか結構なかったっけ? 文字コードが増える前に、俺らが使う言葉の数を減らせばいいんじゃね? >>66
UTF-8って英数字に対して使うなら容量はそんなに増えなかったかと。 戦争中、敵方の兵士により領土が侵略されると、必ず略奪やレイプがおこなわれる。ルワンダもその例外ではなかった。
大統領の暗殺から2週間ほどたったころ、ルワンダ北西部のルヘンゲリ県のある村で14歳のツチ族少女がフツ族民兵に誘拐された。
当時すでに虐殺の嵐はルワンダ全土を激しく吹き荒れ、各地で次々とツチ族が殺されていた。しかし幸いなことにその村ではまだ一人の死者も出さず、ツチ族とフツ族が微妙なバランスの上で共生していた。
誘拐された少女は、「気立てが良くかわいい娘だ」と村で評判だったらしい。その日も夕食の準備をする母を手伝うため、水を汲みに村外れの井戸へ行き、そこで待ち伏せていた数人の男に拉致されてしまったのだ。
何人かの村人がその様子を目撃し、すぐさま家族に知らせた。家族は娘の身に起こりうる最悪の事態(レイプされた後、殺害される)を考え、血眼になって探したが、1週間たっても少女の行方はわからなかった。
さらに数日が過ぎ家族があきらめかけたころ、隣村から連絡が届いた。
「娘さんらしき少女を保護した。重体ではあるものの生きてはいる」
家族は押っ取り刀で隣村に駆けつけ、粗末なベッドの上で毛布に包まれ、横たわる少女の姿を見た。
体を包んでいる毛布に血がにじみ、見る影もなくやせ細った体は小刻みに震え、その瞳は輝きなく虚空を見つめていた。家族が声をかけても何も反応を示さない。脅えているのか寒いのか、ただ小さく震えるだけだ。 少女は非常に奇異な姿で発見されたという。隣町の農夫は発見したときの様子をこう語る。
「私がいつものとおり自分の畑を耕すためにあぜ道を歩いていると、ふと視界に見慣れないものが目に入ったのです。
最初は『木の切り株か、大きな石なのかなあ』と思ったのですが、近づいてみると違いました。目を疑いましたよ。裸の少女が腰から下を土に埋められていたのですから……。
私が発見したとき、彼女は焦点の定まらない目でぼんやりと遠くを見つめ、半開きになった口からよだれを垂れ流していました。
インタラーメ(フツ族民兵)か政府軍が近くにいるのではと思ったので、慌てて村にいったん帰りました。人を集め武器を持ち、恐る恐るその場に戻って、彼女を掘り返したのです。
目は開いていたのですが、すでに彼女の意識はありませんでした」
変わり果てた姿の少女を、家族はすぐさま村から少し離れたところにあったフランスの緊急医療援助団体“国境なき医師団”の診療所へと運び込んだ。
偶然、その少女の治療に日本人看護婦、山本珠江さんが立ち会っていた。 「数人の男たちに、彼女は何日間にもわたり強姦され続けていたみたいなの。食事もろくに与えられていなかったようね。
しかも土に埋められる前、女性器に木の棒か銃身のような細くて固いものを押し込まれ、こねくり返されたようなのよ。
その傷口に雑菌が入ってしまったらしくて性器の一部が壊疽していたわ。
命だけは助かったけど、当然もう子供は産めないし、あまりに大きなショックを受けたから精神障害がひどくて廃人になってしまったわ」
山本さんは非常に悲しそうでいて、悔しそうな表情をしながらその時の状景を振り返った。
1週間ほどその少女は「国境なき医師団」の診療所に入院していたそうだ。肉体的な治療が終了すると、少女は家族に連れられ家に戻っていった。虐殺の被害に遇った瀕死の患者が次々に運び込まれてくるため、生命の危機がなくなった患者を収容する場所がなかったためだ。
「悲しいけど、これ戦争なのよね」
山本さんは、苦しげに首を横に振りながら語った。 >>97-98
よくあること
はいりょしてくれないと