文字コードの種類は何故複数あるのでしょうか？

**デフォルトの名無しさん** · NG

1つにしてくれればPGが苦労することはなくて
、ミンナうれしいはずなのに。

**デフォルトの名無しさん** · NG

そんなことでスレを立てないで下さい。

**デフォルトの名無しさん** · NG

>>1
アニメの世界であれば、そういう迷惑なことをするのは悪の組織ですよね？
現実の社会ではどうでしょう？
クリーンなイメージのあの組織も、もしかすると悪の組織なのかもしれませんね。

私は、大義名分を振りかざすこと、常に勝つことが重要であると考えています。

**デフォルトの名無しさん** · NG

>>1
それが資本主義。

**デフォルトの名無しさん** · NG

じゃあ共産圏は一つに統一されているのか。

**マイク** ◆yrBrqfF1Ew · NG

宗教戦争の為だ。

**デフォルトの名無しさん** · NG

統一されてないから。

**デフォルトの名無しさん** · NG

なら、>>1 が新しい統一した文字コードを作れ。

**デフォルトの名無しさん** · NG

>>8
また増えるからもういいよ

**デフォルトの名無しさん** · NG

２バイト文字を使わなけりゃいいべや。

**デフォルトの名無しさん** · NG

？
おまえら、まだ文字コード使ってるの？
俺はだいぶ前から文字しか使ってないよ。

**デフォルトの名無しさん** · NG

あめれか人が悪いに決まってるだ

**デフォルトの名無しさん** · NG

もう全部ビットマップでいいよ。

**デフォルトの名無しさん** · NG

>>12
欧米人は頭足りないからな

**デフォルトの名無しさん** · NG

UNICODE がもう少しまともだったらなぁ。

◆Z0vd5w812U · NG

>>15
所詮は「なんでアルファベット以外が存在してんだよ」と思ってる連中が作った規格。

**デフォルトの名無しさん** · NG

1.0と比べると3.2はずいぶんマシになってるし
あと20年もすれば納得いくものになるんじゃないの

**デフォルトの名無しさん** · NG

Unicode1は所詮ローカライズ用

**デフォルトの名無しさん** · NG

アルファベットの文字コードも複数あるわけですが…

**デフォルトの名無しさん** · NG

ここを見れ！

http://www.pahoo.org/e-soul/webtech/encode/encode01-01.shtm

**デフォルトの名無しさん** · NG

http://www005.upp.so-net.ne.jp/p-move_h/constitution.htm
本来神聖なる日本国憲法を記載するに当たり一字一句変える
ことなく記載しなければならないところですが、コンピューター
通信上の禁則文字（ＪＩＳコードに含まれていない文字）があり、
読み方は一緒なのですが例えば「わゐうゑを」２番目の「ゐ」を「い」
に４番目の「ゑ」を「得」に変更させていただきました。
あしからずご了承下さい。

「ゐ」「ゑ」はＪＩＳコードに無い文字なのか？

**デフォルトの名無しさん** · NG

改行コードの種類は何故複数あるのでしょうか？

**デフォルトの名無しさん** · NG

大人の事情

**デフォルトの名無しさん** · NG

>>21
「禁則文字」の用語にも誤解があるようでつね

**デフォルトの名無しさん** · NG

>>22
昔々、テレタイプという通信機には
プラテンを１行分進めるラインフィードという制御コードと
印字ヘッドを左に戻すキャリッジリターンという制御コードが別々にあった
そんでこいつは初期のコンピュータにつないで端末として使ったりもした。

それが今の改行コードの元になったわけだが

ＭＳ－ＤＯＳ,->Windows系列では律儀に上記二つペアを改行コード
としてそのまま引き継いだ

ＵＮＩＸ系だとニューライン（ラインフィード）ＬＦだけになり

Ｍａｃ系はキャリッジリターンだけを改行コードとして採用した。

ネットワークプロトコルではＣＲＬＦが今でも
改行コードの標準だが、
これは

テレタイプ->ダム端末->telnet,rloginの流れで改行コードも
引き継がれたからだ。

**デフォルトの名無しさん** · NG

>>25
答えｷﾀ━━━━━━(ﾟ∀ﾟ)━━━━━━ !!!!
ありがとう
UNIXがLFなのになんでネットワークがCRLFになっちまったのかと思ってたんだよ

**デフォルトの名無しさん** · NG

ttp://satosan.jp/ClangStudy.html
> 遠隔地同士の通信手段としてテレタイプ(通信機能をもった
> タイプライター) が使われていた頃は、ヘッドが行の端まで
> 行ったとき次の行の先頭に戻るまで、2文字分通信するのと
> 同じ時間がかかった。
> そこで改行の文字コードをCR(復帰：キャリッジリターン '\r')と
> LF(改行：ラインフィード '\n')の2つに割り当てた。

**デフォルトの名無しさん** · NG

エンディアンの種類は何（ry

**デフォルトの名無しさん** · NG

age

**デフォルトの名無しさん** · 05/02/10 22:10:51

TRONコード

**デフォルトの名無しさん** · 05/02/10 22:25:42

>>27
理由になってないし

**デフォルトの名無しさん** · 05/02/17 00:28:22

「qwerty配列はタイピングが早すぎてキーが絡まないようにわざと打ちにくくした」
って都市伝説もあったな

**デフォルトの名無しさん** · 05/02/17 01:19:18

キーが絡むなら都市伝説だな。
絡むのはハンマーだから。

**デフォルトの名無しさん** · 05/02/18 01:04:22

>>32
適度に打ちにくくしたのは確かだよ。

最悪に打ちにくくしたわけではない。
最高に打ちやすくしたわけでもない。
最適に打ちにくくしたんだよ。

機械とセールスの拮抗点で。

**デフォルトの名無しさん** · 05/02/18 19:00:00

文字コードと関係ないぞ

**デフォルトの名無しさん** · 05/02/19 00:20:50

そもそも、自然言語が複数あるんだから、
文字コードが複数出来るのも自然な流れだと思われ

**デフォルトの名無しさん** · 05/02/23 17:40:30

>>1
すべて Unicode Consortium が悪い。
そうに決まってる。

**デフォルトの名無しさん** · 05/02/23 19:12:17

>>28
普通の答えは、big-endian と little-endianの２種類だが、

3-4-1-2 や 2-1-4-3 など順序になる不可解なシステムが、過去のミニコン時代にありますた。
それらは、middle-endian と呼ばれている。

よって、３２ビットでのエンディアンの種類は４種類という事になる。

**デフォルトの名無しさん** · 05/02/23 19:26:44

24種類じゃないの。

**デフォルトの名無しさん** · 05/02/23 19:49:20

実在が確認されているのが4種類、可能性としては24種類、ということで。

**デフォルトの名無しさん** · 05/02/23 21:09:47

XMLの仕様書に書かれてる3-4-1-2や2-1-4-3って実在したのか
>>37
ﾜﾛｽ

**デフォルトの名無しさん** · 05/02/23 22:23:06

>>1
容量制限のため用途に応じた使い分けをせざるを得なかった歴史があるからだよ。
たしかに文字コードの乱立はうざい。
こんなに大容量化が進んでマシンのスペックも向上しているにもかかわらず
文字コードが未だに乱立している原因として考えられることは
面倒くさがり屋、変化を恐れる愚かな老人達が我々の行動を阻もうとしていることがあげられる。
日本国内でオブジェクト指向が普及しない原因も、自分の立場を維持したい愚かな老人が
妨害しているのが原因かもしれない。

かつて、ある企業が独自規格を作って大儲けを
たくらんだために文字コードが乱立した可能性もありうる。

今ではUnicodeがあるというのにほとんどの新しい言語、OSは
Unicodeが標準だというのに
頭の古い連中は大したコストパフォーマンスにならないにもかかわらず
容量制限が・・・
既存のリソースが・・・・
などといってUnicodeを採用しようとしない。
既存のリソースならUnicodeに変換すればいいことだろう。
まったく愚かだ。Unicodeに鞍替えできない老舗顧客も老舗プログラマも。

**デフォルトの名無しさん** · 05/02/23 22:32:12

お前が愚かだ。

**デフォルトの名無しさん** · 05/02/23 22:46:26

キーボードは乱立しなくてよかったｗ

**デフォルトの名無しさん** · 05/02/24 10:05:30

乱立してるだろ

**デフォルトの名無しさん** · 05/02/24 15:47:01

「俺たちはどうして何でもUnicodeのせいにするのだろう？」
　文字鏡関係者とTRON関係者とGTプロジェクト関係者が何人か集まって考えた。
しかしいくら考えても結論が出ない。その時、一人がひらめいた。
「それもUnicodeのせいだ！」
　関係者は全員それで納得した。

**デフォルトの名無しさん** · 05/02/24 18:11:09

Windowsもとっととunicodeに移行して欲しいよ

**デフォルトの名無しさん** · 05/02/24 19:13:03

してるじゃん
出来てないのはiniファイルくらいだろ？

**デフォルトの名無しさん** · 05/02/25 06:57:00

どうか教えてください。

[1] 授業単元：プログラム概論
[2] 問題文(含コード&リンク)：
　　　シフトJISからEUCへの文字コード変換プログラムを作りたい（余裕があればその逆も）
　　　http://tokyo.cool.ne.jp/kuonnnokizunanbalivetehe/programming/prog1.txt
[3] 環境
　[3.1] OS： WindowsXP,NT Solaris2.0
　[3.2] コンパイラ(バージョン)：富士通fcc,Cygwin(gcc)
　[3.3] 言語：Ｃ
[4] 期限：2005年2月28日12:00まで
[5] その他の制限：この問題文の意図だと引数をunsigned int型にするべきかどうか分からない

**デフォルトの名無しさん** · 05/02/25 09:58:13

>>49

#include <stdlib.h>
main()
{
return system("nkf -e from > to");
}

つーかスレ違い

**デフォルトの名無しさん** · 05/02/25 11:22:52

>>41
3-4-1-2ってのは、最小アクセス単位が16 bitでbig-endianなCPU
(3-4)-(1-2) 別名middle endian
wordにpackするとこの形になった。(Cの先祖のBCPL、初期のpascal等)

>>27
それは嘘。(そもそも復帰は物凄く時間がかかる)
タイプライター時代から、(行先頭に)復帰して文字を進めて重ね打ち、例えば _ を、
ってのがあって、それをプリンタにも持ち込んだのが最初。

**デフォルトの名無しさん** · 05/02/25 11:26:29

>>50

ﾜﾗ
幾らなんでもそれはないから

> return system("iconv -f shift_jis -t euc-jp < from > to");

でどうだ?

**デフォルトの名無しさん** · 05/02/25 15:51:32

簡単な質問かもしれませんが、分からないので教えてください。

以下のプログラム、核は出来ています。このまま使用しても目的は達成できます。が、
http://tokyo.cool.ne.jp/kuonnnokizunanbalivetehe/CSJS2EUC.C
http://tokyo.cool.ne.jp/kuonnnokizunanbalivetehe/CEUC2SJS.C
この２つのソースコードをJISを経過させずに直接変換させるにはどうしたらいいでしょうか？

**デフォルトの名無しさん** · 05/02/25 16:02:46

>>53
何故一つの質問をあっちこっちで聞きまくるんだ
頭おかしいんじゃないか？

**デフォルトの名無しさん** · 05/02/25 19:04:25

あちこちで聞けば、たくさんの人が並行して考えてくれるので、
答えが早くでると思いました。
どこか答えが出てるスレッドがありましたら教えてください。

**デフォルトの名無しさん** · 05/02/25 19:36:43

だから、テーブルを使えよ。

**デフォルトの名無しさん** · 05/02/25 19:46:47

>>48
コマンドプロンプトとか無理だろ

**デフォルトの名無しさん** · 05/02/25 19:55:45

無理じゃ無いよ
ちゃんとユニコードなファイル名も表示されるし

**デフォルトの名無しさん** · 05/02/25 22:43:07

> あちこちで聞けば、たくさんの人が並行して考えてくれるので、
> 答えが早くでると思いました。
> どこか答えが出てるスレッドがありましたら教えてください。

・・・こういう心理をどう表現すればいいのだ？

自己中心的か
ゲーム脳か

**53@愛宕山** · 05/02/25 23:13:03

ちなみに５５はボクではありません。今さらどうでもいいけど

**デフォルトの名無しさん** · 05/02/26 01:45:06

>>59
全員から同時に返事が来たらどうするつもりなんだろうね

**デフォルトの名無しさん** · 05/03/01 21:40:00

そこで超漢字

**デフォルトの名無しさん** · 2005/04/30(土) 21:51:28

うにこーど

**デフォルトの名無しさん** · 2005/05/01(日) 11:20:17

>>57
localeモデルにしとけば、Shift_JIS→UTF-8移行も楽だったね。

**デフォルトの名無しさん** · 2005/05/03(火) 05:47:35

UNICODEだってごちゃごちゃの固まりジャン
こんな気味悪い文字コードにしなくちゃいけないのはいやだ

**デフォルトの名無しさん** · 2005/05/03(火) 07:29:57

UTF-8は使用するメモリが1.5倍になるからいやだ

**?デフォルトの名無しさん** · 2005/05/03(火) 20:19:22

UTF-8で1.5倍とはしらなかった。

**デフォルトの名無しさん** · 2005/05/04(水) 00:05:00

漢字のコードポイントのとこなら1文字3バイトだけどね。

**デフォルトの名無しさん** · 2005/05/04(水) 00:05:32

あ、3オクテットというべきかにゃ?

**デフォルトの名無しさん** · 2005/05/05(木) 17:46:59

4オクテットの箇所もあるでよ。

**デフォルトの名無しさん** · 2005/11/19(土) 21:54:11

そこでシフトJISですよ。JIS第3水準、第4水準も難なく扱えるし、な。

**デフォルトの名無しさん** · 2005/11/19(土) 22:22:21

つうか、そろそろJIS廃止してくれんかの。
シフトコードｳｻﾞｲ。

**デフォルトの名無しさん** · 2005/11/19(土) 22:27:05

UCS-4ってのが最後のUnicode？
Javaだとint型なんだっけ？よーわからんけど、早く統一して欲しい。

**デフォルトの名無しさん** · 2005/11/19(土) 22:43:03

>>73
1文字8バイトなんて世界が来るのかね。

**デフォルトの名無しさん** · 2005/11/19(土) 22:44:51

UTF-8でいいんでしょ？～とか①とか大丈夫なんでしょ？

**デフォルトの名無しさん** · 2005/11/19(土) 22:53:34

>>75
いまのWord、ExcelはUCS-2だから、その世界に収まっている
仕事ならUTF-8でおけですよ。

でもｵﾔｸｿとかは…

**デフォルトの名無しさん** · 2005/11/20(日) 01:29:07

やっぱり生き残るのはシフトJIS系。
将来的には半角カナの領域を1バイト目にして可変長のコードにして
UnicodeやTRONコード、JEF、KEISを丸呑み。

絶対そうなる。

**デフォルトの名無しさん** · 2005/11/20(日) 01:31:35

>>76
じゃあUCS-4でいいから今すぐ統一して（　ノ＞＜）ノ

**デフォルトの名無しさん** · 2005/11/24(木) 02:30:44

常用漢字とＪＩＳが食い違ってるというのもそもそもどんな縦割り行政
しちょるのかと

**デフォルトの名無しさん** · 2005/11/24(木) 13:11:35

何か食い違ってたっけ？

**デフォルトの名無しさん** · 2005/11/25(金) 21:34:50

龍の旧字体?

**デフォルトの名無しさん** · 2005/11/25(金) 21:35:24

竜の旧字体? だった
龍じゃそのまんまじゃんorz

**デフォルトの名無しさん** · 2005/11/28(月) 16:44:09

「龍」の点の向きのこと？
そんなもん包摂の範囲内だしどっちだっていいやん。
表外漢字字体表にがちがちにあわせたJIS X 0213:2004のほうが異常。

**デフォルトの名無しさん** · 2005/11/29(火) 08:28:23

大体、印刷標準字体とかうざいんじゃ！

**デフォルトの名無しさん** · 2006/02/06(月) 15:57:56

だって常用漢字の数とＪＩＳ漢字の数とそもそもぜんぜん違うじゃん
たしか常用漢字にあってＪＩＳにない漢字とか結構なかったっけ？
それより写植の文字がＪＩＳに入ってないせいで電話記号とか
ポゲムタとかが簡単に出せなくてラムちゃん語も満足に表記できやしない。

**デフォルトの名無しさん** · 2006/02/06(月) 16:36:04

>たしか常用漢字にあってＪＩＳにない漢字とか結構なかったっけ？
>たしか常用漢字にあってＪＩＳにない漢字とか結構なかったっけ？
>たしか常用漢字にあってＪＩＳにない漢字とか結構なかったっけ？
>たしか常用漢字にあってＪＩＳにない漢字とか結構なかったっけ？
>たしか常用漢字にあってＪＩＳにない漢字とか結構なかったっけ？
>たしか常用漢字にあってＪＩＳにない漢字とか結構なかったっけ？
>たしか常用漢字にあってＪＩＳにない漢字とか結構なかったっけ？
>たしか常用漢字にあってＪＩＳにない漢字とか結構なかったっけ？

**デフォルトの名無しさん** · 2006/03/13(月) 10:43:01

いま試しに数えてみたら24個くらいあった

**デフォルトの名無しさん** · 2006/03/25(土) 09:27:36

>>87 夜に数えると増えてるよ。
うちの家の階段も昼間は12段だけど
夜数えると13段ある。

**デフォルトの名無しさん** · 2006/03/26(日) 12:55:29

たしかＪＩＳにあって常用漢字にない漢字とか結構なかったっけ？

**デフォルトの名無しさん** · 2006/03/27(月) 02:43:17

ない。

**デフォルトの名無しさん** · 2006/05/01(月) 11:42:30

お前ら大嘘つきだ。みんな嫌いだ。

**デフォルトの名無しさん** · 2006/05/04(木) 13:03:48

文字コードが増える前に、俺らが使う言葉の数を減らせばいいんじゃね？

**デフォルトの名無しさん** · 2006/05/05(金) 07:04:34

たしかに。英語だけあれば世の中困ること無いよな。

**デフォルトの名無しさん** · 2006/05/30(火) 02:39:01

そうだ。

**デフォルトの名無しさん** · 2006/06/16(金) 19:34:55

>>66
UTF-8って英数字に対して使うなら容量はそんなに増えなかったかと。

**デフォルトの名無しさん** · 2006/07/06(木) 04:23:37

戦争中、敵方の兵士により領土が侵略されると、必ず略奪やレイプがおこなわれる。ルワンダもその例外ではなかった。
　
大統領の暗殺から2週間ほどたったころ、ルワンダ北西部のルヘンゲリ県のある村で14歳のツチ族少女がフツ族民兵に誘拐された。
当時すでに虐殺の嵐はルワンダ全土を激しく吹き荒れ、各地で次々とツチ族が殺されていた。しかし幸いなことにその村ではまだ一人の死者も出さず、ツチ族とフツ族が微妙なバランスの上で共生していた。
　誘拐された少女は、「気立てが良くかわいい娘だ」と村で評判だったらしい。その日も夕食の準備をする母を手伝うため、水を汲みに村外れの井戸へ行き、そこで待ち伏せていた数人の男に拉致されてしまったのだ。

何人かの村人がその様子を目撃し、すぐさま家族に知らせた。家族は娘の身に起こりうる最悪の事態（レイプされた後、殺害される）を考え、血眼になって探したが、1週間たっても少女の行方はわからなかった。
さらに数日が過ぎ家族があきらめかけたころ、隣村から連絡が届いた。
「娘さんらしき少女を保護した。重体ではあるものの生きてはいる」
家族は押っ取り刀で隣村に駆けつけ、粗末なベッドの上で毛布に包まれ、横たわる少女の姿を見た。
　体を包んでいる毛布に血がにじみ、見る影もなくやせ細った体は小刻みに震え、その瞳は輝きなく虚空を見つめていた。家族が声をかけても何も反応を示さない。脅えているのか寒いのか、ただ小さく震えるだけだ。

**デフォルトの名無しさん** · 2006/07/06(木) 04:24:30

少女は非常に奇異な姿で発見されたという。隣町の農夫は発見したときの様子をこう語る。
「私がいつものとおり自分の畑を耕すためにあぜ道を歩いていると、ふと視界に見慣れないものが目に入ったのです。
最初は『木の切り株か、大きな石なのかなあ』と思ったのですが、近づいてみると違いました。目を疑いましたよ。裸の少女が腰から下を土に埋められていたのですから……。
私が発見したとき、彼女は焦点の定まらない目でぼんやりと遠くを見つめ、半開きになった口からよだれを垂れ流していました。
インタラーメ（フツ族民兵）か政府軍が近くにいるのではと思ったので、慌てて村にいったん帰りました。人を集め武器を持ち、恐る恐るその場に戻って、彼女を掘り返したのです。
目は開いていたのですが、すでに彼女の意識はありませんでした」

変わり果てた姿の少女を、家族はすぐさま村から少し離れたところにあったフランスの緊急医療援助団体“国境なき医師団”の診療所へと運び込んだ。
偶然、その少女の治療に日本人看護婦、山本珠江さんが立ち会っていた。

**デフォルトの名無しさん** · 2006/07/06(木) 04:26:13

「数人の男たちに、彼女は何日間にもわたり強姦され続けていたみたいなの。食事もろくに与えられていなかったようね。
しかも土に埋められる前、女性器に木の棒か銃身のような細くて固いものを押し込まれ、こねくり返されたようなのよ。
その傷口に雑菌が入ってしまったらしくて性器の一部が壊疽していたわ。
命だけは助かったけど、当然もう子供は産めないし、あまりに大きなショックを受けたから精神障害がひどくて廃人になってしまったわ」
山本さんは非常に悲しそうでいて、悔しそうな表情をしながらその時の状景を振り返った。
1週間ほどその少女は「国境なき医師団」の診療所に入院していたそうだ。肉体的な治療が終了すると、少女は家族に連れられ家に戻っていった。虐殺の被害に遇った瀕死の患者が次々に運び込まれてくるため、生命の危機がなくなった患者を収容する場所がなかったためだ。

「悲しいけど、これ戦争なのよね」
山本さんは、苦しげに首を横に振りながら語った。

**デフォルトの名無しさん** · 2006/07/08(土) 09:12:04

>>97-98
よくあること
はいりょしてくれないと

**デフォルトの名無しさん** · 2006/10/31(火) 17:47:09

>>1
６４ビットユニコードつかえばいいだろ