1つにしてくれればPGが苦労することはなくて
、ミンナうれしいはずなのに。
探検
文字コードの種類は何故複数あるのでしょうか?
NGNG
NGNG
そんなことでスレを立てないで下さい。
3デフォルトの名無しさん
NGNG >>1
アニメの世界であれば、そういう迷惑なことをするのは悪の組織ですよね?
現実の社会ではどうでしょう?
クリーンなイメージのあの組織も、もしかすると悪の組織なのかもしれませんね。
私は、大義名分を振りかざすこと、常に勝つことが重要であると考えています。
アニメの世界であれば、そういう迷惑なことをするのは悪の組織ですよね?
現実の社会ではどうでしょう?
クリーンなイメージのあの組織も、もしかすると悪の組織なのかもしれませんね。
私は、大義名分を振りかざすこと、常に勝つことが重要であると考えています。
NGNG
>>1
それが資本主義。
それが資本主義。
NGNG
じゃあ共産圏は一つに統一されているのか。
6マイク ◆yrBrqfF1Ew
NGNG 宗教戦争の為だ。
NGNG
統一されてないから。
NGNG
なら、>>1 が新しい統一した文字コードを作れ。
NGNG
>>8
また増えるからもういいよ
また増えるからもういいよ
NGNG
2バイト文字を使わなけりゃいいべや。
11デフォルトの名無しさん
NGNG ?
おまえら、まだ文字コード使ってるの?
俺はだいぶ前から文字しか使ってないよ。
おまえら、まだ文字コード使ってるの?
俺はだいぶ前から文字しか使ってないよ。
NGNG
あめれか人が悪いに決まってるだ
NGNG
もう全部ビットマップでいいよ。
NGNG
>>12
欧米人は頭足りないからな
欧米人は頭足りないからな
NGNG
UNICODE がもう少しまともだったらなぁ。
>>15
所詮は「なんでアルファベット以外が存在してんだよ」と思ってる連中が作った規格。
所詮は「なんでアルファベット以外が存在してんだよ」と思ってる連中が作った規格。
NGNG
1.0と比べると3.2はずいぶんマシになってるし
あと20年もすれば納得いくものになるんじゃないの
あと20年もすれば納得いくものになるんじゃないの
NGNG
Unicode1は所詮ローカライズ用
NGNG
アルファベットの文字コードも複数あるわけですが…
21デフォルトの名無しさん
NGNG http://www005.upp.so-net.ne.jp/p-move_h/constitution.htm
本来神聖なる日本国憲法を記載するに当たり一字一句変える
ことなく記載しなければならないところですが、コンピューター
通信上の禁則文字(JISコードに含まれていない文字)があり、
読み方は一緒なのですが例えば「わゐうゑを」2番目の「ゐ」を「い」
に4番目の「ゑ」を「得」に変更させていただきました。
あしからずご了承下さい。
「ゐ」「ゑ」はJISコードに無い文字なのか?
本来神聖なる日本国憲法を記載するに当たり一字一句変える
ことなく記載しなければならないところですが、コンピューター
通信上の禁則文字(JISコードに含まれていない文字)があり、
読み方は一緒なのですが例えば「わゐうゑを」2番目の「ゐ」を「い」
に4番目の「ゑ」を「得」に変更させていただきました。
あしからずご了承下さい。
「ゐ」「ゑ」はJISコードに無い文字なのか?
NGNG
改行コードの種類は何故複数あるのでしょうか?
NGNG
大人の事情
NGNG
NGNG
>>22
昔々、テレタイプという通信機には
プラテンを1行分進めるラインフィードという制御コードと
印字ヘッドを左に戻すキャリッジリターンという制御コードが別々にあった
そんでこいつは初期のコンピュータにつないで端末として使ったりもした。
それが今の改行コードの元になったわけだが
MS−DOS,->Windows系列では律儀に上記二つペアを改行コード
としてそのまま引き継いだ
UNIX系だとニューライン(ラインフィード)LFだけになり
Mac系はキャリッジリターンだけを改行コードとして採用した。
ネットワークプロトコルではCRLFが今でも
改行コードの標準だが、
これは
テレタイプ->ダム端末->telnet,rloginの流れで改行コードも
引き継がれたからだ。
昔々、テレタイプという通信機には
プラテンを1行分進めるラインフィードという制御コードと
印字ヘッドを左に戻すキャリッジリターンという制御コードが別々にあった
そんでこいつは初期のコンピュータにつないで端末として使ったりもした。
それが今の改行コードの元になったわけだが
MS−DOS,->Windows系列では律儀に上記二つペアを改行コード
としてそのまま引き継いだ
UNIX系だとニューライン(ラインフィード)LFだけになり
Mac系はキャリッジリターンだけを改行コードとして採用した。
ネットワークプロトコルではCRLFが今でも
改行コードの標準だが、
これは
テレタイプ->ダム端末->telnet,rloginの流れで改行コードも
引き継がれたからだ。
NGNG
NGNG
ttp://satosan.jp/ClangStudy.html
> 遠隔地同士の通信手段としてテレタイプ(通信機能をもった
> タイプライター) が使われていた頃は、ヘッドが行の端まで
> 行ったとき次の行の先頭に戻るま で、2文字分通信するのと
> 同じ時間がかかった。
> そこで改行の文字コードをCR(復帰:キャリッジリターン '\r')と
> LF(改行: ラインフィード '\n')の2つに割り当てた。
> 遠隔地同士の通信手段としてテレタイプ(通信機能をもった
> タイプライター) が使われていた頃は、ヘッドが行の端まで
> 行ったとき次の行の先頭に戻るま で、2文字分通信するのと
> 同じ時間がかかった。
> そこで改行の文字コードをCR(復帰:キャリッジリターン '\r')と
> LF(改行: ラインフィード '\n')の2つに割り当てた。
NGNG
エンディアンの種類は何(ry
29デフォルトの名無しさん
NGNG age
30デフォルトの名無しさん
05/02/10 22:10:51 TRONコード
05/02/10 22:25:42
>>27
理由になってないし
理由になってないし
05/02/17 00:28:22
「qwerty配列はタイピングが早すぎてキーが絡まないようにわざと打ちにくくした」
って都市伝説もあったな
って都市伝説もあったな
05/02/17 01:19:18
キーが絡むなら都市伝説だな。
絡むのはハンマーだから。
絡むのはハンマーだから。
34デフォルトの名無しさん
05/02/18 01:04:2205/02/18 19:00:00
文字コードと関係ないぞ
05/02/19 00:20:50
そもそも、自然言語が複数あるんだから、
文字コードが複数出来るのも自然な流れだと思われ
文字コードが複数出来るのも自然な流れだと思われ
37デフォルトの名無しさん
05/02/23 17:40:3038デフォルトの名無しさん
05/02/23 19:12:17 >>28
普通の答えは、big-endian と little-endianの2種類だが、
3-4-1-2 や 2-1-4-3 など順序になる不可解なシステムが、過去のミニコン時代にありますた。
それらは、middle-endian と呼ばれている。
よって、32ビットでのエンディアンの種類は4種類という事になる。
普通の答えは、big-endian と little-endianの2種類だが、
3-4-1-2 や 2-1-4-3 など順序になる不可解なシステムが、過去のミニコン時代にありますた。
それらは、middle-endian と呼ばれている。
よって、32ビットでのエンディアンの種類は4種類という事になる。
05/02/23 19:26:44
24種類じゃないの。
05/02/23 19:49:20
実在が確認されているのが4種類、可能性としては24種類、ということで。
05/02/23 21:09:47
42デフォルトの名無しさん
05/02/23 22:23:06 >>1
容量制限のため用途に応じた使い分けをせざるを得なかった歴史があるからだよ。
たしかに文字コードの乱立はうざい。
こんなに大容量化が進んでマシンのスペックも向上しているにもかかわらず
文字コードが未だに乱立している原因として考えられることは
面倒くさがり屋、変化を恐れる愚かな老人達が我々の行動を阻もうとしていることがあげられる。
日本国内でオブジェクト指向が普及しない原因も、自分の立場を維持したい愚かな老人が
妨害しているのが原因かもしれない。
かつて、ある企業が独自規格を作って大儲けを
たくらんだために文字コードが乱立した可能性もありうる。
今ではUnicodeがあるというのにほとんどの新しい言語、OSは
Unicodeが標準だというのに
頭の古い連中は大したコストパフォーマンスにならないにもかかわらず
容量制限が・・・
既存のリソースが・・・・
などといってUnicodeを採用しようとしない。
既存のリソースならUnicodeに変換すればいいことだろう。
まったく愚かだ。Unicodeに鞍替えできない老舗顧客も老舗プログラマも。
容量制限のため用途に応じた使い分けをせざるを得なかった歴史があるからだよ。
たしかに文字コードの乱立はうざい。
こんなに大容量化が進んでマシンのスペックも向上しているにもかかわらず
文字コードが未だに乱立している原因として考えられることは
面倒くさがり屋、変化を恐れる愚かな老人達が我々の行動を阻もうとしていることがあげられる。
日本国内でオブジェクト指向が普及しない原因も、自分の立場を維持したい愚かな老人が
妨害しているのが原因かもしれない。
かつて、ある企業が独自規格を作って大儲けを
たくらんだために文字コードが乱立した可能性もありうる。
今ではUnicodeがあるというのにほとんどの新しい言語、OSは
Unicodeが標準だというのに
頭の古い連中は大したコストパフォーマンスにならないにもかかわらず
容量制限が・・・
既存のリソースが・・・・
などといってUnicodeを採用しようとしない。
既存のリソースならUnicodeに変換すればいいことだろう。
まったく愚かだ。Unicodeに鞍替えできない老舗顧客も老舗プログラマも。
05/02/23 22:32:12
お前が愚かだ。
05/02/23 22:46:26
キーボードは乱立しなくてよかったw
45デフォルトの名無しさん
05/02/24 10:05:30 乱立してるだろ
05/02/24 15:47:01
「俺たちはどうして何でもUnicodeのせいにするのだろう?」
文字鏡関係者とTRON関係者とGTプロジェクト関係者が何人か集まって考えた。
しかしいくら考えても結論が出ない。その時、一人がひらめいた。
「それもUnicodeのせいだ!」
関係者は全員それで納得した。
文字鏡関係者とTRON関係者とGTプロジェクト関係者が何人か集まって考えた。
しかしいくら考えても結論が出ない。その時、一人がひらめいた。
「それもUnicodeのせいだ!」
関係者は全員それで納得した。
05/02/24 18:11:09
Windowsもとっととunicodeに移行して欲しいよ
05/02/24 19:13:03
してるじゃん
出来てないのはiniファイルくらいだろ?
出来てないのはiniファイルくらいだろ?
49デフォルトの名無しさん
05/02/25 06:57:00 どうか教えてください。
[1] 授業単元:プログラム概論
[2] 問題文(含コード&リンク):
シフトJISからEUCへの文字コード変換プログラムを作りたい(余裕があればその逆も)
http://tokyo.cool.ne.jp/kuonnnokizunanbalivetehe/programming/prog1.txt
[3] 環境
[3.1] OS: WindowsXP,NT Solaris2.0
[3.2] コンパイラ(バージョン):富士通fcc,Cygwin(gcc)
[3.3] 言語:C
[4] 期限:2005年2月28日12:00まで
[5] その他の制限: この問題文の意図だと引数をunsigned int型にするべきかどうか分からない
[1] 授業単元:プログラム概論
[2] 問題文(含コード&リンク):
シフトJISからEUCへの文字コード変換プログラムを作りたい(余裕があればその逆も)
http://tokyo.cool.ne.jp/kuonnnokizunanbalivetehe/programming/prog1.txt
[3] 環境
[3.1] OS: WindowsXP,NT Solaris2.0
[3.2] コンパイラ(バージョン):富士通fcc,Cygwin(gcc)
[3.3] 言語:C
[4] 期限:2005年2月28日12:00まで
[5] その他の制限: この問題文の意図だと引数をunsigned int型にするべきかどうか分からない
05/02/25 09:58:13
05/02/25 11:22:52
05/02/25 11:26:29
05/02/25 15:51:32
簡単な質問かもしれませんが、分からないので教えてください。
以下のプログラム、核は出来ています。このまま使用しても目的は達成できます。が、
http://tokyo.cool.ne.jp/kuonnnokizunanbalivetehe/CSJS2EUC.C
http://tokyo.cool.ne.jp/kuonnnokizunanbalivetehe/CEUC2SJS.C
この2つのソースコードをJISを経過させずに直接変換させるにはどうしたらいいでしょうか?
以下のプログラム、核は出来ています。このまま使用しても目的は達成できます。が、
http://tokyo.cool.ne.jp/kuonnnokizunanbalivetehe/CSJS2EUC.C
http://tokyo.cool.ne.jp/kuonnnokizunanbalivetehe/CEUC2SJS.C
この2つのソースコードをJISを経過させずに直接変換させるにはどうしたらいいでしょうか?
05/02/25 16:02:46
05/02/25 19:04:25
あちこちで聞けば、たくさんの人が並行して考えてくれるので、
答えが早くでると思いました。
どこか答えが出てるスレッドがありましたら教えてください。
答えが早くでると思いました。
どこか答えが出てるスレッドがありましたら教えてください。
05/02/25 19:36:43
だから、テーブルを使えよ。
05/02/25 19:46:47
>>48
コマンドプロンプトとか無理だろ
コマンドプロンプトとか無理だろ
05/02/25 19:55:45
無理じゃ無いよ
ちゃんとユニコードなファイル名も表示されるし
ちゃんとユニコードなファイル名も表示されるし
05/02/25 22:43:07
> あちこちで聞けば、たくさんの人が並行して考えてくれるので、
> 答えが早くでると思いました。
> どこか答えが出てるスレッドがありましたら教えてください。
・・・こういう心理をどう表現すればいいのだ?
自己中心的か
ゲーム脳か
> 答えが早くでると思いました。
> どこか答えが出てるスレッドがありましたら教えてください。
・・・こういう心理をどう表現すればいいのだ?
自己中心的か
ゲーム脳か
6053@愛宕山
05/02/25 23:13:03 ちなみに55はボクではありません。今さらどうでもいいけど
05/02/26 01:45:06
>>59
全員から同時に返事が来たらどうするつもりなんだろうね
全員から同時に返事が来たらどうするつもりなんだろうね
05/03/01 21:40:00
そこで超漢字
63デフォルトの名無しさん
2005/04/30(土) 21:51:28 うにこーど
2005/05/01(日) 11:20:17
>>57
localeモデルにしとけば、Shift_JIS→UTF-8移行も楽だったね。
localeモデルにしとけば、Shift_JIS→UTF-8移行も楽だったね。
65デフォルトの名無しさん
2005/05/03(火) 05:47:35 UNICODEだってごちゃごちゃの固まりジャン
こんな気味悪い文字コードにしなくちゃいけないのはいやだ
こんな気味悪い文字コードにしなくちゃいけないのはいやだ
2005/05/03(火) 07:29:57
UTF-8は使用するメモリが1.5倍になるからいやだ
2005/05/03(火) 20:19:22
UTF-8で1.5倍とはしらなかった。
2005/05/04(水) 00:05:00
漢字のコードポイントのとこなら1文字3バイトだけどね。
2005/05/04(水) 00:05:32
あ、3オクテットというべきかにゃ?
2005/05/05(木) 17:46:59
4オクテットの箇所もあるでよ。
71デフォルトの名無しさん
2005/11/19(土) 21:54:11 そこでシフトJISですよ。JIS第3水準、第4水準も難なく扱えるし、な。
2005/11/19(土) 22:22:21
つうか、そろそろJIS廃止してくれんかの。
シフトコードウザイ。
シフトコードウザイ。
2005/11/19(土) 22:27:05
UCS-4ってのが最後のUnicode?
Javaだとint型なんだっけ?よーわからんけど、早く統一して欲しい。
Javaだとint型なんだっけ?よーわからんけど、早く統一して欲しい。
2005/11/19(土) 22:43:03
2005/11/19(土) 22:44:51
UTF-8でいいんでしょ?〜とか@とか大丈夫なんでしょ?
2005/11/19(土) 22:53:34
77デフォルトの名無しさん
2005/11/20(日) 01:29:07 やっぱり生き残るのはシフトJIS系。
将来的には半角カナの領域を1バイト目にして可変長のコードにして
UnicodeやTRONコード、JEF、KEISを丸呑み。
絶対そうなる。
将来的には半角カナの領域を1バイト目にして可変長のコードにして
UnicodeやTRONコード、JEF、KEISを丸呑み。
絶対そうなる。
2005/11/20(日) 01:31:35
>>76
じゃあUCS-4でいいから今すぐ統一して( ノ><)ノ
じゃあUCS-4でいいから今すぐ統一して( ノ><)ノ
2005/11/24(木) 02:30:44
常用漢字とJISが食い違ってるというのもそもそもどんな縦割り行政
しちょるのかと
しちょるのかと
2005/11/24(木) 13:11:35
何か食い違ってたっけ?
2005/11/25(金) 21:34:50
龍の旧字体?
2005/11/25(金) 21:35:24
竜の旧字体? だった
龍じゃそのまんまじゃんorz
龍じゃそのまんまじゃんorz
2005/11/28(月) 16:44:09
「龍」の点の向きのこと?
そんなもん包摂の範囲内だしどっちだっていいやん。
表外漢字字体表にがちがちにあわせたJIS X 0213:2004のほうが異常。
そんなもん包摂の範囲内だしどっちだっていいやん。
表外漢字字体表にがちがちにあわせたJIS X 0213:2004のほうが異常。
2005/11/29(火) 08:28:23
大体、印刷標準字体とかうざいんじゃ!
2006/02/06(月) 15:57:56
だって常用漢字の数とJIS漢字の数とそもそもぜんぜん違うじゃん
たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
それより写植の文字がJISに入ってないせいで電話記号とか
ポゲムタとかが簡単に出せなくてラムちゃん語も満足に表記できやしない。
たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
それより写植の文字がJISに入ってないせいで電話記号とか
ポゲムタとかが簡単に出せなくてラムちゃん語も満足に表記できやしない。
2006/02/06(月) 16:36:04
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
>たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
2006/03/13(月) 10:43:01
いま試しに数えてみたら24個くらいあった
2006/03/25(土) 09:27:36
2006/03/26(日) 12:55:29
たしかJISにあって常用漢字にない漢字とか結構なかったっけ?
2006/03/27(月) 02:43:17
ない。
2006/05/01(月) 11:42:30
お前ら大嘘つきだ。みんな嫌いだ。
2006/05/04(木) 13:03:48
文字コードが増える前に、俺らが使う言葉の数を減らせばいいんじゃね?
2006/05/05(金) 07:04:34
たしかに。英語だけあれば世の中困ること無いよな。
2006/05/30(火) 02:39:01
そうだ。
2006/06/16(金) 19:34:55
>>66
UTF-8って英数字に対して使うなら容量はそんなに増えなかったかと。
UTF-8って英数字に対して使うなら容量はそんなに増えなかったかと。
96デフォルトの名無しさん
2006/07/06(木) 04:23:37 戦争中、敵方の兵士により領土が侵略されると、必ず略奪やレイプがおこなわれる。ルワンダもその例外ではなかった。
大統領の暗殺から2週間ほどたったころ、ルワンダ北西部のルヘンゲリ県のある村で14歳のツチ族少女がフツ族民兵に誘拐された。
当時すでに虐殺の嵐はルワンダ全土を激しく吹き荒れ、各地で次々とツチ族が殺されていた。しかし幸いなことにその村ではまだ一人の死者も出さず、ツチ族とフツ族が微妙なバランスの上で共生していた。
誘拐された少女は、「気立てが良くかわいい娘だ」と村で評判だったらしい。その日も夕食の準備をする母を手伝うため、水を汲みに村外れの井戸へ行き、そこで待ち伏せていた数人の男に拉致されてしまったのだ。
何人かの村人がその様子を目撃し、すぐさま家族に知らせた。家族は娘の身に起こりうる最悪の事態(レイプされた後、殺害される)を考え、血眼になって探したが、1週間たっても少女の行方はわからなかった。
さらに数日が過ぎ家族があきらめかけたころ、隣村から連絡が届いた。
「娘さんらしき少女を保護した。重体ではあるものの生きてはいる」
家族は押っ取り刀で隣村に駆けつけ、粗末なベッドの上で毛布に包まれ、横たわる少女の姿を見た。
体を包んでいる毛布に血がにじみ、見る影もなくやせ細った体は小刻みに震え、その瞳は輝きなく虚空を見つめていた。家族が声をかけても何も反応を示さない。脅えているのか寒いのか、ただ小さく震えるだけだ。
大統領の暗殺から2週間ほどたったころ、ルワンダ北西部のルヘンゲリ県のある村で14歳のツチ族少女がフツ族民兵に誘拐された。
当時すでに虐殺の嵐はルワンダ全土を激しく吹き荒れ、各地で次々とツチ族が殺されていた。しかし幸いなことにその村ではまだ一人の死者も出さず、ツチ族とフツ族が微妙なバランスの上で共生していた。
誘拐された少女は、「気立てが良くかわいい娘だ」と村で評判だったらしい。その日も夕食の準備をする母を手伝うため、水を汲みに村外れの井戸へ行き、そこで待ち伏せていた数人の男に拉致されてしまったのだ。
何人かの村人がその様子を目撃し、すぐさま家族に知らせた。家族は娘の身に起こりうる最悪の事態(レイプされた後、殺害される)を考え、血眼になって探したが、1週間たっても少女の行方はわからなかった。
さらに数日が過ぎ家族があきらめかけたころ、隣村から連絡が届いた。
「娘さんらしき少女を保護した。重体ではあるものの生きてはいる」
家族は押っ取り刀で隣村に駆けつけ、粗末なベッドの上で毛布に包まれ、横たわる少女の姿を見た。
体を包んでいる毛布に血がにじみ、見る影もなくやせ細った体は小刻みに震え、その瞳は輝きなく虚空を見つめていた。家族が声をかけても何も反応を示さない。脅えているのか寒いのか、ただ小さく震えるだけだ。
97デフォルトの名無しさん
2006/07/06(木) 04:24:30 少女は非常に奇異な姿で発見されたという。隣町の農夫は発見したときの様子をこう語る。
「私がいつものとおり自分の畑を耕すためにあぜ道を歩いていると、ふと視界に見慣れないものが目に入ったのです。
最初は『木の切り株か、大きな石なのかなあ』と思ったのですが、近づいてみると違いました。目を疑いましたよ。裸の少女が腰から下を土に埋められていたのですから……。
私が発見したとき、彼女は焦点の定まらない目でぼんやりと遠くを見つめ、半開きになった口からよだれを垂れ流していました。
インタラーメ(フツ族民兵)か政府軍が近くにいるのではと思ったので、慌てて村にいったん帰りました。人を集め武器を持ち、恐る恐るその場に戻って、彼女を掘り返したのです。
目は開いていたのですが、すでに彼女の意識はありませんでした」
変わり果てた姿の少女を、家族はすぐさま村から少し離れたところにあったフランスの緊急医療援助団体“国境なき医師団”の診療所へと運び込んだ。
偶然、その少女の治療に日本人看護婦、山本珠江さんが立ち会っていた。
「私がいつものとおり自分の畑を耕すためにあぜ道を歩いていると、ふと視界に見慣れないものが目に入ったのです。
最初は『木の切り株か、大きな石なのかなあ』と思ったのですが、近づいてみると違いました。目を疑いましたよ。裸の少女が腰から下を土に埋められていたのですから……。
私が発見したとき、彼女は焦点の定まらない目でぼんやりと遠くを見つめ、半開きになった口からよだれを垂れ流していました。
インタラーメ(フツ族民兵)か政府軍が近くにいるのではと思ったので、慌てて村にいったん帰りました。人を集め武器を持ち、恐る恐るその場に戻って、彼女を掘り返したのです。
目は開いていたのですが、すでに彼女の意識はありませんでした」
変わり果てた姿の少女を、家族はすぐさま村から少し離れたところにあったフランスの緊急医療援助団体“国境なき医師団”の診療所へと運び込んだ。
偶然、その少女の治療に日本人看護婦、山本珠江さんが立ち会っていた。
98デフォルトの名無しさん
2006/07/06(木) 04:26:13 「数人の男たちに、彼女は何日間にもわたり強姦され続けていたみたいなの。食事もろくに与えられていなかったようね。
しかも土に埋められる前、女性器に木の棒か銃身のような細くて固いものを押し込まれ、こねくり返されたようなのよ。
その傷口に雑菌が入ってしまったらしくて性器の一部が壊疽していたわ。
命だけは助かったけど、当然もう子供は産めないし、あまりに大きなショックを受けたから精神障害がひどくて廃人になってしまったわ」
山本さんは非常に悲しそうでいて、悔しそうな表情をしながらその時の状景を振り返った。
1週間ほどその少女は「国境なき医師団」の診療所に入院していたそうだ。肉体的な治療が終了すると、少女は家族に連れられ家に戻っていった。虐殺の被害に遇った瀕死の患者が次々に運び込まれてくるため、生命の危機がなくなった患者を収容する場所がなかったためだ。
「悲しいけど、これ戦争なのよね」
山本さんは、苦しげに首を横に振りながら語った。
しかも土に埋められる前、女性器に木の棒か銃身のような細くて固いものを押し込まれ、こねくり返されたようなのよ。
その傷口に雑菌が入ってしまったらしくて性器の一部が壊疽していたわ。
命だけは助かったけど、当然もう子供は産めないし、あまりに大きなショックを受けたから精神障害がひどくて廃人になってしまったわ」
山本さんは非常に悲しそうでいて、悔しそうな表情をしながらその時の状景を振り返った。
1週間ほどその少女は「国境なき医師団」の診療所に入院していたそうだ。肉体的な治療が終了すると、少女は家族に連れられ家に戻っていった。虐殺の被害に遇った瀕死の患者が次々に運び込まれてくるため、生命の危機がなくなった患者を収容する場所がなかったためだ。
「悲しいけど、これ戦争なのよね」
山本さんは、苦しげに首を横に振りながら語った。
2006/07/08(土) 09:12:04
100デフォルトの名無しさん
2006/10/31(火) 17:47:09101デフォルトの名無しさん
2006/11/09(木) 12:34:39 JISの文字コードがあれなのはそもそもが朝日新聞が適当に定めた文字だから
102デフォルトの名無しさん
2007/01/06(土) 11:43:23 まず文字コードについてだが、コード云々の前に自然言語の整理が必要だと思う。
実際にはほとんど使われることがない文字のためにコード領域を使うのは無駄だから
そういう文字はどんどん淘汰してゆくべき。
あと、字体がそっくりな文字なんかもできるだけ1つに統合してしまったほうがいい。
そのあとで国(言語種別)ごとにコード領域を分けて、すべての文字を1つのコード体系に
収めるべき。
次に改行コードだが、全部LFで統一でOK。改行ごときに2バイトも必要ない。
既存のリソースは全部LFに変換してしまえばよい。
Windowsなんかでファイルの改行を勝手に変換する機能をサポートすれば、
CR+LFはいずれこの世から自然消滅するだろう。
最後にエンディアンについてだが、ビッグエンディアンに統一すべき。
人間が感覚的になじみやすいほうがいいから。
これらのことをやるにはそれなりの負担がかかるが、その結果得られるメリットを
考えたらすぐにでも取り掛かるべき。もちろん世界レベルで。
実際にはほとんど使われることがない文字のためにコード領域を使うのは無駄だから
そういう文字はどんどん淘汰してゆくべき。
あと、字体がそっくりな文字なんかもできるだけ1つに統合してしまったほうがいい。
そのあとで国(言語種別)ごとにコード領域を分けて、すべての文字を1つのコード体系に
収めるべき。
次に改行コードだが、全部LFで統一でOK。改行ごときに2バイトも必要ない。
既存のリソースは全部LFに変換してしまえばよい。
Windowsなんかでファイルの改行を勝手に変換する機能をサポートすれば、
CR+LFはいずれこの世から自然消滅するだろう。
最後にエンディアンについてだが、ビッグエンディアンに統一すべき。
人間が感覚的になじみやすいほうがいいから。
これらのことをやるにはそれなりの負担がかかるが、その結果得られるメリットを
考えたらすぐにでも取り掛かるべき。もちろん世界レベルで。
103デフォルトの名無しさん
2007/01/10(水) 13:15:10 バベルの塔で神の怒りに触れ文字コードの種類が沢山になった。
これは事実で、(ry
これは事実で、(ry
104デフォルトの名無しさん
2007/01/10(水) 14:26:08 JISとEUCはほぼ等価だから
漏れ的には扱い安さは
EUC > JIS >>> SJIS >>>>>>> UNICODE
だと思うよ
漏れ的には扱い安さは
EUC > JIS >>> SJIS >>>>>>> UNICODE
だと思うよ
105デフォルトの名無しさん
2007/01/10(水) 14:28:45 判定のしやすさで言えばJISは・・
UNICODEもそうだな、代わりにUTF-8とか使うが
UNICODEもそうだな、代わりにUTF-8とか使うが
106デフォルトの名無しさん
2007/01/10(水) 17:43:21 援交ディングと門司セットの話がない交ぜに!
107デフォルトの名無しさん
2007/01/10(水) 18:11:17 UTF-128あれば大丈夫だろ?
108デフォルトの名無しさん
2007/01/10(水) 18:15:07 野球板 お約束その122
「しまってこーぜー」
↓
「まずお前が社会の窓閉めろや」
「しまってこーぜー」
↓
「まずお前が社会の窓閉めろや」
109デフォルトの名無しさん
2007/01/10(水) 18:15:43 ミスッた
110デフォルトの名無しさん
2007/01/10(水) 20:06:46 言語は何故複数あるのでしょうか?
どうせなら言語も英語だけにしようよ。
パスがでたー
どうせなら言語も英語だけにしようよ。
パスがでたー
111デフォルトの名無しさん
2007/01/11(木) 09:38:18 主食は何故複数あるのでしょうか?
どうせなら主食も米だけにしようよ。
どうせなら主食も米だけにしようよ。
112デフォルトの名無しさん
2007/01/11(木) 23:46:02 >104
まさかとはおもうが、そのJISはCESとしてのISO-2022-JPの通称のことなのか?
それともCCSとしてのJISX208なのか。
まさかとはおもうが、そのJISはCESとしてのISO-2022-JPの通称のことなのか?
それともCCSとしてのJISX208なのか。
113デフォルトの名無しさん
2007/01/24(水) 23:51:46 だいたい文字をコード(数字)に置き換えなければならない
現代のコンピュータアーキテクチャが問題。
やっぱ文字は文字として扱えなきゃダメでしょ。
現代のコンピュータアーキテクチャが問題。
やっぱ文字は文字として扱えなきゃダメでしょ。
114デフォルトの名無しさん
2007/01/25(木) 09:34:43 「文字を文字として扱う」っていうのは具体的にどういうことよ?
115デフォルトの名無しさん
2007/01/25(木) 10:01:33 0から9、AからFまでの文字しか使わない
116デフォルトの名無しさん
2007/01/25(木) 11:25:11 で、それらの文字を文字として扱うとはどういうこと?
117デフォルトの名無しさん
2007/02/10(土) 22:58:13 あいう・・・と書かずに
a01001a01002a01003・・・
a01001a01002a01003・・・
118デフォルトの名無しさん
2007/03/16(金) 03:44:15 ベクトルデータとしてパターン認識させるとか?w
119デフォルトの名無しさん
2007/07/12(木) 19:45:19 【日本語を扱える主な文字コード(“x-” 付きのものは IANA 非登録)】
Shift_JIS
Windows-31J
x-Mac-Japanese
ISO-2022-JP
ISO-2022-JP-2
x-CP50220
EUC-JP
x-CP51932
UTF-8
x-UTF-8N
x-UTF-8-BOM
UTF-7
UTF-16
UTF-16BE
UTF-16LE
Shift_JIS
Windows-31J
x-Mac-Japanese
ISO-2022-JP
ISO-2022-JP-2
x-CP50220
EUC-JP
x-CP51932
UTF-8
x-UTF-8N
x-UTF-8-BOM
UTF-7
UTF-16
UTF-16BE
UTF-16LE
120デフォルトの名無しさん
2007/07/12(木) 21:01:07 UTF-32系は?
121・∀・)っ-○◎●
2007/08/09(木) 02:10:09 UTF-9は?
122デフォルトの名無しさん
2007/08/09(木) 16:25:42 UTF-18は?
123デフォルトの名無しさん
2007/08/09(木) 23:52:07 Punycodeは?
124デフォルトの名無しさん
2007/08/13(月) 14:54:27 Windows上でperlのCGIを作成していて、
ファイルの保存時に、漢字コードを指定しないと
保存できないのですが、
シフトJISと
JISと
EUCと、
どれを選択したらいいのでしょうか?
作成後はFFFTPでレンタルサーバーにアップロードしますが、
そのレンタルサーバーは当然UNIXなので、
UNIXで動かすということを考えればEUCで保存したほうが
いいのですか?
あと、C5の問題(表とか)を考えれば
シフトJISだと
表¥
っていちいち書かないと文字化けしますが、
EUCだったらそんな余計なこと考えないでいいと
いう記述も見つけました。
だったらEUCで保存しようかな?と思いましたが
それだとWindows上でソースコードの変更作業するときに
漢字が文字化けしないですか?
だってWindowsはシフトJISしか取り扱えないのだから。
結局何で保存すればいいのでしょうか?
ファイルの保存時に、漢字コードを指定しないと
保存できないのですが、
シフトJISと
JISと
EUCと、
どれを選択したらいいのでしょうか?
作成後はFFFTPでレンタルサーバーにアップロードしますが、
そのレンタルサーバーは当然UNIXなので、
UNIXで動かすということを考えればEUCで保存したほうが
いいのですか?
あと、C5の問題(表とか)を考えれば
シフトJISだと
表¥
っていちいち書かないと文字化けしますが、
EUCだったらそんな余計なこと考えないでいいと
いう記述も見つけました。
だったらEUCで保存しようかな?と思いましたが
それだとWindows上でソースコードの変更作業するときに
漢字が文字化けしないですか?
だってWindowsはシフトJISしか取り扱えないのだから。
結局何で保存すればいいのでしょうか?
125デフォルトの名無しさん
2007/08/13(月) 23:34:09126・∀・)っ-○◎●
2007/08/15(水) 03:02:00 UNIXだからってサイトをEUCにしないといけないなんてことはない。
最近のLinuxは標準文字コードはUTF-8が多いよ。
XML対応とかも視野に入れるならできればUTF-8のほうがいい。
Shift-JISはね、HTMLだけならいいけどプログラム書くと何かとトラブルに遭いやすい。
最近のLinuxは標準文字コードはUTF-8が多いよ。
XML対応とかも視野に入れるならできればUTF-8のほうがいい。
Shift-JISはね、HTMLだけならいいけどプログラム書くと何かとトラブルに遭いやすい。
127デフォルトの名無しさん
2007/08/15(水) 03:08:05 そしてベンダ毎の変換表の違いやらのUnicode特有の問題になやまされるわけですね。
SJISでも機種依存文字とか、2バイト目に0x5C使ってるとか問題あるけど、
Unicode使っても薔薇色の未来が待ってるわけじゃない。
どっちかっつーと、長いものには巻かれろ的な感じの方が強い。
SJISでも機種依存文字とか、2バイト目に0x5C使ってるとか問題あるけど、
Unicode使っても薔薇色の未来が待ってるわけじゃない。
どっちかっつーと、長いものには巻かれろ的な感じの方が強い。
128デフォルトの名無しさん
2007/08/15(水) 10:36:44 ハナからUnicode使ってれば変換表とか関係ないんじゃ?
129・∀・)っ-○◎●
2007/08/15(水) 23:28:24 それは言える。
tDiaryでうかつにrecent-rssプラグイン使って2chのRSSを表示しようとすると
機種依存文字の関係でUNICODEの変換失敗で全部転ける。
tDiaryでうかつにrecent-rssプラグイン使って2chのRSSを表示しようとすると
機種依存文字の関係でUNICODEの変換失敗で全部転ける。
130デフォルトの名無しさん
2007/08/16(木) 01:39:32131デフォルトの名無しさん
2007/08/16(木) 05:24:15132デフォルトの名無しさん
2007/08/16(木) 10:12:50 ダンゴさんの居るスレは活気があるな。
133デフォルトの名無しさん
2007/08/20(月) 17:54:12 普通の日本語のサイトならEUC-JPかISO-2022-JPでいいだろ
ちょいと外国の文字使うくらいなら実体参照でも十分だし
Unicodeなんて混乱の極みにある物を使う気にはなれん
ちょいと外国の文字使うくらいなら実体参照でも十分だし
Unicodeなんて混乱の極みにある物を使う気にはなれん
134デフォルトの名無しさん
2007/08/20(月) 20:15:12 なんでウェブサイトの話になってるの?
135デフォルトの名無しさん
2007/08/26(日) 08:04:08 あげ
136デフォルトの名無しさん
2007/08/30(木) 08:21:39 ネットワークが一番文字コード問題が露呈しやすいからだろ
137デフォルトの名無しさん
2007/09/02(日) 18:33:34138デフォルトの名無しさん
2007/09/04(火) 16:32:27 バベルの塔を建てたから
139デフォルトの名無しさん
2007/09/08(土) 10:08:44 JEFとかKEISとかその先にある厚生省系、労働省系の外字コードなんかがUnicodeに反映されていないってのがあるな
140デフォルトの名無しさん
2007/11/25(日) 16:28:52 JISの文字コード表なんて
もうごちゃごちゃだな
80h〜9Fhなんて制御文字には使わないんだから
1区1点〜126区126点1つにまとめろよ
もうごちゃごちゃだな
80h〜9Fhなんて制御文字には使わないんだから
1区1点〜126区126点1つにまとめろよ
141デフォルトの名無しさん
2008/01/16(水) 23:18:53142デフォルトの名無しさん
2008/05/07(水) 23:34:16 age
143デフォルトの名無しさん
2008/05/12(月) 22:00:30 sage
144デフォルトの名無しさん
2008/07/09(水) 23:50:48 2208
145デフォルトの名無しさん
2008/12/23(火) 07:49:06146デフォルトの名無しさん
2008/12/25(木) 21:09:50 プライベートエリアを私用領域とか訳しちゃうセンスが在る限り文字コードは増え続けるさ
147デフォルトの名無しさん
2009/01/07(水) 12:48:00 だれか文字コード総合スレの新スレ立ててー。
148デフォルトの名無しさん
2009/01/07(水) 21:23:47 >>147
前スレ、一ヶ月書き込みなくて17レスで落ちてるみたいだけど、需要ないからじゃね?
前スレ、一ヶ月書き込みなくて17レスで落ちてるみたいだけど、需要ないからじゃね?
149デフォルトの名無しさん
2009/01/07(水) 21:31:34 この板、即死に引っ掛からなければ、数か月書き込みないのはざらなほう。
150デフォルトの名無しさん
2009/01/08(木) 00:03:07151デフォルトの名無しさん
2009/01/08(木) 22:13:20152デフォルトの名無しさん
2009/01/12(月) 16:41:43 http://www.unicode.org/mail-arch/unicode-ml/y2009-m01/0380.html
最近のUnicodeメーリングリストは顔が真っ赤で引くに引けなくなった人たちが
たくさんいるようだがこれはひどすぎる
日本では「犬」を「ケン」と読むこともあるなんて知らないんだろうな。
それとも「いぬ」と読む「犬」と「ケン」と読む「犬」は別字だとか言い出すんだろうか。
それ何てKS X 1001?
最近のUnicodeメーリングリストは顔が真っ赤で引くに引けなくなった人たちが
たくさんいるようだがこれはひどすぎる
日本では「犬」を「ケン」と読むこともあるなんて知らないんだろうな。
それとも「いぬ」と読む「犬」と「ケン」と読む「犬」は別字だとか言い出すんだろうか。
それ何てKS X 1001?
153デフォルトの名無しさん
2009/01/12(月) 19:52:02 文字コードって65000くらいあるの?
154デフォルトの名無しさん
2009/01/12(月) 21:00:14 100万くらいあります
155デフォルトの名無しさん
2009/01/15(木) 00:13:07 絵文字レビュー終了のお知らせ
156デフォルトの名無しさん
2009/01/18(日) 23:15:58 国ごとに専用の(速度重視の)エンコーディング一つとUnicodeだけにしてほしい
157デフォルトの名無しさん
2009/01/18(日) 23:17:53 >>157
日本は何にするの?
日本は何にするの?
158デフォルトの名無しさん
2009/01/26(月) 11:26:56159デフォルトの名無しさん
2009/01/26(月) 12:52:12 >>157
JIS_X201で。
JIS_X201で。
160デフォルトの名無しさん
2009/01/26(月) 23:24:33 http://smallbear.sakura.ne.jp/tron/btm20091.html#20090123
まるで人ごとのように書いてますけど
TRONコードでは&T224C71;と&T224C72;のどっちなんですか?
ていうか「&T224C71;と&T224C72;の区別すらできない欠陥規格だ!」式の批判は
(JIS|Unicode)叩きの定番だったような気がするんですが。
ていうかTフォントマダー? (AAry
まるで人ごとのように書いてますけど
TRONコードでは&T224C71;と&T224C72;のどっちなんですか?
ていうか「&T224C71;と&T224C72;の区別すらできない欠陥規格だ!」式の批判は
(JIS|Unicode)叩きの定番だったような気がするんですが。
ていうかTフォントマダー? (AAry
161デフォルトの名無しさん
2009/01/27(火) 01:10:46 「…お母さん?俺やけど…」
「…TRONか?…」
「うん…俺、包摂分離してしもて…」
「もう、包摂分離の事は気にせんでいいから、成仏して…」
「…TRONか?…」
「うん…俺、包摂分離してしもて…」
「もう、包摂分離の事は気にせんでいいから、成仏して…」
162デフォルトの名無しさん
2009/01/27(火) 08:05:57 ちなみに今昔文字鏡では*****(検閲削除されました)番と*****(検閲削除されました)番。
いや実際には調べてないけど絶対分離されてるに違いないし
いや実際には調べてないけど絶対分離されてるに違いないし
163マイク ◆gZ6OoOjBU6
2009/02/05(木) 08:39:33 UnicodeだかUTF16だか知らんが
サロゲート文字の処理に関する脆弱性が色々なブラウザで報告されたりしてた。
2001年頃に2chで西村博之が誰かに指摘されてたウニコードに関する問題ってそれのことだったのかな。
サロゲート文字の処理に関する脆弱性が色々なブラウザで報告されたりしてた。
2001年頃に2chで西村博之が誰かに指摘されてたウニコードに関する問題ってそれのことだったのかな。
164マイク ◆gZ6OoOjBU6
2009/02/05(木) 08:49:15 これだわこれ。
blackhatコンファレンスで長谷川洋介って人だっけ?
それが発表してた文字コードに関する脆弱性に関する論文に近いもの。
見てない奴は見てみ
参考になんぞ
https://www.blackhat.com/presentations/bh-jp-08/bh-jp-08-Hasegawa/BlackHat-japan-08-Hasegawa-Char-Encoding.pdf
blackhatコンファレンスで長谷川洋介って人だっけ?
それが発表してた文字コードに関する脆弱性に関する論文に近いもの。
見てない奴は見てみ
参考になんぞ
https://www.blackhat.com/presentations/bh-jp-08/bh-jp-08-Hasegawa/BlackHat-japan-08-Hasegawa-Char-Encoding.pdf
165デフォルトの名無しさん
2009/02/06(金) 15:04:05 Gmailが絵文字を全世界的に公式アナウンス。
https://mail.google.com/mail/help/about_whatsnew.html
> Emoticons - they're not just for chat anymore
> Express yourself with emoticons from to (小さい笑い顔) or (カニ) even (ハエうんこ).
> Click the (小さい笑い顔) button when composing a message
> in "Rich formatting" mode, or choose the new emoticons tab in chat,
> and express yourself to your ハートマーク)'s desire.
> Learn more (http://mail.google.com/support/bin/answer.py?hl=en&answer=112518)
https://mail.google.com/mail/help/images/whatsnew/emoji_smile.gif
を絵文字アイコンに決定した模様。
「even ハエうんこ」ワロタ
https://mail.google.com/mail/help/about_whatsnew.html
> Emoticons - they're not just for chat anymore
> Express yourself with emoticons from to (小さい笑い顔) or (カニ) even (ハエうんこ).
> Click the (小さい笑い顔) button when composing a message
> in "Rich formatting" mode, or choose the new emoticons tab in chat,
> and express yourself to your ハートマーク)'s desire.
> Learn more (http://mail.google.com/support/bin/answer.py?hl=en&answer=112518)
https://mail.google.com/mail/help/images/whatsnew/emoji_smile.gif
を絵文字アイコンに決定した模様。
「even ハエうんこ」ワロタ
166デフォルトの名無しさん
2009/02/07(土) 08:19:39167デフォルトの名無しさん
2009/02/07(土) 09:20:45 UTF-16サロゲートペアをUTF-8に変換出来ますか?
168デフォルトの名無しさん
2009/02/07(土) 12:12:34169デフォルトの名無しさん
2009/02/08(日) 01:58:04 日本人になまじ技術力があったから日本製PCが一時期国内でシェアを占め
独自のPC漢字文化が創られた。これがすべての始まり。
独自のPC漢字文化が創られた。これがすべての始まり。
170デフォルトの名無しさん
2009/02/08(日) 13:24:01 で、ケータイの世界でもまったく同じようにガラパゴスケータイがシェアを占めて
独自の絵文字文化が発達したわけですね、わかります。
進歩しろよ
独自の絵文字文化が発達したわけですね、わかります。
進歩しろよ
171デフォルトの名無しさん
2009/02/10(火) 11:08:47 絵文字はユニコードに入りますよ、たぶん。
172デフォルトの名無しさん
2009/02/11(水) 01:08:00 日本のケータイメーカーが音頭を取って入れたわけではないけどね。
漢字だってAdobeの活動でようやく異体字の使い分けが(原理上は)できるようになった
漢字だってAdobeの活動でようやく異体字の使い分けが(原理上は)できるようになった
173デフォルトの名無しさん
2009/02/13(金) 07:51:40 http://www.kumikomi.net/article/report/2009/01tron/01.html
> 2009年の早い時期に,
もう出す出す詐欺はいいよ
> 第1期 236,025字の一般リリース(Webからの無償ダウンロード)を予定しているという.
GT78,675字×3書体を先に出すことにしたのか
> 2009年の早い時期に,
もう出す出す詐欺はいいよ
> 第1期 236,025字の一般リリース(Webからの無償ダウンロード)を予定しているという.
GT78,675字×3書体を先に出すことにしたのか
174デフォルトの名無しさん
2009/02/17(火) 21:04:27 久しぶりにSMPのroadmapを見たらU+1B100あたりに「(Historic Kana)」というのがあった。
http://www.unicode.org/roadmaps/smp/
歴史的仮名遣いに必要な文字はすべて収録済みのはずだから
変体仮名の追加提案かな
http://www.unicode.org/roadmaps/smp/
歴史的仮名遣いに必要な文字はすべて収録済みのはずだから
変体仮名の追加提案かな
175デフォルトの名無しさん
2009/02/17(火) 21:25:54 "historical"じゃないのは何故だろう?
176デフォルトの名無しさん
2009/02/17(火) 23:03:24 この前提案されてたKATAKANA LETTER ORIGINAL E(片仮名の元々のア行の「エ」、「衣」に由来)もそこに入るのかも知れない。
同時に提案されてたHIRAGANA LETTER YE(平仮名ヤ行の「え」、「江」に由来)は平仮名ブロックの空きの内の一つU+3097にほぼ決定みたいだが、
片仮名ブロックはもう空きが無いからな。
同時に提案されてたHIRAGANA LETTER YE(平仮名ヤ行の「え」、「江」に由来)は平仮名ブロックの空きの内の一つU+3097にほぼ決定みたいだが、
片仮名ブロックはもう空きが無いからな。
177デフォルトの名無しさん
2009/02/22(日) 18:58:47 http://fezn.exblog.jp/10234044/
一太郎ってIVS対応してたの? マジ?
一太郎ってIVS対応してたの? マジ?
178デフォルトの名無しさん
2009/02/23(月) 23:33:42 > 今後は「出典をすべてscanデータで出すべし」という方針に。
> だが、律儀に守っているのは日本と中国ぐらい。。
> 未提出多数とか、「人名だから」出さずじまいとか、出典非明示→取り下げ、とか。
UCSがゴミまみれになるのを防ぐことに一定の効果を上げてるわけだな。いいことだ。
> だが、律儀に守っているのは日本と中国ぐらい。。
> 未提出多数とか、「人名だから」出さずじまいとか、出典非明示→取り下げ、とか。
UCSがゴミまみれになるのを防ぐことに一定の効果を上げてるわけだな。いいことだ。
179デフォルトの名無しさん
2009/02/24(火) 15:45:03 >>177
今後の話だろ。
今後の話だろ。
180デフォルトの名無しさん
2009/02/25(水) 22:50:21 今後の話だったら「ブラウザはまだ」って書いてるのが変だ
181デフォルトの名無しさん
2009/03/03(火) 22:09:24 U+1B000がKATAKANA LETTER ARCHAIC E(片仮名「衣」由来のア行の「エ」)になってた。
名前がORIGINAL E(元々の「エ」)からARCHAIC E(古代の「エ」)に変更されてた。
平仮名ヤ行の「え」と違ってBMP外になってしまうけどしょうがないか。
Historic KanaというブロックでU+1B000から256文字分予約されたけど今後変体仮名とか重要な昔の仮名をU+1B001以降にも追加していくつもりなのかな?
名前がORIGINAL E(元々の「エ」)からARCHAIC E(古代の「エ」)に変更されてた。
平仮名ヤ行の「え」と違ってBMP外になってしまうけどしょうがないか。
Historic KanaというブロックでU+1B000から256文字分予約されたけど今後変体仮名とか重要な昔の仮名をU+1B001以降にも追加していくつもりなのかな?
182デフォルトの名無しさん
2009/03/04(水) 00:21:44 256で足りるのw?
そこら辺の文字はよく知らないけど512から1024くらいあってもいいような。
そこら辺の文字はよく知らないけど512から1024くらいあってもいいような。
183デフォルトの名無しさん
2009/03/04(水) 00:29:59 変体かなは良く分からないけど、ここのページを見る限り、平仮名だけでも軽く600以上ありそう。
ttp://www10.plala.or.jp/koin/koinhentaigana.html
ttp://www10.plala.or.jp/koin/koinhentaigana.html
184デフォルトの名無しさん
2009/03/04(水) 12:43:59 住基仮名だけなら256で足りるがな。
185デフォルトの名無しさん
2009/03/05(木) 07:38:01 1バイト目に文字種を表すもんだけいれて後は可変でよろしくやればいいと思った
最低2バイト〜な感じで
最低2バイト〜な感じで
186デフォルトの名無しさん
2009/03/05(木) 17:50:02 欧米人にはそれが理解できんのですよ。
たとえば、”うまれつき目の見えないひと” を想像してみてください。
その人に「海は青い」という事を、いったいどうやって教えればいいのか。
そのひとには、赤も青も黄色も無いんです。色という概念が全く無いんです。
だから理解不可能です。
3次元の世界で生活している我々が4次元の世界を理解できないのと同じく
1文字1バイト圏で生活している欧米人には、1文字が2バイト、3バイトになるのが
理解できんのです。ヤツらにとってマルチバイト文化は4次元の世界なのです。
たとえば、”うまれつき目の見えないひと” を想像してみてください。
その人に「海は青い」という事を、いったいどうやって教えればいいのか。
そのひとには、赤も青も黄色も無いんです。色という概念が全く無いんです。
だから理解不可能です。
3次元の世界で生活している我々が4次元の世界を理解できないのと同じく
1文字1バイト圏で生活している欧米人には、1文字が2バイト、3バイトになるのが
理解できんのです。ヤツらにとってマルチバイト文化は4次元の世界なのです。
187デフォルトの名無しさん
2009/03/05(木) 18:06:53 物理的に無理なのと一緒にされても。
188デフォルトの名無しさん
2009/03/05(木) 19:19:15 文字コード総合の次スレはここでござるな? しからば過去スレを貼り。
【UTF8】文字コード変換【SJIS】
http://pc5.2ch.net/test/read.cgi/tech/1063177450/
文字コード統一スレ 1文字目
http://pc8.2ch.net/test/read.cgi/tech/1109171258/
文字コード総合スレ part2
http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3
http://pc11.2ch.net/test/read.cgi/tech/1180250376/
【UTF8】文字コード変換【SJIS】
http://pc5.2ch.net/test/read.cgi/tech/1063177450/
文字コード統一スレ 1文字目
http://pc8.2ch.net/test/read.cgi/tech/1109171258/
文字コード総合スレ part2
http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3
http://pc11.2ch.net/test/read.cgi/tech/1180250376/
189デフォルトの名無しさん
2009/03/05(木) 20:24:38 >>185
いきなり可変でよろしくやってるのがUTF-8です。
いきなり可変でよろしくやってるのがUTF-8です。
190デフォルトの名無しさん
2009/03/05(木) 21:44:14191デフォルトの名無しさん
2009/03/07(土) 02:01:46 変体でも「あ」なら「あ」なのだから、「あ」に対して異体字セレクタの対応を決めればいいだけなんじゃね?
256種類まで対応できるんだから、多分足りるでしょ。
足りなきゃ、異体字セレクタの方を増やせばいい。
256種類まで対応できるんだから、多分足りるでしょ。
足りなきゃ、異体字セレクタの方を増やせばいい。
192デフォルトの名無しさん
2009/03/07(土) 14:29:53 U+E0100〜U+E01EFは漢字専用じゃなかったっけ?
193デフォルトの名無しさん
2009/03/07(土) 15:36:34 それよりアラビア文字みたいに前後の文字で字形を変えるのを
サポートする必要があるんじゃないか
サポートする必要があるんじゃないか
194デフォルトの名無しさん
2009/03/07(土) 19:27:11 ・縦書き
・前後の状況で字形を変える必要がある
・異体字セレクタに対応が必要
それなんてモンゴル文字?
・前後の状況で字形を変える必要がある
・異体字セレクタに対応が必要
それなんてモンゴル文字?
195デフォルトの名無しさん
2009/03/07(土) 22:28:59 草書を標準化するところから始めないと…
196デフォルトの名無しさん
2009/03/08(日) 11:10:41 アラビア文字がまさに草書の電子化
197デフォルトの名無しさん
2009/03/09(月) 02:11:40 文字コード総合スレ part5
http://pc11.2ch.net/test/read.cgi/tech/1236529563/l50
作ってきた。
即死回避に、だれか頼む。
あと、テンプレがまだ(40行)残ってるので。現在連投規制(5回)で書き込めないのを何とかしないといけない。
http://pc11.2ch.net/test/read.cgi/tech/1236529563/l50
作ってきた。
即死回避に、だれか頼む。
あと、テンプレがまだ(40行)残ってるので。現在連投規制(5回)で書き込めないのを何とかしないといけない。
198デフォルトの名無しさん
2009/03/09(月) 02:23:53 ●かえ
199デフォルトの名無しさん
2009/03/09(月) 02:36:52 ●持ってない
取り合えず見切り発車してくれ。
取り合えず見切り発車してくれ。
200デフォルトの名無しさん
2009/03/09(月) 22:10:13201デフォルトの名無しさん
2009/03/23(月) 19:29:17202デフォルトの名無しさん
2009/08/11(火) 15:28:27 ∧_∧
( ・∀・ )つ
( つ /
| (⌒)どどど・・・
. し' 三
∧_∧
⊂( ・∀・ )
. ヽ ⊂ )
(⌒) |どどどどど・・・・・
三 `J
メ\,_ ,メ゙\、
.メ′ .゙゙アhr _,zl||y,_ .゙∨
.″ .y!^⌒ ¨\ .,,,,,,__
.,yr=¬z .l| ◎ 《 . ゙゙̄^へu,
,メ″,z厂◎ l| ¥ il! ゙ミ
il「 ミy ..,ilト ゙ミy_ ア ,メ .∨
.ll′ 干=冖″ ,,,yyyyy. l| / ̄ ̄ ̄ ̄ ̄
.l| ,,,yvr=冖''''|リ|||》巛》ミ冖'li厂.l| .,l! < 薄型?!!!
.l! 《vvvr=冖¨ ̄ .゙干l! .,メ′ \_____
.l| .l| .,,yrrvy_ ,,,,,,_ .《yrl″
\_ ,l|.,yzl^^゙゙^冖《《||7厂`゙リu_ .l|
.゙\、 .r《l厂 .¨゙冖=vu,フhrト
( ・∀・ )つ
( つ /
| (⌒)どどど・・・
. し' 三
∧_∧
⊂( ・∀・ )
. ヽ ⊂ )
(⌒) |どどどどど・・・・・
三 `J
メ\,_ ,メ゙\、
.メ′ .゙゙アhr _,zl||y,_ .゙∨
.″ .y!^⌒ ¨\ .,,,,,,__
.,yr=¬z .l| ◎ 《 . ゙゙̄^へu,
,メ″,z厂◎ l| ¥ il! ゙ミ
il「 ミy ..,ilト ゙ミy_ ア ,メ .∨
.ll′ 干=冖″ ,,,yyyyy. l| / ̄ ̄ ̄ ̄ ̄
.l| ,,,yvr=冖''''|リ|||》巛》ミ冖'li厂.l| .,l! < 薄型?!!!
.l! 《vvvr=冖¨ ̄ .゙干l! .,メ′ \_____
.l| .l| .,,yrrvy_ ,,,,,,_ .《yrl″
\_ ,l|.,yzl^^゙゙^冖《《||7厂`゙リu_ .l|
.゙\、 .r《l厂 .¨゙冖=vu,フhrト
203デフォルトの名無しさん
2009/12/12(土) 15:53:19 >>1
日本が世界を統一できなかったから
日本が世界を統一できなかったから
204デフォルトの名無しさん
2009/12/12(土) 18:36:49205デフォルトの名無しさん
2010/04/08(木) 01:34:54 もし、織田信長が生きていたら、日本が世界を支配するとか、テレビってマジ、アホだな。
あそこに出てた専門家も恥ずかしくないんだろうか?
(ひょっとして自称専門家かな)
あそこに出てた専門家も恥ずかしくないんだろうか?
(ひょっとして自称専門家かな)
206デフォルトの名無しさん
2010/06/27(日) 00:46:08 UTF8最強
ASCIIとの互換性は伊達じゃない。
ASCIIとの互換性は伊達じゃない。
207デフォルトの名無しさん
2010/06/27(日) 00:57:46 もし、織田信長が生きていたら、日本が世界を支配
208デフォルトの名無しさん
2010/06/30(水) 13:16:56 立ってないことろを見ると、ここが「文字コード総合スレ」の後継スレでつか?
209デフォルトの名無しさん
2010/06/30(水) 13:28:51 立てるか。
テンプレ面倒過ぎるな。1 だけでいい?
テンプレ面倒過ぎるな。1 だけでいい?
210デフォルトの名無しさん
2010/06/30(水) 23:13:43 VSネタまだやるなら分けてほしいな
211デフォルトの名無しさん
2010/07/02(金) 17:37:12 結局争点はなんだったのだろう?
212デフォルトの名無しさん
2010/07/02(金) 23:59:40213デフォルトの名無しさん
2010/07/03(土) 00:50:32 >>211
もおたが飲み仲間なのか、それとも憎いかでしょう。
もおたが飲み仲間なのか、それとも憎いかでしょう。
214デフォルトの名無しさん
2010/07/03(土) 11:01:09 それじゃ、争点を洗い出すスレが別に要る?それともここがそれ?
215デフォルトの名無しさん
2010/07/03(土) 11:02:48 >>214
もういらないだろ。
もういらないだろ。
216デフォルトの名無しさん
2010/07/03(土) 11:55:19 文字コードのスレは何故複数あるのでしょうか?
217デフォルトの名無しさん
2010/07/03(土) 11:57:49 コードもスレも統合出来ないお馬鹿さんたちwww
218デフォルトの名無しさん
2010/07/03(土) 12:18:09 馬鹿が来たぞー
219デフォルトの名無しさん
2010/07/03(土) 12:41:21 >>211
争点は、UTF8はUTF16やUTF32よりも優れている。
特にASCIIとの互換性に優れており、
既存のソフト・・・多くはASCIIやEUC-JPなどの
ASCII互換用として作られているソフトや
そこで使われているライブラリの互換性がよく
ほとんど修正無しに動く。
UTF16やUTF32だと修正のコストが膨大になる。
ということ。
争点は、UTF8はUTF16やUTF32よりも優れている。
特にASCIIとの互換性に優れており、
既存のソフト・・・多くはASCIIやEUC-JPなどの
ASCII互換用として作られているソフトや
そこで使われているライブラリの互換性がよく
ほとんど修正無しに動く。
UTF16やUTF32だと修正のコストが膨大になる。
ということ。
220デフォルトの名無しさん
2010/07/03(土) 12:52:08 wchar_tとロケールとファイルシステム(fopen)がごっちゃになってた気がするんだが。
221デフォルトの名無しさん
2010/07/03(土) 13:01:26 全部charをwchar_tに置き換えるだけでOKとかいう
能天気やろうもいたしな。
それが全ソースコード修正&再テストという
意味だというのを気づいていない。
その膨大さに気づいていないから、
置き換えるだけにコストがかかるというんですか?
なんてことを平気でいえてしまう。
能天気やろうもいたしな。
それが全ソースコード修正&再テストという
意味だというのを気づいていない。
その膨大さに気づいていないから、
置き換えるだけにコストがかかるというんですか?
なんてことを平気でいえてしまう。
222デフォルトの名無しさん
2010/07/03(土) 13:06:11223デフォルトの名無しさん
2010/07/03(土) 13:07:21224デフォルトの名無しさん
2010/07/03(土) 13:07:38 >>221
置き換えずにそのまま使うのにコストがかかるんですか?というのと同レベルの話。
置き換えずにそのまま使うのにコストがかかるんですか?というのと同レベルの話。
225デフォルトの名無しさん
2010/07/03(土) 13:08:47226デフォルトの名無しさん
2010/07/03(土) 13:10:12227デフォルトの名無しさん
2010/07/03(土) 13:17:19 この話は続ける必要はない。落ちたスレで既に話は終わっていたのだから。
999 名前:デフォルトの名無しさん [sage]: 2010/06/26(土) 22:19:28
>>972
>UTF-8にすると何もかも上手くいくよ派は、何を言いたいのかよくわからん
そんな奴いたか? wchar_tにすれば何もかもうまくいくよ派は居たけど。
---
UTF-8にすると何もかも上手くいくよ派がいないのなら、
>>212が争点にしてたことは、元々誰も否定してなかったことだし、
>>219が争点にしてたことは、元々誰も言っていなかったこと。
wchar_tにすることが全てを解決する方法じゃないのは自明。
結論は既に出ていた。
999 名前:デフォルトの名無しさん [sage]: 2010/06/26(土) 22:19:28
>>972
>UTF-8にすると何もかも上手くいくよ派は、何を言いたいのかよくわからん
そんな奴いたか? wchar_tにすれば何もかもうまくいくよ派は居たけど。
---
UTF-8にすると何もかも上手くいくよ派がいないのなら、
>>212が争点にしてたことは、元々誰も否定してなかったことだし、
>>219が争点にしてたことは、元々誰も言っていなかったこと。
wchar_tにすることが全てを解決する方法じゃないのは自明。
結論は既に出ていた。
228デフォルトの名無しさん
2010/07/03(土) 13:25:04229デフォルトの名無しさん
2010/07/03(土) 13:30:08 じゃあここは「文字コード総合スレ」がなぜ立たないのか、立てた場合のテンプレの話のスレにする?
230デフォルトの名無しさん
2010/07/03(土) 13:38:28 なにもなければ放置されるだけのスレの埋め草としてちょうどいいな。
231デフォルトの名無しさん
2010/07/03(土) 14:35:47232デフォルトの名無しさん
2010/07/03(土) 14:58:57 さっさと次スレ立てろよボケ
233デフォルトの名無しさん
2010/07/03(土) 15:13:49234デフォルトの名無しさん
2010/07/03(土) 15:21:57 >>233
意味が分からん。2chに書いてあったか書いてなかったかと、Unixのロケールがどう関係するんだ?
意味が分からん。2chに書いてあったか書いてなかったかと、Unixのロケールがどう関係するんだ?
235デフォルトの名無しさん
2010/07/03(土) 15:24:04 情報の受け手側に理解する能力がなければ書かれてても気付かないってことだろう
236デフォルトの名無しさん
2010/07/03(土) 15:26:22237デフォルトの名無しさん
2010/07/03(土) 15:28:13知らないことは誰だってあるけど、いいやんとか言って違いも調べず思考停止するやつは向上心もう少し持とうぜ
238デフォルトの名無しさん
2010/07/03(土) 15:43:18 >>236
・fopenの話が出たことと、wchar_tにすれば何もかもうまくいくという人がいたことは関係がない
・fopenが出てくる前から、どうせ泥試合だった
・どっちにせよ、fopenでそのままutf8渡して(文字化けすらしないという意味で)うまくいくのはロケールもutf8のときのみ
と認識しているが。
・fopenの話が出たことと、wchar_tにすれば何もかもうまくいくという人がいたことは関係がない
・fopenが出てくる前から、どうせ泥試合だった
・どっちにせよ、fopenでそのままutf8渡して(文字化けすらしないという意味で)うまくいくのはロケールもutf8のときのみ
と認識しているが。
239デフォルトの名無しさん
2010/07/03(土) 16:01:26 > ・どっちにせよ、fopenでそのままutf8渡して(文字化けすらしないという意味で)うまくいくのはロケールもutf8のときのみ
> と認識しているが。
ロケール間違ったまま使っていることなんてしょっちゅうあるが?
日本語化しないままOS使えるだろ。
文字がちゃんと表示されないだけで
> と認識しているが。
ロケール間違ったまま使っていることなんてしょっちゅうあるが?
日本語化しないままOS使えるだろ。
文字がちゃんと表示されないだけで
240デフォルトの名無しさん
2010/07/03(土) 17:02:38 Linuxのext2,ext3でSJIS,EUC-JP,UTF-8のファイル名混在は時々ある。
LinuxでもCD-ROM,vfat,ntfs,smbfsをマウントできて、その時に文字コードを指定しないと痛い目にあう。
LinuxでもCD-ROM,vfat,ntfs,smbfsをマウントできて、その時に文字コードを指定しないと痛い目にあう。
241デフォルトの名無しさん
2010/07/03(土) 17:47:51242デフォルトの名無しさん
2010/07/03(土) 18:27:39 LANG=Cでもきちんと表示できなかったらだめだって言い切っちゃうの?
243デフォルトの名無しさん
2010/07/03(土) 19:37:56 >>242
それは日本語使えるロケールじゃないだろ。
それは日本語使えるロケールじゃないだろ。
244デフォルトの名無しさん
2010/07/03(土) 19:41:28 つか、例えば仕様書に「ロケールはja_JP.eucjp」って明記してあっても、
utf8で書いてもなんにも問題はないからutf8で書いて、
utf8なら問題なくfopen使えるからutf8でfopen使って、
結果、表示が文字化けしていても、utf8なら問題なく読めるから問題ないって言いきるつもりなのか?
内部的にはutf8使ってもいいけど、必要に応じて変換しないとダメなんじゃないの。
utf8で書いてもなんにも問題はないからutf8で書いて、
utf8なら問題なくfopen使えるからutf8でfopen使って、
結果、表示が文字化けしていても、utf8なら問題なく読めるから問題ないって言いきるつもりなのか?
内部的にはutf8使ってもいいけど、必要に応じて変換しないとダメなんじゃないの。
245デフォルトの名無しさん
2010/07/03(土) 19:44:47246デフォルトの名無しさん
2010/07/03(土) 19:52:48 「日本語が使える」の定義が知りたい。
247デフォルトの名無しさん
2010/07/03(土) 20:34:28248デフォルトの名無しさん
2010/07/03(土) 20:38:42 >>238
>・どっちにせよ、fopenでそのままutf8渡して(文字化けすらしないという意味で)うまくいくのはロケールもutf8のときのみ
>と認識しているが。
それはそうだけど、fopenの機能としてはちゃんと動作するよね。
wchar_tの渡した場合、fopenが正しく機能しない・・・というか渡せない つまりfopenでは動作しない
どちらもうまく動いてないといえるけど、その動かない箇所のレイヤーが違うんだよね。
それを同じ土俵で較べ合ってもしょうがないと思うんだが。
>・どっちにせよ、fopenでそのままutf8渡して(文字化けすらしないという意味で)うまくいくのはロケールもutf8のときのみ
>と認識しているが。
それはそうだけど、fopenの機能としてはちゃんと動作するよね。
wchar_tの渡した場合、fopenが正しく機能しない・・・というか渡せない つまりfopenでは動作しない
どちらもうまく動いてないといえるけど、その動かない箇所のレイヤーが違うんだよね。
それを同じ土俵で較べ合ってもしょうがないと思うんだが。
249デフォルトの名無しさん
2010/07/03(土) 20:52:48250デフォルトの名無しさん
2010/07/03(土) 20:59:31 > 2. wchar_tでもcharでも意図した通りの結果にしたければ、一旦ロケールに合わせて変換しないといけないという点で同じ
意図したとおりの結果にするには表示するときにデータを整えれば良いだけの話。
それはfopenには関係ない話。
意図したとおりの結果にするには表示するときにデータを整えれば良いだけの話。
それはfopenには関係ない話。
251デフォルトの名無しさん
2010/07/03(土) 21:01:10 >>247
> ロケールがEUC-JPなのにファイルをUTF8で書き込むのは正常動作って言えるのか?
普通にロケールがEUC-JPだけど、
UTF-8のファイルを読み書きしたり
データベースがUTF-8だったりするけど?
何を言いたいのかさっぱりわからん。
> ロケールがEUC-JPなのにファイルをUTF8で書き込むのは正常動作って言えるのか?
普通にロケールがEUC-JPだけど、
UTF-8のファイルを読み書きしたり
データベースがUTF-8だったりするけど?
何を言いたいのかさっぱりわからん。
252デフォルトの名無しさん
2010/07/03(土) 21:03:28 fopen(3)はNULLを返さなければ、open(2)は-1を返さなければ正常。
253デフォルトの名無しさん
2010/07/03(土) 21:26:40 内部的にはutf8使う香具師なんているのか
254デフォルトの名無しさん
2010/07/03(土) 21:28:50 なぜ内部にこだわる?
255デフォルトの名無しさん
2010/07/03(土) 21:29:09256デフォルトの名無しさん
2010/07/03(土) 21:36:31 GTKは糞
257デフォルトの名無しさん
2010/07/03(土) 21:47:40 wchar_tが2バイト4バイト、エンディアンの違いを考えると、
gtkの内部utf-8はマルチプラットフォームって意味では合理的だと思うが。
gtkの内部utf-8はマルチプラットフォームって意味では合理的だと思うが。
258デフォルトの名無しさん
2010/07/03(土) 22:45:00 >>249
>1. 意図した通りの結果にならないのなら、どこで失敗しても五十歩百歩
結果で見ればそうだけど、ここはプログラム板。
システムで採用されているロケールの文字を使う限り文字化けはしないわけでしょ。
ASCIIでもShift_JISでもUTF-8でも。
それらに対してprintfはそのまんま使える汎用性がある。
wchar_tの場合は、そこまで汎用性が持たせられない。というかそこまで汎用的に
使える標準関数が整備されていない。
その違いによる(プラットフォーム間の移植などで)発生するコストをどう捉えるかの
問題じゃないの?
>1. 意図した通りの結果にならないのなら、どこで失敗しても五十歩百歩
結果で見ればそうだけど、ここはプログラム板。
システムで採用されているロケールの文字を使う限り文字化けはしないわけでしょ。
ASCIIでもShift_JISでもUTF-8でも。
それらに対してprintfはそのまんま使える汎用性がある。
wchar_tの場合は、そこまで汎用性が持たせられない。というかそこまで汎用的に
使える標準関数が整備されていない。
その違いによる(プラットフォーム間の移植などで)発生するコストをどう捉えるかの
問題じゃないの?
259デフォルトの名無しさん
2010/07/03(土) 23:17:42 ばかっ。
wchar_tとか不用意に持ち出すと今度はCSI vs UCS Normalizationで不毛な戦火の拡大が……
wchar_tとか不用意に持ち出すと今度はCSI vs UCS Normalizationで不毛な戦火の拡大が……
260デフォルトの名無しさん
2010/07/03(土) 23:33:30 >>250
eucjpロケールの環境で、ファイル名も全部eucjpで保存されてるのに、どっかの誰かがお構いなしにutf8で書いて文字化けしたら、
その人のためにわざわざlsをeucjpとutf8混在しててもちゃんと使えるように書き換えろって言うの?
> 結果で見ればそうだけど、ここはプログラム板。
関係がない。どこの板でも、表示上文字化けするかしないかは重要な基準。
eucjpロケールの環境で、ファイル名も全部eucjpで保存されてるのに、どっかの誰かがお構いなしにutf8で書いて文字化けしたら、
その人のためにわざわざlsをeucjpとutf8混在しててもちゃんと使えるように書き換えろって言うの?
> 結果で見ればそうだけど、ここはプログラム板。
関係がない。どこの板でも、表示上文字化けするかしないかは重要な基準。
261247
2010/07/03(土) 23:36:12262デフォルトの名無しさん
2010/07/03(土) 23:37:59263デフォルトの名無しさん
2010/07/03(土) 23:38:59264デフォルトの名無しさん
2010/07/03(土) 23:41:19265デフォルトの名無しさん
2010/07/03(土) 23:42:31 意図した通りってなんだよ。
ファイル名が「テスト」だとしてEUC-JPで書き込んだ場合と
UTF-8で書き込んだ場合、文字コードが違うのだから
それをあらわすバイナリ列も違う。
だから違うファイル名として扱うのが意図した動作だが?
逆に言えば、fopenはバイナリ列しか見ておらず
それがEUC-JPかUTF-8なのかは気にしていない。
わざわざ文字コードを変換する機能を入れるのが意図した動作だと?
ファイル名が「テスト」だとしてEUC-JPで書き込んだ場合と
UTF-8で書き込んだ場合、文字コードが違うのだから
それをあらわすバイナリ列も違う。
だから違うファイル名として扱うのが意図した動作だが?
逆に言えば、fopenはバイナリ列しか見ておらず
それがEUC-JPかUTF-8なのかは気にしていない。
わざわざ文字コードを変換する機能を入れるのが意図した動作だと?
266デフォルトの名無しさん
2010/07/03(土) 23:46:45 >>265
そしたら、君は何のためにファイル名に非ASCII文字を使うの?
そしたら、君は何のためにファイル名に非ASCII文字を使うの?
267デフォルトの名無しさん
2010/07/03(土) 23:50:03 酷い流れだ。もう結論これでいい?
表示上文字化けしないようにファイル作りたかったら、文字コード変換しろ。
表示上文字化けしてもバイナリ列が保存されていればどうでもいいなら、utf8使っても構わん。
表示上文字化けしないようにファイル作りたかったら、文字コード変換しろ。
表示上文字化けしてもバイナリ列が保存されていればどうでもいいなら、utf8使っても構わん。
268デフォルトの名無しさん
2010/07/03(土) 23:52:27269デフォルトの名無しさん
2010/07/03(土) 23:55:05 >>268
何使ってもいいけど、そんなキーボードで入力しにくいファイル名使って何がしたいの?
何使ってもいいけど、そんなキーボードで入力しにくいファイル名使って何がしたいの?
270デフォルトの名無しさん
2010/07/03(土) 23:55:48 >>268
じゃあ、Windowsじゃutf8でfopenは残念なことになるって思っていい?
じゃあ、Windowsじゃutf8でfopenは残念なことになるって思っていい?
271デフォルトの名無しさん
2010/07/04(日) 00:05:25 >>270
cygwin
cygwin
272デフォルトの名無しさん
2010/07/04(日) 00:12:23 >>269
確かにウムラウトとか入力しずらいね。
確かにウムラウトとか入力しずらいね。
273デフォルトの名無しさん
2010/07/04(日) 00:17:36 >>270
はい。残念なことになっています。
fopenはワイド文字を扱う場合は、_wfopenを使うようにと
一時期は使えない関数とされ、今は一応使えるようになりましたが、
標準を満たしていない独自の引数をとるようになりました。
もはや互換性の無い別物です。
はい。残念なことになっています。
fopenはワイド文字を扱う場合は、_wfopenを使うようにと
一時期は使えない関数とされ、今は一応使えるようになりましたが、
標準を満たしていない独自の引数をとるようになりました。
もはや互換性の無い別物です。
274デフォルトの名無しさん
2010/07/04(日) 00:33:55 >>272
うん。表示に拘らないのなら、半角英数だけで事足りる。ドットくらいは使うかもしれんが。
実際、人が読む必要がないキャッシュファイルやら一時ファイルはそういう風な名付け方になってることが多い気がする。
うん。表示に拘らないのなら、半角英数だけで事足りる。ドットくらいは使うかもしれんが。
実際、人が読む必要がないキャッシュファイルやら一時ファイルはそういう風な名付け方になってることが多い気がする。
275デフォルトの名無しさん
2010/07/04(日) 00:34:16 WindowsでfopenでUNICODE文字列のファイル名って開けるのか?
276デフォルトの名無しさん
2010/07/04(日) 00:36:42 http://www.game-create.com/archives/320
>
> よく使う標準関数の UNICODE 対応表を作ってみました。
>
> Windows では UNICODE 対応時と UNICODE 未対応時で
> 呼び出す関数を振り分ける必要がありますが、 _t で始まる
> 標準関数を使っておくことで、コンパイル時に自動的に関数を振り分けることができます。
あー、これは残念だw
>
> よく使う標準関数の UNICODE 対応表を作ってみました。
>
> Windows では UNICODE 対応時と UNICODE 未対応時で
> 呼び出す関数を振り分ける必要がありますが、 _t で始まる
> 標準関数を使っておくことで、コンパイル時に自動的に関数を振り分けることができます。
あー、これは残念だw
277デフォルトの名無しさん
2010/07/04(日) 00:41:32278デフォルトの名無しさん
2010/07/04(日) 00:52:11 >>275
言葉自体が曖昧。
まず、Windowsは内部ではファイル名をutf-16で管理してる。
そして、fopenは実装依存。とりあえずVC++のfopenで、日本語ロケールでの使用を想定する。
つまりfopenはcp932(sjisのMS拡張と思ってよし)でエンコードされたchar*をとって、内部でutf-16に変換してる。
そういう意味で、全ファイル名がUNICODE文字列であって、fopenではcp932を経由してUNICODE文字列のファイル名を開ける、と言える。
あるいは、cp932入れるべきところに強引にUNICODE文字列をねじこんで、
それをWindowsが内部でcp932のつもりでutf-16に変換したもの、という意味なら。
まず、それがファイル名として妥当なものになるのか(つまり、そんなファイル作れない。ないものは読めない)というのがひとつ。
次に、UNICODE文字列とはutf8か16か32か(あるいは7か...)。
16,32ならNULを含むことになって作れないだろうなぁ。
8なら、sjisのバックスラッシュ問題にコンパイラが対応してるか、ユーザが小細工してるか。
それによって別の文字になるので調整しないといけないが、うまくすれば読める。
言葉自体が曖昧。
まず、Windowsは内部ではファイル名をutf-16で管理してる。
そして、fopenは実装依存。とりあえずVC++のfopenで、日本語ロケールでの使用を想定する。
つまりfopenはcp932(sjisのMS拡張と思ってよし)でエンコードされたchar*をとって、内部でutf-16に変換してる。
そういう意味で、全ファイル名がUNICODE文字列であって、fopenではcp932を経由してUNICODE文字列のファイル名を開ける、と言える。
あるいは、cp932入れるべきところに強引にUNICODE文字列をねじこんで、
それをWindowsが内部でcp932のつもりでutf-16に変換したもの、という意味なら。
まず、それがファイル名として妥当なものになるのか(つまり、そんなファイル作れない。ないものは読めない)というのがひとつ。
次に、UNICODE文字列とはutf8か16か32か(あるいは7か...)。
16,32ならNULを含むことになって作れないだろうなぁ。
8なら、sjisのバックスラッシュ問題にコンパイラが対応してるか、ユーザが小細工してるか。
それによって別の文字になるので調整しないといけないが、うまくすれば読める。
279デフォルトの名無しさん
2010/07/04(日) 00:52:15 >>270
CP_UTF8ってのがあるよ。
CP_UTF8ってのがあるよ。
280デフォルトの名無しさん
2010/07/04(日) 01:02:09281デフォルトの名無しさん
2010/07/04(日) 01:09:25 WindowsではfopenにASCII非互換のSJISなどを
認めてしまったため、ASCII互換のものならなんでも受け付けられる
なんて変更は出来なかった。
そのためUNICODEに対応するには、fopenではない
別の関数を使うしかない。それが_wfopen(MS独自関数)ただし
これはUNICODE(UTF-16)限定のためWin9xでは動かない。
そのために_tfopenというマクロが作られた。これを使っていると
define定数でfopen、_wfopenどちらを使うか自動的に変更できる。
これは関数だけではなく、文字列も一緒で、L”文字列"なんて書き方をすると
自動的に変換してくれるがなんか_Tマクロとか_TEXTマクロとかいろいろあって
誰か、きれいにまとめて書いてくれ。
めちゃくちゃすぎてわからん。あぁ、fopenだけでUTF-8で
もEUC-JPにもなんにでも対応できるLinux楽だよ。
認めてしまったため、ASCII互換のものならなんでも受け付けられる
なんて変更は出来なかった。
そのためUNICODEに対応するには、fopenではない
別の関数を使うしかない。それが_wfopen(MS独自関数)ただし
これはUNICODE(UTF-16)限定のためWin9xでは動かない。
そのために_tfopenというマクロが作られた。これを使っていると
define定数でfopen、_wfopenどちらを使うか自動的に変更できる。
これは関数だけではなく、文字列も一緒で、L”文字列"なんて書き方をすると
自動的に変換してくれるがなんか_Tマクロとか_TEXTマクロとかいろいろあって
誰か、きれいにまとめて書いてくれ。
めちゃくちゃすぎてわからん。あぁ、fopenだけでUTF-8で
もEUC-JPにもなんにでも対応できるLinux楽だよ。
282デフォルトの名無しさん
2010/07/04(日) 01:54:02283デフォルトの名無しさん
2010/07/04(日) 07:56:21 _Tマクロとか_TEXTマクロとかWindowsのマクロの種類は何故複数あるのでしょうか?
284デフォルトの名無しさん
2010/07/04(日) 12:58:15 TEXT("hoge") もあったな
285デフォルトの名無しさん
2010/07/04(日) 13:23:16 文字コード処理の種類はCSI方式とUCS normalization方式と何故複数あるのでしょうか?
286デフォルトの名無しさん
2010/07/04(日) 14:37:25 それは対になるものなのか?
287デフォルトの名無しさん
2010/07/06(火) 12:42:48 文字コードのスレは何故複数あるのでしょうか?
288デフォルトの名無しさん
2010/07/06(火) 14:36:35 あっちがうさげならばこっちはよそ?
289デフォルトの名無しさん
2010/07/08(木) 13:59:28 インテリジェント昆布
略して iconv
略して iconv
290デフォルトの名無しさん
2010/07/12(月) 21:33:35 文字コード総合スレ part6
http://pc12.2ch.net/test/read.cgi/tech/1278923059/
http://pc12.2ch.net/test/read.cgi/tech/1278923059/
291デフォルトの名無しさん
2010/07/14(水) 01:22:05 文字の種類は何故複数あるのでしょうか?
292デフォルトの名無しさん
2010/07/14(水) 01:50:03 ローマ字では日本語を読みにくいからじゃないかしら
293デフォルトの名無しさん
2010/07/14(水) 04:59:56 世界は広いからだよ
294デフォルトの名無しさん
2010/07/14(水) 05:46:37 バベルの塔を作り始めたからです
295デフォルトの名無しさん
2010/07/15(木) 20:19:48 肉フライ
略してnkf
略してnkf
296デフォルトの名無しさん
2010/07/16(金) 01:00:45 >>295
正式にはnettowa-ku kanji firuta-の略だっけ。
正式にはnettowa-ku kanji firuta-の略だっけ。
297デフォルトの名無しさん
2010/07/16(金) 02:24:52 nurupo
kimuchi-E
fack
kimuchi-E
fack
298デフォルトの名無しさん
2010/07/16(金) 16:06:16 >>296
nkf Network Kanji Filter
http://sourceforge.jp/projects/nkf/
まさかのgit。
http://git.sourceforge.jp/view?p=nkf/nkf.git
nkf Network Kanji Filter
http://sourceforge.jp/projects/nkf/
まさかのgit。
http://git.sourceforge.jp/view?p=nkf/nkf.git
299デフォルトの名無しさん
2010/07/30(金) 16:49:09 ワロタ 本になっていたのね。
斎藤秀紀「構造化4バイトコードによる多言語漢字の符号化」
http://www.amazon.co.jp/gp/product/4898273009/
これでしょ。
http://www.horagai.com/www/moji/int/saito.htm
斎藤秀紀「構造化4バイトコードによる多言語漢字の符号化」
http://www.amazon.co.jp/gp/product/4898273009/
これでしょ。
http://www.horagai.com/www/moji/int/saito.htm
300デフォルトの名無しさん
2010/07/30(金) 20:17:12 >>299
ここも隔離スレっぽいよ。
ここも隔離スレっぽいよ。
301デフォルトの名無しさん
2010/08/05(木) 08:30:33 コードの種類は何故複数あるのでしょうか?
ストレートとクロスの見分けが付きません。
ストレートとクロスの見分けが付きません。
302デフォルトの名無しさん
2010/08/05(木) 09:06:26 ソースといえばブルドック?おたふく?
あなたはどちら?
あなたはどちら?
303デフォルトの名無しさん
2010/08/05(木) 09:06:55 買ったらすぐにシール貼っとけよ
304デフォルトの名無しさん
2010/08/05(木) 20:29:23 >>301
両端のコネクタを並べてみて、色が同じ順ならストレート、違う順ならクロス。
両端のコネクタを並べてみて、色が同じ順ならストレート、違う順ならクロス。
305デフォルトの名無しさん
2010/08/10(火) 12:56:48 >>302
イカリソース
イカリソース
306デフォルトの名無しさん
2010/09/12(日) 08:49:08 >>302
カゴメ
カゴメ
307デフォルトの名無しさん
2010/09/12(日) 11:38:54 >>302
中部地方はコーミソースに決まってんだよ。ブルドッグ何それ。
中部地方はコーミソースに決まってんだよ。ブルドッグ何それ。
308デフォルトの名無しさん
2010/09/12(日) 11:49:50 俺のホワイトソースでも飲んでろ
馬鹿どもめ
馬鹿どもめ
309デフォルトの名無しさん
2010/09/13(月) 07:34:49 ソースの種類は何故複数あるのでしょうか?
ソースを買ってくるように頼まれてソイソースを買ってきたら怒られました。
ソースを買ってくるように頼まれてソイソースを買ってきたら怒られました。
310デフォルトの名無しさん
2010/09/13(月) 16:04:42 そりゃ醤油はソースとは認められないからな。
次はちゃんとソースを買ってくるんだぞ。
次はちゃんとソースを買ってくるんだぞ。
311デフォルトの名無しさん
2010/09/13(月) 16:38:52312デフォルトの名無しさん
2010/09/13(月) 22:48:14 UNICODEがSDK用で_UNICODEがCRT用だっけ
313デフォルトの名無しさん
2010/09/13(月) 23:10:52 L()はどれだっけ
314デフォルトの名無しさん
2010/09/13(月) 23:24:28 そんなマクロあったっけ
315デフォルトの名無しさん
2010/09/14(火) 01:03:17 L""ならリテラルじゃね
316デフォルトの名無しさん
2010/09/14(火) 07:45:04 それは言語機能でMSは関係ないな
もっともMS以外ではワイド文字がUTF-16とは限らないけど
もっともMS以外ではワイド文字がUTF-16とは限らないけど
317デフォルトの名無しさん
2010/09/25(土) 17:10:40 もっとも、 <windows.h>の中のどこかのヘッダで以下のような旨の記述があり、
「_UNICODEとUNICODEのどちらか一方は定義してあるけど、もう片方は定義されていない」
という状況を排除しているので、_TとTEXTを混在させても問題ない。
#ifdef UNICODE
#ifndef _UNICODE
#define _UNICODE
#endif
#endif
#ifdef _UNICODE
#ifndef UNICODE
#define UNICODE
#endif
#endif
「_UNICODEとUNICODEのどちらか一方は定義してあるけど、もう片方は定義されていない」
という状況を排除しているので、_TとTEXTを混在させても問題ない。
#ifdef UNICODE
#ifndef _UNICODE
#define _UNICODE
#endif
#endif
#ifdef _UNICODE
#ifndef UNICODE
#define UNICODE
#endif
#endif
318デフォルトの名無しさん
2010/10/09(土) 19:23:25 >>302
どろソース
どろソース
319デフォルトの名無しさん
2011/01/16(日) 14:27:02 そーすね
320デフォルトの名無しさん
2011/04/15(金) 13:28:40.29 >>302
オリバー
オリバー
321デフォルトの名無しさん
2011/04/15(金) 15:28:09.44 >>302
イカリが多かったがカープも使う
イカリが多かったがカープも使う
322デフォルトの名無しさん
2011/04/15(金) 21:32:56.00 CP932の完成度は異常。
323デフォルトの名無しさん
2011/04/15(金) 22:39:01.54 同じ文字でコードが何種類もあるものが完全とな。
324デフォルトの名無しさん
2011/04/15(金) 22:53:48.86 スレ全体検索したけど完全なんて文字は>>323しかない件
325森& ◆vjMeDi2lEM
2011/06/24(金) 00:06:15.57 森鴎外の「鴎」は正しくは「鷗」である。
草なぎ剛
草g剛
北朝鮮に文字コードは割り振られているのか?
マイクロソフトは、南朝鮮の町工場に北の象形文字をOSに実装してくれと
懇願されたが拒否したらしいが。直接北から要求しなかった。
北は南と文字が異なっているのか。
unicodeに北文字あったか?存在するなら規格票、文献を提示してくれ。
草なぎ剛
草g剛
北朝鮮に文字コードは割り振られているのか?
マイクロソフトは、南朝鮮の町工場に北の象形文字をOSに実装してくれと
懇願されたが拒否したらしいが。直接北から要求しなかった。
北は南と文字が異なっているのか。
unicodeに北文字あったか?存在するなら規格票、文献を提示してくれ。
326uy ◆hi.ht/Isu2
2011/06/29(水) 06:19:43.43 >マイクロソフトは、南朝鮮の町工場に北の象形文字をOSに実装してくれと
>懇願されたが拒否したらしいが。直接北から要求しなかった。
>北は南と文字が異なっているのか。
日本語勉強しろよゴミカスが
マジでゴミなんだな
>懇願されたが拒否したらしいが。直接北から要求しなかった。
>北は南と文字が異なっているのか。
日本語勉強しろよゴミカスが
マジでゴミなんだな
327デフォルトの名無しさん
2011/10/25(火) 22:25:08.62 ∩___∩
| ノ ヽ
/ ● ● |
| ( _●_) ミ
彡、 丶 ノ 、`
/ __/ ⌒`\/⌒/
(___) . / ( )
| ⌒`\//⌒
入_ へ \_ へ \_
@三三三三 (____)三(____)三三)
| ノ ヽ
/ ● ● |
| ( _●_) ミ
彡、 丶 ノ 、`
/ __/ ⌒`\/⌒/
(___) . / ( )
| ⌒`\//⌒
入_ へ \_ へ \_
@三三三三 (____)三(____)三三)
328デフォルトの名無しさん
2011/10/25(火) 22:39:19.15329デフォルトの名無しさん
2011/10/25(火) 23:00:40.79 斎藤、斉藤、齋藤、齊藤
おまえら少しは反省しろ
おまえら少しは反省しろ
330デフォルトの名無しさん
2011/10/26(水) 00:03:12.66 「そ」を1筆で書くのか2筆で書くのかくらいの違いはある
331デフォルトの名無しさん
2011/10/26(水) 14:40:03.49 >>329
何を?
何を?
332デフォルトの名無しさん
2011/10/27(木) 04:55:47.65 山崎、山嵜、山ア
やまざき? やまさき?
やまざき? やまさき?
333デフォルトの名無しさん
2011/10/30(日) 10:23:28.18 ∧_∧
ピュー ( ^^ ) <これからも山崎を応援して下さいね(^^)。
=〔~∪ ̄ ̄〕
= ◎――◎ 山崎渉
ピュー ( ^^ ) <これからも山崎を応援して下さいね(^^)。
=〔~∪ ̄ ̄〕
= ◎――◎ 山崎渉
334デフォルトの名無しさん
2011/12/13(火) 16:57:33.87 __∧_∧_
|( ^^ )| <寝るぽ(^^)
|\⌒⌒⌒\
\ |⌒⌒⌒~| 山崎渉
|( ^^ )| <寝るぽ(^^)
|\⌒⌒⌒\
\ |⌒⌒⌒~| 山崎渉
335デフォルトの名無しさん
2011/12/13(火) 18:21:01.09 >>1
一番単純な答えは、JISの出来が悪かったから、というものだと思う。
一番単純な答えは、JISの出来が悪かったから、というものだと思う。
336デフォルトの名無しさん
2011/12/14(水) 22:02:31.30 日本語の文字コードがいくつもある理由
http://qpon.at.webry.info/201112/article_14.html
http://qpon.at.webry.info/201112/article_14.html
337デフォルトの名無しさん
2012/01/04(水) 00:38:14.32 IVSというかUnicodeに見る日本政府のダメな感じ
ttp://wontfix.blogspot.com/2011/05/ivsunicode.html
ttp://wontfix.blogspot.com/2011/05/ivsunicode.html
338デフォルトの名無しさん
2012/01/04(水) 05:48:12.54 この人の文字コードに対する理解力がダメな感じ
339デフォルトの名無しさん
2012/01/04(水) 11:38:46.62 IVSは同一字形でも包摂しない、という原則じゃなかったっけ?というか同一字形かどうか
わからないから、だったかも。そもそもIVSで区別されているのはグリフであって文字ではないわけで。
わからないから、だったかも。そもそもIVSで区別されているのはグリフであって文字ではないわけで。
340デフォルトの名無しさん
2012/07/25(水) 17:25:52.49341デフォルトの名無しさん
2012/08/22(水) 23:46:05.05 >>322
・文字集合はIBMホストコードに合わせてあって
・符号の順序はJIS順になっていて
・1978年版、1983年版、1990年版をそつなくこなし
・JISの水準外の文字はJISの区点内にも区点外のどちらにもある
とどめに
・半角カタカナと一緒に使える
ってことだな
・文字集合はIBMホストコードに合わせてあって
・符号の順序はJIS順になっていて
・1978年版、1983年版、1990年版をそつなくこなし
・JISの水準外の文字はJISの区点内にも区点外のどちらにもある
とどめに
・半角カタカナと一緒に使える
ってことだな
342デフォルトの名無しさん
2012/10/07(日) 12:14:01.29343デフォルトの名無しさん
2012/11/29(木) 11:16:09.54 空揚げ
344デフォルトの名無しさん
2012/11/30(金) 12:55:47.17 そんなこんなで本スレが落ちてしまったわけだが
345デフォルトの名無しさん
2012/11/30(金) 13:22:07.85346デフォルトの名無しさん
2012/12/01(土) 00:25:34.28 >>345
乙
乙
348デフォルトの名無しさん
2014/08/29(金) 20:54:32.09ID:IGXHweHY ★2ch勢いランキングサイトリスト★
☆ +ニュース板
・ 2NN
・ 2chTimes
☆ +ニュース板新着
・ 2NN新着
・ Headline BBY
・ Unker
☆ ニュース板他
・ Desktop2ch
・ 記者別一覧
・ スレッドランキング
☆ 全板
・ 全板縦断勢いランキング
・ 2勢
・ READ2CH
・ i-ikioi
※ 要サイト名検索
☆ +ニュース板
・ 2NN
・ 2chTimes
☆ +ニュース板新着
・ 2NN新着
・ Headline BBY
・ Unker
☆ ニュース板他
・ Desktop2ch
・ 記者別一覧
・ スレッドランキング
☆ 全板
・ 全板縦断勢いランキング
・ 2勢
・ READ2CH
・ i-ikioi
※ 要サイト名検索
349デフォルトの名無しさん
2014/08/29(金) 21:47:32.66ID:q83myYC6350デフォルトの名無しさん
2014/11/19(水) 16:18:55.03ID:JZ2oYyd9 ㄘんㄘんㄟ⁰ㄋㄟ⁰ㄋㄜㄝㄋ
351デフォルトの名無しさん
2014/11/19(水) 18:54:03.45ID:g6yRyndh だいたい1バイトのアスキーコードを、2バイトにして日本語を
表示できるようにしたり、それをさらに、3バイトとか4バイトに
増やすとか、チマチマそんなことしてきたから、いろんな文字コード
作られてワケワカメになったんだろ。
もうこの際、全ての言語や記号など全部表せるように、
文字コードは1文字16バイトくらいにして、
全ての文書にこのコードを使う事を強制すればいい。
16バイトもあれば、困ることは無いだろう。
表示できるようにしたり、それをさらに、3バイトとか4バイトに
増やすとか、チマチマそんなことしてきたから、いろんな文字コード
作られてワケワカメになったんだろ。
もうこの際、全ての言語や記号など全部表せるように、
文字コードは1文字16バイトくらいにして、
全ての文書にこのコードを使う事を強制すればいい。
16バイトもあれば、困ることは無いだろう。
352デフォルトの名無しさん
2014/11/19(水) 19:53:15.84ID:0+0ozXC3 ㄘωㄘωㄟ⁰ㄋㄟ⁰ㄋㄜㄝㄋ
353デフォルトの名無しさん
2014/11/20(木) 00:22:16.17ID:8wQd6afC >>351
これ、釣りなのかな。
これ、釣りなのかな。
354デフォルトの名無しさん
2014/11/20(木) 10:27:23.90ID:EmAWw9wC (。☉౪ ⊙。)
(。◕ฺˇε ˇ◕ฺ。)
(。◕ิ_◕ิ。)
(。◕ˇдˇ◕。)
(。◕ˇ_ˇ◕。)
(。╹ω╹。)
(。╹ω╹。)
(。≖ิ‿≖ิ);
(。•́︿•̀。)
(。ó .̫ ò。)
(。´ސު`。)
色々あるんやね
(。◕ฺˇε ˇ◕ฺ。)
(。◕ิ_◕ิ。)
(。◕ˇдˇ◕。)
(。◕ˇ_ˇ◕。)
(。╹ω╹。)
(。╹ω╹。)
(。≖ิ‿≖ิ);
(。•́︿•̀。)
(。ó .̫ ò。)
(。´ސު`。)
色々あるんやね
355デフォルトの名無しさん
2014/12/05(金) 00:46:33.27ID:ddy5/aJe >>351
データ容量が無駄
データ容量が無駄
356デフォルトの名無しさん
2014/12/05(金) 10:32:24.04ID:NyP973bT 将来ジャミング暗号化に使われそうなアルゴリズムだな
357デフォルトの名無しさん
2016/03/29(火) 09:28:41.71ID:/c8bAcK4 サッカーブッシュ日本代表日程ぷあたん(しゅっちょうまいくろ教育長交代)春文執行40代売上差額シュガーチョコ
https://www.youtube.com/watch?v=NDq1QoJY0nY宇ドナルドアナリストパワーストーンコーチングとしまえん
サッカーブッシュ日本代表日程古本屋よしたけしゅっちょうちょこしゅがー
ディーラー税務署天才開発者死亡詰みヨミドクターマイクロサービス不足
サッカーブッシュ日本代表日程ぷあたんシフト光金さかい強制バイト人権侵害問題
春分資源執行ニューヨーク低原価ぼったステーキソルトレイク福岡横浜新橋奴隷課金パチシフト強制バイト問題新潟米センター生残
コスメ24チャリティー隠れ40代生活保護プレイボーイバイトレードいたりあん接待問題
マスコミKARDローンケーオーサービス不足婚活パーティー寄付金執行原発ビジネス
FBIチャイニーズタイホテル売上事務所ガチャ決算ガチャキャンペーン(販売報道陣過激派組織向携帯最新情報提供終了
校長発言細心注意ノートン産廃エラー(著作権クレーム中国反応融資高額教育費)(中国捕鯨団体40代社員サッカーコメント
高額入学金ヤフウ新橋大学ヤフウ新橋理事長FX経費 おじや50代資産ガリバズフィード40代エリート
https://www.youtube.com/watch?v=NDq1QoJY0nY宇ドナルドアナリストパワーストーンコーチングとしまえん
サッカーブッシュ日本代表日程古本屋よしたけしゅっちょうちょこしゅがー
ディーラー税務署天才開発者死亡詰みヨミドクターマイクロサービス不足
サッカーブッシュ日本代表日程ぷあたんシフト光金さかい強制バイト人権侵害問題
春分資源執行ニューヨーク低原価ぼったステーキソルトレイク福岡横浜新橋奴隷課金パチシフト強制バイト問題新潟米センター生残
コスメ24チャリティー隠れ40代生活保護プレイボーイバイトレードいたりあん接待問題
マスコミKARDローンケーオーサービス不足婚活パーティー寄付金執行原発ビジネス
FBIチャイニーズタイホテル売上事務所ガチャ決算ガチャキャンペーン(販売報道陣過激派組織向携帯最新情報提供終了
校長発言細心注意ノートン産廃エラー(著作権クレーム中国反応融資高額教育費)(中国捕鯨団体40代社員サッカーコメント
高額入学金ヤフウ新橋大学ヤフウ新橋理事長FX経費 おじや50代資産ガリバズフィード40代エリート
358デフォルトの名無しさん
2016/08/29(月) 19:33:30.09ID:sf9PpAXO 1978年
JIS C 6226が成立。
1981年
当用漢字表が廃止されて常用漢字表が告示される。
それまでの1850字に95字が追加され1945字になる。
その95字が全てJIS第一水準。一体何があったのか。
JIS C 6226が成立。
1981年
当用漢字表が廃止されて常用漢字表が告示される。
それまでの1850字に95字が追加され1945字になる。
その95字が全てJIS第一水準。一体何があったのか。
359358
2016/08/29(月) 19:39:42.82ID:sf9PpAXO ここで勝手に憶測。
1.
78JISが成立した時点で、文部省が通産省に圧力をかけて、将来の常用漢字に
入れたくない字を無理やり第2水準に追いやった。
2.
常用漢字表を作る際に、第2水準の字を加える事を第2水準であるという理由で拒否。
何としてでもなるべく字を増やしたくないという口実にJISが利用された。
1.
78JISが成立した時点で、文部省が通産省に圧力をかけて、将来の常用漢字に
入れたくない字を無理やり第2水準に追いやった。
2.
常用漢字表を作る際に、第2水準の字を加える事を第2水準であるという理由で拒否。
何としてでもなるべく字を増やしたくないという口実にJISが利用された。
360358
2016/08/29(月) 21:29:18.35ID:sf9PpAXO 2010年11月30日
常用漢字表改定
196字追加、5字削除、2136字となる。
1881年とは時代が違う社会が違う、という事か、JIS第2水準の字も多く追加された。
第3、第4水準の字すら入っている。
もしJISの83改定がなければ殆ど第2水準で済んでいた。
常用漢字表改定
196字追加、5字削除、2136字となる。
1881年とは時代が違う社会が違う、という事か、JIS第2水準の字も多く追加された。
第3、第4水準の字すら入っている。
もしJISの83改定がなければ殆ど第2水準で済んでいた。
361358
2016/09/02(金) 16:08:22.98ID:YK1p9+vc 文部科学省の常用漢字表にはJISコードが記載されていない。まさに縦割り行政だ。
常用漢字の通し番号も無い。
一般的にはこれで困る人はいない。だがそれでいいのか。
法律の如き、あるいは数学の如き厳密さを求めると、常用漢字表の字とJIS規格票の字が
同じ字であるとは見なせない。
民間の漢和辞典にはJISコードの記載があるが、その厳密な根拠はどこにも無いという事になる。
国が率先して論理的思考を実践してほしい。
常用漢字の通し番号も無い。
一般的にはこれで困る人はいない。だがそれでいいのか。
法律の如き、あるいは数学の如き厳密さを求めると、常用漢字表の字とJIS規格票の字が
同じ字であるとは見なせない。
民間の漢和辞典にはJISコードの記載があるが、その厳密な根拠はどこにも無いという事になる。
国が率先して論理的思考を実践してほしい。
362デフォルトの名無しさん
2016/12/07(水) 00:05:59.62ID:34HNZ6/r 意味もなく Age。
JIS漢字にしても、まるぶん漢字にしても、日常生活に結構影響が出ている。
同級生のパパ、議員やっていたんだが、該当する漢字がなくて、全部当て字で済ましている。
姓の歴史を見ればわかる通り、明治の初めに姓が法制化された。
漢字が書けないことが多くて、近所(?、1泊で往復できるぐらいの距離)のエライ坊さんのところに行って漢字を教えてもらった。
これが、同音の文字を崩して、別の意味を持たせた。
地名も同様なものがある。
社名も、鉄を使わない(金を失う)ではなく、旧字を使うとロコがある。
Toron コードでは大体そろっていたはずなんだけど、見ていないからわからない。
JIS漢字にしても、まるぶん漢字にしても、日常生活に結構影響が出ている。
同級生のパパ、議員やっていたんだが、該当する漢字がなくて、全部当て字で済ましている。
姓の歴史を見ればわかる通り、明治の初めに姓が法制化された。
漢字が書けないことが多くて、近所(?、1泊で往復できるぐらいの距離)のエライ坊さんのところに行って漢字を教えてもらった。
これが、同音の文字を崩して、別の意味を持たせた。
地名も同様なものがある。
社名も、鉄を使わない(金を失う)ではなく、旧字を使うとロコがある。
Toron コードでは大体そろっていたはずなんだけど、見ていないからわからない。
363デフォルトの名無しさん
2016/12/08(木) 21:34:23.40ID:5SK5WFdP Toronコード
364デフォルトの名無しさん
2016/12/11(日) 14:59:51.79ID:pm6ghExK365デフォルトの名無しさん
2016/12/24(土) 00:11:12.03ID:tCnPOkaj 漢字コードは浮動小数点数コードにしとけばよかったんだよな
366デフォルトの名無しさん
2016/12/24(土) 06:02:44.63ID:NChqVw6n 現実世界の方言は好き
367デフォルトの名無しさん
2016/12/26(月) 20:12:45.34ID:TRnwbnfO368デフォルトの名無しさん
2017/02/09(木) 16:30:11.04ID:8bYRq8V4 最初5bitから始まった話とかロッキングシフトの話とかからの話から始まると思ったら、ここまで出てこないのは何なの?
369デフォルトの名無しさん
2017/08/29(火) 22:15:11.99ID:MJTdI4fF ローマ字で日本語の長音を表現するのにサーカムフレックスまたはマクロンの付いた
アルファベットが有ると便利。というか必要。
しかしこれが長い間JISに採用されなかった。
ローマ字主義者と反対派の血みどろの戦いが繰り広げられ、ローマ字主義者が
負け続けたのだろうか。
アルファベットが有ると便利。というか必要。
しかしこれが長い間JISに採用されなかった。
ローマ字主義者と反対派の血みどろの戦いが繰り広げられ、ローマ字主義者が
負け続けたのだろうか。
370デフォルトの名無しさん
2018/01/08(月) 11:02:55.15ID:szpKYJOz ユニコードですら絵文字で大混乱してるからな
371デフォルトの名無しさん
2018/01/08(月) 12:10:38.61ID:g3wGVkXu 明らかに文字化けって判るような壊れ方ならまだいいけど
送信側が↑↑↑で送信してるのに
受信側で↓↓↓って表示されてたり
って普通にあるからなー
送信側が↑↑↑で送信してるのに
受信側で↓↓↓って表示されてたり
って普通にあるからなー
372デフォルトの名無しさん
2018/01/08(月) 12:45:25.22ID:hdddIjmR 絵文字の正規表現に対応しているのは、Ruby 2.4 以降だけかも
373デフォルトの名無しさん
2018/01/09(火) 03:13:02.13ID:69Y93T5M うんこ騒動はなぜ起きた?
374デフォルトの名無しさん
2018/01/20(土) 12:34:45.37ID:4AOaXNlF375デフォルトの名無しさん
2018/01/22(月) 23:21:50.19ID:UK/uqEp5376デフォルトの名無しさん
2018/01/24(水) 05:29:19.56ID:PJ1wHVKm >>375
おつん
おつん
377デフォルトの名無しさん
2018/01/28(日) 15:12:12.86ID:Erw8GBm0378デフォルトの名無しさん
2018/05/23(水) 20:36:26.50ID:Au5e7VGg 僕の知り合いの知り合いができたパソコン一台でお金持ちになれるやり方
役に立つかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』
Z1BZ2
役に立つかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』
Z1BZ2
379デフォルトの名無しさん
2018/07/05(木) 01:16:25.52ID:RfoszcD2 9Z7
380デフォルトの名無しさん
2018/11/23(金) 10:17:55.52ID:e4GZHgy/ コードおしえて
https://twitter.com/Takuta/status/1064769978040107008
https://twitter.com/5chan_nel (5ch newer account)
https://twitter.com/Takuta/status/1064769978040107008
https://twitter.com/5chan_nel (5ch newer account)
381デフォルトの名無しさん
2019/03/08(金) 15:02:24.13ID:uMMKH+w1382デフォルトの名無しさん
2019/03/08(金) 15:12:45.64ID:Im37M35h ハローワールド
383デフォルトの名無しさん
2019/04/06(土) 20:46:36.38ID:v8Dss5L/ ディスクやメモリの容量に関してけちけちしなければならない時代ではもはやないから、
UTF32にさっさと統一してしまった方が良い。
UTF32にさっさと統一してしまった方が良い。
384【猫の日】なぜ多い? 春の「猫の交通事故」
2021/02/22(月) 13:23:14.54ID:560/33vK https://asahi.5ch.net/test/read.cgi/newsplus/1613963569/l50
年間30万匹超 猫の交通事故を減らすために出来ることは
2月22日は、猫の日制定委員会が「ニャン・ニャン・ニャン」の語呂合わせから制定した「猫の日」です。猫は屋外で放し飼いされていることもあるほか、野良猫として暮らしている猫もよく見かけます。そのため、猫は比較的交通事故に巻き込まれやすい動物でもあるのです。
年間30万匹超 猫の交通事故を減らすために出来ることは
2月22日は、猫の日制定委員会が「ニャン・ニャン・ニャン」の語呂合わせから制定した「猫の日」です。猫は屋外で放し飼いされていることもあるほか、野良猫として暮らしている猫もよく見かけます。そのため、猫は比較的交通事故に巻き込まれやすい動物でもあるのです。
385デフォルトの名無しさん
2021/12/13(月) 15:55:12.76ID:zEMsblTa サター
386デフォルトの名無しさん
2023/09/25(月) 20:04:52.06ID:+J4Cdjdz ホンマにそれがええんか?
387デフォルトの名無しさん
2024/04/08(月) 00:07:31.00ID:gUGErxP/ キャラクタセットの種類なのか?
文字のコードの数なのか?
文字のコードの数なのか?
388デフォルトの名無しさん
2024/04/08(月) 00:08:00.14ID:gUGErxP/ いまどきキャラクタセットのことを文字コードと呼ぶのは混乱を招くだけ
389デフォルトの名無しさん
2024/04/08(月) 09:16:19.01ID:9TXPQqPK 文字コード廃止しなさーーい。
でもモピロン、Emojiなら🙆 ∵文字コード❌
やっぱり、文字は、手書きは、いいよな。
でもモピロン、Emojiなら🙆 ∵文字コード❌
やっぱり、文字は、手書きは、いいよな。
390デフォルトの名無しさん
2024/04/12(金) 10:52:04.90ID:T6Cc2W5H >>1
主にNECが戦犯
主にNECが戦犯
391デフォルトの名無しさん
2024/04/12(金) 10:55:17.68ID:Aub4//wW ヨーロッパ圏でも字の上に点やら何やら付いてる文字はあるからなぁ
アメリカやイギリスが規格を考えるから問題が出たんだよ
アメリカやイギリスが規格を考えるから問題が出たんだよ
392デフォルトの名無しさん
2024/04/16(火) 00:37:14.97ID:aRJ0OCMo で、何だな、windowsのメモ帳で
「\」をタイプするとモチロン「\」と表示されるけど
書式-フォントを Courier Newにすると
「\」は「\」の半角で表示されるな。
バイナリベースでコードは変わってないのに
フォントを変えると全く別のに変化する ぽぃぞ
だから、文字コードなんて廃止して
全部絵文字とかGIFとかPNGでデザインすりゃいいのに
完全に地球人は樹海にハマったね。┐(´д`)┌ヤレヤレ
「\」をタイプするとモチロン「\」と表示されるけど
書式-フォントを Courier Newにすると
「\」は「\」の半角で表示されるな。
バイナリベースでコードは変わってないのに
フォントを変えると全く別のに変化する ぽぃぞ
だから、文字コードなんて廃止して
全部絵文字とかGIFとかPNGでデザインすりゃいいのに
完全に地球人は樹海にハマったね。┐(´д`)┌ヤレヤレ
393デフォルトの名無しさん
2024/05/14(火) 10:41:35.22ID:MC8X/Cwe 最近のWindowsおかしくないか?
鉤括弧がなんか前の文字に重なってたり
鉤括弧がなんか前の文字に重なってたり
394デフォルトの名無しさん
2024/05/31(金) 18:44:57.82ID:RY14AR3w >>392
それフォントだぞ?
それフォントだぞ?
395デフォルトの名無しさん
2025/02/22(土) 21:58:35.36ID:6S9Jxd1m / ̄ ̄ ̄ ̄ ̄ ̄ ̄ヽ
/ \
/ ヽ
/ 〕
/ ∧ |
〔巛巛《/;::;;\_,,,,.-巛巛巛ヽ |
〕 く.◎ノ:::;;;;;;;;〆;;;::\◎...ゝ__ 〕
/ /;;二::::;;;ゝ::;;;;;;/;;::::~;;~;;;;;;::::ヽ\⌒)
| /::;:::::/;;;;;;;;;;;;;;::;;ヽ;::;;:::;;:::;:::::::::ノ ) /
| ノ:::;;;;:::|:::;;;;::::;;::::::。;;;;;;;;;:;::ヽヽ/ |/──
| |::::;ヽ;;;\;;;;::::ミ:;;:::;;;;;;;;;;::∬:<__ |
/|/:::;;;;;;;;ゞ;;;#:::《;;ソ;;:::;;::;;;《;::::::::;::;:;::〕/
/ /:::::§;;:::;;;::;;::;;ヽ;;_;_;鬱::;;O:::ノ:::;:::::ヽく |
/ ノ::::;;;;;:;;:;;;;ヽ;:/:;::~;;::~::::ヽ;;;く::::;;;:::;:;::;:ヽ
/::::;;;::::::〔ヽヽ;|::::;::::::::::::::::ヾ;::;:::;;:ソ::;;::::/
ヾ::;;ゞ::::;;;~''ソ|:::::;;;;:;::::;;;;ミミ:::::::;;;巛ヾ<〔
~/::;;ヽ;/ヾ〔:::::;;;;::::::;;;:::;ミノ:::::;;;;::::ソ《ゝ;:\
ヽ:;;;;ノ 〉|:::;;:::::;;;::;;;;:;ミ《ミ;;::;;;:;;;;ヽ;;;;;;::::ノ
υ \::::::;;;:::::;∧;::::::∬;::::::)〕::;::/
`ヽ;/~~ ~∪⌒ι/ υ
|:|
||
||
U
/ \
/ ヽ
/ 〕
/ ∧ |
〔巛巛《/;::;;\_,,,,.-巛巛巛ヽ |
〕 く.◎ノ:::;;;;;;;;〆;;;::\◎...ゝ__ 〕
/ /;;二::::;;;ゝ::;;;;;;/;;::::~;;~;;;;;;::::ヽ\⌒)
| /::;:::::/;;;;;;;;;;;;;;::;;ヽ;::;;:::;;:::;:::::::::ノ ) /
| ノ:::;;;;:::|:::;;;;::::;;::::::。;;;;;;;;;:;::ヽヽ/ |/──
| |::::;ヽ;;;\;;;;::::ミ:;;:::;;;;;;;;;;::∬:<__ |
/|/:::;;;;;;;;ゞ;;;#:::《;;ソ;;:::;;::;;;《;::::::::;::;:;::〕/
/ /:::::§;;:::;;;::;;::;;ヽ;;_;_;鬱::;;O:::ノ:::;:::::ヽく |
/ ノ::::;;;;;:;;:;;;;ヽ;:/:;::~;;::~::::ヽ;;;く::::;;;:::;:;::;:ヽ
/::::;;;::::::〔ヽヽ;|::::;::::::::::::::::ヾ;::;:::;;:ソ::;;::::/
ヾ::;;ゞ::::;;;~''ソ|:::::;;;;:;::::;;;;ミミ:::::::;;;巛ヾ<〔
~/::;;ヽ;/ヾ〔:::::;;;;::::::;;;:::;ミノ:::::;;;;::::ソ《ゝ;:\
ヽ:;;;;ノ 〉|:::;;:::::;;;::;;;;:;ミ《ミ;;::;;;:;;;;ヽ;;;;;;::::ノ
υ \::::::;;;:::::;∧;::::::∬;::::::)〕::;::/
`ヽ;/~~ ~∪⌒ι/ υ
|:|
||
||
U
レスを投稿する
ニュース
- 中国国営メディア「沖縄は日本ではない」… ★4 [BFU★]
- 小野田氏、”中国経済への依存“に警戒感 高市首相の国会答弁巡り [煮卵★]
- 【こんなの初めて…】民泊には既にキャンセルも 中国の渡航自粛で [ぐれ★]
- 台湾声明 「台湾は独立した主権国家、中国は台湾を統治したことがなく、中国は口出しする権利ない」 中国が高市首相に抗議で ★7 [お断り★]
- 日本が「世界で最も魅力的な国」1位に!✨「魅力的な都市」では東京が2位 「魅力的な地域」は北海道が7位に [煮卵★]
- 【サッカー】独占入手 最年長JリーガーにW不倫疑惑 『お風呂覗きたいんですが笑』LINE流出も… 慰謝料トラブルを本人に直撃 [冬月記者★]
- 浜田省吾に「チェリーボーイ」って曲あったっけ? [369521721]
- 【高市速報】日本「中国さんお願い首脳会談させて!ねえってば!😭」 [931948549]
- 日経平均、49000円割れ 国賊高市を許すな [402859164]
- とうすこ🏡愛され絵文字♡🤥👊😅👊👶♡
- ネトウヨ、完全に終わる 「高市さんの『台湾が武力攻撃された場合』というのは『米中戦争が勃発した場合』って意味に決まってるだろ!」 [314039747]
- 中国とのパイプ役がいない高市政権、実施詰みか [668970678]
