青春をともに過ごしたPerlの何がだめって言うんだよ〜
教えてくれ!
探検
【えっ】Perlに未来はあるのか?【終わり?】
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
2007/06/02(土) 00:54:11374デフォルトの名無しさん
2008/07/21(月) 21:36:02375デフォルトの名無しさん
2008/07/21(月) 21:49:06 別にブーブー文句たれてないぞ。
普通に使えるし。
普通に使えるし。
376デフォルトの名無しさん
2008/07/21(月) 22:14:55 サロゲートペアなんか知らないふりしとけばおk
377デフォルトの名無しさん
2008/07/21(月) 22:25:42 >>375
そりゃそうだ。まだユニコードには対応してないんだから。
そりゃそうだ。まだユニコードには対応してないんだから。
378デフォルトの名無しさん
2008/07/21(月) 22:29:50379デフォルトの名無しさん
2008/07/21(月) 22:57:46 「UTF-16LE」のLE=りとる・えんでぃあん
380デフォルトの名無しさん
2008/07/21(月) 23:00:20 ユニコード化すると、どうしてもリトルエンディアン・ビッグエンディアンを気にしなければならなくなる。
ここらへんがUNIX系OSにユニコードが導入されにくい理由の一つでもある。
Windows系OSならCPUはインテルしか無いからな。
ここらへんがUNIX系OSにユニコードが導入されにくい理由の一つでもある。
Windows系OSならCPUはインテルしか無いからな。
381デフォルトの名無しさん
2008/07/21(月) 23:05:29 perlの質問をしているつもりが
CPUレベルまで降りてきたぜ
CPUレベルまで降りてきたぜ
382デフォルトの名無しさん
2008/07/21(月) 23:36:36 ビッグエンディアンなんていらんかったんや
383デフォルトの名無しさん
2008/07/21(月) 23:39:19 つまりネットワークもいらないと
384デフォルトの名無しさん
2008/07/22(火) 00:00:17 >>379
それは違うんじゃね?
UTF-16LEとUTF-16BEはBOMなし。UTF-16はBOMあり。
WindowsのコードはBOMありのUTF-16でリトルエンディアンで直列化してるはず。
ってかそんなことも知らないでユニコードの話してるの?クソワラタ
それは違うんじゃね?
UTF-16LEとUTF-16BEはBOMなし。UTF-16はBOMあり。
WindowsのコードはBOMありのUTF-16でリトルエンディアンで直列化してるはず。
ってかそんなことも知らないでユニコードの話してるの?クソワラタ
385デフォルトの名無しさん
2008/07/22(火) 00:10:47 もうPerlと関係なくなってね?
386デフォルトの名無しさん
2008/07/22(火) 00:19:11 お前よく気づいたな
387デフォルトの名無しさん
2008/07/22(火) 00:22:43 >>384
ライブラリやAPIレベルではBOM要らないぞ。
ライブラリやAPIレベルではBOM要らないぞ。
388デフォルトの名無しさん
2008/07/22(火) 00:27:12 これから >>384 をたたえる祭りが始まります。
389デフォルトの名無しさん
2008/07/22(火) 00:29:11 BOMなしって、どゆこと?代わりにスーパー写真塾がついてるのか?
390デフォルトの名無しさん
2008/07/22(火) 00:34:38 >WindowsのコードはBOMありのUTF-16でリトルエンディアンで直列化してるはず。
>ってかそんなことも知らないでユニコードの話してるの?クソワラタ
これは良い釣り
>ってかそんなことも知らないでユニコードの話してるの?クソワラタ
これは良い釣り
391デフォルトの名無しさん
2008/07/22(火) 00:40:13 おれは熱烈投稿のお世話になったよ。
392デフォルトの名無しさん
2008/07/22(火) 00:49:58 >>389
内部ではワイドキャラクタ(16bit)で扱うので、バイト直列化してないということ。
内部ではワイドキャラクタ(16bit)で扱うので、バイト直列化してないということ。
393デフォルトの名無しさん
2008/07/22(火) 01:30:20 まさかのマジレス?
394デフォルトの名無しさん
2008/07/22(火) 01:46:29 ボケが判りにくいからじゃね?
395デフォルトの名無しさん
2008/07/22(火) 15:41:17 一つだけ言えるのは、海胆コードによって、コード系世界は地獄と化したと言うこと。
396あああ ◆RrX6W08b02
2008/07/22(火) 23:50:01397デフォルトの名無しさん
2008/07/23(水) 00:44:17 つまりはJPerlの方が使いやすかったと。
しかし、どこをどう間違えてしまったのだ?
やはりこれは *バベルの塔* なのか?
しかし、どこをどう間違えてしまったのだ?
やはりこれは *バベルの塔* なのか?
398デフォルトの名無しさん
2008/07/23(水) 00:50:04 JPerlはスクリプトやブロックの定義がイマイチ。
Perl5.8の方がいい。
Perl5.8の方がいい。
399デフォルトの名無しさん
2008/07/23(水) 00:55:10 JPLと勘違いしてないか?
400デフォルトの名無しさん
2008/07/23(水) 01:37:59 PerlのUnicode化は、内部表現である"UTF-8"が見えてしまうのが一つの問題。
たとえ内部的にUTF-8を使っていても、抽象化して「Unicode文字列」としてしか
扱わない、扱えないようにするべきだった。
内部形式なんて、見えるようにしても何のメリットもない。
さらに、「わかっている人向け」のインターフェイスしかないのも致命的。
LWP::SimpleとLWP::UserAgent(等)のように、簡単・手軽な普段使いのものと、
複雑・強力な本格的なものを用意するべきだったのに。
Pythonで、コマンドプロンプトから"print u'あ'"を実行すると、"あ"と表示される。
もちろん裏では"use encoding(cp932);"と同様の処理がされているのだろうが、
ユーザには見えない。見える必要もない。
Perlでは、Unicode 専用の文法を何も作らずにUnicode対応したのも敗因。
u"" のような文法がないから、例えば"use utf8;"や"use encoding(cp932);"のような
「モードの切り替え」が必要になる。
しかし、これは一般ユーザには敷居が高すぎて、単純に理解してもらえない。
残念なことだ。
たとえ内部的にUTF-8を使っていても、抽象化して「Unicode文字列」としてしか
扱わない、扱えないようにするべきだった。
内部形式なんて、見えるようにしても何のメリットもない。
さらに、「わかっている人向け」のインターフェイスしかないのも致命的。
LWP::SimpleとLWP::UserAgent(等)のように、簡単・手軽な普段使いのものと、
複雑・強力な本格的なものを用意するべきだったのに。
Pythonで、コマンドプロンプトから"print u'あ'"を実行すると、"あ"と表示される。
もちろん裏では"use encoding(cp932);"と同様の処理がされているのだろうが、
ユーザには見えない。見える必要もない。
Perlでは、Unicode 専用の文法を何も作らずにUnicode対応したのも敗因。
u"" のような文法がないから、例えば"use utf8;"や"use encoding(cp932);"のような
「モードの切り替え」が必要になる。
しかし、これは一般ユーザには敷居が高すぎて、単純に理解してもらえない。
残念なことだ。
401デフォルトの名無しさん
2008/07/23(水) 02:06:01 1文字1バイトの国で生まれ育った人には、何を言っても無駄。
湯煮コードだ、CP932だ、何だかんだ言っても、その概念が飲み込めない人なんだから。
(このスレにも、ユニコードと UTF-8 の違いが飲み込めないヤツがおるくらいだから、
アメリカ人に漢字が理解できるワケが無い)
生まれつき目の見えない人に、「青い」とか「赤い」とか言っても理解してもらえないのと同じ。
色の概念が無いわけですから。(目の見えない人、変な例えに使ってゴメンなさい)
もうこれ以上、perl に何かを期待しても無駄だよ。
湯煮コードだ、CP932だ、何だかんだ言っても、その概念が飲み込めない人なんだから。
(このスレにも、ユニコードと UTF-8 の違いが飲み込めないヤツがおるくらいだから、
アメリカ人に漢字が理解できるワケが無い)
生まれつき目の見えない人に、「青い」とか「赤い」とか言っても理解してもらえないのと同じ。
色の概念が無いわけですから。(目の見えない人、変な例えに使ってゴメンなさい)
もうこれ以上、perl に何かを期待しても無駄だよ。
402デフォルトの名無しさん
2008/07/23(水) 20:35:44 >>401
ユニコード ∋ UCS2, UCS4, UTF-7, UTF-8, UTF-16, UTF-32
確かに ユニコード≡UTF-8 は成り立たないが ユニコード≡UTF-16も成り立たない。
ゆえに「ユニコードはUTF-8ではない」が真ならば「ユニコードはUTF-16ではない」もまた真になる。
ユニコード∋UTF-16 をもって 「ユニコードとはUTF-16の事である」というのであれば、
ユニコード∋UTF-8 なので 「ユニコードとはUTF-8の事である」もまた真になる。
一般用語としてのユニコードがUTF-16を指すとしても、
UTF-8との比較対照としてUTF-16を扱う場合、ユニコードをUTF-16として語る事は
釣り餌以外のなにものにもならない。
UTF-8を使う事がどうしていけないのか、UTF-16がUTF-8と比較してどんな利点があるのか
具体的に例示しないのは、本人がユニコードとUTF-16とUTF-8について理解してないからだと思われ。
注1) ∋ は集合論の記号。右に列挙したものが左の集合の要素であるという意味。
注2) ≡ は集合論の記号。左右がまったく同じものという意味。
ユニコード ∋ UCS2, UCS4, UTF-7, UTF-8, UTF-16, UTF-32
確かに ユニコード≡UTF-8 は成り立たないが ユニコード≡UTF-16も成り立たない。
ゆえに「ユニコードはUTF-8ではない」が真ならば「ユニコードはUTF-16ではない」もまた真になる。
ユニコード∋UTF-16 をもって 「ユニコードとはUTF-16の事である」というのであれば、
ユニコード∋UTF-8 なので 「ユニコードとはUTF-8の事である」もまた真になる。
一般用語としてのユニコードがUTF-16を指すとしても、
UTF-8との比較対照としてUTF-16を扱う場合、ユニコードをUTF-16として語る事は
釣り餌以外のなにものにもならない。
UTF-8を使う事がどうしていけないのか、UTF-16がUTF-8と比較してどんな利点があるのか
具体的に例示しないのは、本人がユニコードとUTF-16とUTF-8について理解してないからだと思われ。
注1) ∋ は集合論の記号。右に列挙したものが左の集合の要素であるという意味。
注2) ≡ は集合論の記号。左右がまったく同じものという意味。
403デフォルトの名無しさん
2008/07/23(水) 20:49:22 UTF-8は1バイト圏の人が嫌々国際化に対応した結果です
404デフォルトの名無しさん
2008/07/23(水) 21:16:23 >>402
一般的にはUTF-32(CEF)じゃないのか?
一般的にはUTF-32(CEF)じゃないのか?
405デフォルトの名無しさん
2008/07/23(水) 21:29:42 シフトJIS が生まれる前のパソコンって、どんな漢字コード使ってたか知ってるよね?
そう、JIS漢字コード(JIS6226)だね。ちょっと常識すぎたかな。
UNIX も、マイクロソフトのBASICを乗っけたパソコンも、漢字はJIS漢字コードを使ってたんだよ。
ところが、これが非常に使いにくい。ASCII の1バイト文字とJIS漢字を共存させるのが、えらい苦労する。
そこで、ゲイツ一味が考え出したのが、シフトJISってワケ。
これは、JIS漢字コードに無理やり数値を足したり引いたり掛け算したり・・・
で、ASCIIコードと重ならないように工夫したコードなんだね。
UTF-8 ってのは、このシフトJIS のユニコード版と言えるかな。
笑われるのを覚悟で言って見れば、「UTF-8 とは、シフト・ユニコードである」 ってところだろうか。
(・・・あ、こんな言葉は無いから外では使うなよ。たった今オレが思いついた言葉だからね)
ユニコードと1バイトASCIIコードは共存できない。そこを、無理やり、数値を足したり引いたり掛け算したり・・・
で、ASCIIコードと重ならないように工夫したわけさ。ほら、シフトJISと状況が似てるだろ?
ということで、UTF-8 はシフトJISと同じ問題をはらんでいる。
つまり、コンピュータの文字の内部表現には向かない、って事。
たとえば、頭から10万文字めを取り出す、という処理を考えると、先頭の1バイトめから順々に数えなければ
10万文字目が特定できない。次の10万1文字めを取り出すには、またまた先頭の1バイトめから順々に数えなければ
文字が特定できないって事なのよ。大量の文字列を扱うのにはスピード的に不利なわけ。
ユニコードで内部処理していれば、こんな事にはならない。単なる文字の配列だから10万文字めだろうが10万1文字め
だろうが、素早くランダムアクセスできるからね。
いつまでも内部表現にUTF-8を使い続けるのは、問題を先延ばしにしているだけで、未来は破綻が待っている。
そう、JIS漢字コード(JIS6226)だね。ちょっと常識すぎたかな。
UNIX も、マイクロソフトのBASICを乗っけたパソコンも、漢字はJIS漢字コードを使ってたんだよ。
ところが、これが非常に使いにくい。ASCII の1バイト文字とJIS漢字を共存させるのが、えらい苦労する。
そこで、ゲイツ一味が考え出したのが、シフトJISってワケ。
これは、JIS漢字コードに無理やり数値を足したり引いたり掛け算したり・・・
で、ASCIIコードと重ならないように工夫したコードなんだね。
UTF-8 ってのは、このシフトJIS のユニコード版と言えるかな。
笑われるのを覚悟で言って見れば、「UTF-8 とは、シフト・ユニコードである」 ってところだろうか。
(・・・あ、こんな言葉は無いから外では使うなよ。たった今オレが思いついた言葉だからね)
ユニコードと1バイトASCIIコードは共存できない。そこを、無理やり、数値を足したり引いたり掛け算したり・・・
で、ASCIIコードと重ならないように工夫したわけさ。ほら、シフトJISと状況が似てるだろ?
ということで、UTF-8 はシフトJISと同じ問題をはらんでいる。
つまり、コンピュータの文字の内部表現には向かない、って事。
たとえば、頭から10万文字めを取り出す、という処理を考えると、先頭の1バイトめから順々に数えなければ
10万文字目が特定できない。次の10万1文字めを取り出すには、またまた先頭の1バイトめから順々に数えなければ
文字が特定できないって事なのよ。大量の文字列を扱うのにはスピード的に不利なわけ。
ユニコードで内部処理していれば、こんな事にはならない。単なる文字の配列だから10万文字めだろうが10万1文字め
だろうが、素早くランダムアクセスできるからね。
いつまでも内部表現にUTF-8を使い続けるのは、問題を先延ばしにしているだけで、未来は破綻が待っている。
406デフォルトの名無しさん
2008/07/23(水) 21:44:47 にもかかわらず、UNIX系OSがUTF-8に固執するのは、OSがC言語で記述されているから。
UNIXのシステムコールもC言語から呼ぶことになっている。
UNIXはすべてC言語が基本なんだね。
ところで、ユニコードの"ABC"という文字を、C言語のライブラリに渡すことを考えてみよう。
int fd = open("ABC", O_RDONLY);
ユニコードの"ABC" を受け取った open 関数はどういう挙動をするか?
ユニコードの"ABC" は char の配列 { 0x41, 0x00, 0x42, 0x00, 0x43, 0x00 } と解釈されてしまう。
(インテルCPUの場合)
ここで注意しなければならないのは、 0x00 は文字列の終端記号に間違われてしまうという事。
文字列に \0 が含まれていると、それが文字列の終わりという腐った約束ごとがあるから
結局、open 関数には "A" というファイルをオープンしようとするだろうね。
つ・ま・り、UNIX系OSは、どうあがいても、泣けど叫べど、絶対にユニコード化は不可能。
だから UTF-8 に固執してるんだよ。
くやしかったら 文字列の終端が \0 って言うクソ仕様を廃止してみろwww
UNIXのシステムコールもC言語から呼ぶことになっている。
UNIXはすべてC言語が基本なんだね。
ところで、ユニコードの"ABC"という文字を、C言語のライブラリに渡すことを考えてみよう。
int fd = open("ABC", O_RDONLY);
ユニコードの"ABC" を受け取った open 関数はどういう挙動をするか?
ユニコードの"ABC" は char の配列 { 0x41, 0x00, 0x42, 0x00, 0x43, 0x00 } と解釈されてしまう。
(インテルCPUの場合)
ここで注意しなければならないのは、 0x00 は文字列の終端記号に間違われてしまうという事。
文字列に \0 が含まれていると、それが文字列の終わりという腐った約束ごとがあるから
結局、open 関数には "A" というファイルをオープンしようとするだろうね。
つ・ま・り、UNIX系OSは、どうあがいても、泣けど叫べど、絶対にユニコード化は不可能。
だから UTF-8 に固執してるんだよ。
くやしかったら 文字列の終端が \0 って言うクソ仕様を廃止してみろwww
407デフォルトの名無しさん
2008/07/23(水) 21:53:12 >>405
先頭から何文字目の文字とかを扱うのってそんなに重要か?
まあ、それが重要だとしても、UTF-16だって先頭から数えなきゃならない。
なぜならサロゲートペアってものがあるから。
そんなにユニコード完全準拠が必要だと思うなら、UTF-32(UCS4)を内部表現に使うように主張するべきじゃね?
先頭から何文字目の文字とかを扱うのってそんなに重要か?
まあ、それが重要だとしても、UTF-16だって先頭から数えなきゃならない。
なぜならサロゲートペアってものがあるから。
そんなにユニコード完全準拠が必要だと思うなら、UTF-32(UCS4)を内部表現に使うように主張するべきじゃね?
408デフォルトの名無しさん
2008/07/23(水) 22:02:14409デフォルトの名無しさん
2008/07/23(水) 22:03:56 >>406
うーん、C言語について、誤解してるようだが・・・。
\0というのは、別に、(0000 0000)bを意味して無いぞ。
オリジナルのC言語は6bit=1キャラクタのマシン(PDP-7)で動作していた。
それが今の8bit=1キャラクタのマシンに移植できたんだから、
16bit=1キャラクタだろうが、32bit=1キャラクタだろうが
C言語の言語仕様としては全く問題は無く扱える。
まあ、問題があるとすれば、
1キャラクタ(1Byte)=8bitを前提としたビットアクセス、 union、ポインタ操作などだけど、
その辺はフィルタ作ればソースから抽出するのはさほど難しくは無い。
2000年問題に対応した時の規模の修正で対応可能だろう。
うーん、C言語について、誤解してるようだが・・・。
\0というのは、別に、(0000 0000)bを意味して無いぞ。
オリジナルのC言語は6bit=1キャラクタのマシン(PDP-7)で動作していた。
それが今の8bit=1キャラクタのマシンに移植できたんだから、
16bit=1キャラクタだろうが、32bit=1キャラクタだろうが
C言語の言語仕様としては全く問題は無く扱える。
まあ、問題があるとすれば、
1キャラクタ(1Byte)=8bitを前提としたビットアクセス、 union、ポインタ操作などだけど、
その辺はフィルタ作ればソースから抽出するのはさほど難しくは無い。
2000年問題に対応した時の規模の修正で対応可能だろう。
410デフォルトの名無しさん
2008/07/23(水) 22:05:23411デフォルトの名無しさん
2008/07/23(水) 22:09:30412デフォルトの名無しさん
2008/07/23(水) 22:12:12 >>409
ほうほうほう。それは勉強になった。
で?UNIXは、なぜ1キャラクタ16ビットや32ビットのCコンパイラを使わないの?
そうすれば数々のユニコード問題が一気に解決するじゃん。
そんな石器時代の石斧を持ち出して自衛隊に持たせても、北の侵略から日本は守れないぞ〜
ほうほうほう。それは勉強になった。
で?UNIXは、なぜ1キャラクタ16ビットや32ビットのCコンパイラを使わないの?
そうすれば数々のユニコード問題が一気に解決するじゃん。
そんな石器時代の石斧を持ち出して自衛隊に持たせても、北の侵略から日本は守れないぞ〜
413デフォルトの名無しさん
2008/07/23(水) 22:13:41 gccのwchar_tは4バイトなわけだが・・
414デフォルトの名無しさん
2008/07/23(水) 22:22:56 >>412
それこそ後出しジャンケンだろ。
UNIXにしても、Linuxにしてもユニコードが普及する前からやってるわけで、
最近は64bit対応とかワイドキャラ対応とかで順次対応が進んでる状況なわけだ。
少なくとも2036年問題対応の頃までには、longは64bitか128bitになってるだろうし、
必要性があれば、内部文字コードがUTF-32になってるかもしれない。
もっとも、charを16bit(32bit)にするアプローチがいいのか、wchar_tを標準にした方が良いのかは
十分議論を尽くしてないだろうから、wchar_tを文字列の標準にする方向になるのかもしれないが。
それこそ後出しジャンケンだろ。
UNIXにしても、Linuxにしてもユニコードが普及する前からやってるわけで、
最近は64bit対応とかワイドキャラ対応とかで順次対応が進んでる状況なわけだ。
少なくとも2036年問題対応の頃までには、longは64bitか128bitになってるだろうし、
必要性があれば、内部文字コードがUTF-32になってるかもしれない。
もっとも、charを16bit(32bit)にするアプローチがいいのか、wchar_tを標準にした方が良いのかは
十分議論を尽くしてないだろうから、wchar_tを文字列の標準にする方向になるのかもしれないが。
415デフォルトの名無しさん
2008/07/23(水) 22:28:00 で?UNIXは、なぜ1キャラクタ16ビットや32ビットのCコンパイラを使わないの?
416デフォルトの名無しさん
2008/07/23(水) 22:29:56 perl もC言語で記述されてるんでしょ?
だったら1文字16ビットや32ビットのCコンパイラでコンパイルした perl を使えばいいじゃん。
ユニコードとか utf8 とか、メンドクサイ事を考える必要無いじゃん。
なぜそれが出来ない?
だったら1文字16ビットや32ビットのCコンパイラでコンパイルした perl を使えばいいじゃん。
ユニコードとか utf8 とか、メンドクサイ事を考える必要無いじゃん。
なぜそれが出来ない?
417デフォルトの名無しさん
2008/07/23(水) 22:35:44 何か痛いのが居るな
418デフォルトの名無しさん
2008/07/23(水) 22:40:43 だから、サロゲートペアの反論は?
UTF-32が後出しジャンケンだっていうけど、藻前が主張したいのはWindowsの実装こそ正義って話?
UTF-32なら藻前が言った先頭から何文字目とかの話に対応できるから、
藻前がその話を引き合いに出すならUTF-32を内部コードにするべきって主張するのが本当だろうって話なんだが?
UTF-32が後出しジャンケンだっていうけど、藻前が主張したいのはWindowsの実装こそ正義って話?
UTF-32なら藻前が言った先頭から何文字目とかの話に対応できるから、
藻前がその話を引き合いに出すならUTF-32を内部コードにするべきって主張するのが本当だろうって話なんだが?
419デフォルトの名無しさん
2008/07/23(水) 22:41:45 Win厨必死だな。
420デフォルトの名無しさん
2008/07/23(水) 23:08:22 合成や正規化の問題があるから、UTF-32にすればハッピーというのも何か
微妙な気がするんだが、
せいぜいサロゲートペアが消えるだけでしょう
微妙な気がするんだが、
せいぜいサロゲートペアが消えるだけでしょう
421デフォルトの名無しさん
2008/07/23(水) 23:16:38 1文字1Byteの国の連中(マイクロソフトを含む)が、1文字1Byteじゃ表現できない範囲をカバーするために提案したのがユニコード。
当初は何が何でも2Byteに収めようとかなり強引な事(見た目が同じ文字は1つのコードにまとめる等)を色々やってUCS-2を作り上げた。
それを表現する方法として作ったのがUTF-16。
でも1文字1Byteじゃ表現できない文字を扱ってる国からの反発がものすごくて、Unicode2.0では21bitに拡張され、結局32bitのUCS-4が作られた。
1文字1Byte圏批判をするなら、当初の頃Unicodeを2Byteに押し込めようとした連中を批判すべき。
UTF-8に対するUTF-16の優位性なんて、Unicode2.0誕生でサロゲートペアが出来て以後ほとんど無いのに、
妄想でUTF-16賛美UTF-8批判するヤツはオカシイと思う。
「Microsoftが採用してWindowsの内部表現になったからすごいんだ」と言いたいならはっきりそう書けばイイジャン。
当初は何が何でも2Byteに収めようとかなり強引な事(見た目が同じ文字は1つのコードにまとめる等)を色々やってUCS-2を作り上げた。
それを表現する方法として作ったのがUTF-16。
でも1文字1Byteじゃ表現できない文字を扱ってる国からの反発がものすごくて、Unicode2.0では21bitに拡張され、結局32bitのUCS-4が作られた。
1文字1Byte圏批判をするなら、当初の頃Unicodeを2Byteに押し込めようとした連中を批判すべき。
UTF-8に対するUTF-16の優位性なんて、Unicode2.0誕生でサロゲートペアが出来て以後ほとんど無いのに、
妄想でUTF-16賛美UTF-8批判するヤツはオカシイと思う。
「Microsoftが採用してWindowsの内部表現になったからすごいんだ」と言いたいならはっきりそう書けばイイジャン。
422デフォルトの名無しさん
2008/07/23(水) 23:19:54 UTF-16でサロゲートを見なかった事にするのが一番現実的
423デフォルトの名無しさん
2008/07/23(水) 23:21:11 「UTF-32にすればハッピー」ってどこに書いてあるの?
424デフォルトの名無しさん
2008/07/23(水) 23:24:59425デフォルトの名無しさん
2008/07/23(水) 23:27:15 ASCII混在ファイルが現役で大量に残ってる間は、英字部分だけでもASCIIと互換性があるUTF-8を使うのが一番現実的。
HTMLだって、metaタグのcharset見て処理できるような仕様になってるのは、ASCII混在が前提になってるから。
HTMLだって、metaタグのcharset見て処理できるような仕様になってるのは、ASCII混在が前提になってるから。
426デフォルトの名無しさん
2008/07/23(水) 23:29:07 >>424
ん?サロゲートが消えて1文字32bit固定になれば、
「単なる文字の配列だから10万文字めだろうが10万1文字めだろうが、素早くランダムアクセスできるからね」
が出来るようになるんじゃねえの?
ん?サロゲートが消えて1文字32bit固定になれば、
「単なる文字の配列だから10万文字めだろうが10万1文字めだろうが、素早くランダムアクセスできるからね」
が出来るようになるんじゃねえの?
427デフォルトの名無しさん
2008/07/23(水) 23:39:10 >>426
UTF-32ならUCS-4の「コードポイント」を確かに32bitの整数一個で表現できるけど
Unicodeの仕様では、今や一つの「文字」が一つのコードポイントに
必ずしも対応しないわけですから、
> 先頭から何文字目
のような「文字」ベースの話では、どのみち問題はおきますよ、と言ってるんですよ
UTF-32ならUCS-4の「コードポイント」を確かに32bitの整数一個で表現できるけど
Unicodeの仕様では、今や一つの「文字」が一つのコードポイントに
必ずしも対応しないわけですから、
> 先頭から何文字目
のような「文字」ベースの話では、どのみち問題はおきますよ、と言ってるんですよ
428デフォルトの名無しさん
2008/07/23(水) 23:42:55429デフォルトの名無しさん
2008/07/24(木) 00:21:06 encode,decode使ってればいまのとこそんなに困る事もないし
行き詰ったらラリーがどうにかしてくれるから
いい加減unicodeスレに帰ってください
行き詰ったらラリーがどうにかしてくれるから
いい加減unicodeスレに帰ってください
430デフォルトの名無しさん
2008/07/25(金) 09:32:05 え?今後は Perl 6 だから、 Perl 5.x での問題はなくなるんじゃないの?
まぁ、 Perl 5.x とそれで動くプログラムは切り捨てられるんだろうけど。
まぁ、 Perl 5.x とそれで動くプログラムは切り捨てられるんだろうけど。
431デフォルトの名無しさん
2008/07/25(金) 09:36:19 10000対1で、切り捨てられるのはPerl6
432デフォルトの名無しさん
2008/07/25(金) 10:39:19 え?今後は BTX だから、 ATX での問題はなくなるんじゃないの?
まぁ、ATX とそれで動くボードは切り捨てられるんだろうけど。
まぁ、ATX とそれで動くボードは切り捨てられるんだろうけど。
433デフォルトの名無しさん
2008/07/25(金) 12:54:25 え?今後は Vista だから、 XP での問題はなくなるんじゃないの?
まぁ、XP とそれで動くプログラムは切り捨てられるんだろうけど。
まぁ、XP とそれで動くプログラムは切り捨てられるんだろうけど。
434デフォルトの名無しさん
2008/07/25(金) 13:00:21 え?今後は 「ねんきん機構」 だから、 「社会保険庁」 での問題はなくなるんじゃないの?
まぁ、 消えた年金5000万件 とそを納めた被保険者は切り捨てられるんだろうけど。
まぁ、 消えた年金5000万件 とそを納めた被保険者は切り捨てられるんだろうけど。
435デフォルトの名無しさん
2008/07/25(金) 13:19:32 つまんね
436デフォルトの名無しさん
2008/07/25(金) 13:59:34 え?今後は Mach だから、 UNIX での問題はなくなるんじゃないの?
まぁ、 UNIX とそれで動くプログラムは切り捨てられるんだろうけど。
まぁ、 UNIX とそれで動くプログラムは切り捨てられるんだろうけど。
437デフォルトの名無しさん
2008/08/02(土) 01:11:14 「美しいコードを書けるからRubyを選んだ」---Ruby on Rails作者 David Heinemeier Hansson氏:ITpro
http://itpro.nikkeibp.co.jp/article/NEWS/20060620/241346/
DHH:いろんなPerlソースを見ていると,頭が爆発しそうでした。
なぜかというと,どのコードを見てもスタイルがそれぞれ違って,
正しいのはどれかがわからない。
それぞれおもしろいんだけど,自己主張が激しすぎると感じました。
一方で,Rubyで書いたものはどれも,
同じことをする場合はだいたい似たように見える。
この「統一感」がすごく重要でした。
http://itpro.nikkeibp.co.jp/article/NEWS/20060620/241346/
DHH:いろんなPerlソースを見ていると,頭が爆発しそうでした。
なぜかというと,どのコードを見てもスタイルがそれぞれ違って,
正しいのはどれかがわからない。
それぞれおもしろいんだけど,自己主張が激しすぎると感じました。
一方で,Rubyで書いたものはどれも,
同じことをする場合はだいたい似たように見える。
この「統一感」がすごく重要でした。
438デフォルトの名無しさん
2008/08/02(土) 03:49:14 そりゃPerlにくらべりゃな・・
439デフォルトの名無しさん
2008/08/02(土) 07:32:10 >>437
そのURLのページに、そんな文章ないんだが・・
そのURLのページに、そんな文章ないんだが・・
440デフォルトの名無しさん
2008/08/02(土) 09:14:40 そこで Perl6 ですよ。
441デフォルトの名無しさん
2008/08/02(土) 09:37:55 Lakeの書式見てRubyイイと言い出す人間は多いな。R&Rもそのクチじゃないかな。
442デフォルトの名無しさん
2008/08/02(土) 11:03:56 一つの動作を色々な書き方ができるほうがいいのか
一つの動作なら同じ書き方で統一するほうがいいのか
これは価値観の問題じゃない?
一つの動作なら同じ書き方で統一するほうがいいのか
これは価値観の問題じゃない?
443デフォルトの名無しさん
2008/08/02(土) 11:10:00 まぁそうだが、同じ動作なら読むほうにとっては後者が歓迎されるんじゃね
444デフォルトの名無しさん
2008/08/04(月) 00:18:55 統一感を求めるならPythonのほうがよくね?
445デフォルトの名無しさん
2008/08/04(月) 03:27:14 Pythonも使ってるけど、コンソールコピペで叩けるような長文ワンライナができないと面倒な感じ
その意味ではまだRubyかな
SpiderMonkeyあたりがコンソールライブラリ充実したらRubyとか糞とか言える日が来るかもしらんけど
その意味ではまだRubyかな
SpiderMonkeyあたりがコンソールライブラリ充実したらRubyとか糞とか言える日が来るかもしらんけど
446デフォルトの名無しさん
2008/08/04(月) 07:08:53 >>440
ますます迷走してるし
ますます迷走してるし
447デフォルトの名無しさん
2008/08/04(月) 09:47:30 今から初めてプログラミングをする人が選ぶならば、PerlとRubyどちらがいいと思う?
ただし、職業としてでなく、あくまで自分で使うため。
書籍も多数発売されて、Rubyを学ぶ環境は問題なくなりつつあるよね
Perlとは違った意味でRubyにも将来性の不安というのはあるけれど…
実はどちらも勉強するが正しいのかな
ただし、職業としてでなく、あくまで自分で使うため。
書籍も多数発売されて、Rubyを学ぶ環境は問題なくなりつつあるよね
Perlとは違った意味でRubyにも将来性の不安というのはあるけれど…
実はどちらも勉強するが正しいのかな
448デフォルトの名無しさん
2008/08/04(月) 10:11:43 どっちもやれよ。
449デフォルトの名無しさん
2008/08/04(月) 10:51:22 でもそれじゃ話が進まない。
どちらか一方をと言われたら?
どちらか一方をと言われたら?
450デフォルトの名無しさん
2008/08/04(月) 11:05:44 どっちもやれ
451デフォルトの名無しさん
2008/08/04(月) 11:22:29 では、どちらを先にやりましょうか
452デフォルトの名無しさん
2008/08/04(月) 14:11:01 php
453デフォルトの名無しさん
2008/08/04(月) 16:26:25 perlとphp長いことやってきたけどやっぱいろいろできるperlのがいいな
454デフォルトの名無しさん
2008/08/04(月) 17:53:41455デフォルトの名無しさん
2008/08/04(月) 18:34:44 >>447
Perl
Perl
456デフォルトの名無しさん
2008/08/04(月) 23:34:29 perlの将来性は確かに不安だ
だが、rubyやpythonに将来性があるかといわれると、それも大いに疑問だな
phpは立ち位置が違うから比較にならない。上の3つのどれかを知っていても別に覚える意味はあると思う。
だが、rubyやpythonに将来性があるかといわれると、それも大いに疑問だな
phpは立ち位置が違うから比較にならない。上の3つのどれかを知っていても別に覚える意味はあると思う。
457デフォルトの名無しさん
2008/08/05(火) 00:27:50 迷ってる暇があったらとっとと習得すればいいだろ。
今週はPerlをマスターして、来週前半でRuby、後半でPythonを
マスターすれば良い。
今週はPerlをマスターして、来週前半でRuby、後半でPythonを
マスターすれば良い。
458デフォルトの名無しさん
2008/08/05(火) 01:05:52 Perlに未来があるとすればUnicodeを捨てて、もとのPerlに
戻るのみ。
幸いにも癌は取り除きやすいようにパッケージされている。
戻るのみ。
幸いにも癌は取り除きやすいようにパッケージされている。
459デフォルトの名無しさん
2008/08/05(火) 05:49:44 >>457
どんだけ記憶力良いんだよ
どんだけ記憶力良いんだよ
460デフォルトの名無しさん
2008/08/05(火) 05:53:55 Rubyだけやった方がいい
Perlやって変なクセつくより、オブジェクト指向のRubyだけを勉強した方がいい。
多けりゃいいってもんじゃないんだよ。
Perlやって変なクセつくより、オブジェクト指向のRubyだけを勉強した方がいい。
多けりゃいいってもんじゃないんだよ。
461デフォルトの名無しさん
2008/08/05(火) 21:02:07 PerlをいやになるぐらいやってからRubyのほうが感動するらしいぞ。
462デフォルトの名無しさん
2008/08/05(火) 22:34:56 その頃にはRubyがあるかどうか…
あっても大幅に仕様変更しているだろう
あっても大幅に仕様変更しているだろう
463デフォルトの名無しさん
2008/08/06(水) 07:47:51 >>461
今、Perlを嫌になるほどやれるシチュエーションってないな。
もうPerlでCGIって時代でもないし。Perlのwebフレームワーク使った案件もないし。
せいぜいワンライナーとかチョンプロぐらい。
今、Perlを嫌になるほどやれるシチュエーションってないな。
もうPerlでCGIって時代でもないし。Perlのwebフレームワーク使った案件もないし。
せいぜいワンライナーとかチョンプロぐらい。
464デフォルトの名無しさん
2008/08/06(水) 09:59:50 この板別に職業プログラマだけとは限らんのよ?
465デフォルトの名無しさん
2008/08/08(金) 22:15:05 Rubyもまたいずれ暴走するんだろうな
466デフォルトの名無しさん
2008/08/08(金) 22:20:55 「仕事でやむをえず」以外に、いまさらPerlなんぞを使う理由って何かあんの?
趣味ならもっとマシな言語を好きに選べるのだし、選んだほうが幸せになれるだろ
まあPerlは非常に広い範囲で使われてるから、知っておくと便利は便利だが
それを言うならもっと先に学ぶべき言語はいくらでもある
趣味ならもっとマシな言語を好きに選べるのだし、選んだほうが幸せになれるだろ
まあPerlは非常に広い範囲で使われてるから、知っておくと便利は便利だが
それを言うならもっと先に学ぶべき言語はいくらでもある
467デフォルトの名無しさん
2008/08/09(土) 08:33:28468デフォルトの名無しさん
2008/08/09(土) 12:56:50 Perl6ついに今年のクリスマスにα版が?
http://rikunabi-next.yahoo.co.jp/tech/docs/ct_s03600.jsp?p=001357
http://rikunabi-next.yahoo.co.jp/tech/docs/ct_s03600.jsp?p=001357
469デフォルトの名無しさん
2008/08/10(日) 11:54:05470デフォルトの名無しさん
2008/08/10(日) 16:22:17 ウェブなら、PHPかPerlでいいんじゃない。モダンなスクリプト言語ならPythonってなるだろうし、Rubyにはメリットというか、存在意味を感じない。
471デフォルトの名無しさん
2008/08/10(日) 17:43:34 >>470
RGSSやるならrubyを勉強するしかないお
RGSSやるならrubyを勉強するしかないお
472デフォルトの名無しさん
2008/08/11(月) 08:44:01 >>470
ラリーが言ってるんだから例年のクリスマスよりwktk出来るだろ
ラリーが言ってるんだから例年のクリスマスよりwktk出来るだろ
473デフォルトの名無しさん
2008/08/11(月) 08:48:43 wktkって…
過去に書いたコードが死ぬ日がそんなに楽しみですか?
過去に書いたコードが死ぬ日がそんなに楽しみですか?
474デフォルトの名無しさん
2008/08/11(月) 14:52:14 use perl5とか出来るんでしょ
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【日本人の旅行離れ】国内旅行すら行けなくなった……オーバーツーリズムだけじゃない 旅行者減少の異常事態 [ぐれ★]
- 高市首相の答弁書に「台湾有事答えない」と明記 存立危機発言当時 ★12 [蚤の市★]
- “ひとり焼肉”でおなじみ「焼肉ライク」が閉店ラッシュ。なぜ「コスパが悪い」と言われてしまうのか [Gecko★]
- 女性天皇「賛成」69%、将来の皇位継承「不安」68%…読売世論調査 [蚤の市★]
- 【兵庫】空き家の金庫に保管、現金1300万円盗まれる 持ち主男性の実家で3年前から無人 加西 [ぐれ★]
- 中国の渡航自粛要請1カ月 大阪の観光バス予約ゼロ、東北にも波及 [蚤の市★]
- そこまでカワイイ顔じゃないが、魅力的なブサかわいい顔👈だれそうぞうした? [839143615]
- 女だが
- なぜ、ネトウヨは例外なく狂っているのか? [805596214]
- 🏡おい!返事しろ︎︎!知的障害者!
- 高市、メガソーラー廃止。環境破壊が社会問題化 [792147417]
- (´・ω・`)出かけたいけど雨降ってるから出かけることはできない
