X



Perlについての質問箱 63箱目
■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん
垢版 |
2014/02/19(水) 23:36:23.29
CGIについての質問は板違いです。WEBプログラミング板でどうぞ。
CGIとPerlの区別がつかない人もWEBプログラミング板に行ってください。
(WEBプログラミング板: http://kohada.2ch.net/php/

このスレでは(CGI以外の)純粋にPerlのみに関係する質問を取り扱っていこうと思います。
スレ違いの質問にはスルーか、速やかな誘導をお願いします。
荒らしはスルー推奨。

"The duct tape of the Internet" こと、Perlについての質問箱です。
"There's more than one way to do it" ということで、
Perlの奥深さについて皆で語り合い、追求してまいりましょう。

www.perl.org/get.html
Download Latest Stable Source (5.18.2)

▼前スレ
Perlについての質問箱 61箱目
http://toro.2ch.net/test/read.cgi/tech/1381561905/
Perlについての質問箱 62箱目
http://toro.2ch.net/test/read.cgi/tech/1385039352/
0178デフォルトの名無しさん
垢版 |
2016/06/03(金) 12:58:52.91ID:a9xFHzmZ
>>176
いまいち良い方法が見つからなかった
再帰処理でがりがり頑張ったけど、ものすごい時間が掛かってしまった

>>177
ありがとう
無事いけた
コマンドライン詳しくないから、NULでひかかった
NULの代わりに、list.txtなどにするとサクッと記録された
速度滅茶苦茶早いなー
0179デフォルトの名無しさん
垢版 |
2016/06/04(土) 15:10:16.50ID:d7ojMir6
ループの条件を満たしてなくてもredoでループされるんだけど、そうゆうことでいいのかな
0181デフォルトの名無しさん
垢版 |
2016/06/04(土) 16:50:14.92ID:d7ojMir6
>redo コマンドは、条件を再評価しないで、ループブロックの始めからもう一度 実行を開始します
そうかそうか、これが欲しかった。どうも。
0182デフォルトの名無しさん
垢版 |
2016/06/08(水) 04:54:48.15ID:c/sFGpfw
ちょっと相談と言うか、バグの原因が想像つかなくてこまっちんぐなんだけど、

$| = 1;
for(.....){
................
.................
print $x;
}

みたいな感じでいっぱいプリントしてる時、
プロセス実行中は8.00KB(8192B)しか出力されないんだよね。

本来は9.22KB程度出力されるはずで、これはプロセスが終了したら出力される。
0185デフォルトの名無しさん
垢版 |
2016/06/08(水) 15:34:08.08ID:1ofjxszc
10GBくらいのCSVで作成された辞書の文字を置換して出力する場合最も適切な方法はどんな感じ?
すぐ思いつくのは下記だけど、膨大な回数HDDにアクセスして大丈夫かと不安になるがバッファリングされるから影響はないかな?

open(IN,"<Wikipedia.txt");
open(OUT,">>test.txt");
while(<IN>){
$_ =~ s/<|>/<>/g;
print OUT $_;
}
close OUT;
close IN;
0186デフォルトの名無しさん
垢版 |
2016/06/08(水) 15:38:30.27ID:c/sFGpfw
そら最低の理論値でも10GB分HDDから読み出しして10GB分HDDに書き出ししないとな
0187デフォルトの名無しさん
垢版 |
2016/06/08(水) 15:56:29.67ID:1ofjxszc
>>186
単にリードするだけなら10GBは大丈夫だろうけど、
出力のバッファリングが甘いと、何度も書き込みHDDに凄い負担掛かるんじゃないかと思って・・・
因みに、昔は下記みたいにしてた、やたらHDDがガリガリ言ってた気がする
正しい方法はどうするのが良いのかと思ってね・・・

$| = 1;
open(IN,"<Wikipedia.txt");
while(<IN>){
 open(OUT,">>test.txt");
 $_ =~ s/<|>/<>/g;
 print OUT $_;
 close OUT;
 print $count++;
 print "\n";
}
close IN;
0190デフォルトの名無しさん
垢版 |
2016/06/12(日) 12:28:41.66ID:JDueIOd3
どんな言語で書いても10GBのHDDをアクセスすること自体に変わりはない。
温度が上昇してエラーになるなら、扇風機で冷やしながら実行するとよい。
0192デフォルトの名無しさん
垢版 |
2016/06/12(日) 13:26:20.33ID:0HO5/jac
そもそも10GBのテキストなんざ、
今の基準で言えば普通よりちょっとデカい程度。

日常的に扱かってる人間からすれば、質問自体が意味不明。

一回こっきりの捨てスクリプトなんだろうから、
検証以前にさっさと書いて終りにすりゃあいい。
0193デフォルトの名無しさん
垢版 |
2016/06/12(日) 14:32:37.22ID:wrakKGfW
でも>>187は毎回やってると流石にHDD痛めそうな気がする
ベストな方法や、やってはならない方法はあるでしょ
0194デフォルトの名無しさん
垢版 |
2016/06/12(日) 15:01:08.44ID:0HO5/jac
ちょっと待って>>187は、論外だろ?
これを含めて、ベスト云々を議論すんなら、
「初歩から教えろ」って言ってるのと変らんぞ?

普通に、>>185でいいじゃん。
>>186とか、>>190とか指摘してる通り、
どうあがこうが、10GBの書き込みは生じるんだから。
0195デフォルトの名無しさん
垢版 |
2016/06/12(日) 16:03:16.27ID:ve4Ih4ce
まぁ俺は10GB程度のファイル、頻繁にDLしたり削除したりコピーしたり色々してるけどな、ほぼ毎日。
0196デフォルトの名無しさん
垢版 |
2016/06/12(日) 18:22:13.25ID:wrakKGfW
プログラムもだけど$|=1;使って動作確認してたり、
バッファリング無し、バッチ処理で毎晩10GB1行毎の書き込みは流石にまずいんじゃない?

185も$|=1;使ったらどんな動作になるんだろ?

187はコードが見やすくなるからテストでは結構使ってる
そのまま忘れてて大きなファイルを解析させてたりもある
みんな185形式で書いてるの?
0197デフォルトの名無しさん
垢版 |
2016/06/12(日) 18:23:39.84ID:wrakKGfW
速度も考えて最近は配列に貯めてからすることがある
ただWindowsだとすぐout of memoryでる
0199デフォルトの名無しさん
垢版 |
2016/06/12(日) 19:00:15.13ID:ve4Ih4ce
でもPerlってメモリの量が異常に増えるんだよね
10MBのデータを読み込んでごにょごにょしてたらなぜかメモリ200MBになってたり
普通にネイティブな言語使ったほうがいいのでは
0200デフォルトの名無しさん
垢版 |
2016/06/12(日) 21:45:18.08ID:0HO5/jac
どんなレス考えても、罵倒しか思い浮ばん。

HDDの負担以前の問題だよ。
open/closeを行数分繰替えすのが、
どれだけ時間の無駄(=マシンに負荷がかかる)か実例貼っとく。

$ perl -le ' sub ps { print `ps ux $$`}; ps ; for( 0 .. 9999999 ){ open my $h, ">>", "test.txt" ; print {$h} "h" } ; ps ;'
USER PID %CPU %MEM VSZ RSS TT STAT STARTED TIME COMMAND
XXXXX 36471 13.2 0.1 2445400 3344 s002 S+ 8:24PM 0:00.16 perl -le sub ps { print `ps ux $$`}; ps ; for( 0 .. 9999999 ){ open my $h, ">>", "test.txt" ; print {$h} "h" } ; ps ;

USER PID %CPU %MEM VSZ RSS TT STAT STARTED TIME COMMAND
XXXXX 36471 22.5 0.0 2445400 1664 s002 S+ 8:24PM 24:21.88 perl -le sub ps { print `ps ux $$`}; ps ; for( 0 .. 9999999 ){ open my $h, ">>", "test.txt" ; print {$h} "h" } ; ps ;

CPU time で24分だけど、実際には、9時半まで処理掛かってる。
0201デフォルトの名無しさん
垢版 |
2016/06/12(日) 21:49:23.64ID:0HO5/jac
$ perl -le ' sub ps { print `ps ux $$`}; ps ; open my $h, ">", "test.txt" ; for( 0 .. 9999999 ){ print {$h} "h" } ; ps ;'
USER PID %CPU %MEM VSZ RSS TT STAT STARTED TIME COMMAND
XXXXX 40081 7.0 0.1 2445400 3324 s002 R+ 9:36PM 0:00.09 perl -le sub ps { print `ps ux $$`}; ps ; open my $h, ">", "test.txt" ; for( 0 .. 9999999 ){ print {$h} "h" } ; ps ;

USER PID %CPU %MEM VSZ RSS TT STAT STARTED TIME COMMAND
XXXXX 40081 96.8 0.1 2445400 3340 s002 S+ 9:36PM 0:03.08 perl -le sub ps { print `ps ux $$`}; ps ; open my $h, ">", "test.txt" ; for( 0 .. 9999999 ){ print {$h} "h" } ; ps ;

$ ls -alh test.txt
-rw-r--r-- 1 XXXXX staff 19M 6 12 21:36 test.txt

今の時代の強力なマシンだろうが、こんだけ負担をかける事は、一昔前の人間だったら常識の範囲。

ちなみにフラッシュしようが、出力される量は変動しないんだから、
HDDの負担は変らん。と何回指摘されりゃ気が済むんだ?
0203デフォルトの名無しさん
垢版 |
2016/06/12(日) 23:18:14.97ID:wrakKGfW
>>201
今の時代マシーンパワーに物言わせてと言うことが意外と出来きてしまう
勿論、限度はあるけど
朝までに終わればいいわ程度で一度コード作ったらあとは触らないとかね
それと、昔デフラグし過ぎるとHDDが壊れるとか言われてた
出力される量でHDDの劣化が決まるって話だけど、細かいファイルを大量に書いたり作成するのはHDDにとって過大な負担になるんじゃない?
例えばだけど、100GBのファイル一つ書き込むのと、1バイトのファイルを100GB分毎回書き込むのでは違うと思うのだが?

>>198
配列をアホみたいに増やしたらメモリー(SSDで仮想いくらでも増やせるし)が一杯になる前に落ちる
0204デフォルトの名無しさん
垢版 |
2016/06/12(日) 23:41:21.09ID:0HO5/jac
>>203
意味不明。
細かいファイルの件なんか、俺のコードにも、>>185にも>>187にも
全く触れられてないんだけど?

百歩譲って、断片化の可能性が高まるのは、open/close を繰替えす
>>187のコード(膨大な処理時間中に他のIOが割って入る)だが、
擁護してんのか晒してんのかも不明。
0205デフォルトの名無しさん
垢版 |
2016/06/12(日) 23:49:21.59ID:xguVhByI
>>201
> ちなみにフラッシュしようが、出力される量は変動しないんだから、
> HDDの負担は変らん。と何回指摘されりゃ気が済むんだ?

出力される量は変動しなくても
書き込み回数は増えるじゃん。

フラッシュって何をやってるのか知らないの?
HDDに書き込まないでメモリに蓄えているものを
書き出す処理だぞ。

だからHDDの負担は増える。
0206デフォルトの名無しさん
垢版 |
2016/06/12(日) 23:52:30.66ID:xguVhByI
ちなみに、出力される量も実際に変動する。

HDDに限らないが通常書き込みっていうのは
ブロック単位で書き込まれる。

HDDの場合は512バイトだったり最近は4Kバイトだったりする。
1バイトの書き込みでも4Kバイト書き込まれるわけだ。

だからデータ量が1000バイトだった場合、
フラッシュ無しだと4KBの書き込みだが
1バイト毎にフラッシュすると、4KB×1000=4MBの書き込み量になる。

ファイルサイズはどちらも同じ1000バイトであっても
それを作るための書き込み量は違う。
0207デフォルトの名無しさん
垢版 |
2016/06/13(月) 00:08:38.69ID:GclKUW1b
>ちなみにフラッシュしようが、出力される量は変動しないんだから、
>HDDの負担は変らん。と何回指摘されりゃ気が済むんだ?
この二行は、あなたのご指摘通り。
訂正します。

>>187
>$| = 1;
は、*OUTのフラッシュになんの関与もしていないけど。
0208デフォルトの名無しさん
垢版 |
2016/06/13(月) 00:32:22.24ID:Yqh2uzvZ
>>204
205-206が言いたいこと言ってくれた
擁護でも晒すわけでもなく、より適切な方法が見つかれば良いと思う
185にしても、もっとバッファリングしてやればHDDへのIOが減りHDDの負担は減るんじゃないかなと
標準だと4/8KBでフラッシュしてるよね、これを100MBにすればHDDへの負担はぐっと減りそう
今時のキャッシュ大きめのHDDでどの程度意味があるのか分からないし
寿命に影響するかどうかは分からないけど毎日繰り返す処理なら意味があるかも

>>207
そうなの?って思って調べてみた
http://mikeda.hatenablog.com/entry/20090503/1241365884
みたらselectしないと効かないっぽいな
0209デフォルトの名無しさん
垢版 |
2016/06/13(月) 01:15:56.79ID:w1lAZiF2
夏場なんで、while ブロックの先頭に
sleep 2 unless $. % 10000;
を入れるとよい。2つの数字は調整してみてくれ。
0210デフォルトの名無しさん
垢版 |
2016/06/13(月) 15:19:04.03ID:bjrR9GHC
#!/usr/bin/perl -w

use strict;
use File::Path;
use IO::File;

sub diskstat {
 system(
0211デフォルトの名無しさん
垢版 |
2016/06/13(月) 16:48:17.11ID:bjrR9GHC
https://ideone.com/fUNKyh

このプログラムの意図 : >>185>>187 の違いがディスクアクセスに及ぼす影響の検証。

明らかに >>185 よりも >>187 の方がシステムコールの回数が多い。
しかし、それだけでディスクアクセスに違いが出てくるわけではない。
実行時間を同程度にしてみたらどうなるだろうか。
実行する前に
grep sda5
の sda5 を環境に合わせて書き換えてほしい。
0212デフォルトの名無しさん
垢版 |
2016/06/14(火) 01:15:43.18ID:M6DJWkXG
> 実行時間を同程度にしてみたらどうなるだろうか。

実行時間を同程度にしたら、遅い方の書き込み量が減るから
比較にならんだろw
0213デフォルトの名無しさん
垢版 |
2016/06/14(火) 20:04:47.85ID:UhtJW9b9
プログラムを見てくれてないのかな……だとしたらその時点でもう対象外なんだけど。
ろくに見もしないで何を想像したの?
0214デフォルトの名無しさん
垢版 |
2016/06/15(水) 01:35:53.40ID:7O5/ia9k
そう言えば古いDiffソフト(AikoWin)やたらHDDガリガリ音鳴ってたな
あれ読み出しが少しずつでHDDに相当の負担が掛かるとか聞いたことがある
細かいファイルを書き込むのも良くないけど、自分でソフト作る時にには
呼び出しも気を付けないとまずいんだよなー
0215211
垢版 |
2016/06/15(水) 12:03:11.68ID:rzJhZO2i
もう少しマシなプログラムを書いてみたよ。

https://ideone.com/Nh4Esi

Linux 限定だけど無修正で実行できる。
実行時間は 5 分くらいかかるよ。正確なデータを得るにはそうした方がいいみたいなんだ……
0216デフォルトの名無しさん
垢版 |
2016/06/15(水) 13:23:28.38ID:rzJhZO2i
自分の実行結果を書いておくよ。

sub f_a {
 my $fh = IO::File->new( &genfn(),'>') || die( $!);
 $fh->autoflush( 0);
 $fh->print('h') foreach 0 .. 65535;
 $fh->close;
}

sub f_b {
 my $fh = IO::File->new( &genfn(),'>') || die( $!);
 $fh->autoflush( 1);
 $fh->print('h') foreach 0 .. 65535;
 $fh->close;
}

sub f_c {
 my $fn = &genfn();
 foreach ( 0 .. 65535) {
  my $fh = IO::File->new( $fn,'>>') || die( $!);
  $fh->print('h');
  $fh->close;
 }
}

これらを 16 回ずつ実行した結果、f_a,f_b はそれぞれ 2232 セクタ、
f_c は 2224 セクタ書き込んだみたいだよ。もちろん書き込んだ回数だよ。
0217デフォルトの名無しさん
垢版 |
2016/06/15(水) 17:57:12.29ID:rzJhZO2i
https://ideone.com/K0qeSx

もう少しユーザーフレンドリーな感じにしてみたよ。これで最後だよ。
Windows ではこういう情報を得る方法は無いの?
非同期書き込みが無いのなら彼らの言うことも間違いではないんだけど。
0219218
垢版 |
2016/06/18(土) 13:00:49.64ID:zTifxauk
一行構文のOPだとわかりました。

しかし、
C:\perl\bin\perl -e 'for $i (@ARGV) { print $i ,"\n";}' args1 args2 args3
をWindows環境で実行すると
Can't find string terminator "'" anywhere before EOF at -e line 1
と出てしまいます。
解決方法を教えほしいです。
0221デフォルトの名無しさん
垢版 |
2016/06/18(土) 14:22:55.12ID:zTifxauk
C:\perl\bin\perl -e 'for $i (@ARGV) { "print $i ,qq(\n)";}' args1 args2 args3
で試したがダメでした…
0222デフォルトの名無しさん
垢版 |
2016/06/18(土) 14:58:07.42ID:h9LNivvl
>>221
俺は昨日から始めたんで確かなことは言えないけど、
DOSプロンプトだと、''で括ってもダメだったよ
(何か設定があるんだけど昨日からなんで...)
例えば、
perl -e 'print "hello"'

perl -e "print \"Hello World\n\""
ってしないと動かなかった
0223デフォルトの名無しさん
垢版 |
2016/06/18(土) 15:22:54.54ID:h9LNivvl
よくよく考えたら、コマンドプロンプトで''はいけるはず無いよね
だって、まずコマンドプロンプトで命令が解釈されるわけだから
'a b'だと、連続した文字列とはならずに
'aとb'の2つの引数が指定されたと受け取られちゃうわけだしね
0224デフォルトの名無しさん
垢版 |
2016/06/18(土) 15:30:14.88ID:xZeqh3Cr
Perl の文法上
"\n"
の代わりに
qq(\n)
と書けますよ……という話じゃないのかなあ。

とりあえず、ググって見つけたページ
http://thinca.hatenablog.com/entry/20100210/1265813598
http://up-cat.net/%25A5%25B3%25A5%25DE%25A5%25F3%25A5%25C9%25A5%25D7%25A5%25ED%25A5%25F3%25A5%25D7%25A5%25C8%25A4%25CE%25A5%25A8%25A5%25B9%25A5%25B1%25A1%25BC%25A5%25D7%25BB%25C5%25CD%25CD.html

相変わらずカオスなんですね。それがいやで Linux に乗り換えたのは前世紀のことなのに……
0225デフォルトの名無しさん
垢版 |
2016/06/18(土) 17:13:02.52ID:Q2VQ6qXf
DOS/Windowsコマンドプロンプトのクォートは "
UNIXのシェルのクォートは '
ただそれだけ
コマンドプロンプトのクォートとして "" を使っているから、Perl部分は
qq() を使ってる
0229デフォルトの名無しさん
垢版 |
2016/06/19(日) 20:43:06.86ID:p98kttl2
ファイルの中身じゃなくて、ファイル名をバイナリかなんかで扱いたいときはどうすれば良いでしょうか
どっかの国のどっか語でファイル名書いてあって、ファイル一覧を入手したら全部文字化けみたいな感じになってて困った
0230デフォルトの名無しさん
垢版 |
2016/06/19(日) 22:30:28.43ID:/GELYJ8A
まず、そのファイルが壊れてないかどうかエンコーディングが判らないことには確認しようがありません。
そして、そこに書かれているファイル名が正しいとしても、問題はそのファイル名で何をするかです。
ファイルを作成するとしたら少々困難を伴うと思いますが、何をしますか?
もう少し説明が欲しいです。
0231デフォルトの名無しさん
垢版 |
2016/06/19(日) 23:56:05.73ID:p98kttl2
1: ファイルは壊れてないです。あとファイルの中身はどうでも良くて困ってるのはファイルですね。

2: こちら側からバイナリを含めて希望してるのでそもそも文字コードは問わないです。
なおwindowsですので強制的な解釈としてはcp932でしょうか。文字かどうかは不明ですか。

3: 書いてある通り、ファイル一覧を入手したいです。(と言うよりすでにしました)。その時点での文字化けについてです。
0233デフォルトの名無しさん
垢版 |
2016/06/20(月) 01:52:28.59ID:3dbzY2ue
>>224
単にprintのあと改行したいだけなら、面倒なエスケープを避けてsayを使うのが楽だと思う。

perl -E ‘say “hoge”;’
0235デフォルトの名無しさん
垢版 |
2016/06/20(月) 02:14:22.79ID:JJJI2UNm
ちゃんと話を追ってればシングルクォートではコマンド文字列をperlに渡せないってことを理解できるのに
だから>>220では全体をダブルクォートで括ってるわけ
0236230
垢版 |
2016/06/20(月) 13:40:47.81ID:cF0IFcLP
>>231
「そのファイルが壊れてないか」と書いたのはファイル一覧のことだったんですが……
まあ、それは置いといて。
困っていると言われても、何をお望みなのかよく分かりません。
マルチバイト文字を作成者が意図した通りの文字として読みたいということなら、
やはりエンコーディングを知る必要があります。
そして、そのエンコーディングを扱うことが出来るソフトウェアと、もちろんフォントも必要です。
どんな環境で、どこからどのような手段で入手して、何をして文字化けだと思ったのか、
それがどうなるのが望みなのかを書いていただけないと、お役に立てそうもありません。
0237デフォルトの名無しさん
垢版 |
2016/06/20(月) 14:10:59.68ID:ppvG3ddJ
ファイル名はテキストだろ。
バイナリのファイル名など、聞いたことがない

フォントが無いだけで、たぶん正常だろ。
それか、ファイル一覧を表示している、端末の文字コードが違うだけ

そのファイル名をエディタにコピーして、色々な文字コードに変えて、試してみる
0238デフォルトの名無しさん
垢版 |
2016/06/20(月) 14:43:14.96ID:og12Zqf+
先日も申しましたが、ファイル名はOSの仕様によってcp932扱いで表示されたバイナリです。
windowsにおけるバイナリとテキストの違いは、改行など一部の文字の解釈です
すなわち、ファイル名を入手した時点で破損しています
0239デフォルトの名無しさん
垢版 |
2016/06/20(月) 15:21:44.17ID:7O0ObdXP
うーん・・・
関係ないけど
ハートマークのファイル名作ったけど、
ちゃんと表示できたよ
0240デフォルトの名無しさん
垢版 |
2016/06/20(月) 15:27:52.95ID:JJJI2UNm
>>238
「ファイルはテキストだが何のコードでエンコードされたものかわからん」をcp932で開いた
ではなくて
「cp932でエンコードしてしまって、もう元のファイルの情報は欠けてしまった文字化けファイル」を開いた
ってことか?
0242デフォルトの名無しさん
垢版 |
2016/06/20(月) 16:53:54.14ID:cF0IFcLP
もう一度聞くけど、どこからどのような手段で入手して、どうやって見てるの?
どうなってほしいの? 使ったソフトウェアの仕様はちゃんと理解できてるの?
0243デフォルトの名無しさん
垢版 |
2016/06/20(月) 23:26:05.47ID:og12Zqf+
Aディレクトリの中のファイル名をopendirでとってくる。
この時のファイル名ってどう言う扱い?バイナリ?テキスト?コードは?フラグは?
とってきたらそれがすでに破損してて開くこともできない。
0246デフォルトの名無しさん
垢版 |
2016/06/21(火) 12:21:49.21ID:yHwsrvxs
-------------------------------------------------------
Perl に関係ない話題は、以上で終了。
0247デフォルトの名無しさん
垢版 |
2016/06/22(水) 02:03:09.88ID:pkNIGL7K
>>ファイルの中身じゃなくて、ファイル名をバイナリかなんかで扱いたいときはどうすれば良いでしょうか
特別なことをしなければバイナリで扱うことになる。むしろファイル名は文字列では扱(え|わ)ない。
0248デフォルトの名無しさん
垢版 |
2016/06/22(水) 17:07:36.10ID:NJ9t5GVO
Perlを使って下記のように2文字半角スペースを入れたいのです。
0015000008006a3376 -> 00 15 00 00 08 00 6a 33 76

下記を教えて貰いましたが旨く出来ません・・・アドバイス願います。
$ perl -p -e 's/(..)/$1 /g;'
001500 -> 00 15 00
0249デフォルトの名無しさん
垢版 |
2016/06/22(水) 17:34:24.64ID:MK9gPhs4
いや、ちゃんとその通りになったけど……どううまくいかなかったの?
末尾にスペースが入っちゃいかんとかなら、方法はあるけど。
0251デフォルトの名無しさん
垢版 |
2016/06/22(水) 17:44:10.61ID:NJ9t5GVO
試したのは下記ですが、進まないと言うか終らないんです。
連続数字は変えますが・・・123456に変更
perl -p -e 's/ 123456/$1 /g;'

perl -p -e 's/(123456)/$1 /g;'

perl -p -e 's/( 123456)/$1 /g;'

perl -p -e 's/\(123456\)/$1 /g;'
0253デフォルトの名無しさん
垢版 |
2016/06/22(水) 19:34:58.14ID:NJ9t5GVO
>>252
色々と試行錯誤した中で試してみましたが、ドットを入れるならスペース入れても
同じような・・・
perl -p -e 's/(12.34.56)/$1 /g;'
0254デフォルトの名無しさん
垢版 |
2016/06/22(水) 19:45:27.49ID:9eEpB7QB
もう連続した数値を2桁ずつ区切るとは話が違ってきてるぞ
まあ色々試しているんだろうが、まず正規表現をちゃんと勉強した方が結局は早道だよ
0255デフォルトの名無しさん
垢版 |
2016/06/22(水) 20:13:59.90ID:SZhXzwW9
>>253
正規表現を使っているという事は理解してる?
ドット一つは「任意の一文字」を意味しているのだけれども…
0257デフォルトの名無しさん
垢版 |
2016/06/22(水) 20:36:25.70ID:jdKVcriH
s/(..)/$1 /g

( ) で囲むと、キャプチャーできて、$1〜9 で後方参照できる。
. は、任意の1文字だから、.. で2文字

その2文字を、$1で参照して、その後ろに、半角空白を付けている。
$1の後ろに、半角空白があるだろ

g(global)フラグは、すべて置換する

だから、ab なら、ab半角空白 となる。
正規表現の説明を参照
0258デフォルトの名無しさん
垢版 |
2016/06/22(水) 20:38:53.55ID:q7cmPaAS
質問者は本当にやりたいことを隠して質問してるからもうどおでもいいけど
なぜ  perl -p -e 's/(..)/$1 /g;' でうまくいっちゃうんだろうね。

ぱっと見だと
001500 -> 00 01 15 50 00
になってもおかしくないのになと思った。
0259デフォルトの名無しさん
垢版 |
2016/06/22(水) 21:11:10.25ID:NJ9t5GVO
>>249->>258 皆さまスレ汚してすみませんでした。
Perlは使うばかりで、プログラミングはど素人です。
(..)は顔文字だと思っていました・・・お恥ずかしい

○○○@H170M-PLUS ~
$ perl -p -e 's/(..)/$1 /g;'
123456
12 34 56

あ〜スッキリした。
有難うございました。
0260デフォルトの名無しさん
垢版 |
2016/06/22(水) 22:35:11.08ID:jdKVcriH
>>258
1234なら、12 23 34 にはならない

.. は2文字に一致するから、12に一致する。
すると次は、3からスタートするから、34に一致する

つまり、一致した次の文字から、スタートする
0261デフォルトの名無しさん
垢版 |
2016/06/22(水) 23:26:29.09ID:q7cmPaAS
なるほろー。
最初はこんな感じが頭にうかんだけど冗長だね。ワンライナー3級ですな。
perl -ne 'for( $i = 0; $i < length() ; $i += 2 ){ print substr($_,$i,2)" " }'
0263259
垢版 |
2016/06/23(木) 10:28:45.02ID:mgh0+o+/
>>262 _(_^_)_ m(_ _)m
0264デフォルトの名無しさん
垢版 |
2016/06/23(木) 14:28:28.61ID:Fa0lhzij
>>243
もう見てないと思うけど、一応書いとくよ。君はまず、
Perl readdir Windows
でググってみるべきだった。
0265デフォルトの名無しさん
垢版 |
2016/06/28(火) 23:22:27.94ID:sQcX3Fgh
複数の文字列フィルタ (grep や s) を連続で通す書き方って、どうだったっけ?
ある文字列を
 ・grep でフィルタ → grep で再度フィルタ → s で置換 → split で分割 → 先頭要素だけスカラー変数に格納
これをスマートに(可能ならば1行で)やりたい。
0266デフォルトの名無しさん
垢版 |
2016/06/28(火) 23:31:42.78ID:IoEHfO5D
@result = map {(split //)[0]} map {s//;$_} grep {} grep {} @strings;
こんな雰囲気でええんでないかい?
0268デフォルトの名無しさん
垢版 |
2016/07/02(土) 14:22:47.36ID:UtcihNE2
基本的に日本語で書いたときの逆順に記述するだけなんだけどね
マニュアル読んで分からなければたぶん無理だろう
0270デフォルトの名無しさん
垢版 |
2016/07/04(月) 00:55:08.84ID:xC//1vCA
id="011"<width>1</width>

この文字列から011だけ正規表現で抜き出す方法教えてください
idの数値だけを抜き出したい
0272デフォルトの名無しさん
垢版 |
2016/07/04(月) 01:08:21.29ID:xC//1vCA
>>271
ありますが、かなり長いxmlなので必要だと思った部分だけ抜き出しました
もう少し抜き出してみるとこんな感じです

source="http://hogehoge.xml"; />
<name="foo" id="0110"

このような文字列が大量にあってそのなかからidの数値だけが欲しいです
0274デフォルトの名無しさん
垢版 |
2016/07/04(月) 22:53:37.85ID:0oVcG5wM
HTMLパーサーを使うのが一番簡単で正確
コメントの中にHTMLがあったらどうするんだ?

つーか正規表現を乱用するな。
0276デフォルトの名無しさん
垢版 |
2016/07/05(火) 17:36:47.05ID:QGn+r4HY
>>270 だとタグの外にあるように見えるのに >>272 ではタグの中になってる。
だから静観してたけど、結局どっちなの?
0277デフォルトの名無しさん
垢版 |
2016/07/05(火) 17:48:38.40ID:gL12vNid
なんか最初のだと後に<width>のある特定のidの値が欲しいのかな?って思ってたけど
そうでもなくて全部のidの値でいいんだってのが>>273でわかったんで拍子抜けしたところ
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況