Perlについての質問箱 63箱目

**デフォルトの名無しさん** · 2014/02/19(水) 23:36:23.29

CGIについての質問は板違いです。WEBプログラミング板でどうぞ。
CGIとPerlの区別がつかない人もWEBプログラミング板に行ってください。
（WEBプログラミング板: http://kohada.2ch.net/php/）

このスレでは（CGI以外の）純粋にPerlのみに関係する質問を取り扱っていこうと思います。
スレ違いの質問にはスルーか、速やかな誘導をお願いします。
荒らしはスルー推奨。

"The duct tape of the Internet" こと、Perlについての質問箱です。
"There's more than one way to do it" ということで、
Perlの奥深さについて皆で語り合い、追求してまいりましょう。

www.perl.org/get.html
Download Latest Stable Source (5.18.2)

▼前スレ
Perlについての質問箱 61箱目
http://toro.2ch.net/test/read.cgi/tech/1381561905/
Perlについての質問箱 62箱目
http://toro.2ch.net/test/read.cgi/tech/1385039352/

**デフォルトの名無しさん** · 2016/06/03(金) 12:58:52.91

>>176
いまいち良い方法が見つからなかった
再帰処理でがりがり頑張ったけど、ものすごい時間が掛かってしまった

>>177
ありがとう
無事いけた
コマンドライン詳しくないから、NULでひかかった
NULの代わりに、list.txtなどにするとサクッと記録された
速度滅茶苦茶早いなー

**デフォルトの名無しさん** · 2016/06/04(土) 15:10:16.50

ループの条件を満たしてなくてもredoでループされるんだけど、そうゆうことでいいのかな

**デフォルトの名無しさん** · 2016/06/04(土) 15:25:38.27

そのための redo だから。

http://perldoc.jp/index/function

**デフォルトの名無しさん** · 2016/06/04(土) 16:50:14.92

>redo コマンドは、条件を再評価しないで、ループブロックの始めからもう一度実行を開始します
そうかそうか、これが欲しかった。どうも。

**デフォルトの名無しさん** · 2016/06/08(水) 04:54:48.15

ちょっと相談と言うか、バグの原因が想像つかなくてこまっちんぐなんだけど、

$| = 1;
for(.....){
................
.................
print $x;
}

みたいな感じでいっぱいプリントしてる時、
プロセス実行中は8.00KB(8192B)しか出力されないんだよね。

本来は9.22KB程度出力されるはずで、これはプロセスが終了したら出力される。

**デフォルトの名無しさん** · 2016/06/08(水) 05:03:29.17

ちゃんとcloseを記述したら直りました。

**デフォルトの名無しさん** · 2016/06/08(水) 05:36:30.43

どうしても即時出力したいなら、バッファリングで検索

**デフォルトの名無しさん** · 2016/06/08(水) 15:34:08.08

10GBくらいのCSVで作成された辞書の文字を置換して出力する場合最も適切な方法はどんな感じ？
すぐ思いつくのは下記だけど、膨大な回数HDDにアクセスして大丈夫かと不安になるがバッファリングされるから影響はないかな？

open(IN,"<Wikipedia.txt");
open(OUT,">>test.txt");
while(<IN>){
$_ =~ s/<|>/＜＞/g;
print OUT $_;
}
close OUT;
close IN;

**デフォルトの名無しさん** · 2016/06/08(水) 15:38:30.27

そら最低の理論値でも10GB分HDDから読み出しして10GB分HDDに書き出ししないとな

**デフォルトの名無しさん** · 2016/06/08(水) 15:56:29.67

>>186
単にリードするだけなら10GBは大丈夫だろうけど、
出力のバッファリングが甘いと、何度も書き込みHDDに凄い負担掛かるんじゃないかと思って・・・
因みに、昔は下記みたいにしてた、やたらHDDがガリガリ言ってた気がする
正しい方法はどうするのが良いのかと思ってね・・・

$| = 1;
open(IN,"<Wikipedia.txt");
while(<IN>){
　open(OUT,">>test.txt");
　$_ =~ s/<|>/＜＞/g;
　print OUT $_;
　close OUT;
　print $count++;
　print "\n";
}
close IN;

**デフォルトの名無しさん** · 2016/06/09(木) 08:19:20.98

>>185
環境によるのでもう少し小さいデータと思いついたコードでベンチ取れとしか。
http://perldoc.jp/docs/perl/perlperf.pod

**デフォルトの名無しさん** · 2016/06/09(木) 08:56:02.57

>>185
単純な置換、大きなファイルサイズなら、
perl より sed 使ったほうが速いかもな。

**デフォルトの名無しさん** · 2016/06/12(日) 12:28:41.66

どんな言語で書いても10GBのHDDをアクセスすること自体に変わりはない。
温度が上昇してエラーになるなら、扇風機で冷やしながら実行するとよい。

**デフォルトの名無しさん** · 2016/06/12(日) 13:25:11.80

そうかなー
スクリプトだとなにやられてるんだか分からない印象だけど

**デフォルトの名無しさん** · 2016/06/12(日) 13:26:20.33

そもそも10GBのテキストなんざ、
今の基準で言えば普通よりちょっとデカい程度。

日常的に扱かってる人間からすれば、質問自体が意味不明。

一回こっきりの捨てスクリプトなんだろうから、
検証以前にさっさと書いて終りにすりゃあいい。

**デフォルトの名無しさん** · 2016/06/12(日) 14:32:37.22

でも>>187は毎回やってると流石にHDD痛めそうな気がする
ベストな方法や、やってはならない方法はあるでしょ

**デフォルトの名無しさん** · 2016/06/12(日) 15:01:08.44

ちょっと待って>>187は、論外だろ？
これを含めて、ベスト云々を議論すんなら、
「初歩から教えろ」って言ってるのと変らんぞ？

普通に、>>185でいいじゃん。
>>186とか、>>190とか指摘してる通り、
どうあがこうが、10GBの書き込みは生じるんだから。

**デフォルトの名無しさん** · 2016/06/12(日) 16:03:16.27

まぁ俺は10GB程度のファイル、頻繁にDLしたり削除したりコピーしたり色々してるけどな、ほぼ毎日。

**デフォルトの名無しさん** · 2016/06/12(日) 18:22:13.25

プログラムもだけど$|=1;使って動作確認してたり、
バッファリング無し、バッチ処理で毎晩10GB1行毎の書き込みは流石にまずいんじゃない？

185も$|=1;使ったらどんな動作になるんだろ？

187はコードが見やすくなるからテストでは結構使ってる
そのまま忘れてて大きなファイルを解析させてたりもある
みんな185形式で書いてるの？

**デフォルトの名無しさん** · 2016/06/12(日) 18:23:39.84

速度も考えて最近は配列に貯めてからすることがある
ただWindowsだとすぐout of memoryでる

**デフォルトの名無しさん** · 2016/06/12(日) 18:58:39.76

まあ自分のPCならサブマシンでもメモリ32Gあるし別に・・・って感じだが

**デフォルトの名無しさん** · 2016/06/12(日) 19:00:15.13

でもPerlってメモリの量が異常に増えるんだよね
10MBのデータを読み込んでごにょごにょしてたらなぜかメモリ200MBになってたり
普通にネイティブな言語使ったほうがいいのでは

**デフォルトの名無しさん** · 2016/06/12(日) 21:45:18.08

どんなレス考えても、罵倒しか思い浮ばん。

HDDの負担以前の問題だよ。
open/closeを行数分繰替えすのが、
どれだけ時間の無駄（=マシンに負荷がかかる）か実例貼っとく。

$ perl -le ' sub ps { print `ps ux $$`}; ps ; for( 0 .. 9999999 ){ open my $h, ">>", "test.txt" ; print {$h} "h" } ; ps ;'
USER PID %CPU %MEM VSZ RSS TT STAT STARTED TIME COMMAND
XXXXX 36471 13.2 0.1 2445400 3344 s002 S+ 8:24PM 0:00.16 perl -le sub ps { print `ps ux $$`}; ps ; for( 0 .. 9999999 ){ open my $h, ">>", "test.txt" ; print {$h} "h" } ; ps ;

USER PID %CPU %MEM VSZ RSS TT STAT STARTED TIME COMMAND
XXXXX 36471 22.5 0.0 2445400 1664 s002 S+ 8:24PM 24:21.88 perl -le sub ps { print `ps ux $$`}; ps ; for( 0 .. 9999999 ){ open my $h, ">>", "test.txt" ; print {$h} "h" } ; ps ;

CPU time で24分だけど、実際には、9時半まで処理掛かってる。

**デフォルトの名無しさん** · 2016/06/12(日) 21:49:23.64

$ perl -le ' sub ps { print `ps ux $$`}; ps ; open my $h, ">", "test.txt" ; for( 0 .. 9999999 ){ print {$h} "h" } ; ps ;'
USER PID %CPU %MEM VSZ RSS TT STAT STARTED TIME COMMAND
XXXXX 40081 7.0 0.1 2445400 3324 s002 R+ 9:36PM 0:00.09 perl -le sub ps { print `ps ux $$`}; ps ; open my $h, ">", "test.txt" ; for( 0 .. 9999999 ){ print {$h} "h" } ; ps ;

USER PID %CPU %MEM VSZ RSS TT STAT STARTED TIME COMMAND
XXXXX 40081 96.8 0.1 2445400 3340 s002 S+ 9:36PM 0:03.08 perl -le sub ps { print `ps ux $$`}; ps ; open my $h, ">", "test.txt" ; for( 0 .. 9999999 ){ print {$h} "h" } ; ps ;

$ ls -alh test.txt
-rw-r--r-- 1 XXXXX staff 19M 6 12 21:36 test.txt

今の時代の強力なマシンだろうが、こんだけ負担をかける事は、一昔前の人間だったら常識の範囲。

ちなみにフラッシュしようが、出力される量は変動しないんだから、
HDDの負担は変らん。と何回指摘されりゃ気が済むんだ？

**デフォルトの名無しさん** · 2016/06/12(日) 21:54:39.02

>>200,>>201は、>>196へ。

**デフォルトの名無しさん** · 2016/06/12(日) 23:18:14.97

>>201
今の時代マシーンパワーに物言わせてと言うことが意外と出来きてしまう
勿論、限度はあるけど
朝までに終わればいいわ程度で一度コード作ったらあとは触らないとかね
それと、昔デフラグし過ぎるとHDDが壊れるとか言われてた
出力される量でHDDの劣化が決まるって話だけど、細かいファイルを大量に書いたり作成するのはHDDにとって過大な負担になるんじゃない？
例えばだけど、100GBのファイル一つ書き込むのと、1バイトのファイルを100GB分毎回書き込むのでは違うと思うのだが？

>>198
配列をアホみたいに増やしたらメモリー（SSDで仮想いくらでも増やせるし）が一杯になる前に落ちる

**デフォルトの名無しさん** · 2016/06/12(日) 23:41:21.09

>>203
意味不明。
細かいファイルの件なんか、俺のコードにも、>>185にも>>187にも
全く触れられてないんだけど？

百歩譲って、断片化の可能性が高まるのは、open/close を繰替えす
>>187のコード（膨大な処理時間中に他のIOが割って入る）だが、
擁護してんのか晒してんのかも不明。

**デフォルトの名無しさん** · 2016/06/12(日) 23:49:21.59

>>201
> ちなみにフラッシュしようが、出力される量は変動しないんだから、
> HDDの負担は変らん。と何回指摘されりゃ気が済むんだ？

出力される量は変動しなくても
書き込み回数は増えるじゃん。

フラッシュって何をやってるのか知らないの？
HDDに書き込まないでメモリに蓄えているものを
書き出す処理だぞ。

だからHDDの負担は増える。

**デフォルトの名無しさん** · 2016/06/12(日) 23:52:30.66

ちなみに、出力される量も実際に変動する。

HDDに限らないが通常書き込みっていうのは
ブロック単位で書き込まれる。

HDDの場合は512バイトだったり最近は4Kバイトだったりする。
1バイトの書き込みでも4Kバイト書き込まれるわけだ。

だからデータ量が1000バイトだった場合、
フラッシュ無しだと4KBの書き込みだが
1バイト毎にフラッシュすると、4KB×1000=4MBの書き込み量になる。

ファイルサイズはどちらも同じ1000バイトであっても
それを作るための書き込み量は違う。

**デフォルトの名無しさん** · 2016/06/13(月) 00:08:38.69

>ちなみにフラッシュしようが、出力される量は変動しないんだから、
>HDDの負担は変らん。と何回指摘されりゃ気が済むんだ？
この二行は、あなたのご指摘通り。
訂正します。

>>187の
>$| = 1;
は、*OUTのフラッシュになんの関与もしていないけど。

**デフォルトの名無しさん** · 2016/06/13(月) 00:32:22.24

>>204
205-206が言いたいこと言ってくれた
擁護でも晒すわけでもなく、より適切な方法が見つかれば良いと思う
185にしても、もっとバッファリングしてやればHDDへのIOが減りHDDの負担は減るんじゃないかなと
標準だと4/8KBでフラッシュしてるよね、これを100MBにすればHDDへの負担はぐっと減りそう
今時のキャッシュ大きめのHDDでどの程度意味があるのか分からないし
寿命に影響するかどうかは分からないけど毎日繰り返す処理なら意味があるかも

>>207
そうなの？って思って調べてみた
http://mikeda.hatenablog.com/entry/20090503/1241365884
みたらselectしないと効かないっぽいな

**デフォルトの名無しさん** · 2016/06/13(月) 01:15:56.79

夏場なんで、while ブロックの先頭に
sleep 2 unless $. % 10000;
を入れるとよい。2つの数字は調整してみてくれ。

**デフォルトの名無しさん** · 2016/06/13(月) 15:19:04.03

#!/usr/bin/perl -w

use strict;
use File::Path;
use IO::File;

sub diskstat {
　system(

**デフォルトの名無しさん** · 2016/06/13(月) 16:48:17.11

https://ideone.com/fUNKyh

このプログラムの意図 : >>185 と >>187 の違いがディスクアクセスに及ぼす影響の検証。

明らかに >>185 よりも >>187 の方がシステムコールの回数が多い。
しかし、それだけでディスクアクセスに違いが出てくるわけではない。
実行時間を同程度にしてみたらどうなるだろうか。
実行する前に
grep sda5
の sda5 を環境に合わせて書き換えてほしい。

**デフォルトの名無しさん** · 2016/06/14(火) 01:15:43.18

> 実行時間を同程度にしてみたらどうなるだろうか。

実行時間を同程度にしたら、遅い方の書き込み量が減るから
比較にならんだろｗ

**デフォルトの名無しさん** · 2016/06/14(火) 20:04:47.85

プログラムを見てくれてないのかな……だとしたらその時点でもう対象外なんだけど。
ろくに見もしないで何を想像したの？

**デフォルトの名無しさん** · 2016/06/15(水) 01:35:53.40

そう言えば古いDiffソフト（AikoWin）やたらHDDガリガリ音鳴ってたな
あれ読み出しが少しずつでHDDに相当の負担が掛かるとか聞いたことがある
細かいファイルを書き込むのも良くないけど、自分でソフト作る時にには
呼び出しも気を付けないとまずいんだよなー

**211** · 2016/06/15(水) 12:03:11.68

もう少しマシなプログラムを書いてみたよ。

https://ideone.com/Nh4Esi

Linux 限定だけど無修正で実行できる。
実行時間は 5 分くらいかかるよ。正確なデータを得るにはそうした方がいいみたいなんだ……

**デフォルトの名無しさん** · 2016/06/15(水) 13:23:28.38

自分の実行結果を書いておくよ。

sub f_a {
　my $fh = IO::File->new( &genfn(),'>') || die( $!);
　$fh->autoflush( 0);
　$fh->print('h') foreach 0 .. 65535;
　$fh->close;
}

sub f_b {
　my $fh = IO::File->new( &genfn(),'>') || die( $!);
　$fh->autoflush( 1);
　$fh->print('h') foreach 0 .. 65535;
　$fh->close;
}

sub f_c {
　my $fn = &genfn();
　foreach ( 0 .. 65535) {
　　my $fh = IO::File->new( $fn,'>>') || die( $!);
　　$fh->print('h');
　　$fh->close;
　}
}

これらを 16 回ずつ実行した結果、f_a,f_b はそれぞれ 2232 セクタ、
f_c は 2224 セクタ書き込んだみたいだよ。もちろん書き込んだ回数だよ。

**デフォルトの名無しさん** · 2016/06/15(水) 17:57:12.29

https://ideone.com/K0qeSx

もう少しユーザーフレンドリーな感じにしてみたよ。これで最後だよ。
Windows ではこういう情報を得る方法は無いの？
非同期書き込みが無いのなら彼らの言うことも間違いではないんだけど。

**デフォルトの名無しさん** · 2016/06/18(土) 11:42:41.43

$ perl -p -e ～
となっているのですが、-p と -e の意味を教えてください。

**218** · 2016/06/18(土) 13:00:49.64

一行構文のOPだとわかりました。

しかし、
C:\perl\bin\perl -e 'for $i (@ARGV) { print $i ,"\n";}' args1 args2 args3
をWindows環境で実行すると
Can't find string terminator "'" anywhere before EOF at -e line 1
と出てしまいます。
解決方法を教えほしいです。

**デフォルトの名無しさん** · 2016/06/18(土) 13:07:12.42

'print "\n"'ではなく"print qq(\n)"のように

**デフォルトの名無しさん** · 2016/06/18(土) 14:22:55.12

C:\perl\bin\perl -e 'for $i (@ARGV) { "print $i ,qq(\n)";}' args1 args2 args3
で試したがダメでした…

**デフォルトの名無しさん** · 2016/06/18(土) 14:58:07.42

>>221
俺は昨日から始めたんで確かなことは言えないけど、
DOSプロンプトだと、''で括ってもダメだったよ
（何か設定があるんだけど昨日からなんで．．．）
例えば、
perl -e 'print "hello"'
は
perl -e "print \"Hello World\n\""
ってしないと動かなかった

**デフォルトの名無しさん** · 2016/06/18(土) 15:22:54.54

よくよく考えたら、コマンドプロンプトで''はいけるはず無いよね
だって、まずコマンドプロンプトで命令が解釈されるわけだから
'a b'だと、連続した文字列とはならずに
'aとb'の2つの引数が指定されたと受け取られちゃうわけだしね

**デフォルトの名無しさん** · 2016/06/18(土) 15:30:14.88

Perl の文法上
"\n"
の代わりに
qq(\n)
と書けますよ……という話じゃないのかなあ。

とりあえず、ググって見つけたページ
http://thinca.hatenablog.com/entry/20100210/1265813598
http://up-cat.net/%25A5%25B3%25A5%25DE%25A5%25F3%25A5%25C9%25A5%25D7%25A5%25ED%25A5%25F3%25A5%25D7%25A5%25C8%25A4%25CE%25A5%25A8%25A5%25B9%25A5%25B1%25A1%25BC%25A5%25D7%25BB%25C5%25CD%25CD.html

相変わらずカオスなんですね。それがいやで Linux に乗り換えたのは前世紀のことなのに……

**デフォルトの名無しさん** · 2016/06/18(土) 17:13:02.52

DOS/Windowsコマンドプロンプトのクォートは "
UNIXのシェルのクォートは '
ただそれだけ
コマンドプロンプトのクォートとして "" を使っているから、Perl部分は
qq() を使ってる

**デフォルトの名無しさん** · 2016/06/18(土) 17:51:48.00

すごいにゃー。ワシは動けばいいやなんで。

**デフォルトの名無しさん** · 2016/06/18(土) 17:53:59.52

動かないんだろ？

**デフォルトの名無しさん** · 2016/06/18(土) 20:50:09.79

PowerShell_ISE では、どうなる？

**デフォルトの名無しさん** · 2016/06/19(日) 20:43:06.86

ファイルの中身じゃなくて、ファイル名をバイナリかなんかで扱いたいときはどうすれば良いでしょうか
どっかの国のどっか語でファイル名書いてあって、ファイル一覧を入手したら全部文字化けみたいな感じになってて困った

**デフォルトの名無しさん** · 2016/06/19(日) 22:30:28.43

まず、そのファイルが壊れてないかどうかエンコーディングが判らないことには確認しようがありません。
そして、そこに書かれているファイル名が正しいとしても、問題はそのファイル名で何をするかです。
ファイルを作成するとしたら少々困難を伴うと思いますが、何をしますか？
もう少し説明が欲しいです。

**デフォルトの名無しさん** · 2016/06/19(日) 23:56:05.73

1: ファイルは壊れてないです。あとファイルの中身はどうでも良くて困ってるのはファイルですね。

2: こちら側からバイナリを含めて希望してるのでそもそも文字コードは問わないです。
なおwindowsですので強制的な解釈としてはcp932でしょうか。文字かどうかは不明ですか。

3: 書いてある通り、ファイル一覧を入手したいです。（と言うよりすでにしました）。その時点での文字化けについてです。

**デフォルトの名無しさん** · 2016/06/20(月) 01:41:13.70

文字化けは君の環境のフォントの問題では…

**デフォルトの名無しさん** · 2016/06/20(月) 01:52:28.59

>>224
単にprintのあと改行したいだけなら、面倒なエスケープを避けてsayを使うのが楽だと思う。

perl -E ‘say “hoge”;’

**デフォルトの名無しさん** · 2016/06/20(月) 01:55:16.19

>>231
CPANにあるWin32::Unicodeを使ってみてはどうだろう。

**デフォルトの名無しさん** · 2016/06/20(月) 02:14:22.79

ちゃんと話を追ってればシングルクォートではコマンド文字列をperlに渡せないってことを理解できるのに
だから>>220では全体をダブルクォートで括ってるわけ

**230** · 2016/06/20(月) 13:40:47.81

>>231
「そのファイルが壊れてないか」と書いたのはファイル一覧のことだったんですが……
まあ、それは置いといて。
困っていると言われても、何をお望みなのかよく分かりません。
マルチバイト文字を作成者が意図した通りの文字として読みたいということなら、
やはりエンコーディングを知る必要があります。
そして、そのエンコーディングを扱うことが出来るソフトウェアと、もちろんフォントも必要です。
どんな環境で、どこからどのような手段で入手して、何をして文字化けだと思ったのか、
それがどうなるのが望みなのかを書いていただけないと、お役に立てそうもありません。

**デフォルトの名無しさん** · 2016/06/20(月) 14:10:59.68

ファイル名はテキストだろ。
バイナリのファイル名など、聞いたことがない

フォントが無いだけで、たぶん正常だろ。
それか、ファイル一覧を表示している、端末の文字コードが違うだけ

そのファイル名をエディタにコピーして、色々な文字コードに変えて、試してみる

**デフォルトの名無しさん** · 2016/06/20(月) 14:43:14.96

先日も申しましたが、ファイル名はOSの仕様によってcp932扱いで表示されたバイナリです。
windowsにおけるバイナリとテキストの違いは、改行など一部の文字の解釈です
すなわち、ファイル名を入手した時点で破損しています

**デフォルトの名無しさん** · 2016/06/20(月) 15:21:44.17

うーん・・・
関係ないけど
ハートマークのファイル名作ったけど、
ちゃんと表示できたよ

**デフォルトの名無しさん** · 2016/06/20(月) 15:27:52.95

>>238
「ファイルはテキストだが何のコードでエンコードされたものかわからん」をcp932で開いた
ではなくて
「cp932でエンコードしてしまって、もう元のファイルの情報は欠けてしまった文字化けファイル」を開いた
ってことか？

**デフォルトの名無しさん** · 2016/06/20(月) 16:05:49.21

>>238
破損とは何か。期待値と実際値を言わないとわからん

**デフォルトの名無しさん** · 2016/06/20(月) 16:53:54.14

もう一度聞くけど、どこからどのような手段で入手して、どうやって見てるの？
どうなってほしいの？使ったソフトウェアの仕様はちゃんと理解できてるの？

**デフォルトの名無しさん** · 2016/06/20(月) 23:26:05.47

Aディレクトリの中のファイル名をopendirでとってくる。
この時のファイル名ってどう言う扱い？バイナリ？テキスト？コードは？フラグは？
とってきたらそれがすでに破損してて開くこともできない。

**デフォルトの名無しさん** · 2016/06/20(月) 23:27:22.44

もちろん cp932で定義されてる範囲のバイト列ではバグらないよ

**デフォルトの名無しさん** · 2016/06/21(火) 00:30:40.48

そうですか。
で？

**デフォルトの名無しさん** · 2016/06/21(火) 12:21:49.21

-------------------------------------------------------
Perl に関係ない話題は、以上で終了。

**デフォルトの名無しさん** · 2016/06/22(水) 02:03:09.88

>>ファイルの中身じゃなくて、ファイル名をバイナリかなんかで扱いたいときはどうすれば良いでしょうか
特別なことをしなければバイナリで扱うことになる。むしろファイル名は文字列では扱(え|わ)ない。

**デフォルトの名無しさん** · 2016/06/22(水) 17:07:36.10

Perlを使って下記のように2文字半角スペースを入れたいのです。
0015000008006a3376 -> 00 15 00 00 08 00 6a 33 76

下記を教えて貰いましたが旨く出来ません・・・アドバイス願います。
$ perl -p -e 's/(..)/$1 /g;'
001500 -> 00 15 00

**デフォルトの名無しさん** · 2016/06/22(水) 17:34:24.64

いや、ちゃんとその通りになったけど……どううまくいかなかったの？
末尾にスペースが入っちゃいかんとかなら、方法はあるけど。

**デフォルトの名無しさん** · 2016/06/22(水) 17:34:34.20

それでできたけど。

**デフォルトの名無しさん** · 2016/06/22(水) 17:44:10.61

試したのは下記ですが、進まないと言うか終らないんです。
連続数字は変えますが・・・123456に変更
perl -p -e 's/ 123456/$1 /g;'

perl -p -e 's/(123456)/$1 /g;'

perl -p -e 's/( 123456)/$1 /g;'

perl -p -e 's/$123456$/$1 /g;'

**デフォルトの名無しさん** · 2016/06/22(水) 18:37:34.12

>>251
いや、そのドットが重要なのでは…？

**デフォルトの名無しさん** · 2016/06/22(水) 19:34:58.14

>>252
色々と試行錯誤した中で試してみましたが、ドットを入れるならスペース入れても
同じような・・・
perl -p -e 's/(12.34.56)/$1 /g;'

**デフォルトの名無しさん** · 2016/06/22(水) 19:45:27.49

もう連続した数値を2桁ずつ区切るとは話が違ってきてるぞ
まあ色々試しているんだろうが、まず正規表現をちゃんと勉強した方が結局は早道だよ

**デフォルトの名無しさん** · 2016/06/22(水) 20:13:59.90

>>253
正規表現を使っているという事は理解してる？
ドット一つは「任意の一文字」を意味しているのだけれども…

**デフォルトの名無しさん** · 2016/06/22(水) 20:14:45.08

$string = '012345';
$string =~ s/(..)/$1 /g;

**デフォルトの名無しさん** · 2016/06/22(水) 20:36:25.70

s/(..)/$1 /g

( ) で囲むと、キャプチャーできて、$1～9 で後方参照できる。
. は、任意の1文字だから、.. で2文字

その2文字を、$1で参照して、その後ろに、半角空白を付けている。
$1の後ろに、半角空白があるだろ

g(global)フラグは、すべて置換する

だから、ab なら、ab半角空白となる。
正規表現の説明を参照

**デフォルトの名無しさん** · 2016/06/22(水) 20:38:53.55

質問者は本当にやりたいことを隠して質問してるからもうどおでもいいけど
なぜ　 perl -p -e 's/(..)/$1 /g;'　でうまくいっちゃうんだろうね。

ぱっと見だと
001500 -> 00 01 15 50 00
になってもおかしくないのになと思った。

**デフォルトの名無しさん** · 2016/06/22(水) 21:11:10.25

>>249->>258　皆さまスレ汚してすみませんでした。
Perlは使うばかりで、プログラミングはど素人です。
(..)は顔文字だと思っていました・・・お恥ずかしい

○○○@H170M-PLUS ~
$ perl -p -e 's/(..)/$1 /g;'
123456
12 34 56

あ～スッキリした。
有難うございました。

**デフォルトの名無しさん** · 2016/06/22(水) 22:35:11.08

>>258
1234なら、12 23 34 にはならない

.. は2文字に一致するから、12に一致する。
すると次は、3からスタートするから、34に一致する

つまり、一致した次の文字から、スタートする

**デフォルトの名無しさん** · 2016/06/22(水) 23:26:29.09

なるほろー。
最初はこんな感じが頭にうかんだけど冗長だね。ワンライナー３級ですな。
perl -ne 'for( $i = 0; $i < length() ; $i += 2 ){ print substr($_,$i,2)" " }'

**デフォルトの名無しさん** · 2016/06/23(木) 09:02:33.36

もう顔文字にしか見えない(..)どうしてくれる

**259** · 2016/06/23(木) 10:28:45.02

>>262　_(_^_)_　m(_ _)m

**デフォルトの名無しさん** · 2016/06/23(木) 14:28:28.61

>>243
もう見てないと思うけど、一応書いとくよ。君はまず、
Perl readdir Windows
でググってみるべきだった。

**デフォルトの名無しさん** · 2016/06/28(火) 23:22:27.94

複数の文字列フィルタ (grep や s) を連続で通す書き方って、どうだったっけ？
ある文字列を
　・grep でフィルタ　→　grep で再度フィルタ　→ s で置換　→　split で分割　→　先頭要素だけスカラー変数に格納
これをスマートに（可能ならば1行で）やりたい。

**デフォルトの名無しさん** · 2016/06/28(火) 23:31:42.78

@result = map {(split //)[0]} map {s//;$_} grep {} grep {} @strings;
こんな雰囲気でええんでないかい？

**デフォルトの名無しさん** · 2016/06/29(水) 01:53:58.12

mapやgrepを一行で複数書くのはアホの代表だと思いまーす

**デフォルトの名無しさん** · 2016/07/02(土) 14:22:47.36

基本的に日本語で書いたときの逆順に記述するだけなんだけどね
マニュアル読んで分からなければたぶん無理だろう

**デフォルトの名無しさん** · 2016/07/02(土) 15:01:42.19

批判するならコードかけや

**デフォルトの名無しさん** · 2016/07/04(月) 00:55:08.84

id="011"<width>1</width>

この文字列から011だけ正規表現で抜き出す方法教えてください
idの数値だけを抜き出したい

**デフォルトの名無しさん** · 2016/07/04(月) 00:57:21.80

>>270
これで文字列全体？
その前後にいろんなタグがありそうないやな予感がするんだが？

**デフォルトの名無しさん** · 2016/07/04(月) 01:08:21.29

>>271
ありますが、かなり長いxmlなので必要だと思った部分だけ抜き出しました
もう少し抜き出してみるとこんな感じです

source="http://hogehoge.xml"; />
<name="foo" id="0110"

このような文字列が大量にあってそのなかからidの数値だけが欲しいです

**デフォルトの名無しさん** · 2016/07/04(月) 01:29:50.90

>>270
/id="([0-9]*)/g
これでできたような気がします

**デフォルトの名無しさん** · 2016/07/04(月) 22:53:37.85

HTMLパーサーを使うのが一番簡単で正確
コメントの中にHTMLがあったらどうするんだ？

つーか正規表現を乱用するな。

**デフォルトの名無しさん** · 2016/07/04(月) 22:54:10.05

XMLパーサーか

**デフォルトの名無しさん** · 2016/07/05(火) 17:36:47.05

>>270 だとタグの外にあるように見えるのに >>272 ではタグの中になってる。
だから静観してたけど、結局どっちなの？

**デフォルトの名無しさん** · 2016/07/05(火) 17:48:38.40

なんか最初のだと後に<width>のある特定のidの値が欲しいのかな？って思ってたけど
そうでもなくて全部のidの値でいいんだってのが>>273でわかったんで拍子抜けしたところ