正規表現

**正規表現** · NG

正規表現

**名無しさん＠お腹いっぱい。** · NG

gsub!(/俺の存在/, "")

**名無しさん＠お腹いっぱい。** · NG

捕手

**名無しさん＠お腹いっぱい。** · NG

　　　　　　　ｒｰ､
　　　　｣´￣｀ｌｰ) ＼
　　　　Ｔ¨Ｌ　|_/⌒/
　　　　｀レ￣｀ヽ〈
　　　　 |　　i＿_1
　　　　　_ゝ_／ノ
　　　　Ｌ__jイ´_　）
　　　　　　　 |　　ｲ
　　　　　　 |　　ﾉ--､　　　　　ｒ'⌒ヽ_
　　　　　　　ゝ､_＿_ﾉ二７　　／´￣l､＿,/}:＼
　　　　　　　 |ｰi |　　 l_/　／__ｨ::.　ゝ~_ィ´:;　,ゝ
　　　　　　　 __〉 {　　　　 (Ｔ´ |1:::.　　＼_>､};;_｣
　　　　　　　'ー‐┘ 　　　 !　｀￣''ｧ一､＼　ヽ｝　← 保守
　　　　　　　　　　　　　　　〈｀￣￣＾｀￢ﾉ .::〔￣´
　　　　　　　　　　　　　 1　ヽ　 .:::レ　　ヽ、
　　　　　　　　　　　　　　　　|＿ｲｰ-､_;;j|_:.　　　ゝ、
　　　　　　　　 __,,,... -- |. ｛―――‐ﾌゝ、　〉 -- ...,,,__
　　　　　 _,, -‐　´ 　　　 ,ｒ|__ﾄ,　　　　1ﾆﾉー'´　　　　　　｀　‐- ,,_
　　　 , ‐ ´　　　　　　　　　└―'´　　　　　　　　　　　　　　　　　　　　｀

**名無しさん＠お腹いっぱい。** · NG

>>353
それ捕手じゃなくて投手やっ！ｗｗｗ

**名無しさん＠お腹いっぱい。** · NG

別のスレからの引用
ps ａx |grep '[s]shd'
とやると、grep自身の行にヒットしないそうだけど、なぜ？
sってメタ文字でもなんでもないのに。

**名無しさん＠お腹いっぱい。** · NG

なぜって言われても、自明だが。

**名無しさん＠お腹いっぱい。** · NG

grep sshd と何が違うの？

**名無しさん＠お腹いっぱい。** · NG

あ、ごめん、わかった（ｗ

**名無しさん＠お腹いっぱい。** · NG

grep sshd だと、ps の出力に含まれる "grep sshd" の "sshd" がマッチする。

grep '[s]shd' だと、ps の出力には "grep [s]shd" が含まれるが、
この "[s]shd" は、[s]shd にはマッチしない。よね？わかる？

**名無しさん＠お腹いっぱい。** · NG

なるほど。トリックだな。

**名無しさん＠お腹いっぱい。** · NG

まあバッドノウハウだとも思うけどナー
http://www.namazu.org/~satoru/misc/bad-knowhow.html

**名無しさん＠お腹いっぱい。** · NG

そこまでのものではないと思うけど、
この例だと、頭の中でpsの出力まで加工しちゃうからな（ｗ

**名無しさん＠お腹いっぱい。** · NG

grep -v grep でええやん。

**名無しさん＠お腹いっぱい。** · NG

muttのaliasで
alias keyword Name <mailaddress>
みたいなフォーマットで並んでいるファイルを
alias keyword <mailaddress> # Name
に整形しようと思い,
cat alias | sed 's![[:space:]]*alias[[:space:]]*$[^[:space:]]*$[[:space:]]*$.*$[[:space:]]*<$.*$>!alias \1 <\3> # \2!' > alias.new
としました.

上手く行くんですが, "#" の位置が行ごとにバラバラなのが気持ち悪いです.

そのファイルで "#" 以前の文字数が一番長いものを調べ, そこに合わせて
その他の行の "#" 以降を持ってくるようにするにはどうすればいいんでしょうか?

**名無しさん＠お腹いっぱい。** · NG

sedでやれってか？
漏れはへたれなので、Perlなどを使ってしまうが（ｗ

**名無しさん＠お腹いっぱい。** · NG

>>364
2パスでやれば？

**名無しさん＠お腹いっぱい。** · NG

2パス？

**名無しさん＠お腹いっぱい。** · NG

>>367
"#" 以前が一番長いのを調べてから、それに合わせて整形し直せば。

**名無しさん＠お腹いっぱい。** · NG

>>364
70桁でそろえる場合

sed ':a /.\{70\}\#/!bc; b; :c s/$.*$\#$.*$$/\1 \#\2/; ta'

亀ですが、こんなんでどうでしょう

**名無しさん＠お腹いっぱい。** · NG

決め打ちでいいなら何の苦労もないわけで。

**名無しさん＠お腹いっぱい。** · NG

>>369
反則技。gawk で。sed ではどうやっても出来ないような気が……(_ _;)
# sed でできるのか？

{
a=index($0,"#");
if(a>best) {
best=a;
}
c[FNR]=$0
}

END {
for(i=0;i<=NR;i++){
x=index(c[i],"#");
if(x && x<best) {
for (j=x;j<best;j++) {
gsub("#"," #",c[i]);
}
}
print c[i]
}
}

**名無しさん＠お腹いっぱい。** · NG

（　´∀｀）

**名無しさん＠お腹いっぱい。** · NG

保守

**名無しさん＠お腹いっぱい。** · NG

教えてください。
Windows用のファイルをemacsなんかで開いたとき，最下行に
^Z
という符号が表示されることがあります。
これはいったい何でしょうか？

**名無しさん＠お腹いっぱい。** · NG

いわゆるeof

**名無しさん＠お腹いっぱい。** · NG

>>375
ありがとうございます。この符号のあるファイル同士をcatで連結すると，途
中にこの符号が入ってしまいます。この符号をsedでマッチさせて消去したい
のですが，どうすればいいでしょうか。
sed '/^$/d' ではダメでした。

**名無しさん＠お腹いっぱい。** · NG

>>376
いわゆるeof

**名無しさん＠お腹いっぱい。** · NG

EOF符号をsedで消去できますか？

**名無しさん＠お腹いっぱい。** · NG

grep で使える正規表現を精密に解説したサイトはありますかね?
日本語/英語どっちでもいいのですが。

**名無しさん＠お腹いっぱい。** · NG

http://www.kt.rim.or.jp/~kbk/regex/regex.html

**名無しさん＠お腹いっぱい。** · NG

レベル低いなー
378に対して出来るとも出来ないとも言えないのか...

**名無しさん＠お腹いっぱい。** · NG

378=381 ですか?

**名無しさん＠お腹いっぱい。** · NG

>>378
できるよ。普通に
s/^Z//
とかすればいい。もちろん^ZはEOFの一文字ね。

こんなの試せばすぐわかるだろと思ってたんだが、よく>>376を読むと、
「正規表現は純なテキストであるべきで特殊記号を混ぜるのはイクナイ」
と感じたんだろうな。まあ気持ちはわかるわ。

最近の正規表現拡張では、文字をコードの数値で表現する文法が
入ってたりする方が普通(例えばperlとか)だもんな。

**338** · NG

でね、特殊記号の特別なケースがtab。大昔は\tなんて表現なかったさ。
よく画面上の見た目やハードコピーや雑誌からシェルスクリプトを打ち直して、
tabとspaceの違いで動かないなんてことが時々あったんだよ。

あと勝手にシェルスクリプトを整形されて動かなくなるとか。

**名無しさん＠お腹いっぱい。** · NG

>>382
いいえ
>>383
ありがトン!

**名無しさん＠お腹いっぱい。** · NG

>>382
381=385 が正解

**名無しさん＠お腹いっぱい。** · NG

>>380
ブックマークにいれますた。

**名無しさん＠お腹いっぱい。** · NG

[\\w$'-]
これはどういうことなのでしょう？
[\w$'-]
ならわかるのですが..

**名無しさん＠お腹いっぱい。** · NG

>>388
処理系は何？

**名無しさん＠お腹いっぱい。** · NG

>>389
Rubyです
Regexp::compile("\b\d[\d\.]+\d\b|[\w]+|[\\w$'-]+")
scanメソッドで英文を分割してます

**名無しさん＠お腹いっぱい。** · NG

>>390
ほほう。バグってる悪寒。

**名無しさん＠お腹いっぱい。** · NG

Regexp::compile("\\b\\d[\\d\\.,]+\\d\\b")
こんなのがあるんですが..

**名無しさん＠お腹いっぱい。** · NG

>>392
Ruby で "..." の中で '\' を書くときは、'\' でエスケープする必要があるの。
つまり Regexp::compile("\\w") は /\w/ と同じ。

>>390 のだと '\' のエスケープが足りない部分があるように見える。
たとえば、 "\w" は "w" に、 "\b" は "\010" になっちゃう。
ので「バグってる悪寒」と言いました。

**名無しさん＠お腹いっぱい。** · NG

>>393
なるほど、必死に\\と重ねる正規表現について調べてましたよ
ありがとう

**名無しさん＠お腹いっぱい。** · NG

perl で質問です。

NOTE note "note" notes

上のような文字列を「book」だけを「note」に置換したいのですが
s/\bnote\b/book/g
のようにすると、ダブルクォートで囲まれているものも置換されてしまうのですが
それを

NOTE book "note" notes

のようにするにはどう表記すればよいのでしょうか?
詳しい方、教えてください。

**名無しさん＠お腹いっぱい。** · NG

>>395
> NOTE note "note" notes
>
> 上のような文字列を「book」だけを「note」に置換したいのですが

**名無しさん＠お腹いっぱい。** · NG

>>396
その下の
s/\bnote\b/book/g
ぐらい読んで多目にみてやれ。

>>395
とはいえ、仕様があいまいすぎ。
'note' はどうする？ :note: は？ "abc note def" は？

**名無しさん＠お腹いっぱい。** · NG

s/ note / book /g
か?

>>397
> とはいえ、仕様があいまいすぎ。
んだな。

**名無しさん＠お腹いっぱい。** · NG

>>395
s/(?=[^"])\bnote\b(?=[^"])/book/g;

＃こんなんで良いわけないよなと思いつつ・・・

**名無しさん＠お腹いっぱい。** · NG

>>397

> とはいえ、仕様があいまいすぎ。

すいません、おっしゃるとおりです。
ある単語(note)をある単語(book)に置換したいのですが、
ダブルクォートで囲まれているもの("note")は、その置換からは除外したいのです。

> 'note' はどうする？ :note: は？ "abc note def" は？

したがいまして、これらはとりあえず想定外で構わないので置換してしまっても構いません。
もう少し昨日の例を詳しく書きますと

NOTE,note"note"notes-note

このようなものでも

NOTE,book"note"notes-book

のようになってくれるのを期待しています。

ただ、"abc note def"　これも想定外で構わないのですが
対応が可能であるのなら、私の勉強の為に教えてくださるとありがたく思います。

>>399
ありがとうございます。

>s/(?=[^"])\bnote\b(?=[^"])/book/g;
これを試してみました。
基本的にOKかなと思ったのですが、行頭、行末では置換の対象となってくれませんでした。

**名無しさん＠お腹いっぱい。** · NG

>>400
補足です。
ここでいう単語とは \w+ で表せる範囲のもので、
アルファベット大文字、小文字も含めて完全に単語の
先頭から末尾までが一致するものです。

**名無しさん＠お腹いっぱい。** · NG

もっと簡単にできるかもしれないけど、
s/(^|(?<=[^\w"]))note\b|\bnote($|(?=[^\w"]))/book/g;
とかは？

> ただ、"abc note def"　これも想定外で構わないのですが

後ろから数えた"の個数が奇数ならマッチしないようにして、
$b =~ s/\bnote\b(?=([^"]*"[^"]*")*[^"]*$)/book/g;
とすれば、"のマッチングが保証できる範囲ではなんとかなるかも。
前からの"の個数でマッチさせようとしたら、
可変長のlook-behindは実装してないらしい。(perl 5.8)

**名無しさん＠お腹いっぱい。** · NG

s/"note"/hogehoge/g
s/note/book/g
s/hogehoge/"note"/g
おれならこうしちゃうな。
考えんのめんどい。

**名無しさん＠お腹いっぱい。** · NG

>>402

ありがとうございました。
たいへん勉強になりました。

**名無しさん＠お腹いっぱい。** · NG

質問させてください。

&にはマッチして欲しいのですが、&にはマッチして欲しくないのです。

どのように記述すればよいのでしょう。

お願いします。

**405** · NG

&にはマッチ
＆ａｍｐ；にはマッチしない

でした。すいません。

**名無しさん＠お腹いっぱい。** · NG

>>405
Perl5 でいい？

**名無しさん＠お腹いっぱい。** · NG

>>405
/&(?!amp;)/

**名無しさん＠お腹いっぱい。** · NG

正規表現のおすすめ書って何がありますか？

**名無しさん＠お腹いっぱい。** · NG

オライリーのやつ。

**名無しさん＠そうだ選挙に行こう** · NG

ワイルドカード(DOS)の *.txt って、正規表現だとどう書くの？

**名無しさん＠お腹いっぱい。** · NG

{(([0-9a-zA-Z]){0,})\.txt}とか半端に返してみるテスト

**名無しさん＠お腹いっぱい。** · NG

[^\\/]+\.[Tt][Xx][Tx]\z とか (ry

**名無しさん＠お腹いっぱい。** · NG

foo と bar 両方含む行をマッチさせたいんだけど、
awkでいうところの and演算子
% awk /foo/&&/bar/
が使える、windowsで動くgrepツールなんか教えてください。

#絞込み再検索のないGUIなgrepツールなんかイラネ

**名無しさん＠お腹いっぱい。** · NG

>>412,413
. 記号は \ でエスケープになるのですね。.*\.txt でマッチはしました。
助かりました、ありがとうです。

**名無しさん＠お腹いっぱい。** · NG

>>414

FIND "foo" | FIND "bar"

みたいのじゃ駄目？

**名無しさん＠お腹いっぱい。** · NG

>>414
|が使えるツールなら、/foo.*bar|bar.*foo/とかで近似できるんじゃないの。
CygwinのGNU grepで試してみた。

> cat foobar.txt
foo
bar
foo foo
foo bar
bar bar
bar foo
> grep -n "foo.*bar\|bar.*foo" foobar.txt
4:foo bar
6:bar foo
>

**414** · NG

なるほど、andをorに展開すればいいのか。
しかし fooかつbarかつbazを検索、つーばあい展開すんのめんどくさいなぁ。

windowsのGUIなgrepツールは、サブフォルダも検索、とかできて
結構便利なのも歩けど、パイプとかorが使えなかったりしてイマイチ。

結局cygwinでawk使ってるけど、これもいまひとつメンドクサイ。
2chのログを検索してるだけなんだが＿|￣|○

**名無しさん＠お腹いっぱい。** · NG

>>418
xyzzy の ggrep 辺りがいいんじゃない？

**名無しさん＠お腹いっぱい。** · NG

Windows の　AWKじゃだめですか？

**名無しさん＠お腹いっぱい。** · NG

Perloしかないべ

**名無しさん＠お腹いっぱい。** · NG

#から行末までをあらわす正規表現ってどうやればいいんでしょうか。

**名無しさん＠お腹いっぱい。** · NG

#.*$

**名無しさん＠お腹いっぱい。** · NG

#[^#]*$

**名無しさん＠お腹いっぱい。** · NG

質問があります。

サクラエディタ(正規表現ライブラリ:BREGEXP.DLL)でCソース中のhogehogeをgrepしてた
場合に、コメント化(//)されている行だけは検索結果に表示したくないんですが、
どのような正規表現で検索すればいいでしょうか？

**名無しさん＠お腹いっぱい。** · NG

あげ

**名無しさん＠お腹いっぱい。** · NG

>>425
そのエディタよく知らないんだけど、Unix で動くの?

**名無しさん＠お腹いっぱい。** · NG

スレタイだけ見て、板を確認してないんだと思われ。

**名無しさん＠お腹いっぱい。** · NG

それを言うと、このスレ自体板違いな気もしなくはないが。ム板のだけで十分やん。

**425** · NG

UNIX板って知っていて質問をしましたが。
とりあえず、ム板に逝ってみます。

**名無しさん＠お腹いっぱい。** · NG

>>430
Unix 用のソフトなの?

**名無しさん＠お腹いっぱい。** · NG

>>431
is not UNIX

**名無しさん＠お腹いっぱい。** · NG

多分エディタの種類はどうでもよくて、 /\/\*.*\*\/ とか、そんな答えを期待していたと思われ

**名無しさん＠お腹いっぱい。** · NG

ム板の正規表現もとんと書き込みないから、テストしてみたら
書き込めた。ここもどうなんだか、書き込んでみる。

**名無しさん＠お腹いっぱい。** · NG

ハハ*.*ハハ

**名無しさん＠お腹いっぱい。** · NG

指定文字列A 何か　指定文字列B
という何かにヒットさせるにはどういう正規表現にすればいいですか？

**名無しさん＠お腹いっぱい。** · NG

>>436
素で答えると「文字列A.*文字列B」だけど？そういう話？

もちろん文字列ABに特殊記号があったらどうするかとか、
.*は最長マッチでいいのとか、いろいろ細かい話はあるけど。

**436** · NG

自分で、
(文字列A).*{2,15}(文字列B)
とかでやってみたんですが、
マッチするのが、
指定文字列A 何か　指定文字列B
がマッチしてしまうので…

何か　の部分だけを抽出しようと思ってます。

**名無しさん＠お腹いっぱい。** · NG

後から取り出したい部分を()で囲む。(.*{2,15})みたいに。

**436** · NG

>>439さんの方法でも結果が変わりませんでした…　処理系が違うからかな？

とりあえず諦めて、
指定文字列A 何か　指定文字列B
をマッチさせて、指定文字列A+1文字目から　何か　の文字数だけ切り取ることにします。

ありがとうございました。

**名無しさん＠お腹いっぱい。** · NG

>>440
で、その処理系が何かを晒すつもりは毛頭無いわけですね？

**名無しさん＠お腹いっぱい。** · NG

>>441
ハゲには無理

**436** · NG

何度もすいません。

C#です…　改めてやってみると>>439さんの方法でいけました。
group[1]に入ってたんですね。全体しか見てませんでした。

板違いにお騒がせしました。

**名無しさん＠お腹いっぱい。** · NG

Perlの場合、

$_ = "いっぱい";
s/い/お/;　　　　　　　　　　# おっぱい
s/い/お/g;　　　　　　　　　# おっぱお

ということでおｋ？

**名無しさん＠お腹いっぱい。** · NG

　 _ 　∩
(　ﾟ∀ﾟ)彡　おっぱい！おっぱお！
　⊂彡

**名無しさん＠お腹いっぱい。** · NG

小学生のころ流行ったネタ

**名無しさん＠お腹いっぱい。** · NG

性器表現

**名無しさん＠お腹いっぱい。** · NG

ﾜﾛﾃﾓｰﾀ

**名無しさん＠お腹いっぱい。** · NG

さんざん概出なのに・・・

NG

**名無しさん＠お腹いっぱい。** · NG