正規表現

■ このスレッドは過去ログ倉庫に格納されています
NGNG
正規表現
NGNG
>>405
/&(?!amp;)/
NGNG
正規表現のおすすめ書って何がありますか?
NGNG
オライリーのやつ。
411名無しさん@そうだ選挙に行こう
垢版 |
NGNG
ワイルドカード(DOS)の *.txt って、正規表現だとどう書くの?
NGNG
{(([0-9a-zA-Z]){0,})\.txt}とか半端に返してみるテスト
NGNG
[^\\/]+\.[Tt][Xx][Tx]\z とか (ry
NGNG
foo と bar 両方含む行をマッチさせたいんだけど、
awkでいうところの and演算子
% awk /foo/&&/bar/
が使える、windowsで動くgrepツールなんか教えてください。

#絞込み再検索のないGUIなgrepツールなんかイラネ
415名無しさん@お腹いっぱい。
垢版 |
NGNG
>>412,413
. 記号は \ でエスケープになるのですね。.*\.txt でマッチはしました。
助かりました、ありがとうです。
NGNG
>>414

FIND "foo" | FIND "bar"

みたいのじゃ駄目?
NGNG
>>414
|が使えるツールなら、/foo.*bar|bar.*foo/とかで近似できるんじゃないの。
CygwinのGNU grepで試してみた。

> cat foobar.txt
foo
bar
foo foo
foo bar
bar bar
bar foo
> grep -n "foo.*bar\|bar.*foo" foobar.txt
4:foo bar
6:bar foo
>
418414
垢版 |
NGNG
なるほど、andをorに展開すればいいのか。
しかし fooかつbarかつbazを検索、つーばあい展開すんのめんどくさいなぁ。

windowsのGUIなgrepツールは、サブフォルダも検索、とかできて
結構便利なのも歩けど、パイプとかorが使えなかったりしてイマイチ。

結局cygwinでawk使ってるけど、これもいまひとつメンドクサイ。
2chのログを検索してるだけなんだが_| ̄|○
NGNG
>>418
xyzzy の ggrep 辺りがいいんじゃない?
420名無しさん@お腹いっぱい。
垢版 |
NGNG
Windows の AWKじゃだめですか?
421名無しさん@お腹いっぱい。
垢版 |
NGNG
Perloしかないべ
422名無しさん@お腹いっぱい。
垢版 |
NGNG
#から行末までをあらわす正規表現ってどうやればいいんでしょうか。
NGNG
#.*$
NGNG
#[^#]*$
NGNG
質問があります。

サクラエディタ(正規表現ライブラリ:BREGEXP.DLL)でCソース中のhogehogeをgrepしてた
場合に、コメント化(//)されている行だけは検索結果に表示したくないんですが、
どのような正規表現で検索すればいいでしょうか?
426名無しさん@お腹いっぱい。
垢版 |
NGNG
あげ
NGNG
>>425
そのエディタよく知らないんだけど、Unix で動くの?
NGNG
スレタイだけ見て、板を確認してないんだと思われ。
NGNG
それを言うと、このスレ自体板違いな気もしなくはないが。ム板のだけで十分やん。
430425
垢版 |
NGNG
UNIX板って知っていて質問をしましたが。
とりあえず、ム板に逝ってみます。
NGNG
>>430
Unix 用のソフトなの?
NGNG
>>431
is not UNIX
433名無しさん@お腹いっぱい。
垢版 |
NGNG
多分エディタの種類はどうでもよくて、 /\/\*.*\*\/ とか、そんな答えを期待していたと思われ
NGNG
ム板の正規表現もとんと書き込みないから、テストしてみたら
書き込めた。ここもどうなんだか、書き込んでみる。
NGNG
ハハ*.*ハハ
436名無しさん@お腹いっぱい。
垢版 |
NGNG
指定文字列A 何か 指定文字列B
という何かにヒットさせるにはどういう正規表現にすればいいですか?
NGNG
>>436
素で答えると「文字列A.*文字列B」だけど?そういう話?

もちろん文字列ABに特殊記号があったらどうするかとか、
.*は最長マッチでいいのとか、いろいろ細かい話はあるけど。
438436
垢版 |
NGNG
自分で、
(文字列A).*{2,15}(文字列B)
とかでやってみたんですが、
マッチするのが、
指定文字列A 何か 指定文字列B
がマッチしてしまうので…

何か の部分だけを抽出しようと思ってます。
NGNG
後から取り出したい部分を()で囲む。(.*{2,15})みたいに。
440436
垢版 |
NGNG
>>439さんの方法でも結果が変わりませんでした… 処理系が違うからかな?

とりあえず諦めて、
指定文字列A 何か 指定文字列B
をマッチさせて、指定文字列A+1文字目から 何か の文字数だけ切り取ることにします。

ありがとうございました。
NGNG
>>440
で、その処理系が何かを晒すつもりは毛頭無いわけですね?
NGNG
>>441
ハゲには無理
443436
垢版 |
NGNG
何度もすいません。

C#です… 改めてやってみると>>439さんの方法でいけました。
group[1]に入ってたんですね。全体しか見てませんでした。

板違いにお騒がせしました。
444名無しさん@お腹いっぱい。
垢版 |
NGNG
Perlの場合、

$_ = "いっぱい";
s/い/お/;          # おっぱい
s/い/お/g;         # おっぱお

ということでおk?
NGNG
  _  ∩
( ゚∀゚)彡 おっぱい!おっぱお!
 ⊂彡
NGNG
小学生のころ流行ったネタ
NGNG
性器表現
NGNG
ワロテモータ
NGNG
さんざん概出なのに・・・
450
垢版 |
NGNG

NGNG
.*
NGNG
↑アナルは性器じゃねーよな、とか思ってよく見ると、ドット米。
イボ痔か?
NGNG
>>452
拭き忘れたウンチだよ。きっと!
454名無しさん@お腹いっぱい。
垢版 |
NGNG
regexp
NGNG
rege*p
NGNG
正規表現で複数の単語の中に「/」があるときにヒットさせたいんですが

echo "hoge / hoge" | grep "\</\>"

でだめでした・・。だれか修正をお願いしますorz
NGNG
>>456
条件をもっと明確に定義しろ。
マルチすんな。
458456
垢版 |
NGNG
>>457

複数の単語の中で、"/"のみで構成される単語が存在する場合のみ
ヒットさせたいのです

つまり
a b c / d
上記ようなときで下記のどの事象にもヒットさせたくはないのです
// /a a/ a/a

NGNG
>>456
http://pc5.2ch.net/test/read.cgi/linux/1101654885/957
とこっちと、どっちで続けるのかね。
NGNG
まことに勝手ながらこちらで続けさせてください
質問を改めます
やりたいことは
-----------------------
1) echo "/" | grep ......
2) echo "/ a b" | grep ......
3) echo "a b /" | grep ......
4) echo "/a / b/" | grep ......
-----------------------
上ですべてマッチさせて
以下はすべてはじくようにしたいのです
-----------------------
5) echo "//" | grep ......
6) echo "// /// ////" | grep ......
7) echo "/a b/ /c/" | grep ......
-----------------------
上と下の違いは、前後にスペースを含む" / "が存在するか否かです

よって以下のように考えましたが、ヒットしませんでした
echo "a / b"|grep "\</\>"
echo "a / b"|grep "\<\/\>"

どなたか修正をおねがいしますorz
NGNG
>>460
grep と言ってもいろいろあるんだが
どの OS のどの grep よ。
462456
垢版 |
NGNG
↑修正します

修正前)上と下の違いは、前後にスペースを含む" / "が存在するか否かです

修正後)上と下の違いは、単語 / が存在するか否かです
NGNG
>>460
> 上と下の違いは、前後にスペースを含む" / "が存在するか否かです
1) と 2) には存在しないようだが。
NGNG
>>462
「単語」とは?
465名無しさん@お腹いっぱい。
垢版 |
NGNG
ブラケットの中でピリオドを入れる時ってメタキャラクタとして扱われますか?

[\w.]

[\w\.]
が同じ動きにになるみたいなんですけど・・・。

ちなみに、パールです。
NGNG
>>465
「みたい」じゃなくてテストコードで示してよ。
NGNG
どの言語の正規表現がどんな有限オートマトン使ってるという情報って
どこかにありますかねぇ。正規表現コンバータ作ろうかと思ってるのですが。。

NFA、DFAの違いぐらいは詳説正規表現の本でわかるのですが、実装ともなると。
オートマトンの変換に関してはコンパイラの本を参考にしてますが、
やはりかなりつらいものがありますね。たんに字句解析して作った方がいいのかなぁ。
NGNG
普通にNFA+DFAでいいじゃん
NGNG
オブジェクト指向正規表現の仕様策定はまだですか?
NGNG
>>469
聞いたことないな。
何それ?
NGNG
>>469
まかせた。
472名無しさん@お腹いっぱい。
垢版 |
NGNG
お前らWinの.NETなんだが正規表現の質問をさせてくれ。

RegularExpressions.Regexで下の文字列を検索して<TD>から</TD>に分けたい。

string strHtml = "<TD>a</TD><TD>b</TD><TD>c</TD>"

Regex regex = Regex("<TD>.*</TD>");
MatchCollection matchcollection = regex.Matches(strHtml);

だと最長一致で "<TD>a</TD><TD>b</TD><TD>c</TD>"の1つのコレクション取得。

Regex regex = Regex("<TD>.*?</TD>");

だとやりたい "<TD>a</TD>", "<TD>b</TD>","<TD>c</TD>"の3つのコレクションが取得できる。

.*? の意味をアフォにも分かるように説明してくれ。
.*(任意の0文字以上)が?(あるかないか)だろ。
なんで思った通りに3つのコレクションが取得できるの?
473472
垢版 |
NGNG
*? つーのは最短一致という便利なキーワードなのか。
つまらん質問失礼しますた。
474名無しさん@お腹いっぱい。
垢版 |
NGNG
下がってるので、どれ一つ、とんちでも。
rubyでは
/aa+??/ =~ "a" => 0
emacsでは
"aa+??" =~ "a" => nil
さて、こうなってしまうのは、各々がどのようなオートマトンで
解釈されているからでしょうか。
NGNG
emacsって最短マッチあんの?
NGNG
ありましゅよー
ttp://www.cs.huji.ac.il/support/emacs/elisp-help/elisp-manref/elisp_34.html

でも、{m,n}? の最短マッチはないみたい…。
NGNG
最短マッチに対応した grep ってある?
NGNG
>>477
grep が最短マッチに対応してるかどうかが問題になるケースってある?
05/01/30 22:46:31
[^ま]*まってかくのめんどくさい
480名無しさん@お腹いっぱい。
垢版 |
05/02/26 05:47:57
あげ
481名無しさん@お腹いっぱい。
垢版 |
2005/03/30(水) 02:33:49
up
2005/04/19(火) 17:08:07
正規表現の実装っていろいろあることにやっと気づいた漏れorz
2005/05/14(土) 15:12:25
ほしゅ
484名無しさん@お腹いっぱい。
垢版 |
2005/05/16(月) 16:51:45
abc xyzをaxbyczにしたいのですが
2005/05/16(月) 17:05:02
s/abc xyz/axbycz/g
2005/05/16(月) 19:33:57
ワロタ
2005/05/16(月) 19:34:25
保守
488名無しさん@お腹いっぱい。
垢版 |
2005/05/17(火) 22:45:20
>>484
echo abc xyz |sed -e "s/^/%/; :ll; s/[%]\(.\)\(.*\) \(.\)\(.*\)/\1\3%\2 \4/; tll; s/%//;"
2005/05/18(水) 00:13:40
うひょー
2005/05/28(土) 03:19:18
うに厨として、% をめぐる動きに溜息出た…真剣にありがと 何重にも目が覚めた
2005/05/28(土) 05:32:41
abc xyz でも
abcdefg ABCDEFG でもできるね。すげーや。
2005/06/02(木) 22:17:25
a
2005/06/04(土) 23:07:23
('A`)
2005/06/19(日) 02:53:08
Onigurumaを使っているんですが、
あるテキストデータがあります。
----- ここから
END

注釈 ○○○
注意 △△△
補足 ◎◎◎

TITLE
----- ここまで
という部分の、ENDの後の空白行からTITLEの前の空白行の部分(間の行)を削除して、
ENDとTITLEの間は1行だけの空白行にしたいです。
「END\s^[0-9a-zA-Z。-゜ぁ-んァ-ヶ亜-?]*\sTITLE」を指定してもマッチしないんですが、
これは私の正規表現の式が間違えているんでしょうか?
(複数行を1度に選択する方法を間違えている???)
2005/06/19(日) 03:13:31
>>494
つーか、正規表現だけ見せられても判断できないと思うんだけど。
改行処理や文字コードのオプション設定はどうしてるかとかいろいろ情報が足りない。
2005/07/13(水) 09:25:56
素直に、
~s/END(\s*.*?\s*)TITLE/END\n\nTITLE/sg;
じゃダメ?
2005/07/13(水) 13:15:24
>>496
Oniguruma の質問なわけだが?
2005/07/13(水) 17:54:26
…とは思ったのだが、Perl 互換らしーから、いーかなとw

てか、見つかるのむちゃくちゃ早いなww
事後ながら、oniguruma (ライブラリ)取りに行った
2005/07/13(水) 19:58:46
>>498
> 見つかるのむちゃくちゃ早いなww
どういうこと?
2005/07/17(日) 23:17:41
>494
> 「END\s^[0-9a-zA-Z。-゜ぁ-んァ-ヶ亜-?]*\sTITLE」を指定してもマッチしないんですが、
> これは私の正規表現の式が間違えているんでしょうか?
> (複数行を1度に選択する方法を間違えている???)

これのどこが、複数行を一度に選択しているの?
2005/07/19(火) 19:22:13
>>500
ONIG_OPTION_MULTILINE (や REG_NEWLINE や RE_OPTION_MULTILINE など) をセット
しているかどうかで複数行選択できるかどうか変わるので、
そのへんを晒せばもうちょっと状況がわかると思うのだが、
元質問者はもう既にどっかいっちゃったのだろうな。
502名無しさん@お腹いっぱい。
垢版 |
2005/09/21(水) 20:57:28
正規表現で
○○ か ○○の場合と言うのはどう表現するのでしょうか?

Cで言う、 || のようなものです。
2005/09/21(水) 21:07:45
テンプレに何もないんだなこのスレ。
このあたりで調べろ

http://www.kt.rim.or.jp/%7Ekbk/regex/regex.html
2005/09/21(水) 21:18:44
\(>∀<\) キャー
2005/09/21(水) 21:58:13
(;`∇´))))))))))) \(>∀<\) キャー
2005/09/21(水) 22:48:45
俺ならこう→「\(○{2}\) か \1の場合」
2005/09/21(水) 23:46:20
何気に正規表現本もラッシュだな。
2005/09/22(木) 00:19:11
\([^ ]∀[^ ]*\)

AAみたいな正規表現を作りたいが難しい。
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況