正規表現

**正規表現** · NG

正規表現

**436** · NG

自分で、
(文字列A).*{2,15}(文字列B)
とかでやってみたんですが、
マッチするのが、
指定文字列A 何か　指定文字列B
がマッチしてしまうので…

何か　の部分だけを抽出しようと思ってます。

**名無しさん＠お腹いっぱい。** · NG

後から取り出したい部分を()で囲む。(.*{2,15})みたいに。

**436** · NG

>>439さんの方法でも結果が変わりませんでした…　処理系が違うからかな？

とりあえず諦めて、
指定文字列A 何か　指定文字列B
をマッチさせて、指定文字列A+1文字目から　何か　の文字数だけ切り取ることにします。

ありがとうございました。

**名無しさん＠お腹いっぱい。** · NG

>>440
で、その処理系が何かを晒すつもりは毛頭無いわけですね？

**名無しさん＠お腹いっぱい。** · NG

>>441
ハゲには無理

**436** · NG

何度もすいません。

C#です…　改めてやってみると>>439さんの方法でいけました。
group[1]に入ってたんですね。全体しか見てませんでした。

板違いにお騒がせしました。

**名無しさん＠お腹いっぱい。** · NG

Perlの場合、

$_ = "いっぱい";
s/い/お/;　　　　　　　　　　# おっぱい
s/い/お/g;　　　　　　　　　# おっぱお

ということでおｋ？

**名無しさん＠お腹いっぱい。** · NG

　 _ 　∩
(　ﾟ∀ﾟ)彡　おっぱい！おっぱお！
　⊂彡

**名無しさん＠お腹いっぱい。** · NG

小学生のころ流行ったネタ

**名無しさん＠お腹いっぱい。** · NG

性器表現

**名無しさん＠お腹いっぱい。** · NG

ﾜﾛﾃﾓｰﾀ

**名無しさん＠お腹いっぱい。** · NG

さんざん概出なのに・・・

NG

**名無しさん＠お腹いっぱい。** · NG

**ｳｻﾁｬｿ** · NG

↑アナルは性器じゃねーよな、とか思ってよく見ると、ドット米。
イボ痔か？

**名無しさん＠お腹いっぱい。** · NG

>>452
拭き忘れたウンチだよ。きっと！

**名無しさん＠お腹いっぱい。** · NG

regexp

**名無しさん＠お腹いっぱい。** · NG

rege*p

**名無しさん＠お腹いっぱい。** · NG

正規表現で複数の単語の中に「/」があるときにヒットさせたいんですが

echo "hoge / hoge" | grep "\</\>"

でだめでした・・。だれか修正をお願いしますorz

**名無しさん＠お腹いっぱい。** · NG

>>456
条件をもっと明確に定義しろ。
マルチすんな。

**456** · NG

>>457

複数の単語の中で、"/"のみで構成される単語が存在する場合のみ
ヒットさせたいのです

つまり
a b c / d
上記ようなときで下記のどの事象にもヒットさせたくはないのです
// /a a/ a/a

**名無しさん＠お腹いっぱい。** · NG

>>456
http://pc5.2ch.net/test/read.cgi/linux/1101654885/957
とこっちと、どっちで続けるのかね。

**名無しさん＠お腹いっぱい。** · NG

まことに勝手ながらこちらで続けさせてください
質問を改めます
やりたいことは
-----------------------
1) echo "/" | grep ......
2) echo "/ a b" | grep ......
3) echo "a b /" | grep ......
4) echo "/a / b/" | grep ......
-----------------------
上ですべてマッチさせて
以下はすべてはじくようにしたいのです
-----------------------
5) echo "//" | grep ......
6) echo "// /// ////" | grep ......
7) echo "/a b/ /c/" | grep ......
-----------------------
上と下の違いは、前後にスペースを含む" / "が存在するか否かです

よって以下のように考えましたが、ヒットしませんでした
echo "a / b"|grep "\</\>"
echo "a / b"|grep "\<\/\>"

どなたか修正をおねがいしますorz

**名無しさん＠お腹いっぱい。** · NG

>>460
grep と言ってもいろいろあるんだが
どの OS のどの grep よ。

**456** · NG

↑修正します

修正前）上と下の違いは、前後にスペースを含む" / "が存在するか否かです

修正後）上と下の違いは、単語 / が存在するか否かです

**名無しさん＠お腹いっぱい。** · NG

>>460
> 上と下の違いは、前後にスペースを含む" / "が存在するか否かです
1) と 2) には存在しないようだが。

**名無しさん＠お腹いっぱい。** · NG

>>462
「単語」とは?

**名無しさん＠お腹いっぱい。** · NG

ブラケットの中でピリオドを入れる時ってメタキャラクタとして扱われますか？

[\w.]
と
[\w\.]
が同じ動きにになるみたいなんですけど・・・。

ちなみに、パールです。

**名無しさん＠お腹いっぱい。** · NG

>>465
「みたい」じゃなくてテストコードで示してよ。

**名無しさん＠お腹いっぱい。** · NG

どの言語の正規表現がどんな有限オートマトン使ってるという情報って
どこかにありますかねぇ。正規表現コンバータ作ろうかと思ってるのですが。。

NFA、DFAの違いぐらいは詳説正規表現の本でわかるのですが、実装ともなると。
オートマトンの変換に関してはコンパイラの本を参考にしてますが、
やはりかなりつらいものがありますね。たんに字句解析して作った方がいいのかなぁ。

**名無しさん＠お腹いっぱい。** · NG

普通にNFA+DFAでいいじゃん

**名無しさん＠お腹いっぱい。** · NG

オブジェクト指向正規表現の仕様策定はまだですか？

**名無しさん＠お腹いっぱい。** · NG

>>469
聞いたことないな。
何それ？

**名無しさん＠お腹いっぱい。** · NG

>>469
まかせた。

**名無しさん＠お腹いっぱい。** · NG

お前らWinの.NETなんだが正規表現の質問をさせてくれ。

RegularExpressions.Regexで下の文字列を検索して<TD>から</TD>に分けたい。

string strHtml = "<TD>a</TD><TD>b</TD><TD>c</TD>"

Regex regex = Regex("<TD>.*</TD>");
MatchCollection matchcollection = regex.Matches(strHtml);

だと最長一致で "<TD>a</TD><TD>b</TD><TD>c</TD>"の１つのコレクション取得。

Regex regex = Regex("<TD>.*?</TD>");

だとやりたい "<TD>a</TD>", "<TD>b</TD>","<TD>c</TD>"の３つのコレクションが取得できる。

.*? の意味をアフォにも分かるように説明してくれ。
.*(任意の0文字以上）が?(あるかないか）だろ。
なんで思った通りに３つのコレクションが取得できるの？

**４７２** · NG

*? つーのは最短一致という便利なキーワードなのか。
つまらん質問失礼しますた。

**名無しさん＠お腹いっぱい。** · NG

下がってるので、どれ一つ、とんちでも。
rubyでは
/aa+??/ =~ "a" => 0
emacsでは
"aa+??" =~ "a" => nil
さて、こうなってしまうのは、各々がどのようなオートマトンで
解釈されているからでしょうか。

**名無しさん＠お腹いっぱい。** · NG

emacsって最短ﾏｯﾁあんの？

**名無しさん＠お腹いっぱい。** · NG

ありましゅよー
ttp://www.cs.huji.ac.il/support/emacs/elisp-help/elisp-manref/elisp_34.html

でも、{m,n}? の最短マッチはないみたい…。

**名無しさん＠お腹いっぱい。** · NG

最短マッチに対応した grep ってある？

**名無しさん＠お腹いっぱい。** · NG

>>477
grep が最短マッチに対応してるかどうかが問題になるケースってある？

**名無しさん＠お腹いっぱい。** · 05/01/30 22:46:31

[^ま]*まってかくのめんどくさい

**名無しさん＠お腹いっぱい。** · 05/02/26 05:47:57

あげ

**名無しさん＠お腹いっぱい。** · 2005/03/30(水) 02:33:49

**名無しさん＠お腹いっぱい。** · 2005/04/19(火) 17:08:07

正規表現の実装っていろいろあることにやっと気づいた漏れorz

**名無しさん＠お腹いっぱい。** · 2005/05/14(土) 15:12:25

ほしゅ

**名無しさん＠お腹いっぱい。** · 2005/05/16(月) 16:51:45

abc xyzをaxbyczにしたいのですが

**名無しさん＠お腹いっぱい。** · 2005/05/16(月) 17:05:02

s/abc xyz/axbycz/g

**名無しさん＠お腹いっぱい。** · 2005/05/16(月) 19:33:57

ﾜﾛﾀ

**名無しさん＠お腹いっぱい。** · 2005/05/16(月) 19:34:25

保守

**名無しさん＠お腹いっぱい。** · 2005/05/17(火) 22:45:20

>>484
echo abc xyz |sed -e "s/^/%/; :ll; s/[%]$.$$.*$ $.$$.*$/\1\3%\2 \4/; tll; s/%//;"

**名無しさん＠お腹いっぱい。** · 2005/05/18(水) 00:13:40

うひょー

**名無しさん＠お腹いっぱい。** · 2005/05/28(土) 03:19:18

うに厨として、% をめぐる動きに溜息出た…真剣にありがと何重にも目が覚めた

**名無しさん＠お腹いっぱい。** · 2005/05/28(土) 05:32:41

abc xyz でも
abcdefg ABCDEFG でもできるね。すげーや。

◆2fmGY.thDg · 2005/06/02(木) 22:17:25

**名無しさん＠お腹いっぱい。** · 2005/06/04(土) 23:07:23

('A`)

**名無しさん＠お腹いっぱい。** · 2005/06/19(日) 02:53:08

Onigurumaを使っているんですが、
あるテキストデータがあります。
----- ここから
END

注釈 ○○○
注意 △△△
補足 ◎◎◎

TITLE
----- ここまで
という部分の、ENDの後の空白行からTITLEの前の空白行の部分（間の行）を削除して、
ENDとTITLEの間は1行だけの空白行にしたいです。
「END＼s^[0-9a-zA-Z。-゜ぁ-んァ-ヶ亜-?]*＼sTITLE」を指定してもマッチしないんですが、
これは私の正規表現の式が間違えているんでしょうか？
（複数行を1度に選択する方法を間違えている???）

**名無しさん＠お腹いっぱい。** · 2005/06/19(日) 03:13:31

>>494
つーか、正規表現だけ見せられても判断できないと思うんだけど。
改行処理や文字コードのオプション設定はどうしてるかとかいろいろ情報が足りない。

**名無しさん＠お腹いっぱい。** · 2005/07/13(水) 09:25:56

素直に、
~s/END(\s*.*?\s*)TITLE/END\n\nTITLE/sg;
じゃダメ?

**名無しさん＠お腹いっぱい。** · 2005/07/13(水) 13:15:24

>>496
Oniguruma の質問なわけだが？

**名無しさん＠お腹いっぱい。** · 2005/07/13(水) 17:54:26

…とは思ったのだが、Perl 互換らしーから、いーかなとｗ

てか、見つかるのむちゃくちゃ早いなｗｗ
事後ながら、oniguruma (ライブラリ)取りに行った

**名無しさん＠お腹いっぱい。** · 2005/07/13(水) 19:58:46

>>498
> 見つかるのむちゃくちゃ早いなｗｗ
どういうこと？

**名無しさん＠お腹いっぱい。** · 2005/07/17(日) 23:17:41

>494
> 「END＼s^[0-9a-zA-Z。-゜ぁ-んァ-ヶ亜-?]*＼sTITLE」を指定してもマッチしないんですが、
> これは私の正規表現の式が間違えているんでしょうか？
> （複数行を1度に選択する方法を間違えている???）

これのどこが、複数行を一度に選択しているの？

**名無しさん＠お腹いっぱい。** · 2005/07/19(火) 19:22:13

>>500
ONIG_OPTION_MULTILINE (や REG_NEWLINE や RE_OPTION_MULTILINE など) をセット
しているかどうかで複数行選択できるかどうか変わるので、
そのへんを晒せばもうちょっと状況がわかると思うのだが、
元質問者はもう既にどっかいっちゃったのだろうな。

**名無しさん＠お腹いっぱい。** · 2005/09/21(水) 20:57:28

正規表現で
○○ か ○○の場合と言うのはどう表現するのでしょうか？

Cで言う、 || のようなものです。

**名無しさん＠お腹いっぱい。** · 2005/09/21(水) 21:07:45

テンプレに何もないんだなこのスレ。
このあたりで調べろ

http://www.kt.rim.or.jp/%7Ekbk/regex/regex.html

**名無しさん＠お腹いっぱい。** · 2005/09/21(水) 21:18:44

$>∀<$ ｷｬｰ

**名無しさん＠お腹いっぱい。** · 2005/09/21(水) 21:58:13

(;｀∇´))))))))))) $>∀<$ ｷｬｰ

**名無しさん＠お腹いっぱい。** · 2005/09/21(水) 22:48:45

俺ならこう→「$○{2}$ か \1の場合」

**名無しさん＠お腹いっぱい。** · 2005/09/21(水) 23:46:20

何気に正規表現本もラッシュだな。

**名無しさん＠お腹いっぱい。** · 2005/09/22(木) 00:19:11

$[^ ]∀[^ ]*$

AAみたいな正規表現を作りたいが難しい。

**名無しさん＠お腹いっぱい。** · 2005/09/22(木) 02:52:41

つくれてるやん！

**名無しさん＠お腹いっぱい。** · 2005/09/23(金) 23:15:15

∀ がメタキャラになってくれると楽しいかも

**名無しさん＠お腹いっぱい。** · 2005/09/26(月) 20:32:51

дも

**名無しさん＠お腹いっぱい。** · 2005/09/28(水) 14:54:06

ネタキャラ

**名無しさん＠お腹いっぱい。** · 2005/12/09(金) 01:04:17

純粋に興味の問題なんだけど、
「ある文字集合の要素が各1回ずつしか出現しない」という文字列は
正規表現で表現できる?

例えばA, B, Cの文字からなる言語を考えたとすると、
ABC ACB BAC BCA CAB CBAの6つの文字列にマッチする表現っす。

**名無しさん＠お腹いっぱい。** · 2005/12/09(金) 01:08:23

文字集合の濃度が有限なら
単に | でつなげばいいな。

**名無しさん＠お腹いっぱい。** · 2005/12/09(金) 02:30:43

いろは歌とか"a quick brown fox..."みたいなのにマッチさせる正規表現、
って書けば説明が早かったかもですね。

>>514
ひらがなの場合で47!個、アルファベットの場合で26!個の文字列を
|でつなぐってことになると思うんですが、やはりこれしか方法ないんですかね。
正規表現の長さは… アルファベットの場合でも約1京テラバイトか… orz

**名無しさん＠お腹いっぱい。** · 2005/12/09(金) 09:42:38

>>513
[^A]*A[^A]* ではどうよ

**名無しさん＠お腹いっぱい。** · 2005/12/09(金) 09:53:24

>>516
BBA にもマッチしちゃうんでは。

**名無しさん＠お腹いっぱい。** · 2005/12/09(金) 09:57:44

>>515
> "a quick brown fox..."みたいなのに
o 2回出てるよ。

実用を考えたら正規表現以外でやった方がいいな。

**名無しさん＠お腹いっぱい。** · 2005/12/09(金) 19:50:27

いろは歌って内容も傑作だよな。

**名無しさん＠お腹いっぱい。** · 2005/12/09(金) 21:53:37

> o 2回出てるよ。

おお、32年生きてて初めて気が付いたっす。漏れの目はfusianasanさんだ… orz

> 実用を考えたら正規表現以外でやった方がいいな。

そうことになっちゃいますかね。みなさんレスどうもでした。

**名無しさん＠お腹いっぱい。** · 2005/12/11(日) 08:09:16

Windowsで正規表現にマッチする文字列のみ（行全体じゃなく）を表示・保存するにはどうすればいいのでしょうか？
xyzzyとかのエディタのgrepでやろうとしたのですが、検索してもよくわかりません。
Rubyとかスクリプト言語を使わないと無理でしょうか？

**名無しさん＠お腹いっぱい。** · 2005/12/11(日) 08:13:57

上すいません。書きこむスレ間違えました。（プログラム板の正規表現スレに書きこんだつもりでした。）

**名無しさん＠お腹いっぱい。** · 2005/12/11(日) 11:19:25

ちょうど一回出るんなら何かの順序でソートして文字列が完全一致することをチェックかなあ

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 11:16:33

エディターの正規表現で置き換えをしたいんですが・・・
１、２、３、・・・という連番を
(1) (2)　(3)というふうに置き換えたいのですが
どうしたらよいでしょうか。

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 11:57:28

まずは(ry

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 12:39:56

置換元：[1-9]
置換先：(\0)
で、できるかもよ。

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 17:30:57

>>526
だめでした。

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 19:50:58

置換元：[1-9][0-9]*
置換先：$\0$
こんな風にすればできるのかな？
どんな風に駄目だったかわからないけれど。

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 20:02:16

>>528
それもやってみましたが、検索はされるのですが、
置き換えが出来ません。(0)となってしまいます。
前回のは(となってしまいます。
エディターだから駄目なのでしょうか。

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 20:09:51

\0のところを、
\1
$1
にしても同じかな？

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 20:13:18

>>530
($1)となってしまいます。

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 20:17:25

そのエディタの正規表現がreference(\1とか$1とか)をサポートしてないに１票。

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 21:27:04

!(＾＾)!ピンポーンです。
ヘルプを見ていたら、referenceはサポートしていないと出ていました。
他のエディターを探すか、どうしたらいいでしょうか。

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 23:17:07

続きです
結局QXエディタをダウンロードして使いました。
びっくりしたのはWindows上では
正規表現というのは全然一般的ではないんですね。
勉強しようにも正規表現サポート自体が脆弱だったんですね。

【大凶】 **3回目** · 2006/01/01(日) 23:32:29

ググればなんぼでも出てきます。少し自分で考えなはれ。

**名無しさん＠お腹いっぱい。** · 2006/01/03(火) 22:49:27

まあやることがハッキリ決まってるんなら、
(念の為)対象ファイルのカレントディレクトリのDOS窓を開いてsed、だな。

**名無しさん＠お腹いっぱい。** · 2006/01/07(土) 07:00:27

{aaa}[bbb}{ccc}
という文字列から、aaa bbb cccをそれぞれマッチさせてとりだしたいので、

/¥{(.*)¥}¥{(.*)¥}¥{(.*)¥}/

としていましたが、
とりだしたい文字列のなかに、さらに{}がはいっていることがあることが
わかりました。
{aaa}[b{b}b}{ccc}
とか。
それぞれaaa b{b}b cccというかたちでとりだしたいのですが、どうしたものでしょうか。

**名無しさん＠お腹いっぱい。** · 2006/01/07(土) 10:07:50

>>537
sedはそのままでｏｋ