正規表現

**正規表現** · NG

正規表現

**名無しさん＠お腹いっぱい。** · 2005/12/09(金) 01:08:23

文字集合の濃度が有限なら
単に | でつなげばいいな。

**名無しさん＠お腹いっぱい。** · 2005/12/09(金) 02:30:43

いろは歌とか"a quick brown fox..."みたいなのにマッチさせる正規表現、
って書けば説明が早かったかもですね。

>>514
ひらがなの場合で47!個、アルファベットの場合で26!個の文字列を
|でつなぐってことになると思うんですが、やはりこれしか方法ないんですかね。
正規表現の長さは… アルファベットの場合でも約1京テラバイトか… orz

**名無しさん＠お腹いっぱい。** · 2005/12/09(金) 09:42:38

>>513
[^A]*A[^A]* ではどうよ

**名無しさん＠お腹いっぱい。** · 2005/12/09(金) 09:53:24

>>516
BBA にもマッチしちゃうんでは。

**名無しさん＠お腹いっぱい。** · 2005/12/09(金) 09:57:44

>>515
> "a quick brown fox..."みたいなのに
o 2回出てるよ。

実用を考えたら正規表現以外でやった方がいいな。

**名無しさん＠お腹いっぱい。** · 2005/12/09(金) 19:50:27

いろは歌って内容も傑作だよな。

**名無しさん＠お腹いっぱい。** · 2005/12/09(金) 21:53:37

> o 2回出てるよ。

おお、32年生きてて初めて気が付いたっす。漏れの目はfusianasanさんだ… orz

> 実用を考えたら正規表現以外でやった方がいいな。

そうことになっちゃいますかね。みなさんレスどうもでした。

**名無しさん＠お腹いっぱい。** · 2005/12/11(日) 08:09:16

Windowsで正規表現にマッチする文字列のみ（行全体じゃなく）を表示・保存するにはどうすればいいのでしょうか？
xyzzyとかのエディタのgrepでやろうとしたのですが、検索してもよくわかりません。
Rubyとかスクリプト言語を使わないと無理でしょうか？

**名無しさん＠お腹いっぱい。** · 2005/12/11(日) 08:13:57

上すいません。書きこむスレ間違えました。（プログラム板の正規表現スレに書きこんだつもりでした。）

**名無しさん＠お腹いっぱい。** · 2005/12/11(日) 11:19:25

ちょうど一回出るんなら何かの順序でソートして文字列が完全一致することをチェックかなあ

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 11:16:33

エディターの正規表現で置き換えをしたいんですが・・・
１、２、３、・・・という連番を
(1) (2)　(3)というふうに置き換えたいのですが
どうしたらよいでしょうか。

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 11:57:28

まずは(ry

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 12:39:56

置換元：[1-9]
置換先：(\0)
で、できるかもよ。

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 17:30:57

>>526
だめでした。

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 19:50:58

置換元：[1-9][0-9]*
置換先：$\0$
こんな風にすればできるのかな？
どんな風に駄目だったかわからないけれど。

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 20:02:16

>>528
それもやってみましたが、検索はされるのですが、
置き換えが出来ません。(0)となってしまいます。
前回のは(となってしまいます。
エディターだから駄目なのでしょうか。

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 20:09:51

\0のところを、
\1
$1
にしても同じかな？

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 20:13:18

>>530
($1)となってしまいます。

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 20:17:25

そのエディタの正規表現がreference(\1とか$1とか)をサポートしてないに１票。

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 21:27:04

!(＾＾)!ピンポーンです。
ヘルプを見ていたら、referenceはサポートしていないと出ていました。
他のエディターを探すか、どうしたらいいでしょうか。

**名無しさん＠お腹いっぱい。** · 2006/01/01(日) 23:17:07

続きです
結局QXエディタをダウンロードして使いました。
びっくりしたのはWindows上では
正規表現というのは全然一般的ではないんですね。
勉強しようにも正規表現サポート自体が脆弱だったんですね。

【大凶】 **3回目** · 2006/01/01(日) 23:32:29

ググればなんぼでも出てきます。少し自分で考えなはれ。

**名無しさん＠お腹いっぱい。** · 2006/01/03(火) 22:49:27

まあやることがハッキリ決まってるんなら、
(念の為)対象ファイルのカレントディレクトリのDOS窓を開いてsed、だな。

**名無しさん＠お腹いっぱい。** · 2006/01/07(土) 07:00:27

{aaa}[bbb}{ccc}
という文字列から、aaa bbb cccをそれぞれマッチさせてとりだしたいので、

/¥{(.*)¥}¥{(.*)¥}¥{(.*)¥}/

としていましたが、
とりだしたい文字列のなかに、さらに{}がはいっていることがあることが
わかりました。
{aaa}[b{b}b}{ccc}
とか。
それぞれaaa b{b}b cccというかたちでとりだしたいのですが、どうしたものでしょうか。

**名無しさん＠お腹いっぱい。** · 2006/01/07(土) 10:07:50

>>537
sedはそのままでｏｋ

**名無しさん＠お腹いっぱい。** · 2006/01/07(土) 14:56:41

グループ化用のカッコにエスケープが必要だからsed「では」ダメじゃないの?
Perlならエスケープ不要なので大丈夫。

ところで>>537はテクニシャンだな。
navi2chで円マーク(￥じゃないほう)を表示させやがって…

**名無しさん＠お腹いっぱい。** · 2006/01/07(土) 15:36:35

>>539
ヒント：}{

**名無しさん＠お腹いっぱい。** · 2006/01/07(土) 15:46:46

いや、それは分かってるつもりだけど。
sedだと例えば{(aaa)}{(bbb)}{(ccc)}にマッチしちゃいますよってこと。

**名無しさん＠お腹いっぱい。** · 2006/01/07(土) 17:31:15

>>541
じゃあ不必要な{}()を最初にスペースに変換してからマッチさせたら

**名無しさん＠お腹いっぱい。** · 2006/01/07(土) 18:58:38

そんな必要ない。sedでも>>537のカッコをすべてエスケープすれば良い。
>>538の「sedは」というのが余分だっただけ。

**名無しさん＠お腹いっぱい。** · 2006/01/12(木) 05:55:00

郵便番号をPHPで「1234567」から「123-4567」へ整形する正規表現を教えて下さい。

**名無しさん＠お腹いっぱい。** · 2006/01/12(木) 11:06:51

>>544
【PHP】質問スレッドpart32【php】
http://pc8.2ch.net/test/read.cgi/php/1136276300/

**名無しさん＠お腹いっぱい。** · 2006/01/13(金) 16:59:36

すいません。
--------------------------------
#hogehoge
fugafuga 1
--------------------------------
という風に行頭が#じゃないというのを正規表現で取得したいのですが
「ではない」というのが分かりません。
bashを用いております。
以上　ご助力をお願いいたします。

**名無しさん＠お腹いっぱい。** · 2006/01/13(金) 20:50:59

>>546
grep -v '^#'

**名無しさん＠お腹いっぱい。** · 2006/01/13(金) 21:08:39

>>546
grep '^[^#]'

**名無しさん＠お腹いっぱい。** · 2006/01/13(金) 21:29:57

いつも思うけど、
[^#] 形式だと文字が存在してないときも除外してしまうので
面倒なことあるよね。
ディレクトリリストから
.
..
を除外しようと
[^.][^.].*
を使って一文字のファイル見逃すとか。

**名無しさん＠お腹いっぱい。** · 2006/01/13(金) 21:47:30

>>549
その方が便利なこともある。

**544** · 2006/01/16(月) 17:54:29

ご教授ありがとうございます。
本当に助かりましたっ

**名無しさん＠お腹いっぱい。** · 2006/01/22(日) 02:37:32

正規表現の正規表現ってどうかきますか？
ある値が正規表現の構文に沿っているかどうかを調べたいとき。

**名無しさん＠お腹いっぱい。** · 2006/01/22(日) 02:48:16

入れ子があるから正規表現にはならない。
BNFを書けば3型文法に属さないこと分かるでしょ。

**名無しさん＠お腹いっぱい。** · 2006/01/26(木) 11:22:53

いきなりすんません
２ちゃんねるブラウザ　Jane Doe Style　で正規表現検索を使おうとしたけど、書き方がいまいち分かりません。
F900i　という文字列だけを検索して　F900is　や　F900iT　はヒットさせないようにするには、どう書けば良いですか
ぐぐってもいまいちわからないので。。。。

**名無しさん＠お腹いっぱい。** · 2006/01/26(木) 11:25:48

板違い。

**名無しさん＠お腹いっぱい。** · 2006/01/26(木) 11:32:56

スマンです。でもスレタイ検索してもほかに質問できそうな場所なかったんけどだめですか。

UNIX　085 正規表現 (553)
プログラム　408 正規表現part2 (102)
プログラマー　283 【Regular】正規表現【Expression】 (36)

**名無しさん＠お腹いっぱい。** · 2006/01/26(木) 11:36:10

板違い。

**名無しさん＠お腹いっぱい。** · 2006/01/26(木) 11:49:12

逝

**名無しさん＠お腹いっぱい。** · 2006/01/26(木) 13:16:13

>>554
Jane Doe Style とやらがどんな正規表現エンジンを使っているかにも
激しく依存する話なので、
まずはそのソフトのスレで聞いてみた方が良いと思う。

**名無しさん＠お腹いっぱい。** · 2006/04/15(土) 16:30:37

(・∀・)

**名無しさん＠お腹いっぱい。** · 2006/04/18(火) 03:51:57

onigruma... 気になる。名前が怖い。

**名無しさん＠お腹いっぱい。** · 2006/04/18(火) 09:54:32

nekoguruma だったら弱そうだしな

**名無しさん＠お腹いっぱい。** · 2006/05/02(火) 22:56:16

>>562
いろいろ運べそうじゃないか

**名無しさん＠お腹いっぱい。** · 2006/05/29(月) 20:29:06

正規表現厨には
grep --color

**名無しさん＠お腹いっぱい。** · 2006/05/31(水) 19:33:06

勉強ついでに554を考えてみた。精度に難がありそうですが、以下でどうだろう？

[^A-Zz-z0-9]*F900i[^A-Za-z0-9]*

成瀬 ◆NBGqNARUSE · 2006/06/16(金) 03:35:29

>>565
最低限試そう。"F900iS"=~/[^A-Zz-z0-9]*F900i[^A-Za-z0-9]*/ はマッチする。
ヒント: \W \b 否定先読み

**名無しさん＠お腹いっぱい。** · 2006/07/25(火) 12:40:49

...
Doll ←ここから
\=\-\--\-``--`\=`-==\
\=-\=-\``\==`=`--`-=-

Egg
-=-\-=-\-\=-=--\=-=-=\
-=-\-=-=\=-=\=-=-\-=\- ←ここまで

Fruits
...

のときDoll～Eggの項目まで抽出するにはどうしたらいいですか？
/Doll/,/Fruits/ でおおまかには抽出できるけどもっと正確に抽出したいのです

**名無しさん＠お腹いっぱい。** · 2006/08/09(水) 21:11:53

『詳説正規表現　第3版』が今月発売されるね。
邦訳版の出版は知らんけど。

**名無しさん＠お腹いっぱい。** · 2006/08/10(木) 13:32:24

情報サンクス。
けど、洋書なら原書のタイトル表記でよろしく。
早とちりして必死で oreilly.co.jp と amazon.co.jp 探しちゃったよー。(←あほ)

**名無しさん＠お腹いっぱい。** · 2006/08/10(木) 21:53:00

>>569
http://www.oreilly.com/catalog/regex3/index.html

わざわざ、邦訳版の出版は知らんって書いたのになｗ

**名無しさん＠お腹いっぱい。** · 2006/08/18(金) 16:48:08

http://oraclesqlpuzzle.hp.infoseek.co.jp/regex/index.html
正規表現の問題集らしい

**名無しさん＠お腹いっぱい。** · 2006/08/18(金) 17:01:57

>>568
作者宣伝乙、
というのは冗談で、情報ありがと。
日本語版はいつ出るんだろ。

**名無しさん＠お腹いっぱい。** · 2006/08/23(水) 13:58:51

立ち読みとか読んだうちに入らんと思われた。

**名無しさん＠お腹いっぱい。** · 2006/08/23(水) 17:31:35

>>177
http://oraclesqlpuzzle.hp.infoseek.co.jp/regex/regex-4-10.html
こんなのもあるみたいやね

**名無しさん＠お腹いっぱい。** · 2006/10/05(木) 15:46:12

age

**名無しさん＠お腹いっぱい。** · 2006/10/16(月) 10:51:27

ageとくか

**名無しさん＠お腹いっぱい。** · 2006/10/17(火) 01:00:23

質問させてください。

正規表現を用いたgrepをするときに、
文字列"foo"を含まない全ての行にマッチさせるためには
どのように書けばよいのでしょうか。

**名無しさん＠お腹いっぱい。** · 2006/10/17(火) 01:13:12

**名無しさん＠お腹いっぱい。** · 2006/10/17(火) 08:26:14

man に書いてあるよ。

**名無しさん＠お腹いっぱい。** · 2006/10/17(火) 08:26:50

-v オプションを使わずに、正規表現上で「文字列"foo"を含まない」を表す方法を
聞いているんじゃないだろうか?

**名無しさん＠お腹いっぱい。** · 2006/10/17(火) 09:48:51

(?!foo)

**名無しさん＠お腹いっぱい。** · 2006/10/17(火) 11:12:35

>>581
今はgrepでの話をしてんだろ。

**名無しさん＠お腹いっぱい。** · 2006/10/17(火) 13:02:02

>>577
否定先読み

**名無しさん＠お腹いっぱい。** · 2006/10/17(火) 13:37:52

>>583
正規表現でできるものか！
先読み、後読み共に否定は貧弱

**名無しさん＠お腹いっぱい。** · 2006/10/17(火) 18:14:48

「一致しない」はあらゆる箇所にマッチするからね
行単位の処理とは基本的に相容れないし

正規表現でなく、-vのようなメタレベルで対処するのが正解
sedとかでもいいな

**名無しさん＠お腹いっぱい。** · 2006/10/17(火) 19:17:42

>>585
なんで、.*?(?!xxx)　を、xxxが一切含まない行、と解釈してくれないんですかね？

**名無しさん＠お腹いっぱい。** · 2006/10/17(火) 19:55:43

論理的に考えてみればわかるよ

**名無しさん＠お腹いっぱい。** · 2006/10/18(水) 09:59:12

>>587
欲張りマッチだから、xxxが見つかった段階で一文字戻ってマッチにしちゃう？

**名無しさん＠お腹いっぱい。** · 2006/10/18(水) 11:10:22

>>586
解釈するわけがない

**名無しさん＠お腹いっぱい。** · 2006/10/20(金) 10:45:16

^(?!.*foo)
でできるだろ

http://pc8.2ch.net/test/read.cgi/tech/1156413899/l100
の1のサイトをよく読め

**名無しさん＠お腹いっぱい。** · 2006/10/24(火) 10:00:30

正規表現でできることの仕様ってずっとこのままなんですかね。
括弧の対を考慮した表現とかって簡単にならないかな。

**名無しさん＠お腹いっぱい。** · 2006/10/24(火) 11:17:38

処理系ごとに拡張してあったりするじゃん。

**名無しさん＠お腹いっぱい。** · 2006/10/24(火) 11:28:08

hp-uxのgrep糞だなｗ
\< \>が使えん。

**名無しさん＠お腹いっぱい。** · 2006/10/24(火) 12:07:18

grepツールで、htmlのコメント内を検索対象からはずしてgrepできるツールありますか？
コメントで死ぬほど引っかかって苦労してます。
複数行コメント中の真ん中ぐらいの行に引っかかっても、先頭に<!--がないから
普通のgrepツールだときびしいです。

**名無しさん＠お腹いっぱい。** · 2006/10/24(火) 12:13:02

sedしかないだろ。

**名無しさん＠お腹いっぱい。** · 2006/10/24(火) 12:24:01

-- の対応まで見ようとするとつらそうだ。

**名無しさん＠お腹いっぱい。** · 2006/10/24(火) 21:37:54

複数行になると途端にわけわからんくなるな・・・。

**名無しさん＠お腹いっぱい。** · 2006/10/26(木) 05:24:59

改行位置を変換する前処理をしてからやるとか

**名無しさん＠お腹いっぱい。** · 2006/10/26(木) 11:38:24

コメントを
s/<!(?:--[^-]*-(?:[^-]+-)*?-(?:[^>-]*(?:-[^>-]+)*?)??)*(?:>|$(?!\n)|--.*$)//g
で取り除いてからgrepすればいいんじゃね？

**名無しさん＠お腹いっぱい。** · 2006/11/03(金) 14:20:22

マルチで済まない。

同じ文字が３文字連続していたら表示したいのだが

**名無しさん＠お腹いっぱい。** · 2006/11/03(金) 15:02:08

>>599
＞s/<!(?:--[^-]*-(?:[^-]+-)*?-(?:[^>-]*(?:-[^>-]+)*?)??)*(?:>|$(?!\n)|--.*$)//g
この部分はsed？
だったら、その後もgrepなんかせずに、sedだけで完結すればいいじゃん。
awkでも同じく。

**<sage>** · 2006/11/10(金) 19:30:45

教えて下さい。

ダブルクオートで囲まれていない、コンマだけを置き換えたいのですが、
正規表現では、どうあらわせばいいのでしょうか？

例：
"aaa, bbb" xxxx, "ccc, ddd" yyyyyy

xxxx, <- このコンマを－＞ xxxx; とセミコロンにしたいです。

よろ

**名無しさん＠お腹いっぱい。** · 2006/11/13(月) 23:01:55

>>602
http://pc8.2ch.net/test/read.cgi/tech/1156413899/l100
のリンク先嫁

**<sage>** · 2006/11/14(火) 15:35:11

>> 603
そのページのどこを読めと？

**名無しさん＠お腹いっぱい。** · 2006/11/22(水) 14:36:47

>>604
ほぼ全部
雑魚には無理な正規表現ってこった

**名無しさん＠お腹いっぱい。** · 2006/11/22(水) 20:49:29

氏ね

**名無しさん＠お腹いっぱい。** · 2006/11/26(日) 13:47:54

>>602

◆関連サイト
正規表現メモ
http://www.kt.rim.or.jp/~kbk/regex/regex.html
Perl正規表現雑技
http://www.din.or.jp/~ohzaki/regex.htm
Regular Expression(Riue ちゃんの正規表現講座)
http://www.sixnine.net/regexp/
正規表現パズル
http://oraclesqlpuzzle.hp.infoseek.co.jp/regex/
詳説正規表現
http://www.oreilly.co.jp/books/4873111307/
正規表現プログラミングFAQ
http://capslockabcjp.kitunebi.com/faq.html

これだけ読めば解決できるが
池沼には無理

**名無しさん＠お腹いっぱい。** · 2006/12/04(月) 14:18:49

アルファベットの文字で構成されるが、「d」は入らない、を
[a-ce-z]以外の書き方で表現する方法はないですか？

もちろん↓はエラーだけど、こんな漢字で書ければいいのだけれど。

[a-z][^c]

**名無しさん＠お腹いっぱい。** · 2006/12/04(月) 19:22:18

a|b|c|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z

**名無しさん＠お腹いっぱい。** · 2006/12/04(月) 22:02:59

>>608
javaならできる

**名無しさん＠お腹いっぱい。** · 2006/12/04(月) 22:08:51

d|i|g|i|t|a|l

**名無しさん＠お腹いっぱい。** · 2006/12/05(火) 09:35:00

>>610
どうやるんだべさ？

**名無しさん＠お腹いっぱい。** · 2006/12/06(水) 02:45:07

>>612
[[a-z]&&[^d]]
こんな感じだったと思う。

**名無しさん＠お腹いっぱい。** · 2006/12/06(水) 09:44:34

>>613
うぉぉぉぉぉぉぉぉぉぉぉぉぉぉぉぉぉ～、すげぇ～。できました！
javaだとこんなのができるのか！
もちろん正規表現標準じゃないので、perlとか秀丸正規表現ではできないかぁ・・・

javaならではの裏技って他に何かあるんですかね？