正規表現

**正規表現** · NG

正規表現

終了 · NG

終了

**名無しさん＠お腹いっぱい。** · NG

/\s*終\s*了\s*/

**名無しさん＠お腹いっぱい。** · NG

oreillyの本読めば全てに限りなく近く分る。よって終了。

**名無しさん＠お腹いっぱい。** · NG

板地害

**名無しだよもん＠カラアゲうまうま** · NG

http://www.oreilly.co.jp/BOOK/regex/

**名無しさん＠お腹いっぱい。** · NG

釣り合いの取れた括弧にマッチする正規表現を教えてください。

()
((()))
((((()))))
(()())
((())(()()))

**名無しさん＠お腹いっぱい。** · NG

正規表現ってFAだけで実装してるの?PDAも使うの?

**名無しさん＠お腹いっぱい。** · NG

>>7
無い。

**名無しさん＠お腹いっぱい。** · NG

(・)(・)
. .) (
( Y )

**性器表現** · NG

性器表現

**名無しさん＠お腹いっぱい。** · NG

限界までgrepやればいい気持ち

**名無しさん＠お腹いっぱい。** · NG

正則表現って訳してる本無かったっけ？

**名無しさん＠お腹いっぱい。** · NG

詳説正規表現に正則表現という言葉が出てきた気がする

**はにゃーん☆** ◆ZoWSAKURAw · NG

>>7
Perl 5.6 以降なら、可能。

#! /usr/local/bin/perl

@kakko = qw[()
())
((()))
(()()))
((((()))))
(()())
((())(()()))];

$regex = qr/[^()]*$(??{$regex})*$[^()]*/;

foreach (@kakko) {
if(/^$regex$/) {
print "Match: $_\n";
} else {
print "Unmatch: $_\n";
}
}

**名無しさん＠お腹いっぱい。** · NG

でも、それ正規表現じゃないんじゃないの？
文脈自由文法のクラスでしょ？

**名無しさん＠お腹いっぱい。** · NG

それ言ったら、今の「正規表現」なんてそもそもの定義から外れちゃうような気がするぞ。

**名無しさん＠お腹いっぱい。** · NG

数学的文脈におけるいわゆる「正則な表現」だけで括弧の釣り合いにマッチさせるスレはここですか?

**名無しさん＠お腹いっぱい。** · NG

ここは既に終了したスレです。

**名無しさん＠お腹いっぱい。** · NG

いやん、正規表現がんばろー。
16>>
拡張正規表現で納得しろ。

**名無しさん＠お腹いっぱい。** · NG

そもそも正規言語は数をかぞえられないんだから、
拡張正規表現でもないでしょ。

**名無しさん＠お腹いっぱい。** · NG

拡張正規表現 = 「正規表現」の定義を拡張。;)

**名無しさん＠お腹いっぱい。** · NG

>>20
言った方がいいかどうかわからんが
16>>
逆だ

**名無しさん＠お腹いっぱい。** · NG

/^(U).\/*&_$&&*_@&(&*@+|@_(@)(?!<>)_##[o-Q](.*O+)&^&%^#)#+#$/

**おむこさん志望** ◆QtGqCwfDSA · NG

いま glibc のマルチバイト回りをやってる人が書いたドキュメント
http://lc.linux.or.jp/lc2001/papers/dfa-i18n-paper.pdf
http://lc.linux.or.jp/lc2002/papers/hasegawa0918h.pdf

>>13
オートマトンで有名な本
http://www.saiensu.co.jp/books-htm/ISBN4-7819-0374-6.htm
には正則表現って書いてあった。

**名無しさん＠お腹いっぱい。** · NG

ttp://sorekika.com/dame.jsp?idx=352

**名無しさん＠お腹いっぱい。** · NG

question = ( to ) ? be : ! be;
　　　　　　　　　-- Wm. Shakespeare

**性器表現** · NG

凸

**山崎渉** · NG

（＾＾）

**名無しさん＠お腹いっぱい。** · NG

質問よいでしょうか・・・
英辞郎の読み仮名を削除したいのですが、
｛(←全角です)ではじまり｝(←これも全角です)でおわる文字列を
ごっそり置換したいのですが、どう表現すればいいのかよく
わかりません・・・・　おしえてくださいおながいします

**名無しさん＠お腹いっぱい。** · NG

>>30
処理系は何？

**名無しさん＠お腹いっぱい。** · NG

>>30
sed "s/｛.*｝//" < input > output
では駄目かい？

**名無しさん＠お腹いっぱい。** · NG

>>32
その解は1行に複数の対が出てきたときに破綻する

**名無しさん＠お腹いっぱい。** · NG

>>31
入れ子になっていない、かつsedが日本語に対応しているならば
s/｛[^｝]*｝//
というパターンを使うのが楽。

30 · NG

>>31
Windowsなんですよね・・・xyzzyの置換使おうかと思ってたんですが
あ、Pythonも使い方よくわからないけど(汗汗)入ってます
# Pythonだとどうかくんですかね？？

ダメだったらCygwinでも入れてやってみようと思います。
皆様有難う御座います。

**名無しさん＠お腹いっぱい。** · NG

秀丸の置換使えば？

**名無しさん＠お腹いっぱい。** · NG

perlぐらいうごかん？

**あぼーん** · NG

あぼーん

30 · NG

>>34さんの方法で問題なく出来ました。
有難う御座いました。とりあえず、この表現の
意味をきちんと理解しとこうと思います。ﾒﾓﾒﾓ･･･

ところで、>>36さん、何故秀丸？

**あぼーん** · NG

あぼーん

**名無しさん＠お腹いっぱい。** · NG

BNF使え

**エディタ何617** · NG

http://pc2.2ch.net/test/read.cgi/software/1040201710/641-643
より移行してきますた。
正規表現の話はこっちでしましょ。
俺には大した知識はないんだが。

>642 ：名無しさん＠お腹いっぱい。 mailto:[sage] ：03/02/21 15:28 ID:esOQbptZ
>なんのために [:alpha:] のような書式があるのかと子一時間

これは知らんかった。
テキストエディタの粋を脱しそうだが。

**エディタ何617** · NG

>643 ：名無しさん＠お腹いっぱい。 mailto:[sage] ：03/02/21 15:31 ID:+tcoIlhs
>>>641
>文字クラスが文字コードに依存するって言うのは恥ずかしいことでしかないと思うんだが。
>どんなコードでも入力が同一なら出力も同一であるべきじゃないの？

後半はよくわからんが、文字クラスが文字コードに依存するのは当然のことだと思うぞ。

文字 a は a というアルファベットという意味があるわけではなく単なるコード(0x61)なわけ。
テキストエディタでは普段から文字コードなんて考える必要はないんだけど、
正規表現では [a-z] とすると
Shift-JISなら [\x61-\x7A]
EBCDICなら [\x81-\xA9]
というふうに変わってくる。
当然文字コードに依存する。
ここで文字コードに依存せずに認識するとなると、EBCDICの場合
[a-z]=[\x81-\x89\x91-\x99\xA2-\xA9]
になってしまって本来の [\x81-\xA9] にはならなくなってしまう。
そのために 642 のような [:alpha:] なんかが用意されている。
さもなければ文字コード共通正規表現用文字テーブルなんてものが必要になりかねない。

テキストエディタで扱う文字コードとして EBCDIC を例に出すのは適当ではないが。

エディタがしているのは文字コードを認識して表示するということで、
文字コードを変換しているわけではない。
もちろん明示的に変換(文字コードを変更して保存等)すれば変わる。

**名無しさん＠お腹いっぱい。** · NG

>文字クラスが文字コードに依存するって言うのは恥ずかしいことでしかないと思うんだが。

そりゃ確かに恥ずかしい。
でも [a-z] という表記が「小文字アルファベットの文字クラスを指定している」ものだと誤解して、
誤用しているほうがもっと恥ずかしい。
「-」を使った表記は文字コード上で連続した複数の文字を意味しているだけだから、
本当に文字クラスを指定しなければならないシーンでは [:lower:] や \l を使うべき。
代表的なエンコーディングでは偶然文字コードが連続しているから
[a-z] で期待した動作になるので常用されているの。

**名無しさん＠お腹いっぱい。** · NG

[:alpha:] とかってウムラウトがどうたらとかいう話のためにあるのだと思ってた

**名無しさん＠お腹いっぱい。** · NG

unicode などが本格的に使われ出して
多国語があたり前になったら
[:Japanese:] とか [:Korean:] とか
できるのかな。

**名無しさん＠お腹いっぱい。** · NG

>>45
その通り。 POSIX ではロケールによって変わるよ。

**テキ何618** · NG

興味があるので誘導されてきました。

ってココは関連Linkないので張るね。
●正規表現最新リンク集2003
ttp://www2.famille.ne.jp/~akio1998/l_grep.html
●正規表現メモ
ttp://www.kt.rim.or.jp/~kbk/regex/regex.html

で向こうのスレでの疑問で思ってたんですが、
| また正規表現の正しい、正しくないってあるのか？
上の引用についてずばり解決してくれる神はおられませんか？
向こうでも思ってたんだけど中途半端な正規化だから文字コードに
依存するって思ってたんですが。

**名無しさん＠お腹いっぱい。** · NG

>>44
>本当に文字クラスを指定しなければならないシーンでは
> [:lower:] や \l を使うべき。

つーことは[B-Yb-y]は本当に文字クラスを指定せんといかんシーンでは
　[BCDEFGHIJKLMNOPQRSTUVWXYbcdefghijklmnopqrstuvwxyz]
あるいは
　[^AZaz[:digit:](憶えとらんので略)]
と書かねばならんわけか…

**名無しさん＠お腹いっぱい。** · NG

[:alpha:] とかって、実際に実装されてるのあるの?

**名無しさん＠お腹いっぱい。** · NG

>>48
ある正規表現が書かれた目的を果たせるかどうかで、正しい正しくないを言うことはで
きるでしょう。ただし目的を果たすといっても厳密でなければならない場合やアバウト
で大丈夫な場合と様々なレベルがあるわけで、ケースに応じて使い分けるのが大人とい
うものです。

それから正規化しているから正規表現というわけじゃないです。ある有限オートマトン
が受理する特定の言語(記号列)を正規言語と呼び、その受理される言語の全ての集合を
正規集合と呼び、その集合を表現する方法を正規表現と呼んでいるのです。文字コード
云々が問題になるのは、SJISやEUCのようなマルチバイトコードで表現された1文字を1
つの記号として認識しない正規表現エンジンがあるからで、またエンジンが認識する場
合でも利用者側が記号としての文字と文字コードとの関係を、[a-zA-Z] と [:alpha:]
のようにゴッチャにしているからです。もっとも後者についてはマルチバイトには依存
しない話ですけれど。

>>49
厳密にはそういうことになります。メンドイのでそこまでする人は少ないでしょうが。