正規表現

■ このスレッドは過去ログ倉庫に格納されています
NGNG
正規表現
465名無しさん@お腹いっぱい。
垢版 |
NGNG
ブラケットの中でピリオドを入れる時ってメタキャラクタとして扱われますか?

[\w.]

[\w\.]
が同じ動きにになるみたいなんですけど・・・。

ちなみに、パールです。
NGNG
>>465
「みたい」じゃなくてテストコードで示してよ。
NGNG
どの言語の正規表現がどんな有限オートマトン使ってるという情報って
どこかにありますかねぇ。正規表現コンバータ作ろうかと思ってるのですが。。

NFA、DFAの違いぐらいは詳説正規表現の本でわかるのですが、実装ともなると。
オートマトンの変換に関してはコンパイラの本を参考にしてますが、
やはりかなりつらいものがありますね。たんに字句解析して作った方がいいのかなぁ。
NGNG
普通にNFA+DFAでいいじゃん
NGNG
オブジェクト指向正規表現の仕様策定はまだですか?
NGNG
>>469
聞いたことないな。
何それ?
NGNG
>>469
まかせた。
472名無しさん@お腹いっぱい。
垢版 |
NGNG
お前らWinの.NETなんだが正規表現の質問をさせてくれ。

RegularExpressions.Regexで下の文字列を検索して<TD>から</TD>に分けたい。

string strHtml = "<TD>a</TD><TD>b</TD><TD>c</TD>"

Regex regex = Regex("<TD>.*</TD>");
MatchCollection matchcollection = regex.Matches(strHtml);

だと最長一致で "<TD>a</TD><TD>b</TD><TD>c</TD>"の1つのコレクション取得。

Regex regex = Regex("<TD>.*?</TD>");

だとやりたい "<TD>a</TD>", "<TD>b</TD>","<TD>c</TD>"の3つのコレクションが取得できる。

.*? の意味をアフォにも分かるように説明してくれ。
.*(任意の0文字以上)が?(あるかないか)だろ。
なんで思った通りに3つのコレクションが取得できるの?
473472
垢版 |
NGNG
*? つーのは最短一致という便利なキーワードなのか。
つまらん質問失礼しますた。
474名無しさん@お腹いっぱい。
垢版 |
NGNG
下がってるので、どれ一つ、とんちでも。
rubyでは
/aa+??/ =~ "a" => 0
emacsでは
"aa+??" =~ "a" => nil
さて、こうなってしまうのは、各々がどのようなオートマトンで
解釈されているからでしょうか。
NGNG
emacsって最短マッチあんの?
NGNG
ありましゅよー
ttp://www.cs.huji.ac.il/support/emacs/elisp-help/elisp-manref/elisp_34.html

でも、{m,n}? の最短マッチはないみたい…。
NGNG
最短マッチに対応した grep ってある?
NGNG
>>477
grep が最短マッチに対応してるかどうかが問題になるケースってある?
05/01/30 22:46:31
[^ま]*まってかくのめんどくさい
480名無しさん@お腹いっぱい。
垢版 |
05/02/26 05:47:57
あげ
481名無しさん@お腹いっぱい。
垢版 |
2005/03/30(水) 02:33:49
up
2005/04/19(火) 17:08:07
正規表現の実装っていろいろあることにやっと気づいた漏れorz
2005/05/14(土) 15:12:25
ほしゅ
484名無しさん@お腹いっぱい。
垢版 |
2005/05/16(月) 16:51:45
abc xyzをaxbyczにしたいのですが
2005/05/16(月) 17:05:02
s/abc xyz/axbycz/g
2005/05/16(月) 19:33:57
ワロタ
2005/05/16(月) 19:34:25
保守
488名無しさん@お腹いっぱい。
垢版 |
2005/05/17(火) 22:45:20
>>484
echo abc xyz |sed -e "s/^/%/; :ll; s/[%]\(.\)\(.*\) \(.\)\(.*\)/\1\3%\2 \4/; tll; s/%//;"
2005/05/18(水) 00:13:40
うひょー
2005/05/28(土) 03:19:18
うに厨として、% をめぐる動きに溜息出た…真剣にありがと 何重にも目が覚めた
2005/05/28(土) 05:32:41
abc xyz でも
abcdefg ABCDEFG でもできるね。すげーや。
2005/06/02(木) 22:17:25
a
2005/06/04(土) 23:07:23
('A`)
2005/06/19(日) 02:53:08
Onigurumaを使っているんですが、
あるテキストデータがあります。
----- ここから
END

注釈 ○○○
注意 △△△
補足 ◎◎◎

TITLE
----- ここまで
という部分の、ENDの後の空白行からTITLEの前の空白行の部分(間の行)を削除して、
ENDとTITLEの間は1行だけの空白行にしたいです。
「END\s^[0-9a-zA-Z。-゜ぁ-んァ-ヶ亜-?]*\sTITLE」を指定してもマッチしないんですが、
これは私の正規表現の式が間違えているんでしょうか?
(複数行を1度に選択する方法を間違えている???)
2005/06/19(日) 03:13:31
>>494
つーか、正規表現だけ見せられても判断できないと思うんだけど。
改行処理や文字コードのオプション設定はどうしてるかとかいろいろ情報が足りない。
2005/07/13(水) 09:25:56
素直に、
~s/END(\s*.*?\s*)TITLE/END\n\nTITLE/sg;
じゃダメ?
2005/07/13(水) 13:15:24
>>496
Oniguruma の質問なわけだが?
2005/07/13(水) 17:54:26
…とは思ったのだが、Perl 互換らしーから、いーかなとw

てか、見つかるのむちゃくちゃ早いなww
事後ながら、oniguruma (ライブラリ)取りに行った
2005/07/13(水) 19:58:46
>>498
> 見つかるのむちゃくちゃ早いなww
どういうこと?
2005/07/17(日) 23:17:41
>494
> 「END\s^[0-9a-zA-Z。-゜ぁ-んァ-ヶ亜-?]*\sTITLE」を指定してもマッチしないんですが、
> これは私の正規表現の式が間違えているんでしょうか?
> (複数行を1度に選択する方法を間違えている???)

これのどこが、複数行を一度に選択しているの?
2005/07/19(火) 19:22:13
>>500
ONIG_OPTION_MULTILINE (や REG_NEWLINE や RE_OPTION_MULTILINE など) をセット
しているかどうかで複数行選択できるかどうか変わるので、
そのへんを晒せばもうちょっと状況がわかると思うのだが、
元質問者はもう既にどっかいっちゃったのだろうな。
502名無しさん@お腹いっぱい。
垢版 |
2005/09/21(水) 20:57:28
正規表現で
○○ か ○○の場合と言うのはどう表現するのでしょうか?

Cで言う、 || のようなものです。
2005/09/21(水) 21:07:45
テンプレに何もないんだなこのスレ。
このあたりで調べろ

http://www.kt.rim.or.jp/%7Ekbk/regex/regex.html
2005/09/21(水) 21:18:44
\(>∀<\) キャー
2005/09/21(水) 21:58:13
(;`∇´))))))))))) \(>∀<\) キャー
2005/09/21(水) 22:48:45
俺ならこう→「\(○{2}\) か \1の場合」
2005/09/21(水) 23:46:20
何気に正規表現本もラッシュだな。
2005/09/22(木) 00:19:11
\([^ ]∀[^ ]*\)

AAみたいな正規表現を作りたいが難しい。
2005/09/22(木) 02:52:41
つくれてるやん!
2005/09/23(金) 23:15:15
∀ がメタキャラになってくれると楽しいかも
2005/09/26(月) 20:32:51
дも
2005/09/28(水) 14:54:06
ネタキャラ
2005/12/09(金) 01:04:17
純粋に興味の問題なんだけど、
「ある文字集合の要素が各1回ずつしか出現しない」という文字列は
正規表現で表現できる?

例えばA, B, Cの文字からなる言語を考えたとすると、
ABC ACB BAC BCA CAB CBAの6つの文字列にマッチする表現っす。
2005/12/09(金) 01:08:23
文字集合の濃度が有限なら
単に | でつなげばいいな。
2005/12/09(金) 02:30:43
いろは歌とか"a quick brown fox..."みたいなのにマッチさせる正規表現、
って書けば説明が早かったかもですね。

>>514
ひらがなの場合で47!個、アルファベットの場合で26!個の文字列を
|でつなぐってことになると思うんですが、やはりこれしか方法ないんですかね。
正規表現の長さは… アルファベットの場合でも約1京テラバイトか… orz
2005/12/09(金) 09:42:38
>>513
[^A]*A[^A]* ではどうよ
2005/12/09(金) 09:53:24
>>516
BBA にもマッチしちゃうんでは。
2005/12/09(金) 09:57:44
>>515
> "a quick brown fox..."みたいなのに
o 2回出てるよ。

実用を考えたら正規表現以外でやった方がいいな。
2005/12/09(金) 19:50:27
いろは歌って内容も傑作だよな。
2005/12/09(金) 21:53:37
> o 2回出てるよ。

おお、32年生きてて初めて気が付いたっす。漏れの目はfusianasanさんだ… orz

> 実用を考えたら正規表現以外でやった方がいいな。

そうことになっちゃいますかね。みなさんレスどうもでした。
521名無しさん@お腹いっぱい。
垢版 |
2005/12/11(日) 08:09:16
Windowsで正規表現にマッチする文字列のみ(行全体じゃなく)を表示・保存するにはどうすればいいのでしょうか?
xyzzyとかのエディタのgrepでやろうとしたのですが、検索してもよくわかりません。
Rubyとかスクリプト言語を使わないと無理でしょうか?
2005/12/11(日) 08:13:57
上すいません。書きこむスレ間違えました。(プログラム板の正規表現スレに書きこんだつもりでした。)
523名無しさん@お腹いっぱい。
垢版 |
2005/12/11(日) 11:19:25
ちょうど一回出るんなら何かの順序でソートして文字列が完全一致することをチェックかなあ
524名無しさん@お腹いっぱい。
垢版 |
2006/01/01(日) 11:16:33
エディターの正規表現で置き換えをしたいんですが・・・
1、2、3、・・・という連番を
(1) (2) (3)というふうに置き換えたいのですが
どうしたらよいでしょうか。
2006/01/01(日) 11:57:28
まずは(ry
2006/01/01(日) 12:39:56
置換元:[1-9]
置換先:(\0)
で、できるかもよ。
527名無しさん@お腹いっぱい。
垢版 |
2006/01/01(日) 17:30:57
>>526
だめでした。
2006/01/01(日) 19:50:58
置換元:[1-9][0-9]*
置換先:\(\0\)
こんな風にすればできるのかな?
どんな風に駄目だったかわからないけれど。
529名無しさん@お腹いっぱい。
垢版 |
2006/01/01(日) 20:02:16
>>528
それもやってみましたが、検索はされるのですが、
置き換えが出来ません。(0)となってしまいます。
前回のは(となってしまいます。
エディターだから駄目なのでしょうか。
2006/01/01(日) 20:09:51
\0のところを、
\1
$1
にしても同じかな?
531名無しさん@お腹いっぱい。
垢版 |
2006/01/01(日) 20:13:18
>>530
($1)となってしまいます。
2006/01/01(日) 20:17:25
そのエディタの正規表現がreference(\1とか$1とか)をサポートしてないに1票。
533名無しさん@お腹いっぱい。
垢版 |
2006/01/01(日) 21:27:04
!(^^)!ピンポーンです。
ヘルプを見ていたら、referenceはサポートしていないと出ていました。
他のエディターを探すか、どうしたらいいでしょうか。
534名無しさん@お腹いっぱい。
垢版 |
2006/01/01(日) 23:17:07
続きです
結局QXエディタをダウンロードして使いました。
びっくりしたのはWindows上では
正規表現というのは全然一般的ではないんですね。
勉強しようにも正規表現サポート自体が脆弱だったんですね。
2006/01/01(日) 23:32:29
ググればなんぼでも出てきます。少し自分で考えなはれ。
2006/01/03(火) 22:49:27
まあやることがハッキリ決まってるんなら、
(念の為)対象ファイルのカレントディレクトリのDOS窓を開いてsed、だな。
537名無しさん@お腹いっぱい。
垢版 |
2006/01/07(土) 07:00:27

{aaa}[bbb}{ccc}
という文字列から、aaa bbb cccをそれぞれマッチさせてとりだしたいので、

/¥{(.*)¥}¥{(.*)¥}¥{(.*)¥}/

としていましたが、
とりだしたい文字列のなかに、さらに{}がはいっていることがあることが
わかりました。
{aaa}[b{b}b}{ccc}
とか。
それぞれaaa b{b}b cccというかたちでとりだしたいのですが、どうしたものでしょうか。
2006/01/07(土) 10:07:50
>>537
sedはそのままでok
2006/01/07(土) 14:56:41
グループ化用のカッコにエスケープが必要だからsed「では」ダメじゃないの?
Perlならエスケープ不要なので大丈夫。

ところで>>537はテクニシャンだな。
navi2chで円マーク(¥じゃないほう)を表示させやがって…
2006/01/07(土) 15:36:35
>>539
ヒント:}{
2006/01/07(土) 15:46:46
いや、それは分かってるつもりだけど。
sedだと例えば{(aaa)}{(bbb)}{(ccc)}にマッチしちゃいますよってこと。
2006/01/07(土) 17:31:15
>>541
じゃあ不必要な{}()を最初にスペースに変換してからマッチさせたら
2006/01/07(土) 18:58:38
そんな必要ない。sedでも>>537のカッコをすべてエスケープすれば良い。
>>538の「sedは」というのが余分だっただけ。
544名無しさん@お腹いっぱい。
垢版 |
2006/01/12(木) 05:55:00
郵便番号をPHPで「1234567」から「123-4567」へ整形する正規表現を教えて下さい。
2006/01/12(木) 11:06:51
>>544
【PHP】質問スレッドpart32【php】
http://pc8.2ch.net/test/read.cgi/php/1136276300/
2006/01/13(金) 16:59:36
すいません。
--------------------------------
#hogehoge
fugafuga 1
--------------------------------
という風に行頭が#じゃないというのを正規表現で取得したいのですが
「ではない」というのが分かりません。
bashを用いております。
以上 ご助力をお願いいたします。
2006/01/13(金) 20:50:59
>>546
grep -v '^#'
2006/01/13(金) 21:08:39
>>546
grep '^[^#]'
2006/01/13(金) 21:29:57
いつも思うけど、
[^#] 形式だと文字が存在してないときも除外してしまうので
面倒なことあるよね。
ディレクトリリストから
.
..
を除外しようと
[^.][^.].*
を使って一文字のファイル見逃すとか。
2006/01/13(金) 21:47:30
>>549
その方が便利なこともある。
551544
垢版 |
2006/01/16(月) 17:54:29
ご教授ありがとうございます。
本当に助かりましたっ
552名無しさん@お腹いっぱい。
垢版 |
2006/01/22(日) 02:37:32
正規表現の正規表現ってどうかきますか?
ある値が正規表現の構文に沿っているかどうかを調べたいとき。
2006/01/22(日) 02:48:16
入れ子があるから正規表現にはならない。
BNFを書けば3型文法に属さないこと分かるでしょ。
2006/01/26(木) 11:22:53
いきなりすんません
2ちゃんねるブラウザ Jane Doe Style で正規表現検索を使おうとしたけど、書き方がいまいち分かりません。
F900i という文字列だけを検索して F900is や F900iT はヒットさせないようにするには、どう書けば良いですか
ぐぐってもいまいちわからないので。。。。
2006/01/26(木) 11:25:48
板違い。
2006/01/26(木) 11:32:56
スマンです。でもスレタイ検索してもほかに質問できそうな場所なかったんけどだめですか。

UNIX 085 正規表現 (553)
プログラム 408 正規表現part2 (102)
プログラマー 283 【Regular】正規表現【Expression】 (36)
2006/01/26(木) 11:36:10
板違い。
2006/01/26(木) 11:49:12
2006/01/26(木) 13:16:13
>>554
Jane Doe Style とやらがどんな正規表現エンジンを使っているかにも
激しく依存する話なので、
まずはそのソフトのスレで聞いてみた方が良いと思う。
560名無しさん@お腹いっぱい。
垢版 |
2006/04/15(土) 16:30:37
(・∀・)
561名無しさん@お腹いっぱい。
垢版 |
2006/04/18(火) 03:51:57
onigruma... 気になる。名前が怖い。
2006/04/18(火) 09:54:32
nekoguruma だったら弱そうだしな
2006/05/02(火) 22:56:16
>>562
いろいろ運べそうじゃないか
564名無しさん@お腹いっぱい。
垢版 |
2006/05/29(月) 20:29:06
正規表現厨には
grep --color
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況