正規表現

■ このスレッドは過去ログ倉庫に格納されています
NGNG
正規表現
308あぼーん
垢版 |
NGNG
あぼーん
NGNG
>>308
二度と目を覚ますな。
310あぼーん
垢版 |
NGNG
あぼーん
NGNG
さげ保守
NGNG
OOはもうすぐ1.1出るけど、MSWORDよりセキュリティ大丈夫かな?
http://pc2.2ch.net/test/read.cgi/bsoft/1055292975/392
313あぼーん
垢版 |
NGNG
あぼーん
314高校生
垢版 |
NGNG
boo
baa
baz
っていうテキストが例だとして、sedを用いて、
booまたはbaz、っていう正規表現はどうなるの?
rubyやperlならパイプ記号で条件和の表現が出るけど、
同じように書いてもsedに誤解されてしまう。
NGNG
>>314 ん? \|使えば良いのでは
316高校生
垢版 |
NGNG
sed 's/boo\|baa/hoge/g' ./hage.txt
とかだとやっぱりだめなんすよね。
「boo」とかの単語の括り方がよくわからんのです。
NGNG
GNU sed 4.0.7版 ではそれでもできてるけどな。
sed 's/\(boo\|baa\)/hoge/g' これでどう?
NGNG
>>317
gsedならできるがsedは食ってくれない。
NGNG
単一の正規表現じゃなきゃいかんの?
sedと決まってるなら
sed -e 's/boo/hoge/g' -e 's/baa/hoge/g'
でいいんちゃう?

置換後の文字列と置換前の文字列の片方とで重なりがある場合
どうするかひとしきりモメたりする ↓↓↓ のがお決まりだな。
NGNG
単一の正規表現でないと記述が冗長で見た目がキモイ、
っていうのはあると思うよ。
おいらはインストール直後のFreeBSDの環境構築をスクリプトに任せたくて、
結局シェルスクリプトにawkな記述を書いて解決した。
カーネルの再構築にしても、/etc/下の記述にしても、要はテキストの置換なわけで。
本当はrubyがFreeBSDの/usr/bin下にあるようなご時世だったら
楽ができるんだけど、そこら辺は個人的な勉強不足だなぁ。
321名無しさん@お腹いっぱい。
垢版 |
NGNG
{a,b}上の言語Lが
『aaで開始し、かつ、bbを部分列として含む』という条件を満たす語からなるとき
Lを表す正規表現ってどうなるの?
L=aa(a*b*+bb)* ?
NGNG
L=aa(a+b)*bb(a+b)*
NGNG
>>321
*+ ???
NGNG
>323
'+'より'|'のほうが普通かな。
L=aa(a|b)*bb(a|b)*

本来的には連接、選択、閉包が表現できればいい。
NGNG
L ::= aA
A ::= aB
B ::= aB | bC
C ::= aB | bD
D ::= ε | aD | bD
NGNG
.*
何にでもマッチする最強の正規表現です!
327名無しさん@お腹いっぱい。
垢版 |
NGNG
>>326
ドットが含まれてなかったらマッチしない罠
NGNG
キター
NGNG
ageてるし、ネタと見た。
NGNG
>>329
しね!
331あぼーん
垢版 |
NGNG
あぼーん
332あぼーん
垢版 |
NGNG
あぼーん
333名無しさん@お腹いっぱい。
垢版 |
NGNG
うまづら。
NGNG
ほす。
NGNG
☆湯
NGNG
[ruby-list:38393] じゃないけど、[a-z] みたいな文字クラスの表現は、
EBCDIC とかだと「意図した通り」には動かないと思うんだけど、
ASCII か ASCII を包含したキャラクタセットという前提で書くべきものなの?
NGNG
>>336
[:lower:] とかは使っちゃだめ?
NGNG
>>337
あ、いや、質問が悪かったですね。
範囲指定する文字クラスはどうあるべき (書くべき) か?っていう話です。

ていうか、 re_format(7) を私の拙い英語力で読んでみたところ、
ASCII コードの並びを前提とするような文字クラスの範囲指定は、
portable じゃないからやらない方が良い、ということのようですね。

というわけで、極力 >>337 さんのみたいな文字クラス指定を使った方が良い、と。
NGNG
NGNG
保守
341名無しさん@お腹いっぱい。
垢版 |
NGNG
vimで"DEL"という文字列が含む行で、"DEL"以下を削除したい場合はどうしたらいいでしょうか?
NGNG
スレ違い。


Vim6 Part6
http://pc.2ch.net/test/read.cgi/unix/1058706125/
343名無しさん@お腹いっぱい。
垢版 |
NGNG
:%s/DEL.*//
NGNG
>>343
サンクス、すみません。
NGNG
346名無しさん@お腹いっぱい。
垢版 |
NGNG
>>343
DELは残したい場合はどうすればいいですか?
NGNG
:%s/DEL.*/DEL/
348名無しさん@お腹いっぱい。
垢版 |
NGNG
MS-DOSが使われていた頃に、"mifes"と言うエディターが有った。
そのマニュアルに1頁ほどの正規表現の説明があって、自分は最初に、それで
覚えて使い出した。
使い始めの頃は、何回も間違えたけど、少しづつ慣れてきた。

自分の周りを見ても、プログラマを何年もやっていても正規表現を知らない
人は、結構いる。
一旦、覚えてしまうと非常に便利だと思うんだけど。
349名無しさん@お腹いっぱい。
垢版 |
NGNG
正規表現で俺の存在を抹消してくれ。
NGNG
s/俺の存在//g;
NGNG
gsub!(/俺の存在/, "")
NGNG
捕手
NGNG
        rー、
    」´ ̄`lー) \
    T¨L |_/⌒/
     `レ ̄`ヽ〈
       |  i__1
     _ゝ_/ ノ
      L__jイ´_ )
        |  イ
         |  ノ--、           r'⌒ヽ_
        ゝ、___ノ二7  /´ ̄l、_,/}:\
         |ーi |   l_/ /__ィ::.  ゝ~_ィ´:; ,ゝ
        __〉 {      (T´ |1:::.  \_>、};;_」
       'ー‐┘       ! ` ̄''ァ一 、\ ヽ}  ← 保守
               〈` ̄ ̄^`¬ノ .::〔 ̄´
                   1  ヽ   .:::レ  ヽ、
                |_イー-、_;;j|_:.   ゝ、
                __,,,... -- |. {―――‐フゝ、   〉 -- ...,,,__
        _,, -‐ ´       ,r|__ト,    1ニノ ー'´       ` ‐- ,,_
    , ‐ ´         └―'´                     `
NGNG
>>353
それ捕手じゃなくて投手やっ!www
NGNG
別のスレからの引用
ps ax |grep '[s]shd'
とやると、grep自身の行にヒットしないそうだけど、なぜ?
sってメタ文字でもなんでもないのに。
NGNG
なぜって言われても、自明だが。
NGNG
grep sshd と何が違うの?
NGNG
あ、ごめん、わかった(w
NGNG
grep sshd だと、ps の出力に含まれる "grep sshd" の "sshd" がマッチする。

grep '[s]shd' だと、ps の出力には "grep [s]shd" が含まれるが、
この "[s]shd" は、[s]shd にはマッチしない。よね?わかる?
NGNG
なるほど。トリックだな。
NGNG
まあバッドノウハウだとも思うけどナー
http://www.namazu.org/~satoru/misc/bad-knowhow.html
NGNG
そこまでのものではないと思うけど、
この例だと、頭の中でpsの出力まで加工しちゃうからな(w
NGNG
grep -v grep でええやん。
NGNG
muttのaliasで
    alias keyword Name <mailaddress>
みたいなフォーマットで並んでいるファイルを
    alias keyword <mailaddress> # Name
に整形しようと思い,
    cat alias | sed 's![[:space:]]*alias[[:space:]]*\([^[:space:]]*\)[[:space:]]*\(.*\)[[:space:]]*<\(.*\)>!alias \1 <\3> # \2!' > alias.new
としました.

上手く行くんですが, "#" の位置が行ごとにバラバラなのが気持ち悪いです.

そのファイルで "#" 以前の文字数が一番長いものを調べ, そこに合わせて
その他の行の "#" 以降を持ってくるようにするにはどうすればいいんでしょうか?
NGNG
sedでやれってか?
漏れはへたれなので、Perlなどを使ってしまうが(w
NGNG
>>364
2パスでやれば?
NGNG
  2パス?
NGNG
>>367
"#" 以前が一番長いのを調べてから、それに合わせて整形し直せば。
NGNG
>>364
70桁でそろえる場合

sed ':a /.\{70\}\#/!bc; b; :c s/\(.*\)\#\(.*\)$/\1 \#\2/; ta'

亀ですが、こんなんでどうでしょう
NGNG
決め打ちでいいなら何の苦労もないわけで。
NGNG
>>369
反則技。gawk で。sed ではどうやっても出来ないような気が……(_ _;)
# sed でできるのか?

{
a=index($0,"#");
if(a>best) {
best=a;
}
c[FNR]=$0
}

END {
for(i=0;i<=NR;i++){
x=index(c[i],"#");
if(x && x<best) {
for (j=x;j<best;j++) {
gsub("#"," #",c[i]);
}
}
print c[i]
}
}
NGNG
( ´∀`)
NGNG
保守
374名無しさん@お腹いっぱい。
垢版 |
NGNG
教えてください。
Windows用のファイルをemacsなんかで開いたとき,最下行に
^Z
という符号が表示されることがあります。
これはいったい何でしょうか?
NGNG
いわゆるeof
NGNG
>>375
ありがとうございます。この符号のあるファイル同士をcatで連結すると,途
中にこの符号が入ってしまいます。この符号をsedでマッチさせて消去したい
のですが,どうすればいいでしょうか。
sed '/^$/d' ではダメでした。
NGNG
>>376
いわゆるeof
378名無しさん@お腹いっぱい。
垢版 |
NGNG
EOF符号をsedで消去できますか?
NGNG
grep で使える正規表現を精密に解説したサイトはありますかね?
日本語/英語どっちでもいいのですが。
NGNG
http://www.kt.rim.or.jp/~kbk/regex/regex.html
NGNG
レベル低いなー
378に対して出来るとも出来ないとも言えないのか...
NGNG
378=381 ですか?
NGNG
>>378
できるよ。普通に
s/^Z//
とかすればいい。もちろん^ZはEOFの一文字ね。

こんなの試せばすぐわかるだろと思ってたんだが、よく>>376を読むと、
「正規表現は純なテキストであるべきで特殊記号を混ぜるのはイクナイ」
と感じたんだろうな。まあ気持ちはわかるわ。

最近の正規表現拡張では、文字をコードの数値で表現する文法が
入ってたりする方が普通(例えばperlとか)だもんな。
384338
垢版 |
NGNG
でね、特殊記号の特別なケースがtab。大昔は\tなんて表現なかったさ。
よく画面上の見た目やハードコピーや雑誌からシェルスクリプトを打ち直して、
tabとspaceの違いで動かないなんてことが時々あったんだよ。

あと勝手にシェルスクリプトを整形されて動かなくなるとか。
NGNG
>>382
いいえ
>>383
ありがトン!
NGNG
>>382
381=385 が正解
NGNG
>>380
ブックマークにいれますた。
388名無しさん@お腹いっぱい。
垢版 |
NGNG
[\\w$'-]
これはどういうことなのでしょう?
[\w$'-]
ならわかるのですが..
NGNG
>>388
処理系は何?
390名無しさん@お腹いっぱい。
垢版 |
NGNG
>>389
Rubyです
Regexp::compile("\b\d[\d\.]+\d\b|[\w]+|[\\w$'-]+")
scanメソッドで英文を分割してます
NGNG
>>390
ほほう。バグってる悪寒。
NGNG
Regexp::compile("\\b\\d[\\d\\.,]+\\d\\b")
こんなのがあるんですが..
NGNG
>>392
Ruby で "..." の中で '\' を書くときは、'\' でエスケープする必要があるの。
つまり Regexp::compile("\\w") は /\w/ と同じ。

>>390 のだと '\' のエスケープが足りない部分があるように見える。
たとえば、 "\w" は "w" に、 "\b" は "\010" になっちゃう。
ので「バグってる悪寒」と言いました。
NGNG
>>393
なるほど、必死に\\と重ねる正規表現について調べてましたよ
ありがとう
NGNG
perl で質問です。

NOTE note "note" notes

上のような文字列を「book」だけを「note」に置換したいのですが
s/\bnote\b/book/g
のようにすると、ダブルクォートで囲まれているものも置換されてしまうのですが
それを

NOTE book "note" notes

のようにするにはどう表記すればよいのでしょうか?
詳しい方、教えてください。
NGNG
>>395
> NOTE note "note" notes
>
> 上のような文字列を「book」だけを「note」に置換したいのですが
NGNG
>>396
その下の
s/\bnote\b/book/g
ぐらい読んで多目にみてやれ。

>>395
とはいえ、仕様があいまいすぎ。
'note' はどうする? :note: は? "abc note def" は?
NGNG
s/ note / book /g
か?

>>397
> とはいえ、仕様があいまいすぎ。
んだな。
NGNG
>>395
s/(?=[^"])\bnote\b(?=[^"])/book/g;

# こんなんで良いわけないよなと思いつつ・・・
NGNG
>>397

> とはいえ、仕様があいまいすぎ。

すいません、おっしゃるとおりです。
ある単語(note)をある単語(book)に置換したいのですが、
ダブルクォートで囲まれているもの("note")は、その置換からは除外したいのです。

> 'note' はどうする? :note: は? "abc note def" は?

したがいまして、これらはとりあえず想定外で構わないので置換してしまっても構いません。
もう少し昨日の例を詳しく書きますと

NOTE,note"note"notes-note

このようなものでも

NOTE,book"note"notes-book

のようになってくれるのを期待しています。

ただ、"abc note def" これも想定外で構わないのですが
対応が可能であるのなら、私の勉強の為に教えてくださるとありがたく思います。

>>399
ありがとうございます。

>s/(?=[^"])\bnote\b(?=[^"])/book/g;
これを試してみました。
基本的にOKかなと思ったのですが、行頭、行末では置換の対象となってくれませんでした。

NGNG
>>400
補足です。
ここでいう単語とは \w+ で表せる範囲のもので、
アルファベット大文字、小文字も含めて完全に単語の
先頭から末尾までが一致するものです。
NGNG
もっと簡単にできるかもしれないけど、
s/(^|(?<=[^\w"]))note\b|\bnote($|(?=[^\w"]))/book/g;
とかは?

> ただ、"abc note def" これも想定外で構わないのですが

後ろから数えた"の個数が奇数ならマッチしないようにして、
$b =~ s/\bnote\b(?=([^"]*"[^"]*")*[^"]*$)/book/g;
とすれば、"のマッチングが保証できる範囲ではなんとかなるかも。
前からの"の個数でマッチさせようとしたら、
可変長のlook-behindは実装してないらしい。(perl 5.8)
NGNG
s/"note"/hogehoge/g
s/note/book/g
s/hogehoge/"note"/g
おれならこうしちゃうな。
考えんのめんどい。
NGNG
>>402

ありがとうございました。
たいへん勉強になりました。
405名無しさん@お腹いっぱい。
垢版 |
NGNG
質問させてください。

&にはマッチして欲しいのですが、&にはマッチして欲しくないのです。

どのように記述すればよいのでしょう。

お願いします。
406405
垢版 |
NGNG
&にはマッチ
&amp;にはマッチしない

でした。すいません。
NGNG
>>405
Perl5 でいい?
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況