Regular Expression(正規表現) Part16

レス数が1000を超えています。これ以上書き込みはできません。
1デフォルトの名無しさん
垢版 |
2021/11/03(水) 19:50:01.71ID:ebAE+z9+
Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part15
https://mevius.5ch.net/test/read.cgi/tech/1568640311/


次スレは>>980宜しく
天ぷら等>>2以降
2023/11/29(水) 17:53:32.44ID:AoutXZD6
>>980
その理屈で言えば1回目で対象を消費しきってるから2回目が失敗するべき

1回目で消費しきっているにも関わらず2回目のゼロ幅マッチが成功するなら3回目のゼロ幅マッチだって成功するはず
そうならないのは対象を消費しきってるかどうかを確認せずにマッチを実施しており最終的には2回連続同一箇所でのゼロ幅マッチという失敗条件に合致してはじかれているから
2023/11/29(水) 18:01:27.70ID:lw8jVmFR
確かにその通りやな、1度目で消費しきっとるはずや
2023/11/29(水) 18:06:42.76ID:lw8jVmFR
分かったつもりになってるだけで全然分かってへんのがおるから
ちゃんと本か何かで学習したほうがええで、今までそういう学習をしてへんやろ
2023/11/29(水) 20:04:08.42ID:x7bR/xfi
/(.*)$(.*)$((.*)$){999}/
2023/11/29(水) 22:25:25.39ID:yvH2v9xT
>>985
えーと、つまり
・ゼロ幅は消費されない。パーマネントにゼロであり続ける。なので無限にマッチ可能
・無限にマッチ可能→同じゼロ幅に2回連続マッチしたからといってposを進めたり終了するわけではない
てことかな?

2回目以降が発生するかどうかは、、どうなんだろう
前回と完全に同じマッチになるときは試行せず終わる、っぽいけど
987デフォルトの名無しさん
垢版 |
2023/12/01(金) 02:37:28.94ID:07OBAnmr
sedの基本正規表現と拡張正規表現だとゼロ幅にマッチしないね
元はPerlのバグだったのが仕様ってことになったのでは?

$ printf 'abc' | sed 's/\(.*\)/[\1]/g'
[abc]

$ printf 'abc' | sed -E 's/(.*)/[\1]/g'
[abc]
2023/12/01(金) 08:09:57.11ID:RWimeGTM
/^\w+|$/[$&]/

これが[abc][]になるのはおかしいと感じないよね?
前半が末尾まで食い尽くすから$はマッチしないはずだと思う?
2023/12/02(土) 00:36:44.31ID:/f7jnFb0
挙動を仕様書で厳密に定義しているJavaScriptではこうなってた
https://tc39.es/ecma262/multipage/text-processing.html#sec-regexp.prototype-@@replace

・1回目のマッチが "abc" すべてを消費する
・2回目のマッチは文字列末尾から始まるけど正規表現が.*なのでマッチングに成功する
 ただし空文字にマッチした場合、先へ進まなくなることを回避するために
 次回開始位置を一つ後ろへずらす処理が入る (12.c.iii.2以下)
 これにより3回目のマッチは文字列の終端+1という範囲外の位置から始まることになり失敗に終わる
2023/12/07(木) 23:24:41.69ID:Ug9Hn2aN
KEEPのKはあるのにPが無い、何故?
2023/12/07(木) 23:31:35.71ID:Ug9Hn2aN
(?<=uma)musu(?=me) 柿憎い
uma\Kmusu\Pme 柿安い
2023/12/10(日) 09:57:52.47ID:8JqB6SG/
>>988
思うよ
+の後に$を置けば余計にそう思う
2023/12/10(日) 13:04:54.79ID:t3u5G9tC
$は「後ろが終端である位置」の指定であって「最後まで全部」という意味ではない
なので.+$で文字列を末尾まで消費した後でも再度末尾のゼロ幅にマッチできることはバグでもなんでもない
2023/12/10(日) 14:15:57.63ID:ayXeZXuA
実装上のバグではなく仕様バグだろって話をしてるのがわからないのか?
2023/12/10(日) 15:43:26.80ID:e6Tz3fj/
.*と$でマッチするものが異なるのに.*と.*|$でマッチするものが変わらないのは明らかにバクってるな
正規表現のパターンを変えるだけでperlでは[abc][]にも[abc]にもできるのにsedではこのバグのせいで[abc][]には絶対にできなくなってる

$ printf 'abc' | sed -E 's/.*|$/[&]/g'
[abc]
2023/12/10(日) 15:44:52.66ID:e6Tz3fj/
s/バク/バグ/
2023/12/13(水) 11:48:29.08ID:wzNHEkEB
ただの仕様だよ、あほらし

次スレよろ
2023/12/16(土) 09:00:59.04ID:KMxF6SWS
次スレ
https://mevius.5ch.net/test/read.cgi/tech/1702684760/
2023/12/16(土) 09:36:31.90ID:pgUnJUCg
天地無用
2023/12/16(土) 10:49:04.16ID:faoSWywL
>>998
ほめてつかわす
10011001
垢版 |
Over 1000Thread
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 772日 14時間 59分 3秒
レス数が1000を超えています。これ以上書き込みはできません。
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況