Regular Expressionスレです。
質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。
前スレ
Regular Expression(正規表現) Part15
https://mevius.5ch.net/test/read.cgi/tech/1568640311/
次スレは>>980宜しく
天ぷら等>>2以降
探検
Regular Expression(正規表現) Part16
レス数が1000を超えています。これ以上書き込みはできません。
1デフォルトの名無しさん
2021/11/03(水) 19:50:01.71ID:ebAE+z9+968デフォルトの名無しさん
2023/11/28(火) 16:20:34.59ID:JJPCdnVt でもなぁ
バグなら今までこんなん気が付かないはずないと思うからどうなんだろ
バグなら今までこんなん気が付かないはずないと思うからどうなんだろ
969デフォルトの名無しさん
2023/11/28(火) 16:21:19.02ID:vIU65Zk5 $ perl -e '$a="abc"; $a =~ s/(.*)$/[$1]/g; print $a . "\n"'
[abc][]
$ perl -e '$a="abc"; $a =~ s/(.*$)/[$1]/g; print $a . "\n"'
[abc][]
後ろに$入れても同じ
行末以降の何にマッチしてんのこれ?
[abc][]
$ perl -e '$a="abc"; $a =~ s/(.*$)/[$1]/g; print $a . "\n"'
[abc][]
後ろに$入れても同じ
行末以降の何にマッチしてんのこれ?
970デフォルトの名無しさん
2023/11/28(火) 16:22:48.63ID:vIU65Zk5 Rubyのコードも持ってきた。持ってきただけだから意味は知らん。
ruby -e 're=/(.*)/; puts %Q(abc).sub(re){ %Q([#$1]) }'
[abc]
ruby -e 're=/(.*)/; puts %Q(abc).gsub(re){ %Q([#$1]) }'
[abc][]
ruby -e 're=/(.*)/; puts %Q(abc).sub(re){ %Q([#$1]) }'
[abc]
ruby -e 're=/(.*)/; puts %Q(abc).gsub(re){ %Q([#$1]) }'
[abc][]
971デフォルトの名無しさん
2023/11/28(火) 16:44:51.01ID:wVUnEJO+ ググってみたがperlのそういう”仕様”として定着してるみたいだな
引っかかったことなかったわ
引っかかったことなかったわ
972デフォルトの名無しさん
2023/11/28(火) 16:47:59.11ID:uy7CvN4q973デフォルトの名無しさん
2023/11/28(火) 16:49:01.41ID:CppHkuHl 0文字と一致させたくなければ.*ではなく.+と書けよ
974デフォルトの名無しさん
2023/11/28(火) 16:59:51.73ID:fB6/42vV >>972
Perlの文字列はNull Terminatedされてないよ
/gだとマッチできないか再度確かめるからzero-lengthのempty stringにマッチするんだとさ
でも同じ位置でempty stringに2回はマッチしないようなチェックが入ってるからそこで抜けるんだとさ
個人的にはバグだと思うけどPCRE準拠でみんな作ってるから同じ動きをさせたんだろうね
regex101で試すとRustだけが一般に期待する動作をしてる
Perlの文字列はNull Terminatedされてないよ
/gだとマッチできないか再度確かめるからzero-lengthのempty stringにマッチするんだとさ
でも同じ位置でempty stringに2回はマッチしないようなチェックが入ってるからそこで抜けるんだとさ
個人的にはバグだと思うけどPCRE準拠でみんな作ってるから同じ動きをさせたんだろうね
regex101で試すとRustだけが一般に期待する動作をしてる
975デフォルトの名無しさん
2023/11/28(火) 17:02:27.57ID:fB6/42vV /(.*)$/みたいに末尾のアンカー入れても結果変わらないから余計におかしい
^を入れたら当然防げるけど
^を入れたら当然防げるけど
976デフォルトの名無しさん
2023/11/28(火) 17:09:04.46ID:vIU65Zk5977デフォルトの名無しさん
2023/11/28(火) 18:08:10.66ID:waKUlTL5 これは長さゼロでマッチした直後に長さゼロにマッチしてposが進まなかったときにマッチを終了するという、頭の悪い正規表現を書くマヌケのために配慮された動作が例外的なんだよ
そのおかげで頭の悪い正規表現を書いても無限ループさせずに済んだことにむしろ感謝するべきだね
そのおかげで頭の悪い正規表現を書いても無限ループさせずに済んだことにむしろ感謝するべきだね
978デフォルトの名無しさん
2023/11/28(火) 18:30:16.15ID:mMoqXMUf (ハクション!
979デフォルトの名無しさん
2023/11/28(火) 19:16:57.98ID:6l9rHssS 単に便利だからゼロ幅マッチさせてるん
$str =~ s/()/$1,/g; やってみるといいのん
$str =~ s/()/$1,/g; やってみるといいのん
980デフォルトの名無しさん
2023/11/29(水) 13:08:47.77ID:yvH2v9xT 正規表現検索は失敗しないかぎり終わらないって話では
abcに対して(.*)$が検索される→「abc+末尾」がマッチ、この時点での位置はcの後ろのゼロ幅
残りの部分に対して再度(.*)$が検索される→「ゼロ幅+末尾」がマッチ、cの後ろのゼロ幅が消費される
残りの部分に対して再度(.*)$が検索される→対象を消費しきっているので失敗→検索終了
abcに対して(.*)$が検索される→「abc+末尾」がマッチ、この時点での位置はcの後ろのゼロ幅
残りの部分に対して再度(.*)$が検索される→「ゼロ幅+末尾」がマッチ、cの後ろのゼロ幅が消費される
残りの部分に対して再度(.*)$が検索される→対象を消費しきっているので失敗→検索終了
981デフォルトの名無しさん
2023/11/29(水) 14:41:21.44ID:lw8jVmFR そういうもんだと思って使ってたわ
それをバグだと思ってる人がいてびっくりぽんや
しかしこういうことに疑問を持つ人は今後伸びるで
それをバグだと思ってる人がいてびっくりぽんや
しかしこういうことに疑問を持つ人は今後伸びるで
982デフォルトの名無しさん
2023/11/29(水) 17:53:32.44ID:AoutXZD6 >>980
その理屈で言えば1回目で対象を消費しきってるから2回目が失敗するべき
1回目で消費しきっているにも関わらず2回目のゼロ幅マッチが成功するなら3回目のゼロ幅マッチだって成功するはず
そうならないのは対象を消費しきってるかどうかを確認せずにマッチを実施しており最終的には2回連続同一箇所でのゼロ幅マッチという失敗条件に合致してはじかれているから
その理屈で言えば1回目で対象を消費しきってるから2回目が失敗するべき
1回目で消費しきっているにも関わらず2回目のゼロ幅マッチが成功するなら3回目のゼロ幅マッチだって成功するはず
そうならないのは対象を消費しきってるかどうかを確認せずにマッチを実施しており最終的には2回連続同一箇所でのゼロ幅マッチという失敗条件に合致してはじかれているから
983デフォルトの名無しさん
2023/11/29(水) 18:01:27.70ID:lw8jVmFR 確かにその通りやな、1度目で消費しきっとるはずや
984デフォルトの名無しさん
2023/11/29(水) 18:06:42.76ID:lw8jVmFR 分かったつもりになってるだけで全然分かってへんのがおるから
ちゃんと本か何かで学習したほうがええで、今までそういう学習をしてへんやろ
ちゃんと本か何かで学習したほうがええで、今までそういう学習をしてへんやろ
985デフォルトの名無しさん
2023/11/29(水) 20:04:08.42ID:x7bR/xfi /(.*)$(.*)$((.*)$){999}/
986デフォルトの名無しさん
2023/11/29(水) 22:25:25.39ID:yvH2v9xT >>985
えーと、つまり
・ゼロ幅は消費されない。パーマネントにゼロであり続ける。なので無限にマッチ可能
・無限にマッチ可能→同じゼロ幅に2回連続マッチしたからといってposを進めたり終了するわけではない
てことかな?
2回目以降が発生するかどうかは、、どうなんだろう
前回と完全に同じマッチになるときは試行せず終わる、っぽいけど
えーと、つまり
・ゼロ幅は消費されない。パーマネントにゼロであり続ける。なので無限にマッチ可能
・無限にマッチ可能→同じゼロ幅に2回連続マッチしたからといってposを進めたり終了するわけではない
てことかな?
2回目以降が発生するかどうかは、、どうなんだろう
前回と完全に同じマッチになるときは試行せず終わる、っぽいけど
987デフォルトの名無しさん
2023/12/01(金) 02:37:28.94ID:07OBAnmr sedの基本正規表現と拡張正規表現だとゼロ幅にマッチしないね
元はPerlのバグだったのが仕様ってことになったのでは?
$ printf 'abc' | sed 's/\(.*\)/[\1]/g'
[abc]
$ printf 'abc' | sed -E 's/(.*)/[\1]/g'
[abc]
元はPerlのバグだったのが仕様ってことになったのでは?
$ printf 'abc' | sed 's/\(.*\)/[\1]/g'
[abc]
$ printf 'abc' | sed -E 's/(.*)/[\1]/g'
[abc]
988デフォルトの名無しさん
2023/12/01(金) 08:09:57.11ID:RWimeGTM /^\w+|$/[$&]/
これが[abc][]になるのはおかしいと感じないよね?
前半が末尾まで食い尽くすから$はマッチしないはずだと思う?
これが[abc][]になるのはおかしいと感じないよね?
前半が末尾まで食い尽くすから$はマッチしないはずだと思う?
989デフォルトの名無しさん
2023/12/02(土) 00:36:44.31ID:/f7jnFb0 挙動を仕様書で厳密に定義しているJavaScriptではこうなってた
https://tc39.es/ecma262/multipage/text-processing.html#sec-regexp.prototype-@@replace
・1回目のマッチが "abc" すべてを消費する
・2回目のマッチは文字列末尾から始まるけど正規表現が.*なのでマッチングに成功する
ただし空文字にマッチした場合、先へ進まなくなることを回避するために
次回開始位置を一つ後ろへずらす処理が入る (12.c.iii.2以下)
これにより3回目のマッチは文字列の終端+1という範囲外の位置から始まることになり失敗に終わる
https://tc39.es/ecma262/multipage/text-processing.html#sec-regexp.prototype-@@replace
・1回目のマッチが "abc" すべてを消費する
・2回目のマッチは文字列末尾から始まるけど正規表現が.*なのでマッチングに成功する
ただし空文字にマッチした場合、先へ進まなくなることを回避するために
次回開始位置を一つ後ろへずらす処理が入る (12.c.iii.2以下)
これにより3回目のマッチは文字列の終端+1という範囲外の位置から始まることになり失敗に終わる
990デフォルトの名無しさん
2023/12/07(木) 23:24:41.69ID:Ug9Hn2aN KEEPのKはあるのにPが無い、何故?
991デフォルトの名無しさん
2023/12/07(木) 23:31:35.71ID:Ug9Hn2aN (?<=uma)musu(?=me) 柿憎い
uma\Kmusu\Pme 柿安い
uma\Kmusu\Pme 柿安い
992デフォルトの名無しさん
2023/12/10(日) 09:57:52.47ID:8JqB6SG/993デフォルトの名無しさん
2023/12/10(日) 13:04:54.79ID:t3u5G9tC $は「後ろが終端である位置」の指定であって「最後まで全部」という意味ではない
なので.+$で文字列を末尾まで消費した後でも再度末尾のゼロ幅にマッチできることはバグでもなんでもない
なので.+$で文字列を末尾まで消費した後でも再度末尾のゼロ幅にマッチできることはバグでもなんでもない
994デフォルトの名無しさん
2023/12/10(日) 14:15:57.63ID:ayXeZXuA 実装上のバグではなく仕様バグだろって話をしてるのがわからないのか?
995デフォルトの名無しさん
2023/12/10(日) 15:43:26.80ID:e6Tz3fj/ .*と$でマッチするものが異なるのに.*と.*|$でマッチするものが変わらないのは明らかにバクってるな
正規表現のパターンを変えるだけでperlでは[abc][]にも[abc]にもできるのにsedではこのバグのせいで[abc][]には絶対にできなくなってる
$ printf 'abc' | sed -E 's/.*|$/[&]/g'
[abc]
正規表現のパターンを変えるだけでperlでは[abc][]にも[abc]にもできるのにsedではこのバグのせいで[abc][]には絶対にできなくなってる
$ printf 'abc' | sed -E 's/.*|$/[&]/g'
[abc]
996デフォルトの名無しさん
2023/12/10(日) 15:44:52.66ID:e6Tz3fj/ s/バク/バグ/
997デフォルトの名無しさん
2023/12/13(水) 11:48:29.08ID:wzNHEkEB ただの仕様だよ、あほらし
次スレよろ
次スレよろ
998デフォルトの名無しさん
2023/12/16(土) 09:00:59.04ID:KMxF6SWS999デフォルトの名無しさん
2023/12/16(土) 09:36:31.90ID:pgUnJUCg 天地無用
1000デフォルトの名無しさん
2023/12/16(土) 10:49:04.16ID:faoSWywL >>998
ほめてつかわす
ほめてつかわす
10011001
Over 1000Thread このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 772日 14時間 59分 3秒
新しいスレッドを立ててください。
life time: 772日 14時間 59分 3秒
レス数が1000を超えています。これ以上書き込みはできません。
ニュース
- 中国「国連安保理の許可なしに日本攻撃可能」 Xで旧敵国条項に言及… ★12 [BFU★]
- 台湾有事での集団的自衛権行使に賛成48%、「反対」が44.2% [♪♪♪★]
- 中国・国連大使「日本側は反省せず、発言の撤回拒否」 書簡を国連事務総長に送る [♪♪♪★]
- 首相官邸前で「戦争あおるな」 台湾有事巡る答弁に抗議 ★3 [蚤の市★]
- 中国「国連安保理の許可なしに日本攻撃可能」 Xで旧敵国条項に言及… ★13 [BFU★]
- 【NHK】受信料の未払い督促を10倍に強化… 支払い拒否が続くと民事手続きも 「カーナビも受信料いただきます」方針 [冬月記者★]
- 他サポ 2025-260
- 【フジテレビ】2025 FORMULA 1【NEXT】Lap600
- 【DAZN】フォーミュラGP【F1 2 3 SF P】Lap1807
- 2025 SUPER FORMULA Lap18
- 京都競馬4回5日目エリザベス女王杯★3
- 福島競馬3回5日目
- 中国駐日大使館「釣魚島とその付属島嶼は中国固有の領土」愛国者ブチギレへ [834922174]
- 「暇空茜」名乗る男性、神奈川県警が追送検 投稿サイトで大学生侮辱の疑い😲 [861717324]
- 【実況】博衣こよりのえちえちゼルダの伝説 ムジュラの仮面🧪 ★4
- 日本人の48%覚悟完了… [819729701]
- 小野田大臣「それ正式なデータですか?報道ベースですよね」(10万いいね) [237216734]
- 女の子、プチ整形で垢抜けまくってしまうwwwwwwwwwwwwwwwwwwwwwwww [329329848]
