Regular Expressionスレです。
質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。
前スレ
Regular Expression(正規表現) Part15
https://mevius.5ch.net/test/read.cgi/tech/1568640311/
次スレは>>980宜しく
天ぷら等>>2以降
Regular Expression(正規表現) Part16
レス数が1000を超えています。これ以上書き込みはできません。
1デフォルトの名無しさん
2021/11/03(水) 19:50:01.71ID:ebAE+z9+900デフォルトの名無しさん
2023/10/20(金) 16:11:58.36ID:8kCGh912 >>899
ZIP edition が無い…
ZIP edition が無い…
901デフォルトの名無しさん
2023/10/21(土) 14:33:23.21ID:43n7K7Fq tar.gzで我慢しなさい
902デフォルトの名無しさん
2023/10/29(日) 10:19:38.81ID:zDgIETfO アルファベットのみにマッチする文字クラスを[a-Z]と書けない
ASCIIコード表を決めた人達は今頃失敗したと思ってるんだろうか
ASCIIコード表を決めた人達は今頃失敗したと思ってるんだろうか
903デフォルトの名無しさん
2023/10/29(日) 12:34:50.74ID:vOjtdftv 初心者向けクイズ
Q: /w にマッチするアルファベット以外の文字がひとつあります。その文字とは、一体何でしょうか?
Q: /w にマッチするアルファベット以外の文字がひとつあります。その文字とは、一体何でしょうか?
904デフォルトの名無しさん
2023/10/29(日) 12:42:28.97ID:BaFdPLsN アンダースコート
905デフォルトの名無しさん
2023/10/29(日) 12:45:28.88ID:zDgIETfO アンダースロー
906デフォルトの名無しさん
2023/10/29(日) 13:20:31.22ID:y5KdwCim アンダーニンジャ
907デフォルトの名無しさん
2023/10/29(日) 15:41:31.84ID:zDgIETfO ニンジャリバンバン
908デフォルトの名無しさん
2023/10/29(日) 19:20:26.89ID:dO2GnsiA 正解はスラッシュでした
909デフォルトの名無しさん
2023/10/29(日) 19:49:37.09ID:zDgIETfO (/w\)
910デフォルトの名無しさん
2023/10/30(月) 20:06:53.46ID:wzEyUd/K ASCIIコード表について調べてみたら特定の1ビットを0にするか1にするかで
大文字小文字が変換出来るようにするための順番らしい
並びの便利さより処理効率が優先されてた、先人の知恵に敬礼
大文字小文字が変換出来るようにするための順番らしい
並びの便利さより処理効率が優先されてた、先人の知恵に敬礼
911デフォルトの名無しさん
2023/10/30(月) 20:59:27.53ID:dhg2pdyL どうせ範囲チェックはしないといけないんだから
それだったら引き算や足し算で大文字小文字変換できちゃう
まあ昔はbit演算より算術演算にステップ数が掛かってたからその当時は良かったんだろうけど
それだったら引き算や足し算で大文字小文字変換できちゃう
まあ昔はbit演算より算術演算にステップ数が掛かってたからその当時は良かったんだろうけど
912デフォルトの名無しさん
2023/10/31(火) 18:36:44.19ID:X00tNW2d 今時のマシンのことしか考えなくていいなら足し引きで良さそうだけど
遅いマシンのことまで考えるならビット演算一択になるんだろうな
アルファベットが32文字だったら隙間出来なかったのに
SHIFT_JISのダメ文字問題も最初からEUC-JPにしとけば苦労しなかったのにな
遅いマシンのことまで考えるならビット演算一択になるんだろうな
アルファベットが32文字だったら隙間出来なかったのに
SHIFT_JISのダメ文字問題も最初からEUC-JPにしとけば苦労しなかったのにな
913デフォルトの名無しさん
2023/10/31(火) 21:57:53.63ID:27STA2Pg 正規表現は改行の扱いが難しいなあ
やらかすときはたいてい改行の処理でミスる
やらかすときはたいてい改行の処理でミスる
914デフォルトの名無しさん
2023/11/01(水) 09:19:33.19ID:DBguvWIQ . が改行にマッチしないのを失念してってのは何度もやってる
915デフォルトの名無しさん
2023/11/01(水) 11:38:27.61ID:ikHnu6pN ●Regular Expressionの使用環境
サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0)
●検索か置換か?
検索
●説明
キムラタクヤの略称を検索するために
(キムラ)と(タクヤ)からそれぞれ1字以上使って並べた単語にマッチする正規表現を作りました
^(キ|ム|ラ|キム|ムラ|キラ|キムラ)(タ|ク|ヤ|タク|クヤ|タヤ|タクヤ)$
文字数や単語数が増えたときひどいのでもっと上手な書き方を教えてください
●マッチする文字列
キク
キラク
ムラタヤ
●マッチさせない文字列
キム
キムラ
タクヤ
サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0)
●検索か置換か?
検索
●説明
キムラタクヤの略称を検索するために
(キムラ)と(タクヤ)からそれぞれ1字以上使って並べた単語にマッチする正規表現を作りました
^(キ|ム|ラ|キム|ムラ|キラ|キムラ)(タ|ク|ヤ|タク|クヤ|タヤ|タクヤ)$
文字数や単語数が増えたときひどいのでもっと上手な書き方を教えてください
●マッチする文字列
キク
キラク
ムラタヤ
●マッチさせない文字列
キム
キムラ
タクヤ
916デフォルトの名無しさん
2023/11/01(水) 11:38:37.53ID:ikHnu6pN ●Regular Expressionの使用環境
サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0)
●検索か置換か?
検索
●説明
キムラタクヤの略称を検索するために
(キムラ)と(タクヤ)からそれぞれ1字以上使って並べた単語にマッチする正規表現を作りました
^(キ|ム|ラ|キム|ムラ|キラ|キムラ)(タ|ク|ヤ|タク|クヤ|タヤ|タクヤ)$
文字数や単語数が増えたときひどいのでもっと上手な書き方を教えてください
●マッチする文字列
キク
キラク
ムラタヤ
●マッチさせない文字列
キム
キムラ
タクヤ
サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0)
●検索か置換か?
検索
●説明
キムラタクヤの略称を検索するために
(キムラ)と(タクヤ)からそれぞれ1字以上使って並べた単語にマッチする正規表現を作りました
^(キ|ム|ラ|キム|ムラ|キラ|キムラ)(タ|ク|ヤ|タク|クヤ|タヤ|タクヤ)$
文字数や単語数が増えたときひどいのでもっと上手な書き方を教えてください
●マッチする文字列
キク
キラク
ムラタヤ
●マッチさせない文字列
キム
キムラ
タクヤ
917デフォルトの名無しさん
2023/11/01(水) 12:08:10.81ID:oh2mJ3WA ^(?:キ?ム?ラ?)(?<=\S)(?=\S)(?:タ?ク?ヤ?)$
918デフォルトの名無しさん
2023/11/01(水) 14:40:34.08ID:DBguvWIQ 同じ人かは分からないけど超優秀な回答者がここ1,2年前から来てくれてる
多くの閲覧者にとっても勉強になるからありたがいことです
多くの閲覧者にとっても勉強になるからありたがいことです
919デフォルトの名無しさん
2023/11/01(水) 16:00:59.53ID:G1jsC9Xy じつはその人AIだよ
920デフォルトの名無しさん
2023/11/01(水) 17:01:21.99ID:ikHnu6pN >>917
ありがとうございます動きました
3語以上の場合はこれでできてますか?
^(?:キ?ム?)(?<=\S)(?=\S{2})((?:ラ?タ?)(?<=\S{2})(?=\S)(?:ク?ヤ?))$
ありがとうございます動きました
3語以上の場合はこれでできてますか?
^(?:キ?ム?)(?<=\S)(?=\S{2})((?:ラ?タ?)(?<=\S{2})(?=\S)(?:ク?ヤ?))$
921デフォルトの名無しさん
2023/11/01(水) 17:03:51.95ID:DBguvWIQ AIと言われても違和感が無いから困る、人間だったほうがいい
サクラエディタを少し触ってみたが
\r を \c-
\n を \c*
に書き換えてもマッチした
このことは恐らくbregoing.dllの作者氏でも知らないのでは
サクラエディタを少し触ってみたが
\r を \c-
\n を \c*
に書き換えてもマッチした
このことは恐らくbregoing.dllの作者氏でも知らないのでは
922デフォルトの名無しさん
2023/11/01(水) 18:26:59.70ID:upaRAmPk923デフォルトの名無しさん
2023/11/01(水) 21:03:12.97ID:bvA/YDb8 最後で語数チェックすれば?
(?<=\S{3})$
(?<=\S{3})$
924デフォルトの名無しさん
2023/11/01(水) 22:35:57.76ID:8ROMQdip ^(キ?ム?ラ?)(タ?ク?ヤ?)$(?!\1|\2)
^(キ?ム?)(ラ?タ?)(ク?ヤ?)$(?!\1)(?!\2)(?!\3)
^(キ?ム?)(?!.*+$\k<-1>)(ラ?タ?)(?!.*+$\k<-1>)(ク?ヤ?)(?!.*+$\k<-1>)$
^(?=(.++))(?:キ?ム?)(?!\k<-1>)(?=(.++))(?:ラ?タ?)(?!\k<-1>)(?=(.++))(?:ク?ヤ?)(?!\k<-1>)$
^(キ?ム?)(ラ?タ?)(ク?ヤ?)$(?!\1)(?!\2)(?!\3)
^(キ?ム?)(?!.*+$\k<-1>)(ラ?タ?)(?!.*+$\k<-1>)(ク?ヤ?)(?!.*+$\k<-1>)$
^(?=(.++))(?:キ?ム?)(?!\k<-1>)(?=(.++))(?:ラ?タ?)(?!\k<-1>)(?=(.++))(?:ク?ヤ?)(?!\k<-1>)$
925デフォルトの名無しさん
2023/11/02(木) 08:03:41.39ID:ztJD977Y 文字数も単語数も拡張性もばっちりです
ご指導ありがとうございました
ご指導ありがとうございました
926デフォルトの名無しさん
2023/11/02(木) 09:18:56.98ID:/CeYlFrx > $(?!\1|\2)
これもすごい、こんなの思い付かない
私なら(?(1))を使おうとしてグチャる
こういうのを作れる人になりたかった、羨ましい限りだ
これもすごい、こんなの思い付かない
私なら(?(1))を使おうとしてグチャる
こういうのを作れる人になりたかった、羨ましい限りだ
927デフォルトの名無しさん
2023/11/02(木) 09:22:55.91ID:kxWwWLf8 >>910
アルファベットが32文字だったら誰も困らなかったはず
アルファベットが32文字だったら誰も困らなかったはず
928デフォルトの名無しさん
2023/11/02(木) 11:56:22.72ID:YMFW9tw8 各文字列から最低2文字以上含まれてる略称にだけマッチすることもできる?
929デフォルトの名無しさん
2023/11/02(木) 13:01:27.99ID:eLjTHeK1 ^(?=.(.++))(?:キ?ム?ラ?)(?!.?\k<-1>)(?=.(.++))(?:タ?ク?ヤ?)(?!.?\k<-1>)$
^(?=.{1}(.++))(?:キ?ム?ラ?)(?!.{0,1}\k<-1>)(?=.{1}(.++))(?:タ?ク?ヤ?)(?!.{0,1}\k<-1>)$
^(?=.{1}(.++))(?:キ?ム?ラ?)(?!.{0,1}\k<-1>)(?=.{1}(.++))(?:タ?ク?ヤ?)(?!.{0,1}\k<-1>)$
930デフォルトの名無しさん
2023/11/02(木) 19:36:53.03ID:/CeYlFrx ラノベ 「1日でキムタクの一般項が出来てるからパソコンそっと閉じて見なかったことにする」
931デフォルトの名無しさん
2023/11/03(金) 08:34:37.96ID:cY7DSC5H ^[キムラ]{1,2}[タクヤ]{1,2}$
932デフォルトの名無しさん
2023/11/03(金) 09:08:43.70ID:PqFUo1lf それはラキクタにマッチするからボツ(==.)
933デフォルトの名無しさん
2023/11/03(金) 10:43:13.94ID:cY7DSC5H ラキクタにマッチしたらダメって条件にはないんだけど‥
934デフォルトの名無しさん
2023/11/03(金) 11:44:22.65ID:PqFUo1lf 確かに言葉ではそんな条件は書いてないね、曖昧3cm
935デフォルトの名無しさん
2023/11/03(金) 11:50:18.95ID:zxzLPr4V ^?キ?ム?ラ?タ?クヤ?$が略称条件な流れ?
936デフォルトの名無しさん
2023/11/03(金) 12:14:21.11ID:sAJhyk0D ^(?=A)(?=B).*$
937デフォルトの名無しさん
2023/11/03(金) 12:18:03.55ID:PqFUo1lf >>916を読めば文字順通りと受け取るのが妥当だね
ちなみにもしこのコマンドがあったら簡単に書けた
https://www.proxomitron.info/45/help/Matching-Commands.html#TST
^(キ?ム?ラ?)$TST(\1=..+)(タ?ク?ヤ?)$TST(\2=..+)$
perlなら(??{code})でこのコマンドと同じことが出来るけどサクラエディタのdllでは無理
dllに$SETと$TSTが実装されたら正規表現の幅がめっちゃ広がるけど無理そう
// \1 に日本語表記での色が代入される
blue$SET(1=青)|yellow$SET(1=黄)|red$SET(1=赤)
ちなみにもしこのコマンドがあったら簡単に書けた
https://www.proxomitron.info/45/help/Matching-Commands.html#TST
^(キ?ム?ラ?)$TST(\1=..+)(タ?ク?ヤ?)$TST(\2=..+)$
perlなら(??{code})でこのコマンドと同じことが出来るけどサクラエディタのdllでは無理
dllに$SETと$TSTが実装されたら正規表現の幅がめっちゃ広がるけど無理そう
// \1 に日本語表記での色が代入される
blue$SET(1=青)|yellow$SET(1=黄)|red$SET(1=赤)
938デフォルトの名無しさん
2023/11/03(金) 13:00:30.59ID:RnAsJxc7 >>924
^(?=(キ?ム?ラ?)(タ?ク?ヤ?)$)[キムラ]{1,}[タクヤ]{1,}$
(?=(キ?ム?ラ?)(タ?ク?ヤ?)(.*+))[キムラ]{1,}[タクヤ]{1,}(?=\3)
キキムタククク
^(?=(キ?ム?ラ?)(タ?ク?ヤ?)$)[キムラ]{1,}[タクヤ]{1,}$
(?=(キ?ム?ラ?)(タ?ク?ヤ?)(.*+))[キムラ]{1,}[タクヤ]{1,}(?=\3)
キキムタククク
939デフォルトの名無しさん
2023/11/03(金) 18:04:12.94ID:328LomOy キムラタクヤ人気で🌿
940デフォルトの名無しさん
2023/11/03(金) 19:14:55.49ID:3J2AA+3k >>937
他人には厳しい条件はたすくせに外部コマンドやperl使うのはokなのかw
他人には厳しい条件はたすくせに外部コマンドやperl使うのはokなのかw
941デフォルトの名無しさん
2023/11/03(金) 20:09:52.31ID:PqFUo1lf 知ってる外部コマンドは使っていいに決まってる
頭の中では質問見た瞬間に出来てたよ
頭の中では質問見た瞬間に出来てたよ
942デフォルトの名無しさん
2023/11/03(金) 20:13:40.11ID:/gQFYHMn 「課す」を「はたす」って読んでるってマ?🤣
943デフォルトの名無しさん
2023/11/03(金) 21:12:42.60ID:PqFUo1lf この外部コマンドを考えた方は2004年に亡くなっている
https://en.wikipedia.org/wiki/Scott_R._Lemmon
20年前にこのコマンドを実装済みだったのはやばいな
perlの正規表現ですらそんなに機能が無かった時代だ
https://en.wikipedia.org/wiki/Scott_R._Lemmon
20年前にこのコマンドを実装済みだったのはやばいな
perlの正規表現ですらそんなに機能が無かった時代だ
944デフォルトの名無しさん
2023/11/03(金) 21:17:14.08ID:N1OKG/2k 最初から略称と言ってるのに文字順不問だと思うほうがどうかしてる
945デフォルトの名無しさん
2023/11/04(土) 08:36:40.13ID:w1sIftMp (正直|ぶっちゃけぇ?)高度すぎて理解が追いつかない
946デフォルトの名無しさん
2023/11/04(土) 11:16:01.85ID:PZuBSK2Q カラクリを簡単に説明しよう
1、 (?:キ?ム?ラ?) で文字順を固定
2、 その他の部分でカッコ内でマッチする文字数の制限をかけている
例、 (?:キ?ム?ラ?) が0文字にマッチしたとしよう
\1が捕獲した中身は0文字になる
(?!\1) の\1の中身が0文字だったら (?!\1) は (?!) と同じ動作になる
(?!) は常にマッチを失敗させるから\1が0文字ならマッチ出来ない
結果的にこれが文字数制限になっている
ちなみに正規表現にカウント機能があればもっと簡単に書けていた
(
(?:キ$COUNT(x))?
(?:ム$COUNT(x))?
(?:ラ$COUNT(x))?
)
$COUNT(0<x)
perlは(?{code})でカウント可能、鬼車もカウント機能を実装済
1、 (?:キ?ム?ラ?) で文字順を固定
2、 その他の部分でカッコ内でマッチする文字数の制限をかけている
例、 (?:キ?ム?ラ?) が0文字にマッチしたとしよう
\1が捕獲した中身は0文字になる
(?!\1) の\1の中身が0文字だったら (?!\1) は (?!) と同じ動作になる
(?!) は常にマッチを失敗させるから\1が0文字ならマッチ出来ない
結果的にこれが文字数制限になっている
ちなみに正規表現にカウント機能があればもっと簡単に書けていた
(
(?:キ$COUNT(x))?
(?:ム$COUNT(x))?
(?:ラ$COUNT(x))?
)
$COUNT(0<x)
perlは(?{code})でカウント可能、鬼車もカウント機能を実装済
947デフォルトの名無しさん
2023/11/04(土) 14:47:51.87ID:Xn6+uSVd perlジジイこのスレでも自演してんのかw
948デフォルトの名無しさん
2023/11/04(土) 17:37:08.01ID:PZuBSK2Q COBOLジジイからperlジジイにランクアップ
949デフォルトの名無しさん
2023/11/05(日) 13:03:00.89ID:q8heJbgz サクラエディタ
// 1
\1(a)
// 2
\k<name>(?<name>a)
2は1を名前付き括弧にしただけ
1は実行してもマッチに失敗するだけだが2はエラー
これはどちらもエラーになるほうが良い
// 1
\1(a)
// 2
\k<name>(?<name>a)
2は1を名前付き括弧にしただけ
1は実行してもマッチに失敗するだけだが2はエラー
これはどちらもエラーになるほうが良い
950デフォルトの名無しさん
2023/11/05(日) 13:07:33.08ID:q8heJbgz ん?本当にそうか?分からん
951デフォルトの名無しさん
2023/11/05(日) 15:52:16.56ID:q8heJbgz 2がエラーになるのは誤りだ、異論ある?
いつもの超優秀な人(AI?)の意見を聞かせて欲しい
いつもの超優秀な人(AI?)の意見を聞かせて欲しい
952デフォルトの名無しさん
2023/11/06(月) 06:59:13.82ID:j6L5l5bH 異論はないってことで良いかな、おそらく既知の問題(仕様)だと思われる
この問題に長年気付かないとは考えられないから
本来動くべきサンプルを貼って>>949の件は終了とする
x2("(?:\\k<n>b|(?<n>a))+", "aab", 0, 3); // ERROR: undefined name <n> reference
x2("(?:(?<n>a)|\\k<n>b)+", "aab", 0, 2); // OK
x2("(?:\\1b|(a))+", "aab", 0, 3); // OK
x2("(?:(a)|\\1b)+", "aab", 0, 2); // OK
この問題に長年気付かないとは考えられないから
本来動くべきサンプルを貼って>>949の件は終了とする
x2("(?:\\k<n>b|(?<n>a))+", "aab", 0, 3); // ERROR: undefined name <n> reference
x2("(?:(?<n>a)|\\k<n>b)+", "aab", 0, 2); // OK
x2("(?:\\1b|(a))+", "aab", 0, 3); // OK
x2("(?:(a)|\\1b)+", "aab", 0, 2); // OK
953デフォルトの名無しさん
2023/11/06(月) 19:00:47.89ID:j6L5l5bH 回避策
x2("(?<n>a){0}(?:\\k<n>b|\\g<n>)+", "aab", 0, 3); // OK
x2("(?<n>a){0}(?:\\k<n>b|\\g<n>)+", "aab", 0, 3); // OK
954デフォルトの名無しさん
2023/11/15(水) 17:50:43.57ID:Karf8A+O 文字列の頭に部分一致するパターンなんですが・・・
「abcdefg」にマッチするパターンですが、
/^a(?:b(?:c(?:d(?:e(?:f(?:g)?)?)?)?)?)?/
と書くしかないですか?
文字列が長大な場合、ちょっと無理なんですが・・・
(文字はアルファベットとは限らず)
WindowsのJScriptですが。
「abcdefg」にマッチするパターンですが、
/^a(?:b(?:c(?:d(?:e(?:f(?:g)?)?)?)?)?)?/
と書くしかないですか?
文字列が長大な場合、ちょっと無理なんですが・・・
(文字はアルファベットとは限らず)
WindowsのJScriptですが。
955デフォルトの名無しさん
2023/11/15(水) 18:12:27.94ID:ctqB5947 /^abcdefg/
956デフォルトの名無しさん
2023/11/15(水) 18:41:54.66ID:/mJ+eeiZ 無いんじゃないか?
^(?:abcdefg|abcdef|abcde|abcde|abcd|abc|ab|a)
とどっちがマシかな
^(?:abcdefg|abcdef|abcde|abcde|abcd|abc|ab|a)
とどっちがマシかな
957デフォルトの名無しさん
2023/11/16(木) 14:47:23.08ID:7i/8qZTv /^m/ にマッチして map だけマッチして欲しくない
/^m[^a][^p]/ これだと man にマッチしてくれない
どう書けばいいですか
/^m[^a][^p]/ これだと man にマッチしてくれない
どう書けばいいですか
958デフォルトの名無しさん
2023/11/16(木) 14:53:22.83ID:4tHpE5Jq >>957
否定先読みが使えるなら^m(?!ap)かな?
否定先読みが使えるなら^m(?!ap)かな?
959デフォルトの名無しさん
2023/11/16(木) 15:59:06.48ID:7i/8qZTv ありがとう
960デフォルトの名無しさん
2023/11/17(金) 04:25:56.84ID:gwXFy+9L 特定の文字列を検出したい場合、\Q~\Eの~に、その特定の文字列を入れておけば、どんな文字が来ても大丈夫でしょうか?
961デフォルトの名無しさん
2023/11/17(金) 06:13:31.18ID:28WV0iMa \Eが来ると困る
962デフォルトの名無しさん
2023/11/28(火) 12:33:08.74ID:vIU65Zk5 正規表現スレがいいと聞いてきました
ここがいい正規表現すれですか?
$ perl -e '$a="abc"; $a =~ s/(.*)/[$1]/g; print $a . "\n"'
[abc][]
なんで後ろにカッコが来るん?
.*に全部マッチするんだから
二個目の[]が来るなんてお菓子にゃん?
ここがいい正規表現すれですか?
$ perl -e '$a="abc"; $a =~ s/(.*)/[$1]/g; print $a . "\n"'
[abc][]
なんで後ろにカッコが来るん?
.*に全部マッチするんだから
二個目の[]が来るなんてお菓子にゃん?
963デフォルトの名無しさん
2023/11/28(火) 13:42:04.64ID:EkqG9ePT perlよく知らんがgとったら消える
964デフォルトの名無しさん
2023/11/28(火) 13:54:45.94ID:uy7CvN4q 推測だが、
1) .*にabcがマッチする -> [abc]
2) .*は0個でもいいので、末尾位置(NUL)にマッチする -> []
1) .*にabcがマッチする -> [abc]
2) .*は0個でもいいので、末尾位置(NUL)にマッチする -> []
965デフォルトの名無しさん
2023/11/28(火) 14:25:52.10ID:uy7CvN4q 2回目は$a=""の場合と同じだと思えばいい
ヌル文字列でも.*だとマッチするでしょ?
ヌル文字列でも.*だとマッチするでしょ?
966デフォルトの名無しさん
2023/11/28(火) 16:18:10.81ID:vIU65Zk5967デフォルトの名無しさん
2023/11/28(火) 16:18:30.67ID:JJPCdnVt 仮に2回目でマッチする何かがあったとしても
.*はgreedyなんだから1回目で消費してないとお菓子イイ
.*はgreedyなんだから1回目で消費してないとお菓子イイ
968デフォルトの名無しさん
2023/11/28(火) 16:20:34.59ID:JJPCdnVt でもなぁ
バグなら今までこんなん気が付かないはずないと思うからどうなんだろ
バグなら今までこんなん気が付かないはずないと思うからどうなんだろ
969デフォルトの名無しさん
2023/11/28(火) 16:21:19.02ID:vIU65Zk5 $ perl -e '$a="abc"; $a =~ s/(.*)$/[$1]/g; print $a . "\n"'
[abc][]
$ perl -e '$a="abc"; $a =~ s/(.*$)/[$1]/g; print $a . "\n"'
[abc][]
後ろに$入れても同じ
行末以降の何にマッチしてんのこれ?
[abc][]
$ perl -e '$a="abc"; $a =~ s/(.*$)/[$1]/g; print $a . "\n"'
[abc][]
後ろに$入れても同じ
行末以降の何にマッチしてんのこれ?
970デフォルトの名無しさん
2023/11/28(火) 16:22:48.63ID:vIU65Zk5 Rubyのコードも持ってきた。持ってきただけだから意味は知らん。
ruby -e 're=/(.*)/; puts %Q(abc).sub(re){ %Q([#$1]) }'
[abc]
ruby -e 're=/(.*)/; puts %Q(abc).gsub(re){ %Q([#$1]) }'
[abc][]
ruby -e 're=/(.*)/; puts %Q(abc).sub(re){ %Q([#$1]) }'
[abc]
ruby -e 're=/(.*)/; puts %Q(abc).gsub(re){ %Q([#$1]) }'
[abc][]
971デフォルトの名無しさん
2023/11/28(火) 16:44:51.01ID:wVUnEJO+ ググってみたがperlのそういう”仕様”として定着してるみたいだな
引っかかったことなかったわ
引っかかったことなかったわ
972デフォルトの名無しさん
2023/11/28(火) 16:47:59.11ID:uy7CvN4q973デフォルトの名無しさん
2023/11/28(火) 16:49:01.41ID:CppHkuHl 0文字と一致させたくなければ.*ではなく.+と書けよ
974デフォルトの名無しさん
2023/11/28(火) 16:59:51.73ID:fB6/42vV >>972
Perlの文字列はNull Terminatedされてないよ
/gだとマッチできないか再度確かめるからzero-lengthのempty stringにマッチするんだとさ
でも同じ位置でempty stringに2回はマッチしないようなチェックが入ってるからそこで抜けるんだとさ
個人的にはバグだと思うけどPCRE準拠でみんな作ってるから同じ動きをさせたんだろうね
regex101で試すとRustだけが一般に期待する動作をしてる
Perlの文字列はNull Terminatedされてないよ
/gだとマッチできないか再度確かめるからzero-lengthのempty stringにマッチするんだとさ
でも同じ位置でempty stringに2回はマッチしないようなチェックが入ってるからそこで抜けるんだとさ
個人的にはバグだと思うけどPCRE準拠でみんな作ってるから同じ動きをさせたんだろうね
regex101で試すとRustだけが一般に期待する動作をしてる
975デフォルトの名無しさん
2023/11/28(火) 17:02:27.57ID:fB6/42vV /(.*)$/みたいに末尾のアンカー入れても結果変わらないから余計におかしい
^を入れたら当然防げるけど
^を入れたら当然防げるけど
976デフォルトの名無しさん
2023/11/28(火) 17:09:04.46ID:vIU65Zk5977デフォルトの名無しさん
2023/11/28(火) 18:08:10.66ID:waKUlTL5 これは長さゼロでマッチした直後に長さゼロにマッチしてposが進まなかったときにマッチを終了するという、頭の悪い正規表現を書くマヌケのために配慮された動作が例外的なんだよ
そのおかげで頭の悪い正規表現を書いても無限ループさせずに済んだことにむしろ感謝するべきだね
そのおかげで頭の悪い正規表現を書いても無限ループさせずに済んだことにむしろ感謝するべきだね
978デフォルトの名無しさん
2023/11/28(火) 18:30:16.15ID:mMoqXMUf (ハクション!
979デフォルトの名無しさん
2023/11/28(火) 19:16:57.98ID:6l9rHssS 単に便利だからゼロ幅マッチさせてるん
$str =~ s/()/$1,/g; やってみるといいのん
$str =~ s/()/$1,/g; やってみるといいのん
980デフォルトの名無しさん
2023/11/29(水) 13:08:47.77ID:yvH2v9xT 正規表現検索は失敗しないかぎり終わらないって話では
abcに対して(.*)$が検索される→「abc+末尾」がマッチ、この時点での位置はcの後ろのゼロ幅
残りの部分に対して再度(.*)$が検索される→「ゼロ幅+末尾」がマッチ、cの後ろのゼロ幅が消費される
残りの部分に対して再度(.*)$が検索される→対象を消費しきっているので失敗→検索終了
abcに対して(.*)$が検索される→「abc+末尾」がマッチ、この時点での位置はcの後ろのゼロ幅
残りの部分に対して再度(.*)$が検索される→「ゼロ幅+末尾」がマッチ、cの後ろのゼロ幅が消費される
残りの部分に対して再度(.*)$が検索される→対象を消費しきっているので失敗→検索終了
981デフォルトの名無しさん
2023/11/29(水) 14:41:21.44ID:lw8jVmFR そういうもんだと思って使ってたわ
それをバグだと思ってる人がいてびっくりぽんや
しかしこういうことに疑問を持つ人は今後伸びるで
それをバグだと思ってる人がいてびっくりぽんや
しかしこういうことに疑問を持つ人は今後伸びるで
982デフォルトの名無しさん
2023/11/29(水) 17:53:32.44ID:AoutXZD6 >>980
その理屈で言えば1回目で対象を消費しきってるから2回目が失敗するべき
1回目で消費しきっているにも関わらず2回目のゼロ幅マッチが成功するなら3回目のゼロ幅マッチだって成功するはず
そうならないのは対象を消費しきってるかどうかを確認せずにマッチを実施しており最終的には2回連続同一箇所でのゼロ幅マッチという失敗条件に合致してはじかれているから
その理屈で言えば1回目で対象を消費しきってるから2回目が失敗するべき
1回目で消費しきっているにも関わらず2回目のゼロ幅マッチが成功するなら3回目のゼロ幅マッチだって成功するはず
そうならないのは対象を消費しきってるかどうかを確認せずにマッチを実施しており最終的には2回連続同一箇所でのゼロ幅マッチという失敗条件に合致してはじかれているから
983デフォルトの名無しさん
2023/11/29(水) 18:01:27.70ID:lw8jVmFR 確かにその通りやな、1度目で消費しきっとるはずや
984デフォルトの名無しさん
2023/11/29(水) 18:06:42.76ID:lw8jVmFR 分かったつもりになってるだけで全然分かってへんのがおるから
ちゃんと本か何かで学習したほうがええで、今までそういう学習をしてへんやろ
ちゃんと本か何かで学習したほうがええで、今までそういう学習をしてへんやろ
985デフォルトの名無しさん
2023/11/29(水) 20:04:08.42ID:x7bR/xfi /(.*)$(.*)$((.*)$){999}/
986デフォルトの名無しさん
2023/11/29(水) 22:25:25.39ID:yvH2v9xT >>985
えーと、つまり
・ゼロ幅は消費されない。パーマネントにゼロであり続ける。なので無限にマッチ可能
・無限にマッチ可能→同じゼロ幅に2回連続マッチしたからといってposを進めたり終了するわけではない
てことかな?
2回目以降が発生するかどうかは、、どうなんだろう
前回と完全に同じマッチになるときは試行せず終わる、っぽいけど
えーと、つまり
・ゼロ幅は消費されない。パーマネントにゼロであり続ける。なので無限にマッチ可能
・無限にマッチ可能→同じゼロ幅に2回連続マッチしたからといってposを進めたり終了するわけではない
てことかな?
2回目以降が発生するかどうかは、、どうなんだろう
前回と完全に同じマッチになるときは試行せず終わる、っぽいけど
987デフォルトの名無しさん
2023/12/01(金) 02:37:28.94ID:07OBAnmr sedの基本正規表現と拡張正規表現だとゼロ幅にマッチしないね
元はPerlのバグだったのが仕様ってことになったのでは?
$ printf 'abc' | sed 's/\(.*\)/[\1]/g'
[abc]
$ printf 'abc' | sed -E 's/(.*)/[\1]/g'
[abc]
元はPerlのバグだったのが仕様ってことになったのでは?
$ printf 'abc' | sed 's/\(.*\)/[\1]/g'
[abc]
$ printf 'abc' | sed -E 's/(.*)/[\1]/g'
[abc]
988デフォルトの名無しさん
2023/12/01(金) 08:09:57.11ID:RWimeGTM /^\w+|$/[$&]/
これが[abc][]になるのはおかしいと感じないよね?
前半が末尾まで食い尽くすから$はマッチしないはずだと思う?
これが[abc][]になるのはおかしいと感じないよね?
前半が末尾まで食い尽くすから$はマッチしないはずだと思う?
989デフォルトの名無しさん
2023/12/02(土) 00:36:44.31ID:/f7jnFb0 挙動を仕様書で厳密に定義しているJavaScriptではこうなってた
https://tc39.es/ecma262/multipage/text-processing.html#sec-regexp.prototype-@@replace
・1回目のマッチが "abc" すべてを消費する
・2回目のマッチは文字列末尾から始まるけど正規表現が.*なのでマッチングに成功する
ただし空文字にマッチした場合、先へ進まなくなることを回避するために
次回開始位置を一つ後ろへずらす処理が入る (12.c.iii.2以下)
これにより3回目のマッチは文字列の終端+1という範囲外の位置から始まることになり失敗に終わる
https://tc39.es/ecma262/multipage/text-processing.html#sec-regexp.prototype-@@replace
・1回目のマッチが "abc" すべてを消費する
・2回目のマッチは文字列末尾から始まるけど正規表現が.*なのでマッチングに成功する
ただし空文字にマッチした場合、先へ進まなくなることを回避するために
次回開始位置を一つ後ろへずらす処理が入る (12.c.iii.2以下)
これにより3回目のマッチは文字列の終端+1という範囲外の位置から始まることになり失敗に終わる
990デフォルトの名無しさん
2023/12/07(木) 23:24:41.69ID:Ug9Hn2aN KEEPのKはあるのにPが無い、何故?
991デフォルトの名無しさん
2023/12/07(木) 23:31:35.71ID:Ug9Hn2aN (?<=uma)musu(?=me) 柿憎い
uma\Kmusu\Pme 柿安い
uma\Kmusu\Pme 柿安い
992デフォルトの名無しさん
2023/12/10(日) 09:57:52.47ID:8JqB6SG/993デフォルトの名無しさん
2023/12/10(日) 13:04:54.79ID:t3u5G9tC $は「後ろが終端である位置」の指定であって「最後まで全部」という意味ではない
なので.+$で文字列を末尾まで消費した後でも再度末尾のゼロ幅にマッチできることはバグでもなんでもない
なので.+$で文字列を末尾まで消費した後でも再度末尾のゼロ幅にマッチできることはバグでもなんでもない
994デフォルトの名無しさん
2023/12/10(日) 14:15:57.63ID:ayXeZXuA 実装上のバグではなく仕様バグだろって話をしてるのがわからないのか?
995デフォルトの名無しさん
2023/12/10(日) 15:43:26.80ID:e6Tz3fj/ .*と$でマッチするものが異なるのに.*と.*|$でマッチするものが変わらないのは明らかにバクってるな
正規表現のパターンを変えるだけでperlでは[abc][]にも[abc]にもできるのにsedではこのバグのせいで[abc][]には絶対にできなくなってる
$ printf 'abc' | sed -E 's/.*|$/[&]/g'
[abc]
正規表現のパターンを変えるだけでperlでは[abc][]にも[abc]にもできるのにsedではこのバグのせいで[abc][]には絶対にできなくなってる
$ printf 'abc' | sed -E 's/.*|$/[&]/g'
[abc]
996デフォルトの名無しさん
2023/12/10(日) 15:44:52.66ID:e6Tz3fj/ s/バク/バグ/
997デフォルトの名無しさん
2023/12/13(水) 11:48:29.08ID:wzNHEkEB ただの仕様だよ、あほらし
次スレよろ
次スレよろ
998デフォルトの名無しさん
2023/12/16(土) 09:00:59.04ID:KMxF6SWS999デフォルトの名無しさん
2023/12/16(土) 09:36:31.90ID:pgUnJUCg 天地無用
1000デフォルトの名無しさん
2023/12/16(土) 10:49:04.16ID:faoSWywL >>998
ほめてつかわす
ほめてつかわす
レス数が1000を超えています。これ以上書き込みはできません。
