Regular Expressionスレです。
質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。
前スレ
Regular Expression(正規表現) Part15
https://mevius.5ch.net/test/read.cgi/tech/1568640311/
次スレは>>980宜しく
天ぷら等>>2以降
Regular Expression(正規表現) Part16
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
2021/11/03(水) 19:50:01.71ID:ebAE+z9+698デフォルトの名無しさん
2023/05/28(日) 15:02:19.22ID:yjwdVP6E 初歩的でしたね、ありがとうございます
699デフォルトの名無しさん
2023/05/31(水) 00:20:37.60ID:Dm7F+2f1 「-」の無い電話番号に「-」を入れるには?
700デフォルトの名無しさん
2023/05/31(水) 07:23:21.12ID:X455hjkS 国際電話とかあると面戸だね
701デフォルトの名無しさん
2023/05/31(水) 08:55:50.76ID:t6+qFJ/7 >>700
携帯番号以外は不可能じゃないかな
携帯番号以外は不可能じゃないかな
702デフォルトの名無しさん
2023/05/31(水) 18:03:07.79ID:wXMZ1Y1H 区切り位置が変わるから全部羅列するしかないね
それも時々更新する必要がある
それも時々更新する必要がある
703デフォルトの名無しさん
2023/06/02(金) 21:23:49.13ID:XcfIYH3W704デフォルトの名無しさん
2023/06/03(土) 16:20:02.62ID:p6l+hu28705デフォルトの名無しさん
2023/06/03(土) 22:05:33.82ID:vWJZBL5V 愛は行動。言葉だけではダメ
706デフォルトの名無しさん
2023/06/04(日) 00:25:20.56ID:FmV4cjgS もう冷めました
707デフォルトの名無しさん
2023/06/16(金) 20:08:06.56ID:BLiKvBT9 Perl v5.38.0-RC1
708デフォルトの名無しさん
2023/06/18(日) 00:06:22.30ID:7IbgNtYk NTTと早大、誤った正規表現の文字列抽出を自動で修正する技術を発表
japan.zdnet.com/article/35205348/
perl-5.38.0-RC1 perlre.pod
metacpan.org/release/RJBS/perl-5.38.0-RC1/view/pod/perlre.pod
(鬼車) 不在機能群の入れ子 の動作テスト集
github.com/tonco-miyazawa/regex_etc/blob/master/MEMO_onig/abcent/nesting.txt
japan.zdnet.com/article/35205348/
perl-5.38.0-RC1 perlre.pod
metacpan.org/release/RJBS/perl-5.38.0-RC1/view/pod/perlre.pod
(鬼車) 不在機能群の入れ子 の動作テスト集
github.com/tonco-miyazawa/regex_etc/blob/master/MEMO_onig/abcent/nesting.txt
709デフォルトの名無しさん
2023/06/18(日) 14:54:23.24ID:PO9vLDeK >>708
これは色んな意味でおかしい。まず、画像で例示しているURLだがドメインレベルに ? は
使用できない(エラーになる)。正規表現自身もURLということをチェックしていない。最低限、
スキームが https? で始まり、ID=文字列(アルファベット限定)を含む書式の、文字列のみを
抽出するコードを(ここに直接書くとエラーを食らっているので)貼っておく。
https://pastebin.com/V1DVjsQd
これは色んな意味でおかしい。まず、画像で例示しているURLだがドメインレベルに ? は
使用できない(エラーになる)。正規表現自身もURLということをチェックしていない。最低限、
スキームが https? で始まり、ID=文字列(アルファベット限定)を含む書式の、文字列のみを
抽出するコードを(ここに直接書くとエラーを食らっているので)貼っておく。
https://pastebin.com/V1DVjsQd
710デフォルトの名無しさん
2023/06/18(日) 15:04:09.09ID:PO9vLDeK 訂正。>709で貼ったコードは正しく動作するががコメントに(ここに貼った際に試行錯誤した
せいで) ? が抜けていた。趣旨は同じものなので、↓を参照して下さい。
https://pastebin.com/RQ5uj62f
せいで) ? が抜けていた。趣旨は同じものなので、↓を参照して下さい。
https://pastebin.com/RQ5uj62f
711デフォルトの名無しさん
2023/06/18(日) 15:53:25.97ID:uv5oAAX5712デフォルトの名無しさん
2023/06/18(日) 16:12:09.00ID:uv5oAAX5 「正規表現を用いた文字列抽出の例」図は「誤った正規表現」の例なんじゃないかなあ
例の正規表現では ~.com?fakeID=DEF にもマッチしてしまう
例の正規表現では ~.com?fakeID=DEF にもマッチしてしまう
713デフォルトの名無しさん
2023/06/18(日) 16:13:51.73ID:PO9vLDeK >>711
あなたが示している[1]のsyntax diagram(構文図)[2]にあるように、? はqueryを示す文字で
path( / )以前のドメイン名部分には出てこず、最低限 / の後でなければならないはず。
[1] https://en.wikipedia.org/wiki/URL
[2] https://upload.wikimedia.org/wikipedia/commons/thumb/d/d6/URI_syntax_diagram.svg/1280px-URI_syntax_diagram.svg.png
あなたが示している[1]のsyntax diagram(構文図)[2]にあるように、? はqueryを示す文字で
path( / )以前のドメイン名部分には出てこず、最低限 / の後でなければならないはず。
[1] https://en.wikipedia.org/wiki/URL
[2] https://upload.wikimedia.org/wikipedia/commons/thumb/d/d6/URI_syntax_diagram.svg/1280px-URI_syntax_diagram.svg.png
714デフォルトの名無しさん
2023/06/19(月) 17:12:20.20ID:a4eWUm7x >色んな意味でおかしい
同意。本当にこの例をNTTの技術者が作ったの?と思ってしまった。
広報担当の事務員が頑張って作った例だと言われたら納得出来るw
同意。本当にこの例をNTTの技術者が作ったの?と思ってしまった。
広報担当の事務員が頑張って作った例だと言われたら納得出来るw
715デフォルトの名無しさん
2023/06/20(火) 13:11:10.13ID:AvErps2d これは、>>712の人も言ってるように「悪い見本」か、あるいは「プレスリリース用にめっちゃ簡略化した例」のどちらかかと思う
個人的には悪い見本の方かと思う
「?」と「ID」の間のスペースとか気持ち悪いし
個人的には悪い見本の方かと思う
「?」と「ID」の間のスペースとか気持ち悪いし
716デフォルトの名無しさん
2023/06/21(水) 01:04:22.29ID:LPKmcd4s メールアドレスは誤ったアドレスを発行して運用してるところがあると対応せにゃ仕方ないけど
URLは誰もアクセスできないだけで終わるんだろうな
URLは誰もアクセスできないだけで終わるんだろうな
717デフォルトの名無しさん
2023/06/21(水) 02:01:06.48ID:FL3bkV8O 質問
ある文字列の中に、4桁の数字が出た場合、文字列を区切るという目的で正規表現を使いたいです
let hoge="....";
hoge.split(/\d{4}/)
しかし上記の正規表現だと、例えば6桁の数字でも区切ってしまうため、これを4桁に限定するためにはどうしたらよいでしょうか?
ある文字列の中に、4桁の数字が出た場合、文字列を区切るという目的で正規表現を使いたいです
let hoge="....";
hoge.split(/\d{4}/)
しかし上記の正規表現だと、例えば6桁の数字でも区切ってしまうため、これを4桁に限定するためにはどうしたらよいでしょうか?
718デフォルトの名無しさん
2023/06/21(水) 02:36:29.87ID:HRXsYHZK (?<!\d)\d{4}(?!\d)
719デフォルトの名無しさん
2023/06/21(水) 06:20:04.42ID:FL3bkV8O ありがとうございます
720デフォルトの名無しさん
2023/06/21(水) 07:00:29.04ID:8S43aXN3 修正前 .*(..)?
修正後 .*?(.[^z])?
"abcd"を与えて受理される文字列
修正前 ""
修正後 "ab"
受理してもらいたかった文字列 "cd"
URLからIDを取り出すほうは画像に入るようにデフォルメする必要があるから
おかしいURLになるのはやむを得ないと思う
> (?:[&].*)?
ただこれはちょっと気持ち悪い
これがあっても無くても結果は変わらないから付ける必要なかった
正規表現に詳しい人が"&"を単体で文字クラスに入れることはあまりない(たまにはいる)
新技術のアプリを実際に試させてくれないかな?
提供してもらえれば無償でテストするよ
修正後 .*?(.[^z])?
"abcd"を与えて受理される文字列
修正前 ""
修正後 "ab"
受理してもらいたかった文字列 "cd"
URLからIDを取り出すほうは画像に入るようにデフォルメする必要があるから
おかしいURLになるのはやむを得ないと思う
> (?:[&].*)?
ただこれはちょっと気持ち悪い
これがあっても無くても結果は変わらないから付ける必要なかった
正規表現に詳しい人が"&"を単体で文字クラスに入れることはあまりない(たまにはいる)
新技術のアプリを実際に試させてくれないかな?
提供してもらえれば無償でテストするよ
721デフォルトの名無しさん
2023/06/21(水) 07:17:00.34ID:Z+I+bAqU 「abczは拒否」→「なるほど末尾zは拒否だな」
えー…
えー…
722デフォルトの名無しさん
2023/06/21(水) 07:38:48.98ID:SbeXWTV7 書いてないけど前提として完全一致のつもりだったんだろうな
723デフォルトの名無しさん
2023/06/21(水) 10:41:38.55ID:8S43aXN3 jsって完全一致が前提になるオプションってある?
それがあったとしても .*?(.[^z])? はAutoだが
それがあったとしても .*?(.[^z])? はAutoだが
724デフォルトの名無しさん
2023/06/21(水) 11:16:26.32ID:ld9dVlA3 >>723
シングルラインモード(dotAll)で ^ と $ を使えば良いだけでは?
シングルラインモード(dotAll)で ^ と $ を使えば良いだけでは?
725デフォルトの名無しさん
2023/06/21(水) 12:14:35.15ID:8S43aXN3 ^と$を使うつもりなら画像の中でも使うと思う
見やすくするために省いてるだけなのかな?
そうだとしても .*?(.[^z])? はAutoだが
見やすくするために省いてるだけなのかな?
そうだとしても .*?(.[^z])? はAutoだが
726デフォルトの名無しさん
2023/06/21(水) 22:34:06.87ID:g2ig9yOY ニュー速(嫌儲)で、近頃半角記号を6文字だけとかの書き込みがあります
なんとかNGを作りたいのですがうまく行きません
行頭から記号だけの文字列で4~8文字、って想定でこんなの作ってみたんですが、httpで始まるurlも引っかけてしまいます
^[ -/:-@\[-~]{4,8}
例えばこんなスレなんですが
https://greta.5ch.net/test/read.cgi/poverty/1687352512/
詳しい方、正規表現作ってもらえないでしょうか?
なんとかNGを作りたいのですがうまく行きません
行頭から記号だけの文字列で4~8文字、って想定でこんなの作ってみたんですが、httpで始まるurlも引っかけてしまいます
^[ -/:-@\[-~]{4,8}
例えばこんなスレなんですが
https://greta.5ch.net/test/read.cgi/poverty/1687352512/
詳しい方、正規表現作ってもらえないでしょうか?
727デフォルトの名無しさん
2023/06/22(木) 09:30:57.52ID:nJDgsm3N そういうのは専ブラのNGスレでやるべきだね、ユーザー同士で情報共有にもなるから
正規表現を適用する対象がHTMLでなくdatだったりでユーザーでないと作れない場合もある
記号だけにマッチさせたいなら[!-/:-@\[-`{-~]だが、この前後に付ける正規表現は
お使いの専ブラスレで聞いてくれ
正規表現を適用する対象がHTMLでなくdatだったりでユーザーでないと作れない場合もある
記号だけにマッチさせたいなら[!-/:-@\[-`{-~]だが、この前後に付ける正規表現は
お使いの専ブラスレで聞いてくれ
728デフォルトの名無しさん
2023/06/22(木) 09:42:44.65ID:TTIYA8nl そこみる限りでは3パターンしかなくない?
何かしらの絵文字とかが化けて出てるだけとか。
(\$\@\:\^\()|(\_\]\#\)\&\$\}\>)|(\!\^\*\%\&\$\:\~)
何かしらの絵文字とかが化けて出てるだけとか。
(\$\@\:\^\()|(\_\]\#\)\&\$\}\>)|(\!\^\*\%\&\$\:\~)
729デフォルトの名無しさん
2023/06/22(木) 10:08:56.55ID:L6AKAbfA 726です
726のこれはうまく動かない、と書いたのは、文字間にスペース入ってました
727さんのに変えたら誤動作無く動作しました
^[!-/:-@\[-`{-~]{5,11}
ちなみに、android板に以下のスレを発見しました
しかし、荒らされてて機能して無さそう
他にこっちの方が良いよ、っておすすめのスレはありますかね?
オススメのNGワード
https://egg.5ch.net/test/read.cgi/android/1576334383/
726のこれはうまく動かない、と書いたのは、文字間にスペース入ってました
727さんのに変えたら誤動作無く動作しました
^[!-/:-@\[-`{-~]{5,11}
ちなみに、android板に以下のスレを発見しました
しかし、荒らされてて機能して無さそう
他にこっちの方が良いよ、っておすすめのスレはありますかね?
オススメのNGワード
https://egg.5ch.net/test/read.cgi/android/1576334383/
730デフォルトの名無しさん
2023/06/22(木) 10:55:55.92ID:nJDgsm3N こちらはそちらが何を使ってるかも分からないので勧めようが無い件
問題は正規表現の後ろに付けるほうなんだけど何を使ってるかで変わると思う
今のままでは12文字以上記号が続いててもNGになっちゃうね
問題は正規表現の後ろに付けるほうなんだけど何を使ってるかで変わると思う
今のままでは12文字以上記号が続いててもNGになっちゃうね
731デフォルトの名無しさん
2023/06/22(木) 13:11:08.52ID:L6AKAbfA >>730
chmateなんです
その後、2文字だけのにも対応するためこうなりました。言われた通り後ろ側も条件付けました
^[!-/:-@\[-`{-~]{2,11}$
ここがひどいです
https://greta.5ch.net/test/read.cgi/poverty/1687400738/
chmateなんです
その後、2文字だけのにも対応するためこうなりました。言われた通り後ろ側も条件付けました
^[!-/:-@\[-`{-~]{2,11}$
ここがひどいです
https://greta.5ch.net/test/read.cgi/poverty/1687400738/
732デフォルトの名無しさん
2023/06/22(木) 14:46:12.28ID:vRMLRvgd 方言がひどい記述だけど(PCRE2とbregonig.dllでは大丈夫)
^ ?(((?!&gt;?|&lt;?)[[:punct:]])+|&gt;?|&lt;?){2,} ?$
^ ?(((?!&gt;?|&lt;?)[[:punct:]])+|&gt;?|&lt;?){2,} ?$
733デフォルトの名無しさん
2023/06/22(木) 14:53:40.61ID:vRMLRvgd734デフォルトの名無しさん
2023/06/22(木) 23:53:09.33ID:nJDgsm3N GJ
[[:punct:]] これいいね、覚えとこ
(()+){2,}は繰り返しが二重になっててReDosを狙われる懸念があるから
++や(?>)を使ったほうがいいかも
正規表現エンジンの内部でも対策はしてると思うけど念のために
[[:punct:]] これいいね、覚えとこ
(()+){2,}は繰り返しが二重になっててReDosを狙われる懸念があるから
++や(?>)を使ったほうがいいかも
正規表現エンジンの内部でも対策はしてると思うけど念のために
735デフォルトの名無しさん
2023/06/23(金) 01:33:06.45ID:gmkpJif8 >>734
+が入ってるのはダメじゃん
除いてくれ
作ってる途中で紛れ込んだものだね
なおbregonig.dllだと
^ ?(?:\p{punct}|&gt;?|&lt;?){4,} ?$
^ ?(?:[[:punct:]]|&gt;?|&lt;?){4,} ?$
でもいけちゃうんだよな
ちょっと不思議
+が入ってるのはダメじゃん
除いてくれ
作ってる途中で紛れ込んだものだね
なおbregonig.dllだと
^ ?(?:\p{punct}|&gt;?|&lt;?){4,} ?$
^ ?(?:[[:punct:]]|&gt;?|&lt;?){4,} ?$
でもいけちゃうんだよな
ちょっと不思議
736デフォルトの名無しさん
2023/06/23(金) 02:02:21.28ID:qwakAXsj and検索みたいなのってできない?
今まで[ABC]と[あいう]は2回に分けて検索してたけど1回で済ませたい
今まで[ABC]と[あいう]は2回に分けて検索してたけど1回で済ませたい
737デフォルトの名無しさん
2023/06/23(金) 02:09:08.88ID:gmkpJif8 >>736
^(?=.*?ABC)(?=.*?あいう)(?=.*?甲乙丙)
^(?=.*?ABC)(?=.*?あいう)(?=.*?甲乙丙)
738デフォルトの名無しさん
2023/06/23(金) 02:35:28.92ID:qwakAXsj >>737
感謝
感謝
739デフォルトの名無しさん
2023/06/23(金) 12:02:08.17ID:2Ntzjt3B [文章]
AAAaiueo111 xxx
aaaaa
AAAkakikukeko xxx
b b b
AAAsasisuseso
ccccc
AAAtatituteto000
ddd123
上記の文章で先頭がAAAの行だけ抜き出して、さらにAAAを削除して末尾にxxxがある場合はxxxも削除する正規表現を考えています。
使用するのはサクラエディタの置換機能で、
置換前 AAA(.*)\r |.*\r\n
置換後 $1
で実行するとAAAの行だけ抜き出してAAAも削除出来ましたがxxxが残ります。2回に分けて置換すればいいのですが、面倒なので1回でxxxまで削除する方法があれば教えてください。
AAAaiueo111 xxx
aaaaa
AAAkakikukeko xxx
b b b
AAAsasisuseso
ccccc
AAAtatituteto000
ddd123
上記の文章で先頭がAAAの行だけ抜き出して、さらにAAAを削除して末尾にxxxがある場合はxxxも削除する正規表現を考えています。
使用するのはサクラエディタの置換機能で、
置換前 AAA(.*)\r |.*\r\n
置換後 $1
で実行するとAAAの行だけ抜き出してAAAも削除出来ましたがxxxが残ります。2回に分けて置換すればいいのですが、面倒なので1回でxxxまで削除する方法があれば教えてください。
740デフォルトの名無しさん
2023/06/23(金) 13:06:42.48ID:gnUd2/2c AAAで始まらない1行|先頭のAAA|末尾のxxx
741デフォルトの名無しさん
2023/06/23(金) 13:54:57.82ID:WBrlaKRC ^AAA|xxx$|^.*\r\n → 削除
742デフォルトの名無しさん
2023/06/23(金) 15:20:23.65ID:2Ntzjt3B743デフォルトの名無しさん
2023/06/23(金) 19:05:48.89ID:zWmLGOhD ^AAA([^\r\n]*?)(?:xxx)?$|^[^\r\n]*(?:\r\n|[\r\n])?
$1
アク菌で書けませんぞテスト
$1
アク菌で書けませんぞテスト
744734
2023/06/23(金) 19:21:25.94ID:zWmLGOhD >>735
PCRE2では\p{Punct}は存在しないんだね
www.pcre.org/current/doc/html/pcre2syntax.html
[\p{P}\p{S}]で代用になりそう、全角文字にもマッチするけど
プロパティがこれだけいろいろあると全部を把握するだけでも大変だなぁ
> +
言われてみれば+があるのはおかしいw 忘れ物だったのかw
PCRE2では\p{Punct}は存在しないんだね
www.pcre.org/current/doc/html/pcre2syntax.html
[\p{P}\p{S}]で代用になりそう、全角文字にもマッチするけど
プロパティがこれだけいろいろあると全部を把握するだけでも大変だなぁ
> +
言われてみれば+があるのはおかしいw 忘れ物だったのかw
745デフォルトの名無しさん
2023/06/23(金) 21:34:05.58ID:gmkpJif8 >>744
不思議な点は
PCRE2だと、[[:punct:]]で&が先にキャッチされて&gt;のgt;が取り残されてしまうので
|&gt;とあってもマッチしなくなる
bregonig.dllだと
&gt;にキャッチされてマッチする(punctより&gt;が優先される
(PCRE2は最短マッチが優先されて、bregonigは最長マッチが優先なのか?)
これはorの記述の順序には関係なく左に(先に)&gt;を書いても結果は同じ
不思議な点は
PCRE2だと、[[:punct:]]で&が先にキャッチされて&gt;のgt;が取り残されてしまうので
|&gt;とあってもマッチしなくなる
bregonig.dllだと
&gt;にキャッチされてマッチする(punctより&gt;が優先される
(PCRE2は最短マッチが優先されて、bregonigは最長マッチが優先なのか?)
これはorの記述の順序には関係なく左に(先に)&gt;を書いても結果は同じ
746デフォルトの名無しさん
2023/06/23(金) 22:07:00.56ID:zWmLGOhD ここのテストサイトで regex101.com/
^([[:punct:]]|>|<)$ を < にマッチさせたら成功したけど
本物のPCRE2ではマッチしないの?余計な半角スペースが入ってたりしない?
それで>>732に要らないはずの先読みを入れてたんだね
これがマッチしないならバグかも知れない
もしまたゴミとかのうっかりミスが原因だったとしても気にしないでね、俺もよくやらかすから
^([[:punct:]]|>|<)$ を < にマッチさせたら成功したけど
本物のPCRE2ではマッチしないの?余計な半角スペースが入ってたりしない?
それで>>732に要らないはずの先読みを入れてたんだね
これがマッチしないならバグかも知れない
もしまたゴミとかのうっかりミスが原因だったとしても気にしないでね、俺もよくやらかすから
747デフォルトの名無しさん
2023/06/23(金) 22:09:21.21ID:zWmLGOhD あ、&が化けちゃった
^([[:punct:]]|>|<)$ を > にマッチさせて
^([[:punct:]]|>|<)$ を > にマッチさせて
748デフォルトの名無しさん
2023/06/23(金) 22:31:35.63ID:gmkpJif8749デフォルトの名無しさん
2023/06/23(金) 22:36:28.09ID:gmkpJif8 今考え付くのは
^(?>[[:punct:]]|&gt;)+
とか
&gt;のみ書いといて&lt;に引っ掛かったとかとかかなあ?
^(?>[[:punct:]]|&gt;)+
とか
&gt;のみ書いといて&lt;に引っ掛かったとかとかかなあ?
750デフォルトの名無しさん
2023/06/23(金) 22:47:37.55ID:gmkpJif8 さすがに(?>)を使って気づかないわけないから(使った覚えもないし)
恥ずかしいけど、gt;とlt;の取り違えをやらかした気がする
恥ずかしいけど、gt;とlt;の取り違えをやらかした気がする
751デフォルトの名無しさん
2023/06/23(金) 23:16:11.04ID:zWmLGOhD そういうこと俺もあるから分かるわーw
頭が回ってないときに動作確認するとしっかり確認出来てないのに確認したつもりに
なってしまうんだよなぁ、だから休憩と二重三重の確認はめちゃ大事
間違えた原因は分からないけどとりあえずゆっくり休んでくれw
頭が回ってないときに動作確認するとしっかり確認出来てないのに確認したつもりに
なってしまうんだよなぁ、だから休憩と二重三重の確認はめちゃ大事
間違えた原因は分からないけどとりあえずゆっくり休んでくれw
752デフォルトの名無しさん
2023/06/24(土) 00:27:07.24ID:X4q59utv 勘違いした理由が分かった
^([[:punct:]]|&gt;)+
これをやると&で切れちゃうんだ
s/([[:punct:]]|&gt;)+//g
をやるとgtが置換されずに残る
末尾に$とか目標物を付ければ切れないんだが
さてどうして切れるのか誰か教えて
^([[:punct:]]|&gt;)+
これをやると&で切れちゃうんだ
s/([[:punct:]]|&gt;)+//g
をやるとgtが置換されずに残る
末尾に$とか目標物を付ければ切れないんだが
さてどうして切れるのか誰か教えて
753デフォルトの名無しさん
2023/06/24(土) 00:36:09.10ID:X4q59utv やっぱ左側が優先なのか
(&gt;|[[:punct:]])
と入れ替えたら切れない
(&gt;|[[:punct:]])
と入れ替えたら切れない
754デフォルトの名無しさん
2023/06/24(土) 09:56:18.97ID:o3ZfF1Sp755751
2023/06/24(土) 11:05:23.89ID:QPqcCtG1756デフォルトの名無しさん
2023/06/24(土) 11:10:05.28ID:QPqcCtG1 あ、NTTと早大のやつは正規表現を^と$で囲ってから動かして
757デフォルトの名無しさん
2023/06/24(土) 11:21:09.38ID:X4q59utv758デフォルトの名無しさん
2023/06/24(土) 16:54:14.04ID:QPqcCtG1 >最大の最長を探す記述
ちょっと探してみたらPHPのオプションにあった
www.php.net/manual/ja/function.mb-regex-set-options.php
> l 最も長くマッチするものを探す
この処理ってすごく重くなりそうなイメージがあったけどそうでもないのかな
ちょっと探してみたらPHPのオプションにあった
www.php.net/manual/ja/function.mb-regex-set-options.php
> l 最も長くマッチするものを探す
この処理ってすごく重くなりそうなイメージがあったけどそうでもないのかな
759デフォルトの名無しさん
2023/06/24(土) 17:35:54.33ID:X4q59utv PHPだけじゃなあ
結局、事故らない為には長さの違うダブリは取り除いておくほうが無難ってことか
結局、事故らない為には長さの違うダブリは取り除いておくほうが無難ってことか
760743
2023/06/25(日) 11:57:31.39ID:YeZqv3UB >> 759
考えてみると長いほうを前にしても短いほうがマッチ出来なくて詰むケースがあるのか
正規表現むずかしい
>> 740 741 754
改行コードがLFやCRのみの場合に対応してない
最後の行がAAAで始まらない場合、行末の改行が無い場合に削除されない
743は両方に対応しているけど740の発想のほうがシンプルで優れてるね
あとサクラエディタでは\Rが使えるので使ったほうが簡単に書けそう
考えてみると長いほうを前にしても短いほうがマッチ出来なくて詰むケースがあるのか
正規表現むずかしい
>> 740 741 754
改行コードがLFやCRのみの場合に対応してない
最後の行がAAAで始まらない場合、行末の改行が無い場合に削除されない
743は両方に対応しているけど740の発想のほうがシンプルで優れてるね
あとサクラエディタでは\Rが使えるので使ったほうが簡単に書けそう
761デフォルトの名無しさん
2023/06/27(火) 21:16:47.75ID:TnfGmDZI 最長一致マッチが有効のとき、下の正規表現は何にマッチすべき?
"abcd" =~ /abc\Kd|abc/;
\Kの前を文字列長に含めるべきか否かを考えて下さい
"abcd" =~ /abc\Kd|abc/;
\Kの前を文字列長に含めるべきか否かを考えて下さい
762デフォルトの名無しさん
2023/06/28(水) 12:49:16.44ID:vk3PbjZ1 元より最左ルールに基づいてdよりabcにマッチすべきとはならんやろ
763761
2023/06/28(水) 13:05:55.77ID:m0cBggZC764デフォルトの名無しさん
2023/06/29(木) 11:57:49.56ID:0JMnG4u5 最長一致する正規表現が有効の場合
1、「abc」「あ」
2、「て゛」「で」
A. 前が長い
B. 同じ長さ
C. 後ろが長い
1、「abc」「あ」
2、「て゛」「で」
A. 前が長い
B. 同じ長さ
C. 後ろが長い
765デフォルトの名無しさん
2023/07/02(日) 20:25:06.40ID:/BVUs+ug 奥が深すぎる
766デフォルトの名無しさん
2023/07/06(木) 13:17:43.04ID:GbtWdAMV twitter.com/k_takata/status/1676247372731662336
>正規表現技術入門が第2刷増刷
おめでとうございます
bregonig.dllやonigmoにはいつもお世話になってます
vimは知りませんw
>正規表現技術入門が第2刷増刷
おめでとうございます
bregonig.dllやonigmoにはいつもお世話になってます
vimは知りませんw
767デフォルトの名無しさん
2023/07/06(木) 17:43:12.24ID:SQbV6Whm JaneStyleであぼーんにつかいたいのですが、
アウアウウー Sa47-runv [106.131.26.222]
47
runv
131.26.222
この3つが変わる場合の正規表現ってどうかいたらよいでしょうか?
アウアウウー Sa47-runv [106.131.26.222]
47
runv
131.26.222
この3つが変わる場合の正規表現ってどうかいたらよいでしょうか?
768デフォルトの名無しさん
2023/07/06(木) 20:37:36.61ID:GbtWdAMV Jane Styleの仕様が分からないけどこれでいける?
(?i)アウアウウー\s*Sa[a-z\d]{2}-[a-z\d]{4}\s*\[106\.\d{1,3}\.\d{1,3}\.\d{1,3}\]
(?i)アウアウウー\s*Sa[a-z\d]{2}-[a-z\d]{4}\s*\[106\.\d{1,3}\.\d{1,3}\.\d{1,3}\]
769デフォルトの名無しさん
2023/07/06(木) 21:30:05.44ID:7Yxy824T770デフォルトの名無しさん
2023/07/06(木) 21:54:51.51ID:7Yxy824T771デフォルトの名無しさん
2023/07/06(木) 21:55:53.42ID:gWNyo9yQ いやそれでいけるでしょ
(?i)はデフォなので要らないけど
ダメなら設定の仕方が悪いか、既に表示されているものにNGを設定したんで
設定前の表示が表示されたままで再描画をやってないのでNGが表示に反映されてないかのどっちか
(?i)はデフォなので要らないけど
ダメなら設定の仕方が悪いか、既に表示されているものにNGを設定したんで
設定前の表示が表示されたままで再描画をやってないのでNGが表示に反映されてないかのどっちか
772デフォルトの名無しさん
2023/07/06(木) 22:11:26.50ID:GbtWdAMV 動いて良かった、正規表現の勉強頑張れーw
771さんもありがとう
771さんもありがとう
773デフォルトの名無しさん
2023/07/06(木) 22:11:33.07ID:4RAXuAwI ちなみにワッチョイの下4桁、runvの部分は大文字もありうるから
その正規表現すり抜けするかも
その正規表現すり抜けするかも
774デフォルトの名無しさん
2023/07/06(木) 22:16:17.63ID:gWNyo9yQ (?i)が付いてるし、なくてもそれがデフォだから大丈夫だよ
775デフォルトの名無しさん
2023/07/06(木) 22:21:43.88ID:7Yxy824T >>773
(?i)アウアウウー\s*Sa[0-9A-Za-z\d]{2}-[0-9A-Za-z\d]{4}\s*\[106\.\d{1,3}\.\d{1,3}\.\d{1,3}\]
一応、ご指摘通り改良しておきました!
(?i)アウアウウー\s*Sa[0-9A-Za-z\d]{2}-[0-9A-Za-z\d]{4}\s*\[106\.\d{1,3}\.\d{1,3}\.\d{1,3}\]
一応、ご指摘通り改良しておきました!
776デフォルトの名無しさん
2023/07/07(金) 00:41:55.61ID:adSx9MnJ 反対に(?i)ではSaの他にsAにもマッチしてしまうのでは?
(?-i)アウアウウー Sa..-.... \[106\.
これで誤爆する実例があるなら教えてほしい
(?-i)アウアウウー Sa..-.... \[106\.
これで誤爆する実例があるなら教えてほしい
777デフォルトの名無しさん
2023/07/07(金) 13:06:44.76ID:xew4KSRK 言い方があれだけど、丁寧に書いたかどうかの差なのでどっちでも機能すると思う
778デフォルトの名無しさん
2023/07/07(金) 23:28:01.04ID:chPidFQv 鬼車で(?L)と\g<0>が共存出来ないようだけど
"\g<0>が正規表現全体を取り込むときに(?L)だけを取り込まないようにする"
という修正案で何か問題が起こるか分かる人いません?
例えば (?Lix)abc\g<0> だったら\g<0>の中身が (?ix)abc\g<0> になるようにすれば
共存可能になるんだけど副作用が出るのか分からない
鬼車公式) 全体オプション
github.com/kkos/oniguruma/blob/41a3b802af2155eef6d648aa3608e39605110642/doc/RE.ja#L288
LだけじゃなくCとIも共存不可でした
"\g<0>が正規表現全体を取り込むときに(?L)だけを取り込まないようにする"
という修正案で何か問題が起こるか分かる人いません?
例えば (?Lix)abc\g<0> だったら\g<0>の中身が (?ix)abc\g<0> になるようにすれば
共存可能になるんだけど副作用が出るのか分からない
鬼車公式) 全体オプション
github.com/kkos/oniguruma/blob/41a3b802af2155eef6d648aa3608e39605110642/doc/RE.ja#L288
LだけじゃなくCとIも共存不可でした
779デフォルトの名無しさん
2023/07/09(日) 12:38:44.00ID:dnLGUnq0780デフォルトの名無しさん
2023/07/09(日) 15:02:36.24ID:NT/2XwNR 最長マッチ(?L)を知らなかったんだけど何か思ってたのと全然違った
DFA的な最長だと思ってたのに
DFA的な最長だと思ってたのに
781デフォルトの名無しさん
2023/07/09(日) 17:56:55.84ID:dnLGUnq0 最左じゃなくても良いみたい
UTF-8のとき
abc < abc\Kd
ab < あ
で < て゛
"(?C)a(b|\g<0>)c" がエラーになるのはモヤっとする
"(?C)" が捕獲無効にするから "\g<1>" は使えないし
UTF-8のとき
abc < abc\Kd
ab < あ
で < て゛
"(?C)a(b|\g<0>)c" がエラーになるのはモヤっとする
"(?C)" が捕獲無効にするから "\g<1>" は使えないし
782デフォルトの名無しさん
2023/07/10(月) 13:05:06.30ID:8apozFwM > ab < あ
マルチバイト文字を含む文字列に対して (?L) は使いにくいな
文字単位での長さで比較するようにするのは重くなる上に難易度高そう
マルチバイト文字を含む文字列に対して (?L) は使いにくいな
文字単位での長さで比較するようにするのは重くなる上に難易度高そう
783デフォルトの名無しさん
2023/07/10(月) 20:06:05.30ID:8apozFwM JaneStyleが5ch.netのサポートを終了
この前NG登録出来て喜んでた人かわいそす
この前NG登録出来て喜んでた人かわいそす
784デフォルトの名無しさん
2023/07/11(火) 10:50:26.27ID:6DaZenCz (?L)をマルチ文字対応にするのは無理だけど
>"(?C)a(b|\g<0>)c" がエラーになる
これを使えるように出来る人はいるんじゃないかな
夏休みで暇を持て余している大学生の皆さん、Let's try!
>"(?C)a(b|\g<0>)c" がエラーになる
これを使えるように出来る人はいるんじゃないかな
夏休みで暇を持て余している大学生の皆さん、Let's try!
785デフォルトの名無しさん
2023/07/13(木) 19:11:50.96ID:7AgmN8D3 JAPANを日本、NIPPONをニッポンに、同時に置き換える
JAPAN|NIPPON
↓
日本|ニッポン
JAPAN|NIPPON
↓
日本|ニッポン
786デフォルトの名無しさん
2023/07/13(木) 23:55:44.94ID:OlRmyaph >>785
サクラエディタ+bregonig.dllでは無理っす
サクラエディタ+bregonig.dllでは無理っす
787デフォルトの名無しさん
2023/07/14(金) 00:50:54.69ID:JHf9vJmP788デフォルトの名無しさん
2023/07/14(金) 13:30:40.79ID:lxqistQI わしは鬼車のscan.cをいじって好きに置換出来るようにしたぞ。ファイルからhtmlソースを読み込んで繰り返し検索・置換して結果を別ファイルに出力するようにしとる。便利なのだが使う機会は滅多にない。日常の置換はほぼ秀丸で事足りる。
789デフォルトの名無しさん
2023/07/15(土) 18:19:44.01ID:nnNpViq+ JavaScriptですが「0を含めない正の半角数値のみ」というのは、どう書けばいいのでしょうか?
790デフォルトの名無しさん
2023/07/15(土) 18:22:35.95ID:nnNpViq+ 0を含めないというのは「0より大きい正の半角数値のみ」という意味です
791デフォルトの名無しさん
2023/07/15(土) 18:39:49.26ID:Fs/aULCy 正規表現でやることじゃない
792デフォルトの名無しさん
2023/07/15(土) 18:47:36.28ID:vGns6WZO (?!(?!<[0-9])0(?![0^9]))[0-9]+
00とかあるんだったらダメだけど
00とかあるんだったらダメだけど
793デフォルトの名無しさん
2023/07/15(土) 18:47:49.29ID:hche+KD8794デフォルトの名無しさん
2023/07/15(土) 19:54:00.17ID:nnNpViq+795デフォルトの名無しさん
2023/07/15(土) 20:24:42.65ID:hche+KD8 >>794
「正規表現だけで評価したい理由」になってない
許可したい文字種が「0から9までの数字」ってことで良いのなら、下記で済ませるのが妥当(符号・少数点・セパレータを含んでいたり、16進表記、指数表記、インド数字、などの表現は不許可)
const isValid = Number(inputString) && /^[0-9]+$/.test(inputString);
「正規表現だけで評価したい理由」になってない
許可したい文字種が「0から9までの数字」ってことで良いのなら、下記で済ませるのが妥当(符号・少数点・セパレータを含んでいたり、16進表記、指数表記、インド数字、などの表現は不許可)
const isValid = Number(inputString) && /^[0-9]+$/.test(inputString);
796デフォルトの名無しさん
2023/07/15(土) 21:27:34.96ID:nnNpViq+ すみません
説明の仕方が悪かったです
「正の実数(少数も含む)」でした
0も含ませることにしました
それでこうしました
^(0|[1-9][0-9]*)(|[.][0-9]+)$
説明の仕方が悪かったです
「正の実数(少数も含む)」でした
0も含ませることにしました
それでこうしました
^(0|[1-9][0-9]*)(|[.][0-9]+)$
797デフォルトの名無しさん
2023/07/15(土) 21:44:37.74ID:Ip1+AB5X そして半年後…
「誰だよこんなクソプログラム書いたやつ💢」
「誰だよこんなクソプログラム書いたやつ💢」
798デフォルトの名無しさん
2023/07/15(土) 21:52:20.50ID:G+tF3yG6 滅茶苦茶わかりみ
美しくないプログラムはパッと見てうんざりする
美しくないプログラムはパッと見てうんざりする
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【次の一手】台湾問題で小林よしのり氏が私見「まさに戦争前夜」「ただちに徴兵制を敷いて、高市支持者を最前線へ」… ★5 [BFU★]
- 【野球】大谷翔平、佐々木朗希、山本由伸らがWBC辞退なら広がる不協和音… 『過去イチ盛り上がらない大会』になる可能性も★2 [冬月記者★]
- 【国際】ロシアはすでに戦争準備段階――ポーランド軍トップが警告 [ぐれ★]
- 【news23】小川彩佳アナ「ここまでの広がりになるということを、高市総理はどれだけ想像できていたんでしょうね」 日中問題特集で [冬月記者★]
- 「町中華」の“息切れ倒産”が増加 ブームにも支えられ職人技で踏ん張ってきたが… 大手チェーンは値上げでも絶好調 [ぐれ★]
- 毛寧(もう・ねい)報道官「中国に日本の水産品の市場は無い」 高市首相の国会答弁に「中国民衆の強い怒り」 ★2 [ぐれ★]
- ヤフコメ「中国への輸出がなくなる事で、日本国内で美味しくいただける事に感謝します」👈やたら政権寄りなのはなぜ?(´・ω・`) [399259198]
- 【高市売り】円安、止まらず!凄い勢いで暴落中。157円へ [219241683]
- ファブルに出てくる貝沼君ってのがお前らにそっくりなんだよ
- 俺「お湯を流してと…」シンク「ボンッw」
- 【悲報】ヤフコメ民「中国が水産物を輸入禁止にするなら、日本国民向けに安く販売すればいい。中国依存から脱するべき」 [153736977]
- paypayで支払いするの便利すぎワロッタwwwwwwwwwwwwwww
