Regular Expression(正規表現) Part16

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2021/11/03(水) 19:50:01.71ID:ebAE+z9+
Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part15
https://mevius.5ch.net/test/read.cgi/tech/1568640311/


次スレは>>980宜しく
天ぷら等>>2以降
2023/01/29(日) 21:21:58.64ID:O+Wk/2Eo
近頃はみんな
2023/01/29(日) 22:30:48.24ID:9ooogxSi
薄くなったね
2023/01/30(月) 01:55:35.57ID:GlHcGD1J
体裁を整える能力はピカイチだが、それが正しいという保証はないからなあ
ちゃんと使うにはまずその分野の知識が必要というジレンマ
615デフォルトの名無しさん
垢版 |
2023/01/30(月) 17:50:26.15ID:gh9uKCuR
正規表現でガチャを回せる投稿サイトを作った話
https://zenn.dev/karugamo/articles/c1ce791689c5b7

https://www.regech.app/
2023/01/30(月) 21:13:06.03ID:TI/BqHZQ
(?!).+
2023/02/02(木) 00:14:23.96ID:fPL322j9
顔文字に見える正規表現を考えたい

(;*~_~*)
2023/02/04(土) 22:54:12.69ID:DlLJLfae
2023-02-04という書式の日付のデータがある時
その行で最初に出てきた-を年にしたい
正規表現でなんて書けばいいですか?
2023/02/04(土) 22:57:04.23ID:DlLJLfae
検索欄に(^.*?)(-)
置換欄に\1年
2023/02/05(日) 10:48:30.98ID:KWvYGjBb
-(.*) → 年$1
621デフォルトの名無しさん
垢版 |
2023/02/11(土) 16:20:49.02ID:fAcJ3wf1
●Regular Expressionの使用環境
WindowsのJScript
●検索か置換か?
検索
●説明
下記のような文字列があった場合、
[なんとか]から次の[なんとか]が出てくるまでの複数行を取り出したいんだけど、どうする?
自分はコレしか思いつかなかったんだけ
str.match(/^\[.*\][^\[]*/mg);
もっといい方法ある?

●対象データ(これってAviUtlのexoファイルです。
[424.0]
_name=音声ファイル
再生位置=0.00
再生速度=100.0
ループ再生=0
動画ファイルと連携=1
file=D:\PlayMemories\2023-02-09\C0002.MP4

[424.1]
_name=音量フェード
イン=0.00
アウト=3.00

[424.2]
_name=標準再生
音量=50.0
左右=0.0
2023/02/11(土) 17:02:21.81ID:yc790R16
^\[[^[]*\n(?=\n)
2023/02/11(土) 17:47:19.77ID:4bXfwNL9
str.split('\n\n')
2023/02/11(土) 18:25:52.14ID:G+Atp5X9
空行区切りとは限らない場合、ファイル名に[があるかもしれない場合
str.match(/^\[.*(?:\n(?!\[).*)*\n*/gm)
625デフォルトの名無しさん
垢版 |
2023/02/12(日) 00:39:26.16ID:mse6QHvr
>>622-624
できました。すごい。
2023/02/12(日) 12:08:20.65ID:2oU17ty6
[424.0] は、つまり、

行頭が[ で、行末が] の場合だけを、特別な命令と解釈するのだろ
2023/02/12(日) 12:34:59.28ID:PBDCQhni
こういうの非包含が使えたらすごい楽
^\[(?~^\[)
628デフォルトの名無しさん
垢版 |
2023/02/12(日) 23:00:31.59ID:mse6QHvr
>>627
正規表現て複雑な入れ子とかの抜き出しもできることは知ってるけど、
その辺の解説書とかページてないのかね。
2023/02/14(火) 23:50:28.21ID:dTCCMwFb
JavaScriptの正規表現で質問です
ある正規表現に合致し、ある正規表現に合致しない、という正規表現は可能でしょうか?
具体的には
任意数は0も含むものとして
任意数の大文字アルファベットのあとに、任意数の小文字アルファベットが続き、その後任意数の数字が続く文字列のうち
小文字のみ、数字のみの文字列を除外したいです(大文字のみのものは合致させたい)

合致例
ABab01
AAA0
aaa012
ABCDE

合致させたくない例
abcde
012345
000aaa
2023/02/14(火) 23:57:34.39ID:XRqDNj0i
宿題ですか?
2023/02/15(水) 00:01:55.99ID:GMMfGDKP
宿題かどうかで正規表現の書き方は変わりませんよね?
2023/02/15(水) 00:52:40.53ID:F/CuEgLN
できるけど全部正規表現でやらないほうがメンテしやすいぞ
2023/02/15(水) 00:54:24.40ID:GMMfGDKP
つまりif文で区切るほうが見やすいということですか?
2023/02/15(水) 08:47:44.60ID:p2xlcd9z
([A-Z]+)?[a-z]+[0-9]+|[A-Z]+([0-9]+)?
2023/02/15(水) 10:37:15.75ID:5uY2Ajym
>>634
ありがとうございます
素直に足し算の発想でやればよかったんですね
2023/02/15(水) 12:54:55.60ID:q8BaXLdM
ABab
637デフォルトの名無しさん
垢版 |
2023/02/15(水) 14:01:59.87ID:N6Rs6EpM
([A-Z]+)?[a-z]+[0-9]+|[A-Z]+([a-z]+)?([0-9]+)?
ですかね
2023/02/15(水) 14:05:43.89ID:VU7epY9U
[A-Z]+[a-z]*[0-9]*|[a-z]+[0-9]+
2023/02/15(水) 14:13:41.85ID:6puQI1n1
NG例に000aaaがあるということは
000aaaAA
とかもあるわけだよね
そしてこれは順序が違うからマッチさせたダメってことか?
2023/02/15(水) 14:30:32.69ID:u5Kc1xOf
^(?!$|[a-z]+$|[0-9]+$)[A-Z]*[a-z]*[0-9]*$
2023/02/16(木) 22:56:05.33ID:Tpu7Mxzn
正規表現で*ではなく0文字以上n文字以下って指定の仕方どうやるんだっけ
*はセキュリティホールになるから使うなみたいなのをどこかで見たので
2023/02/16(木) 23:01:53.04ID:Tpu7Mxzn
スマンぐぐったらすぐ出てきたわ
ReDoS攻撃というやつだな
正規表現が標準で使える言語でパターンマッチのタイムアウト設定できるやつってあんのかな
2023/02/22(水) 02:52:40.50ID:Lq+l8VAY
勉強になった
644デフォルトの名無しさん
垢版 |
2023/02/28(火) 19:25:23.88ID:LpLAZFFY
●Regular Expressionの使用環境
秀丸エディタ

●検索か置換か?
置換

●説明
正規表現で加減算したいです
perlの場合これでできるそうです
検索:columnIndex([\d]+)
置換:columnIndex@{[$1+1]}

●対象データ
columnIndex001 = "aaa";
columnIndex002 = "bbb";
columnIndex003 = "ccc";

●希望する結果
columnIndex002 = "aaa";
columnIndex003 = "bbb";
columnIndex004 = "ccc";
2023/02/28(火) 21:40:28.89ID:k7F1eRIt
perlの置換の式はただのスクリプトとしての演算だからなあ
無理なんじゃね
2023/02/28(火) 21:52:42.51ID:3RvLxpuD
俺だったらエクセルに貼って分解して計算して足し込んでcsvに出力する
2023/02/28(火) 22:16:00.68ID:HPZ5xkxF
秀丸にも専用のスクリプト言語的なのなかったっけ?
それ使えばワンチャンあるが素直に汎用のスクリプト言語使った方が楽かも
2023/02/28(火) 22:25:04.50ID:LpLAZFFY
そうかありがとう
B2&TEXT(C2+1,"000")&D2な感じでエクセルに計算させます
2023/03/05(日) 15:30:49.38ID:kbQORjCn
chmateの名前欄ng正規表現について
ここの正規表現は拡張正規表現だよね?
ワッチョイ消しあぼーんは(?<!\))$だけど、この中の\って何?
それと\(ス[プ|ッ]+ Sd(5f|bf)の中の\って何?

正規表現なら\は直後のメタ文字打ち消しだけど拡張正規表現においては何を意味するの?
2023/03/05(日) 16:48:59.22ID:zxnSBXGX
メタ文字消し
|のことならor
2023/03/05(日) 17:13:11.22ID:/VGFBid9
今まさに書き込もうとしてた。ググったらchmateのNG表記も標準正規表現なんだな
俺が何で拡張正規表現かと勘違いしたかというと、|は標準正規表現では使えないからLinuxなら-Eをオプションに付けて拡張正規表現にする必要があると習ったから
chmateでは|が使えるけどメタ文字打ち消しのバックスラッシュも使うというのはどういう事なの?
652デフォルトの名無しさん
垢版 |
2023/03/05(日) 22:34:50.68ID:jasgpIrF
>>642
rubyの3.2は出来ます。

https://www.ruby-lang.org/ja/news/2022/12/25/ruby-3-2-0-released/
Regexpのタイムアウトの導入
653デフォルトの名無しさん
垢版 |
2023/03/25(土) 11:22:38.54ID:YDfCdrWh
/~/という書き方のとき以外でスラッシュ/を\エスケープする必要があるケースはありますか?
654デフォルトの名無しさん
垢版 |
2023/04/17(月) 19:32:17.83ID:5c7uVWzN
「0」と「1」からなる文字列のうち、「0」と「1」を同数含む文字列にマッチする
正規表現は存在しません。

正規表現よりも強力な検索方法で↑の文字列にもマッチさせることができるようなソフトは
存在しますか?
2023/04/17(月) 19:44:56.00ID:sl+3Awil
python
2023/04/17(月) 20:33:36.29ID:waI8rtvz
つらい
2023/04/17(月) 21:06:25.43ID:z5E2eHg0
https://regex101.com/r/abzBX8/1
2023/04/17(月) 21:29:53.48ID:W4QVtvW8
JavaScriptで書くかな
2023/04/17(月) 23:02:23.02ID:HlIFmrYC
正規表現よりも「強力な」検索方法ってどう言う事?
それチェックするだけならBASICだって出来るだろうに
2023/04/17(月) 23:14:49.47ID:aBS+jUDM
あのさあ
>>657を見た後でそんなこと言ってるの?
>>657の末尾に$をつけりゃチェックできるだろうに
2023/04/18(火) 00:49:04.02ID:HEwUJcz7
https://regex101.com/r/abzBX8/4
662デフォルトの名無しさん
垢版 |
2023/04/18(火) 01:55:03.99ID:0xKKyM+T
wwなんじゃこの無意味なやつww
663デフォルトの名無しさん
垢版 |
2023/04/18(火) 01:55:30.29ID:0xKKyM+T
全くチェックできてないやんwww
2023/04/18(火) 03:16:09.61ID:+QStg837
正規表現だけで頑張りすぎる奴はアホ
665デフォルトの名無しさん
垢版 |
2023/04/18(火) 10:37:46.66ID:1M+dv0CB
> 「0」と「1」を同数含む文字列にマッチする
これが部分文字列も含むのなら最初の「0111011110001100000…」のところだけでも
で01, 10とか01111000, 111000, 1100, 0011とか011101111000110000とか
他にもあるけどまあ沢山あるわな

こんなんチェックして何の意味があるのか知らんけど
2023/04/18(火) 11:53:15.97ID:mLPBXdJt
>>661のは01以外の文字が存在してるのを失念してるので、少しだけ修正
^([^01]|0[^01]*?(?1)*?1|1[^01]*?(?1)*?0)++$
2023/04/18(火) 11:55:59.03ID:mLPBXdJt
あ、すまん
>「0」と「1」からなる文字列のうち
を忘れてた
2023/04/18(火) 12:04:05.08ID:mLPBXdJt
おまけに>>666は冗長だったしね
^([^01]|0(?1)*?1|1(?1)*?0)++$
669デフォルトの名無しさん
垢版 |
2023/04/18(火) 12:07:01.90ID:y8YzUN5p
なぜある範囲の文字列を認識できる正規表現が重用されるのでしょうか?

たとえば、文脈自由文法により生成される文字列を認識できるような検索ソフトは
ないのでしょうか?
2023/04/18(火) 12:19:50.17ID:VZPIsbzr
何故妙な所でわざわざ改行を入れるのでしょうか?
2023/04/19(水) 15:37:27.88ID:DhCp7Dkf
たとえばHTMLの<title>の直後だけ判定したいときに
マッチしなかったら長いページの最後まで<title>~を探し続けるの無駄だと思うんだけど
<title>のところだけ見終わったら判定打ち切ることってできる?
2023/04/19(水) 17:20:57.30ID:WqdbOhNP
https://regex101.com/r/xvZeom/1
2023/04/19(水) 18:18:09.16ID:DhCp7Dkf
>>672
ありがとう!
2023/04/19(水) 22:28:52.49ID:ndERcjBg
>>669
計算量が小さいことが数学的に証明されているから
文脈自由文法は計算量が大きい
675デフォルトの名無しさん
垢版 |
2023/05/10(水) 15:31:44.13ID:7WScgW4R
下記の文字列でナンバリングの重複を除去するにはどうすればいいですか?

かまいたちの知らんけど #37 #37 「梅沢富美男とドライブ旅!やりたいこと詰め込んだら喜ぶ、知らんけど」 [GAORA] 2023年05月10日.ts
千鳥の相席食堂 #199 #199 藤岡弘、&藤岡真威人の旅! ’田舎出身&ロケマスター芸人’の千鳥がツッ [スカイA] 2023年05月08日.ts

ナンバリングが同一かどうかを考慮しなければ下記で可能かなと思うのですが、

(#[0-9]{1,})[\S\s]*(#[0-9]{1,})

ナンバリングが同一である場合に除去するってことは可能なのでしょうか?

※「正規表現は、.NET Framework で提供される正規表現の全ての機能が使えます」ってヘルプにあります
676デフォルトの名無しさん
垢版 |
2023/05/10(水) 15:43:18.27ID:7WScgW4R
[\S\s]* は 改行を考慮してみただけで何でもよかったので、無視してください。
2023/05/10(水) 15:49:49.18ID:XkmajJ+H
s/(#\d+ )\1/$1/
2023/05/10(水) 15:56:15.66ID:yXmZBCRQ
#37 #371
2023/05/10(水) 16:24:45.76ID:XkmajJ+H
>>678
なんか問題ある?

まあ例は基本形であって\1というものがあるということを教えればいいだけだけどね
2023/05/10(水) 16:34:36.66ID:KWVZdtYA
誤爆しないかチェックしたかったんでしょ
そんな噛み付か無くても良かろうよ
681デフォルトの名無しさん
垢版 |
2023/05/10(水) 16:44:00.86ID:7WScgW4R
>>677
これでいけそうです、ありがとうございます

\1 の働きが 何か分からないんですが、何て言葉で検索すればいいですか?
682デフォルトの名無しさん
垢版 |
2023/05/10(水) 16:52:01.37ID:7WScgW4R
あ、キャプションってやつですかね。
こうなか?

s/(.*)(#\d+ )\2(.*)/$1 $2 $3/
683デフォルトの名無しさん
垢版 |
2023/05/10(水) 16:52:49.70ID:7WScgW4R
こうかな
2023/05/10(水) 16:57:22.57ID:XkmajJ+H
前後を不定長にするとバックトラックの量が半端じゃなくなるよ
数千倍数万倍それ以上の場合数にあっという間になるので
どれほど爆発的に増えるか考えてみてくれ
685デフォルトの名無しさん
垢版 |
2023/05/10(水) 17:23:53.71ID:H/PxYykp
正規表現はChatGPTと相性いいなぁ
すげー間違ったことも返されるけど検証もさせられるしやテストケースも生成出来て超便利
2023/05/10(水) 18:11:00.72ID:XkmajJ+H
>>682
悪い
試したらstep数は全然増えなかったね
俺の勘違いか
2023/05/18(木) 00:59:59.60ID:GLOCdhwM
ハゲとフサの混在からハゲを排除したい
2023/05/18(木) 09:45:41.67ID:HWVU1A6n
replace(/ハゲ/g, 'ヅラ')
2023/05/21(日) 18:08:25.80ID:T9C8dxe0
\Kってどうゆうときに使うんですかね?
2023/05/22(月) 23:09:40.07ID:lUHZhpO8
安心して下さい\Kはいてますよ
$& = はいてますよ
2023/05/23(火) 15:16:49.72ID:5w9lz5Mr
そちらにはいてますか
2023/05/27(土) 21:08:35.92ID:HxAuQBVD
特定の文字列が2回以上なければ削除したい
$aa=~s/hoge// if $aa!~/.+hoge.+hoge.+/;
正規表現一発で出来ませんか
2023/05/27(土) 22:49:21.84ID:Jh5M5XKC
s/\A(?![\s\S]*(砂沙美魔法少女クラブ)[\s\S]*\1)([\s\S]*)\1([\s\S]*)\z/$2$3/
2023/05/28(日) 06:07:20.35ID:exFpSO/0
s/(hoge.*hoge)|hoge/$1/
s/hoge.*hoge\K|hoge//
s/hoge.*hoge(*SKIP)(*FAIL)|hoge//

s/(hoge)(.*\1\K)?//
https://regex101.com/r/qoyDnZ/1
2023/05/28(日) 10:23:23.66ID:fg1fsMga
s/みさおちゃん(?:.*みさおちゃん(*COMMIT))?//
2023/05/28(日) 12:43:42.23ID:yjwdVP6E
説明不足でした
$aa=~s/.+hoge.+\n// if $aa!~/hoge.+hoge/s;

これなぜにかダメです
$aa=~s/(hoge.+hoge)|[^\n]+hoge[^\n]+\n/$1/s;
2023/05/28(日) 14:47:06.90ID:6Y81pqVN
ダメなのは左のhogeより先に右の[^\n]+hogeがマッチを始めるから
左が先になるように右に合わせる
2023/05/28(日) 15:02:19.22ID:yjwdVP6E
初歩的でしたね、ありがとうございます
2023/05/31(水) 00:20:37.60ID:Dm7F+2f1
「-」の無い電話番号に「-」を入れるには?
2023/05/31(水) 07:23:21.12ID:X455hjkS
国際電話とかあると面戸だね
2023/05/31(水) 08:55:50.76ID:t6+qFJ/7
>>700
携帯番号以外は不可能じゃないかな
2023/05/31(水) 18:03:07.79ID:wXMZ1Y1H
区切り位置が変わるから全部羅列するしかないね
それも時々更新する必要がある
2023/06/02(金) 21:23:49.13ID:XcfIYH3W
>>701
誰か頑張れ
https://www.soumu.go.jp/main_sosiki/joho_tsusin/top/tel_number/q_and_a-2000apr.html
2023/06/03(土) 16:20:02.62ID:p6l+hu28
固定電話
https://regex101.com/r/f9rw3E/1
2023/06/03(土) 22:05:33.82ID:vWJZBL5V
愛は行動。言葉だけではダメ
2023/06/04(日) 00:25:20.56ID:FmV4cjgS
もう冷めました
2023/06/16(金) 20:08:06.56ID:BLiKvBT9
Perl v5.38.0-RC1
2023/06/18(日) 00:06:22.30ID:7IbgNtYk
NTTと早大、誤った正規表現の文字列抽出を自動で修正する技術を発表
japan.zdnet.com/article/35205348/

perl-5.38.0-RC1 perlre.pod
metacpan.org/release/RJBS/perl-5.38.0-RC1/view/pod/perlre.pod

(鬼車) 不在機能群の入れ子 の動作テスト集
github.com/tonco-miyazawa/regex_etc/blob/master/MEMO_onig/abcent/nesting.txt
2023/06/18(日) 14:54:23.24ID:PO9vLDeK
>>708
これは色んな意味でおかしい。まず、画像で例示しているURLだがドメインレベルに ? は
使用できない(エラーになる)。正規表現自身もURLということをチェックしていない。最低限、
スキームが https? で始まり、ID=文字列(アルファベット限定)を含む書式の、文字列のみを
抽出するコードを(ここに直接書くとエラーを食らっているので)貼っておく。

https://pastebin.com/V1DVjsQd
2023/06/18(日) 15:04:09.09ID:PO9vLDeK
訂正。>709で貼ったコードは正しく動作するががコメントに(ここに貼った際に試行錯誤した
せいで) ? が抜けていた。趣旨は同じものなので、↓を参照して下さい。

https://pastebin.com/RQ5uj62f
2023/06/18(日) 15:53:25.97ID:uv5oAAX5
>>709
URLの「正しい」ってなんですか

https://en.wikipedia.org/wiki/URL#Syntax
https://datatracker.ietf.org/doc/html/rfc3986#appendix-A
2023/06/18(日) 16:12:09.00ID:uv5oAAX5
「正規表現を用いた文字列抽出の例」図は「誤った正規表現」の例なんじゃないかなあ
例の正規表現では ~.com?fakeID=DEF にもマッチしてしまう
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況