Regular Expression(正規表現) Part16

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2021/11/03(水) 19:50:01.71ID:ebAE+z9+
Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part15
https://mevius.5ch.net/test/read.cgi/tech/1568640311/


次スレは>>980宜しく
天ぷら等>>2以降
2022/12/30(金) 05:43:41.86ID:gQwuuolL
正規表現の高齢化問題
今の子って正規表現に触れる機会あんのかなあ
糞みたいなエスケープシーケンスの概念込みで教えなきゃならんし
授業ではすきっぷやな
2022/12/31(土) 09:31:33.47ID:3UMVip3o
>>585
ここが…
2022/12/31(土) 19:47:02.85ID:yp0KXAnH
字幕ファイルの修正で秀丸を使って
文字列の置き換えしたいと考えています

置換前
00:00:06:09 - 00:00:10:47
おはよう

00:00:11:18 - 00:00:16:02
こんにちは

置換後
00:00:06.090,00:00:10.470
おはよう

00:00:11.180,00:00:16.020
こんにちは

----

対象データ
”xx:xx:xx:xx - xx:xx:xx:xx”
":xx - "を".xx0,"に置き換え
最後の"xx"を"xx0"に置き換え

希望結果
”xx:xx:xx.xx0,xx:xx:xx.xx0”

お願い致します
2022/12/31(土) 21:20:45.11ID:gFIlpiwK
せっかく秀丸スレあるんだからそっちで聞けばいいのに

HmJre.dll V.510
^([0-9:]+):([0-9]{2}) - ([0-9:]+):([0-9]{2})$
\1.\20,\3.\40
593591
垢版 |
2022/12/31(土) 22:37:29.30ID:yp0KXAnH
大晦日のツンデレさんに圧倒的感謝!!
ありがとうございます
2023/01/04(水) 10:29:42.45ID:vMZ55Vj6
教えてくださいm(__)m

[あああ(いいい)]

のような文字列を

[いいい](あああ)

と置き換える方法はあるでしょうか
2023/01/04(水) 12:23:22.97ID:gCqYqHxa
[あああ(いいい)]で検索して
[いいい](あああ)で置換する
2023/01/04(水) 12:35:30.42ID:Gtp9NVd3
テンプレ無視する馬鹿にはその答で十分だわな
2023/01/04(水) 12:40:09.77ID:k64eH4zi
まあ一例として
s/\[([^\[\]\(\)]+)\(([^\[\]\(\)]+)\)\]/[$2]($1)/
2023/01/04(水) 13:41:53.53ID:sAqw0ZzI
>>594
https://glot.io/snippets/ggykutt927

import pegs

echo "[あああ(いいい)]".replacef(peg" '[' {@} '(' {@} ')' ']' ","[$2]($1)")

でいける
2023/01/04(水) 18:30:34.43ID:REieKqQf
文頭や文中にあるauだけをNGするやつ教えて下さい
2023/01/04(水) 18:46:40.14ID:Edm8Og2O
docomoはいいのか
2023/01/04(水) 18:57:17.14ID:zEB0n1jD
唐突に「NGする」って一体何の話だ???
2023/01/04(水) 18:58:30.08ID:zEB0n1jD
何かを想定しているなら質問に際して最初にそれを伝えるのが常識だろう
2023/01/06(金) 10:01:53.18ID:+4FzrtmN
>>598
ありがとうございました。
助かりました
2023/01/06(金) 10:09:25.96ID:+4FzrtmN
>>597
感謝です!
2023/01/07(土) 13:40:18.10ID:0HEuBgBZ
JaneStyle等の5ちゃん専ブラのNG設定用に、以下の条件を全て満たす書き方を教えてください。

・1行(改行文字無し)
・半角全角で70文字以上100文字
・文中に「、」または「。」を1文字以上含む
2023/01/07(土) 14:35:34.78ID:bXxrhZUn
>>605
それはここじゃなくて JaneStyleのスレで聞いた方がよくね?
2023/01/07(土) 17:50:57.40ID:IdmDw0D4
>>602
うるせーな死ねよハゲ
2023/01/07(土) 19:04:16.19ID:B7GL4Qwr
JaneStyleでの改行は\s<br>\sか?
実際の対象を見ないと分からないけどたとえばアンカーなんかも無いと分かってるなら
^(?=.*[、。])\s[^<]{70,100}\s$

特定の荒らしか何かを想定しているのかな
2023/01/07(土) 19:42:28.54ID:Zoa7JGj4
アンカータグは当然あるよ
5chならね
2023/01/13(金) 18:40:39.04ID:ZqEJpVNq
そういうことじゃないんじゃないか
2023/01/29(日) 18:48:08.66ID:cz1zZ3tj
>>605
そのままchatgpt で聞いてみたよ


以下の正規表現を使用することで、1行 (改行文字無し)、半角全角で70文字以上100文字、文中に「、」または「。」を1文字以上含む条件を全て満たす文字列を抽出することができます。

ruby
Copy code
^(?=.{70,100}$)(?=.*[、。]).*$
この正規表現は、文字列が70文字以上100文字以下であり、文中に「、」または「。」を1文字以上含むことを保証します。

だってさ
2023/01/29(日) 21:21:58.64ID:O+Wk/2Eo
近頃はみんな
2023/01/29(日) 22:30:48.24ID:9ooogxSi
薄くなったね
2023/01/30(月) 01:55:35.57ID:GlHcGD1J
体裁を整える能力はピカイチだが、それが正しいという保証はないからなあ
ちゃんと使うにはまずその分野の知識が必要というジレンマ
615デフォルトの名無しさん
垢版 |
2023/01/30(月) 17:50:26.15ID:gh9uKCuR
正規表現でガチャを回せる投稿サイトを作った話
https://zenn.dev/karugamo/articles/c1ce791689c5b7

https://www.regech.app/
2023/01/30(月) 21:13:06.03ID:TI/BqHZQ
(?!).+
2023/02/02(木) 00:14:23.96ID:fPL322j9
顔文字に見える正規表現を考えたい

(;*~_~*)
2023/02/04(土) 22:54:12.69ID:DlLJLfae
2023-02-04という書式の日付のデータがある時
その行で最初に出てきた-を年にしたい
正規表現でなんて書けばいいですか?
2023/02/04(土) 22:57:04.23ID:DlLJLfae
検索欄に(^.*?)(-)
置換欄に\1年
2023/02/05(日) 10:48:30.98ID:KWvYGjBb
-(.*) → 年$1
621デフォルトの名無しさん
垢版 |
2023/02/11(土) 16:20:49.02ID:fAcJ3wf1
●Regular Expressionの使用環境
WindowsのJScript
●検索か置換か?
検索
●説明
下記のような文字列があった場合、
[なんとか]から次の[なんとか]が出てくるまでの複数行を取り出したいんだけど、どうする?
自分はコレしか思いつかなかったんだけ
str.match(/^\[.*\][^\[]*/mg);
もっといい方法ある?

●対象データ(これってAviUtlのexoファイルです。
[424.0]
_name=音声ファイル
再生位置=0.00
再生速度=100.0
ループ再生=0
動画ファイルと連携=1
file=D:\PlayMemories\2023-02-09\C0002.MP4

[424.1]
_name=音量フェード
イン=0.00
アウト=3.00

[424.2]
_name=標準再生
音量=50.0
左右=0.0
2023/02/11(土) 17:02:21.81ID:yc790R16
^\[[^[]*\n(?=\n)
2023/02/11(土) 17:47:19.77ID:4bXfwNL9
str.split('\n\n')
2023/02/11(土) 18:25:52.14ID:G+Atp5X9
空行区切りとは限らない場合、ファイル名に[があるかもしれない場合
str.match(/^\[.*(?:\n(?!\[).*)*\n*/gm)
625デフォルトの名無しさん
垢版 |
2023/02/12(日) 00:39:26.16ID:mse6QHvr
>>622-624
できました。すごい。
2023/02/12(日) 12:08:20.65ID:2oU17ty6
[424.0] は、つまり、

行頭が[ で、行末が] の場合だけを、特別な命令と解釈するのだろ
2023/02/12(日) 12:34:59.28ID:PBDCQhni
こういうの非包含が使えたらすごい楽
^\[(?~^\[)
628デフォルトの名無しさん
垢版 |
2023/02/12(日) 23:00:31.59ID:mse6QHvr
>>627
正規表現て複雑な入れ子とかの抜き出しもできることは知ってるけど、
その辺の解説書とかページてないのかね。
2023/02/14(火) 23:50:28.21ID:dTCCMwFb
JavaScriptの正規表現で質問です
ある正規表現に合致し、ある正規表現に合致しない、という正規表現は可能でしょうか?
具体的には
任意数は0も含むものとして
任意数の大文字アルファベットのあとに、任意数の小文字アルファベットが続き、その後任意数の数字が続く文字列のうち
小文字のみ、数字のみの文字列を除外したいです(大文字のみのものは合致させたい)

合致例
ABab01
AAA0
aaa012
ABCDE

合致させたくない例
abcde
012345
000aaa
2023/02/14(火) 23:57:34.39ID:XRqDNj0i
宿題ですか?
2023/02/15(水) 00:01:55.99ID:GMMfGDKP
宿題かどうかで正規表現の書き方は変わりませんよね?
2023/02/15(水) 00:52:40.53ID:F/CuEgLN
できるけど全部正規表現でやらないほうがメンテしやすいぞ
2023/02/15(水) 00:54:24.40ID:GMMfGDKP
つまりif文で区切るほうが見やすいということですか?
2023/02/15(水) 08:47:44.60ID:p2xlcd9z
([A-Z]+)?[a-z]+[0-9]+|[A-Z]+([0-9]+)?
2023/02/15(水) 10:37:15.75ID:5uY2Ajym
>>634
ありがとうございます
素直に足し算の発想でやればよかったんですね
2023/02/15(水) 12:54:55.60ID:q8BaXLdM
ABab
637デフォルトの名無しさん
垢版 |
2023/02/15(水) 14:01:59.87ID:N6Rs6EpM
([A-Z]+)?[a-z]+[0-9]+|[A-Z]+([a-z]+)?([0-9]+)?
ですかね
2023/02/15(水) 14:05:43.89ID:VU7epY9U
[A-Z]+[a-z]*[0-9]*|[a-z]+[0-9]+
2023/02/15(水) 14:13:41.85ID:6puQI1n1
NG例に000aaaがあるということは
000aaaAA
とかもあるわけだよね
そしてこれは順序が違うからマッチさせたダメってことか?
2023/02/15(水) 14:30:32.69ID:u5Kc1xOf
^(?!$|[a-z]+$|[0-9]+$)[A-Z]*[a-z]*[0-9]*$
2023/02/16(木) 22:56:05.33ID:Tpu7Mxzn
正規表現で*ではなく0文字以上n文字以下って指定の仕方どうやるんだっけ
*はセキュリティホールになるから使うなみたいなのをどこかで見たので
2023/02/16(木) 23:01:53.04ID:Tpu7Mxzn
スマンぐぐったらすぐ出てきたわ
ReDoS攻撃というやつだな
正規表現が標準で使える言語でパターンマッチのタイムアウト設定できるやつってあんのかな
2023/02/22(水) 02:52:40.50ID:Lq+l8VAY
勉強になった
644デフォルトの名無しさん
垢版 |
2023/02/28(火) 19:25:23.88ID:LpLAZFFY
●Regular Expressionの使用環境
秀丸エディタ

●検索か置換か?
置換

●説明
正規表現で加減算したいです
perlの場合これでできるそうです
検索:columnIndex([\d]+)
置換:columnIndex@{[$1+1]}

●対象データ
columnIndex001 = "aaa";
columnIndex002 = "bbb";
columnIndex003 = "ccc";

●希望する結果
columnIndex002 = "aaa";
columnIndex003 = "bbb";
columnIndex004 = "ccc";
2023/02/28(火) 21:40:28.89ID:k7F1eRIt
perlの置換の式はただのスクリプトとしての演算だからなあ
無理なんじゃね
2023/02/28(火) 21:52:42.51ID:3RvLxpuD
俺だったらエクセルに貼って分解して計算して足し込んでcsvに出力する
2023/02/28(火) 22:16:00.68ID:HPZ5xkxF
秀丸にも専用のスクリプト言語的なのなかったっけ?
それ使えばワンチャンあるが素直に汎用のスクリプト言語使った方が楽かも
2023/02/28(火) 22:25:04.50ID:LpLAZFFY
そうかありがとう
B2&TEXT(C2+1,"000")&D2な感じでエクセルに計算させます
2023/03/05(日) 15:30:49.38ID:kbQORjCn
chmateの名前欄ng正規表現について
ここの正規表現は拡張正規表現だよね?
ワッチョイ消しあぼーんは(?<!\))$だけど、この中の\って何?
それと\(ス[プ|ッ]+ Sd(5f|bf)の中の\って何?

正規表現なら\は直後のメタ文字打ち消しだけど拡張正規表現においては何を意味するの?
2023/03/05(日) 16:48:59.22ID:zxnSBXGX
メタ文字消し
|のことならor
2023/03/05(日) 17:13:11.22ID:/VGFBid9
今まさに書き込もうとしてた。ググったらchmateのNG表記も標準正規表現なんだな
俺が何で拡張正規表現かと勘違いしたかというと、|は標準正規表現では使えないからLinuxなら-Eをオプションに付けて拡張正規表現にする必要があると習ったから
chmateでは|が使えるけどメタ文字打ち消しのバックスラッシュも使うというのはどういう事なの?
652デフォルトの名無しさん
垢版 |
2023/03/05(日) 22:34:50.68ID:jasgpIrF
>>642
rubyの3.2は出来ます。

https://www.ruby-lang.org/ja/news/2022/12/25/ruby-3-2-0-released/
Regexpのタイムアウトの導入
653デフォルトの名無しさん
垢版 |
2023/03/25(土) 11:22:38.54ID:YDfCdrWh
/~/という書き方のとき以外でスラッシュ/を\エスケープする必要があるケースはありますか?
654デフォルトの名無しさん
垢版 |
2023/04/17(月) 19:32:17.83ID:5c7uVWzN
「0」と「1」からなる文字列のうち、「0」と「1」を同数含む文字列にマッチする
正規表現は存在しません。

正規表現よりも強力な検索方法で↑の文字列にもマッチさせることができるようなソフトは
存在しますか?
2023/04/17(月) 19:44:56.00ID:sl+3Awil
python
2023/04/17(月) 20:33:36.29ID:waI8rtvz
つらい
2023/04/17(月) 21:06:25.43ID:z5E2eHg0
https://regex101.com/r/abzBX8/1
2023/04/17(月) 21:29:53.48ID:W4QVtvW8
JavaScriptで書くかな
2023/04/17(月) 23:02:23.02ID:HlIFmrYC
正規表現よりも「強力な」検索方法ってどう言う事?
それチェックするだけならBASICだって出来るだろうに
2023/04/17(月) 23:14:49.47ID:aBS+jUDM
あのさあ
>>657を見た後でそんなこと言ってるの?
>>657の末尾に$をつけりゃチェックできるだろうに
2023/04/18(火) 00:49:04.02ID:HEwUJcz7
https://regex101.com/r/abzBX8/4
662デフォルトの名無しさん
垢版 |
2023/04/18(火) 01:55:03.99ID:0xKKyM+T
wwなんじゃこの無意味なやつww
663デフォルトの名無しさん
垢版 |
2023/04/18(火) 01:55:30.29ID:0xKKyM+T
全くチェックできてないやんwww
2023/04/18(火) 03:16:09.61ID:+QStg837
正規表現だけで頑張りすぎる奴はアホ
665デフォルトの名無しさん
垢版 |
2023/04/18(火) 10:37:46.66ID:1M+dv0CB
> 「0」と「1」を同数含む文字列にマッチする
これが部分文字列も含むのなら最初の「0111011110001100000…」のところだけでも
で01, 10とか01111000, 111000, 1100, 0011とか011101111000110000とか
他にもあるけどまあ沢山あるわな

こんなんチェックして何の意味があるのか知らんけど
2023/04/18(火) 11:53:15.97ID:mLPBXdJt
>>661のは01以外の文字が存在してるのを失念してるので、少しだけ修正
^([^01]|0[^01]*?(?1)*?1|1[^01]*?(?1)*?0)++$
2023/04/18(火) 11:55:59.03ID:mLPBXdJt
あ、すまん
>「0」と「1」からなる文字列のうち
を忘れてた
2023/04/18(火) 12:04:05.08ID:mLPBXdJt
おまけに>>666は冗長だったしね
^([^01]|0(?1)*?1|1(?1)*?0)++$
669デフォルトの名無しさん
垢版 |
2023/04/18(火) 12:07:01.90ID:y8YzUN5p
なぜある範囲の文字列を認識できる正規表現が重用されるのでしょうか?

たとえば、文脈自由文法により生成される文字列を認識できるような検索ソフトは
ないのでしょうか?
2023/04/18(火) 12:19:50.17ID:VZPIsbzr
何故妙な所でわざわざ改行を入れるのでしょうか?
2023/04/19(水) 15:37:27.88ID:DhCp7Dkf
たとえばHTMLの<title>の直後だけ判定したいときに
マッチしなかったら長いページの最後まで<title>~を探し続けるの無駄だと思うんだけど
<title>のところだけ見終わったら判定打ち切ることってできる?
2023/04/19(水) 17:20:57.30ID:WqdbOhNP
https://regex101.com/r/xvZeom/1
2023/04/19(水) 18:18:09.16ID:DhCp7Dkf
>>672
ありがとう!
2023/04/19(水) 22:28:52.49ID:ndERcjBg
>>669
計算量が小さいことが数学的に証明されているから
文脈自由文法は計算量が大きい
675デフォルトの名無しさん
垢版 |
2023/05/10(水) 15:31:44.13ID:7WScgW4R
下記の文字列でナンバリングの重複を除去するにはどうすればいいですか?

かまいたちの知らんけど #37 #37 「梅沢富美男とドライブ旅!やりたいこと詰め込んだら喜ぶ、知らんけど」 [GAORA] 2023年05月10日.ts
千鳥の相席食堂 #199 #199 藤岡弘、&藤岡真威人の旅! ’田舎出身&ロケマスター芸人’の千鳥がツッ [スカイA] 2023年05月08日.ts

ナンバリングが同一かどうかを考慮しなければ下記で可能かなと思うのですが、

(#[0-9]{1,})[\S\s]*(#[0-9]{1,})

ナンバリングが同一である場合に除去するってことは可能なのでしょうか?

※「正規表現は、.NET Framework で提供される正規表現の全ての機能が使えます」ってヘルプにあります
676デフォルトの名無しさん
垢版 |
2023/05/10(水) 15:43:18.27ID:7WScgW4R
[\S\s]* は 改行を考慮してみただけで何でもよかったので、無視してください。
2023/05/10(水) 15:49:49.18ID:XkmajJ+H
s/(#\d+ )\1/$1/
2023/05/10(水) 15:56:15.66ID:yXmZBCRQ
#37 #371
2023/05/10(水) 16:24:45.76ID:XkmajJ+H
>>678
なんか問題ある?

まあ例は基本形であって\1というものがあるということを教えればいいだけだけどね
2023/05/10(水) 16:34:36.66ID:KWVZdtYA
誤爆しないかチェックしたかったんでしょ
そんな噛み付か無くても良かろうよ
681デフォルトの名無しさん
垢版 |
2023/05/10(水) 16:44:00.86ID:7WScgW4R
>>677
これでいけそうです、ありがとうございます

\1 の働きが 何か分からないんですが、何て言葉で検索すればいいですか?
682デフォルトの名無しさん
垢版 |
2023/05/10(水) 16:52:01.37ID:7WScgW4R
あ、キャプションってやつですかね。
こうなか?

s/(.*)(#\d+ )\2(.*)/$1 $2 $3/
683デフォルトの名無しさん
垢版 |
2023/05/10(水) 16:52:49.70ID:7WScgW4R
こうかな
2023/05/10(水) 16:57:22.57ID:XkmajJ+H
前後を不定長にするとバックトラックの量が半端じゃなくなるよ
数千倍数万倍それ以上の場合数にあっという間になるので
どれほど爆発的に増えるか考えてみてくれ
685デフォルトの名無しさん
垢版 |
2023/05/10(水) 17:23:53.71ID:H/PxYykp
正規表現はChatGPTと相性いいなぁ
すげー間違ったことも返されるけど検証もさせられるしやテストケースも生成出来て超便利
2023/05/10(水) 18:11:00.72ID:XkmajJ+H
>>682
悪い
試したらstep数は全然増えなかったね
俺の勘違いか
2023/05/18(木) 00:59:59.60ID:GLOCdhwM
ハゲとフサの混在からハゲを排除したい
2023/05/18(木) 09:45:41.67ID:HWVU1A6n
replace(/ハゲ/g, 'ヅラ')
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況