Regular Expression(正規表現) Part16

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2021/11/03(水) 19:50:01.71ID:ebAE+z9+
Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part15
https://mevius.5ch.net/test/read.cgi/tech/1568640311/


次スレは>>980宜しく
天ぷら等>>2以降
2022/09/04(日) 09:08:03.10ID:MIQciAoV
>>503
それだと92000の200にもマッチしてしまうよ
インド数字等を気にしないなら[0-9]は[\d]でもOK

(?<![0-9])(?:200|[1][0-9]{2}|[1-9][0-9]|[0-9])(?![0-9])
505デフォルトの名無しさん
垢版 |
2022/09/04(日) 09:46:10.78ID:ZQZ632xa
>>503
[0-9]{1,3}
これだと結果でるようだけどそのサイトm値省略不可なのでは
他に | のorも説明ないようなのでダメとか

正規表現文法どこまで対応してるかは動かす環境次第なので質問テンプレートにも入力項目になってんだけど
>>1
2022/09/04(日) 10:07:01.01ID:qlj2b1lm
すまない

●Regular Expressionの使用環境
iPhone,a-shellというアプリ

●検索か置換か?
検索

●説明
フォルダ内にある写真を圧縮するため

●対象データ
1から200などのjpegとかの画像
●希望する結果
検索してそれをまとめて圧縮
2022/09/04(日) 10:19:49.12ID:NNtN3+VI
まあ案件次第だけど
> 200までの数字だとどうしたらいいですか?
とかなら\d+で取得してアプリケーション側で弾くのが後の保守を含めて簡単かと思う
2022/09/13(火) 19:48:53.80ID:aae9uQ50
スルーされにくい質問のテンプレと例

●Regular Expressionの使用環境
PowerShell7.2

●検索か置換か?
置換

●説明
文中(先頭及び文末以外)の0が連続して3つ以上並ぶ部分をハイフン(-)に置換したい

●対象データ
123000444
000123000
1230000000444

●希望する結果
123-444
000123000
123-444

よろしくお願いいたします。
2022/09/13(火) 20:02:34.86ID:BFM47HY2
(?<!^)000+(?!$)
-
2022/09/13(火) 20:23:28.22ID:el3nukes
00000 → 0-0 ?
2022/09/13(火) 20:37:38.14ID:G28B9gdh
ああ、
00001200030000

0-12-3-0
とするのか (>>509のやつ)
先頭末尾に繋がっている0は無視したい
000012-30000
のか例からだと不明だね
2022/09/13(火) 21:45:26.67ID:aae9uQ50
508です。
早くもいろいろご回答いただきありがとうございます。
そしてすみません、みなさまのリプを見て自分の考えが足りなかったことに気付きました…
変換は一度だけ、先頭から数えてもっとも近いもののみです。
正しく書き直します、すみません。

スルーされにくい質問のテンプレと例

●Regular Expressionの使用環境
PowerShell7.2

●検索か置換か?
置換

●説明
文中(先頭及び文末以外)の0が連続して3つ以上並ぶ部分をハイフン(-)に置換したい
(先頭から数えて最初の一致のみ)

●対象データ
123000444
000123000
1230000000444
12000045600006

●希望する結果
123-444
000123000
123-444
12-45600006

よろしくお願いいたします。
2022/09/13(火) 22:09:54.11ID:jeF3JQfM
>>511
> 先頭末尾に繋がっている0は無視したい
こんな条件どこから出てきたんだ?
2022/09/13(火) 22:20:12.97ID:GLLSFlxd
「文中(先頭及び文末以外)の0」が連続して3つ以上並ぶ部分
文中(先頭及び文末以外)の「0が連続して3つ以上並ぶ部分」
2022/09/13(火) 22:24:49.17ID:clq+OpKM
^([1-9]+)0+(\d+)$ --> $1-$2
でいかがでしょう
2022/09/13(火) 22:33:07.80ID:clq+OpKM
あ、「ゼロ3つ以上」を満たしてなかった
また考えますー
2022/09/13(火) 22:35:39.26ID:clq+OpKM
^([1-9]+)0{3,}(\d+)$ --> $1-$2
でしょーか
2022/09/13(火) 22:46:39.11ID:7uE/UK4/
010001
2022/09/13(火) 23:08:19.66ID:G28B9gdh
>>513
> 文中(先頭及び文末以外)の0が
の説明と例からだと
「先頭以外」が先頭の0、1文字を指すのか
先頭から続く0の塊を指すのか不明でしょ
> 3つ以上並ぶ部分
が強欲なのか?欲張りでいいのか?が不明 >>511 さんの質問だね
2022/09/13(火) 23:09:06.59ID:G28B9gdh
>>519
訂正、>>510さんの質問
2022/09/13(火) 23:10:13.89ID:aae9uQ50
みなさんありがとうございます!
できそうな正規表現がありうれしいです。
すみませんが今手元に環境がないため明日動作させて確認します。
2022/09/13(火) 23:20:09.73ID:aae9uQ50
そして自分でも要件を言葉にできておらず申し訳ありません
みなさんに質問いただいて初めて気付きましたが、
先頭及び末尾が0であった場合、そこから連続する0は除外する ができると一番望ましいです。

00001200034000

000012-34000
となります。
返信遅くなりすみません。
2022/09/13(火) 23:44:59.39ID:G28B9gdh
(?<!^)(?>0{3,})(?!$)
未test
最初のマッチだけ置換は以下
https://social.technet.microsoft.com/Forums/ja-JP/ad0f7263-3fd1-4545-b554-e796d27ef948/263682102112398125101248312481?forum=powershellja
2022/09/14(水) 00:51:16.34ID:4SNfctPQ
>>518
あかんすね…

^(0*)((0{0,2}[1-9])+)0{3,}([1-9]\d*)$ --> $1$2-$4
これはどーでしょう?
2022/09/14(水) 05:23:58.73ID:E5sTi1VY
([1-9])0000*([1-9][0-9]*)
$1-$2
2022/09/14(水) 09:12:22.80ID:Kn3Wl+2J
(?<=[1-9])(?>000+)(?!$)(.+)$
-$1
2022/09/14(水) 09:38:59.41ID:s0UMl1ds
(^[^0].*?)0{3,}([^0].*?$)
$1-$2
2022/09/14(水) 10:42:18.62ID:6Qq1IObP
>>524,525,526
>>523,527
2022/09/14(水) 19:22:12.74ID:+0SwTq6N
508です。
沢山の案ありがとうございました、本当に助かりました。
一通り試して正しく動くものは沢山あったのですが、
以下の方式で解決させていただきました。

$reg=[regex]'([1-9])0000*([1-9][0-9]*)'
$reg.Replace($str,'$1-$2',1)

また、上記の案以外もこんな解決方法があるのかととても勉強になりました。
そして自分が要件をまとめられてなかったことにも反省いたしました。

今後はこちらで回答する側になれるよう、再度勉強いたします。
重ね重ね本当にありがとうございました。
2022/09/14(水) 19:57:00.91ID:b2aEm1i9
回答にある正規表現は置換回数を指定できない置換方法でも大丈夫
置換回数に1を指定する方法でやるなら単に ([1-9])0000*([1-9]) でもいい
2022/09/14(水) 22:22:31.78ID:+0SwTq6N
>530
確かに、教えていただいたこともりもりにしてしまいましたが
わざわざ[1-9]のあとに[0-9]を入れている意味がないですね…。
ご指摘ありがとうございます。
532デフォルトの名無しさん
垢版 |
2022/09/18(日) 12:56:41.18ID:QaJ1iFM2
githubで結構探したんですがそれっぽいのが見つからず、お力お貸しください。

●Regular Expressionの使用環境
AutoHotKey1.1系

●検索か置換か?
置換

●説明
2つのクォーテーションマークに囲まれたパスのうち、1つ目(app.exe)を削除したい。
囲まれたパス同士は半角スペースで接続される。

●対象データ
"D:\Dir_Path\_app.exe" "D:\Dir_Path\_script.ahk"
^^^^^^^^^^^^^^^^^^^^^^^

●希望する結果
"D:\Dir_Path\_script.ahk"
2022/09/18(日) 16:16:05.56ID:wjpqonb4
>>532
https://regex101.com/r/zxuEpo/1
534デフォルトの名無しさん
垢版 |
2022/09/18(日) 19:20:15.15ID:/uA/jgNo
>>533
ありがとうございますめちゃくちゃシンプルでした!あとこのregexサービスいいですね

".*"\s だと構文エラー吐きました
置換関数内(””の中)で”がうまく扱えないので頑張ってみます。
2022/09/18(日) 21:26:30.42ID:CbZe8FP4
"を
\"

\x22
に置き換えて試してみてわ
536デフォルトの名無しさん
垢版 |
2022/09/19(月) 16:41:30.36ID:4iw9Mtek
>>535
ありがとうございます、いけました
(ついでに””も削除)
\x22.*\x22\s|\x22
2022/09/20(火) 02:58:09.09ID:94I1wBUa
二重引用符のエスケープは重ねて""だな
"".*""\s
2022/10/29(土) 13:09:46.30ID:ec13kmtS
●Regular Expressionの使用環境
PCRE2

●検索か置換か?
検索

●説明
(..[\0@-g]\0){147}などを高速に検索したい

●対象データ
メガ単位のバイナリファイル(リトルエンディアン)

●希望する結果
説明は一例なので前中後にリテラルパターンが入る事もありますが(16KiBを越える事も)、固定長で
一定範囲だが不明な32bit値(0または0x00400000〜0x00670000付近)を含むブロック位置を列挙したいです

現状PCRE2で検索は出来ていますが、Intel Hyperscanだと
util/determinise.h:determinise:162:succ_id 16383 >= state_limit 16383
ng_mcclellan.cpp:buildMcClellan:590:state limit exceeded
rose_build_add.cpp:addOutfix:1779:could not build as either an NFA or a DFA
ng.cpp:addGraph:507:could not compile component 0 with 592 vertices
と言われて説明の例に限っては正規表現のコンパイルすら不可能です

32bit値は4バイト境界に限りませんが、ブロック先頭は4バイト境界なのでそこから高速化したいのですが
「(?>....)*?\K」を接頭しようとするとPCRE2_ANCHOREDはJITで使えませんし、そもそも遅くなるようです
今のところプログラム側でオフセットが4バイト境界のみを拾い、次の検索開始もアライメントしています
コールアウトもお察し…こういったパターンに適した書き方、又はCライブラリが有れば教えて欲しいです
2022/10/29(土) 19:31:13.26ID:9Ey1MUJ8
>>538
\0@って何?
\c@でNULL文字検索の意味ではないの?
2022/10/29(土) 19:42:35.80ID:ec13kmtS
>>539
文字クラス[\0@-g]なので表記を統一するなら[\x00\x40-\x67]になります
2022/10/30(日) 10:24:48.15ID:dZd+t5oq
スプレッドシートで20221030と入力されている数字を日付の表記?2022/10/30なのか10/30/2022なのかわからないけどDATEDIF関数に使える形に置換する正規表現ってどう書きますでしょうか
2022/10/30(日) 11:55:42.97ID:oF72FRjI
>>541
正規表現では無理。スレチ
DATE関数で日付にかDATEVALUE関数でシリアル値に変換
セルA1の値:20221030
=DATE(LEFT(A1,4),MID(A1,5,2),RIGHT(A1,2))
=DATEDIF(DATE(LEFT(A1,4),MID(A1,5,2),RIGHT(A1,2)),"2022/11/01","D")
2022/10/30(日) 12:28:15.07ID:S1PTRz+V
>>541
=DATEVALUE(REGEXREPLACE(A1, "^(....)(..)(..)$", "$1/$2/$3"))

>>542
スレチ
544デフォルトの名無しさん
垢版 |
2022/11/02(水) 14:16:53.69ID:gx4Z74sz
すいません。
0と正の整数のみにマッチする正規表現はどう書きますか
----
OK
0
1
22
303
999999
----
NG
-3
z55
0.33
2022/11/02(水) 14:20:50.51ID:4jxQNd6r
^\d+$
546デフォルトの名無しさん
垢版 |
2022/11/02(水) 14:26:53.26ID:gx4Z74sz
ありがとうございました!
2022/11/02(水) 14:39:57.52ID:Hz9+pCnD
00
00000000
012
003102
とかはええんかC言語だと8進数なんだけど
2022/11/02(水) 14:57:45.88ID:mLb2a5cx
最近は8進数を0oと書くのが主流じゃね?
2022/11/02(水) 15:14:09.32ID:gx4Z74sz
いやよくないのですが。。
2022/11/02(水) 22:52:34.87ID:WMtJS4K4
>>547
なぜC言語?
2022/11/03(木) 13:08:35.66ID:yr3S2O5F
^(?:0|[1-9]\d*+)$
2022/11/03(木) 23:35:12.45ID:gGr9RQjz
A(B(1), C(2)), B(3), C(4), A(D(5))の

A(B(1), C(2))とA(D(5))の両方にマッチする表現できますでしょうか?
2022/11/04(金) 00:21:55.02ID:Rv2RlvZT
A\([BD]\([15]\)(, C\(2\))?\)
2022/11/04(金) 00:32:30.76ID:u3TD418O
>>552
関数名は英数字1文字、ネストされた関数の引数は数字1文字にしてるけどこんな感じでいけるかと
\w\(\w\(\d\)(?:,\s*\w\(\d\))*\)
https://i.imgur.com/8ayodnp.jpg
2022/11/04(金) 19:23:25.88ID:aOu/uEdM
>>553-554
参考になりました
ありがとうございます
2022/11/05(土) 19:55:25.05ID:xnenmrxP
下のようなテキストがあった時、

フシギダネ、たねポケモン。生まれてから、しばらくの間は背中のタネから栄養をもらって大きく育つ。
フシギソウ、たねポケモン。背中のつぼみがふくらみだすと、あまい匂いが漂い始める。
フシギバナ、たねポケモン。雨の降った翌日は、背中の花の香りが強まる。

その行で最初に出てきた「、」だけをTabで置換したいのですが、
正規表現でなんとかできますかね?(´・ω・`)
2022/11/05(土) 19:57:13.42ID:Gow5Zgrm
顔文字が気持ち悪い
2022/11/05(土) 19:57:30.67ID:KyEMh/LJ
マルチラインモードのg無し置換でええのでは?
2022/11/05(土) 20:01:38.81ID:xnenmrxP
すみません。7分で自己解決しました。(´・ω・`)
2022/11/06(日) 18:52:14.69ID:Ju9kLy6l
>>559.replace('(´・ω・`)', '');
2022/11/06(日) 18:56:40.82ID:gpiofWbc
>>560
エスケープしろ
562デフォルトの名無しさん
垢版 |
2022/12/01(木) 00:48:55.16ID:7b6m1q/M
師走だ
563デフォルトの名無しさん
垢版 |
2022/12/01(木) 20:43:42.13ID:MJwbaGOX
>>556
^(.*?)、(.*)$ → $1¥t$2
2022/12/07(水) 17:35:07.95ID:hI2dpmO3
正規表現はコードを分かりにくくする非常に悪い技術だと思います。
早く廃止され、代替方法が見つかってほしいです。
2022/12/07(水) 18:06:34.78ID:Zr5hf/of
それは思うけどqwertyキーボードですらこの半世紀何も変わってないし、Legacy引き摺る類のUIは余程の転換期でも起こらない限り無理なんじゃないかな
2022/12/07(水) 18:23:42.79ID:IT7suRvF
>>564
わかりやすくて使い物にならないものができあがる予感
2022/12/07(水) 18:33:23.28ID:8ZB5Tvh5
物事の「本質的な複雑さ」を解決しようとしても「その場でぐるぐる回り続ける」ハメになるだけ(どこにもたどり着くことはない)
568デフォルトの名無しさん
垢版 |
2022/12/07(水) 21:37:36.61ID:lzjCqHmQ
正規表現を分かりやすい自然言語や仕様記述に変換するサービス作れば解決

正規表現を生成する機能も用意して最適化オプションもつければ有償で十分やっていける
2022/12/07(水) 22:46:38.37ID:0xPH+d9p
>>568
とりあえずそう言うアプリにお前ならいくら払うんだ?
2022/12/08(木) 10:58:46.31ID:c3lwHRlZ
>>564
それはそうなんだけど
徹夜で必死に考えいいアイデアを提供して下さい
2022/12/11(日) 15:34:21.97ID:xFkTi0uS
abc-ABC
abcd-ABC-def
abcde-defghi-ABC
ab-def-ghi-ABC

-ABCより前にハイフンのない-ABCを選択するのに3,4行目を除外する事で出来たのですが直接-ABCを選択するような事って出来ますか? 使うのはpythonです。よろしくお願いします
2022/12/11(日) 15:49:22.27ID:xFkTi0uS
あ、行頭を指定すれば簡単に出来ましたスレ汚しすみませんでした
2022/12/26(月) 08:14:24.98ID:G31tf+Le
質問です

私に全然知識がないのですごい初歩的な質問になるのですが
例えば“テキ”を検索するとして
“仮テキスト”となっているのは除く、
ホワイトリストを付随するような検索をするにはどうすればいいでしょうか?

私が試したもの、
(?<!仮)テキ(?!スト)
↑例えばこれだと“仮テキ”や“テキスト”まで除かれてしまいます
(おそらく「そりゃ当たり前だろ」と思われる事を言ってると思うのですがなにぶん知識がないためご容赦ください)

正規表現を使う場所としてはchmateやFirefoxアドオンなどで使っています

浅学バリバリな質問なのですがどうかご回答よろしくお願いします
2022/12/26(月) 08:18:23.33ID:LqfRRdYe
>>573
知識以前にお前馬鹿そうだから、>>2のテンプレ使って書き直して
2022/12/26(月) 10:07:19.58ID:5uJMWDBy
(?<!仮)テキ|テキ(?!スト)
2022/12/27(火) 04:47:48.03ID:xSShEST7
>>574
すいません、確かにテンプレ使った方が良かったですね…

>>575
ありがとうございます
単純な話だったんですね…

教えて貰って図々しいのですが
長くなってもいいので“仮テキスト”という続いた文字列を含めて
同じ動作をする正規表現はあるのでしょうか?
あった場合教えていただきたいです…
2022/12/27(火) 17:03:22.33ID:G2ophMPv
テキ(?!..(?<=仮テキスト))
2022/12/28(水) 01:36:28.87ID:Ztu+b3Ae
>>577
ありがとうございます
仕組みも分かったため複数指定もでき望んでいた事がやれました
初歩的な事にわざわざお付き合いいただきありがとうございました
2022/12/29(木) 18:17:40.05ID:HWC94+Gl
正規表現は半年後の自分がメンテできないから嫌なんだわ
特にその時適当に書いて辛うじて動いてるやつなのか会心の出来だったやつなのか一見判らなくて困るんだわ
正規表現に10段階ぐらい完成度のタグを付けたいのだよハイパーテキスト的にな
そういう気の利いて手軽な方法はないのかのう
2022/12/29(木) 19:06:41.81ID:W/by+W2J
人から貰った正規表現を理解もせずに自分の物にしていないからそんな事が起こる
自分で書いた正規表現なら何年経ってもパッと見りゃ内容解る
と言うか年々理解度が向上するから、見てがっかりして書き直すまである
2022/12/29(木) 19:37:11.07ID:HWC94+Gl
>と言うか年々理解度が向上するから
若いってええなあ
あと10年もすれば昔の自分の方が頭いいじゃねえか状態になるから今ががんばり時だよ
2022/12/29(木) 19:46:27.85ID:JPv7+i4s
>>579
コメント付けられる方言もあるがな
2022/12/29(木) 20:16:21.35ID:Y6+rT86n
>>581
すまんもう60越えとる
584デフォルトの名無しさん
垢版 |
2022/12/29(木) 21:08:41.79ID:5pKgQfqK
テスト書かないんだろ
2022/12/29(木) 23:00:20.15ID:zukJLKA9
そのうち、こうこうしたいと書くとそれに合った正規表現を出力するAIが出て来る
たぶん
2022/12/29(木) 23:37:13.29ID:VQTP+Rjm
>>585
今でもchatGPTで出来る
2022/12/30(金) 00:14:09.14ID:QnG1dvSt
今では正規表現中にコメントが書ける(拡張形式ignore whitespace)ものも多いのでは
2022/12/30(金) 01:37:49.63ID:1dcL6xM/
>>586
あれサラッとでまかせ混ぜてくるから油断ならん
まさに詐欺師の所業よ
2022/12/30(金) 05:43:41.86ID:gQwuuolL
正規表現の高齢化問題
今の子って正規表現に触れる機会あんのかなあ
糞みたいなエスケープシーケンスの概念込みで教えなきゃならんし
授業ではすきっぷやな
2022/12/31(土) 09:31:33.47ID:3UMVip3o
>>585
ここが…
2022/12/31(土) 19:47:02.85ID:yp0KXAnH
字幕ファイルの修正で秀丸を使って
文字列の置き換えしたいと考えています

置換前
00:00:06:09 - 00:00:10:47
おはよう

00:00:11:18 - 00:00:16:02
こんにちは

置換後
00:00:06.090,00:00:10.470
おはよう

00:00:11.180,00:00:16.020
こんにちは

----

対象データ
”xx:xx:xx:xx - xx:xx:xx:xx”
":xx - "を".xx0,"に置き換え
最後の"xx"を"xx0"に置き換え

希望結果
”xx:xx:xx.xx0,xx:xx:xx.xx0”

お願い致します
2022/12/31(土) 21:20:45.11ID:gFIlpiwK
せっかく秀丸スレあるんだからそっちで聞けばいいのに

HmJre.dll V.510
^([0-9:]+):([0-9]{2}) - ([0-9:]+):([0-9]{2})$
\1.\20,\3.\40
593591
垢版 |
2022/12/31(土) 22:37:29.30ID:yp0KXAnH
大晦日のツンデレさんに圧倒的感謝!!
ありがとうございます
2023/01/04(水) 10:29:42.45ID:vMZ55Vj6
教えてくださいm(__)m

[あああ(いいい)]

のような文字列を

[いいい](あああ)

と置き換える方法はあるでしょうか
2023/01/04(水) 12:23:22.97ID:gCqYqHxa
[あああ(いいい)]で検索して
[いいい](あああ)で置換する
2023/01/04(水) 12:35:30.42ID:Gtp9NVd3
テンプレ無視する馬鹿にはその答で十分だわな
2023/01/04(水) 12:40:09.77ID:k64eH4zi
まあ一例として
s/\[([^\[\]\(\)]+)\(([^\[\]\(\)]+)\)\]/[$2]($1)/
2023/01/04(水) 13:41:53.53ID:sAqw0ZzI
>>594
https://glot.io/snippets/ggykutt927

import pegs

echo "[あああ(いいい)]".replacef(peg" '[' {@} '(' {@} ')' ']' ","[$2]($1)")

でいける
2023/01/04(水) 18:30:34.43ID:REieKqQf
文頭や文中にあるauだけをNGするやつ教えて下さい
2023/01/04(水) 18:46:40.14ID:Edm8Og2O
docomoはいいのか
2023/01/04(水) 18:57:17.14ID:zEB0n1jD
唐突に「NGする」って一体何の話だ???
2023/01/04(水) 18:58:30.08ID:zEB0n1jD
何かを想定しているなら質問に際して最初にそれを伝えるのが常識だろう
2023/01/06(金) 10:01:53.18ID:+4FzrtmN
>>598
ありがとうございました。
助かりました
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況