Regular Expression(正規表現) Part16

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2021/11/03(水) 19:50:01.71ID:ebAE+z9+
Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part15
https://mevius.5ch.net/test/read.cgi/tech/1568640311/


次スレは>>980宜しく
天ぷら等>>2以降
2023/06/24(土) 17:35:54.33ID:X4q59utv
PHPだけじゃなあ
結局、事故らない為には長さの違うダブリは取り除いておくほうが無難ってことか
760743
垢版 |
2023/06/25(日) 11:57:31.39ID:YeZqv3UB
>> 759
考えてみると長いほうを前にしても短いほうがマッチ出来なくて詰むケースがあるのか
正規表現むずかしい

>> 740 741 754
改行コードがLFやCRのみの場合に対応してない
最後の行がAAAで始まらない場合、行末の改行が無い場合に削除されない
743は両方に対応しているけど740の発想のほうがシンプルで優れてるね
あとサクラエディタでは\Rが使えるので使ったほうが簡単に書けそう
2023/06/27(火) 21:16:47.75ID:TnfGmDZI
最長一致マッチが有効のとき、下の正規表現は何にマッチすべき?

"abcd" =~ /abc\Kd|abc/;

\Kの前を文字列長に含めるべきか否かを考えて下さい
2023/06/28(水) 12:49:16.44ID:vk3PbjZ1
元より最左ルールに基づいてdよりabcにマッチすべきとはならんやろ
763761
垢版 |
2023/06/28(水) 13:05:55.77ID:m0cBggZC
>>762
ありがとうございます、それは正しい意見だと思います
\Kの前を文字列長に含めるべきかどうかについてはどうお考えですか?
今後の参考にしたいと考えております
2023/06/29(木) 11:57:49.56ID:0JMnG4u5
最長一致する正規表現が有効の場合

1、「abc」「あ」

2、「て゛」「で」

A. 前が長い
B. 同じ長さ
C. 後ろが長い
2023/07/02(日) 20:25:06.40ID:/BVUs+ug
奥が深すぎる
2023/07/06(木) 13:17:43.04ID:GbtWdAMV
twitter.com/k_takata/status/1676247372731662336
>正規表現技術入門が第2刷増刷

おめでとうございます
bregonig.dllやonigmoにはいつもお世話になってます
vimは知りませんw
2023/07/06(木) 17:43:12.24ID:SQbV6Whm
JaneStyleであぼーんにつかいたいのですが、

アウアウウー Sa47-runv [106.131.26.222]

47
runv
131.26.222

この3つが変わる場合の正規表現ってどうかいたらよいでしょうか?
2023/07/06(木) 20:37:36.61ID:GbtWdAMV
Jane Styleの仕様が分からないけどこれでいける?

(?i)アウアウウー\s*Sa[a-z\d]{2}-[a-z\d]{4}\s*\[106\.\d{1,3}\.\d{1,3}\.\d{1,3}\]
2023/07/06(木) 21:30:05.44ID:7Yxy824T
>>768
ありがとうございます!
ためしてみたけれど駄目でした。
細かく分析して応用してみます!!
2023/07/06(木) 21:54:51.51ID:7Yxy824T
>>768
失礼しました。勘違いをしていて、正しく設定したらこれでいけました!!
大感謝です!&正規表現の勉強になりました!!
リファレンスみてなるほどとうなっています
2023/07/06(木) 21:55:53.42ID:gWNyo9yQ
いやそれでいけるでしょ
(?i)はデフォなので要らないけど
ダメなら設定の仕方が悪いか、既に表示されているものにNGを設定したんで
設定前の表示が表示されたままで再描画をやってないのでNGが表示に反映されてないかのどっちか
2023/07/06(木) 22:11:26.50ID:GbtWdAMV
動いて良かった、正規表現の勉強頑張れーw
771さんもありがとう
2023/07/06(木) 22:11:33.07ID:4RAXuAwI
ちなみにワッチョイの下4桁、runvの部分は大文字もありうるから
その正規表現すり抜けするかも
2023/07/06(木) 22:16:17.63ID:gWNyo9yQ
(?i)が付いてるし、なくてもそれがデフォだから大丈夫だよ
2023/07/06(木) 22:21:43.88ID:7Yxy824T
>>773
(?i)アウアウウー\s*Sa[0-9A-Za-z\d]{2}-[0-9A-Za-z\d]{4}\s*\[106\.\d{1,3}\.\d{1,3}\.\d{1,3}\]

一応、ご指摘通り改良しておきました!
2023/07/07(金) 00:41:55.61ID:adSx9MnJ
反対に(?i)ではSaの他にsAにもマッチしてしまうのでは?
(?-i)アウアウウー Sa..-.... \[106\.
これで誤爆する実例があるなら教えてほしい
2023/07/07(金) 13:06:44.76ID:xew4KSRK
言い方があれだけど、丁寧に書いたかどうかの差なのでどっちでも機能すると思う
2023/07/07(金) 23:28:01.04ID:chPidFQv
鬼車で(?L)と\g<0>が共存出来ないようだけど

"\g<0>が正規表現全体を取り込むときに(?L)だけを取り込まないようにする"

という修正案で何か問題が起こるか分かる人いません?

例えば (?Lix)abc\g<0> だったら\g<0>の中身が (?ix)abc\g<0> になるようにすれば
共存可能になるんだけど副作用が出るのか分からない

鬼車公式) 全体オプション
github.com/kkos/oniguruma/blob/41a3b802af2155eef6d648aa3608e39605110642/doc/RE.ja#L288

LだけじゃなくCとIも共存不可でした
2023/07/09(日) 12:38:44.00ID:dnLGUnq0
>>778
"\g<0>" に取り込むときにはそのまま全て取り入れ、取り出すときに
"L" や "C" や "I" を取り除く方法もあるのでは?
2023/07/09(日) 15:02:36.24ID:NT/2XwNR
最長マッチ(?L)を知らなかったんだけど何か思ってたのと全然違った
DFA的な最長だと思ってたのに
2023/07/09(日) 17:56:55.84ID:dnLGUnq0
最左じゃなくても良いみたい
UTF-8のとき

abc < abc\Kd
ab < あ
で < て゛

"(?C)a(b|\g<0>)c" がエラーになるのはモヤっとする
"(?C)" が捕獲無効にするから "\g<1>" は使えないし
2023/07/10(月) 13:05:06.30ID:8apozFwM
> ab < あ

マルチバイト文字を含む文字列に対して (?L) は使いにくいな
文字単位での長さで比較するようにするのは重くなる上に難易度高そう
2023/07/10(月) 20:06:05.30ID:8apozFwM
JaneStyleが5ch.netのサポートを終了
この前NG登録出来て喜んでた人かわいそす
2023/07/11(火) 10:50:26.27ID:6DaZenCz
(?L)をマルチ文字対応にするのは無理だけど

>"(?C)a(b|\g<0>)c" がエラーになる

これを使えるように出来る人はいるんじゃないかな
夏休みで暇を持て余している大学生の皆さん、Let's try!
2023/07/13(木) 19:11:50.96ID:7AgmN8D3
JAPANを日本、NIPPONをニッポンに、同時に置き換える

JAPAN|NIPPON

日本|ニッポン
2023/07/13(木) 23:55:44.94ID:OlRmyaph
>>785
サクラエディタ+bregonig.dllでは無理っす
2023/07/14(金) 00:50:54.69ID:JHf9vJmP
https://www.regular-expressions.info/replaceconditional.html
https://npp-user-manual.org/docs/searching/#substitution-conditionals
2023/07/14(金) 13:30:40.79ID:lxqistQI
わしは鬼車のscan.cをいじって好きに置換出来るようにしたぞ。ファイルからhtmlソースを読み込んで繰り返し検索・置換して結果を別ファイルに出力するようにしとる。便利なのだが使う機会は滅多にない。日常の置換はほぼ秀丸で事足りる。
2023/07/15(土) 18:19:44.01ID:nnNpViq+
JavaScriptですが「0を含めない正の半角数値のみ」というのは、どう書けばいいのでしょうか?
2023/07/15(土) 18:22:35.95ID:nnNpViq+
0を含めないというのは「0より大きい正の半角数値のみ」という意味です
791デフォルトの名無しさん
垢版 |
2023/07/15(土) 18:39:49.26ID:Fs/aULCy
正規表現でやることじゃない
2023/07/15(土) 18:47:36.28ID:vGns6WZO
(?!(?!<[0-9])0(?![0^9]))[0-9]+

00とかあるんだったらダメだけど
2023/07/15(土) 18:47:49.29ID:hche+KD8
>>789
XY問題の臭いがする

その文字列を、正規表現「だけ」を使って評価したい理由でもあるの?
2023/07/15(土) 19:54:00.17ID:nnNpViq+
>>793
全角文字と半角英字を除外したいんですよ
入力欄にこれらを入力されるとフリーズします
2023/07/15(土) 20:24:42.65ID:hche+KD8
>>794
「正規表現だけで評価したい理由」になってない

許可したい文字種が「0から9までの数字」ってことで良いのなら、下記で済ませるのが妥当(符号・少数点・セパレータを含んでいたり、16進表記、指数表記、インド数字、などの表現は不許可)

const isValid = Number(inputString) && /^[0-9]+$/.test(inputString);
2023/07/15(土) 21:27:34.96ID:nnNpViq+
すみません
説明の仕方が悪かったです
「正の実数(少数も含む)」でした
0も含ませることにしました
それでこうしました
^(0|[1-9][0-9]*)(|[.][0-9]+)$
797デフォルトの名無しさん
垢版 |
2023/07/15(土) 21:44:37.74ID:Ip1+AB5X
そして半年後…
「誰だよこんなクソプログラム書いたやつ💢」
2023/07/15(土) 21:52:20.50ID:G+tF3yG6
滅茶苦茶わかりみ
美しくないプログラムはパッと見てうんざりする
2023/07/17(月) 02:00:45.07ID:MFjOLYv6
改行厨たいさく
[^\n]+([\n\r\s]{2,})[^\n]+([\n\r\s]{2,})[^\n]+([\n\r\s]{2,})[^\n]+
2023/07/20(木) 17:25:16.42ID:OqTU1F4P
>>785
そういうの出来るといいですけどねえ
2023/07/21(金) 15:55:34.48ID:GwV7ay2N
>>784
C言語で文字列から部分文字列を取り出す関数をググったら「そんなのねーよ、自作しろ」だった
C言語をちゃんと勉強しないと無理だな
2023/07/23(日) 00:50:40.93ID:hdFkAV/t
hage【ZEN123】hoge456789
上記の【】内の全角英数字だけを半角にする
正規表現では無理なパターンの例か
2023/07/23(日) 05:19:55.24ID:BnGP1dsy
正規表現ライブラリを使う側のアプリに変換関数を実装すれば可能になるので
そういう正規表現環境は既に存在してるかも?
今のテキストエディタでもマクロでなら出来るものがありそう
2023/07/23(日) 09:48:00.20ID:PHWyKwrY
秀丸のようにマクロ使わずに検索→変換できるエディタもあるしね
2023/07/23(日) 13:07:11.02ID:BnGP1dsy
秀丸と言えば鬼車を秀丸で使えるようにしようとしてる方がいるから
お願いすれば 全角->半角変換 や >>785 の置換に対応してもらえるかも?

本家の最新の鬼車の秀丸エディタからの利用方法
www2.maruo.co.jp/hidesoft/2/x39752_.html
2023/07/23(日) 15:10:19.87ID:nlZnqujR
>>805
それは、一時期そこら中で暴れていた「触れてはいけない人」のヤツだねw
2023/07/23(日) 16:14:08.28ID:BnGP1dsy
その点は賛否あるだろうけど技術力もモチベも高そうな方だから期待してる
2023/07/24(月) 12:53:06.11ID:LBGWnldn
> 全角->半角変換 や >>785 の置換に対応

正規表現の中での表記はどういう仕様にするのがベストなのかな?
新しい予約語(?)の予感
2023/07/25(火) 00:28:01.42ID:ijwgoKNu
「正規表現には方言がある」
エディターを乗り換えた時に初めて気付かされたな
2023/07/25(火) 01:58:51.32ID:DaPN/KaH
\1(sed系)なのか、$1(perl系)なのかは、最初はいつも逆をやってしまう
2023/07/25(火) 02:10:59.59ID:m8SWwEXi
\1ってあちこちにあるものだったのか
EmEditorってエディタがそれでなんだこれって思ってた
2023/07/25(火) 16:23:19.14ID:hmH9EM9U
Onigumoで検索して気持ち悪くなる定期
2023/07/29(土) 20:32:41.26ID:xNvNUPTs
詳説正規表現の1章だけとりあえず読み終えたけど正規表現の使いどころがわからない
正規表現の便利な使い方教えて!
2023/07/29(土) 21:44:23.17ID:slvWQQxm
>>813
^(?=.*正規表現)(?=.*教えて)
2023/07/29(土) 21:46:27.76ID:slvWQQxm
>>813
途中で送信しちゃった
↓を専ブラのNGwordに入れて正規表現にチェックしてみ
^(?=.*正規表現)(?=.*教えて).*$
2023/07/29(土) 21:49:39.05ID:slvWQQxm
>>813
すまん間違えてたこれ
(?s:(?=.*正規表現)(?=.*教えて)).*$
2023/07/29(土) 21:51:07.45ID:Z2bzRt4C
俺のレス消えちゃうんじゃない?
?=がよくわからないけど後で調べとくよ
2023/07/30(日) 10:33:11.68ID:3uyXLeeN
テキストエディタで置換を行うときに「正規表現」と「選択範囲」をオン

検索: ^
置換: #

選択範囲の全ての行をコメントアウト出来て便利
--------------------------------------------------------

検索: [  \t]+$
置換: (なし)

行末の余計なスペースを削除出来て便利
2023/08/12(土) 18:48:03.89ID:g9Iw6FTW
https://hoge.com/p2io0z.png https://fuga.net/f8qpes.png https://moga.com/6nw4yt.png
の用に1行に複数URLがスペース区切りで記載されているものを、それぞれ単独で抜き出したいです。

https?://(?:[!-~]+.)+[!-~]+
だと最長一致になってしまうようで、1行丸ごと対象になってしまます
最短一致出来ればいいと思うのですが、どう正規表現を弄ればいいか教えてください。
2023/08/12(土) 18:56:16.40ID:IKZkjZuG
http[^\s]+
2023/08/12(土) 19:02:22.92ID:BmgakVsI
>>819
.をエスケープ
2023/08/12(土) 19:14:06.14ID:g9Iw6FTW
>>820
>>821
うぉぉ、ありがとうございました!
2023/08/13(日) 14:38:57.47ID:vv6Q6LsS
突然大きな声で叫ぶな
2023/08/20(日) 13:26:03.91ID:tG3c9Vi+
perl 正規表現で一発変換できませんか
"aaa \"bbb\" \"ccc\" ddd" # これを以下にしたい
aaa "bbb" "ccc" ddd
2023/08/20(日) 13:58:40.55ID:vZ93TkLb
正規表現で
my $s = '"aaa \"bbb\" \"ccc\" ddd"';
$s =~ s/(.*)/eval $s/e;

正規表現を使わずに
my $x = eval '"aaa \"bbb\" \"ccc\" ddd"';
2023/08/20(日) 14:00:17.67ID:vZ93TkLb
>>825
$s =~ s/(.*)/eval $s/e;

  ↓

$s =~ s/(.*)/eval $1/e;
8270824
垢版 |
2023/08/20(日) 20:08:57.65ID:tG3c9Vi+
文字列をevalで再度評価させる
ありがとうございます、勉強になります
ただ文字列にシングルクォートはありません

文字列に2つのパターンがあります
hogehoge "aaa bbb ccc ddd"
hogehoge "aaa \"bbb \"ccc ddd"

s/hogehoge\s+"(.+)".*\n/$1/; # で弾いて
tr/\\//d; # 2回処理しています
2023/08/20(日) 20:26:08.36ID:vZ93TkLb
単純に

s/\\//g

でええんとちゃうん
8290824
垢版 |
2023/08/20(日) 20:59:59.16ID:tG3c9Vi+
>>828
2回処理するのでindexで調べてtr使った方が早いでしょ

hogehoge "aaa bbb ccc ddd"
hogehoge "eee \"fff\" \"ggg\" hhh"

目的文字列

aaa bbb ccc ddd
eee "fff" "ggg" hhh
2023/08/20(日) 21:32:41.19ID:vZ93TkLb
一発変換したいんじゃないの?

s/hogehoge\s+(.+)/eval $1/e
8310824
垢版 |
2023/08/20(日) 21:58:11.37ID:tG3c9Vi+
>>830
ありがとうございます
s/hogehoge\s+"(.+)".*\n/$1/;

これで弾いてるの"以後にコメントがあるかもしれないからです
2023/08/21(月) 20:43:15.01ID:Lyi1TDoI
eval思い付く人すごい、甲子園優勝
2023/08/21(月) 23:39:46.20ID:Frb3PbHb
>>824
これはUnix名前空間の全引数を" "で括ったものをほどくだけに見えるので、例えばLinux上では
文字列変換ではなく、printfコマンドを通せば一発だが。

$ printf '%s' "aaa \"bbb\" \"ccc\" ddd"
# aaa "bbb" "ccc" ddd
2023/08/21(月) 23:52:08.69ID:Frb3PbHb
見落としてたので補足しておくと、>>831のコメントの件もUnixの書式に則ったものなら大丈夫。
$ printf '%s' "aaa \"bbb\" \"ccc\" ddd" # ←のようにコメントがあっても、↓になる
# aaa "bbb" "ccc" ddd
2023/08/22(火) 01:30:15.60ID:RW2iO7Jr
>>perl 正規表現で一発変換できませんか

まあ参考にはなるけど質問の条件無視してドヤ顔で語られてもねえ‥
836デフォルトの名無しさん
垢版 |
2023/08/22(火) 02:16:49.08ID:NJ9SPgik
>>833
単にシェルが引数処理してるだけじゃん
これで十分だろ
echo "aaa \"bbb\" \"ccc\" ddd" #
2023/08/22(火) 12:38:02.82ID:NJ9SPgik
>>831
(perlの)コメントがあっても動作するよ
8380824
垢版 |
2023/08/23(水) 09:58:00.37ID:yShv/GWA
>>837
ありがとうございます、勘違いしてました
eval評価だからコメントあっても行けますね
2023/09/02(土) 20:40:48.54ID:PozNjemk
●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
IPアドレス部分だけ抽出したいです
各セグメントが1-255の範囲内かどうかのチェックは無くてもOKです
※対象データの内xは文字としてのアルファベットのxです
 \r\nは改行コードです
よろしくお願いします

●対象データ
x\r\n192.168.10.1\r\n0\r\n\r\n

●希望する結果
192.168.10.1
840デフォルトの名無しさん
垢版 |
2023/09/02(土) 22:43:12.64ID:JbZUXP6Y
(%d+%.%d+%.%d+%.%d+)
841839
垢版 |
2023/09/03(日) 01:48:07.24ID:BSGxD5eG
ありがとうございました
2023/09/03(日) 01:50:43.78ID:BSGxD5eG
●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
コロンとスペースの右側の数字だけ抽出したいです
よろしくお願いします

●対象データ
abe-gkm: 12

●希望する結果
12
2023/09/03(日) 06:04:52.16ID:ldBVlws1
自分で覚える気は一切ないんですね
2023/09/03(日) 14:44:19.10ID:QHfhMJE9
LUA5.1リファレンスマニュアル 文字列操作
http://milkpot.sakura.ne.jp/lua/lua51_manual_ja.html#5.4
2023/09/03(日) 17:01:33.87ID:7kfz6vsc
訂正がありました
よろしくお願いします

●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
最後に現れるコロンの右側だけ抽出したいです

●対象データ
ab:e-gkm: 12

●希望する結果
12
846デフォルトの名無しさん
垢版 |
2023/09/03(日) 17:20:26.33ID:ruPOb/mk
訂正がありました
よろしくお願いします

●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
最後に現れるコロンの右側だけ抽出したいです

●対象データ
ab:e-gkm: ::12

●希望する結果
12
2023/09/03(日) 17:22:38.45ID:7kfz6vsc
>>846は別の人なのでトリップを付けておきます
よろしくお願いします
848デフォルトの名無しさん
垢版 |
2023/09/03(日) 17:42:25.87ID:ruPOb/mk
訂正がありました
よろしくお願いします

●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
最後に現れるコロンの右側だけ抽出したいです

●対象データ
ab:e-gkm: 121212

●希望する結果
12
849デフォルトの名無しさん
垢版 |
2023/09/04(月) 00:12:22.18ID:SsZQexqW
>>843-844
>>846-848
夏休みキッズ達よ、答えられないor嫌なら見なければいい

>>845
[^: ]*$
2023/09/04(月) 13:01:20.01ID:c5K3sEzk
Excelの文字を取り出すLEFT関数、RIGHT関数、MID関数
正規表現でも相当がんばれば再現できなくはないけれど、努力に見合った意味が見つからない
2023/09/04(月) 13:08:00.64ID:nyO3ndTW
>[^: ]*$
こういうの後ろから見るよう最適化されるのかな
2023/09/04(月) 15:41:22.66ID:zA8RUwS0
ややこしい検索は正規表現だけよりも
awkなどで簡単な正規表現とif文や関数を組み合わせる方が早い
2023/09/04(月) 18:55:45.65ID:BoKCZaYW
今回のはややこしくはない
むしろ簡単
854デフォルトの名無しさん
垢版 |
2023/09/04(月) 19:08:28.07ID:8gjbapjk
>>849
アホらしすぎて・・・
855デフォルトの名無しさん
垢版 |
2023/09/04(月) 20:45:35.27ID:DgpCgO2R
>>854
相手の技量は千差万別
自分を基準に考えるからキッズなんだ
たとえそれがHello World!レベルであったとしても
テンプレ使ってちゃんと質問されているのだから
2023/09/04(月) 20:55:42.10ID:Tkae+foX
>>855
気に入らないレスに絡んでるのは貴方も同じ
嫌なら見るな
857デフォルトの名無しさん
垢版 |
2023/09/04(月) 20:58:59.14ID:DgpCgO2R
>>856
気に入る気に入らないじゃなくて
スレを荒らさないで欲しいって事
858デフォルトの名無しさん
垢版 |
2023/09/04(月) 21:05:24.79ID:NKgrLrxG
訂正がありました
よろしくお願いします

●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
最後に現れるコロンの右側だけ抽出したいです

●対象データ
ab:e-gkm: 33

●希望する結果
12
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況