Regular Expression(正規表現) Part16

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2021/11/03(水) 19:50:01.71ID:ebAE+z9+
Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part15
https://mevius.5ch.net/test/read.cgi/tech/1568640311/


次スレは>>980宜しく
天ぷら等>>2以降
2023/07/06(木) 22:11:33.07ID:4RAXuAwI
ちなみにワッチョイの下4桁、runvの部分は大文字もありうるから
その正規表現すり抜けするかも
2023/07/06(木) 22:16:17.63ID:gWNyo9yQ
(?i)が付いてるし、なくてもそれがデフォだから大丈夫だよ
2023/07/06(木) 22:21:43.88ID:7Yxy824T
>>773
(?i)アウアウウー\s*Sa[0-9A-Za-z\d]{2}-[0-9A-Za-z\d]{4}\s*\[106\.\d{1,3}\.\d{1,3}\.\d{1,3}\]

一応、ご指摘通り改良しておきました!
2023/07/07(金) 00:41:55.61ID:adSx9MnJ
反対に(?i)ではSaの他にsAにもマッチしてしまうのでは?
(?-i)アウアウウー Sa..-.... \[106\.
これで誤爆する実例があるなら教えてほしい
2023/07/07(金) 13:06:44.76ID:xew4KSRK
言い方があれだけど、丁寧に書いたかどうかの差なのでどっちでも機能すると思う
2023/07/07(金) 23:28:01.04ID:chPidFQv
鬼車で(?L)と\g<0>が共存出来ないようだけど

"\g<0>が正規表現全体を取り込むときに(?L)だけを取り込まないようにする"

という修正案で何か問題が起こるか分かる人いません?

例えば (?Lix)abc\g<0> だったら\g<0>の中身が (?ix)abc\g<0> になるようにすれば
共存可能になるんだけど副作用が出るのか分からない

鬼車公式) 全体オプション
github.com/kkos/oniguruma/blob/41a3b802af2155eef6d648aa3608e39605110642/doc/RE.ja#L288

LだけじゃなくCとIも共存不可でした
2023/07/09(日) 12:38:44.00ID:dnLGUnq0
>>778
"\g<0>" に取り込むときにはそのまま全て取り入れ、取り出すときに
"L" や "C" や "I" を取り除く方法もあるのでは?
2023/07/09(日) 15:02:36.24ID:NT/2XwNR
最長マッチ(?L)を知らなかったんだけど何か思ってたのと全然違った
DFA的な最長だと思ってたのに
2023/07/09(日) 17:56:55.84ID:dnLGUnq0
最左じゃなくても良いみたい
UTF-8のとき

abc < abc\Kd
ab < あ
で < て゛

"(?C)a(b|\g<0>)c" がエラーになるのはモヤっとする
"(?C)" が捕獲無効にするから "\g<1>" は使えないし
2023/07/10(月) 13:05:06.30ID:8apozFwM
> ab < あ

マルチバイト文字を含む文字列に対して (?L) は使いにくいな
文字単位での長さで比較するようにするのは重くなる上に難易度高そう
2023/07/10(月) 20:06:05.30ID:8apozFwM
JaneStyleが5ch.netのサポートを終了
この前NG登録出来て喜んでた人かわいそす
2023/07/11(火) 10:50:26.27ID:6DaZenCz
(?L)をマルチ文字対応にするのは無理だけど

>"(?C)a(b|\g<0>)c" がエラーになる

これを使えるように出来る人はいるんじゃないかな
夏休みで暇を持て余している大学生の皆さん、Let's try!
2023/07/13(木) 19:11:50.96ID:7AgmN8D3
JAPANを日本、NIPPONをニッポンに、同時に置き換える

JAPAN|NIPPON

日本|ニッポン
2023/07/13(木) 23:55:44.94ID:OlRmyaph
>>785
サクラエディタ+bregonig.dllでは無理っす
2023/07/14(金) 00:50:54.69ID:JHf9vJmP
https://www.regular-expressions.info/replaceconditional.html
https://npp-user-manual.org/docs/searching/#substitution-conditionals
2023/07/14(金) 13:30:40.79ID:lxqistQI
わしは鬼車のscan.cをいじって好きに置換出来るようにしたぞ。ファイルからhtmlソースを読み込んで繰り返し検索・置換して結果を別ファイルに出力するようにしとる。便利なのだが使う機会は滅多にない。日常の置換はほぼ秀丸で事足りる。
2023/07/15(土) 18:19:44.01ID:nnNpViq+
JavaScriptですが「0を含めない正の半角数値のみ」というのは、どう書けばいいのでしょうか?
2023/07/15(土) 18:22:35.95ID:nnNpViq+
0を含めないというのは「0より大きい正の半角数値のみ」という意味です
791デフォルトの名無しさん
垢版 |
2023/07/15(土) 18:39:49.26ID:Fs/aULCy
正規表現でやることじゃない
2023/07/15(土) 18:47:36.28ID:vGns6WZO
(?!(?!<[0-9])0(?![0^9]))[0-9]+

00とかあるんだったらダメだけど
2023/07/15(土) 18:47:49.29ID:hche+KD8
>>789
XY問題の臭いがする

その文字列を、正規表現「だけ」を使って評価したい理由でもあるの?
2023/07/15(土) 19:54:00.17ID:nnNpViq+
>>793
全角文字と半角英字を除外したいんですよ
入力欄にこれらを入力されるとフリーズします
2023/07/15(土) 20:24:42.65ID:hche+KD8
>>794
「正規表現だけで評価したい理由」になってない

許可したい文字種が「0から9までの数字」ってことで良いのなら、下記で済ませるのが妥当(符号・少数点・セパレータを含んでいたり、16進表記、指数表記、インド数字、などの表現は不許可)

const isValid = Number(inputString) && /^[0-9]+$/.test(inputString);
2023/07/15(土) 21:27:34.96ID:nnNpViq+
すみません
説明の仕方が悪かったです
「正の実数(少数も含む)」でした
0も含ませることにしました
それでこうしました
^(0|[1-9][0-9]*)(|[.][0-9]+)$
797デフォルトの名無しさん
垢版 |
2023/07/15(土) 21:44:37.74ID:Ip1+AB5X
そして半年後…
「誰だよこんなクソプログラム書いたやつ💢」
2023/07/15(土) 21:52:20.50ID:G+tF3yG6
滅茶苦茶わかりみ
美しくないプログラムはパッと見てうんざりする
2023/07/17(月) 02:00:45.07ID:MFjOLYv6
改行厨たいさく
[^\n]+([\n\r\s]{2,})[^\n]+([\n\r\s]{2,})[^\n]+([\n\r\s]{2,})[^\n]+
2023/07/20(木) 17:25:16.42ID:OqTU1F4P
>>785
そういうの出来るといいですけどねえ
2023/07/21(金) 15:55:34.48ID:GwV7ay2N
>>784
C言語で文字列から部分文字列を取り出す関数をググったら「そんなのねーよ、自作しろ」だった
C言語をちゃんと勉強しないと無理だな
2023/07/23(日) 00:50:40.93ID:hdFkAV/t
hage【ZEN123】hoge456789
上記の【】内の全角英数字だけを半角にする
正規表現では無理なパターンの例か
2023/07/23(日) 05:19:55.24ID:BnGP1dsy
正規表現ライブラリを使う側のアプリに変換関数を実装すれば可能になるので
そういう正規表現環境は既に存在してるかも?
今のテキストエディタでもマクロでなら出来るものがありそう
2023/07/23(日) 09:48:00.20ID:PHWyKwrY
秀丸のようにマクロ使わずに検索→変換できるエディタもあるしね
2023/07/23(日) 13:07:11.02ID:BnGP1dsy
秀丸と言えば鬼車を秀丸で使えるようにしようとしてる方がいるから
お願いすれば 全角->半角変換 や >>785 の置換に対応してもらえるかも?

本家の最新の鬼車の秀丸エディタからの利用方法
www2.maruo.co.jp/hidesoft/2/x39752_.html
2023/07/23(日) 15:10:19.87ID:nlZnqujR
>>805
それは、一時期そこら中で暴れていた「触れてはいけない人」のヤツだねw
2023/07/23(日) 16:14:08.28ID:BnGP1dsy
その点は賛否あるだろうけど技術力もモチベも高そうな方だから期待してる
2023/07/24(月) 12:53:06.11ID:LBGWnldn
> 全角->半角変換 や >>785 の置換に対応

正規表現の中での表記はどういう仕様にするのがベストなのかな?
新しい予約語(?)の予感
2023/07/25(火) 00:28:01.42ID:ijwgoKNu
「正規表現には方言がある」
エディターを乗り換えた時に初めて気付かされたな
2023/07/25(火) 01:58:51.32ID:DaPN/KaH
\1(sed系)なのか、$1(perl系)なのかは、最初はいつも逆をやってしまう
2023/07/25(火) 02:10:59.59ID:m8SWwEXi
\1ってあちこちにあるものだったのか
EmEditorってエディタがそれでなんだこれって思ってた
2023/07/25(火) 16:23:19.14ID:hmH9EM9U
Onigumoで検索して気持ち悪くなる定期
2023/07/29(土) 20:32:41.26ID:xNvNUPTs
詳説正規表現の1章だけとりあえず読み終えたけど正規表現の使いどころがわからない
正規表現の便利な使い方教えて!
2023/07/29(土) 21:44:23.17ID:slvWQQxm
>>813
^(?=.*正規表現)(?=.*教えて)
2023/07/29(土) 21:46:27.76ID:slvWQQxm
>>813
途中で送信しちゃった
↓を専ブラのNGwordに入れて正規表現にチェックしてみ
^(?=.*正規表現)(?=.*教えて).*$
2023/07/29(土) 21:49:39.05ID:slvWQQxm
>>813
すまん間違えてたこれ
(?s:(?=.*正規表現)(?=.*教えて)).*$
2023/07/29(土) 21:51:07.45ID:Z2bzRt4C
俺のレス消えちゃうんじゃない?
?=がよくわからないけど後で調べとくよ
2023/07/30(日) 10:33:11.68ID:3uyXLeeN
テキストエディタで置換を行うときに「正規表現」と「選択範囲」をオン

検索: ^
置換: #

選択範囲の全ての行をコメントアウト出来て便利
--------------------------------------------------------

検索: [  \t]+$
置換: (なし)

行末の余計なスペースを削除出来て便利
2023/08/12(土) 18:48:03.89ID:g9Iw6FTW
https://hoge.com/p2io0z.png https://fuga.net/f8qpes.png https://moga.com/6nw4yt.png
の用に1行に複数URLがスペース区切りで記載されているものを、それぞれ単独で抜き出したいです。

https?://(?:[!-~]+.)+[!-~]+
だと最長一致になってしまうようで、1行丸ごと対象になってしまます
最短一致出来ればいいと思うのですが、どう正規表現を弄ればいいか教えてください。
2023/08/12(土) 18:56:16.40ID:IKZkjZuG
http[^\s]+
2023/08/12(土) 19:02:22.92ID:BmgakVsI
>>819
.をエスケープ
2023/08/12(土) 19:14:06.14ID:g9Iw6FTW
>>820
>>821
うぉぉ、ありがとうございました!
2023/08/13(日) 14:38:57.47ID:vv6Q6LsS
突然大きな声で叫ぶな
2023/08/20(日) 13:26:03.91ID:tG3c9Vi+
perl 正規表現で一発変換できませんか
"aaa \"bbb\" \"ccc\" ddd" # これを以下にしたい
aaa "bbb" "ccc" ddd
2023/08/20(日) 13:58:40.55ID:vZ93TkLb
正規表現で
my $s = '"aaa \"bbb\" \"ccc\" ddd"';
$s =~ s/(.*)/eval $s/e;

正規表現を使わずに
my $x = eval '"aaa \"bbb\" \"ccc\" ddd"';
2023/08/20(日) 14:00:17.67ID:vZ93TkLb
>>825
$s =~ s/(.*)/eval $s/e;

  ↓

$s =~ s/(.*)/eval $1/e;
8270824
垢版 |
2023/08/20(日) 20:08:57.65ID:tG3c9Vi+
文字列をevalで再度評価させる
ありがとうございます、勉強になります
ただ文字列にシングルクォートはありません

文字列に2つのパターンがあります
hogehoge "aaa bbb ccc ddd"
hogehoge "aaa \"bbb \"ccc ddd"

s/hogehoge\s+"(.+)".*\n/$1/; # で弾いて
tr/\\//d; # 2回処理しています
2023/08/20(日) 20:26:08.36ID:vZ93TkLb
単純に

s/\\//g

でええんとちゃうん
8290824
垢版 |
2023/08/20(日) 20:59:59.16ID:tG3c9Vi+
>>828
2回処理するのでindexで調べてtr使った方が早いでしょ

hogehoge "aaa bbb ccc ddd"
hogehoge "eee \"fff\" \"ggg\" hhh"

目的文字列

aaa bbb ccc ddd
eee "fff" "ggg" hhh
2023/08/20(日) 21:32:41.19ID:vZ93TkLb
一発変換したいんじゃないの?

s/hogehoge\s+(.+)/eval $1/e
8310824
垢版 |
2023/08/20(日) 21:58:11.37ID:tG3c9Vi+
>>830
ありがとうございます
s/hogehoge\s+"(.+)".*\n/$1/;

これで弾いてるの"以後にコメントがあるかもしれないからです
2023/08/21(月) 20:43:15.01ID:Lyi1TDoI
eval思い付く人すごい、甲子園優勝
2023/08/21(月) 23:39:46.20ID:Frb3PbHb
>>824
これはUnix名前空間の全引数を" "で括ったものをほどくだけに見えるので、例えばLinux上では
文字列変換ではなく、printfコマンドを通せば一発だが。

$ printf '%s' "aaa \"bbb\" \"ccc\" ddd"
# aaa "bbb" "ccc" ddd
2023/08/21(月) 23:52:08.69ID:Frb3PbHb
見落としてたので補足しておくと、>>831のコメントの件もUnixの書式に則ったものなら大丈夫。
$ printf '%s' "aaa \"bbb\" \"ccc\" ddd" # ←のようにコメントがあっても、↓になる
# aaa "bbb" "ccc" ddd
2023/08/22(火) 01:30:15.60ID:RW2iO7Jr
>>perl 正規表現で一発変換できませんか

まあ参考にはなるけど質問の条件無視してドヤ顔で語られてもねえ‥
836デフォルトの名無しさん
垢版 |
2023/08/22(火) 02:16:49.08ID:NJ9SPgik
>>833
単にシェルが引数処理してるだけじゃん
これで十分だろ
echo "aaa \"bbb\" \"ccc\" ddd" #
2023/08/22(火) 12:38:02.82ID:NJ9SPgik
>>831
(perlの)コメントがあっても動作するよ
8380824
垢版 |
2023/08/23(水) 09:58:00.37ID:yShv/GWA
>>837
ありがとうございます、勘違いしてました
eval評価だからコメントあっても行けますね
2023/09/02(土) 20:40:48.54ID:PozNjemk
●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
IPアドレス部分だけ抽出したいです
各セグメントが1-255の範囲内かどうかのチェックは無くてもOKです
※対象データの内xは文字としてのアルファベットのxです
 \r\nは改行コードです
よろしくお願いします

●対象データ
x\r\n192.168.10.1\r\n0\r\n\r\n

●希望する結果
192.168.10.1
840デフォルトの名無しさん
垢版 |
2023/09/02(土) 22:43:12.64ID:JbZUXP6Y
(%d+%.%d+%.%d+%.%d+)
841839
垢版 |
2023/09/03(日) 01:48:07.24ID:BSGxD5eG
ありがとうございました
2023/09/03(日) 01:50:43.78ID:BSGxD5eG
●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
コロンとスペースの右側の数字だけ抽出したいです
よろしくお願いします

●対象データ
abe-gkm: 12

●希望する結果
12
2023/09/03(日) 06:04:52.16ID:ldBVlws1
自分で覚える気は一切ないんですね
2023/09/03(日) 14:44:19.10ID:QHfhMJE9
LUA5.1リファレンスマニュアル 文字列操作
http://milkpot.sakura.ne.jp/lua/lua51_manual_ja.html#5.4
2023/09/03(日) 17:01:33.87ID:7kfz6vsc
訂正がありました
よろしくお願いします

●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
最後に現れるコロンの右側だけ抽出したいです

●対象データ
ab:e-gkm: 12

●希望する結果
12
846デフォルトの名無しさん
垢版 |
2023/09/03(日) 17:20:26.33ID:ruPOb/mk
訂正がありました
よろしくお願いします

●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
最後に現れるコロンの右側だけ抽出したいです

●対象データ
ab:e-gkm: ::12

●希望する結果
12
2023/09/03(日) 17:22:38.45ID:7kfz6vsc
>>846は別の人なのでトリップを付けておきます
よろしくお願いします
848デフォルトの名無しさん
垢版 |
2023/09/03(日) 17:42:25.87ID:ruPOb/mk
訂正がありました
よろしくお願いします

●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
最後に現れるコロンの右側だけ抽出したいです

●対象データ
ab:e-gkm: 121212

●希望する結果
12
849デフォルトの名無しさん
垢版 |
2023/09/04(月) 00:12:22.18ID:SsZQexqW
>>843-844
>>846-848
夏休みキッズ達よ、答えられないor嫌なら見なければいい

>>845
[^: ]*$
2023/09/04(月) 13:01:20.01ID:c5K3sEzk
Excelの文字を取り出すLEFT関数、RIGHT関数、MID関数
正規表現でも相当がんばれば再現できなくはないけれど、努力に見合った意味が見つからない
2023/09/04(月) 13:08:00.64ID:nyO3ndTW
>[^: ]*$
こういうの後ろから見るよう最適化されるのかな
2023/09/04(月) 15:41:22.66ID:zA8RUwS0
ややこしい検索は正規表現だけよりも
awkなどで簡単な正規表現とif文や関数を組み合わせる方が早い
2023/09/04(月) 18:55:45.65ID:BoKCZaYW
今回のはややこしくはない
むしろ簡単
854デフォルトの名無しさん
垢版 |
2023/09/04(月) 19:08:28.07ID:8gjbapjk
>>849
アホらしすぎて・・・
855デフォルトの名無しさん
垢版 |
2023/09/04(月) 20:45:35.27ID:DgpCgO2R
>>854
相手の技量は千差万別
自分を基準に考えるからキッズなんだ
たとえそれがHello World!レベルであったとしても
テンプレ使ってちゃんと質問されているのだから
2023/09/04(月) 20:55:42.10ID:Tkae+foX
>>855
気に入らないレスに絡んでるのは貴方も同じ
嫌なら見るな
857デフォルトの名無しさん
垢版 |
2023/09/04(月) 20:58:59.14ID:DgpCgO2R
>>856
気に入る気に入らないじゃなくて
スレを荒らさないで欲しいって事
858デフォルトの名無しさん
垢版 |
2023/09/04(月) 21:05:24.79ID:NKgrLrxG
訂正がありました
よろしくお願いします

●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
最後に現れるコロンの右側だけ抽出したいです

●対象データ
ab:e-gkm: 33

●希望する結果
12
2023/09/04(月) 21:07:00.10ID:3GWjSEvz
>>849
ありがとうございました
860デフォルトの名無しさん
垢版 |
2023/09/04(月) 21:16:52.45ID:NTqFdCv7
自演荒らしが捗るなw
2023/09/04(月) 22:23:04.68ID:0+pR+e5l
コロンが無い場合はマッチでよかったのかな?

>>851
されない
right to leftにするオプションが必要
対象文字列が短ければ大差ない
862デフォルトの名無しさん
垢版 |
2023/09/06(水) 02:59:30.44ID:lSkku4oe
インフラ屋は性格良い
プログラマは性格悪い
2023/09/06(水) 07:21:34.46ID:yobQfJn+
俺はインフラ屋
性格良いよ
864デフォルトの名無しさん
垢版 |
2023/09/06(水) 09:14:00.91ID:UTcPybKQ
プログラマは正確悪いというより
無駄な事をしたくないだけっていう人が多い
865デフォルトの名無しさん
垢版 |
2023/09/06(水) 09:18:47.39ID:BQBp+rCO
無駄な事をしたくないと思いつつ性格が悪いから文句だけは言う人が多い
2023/09/06(水) 09:44:01.14ID:HD7oM5sP
態度と性格を区別できない人々
2023/09/06(水) 09:45:30.51ID:Ygn1Ao5e
>>866
能書きだけはいっちょまえ
2023/09/06(水) 09:57:30.15ID:tVigPql1
それがプログラマの性分
2023/09/08(金) 08:44:01.58ID:07e9DMWQ
ぼくはインフラ屋だけど性格悪い(´・ω・`)すまんね
2023/09/11(月) 00:45:50.96ID:cvO0nzmM
●Regular Expressionの使用環境
サクラエディタ

●検索か置換か?
検索

●説明
REM半角スペースを検索してREM部分のみに一致させたい

●対象データ
REM TEST

●希望する結果
REM
871870
垢版 |
2023/09/11(月) 00:53:10.22ID:cvO0nzmM
/REM(?= )/kで出来ました
872デフォルトの名無しさん
垢版 |
2023/09/13(水) 16:39:29.09ID:qhl2oEPa
●Regular Expressionの使用環境
javascript

●検索か置換か?
検索

●説明
( ) 括弧の中の文字列の特定の文字の時だけ一致させたいです
例でいえば括弧の中が「横浜」の時だけヒットさせたいです

●対象データ
東京都(ただし新宿区は除く)に住みたいけれど、神奈川県(だけど横浜は家賃が)でもいい

●希望する結果
だけど横浜は家賃が
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況