Regular Expression(正規表現) Part16

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2021/11/03(水) 19:50:01.71ID:ebAE+z9+
Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part15
https://mevius.5ch.net/test/read.cgi/tech/1568640311/


次スレは>>980宜しく
天ぷら等>>2以降
2023/07/17(月) 02:00:45.07ID:MFjOLYv6
改行厨たいさく
[^\n]+([\n\r\s]{2,})[^\n]+([\n\r\s]{2,})[^\n]+([\n\r\s]{2,})[^\n]+
2023/07/20(木) 17:25:16.42ID:OqTU1F4P
>>785
そういうの出来るといいですけどねえ
2023/07/21(金) 15:55:34.48ID:GwV7ay2N
>>784
C言語で文字列から部分文字列を取り出す関数をググったら「そんなのねーよ、自作しろ」だった
C言語をちゃんと勉強しないと無理だな
2023/07/23(日) 00:50:40.93ID:hdFkAV/t
hage【ZEN123】hoge456789
上記の【】内の全角英数字だけを半角にする
正規表現では無理なパターンの例か
2023/07/23(日) 05:19:55.24ID:BnGP1dsy
正規表現ライブラリを使う側のアプリに変換関数を実装すれば可能になるので
そういう正規表現環境は既に存在してるかも?
今のテキストエディタでもマクロでなら出来るものがありそう
2023/07/23(日) 09:48:00.20ID:PHWyKwrY
秀丸のようにマクロ使わずに検索→変換できるエディタもあるしね
2023/07/23(日) 13:07:11.02ID:BnGP1dsy
秀丸と言えば鬼車を秀丸で使えるようにしようとしてる方がいるから
お願いすれば 全角->半角変換 や >>785 の置換に対応してもらえるかも?

本家の最新の鬼車の秀丸エディタからの利用方法
www2.maruo.co.jp/hidesoft/2/x39752_.html
2023/07/23(日) 15:10:19.87ID:nlZnqujR
>>805
それは、一時期そこら中で暴れていた「触れてはいけない人」のヤツだねw
2023/07/23(日) 16:14:08.28ID:BnGP1dsy
その点は賛否あるだろうけど技術力もモチベも高そうな方だから期待してる
2023/07/24(月) 12:53:06.11ID:LBGWnldn
> 全角->半角変換 や >>785 の置換に対応

正規表現の中での表記はどういう仕様にするのがベストなのかな?
新しい予約語(?)の予感
2023/07/25(火) 00:28:01.42ID:ijwgoKNu
「正規表現には方言がある」
エディターを乗り換えた時に初めて気付かされたな
2023/07/25(火) 01:58:51.32ID:DaPN/KaH
\1(sed系)なのか、$1(perl系)なのかは、最初はいつも逆をやってしまう
2023/07/25(火) 02:10:59.59ID:m8SWwEXi
\1ってあちこちにあるものだったのか
EmEditorってエディタがそれでなんだこれって思ってた
2023/07/25(火) 16:23:19.14ID:hmH9EM9U
Onigumoで検索して気持ち悪くなる定期
2023/07/29(土) 20:32:41.26ID:xNvNUPTs
詳説正規表現の1章だけとりあえず読み終えたけど正規表現の使いどころがわからない
正規表現の便利な使い方教えて!
2023/07/29(土) 21:44:23.17ID:slvWQQxm
>>813
^(?=.*正規表現)(?=.*教えて)
2023/07/29(土) 21:46:27.76ID:slvWQQxm
>>813
途中で送信しちゃった
↓を専ブラのNGwordに入れて正規表現にチェックしてみ
^(?=.*正規表現)(?=.*教えて).*$
2023/07/29(土) 21:49:39.05ID:slvWQQxm
>>813
すまん間違えてたこれ
(?s:(?=.*正規表現)(?=.*教えて)).*$
2023/07/29(土) 21:51:07.45ID:Z2bzRt4C
俺のレス消えちゃうんじゃない?
?=がよくわからないけど後で調べとくよ
2023/07/30(日) 10:33:11.68ID:3uyXLeeN
テキストエディタで置換を行うときに「正規表現」と「選択範囲」をオン

検索: ^
置換: #

選択範囲の全ての行をコメントアウト出来て便利
--------------------------------------------------------

検索: [  \t]+$
置換: (なし)

行末の余計なスペースを削除出来て便利
2023/08/12(土) 18:48:03.89ID:g9Iw6FTW
https://hoge.com/p2io0z.png https://fuga.net/f8qpes.png https://moga.com/6nw4yt.png
の用に1行に複数URLがスペース区切りで記載されているものを、それぞれ単独で抜き出したいです。

https?://(?:[!-~]+.)+[!-~]+
だと最長一致になってしまうようで、1行丸ごと対象になってしまます
最短一致出来ればいいと思うのですが、どう正規表現を弄ればいいか教えてください。
2023/08/12(土) 18:56:16.40ID:IKZkjZuG
http[^\s]+
2023/08/12(土) 19:02:22.92ID:BmgakVsI
>>819
.をエスケープ
2023/08/12(土) 19:14:06.14ID:g9Iw6FTW
>>820
>>821
うぉぉ、ありがとうございました!
2023/08/13(日) 14:38:57.47ID:vv6Q6LsS
突然大きな声で叫ぶな
2023/08/20(日) 13:26:03.91ID:tG3c9Vi+
perl 正規表現で一発変換できませんか
"aaa \"bbb\" \"ccc\" ddd" # これを以下にしたい
aaa "bbb" "ccc" ddd
2023/08/20(日) 13:58:40.55ID:vZ93TkLb
正規表現で
my $s = '"aaa \"bbb\" \"ccc\" ddd"';
$s =~ s/(.*)/eval $s/e;

正規表現を使わずに
my $x = eval '"aaa \"bbb\" \"ccc\" ddd"';
2023/08/20(日) 14:00:17.67ID:vZ93TkLb
>>825
$s =~ s/(.*)/eval $s/e;

  ↓

$s =~ s/(.*)/eval $1/e;
8270824
垢版 |
2023/08/20(日) 20:08:57.65ID:tG3c9Vi+
文字列をevalで再度評価させる
ありがとうございます、勉強になります
ただ文字列にシングルクォートはありません

文字列に2つのパターンがあります
hogehoge "aaa bbb ccc ddd"
hogehoge "aaa \"bbb \"ccc ddd"

s/hogehoge\s+"(.+)".*\n/$1/; # で弾いて
tr/\\//d; # 2回処理しています
2023/08/20(日) 20:26:08.36ID:vZ93TkLb
単純に

s/\\//g

でええんとちゃうん
8290824
垢版 |
2023/08/20(日) 20:59:59.16ID:tG3c9Vi+
>>828
2回処理するのでindexで調べてtr使った方が早いでしょ

hogehoge "aaa bbb ccc ddd"
hogehoge "eee \"fff\" \"ggg\" hhh"

目的文字列

aaa bbb ccc ddd
eee "fff" "ggg" hhh
2023/08/20(日) 21:32:41.19ID:vZ93TkLb
一発変換したいんじゃないの?

s/hogehoge\s+(.+)/eval $1/e
8310824
垢版 |
2023/08/20(日) 21:58:11.37ID:tG3c9Vi+
>>830
ありがとうございます
s/hogehoge\s+"(.+)".*\n/$1/;

これで弾いてるの"以後にコメントがあるかもしれないからです
2023/08/21(月) 20:43:15.01ID:Lyi1TDoI
eval思い付く人すごい、甲子園優勝
2023/08/21(月) 23:39:46.20ID:Frb3PbHb
>>824
これはUnix名前空間の全引数を" "で括ったものをほどくだけに見えるので、例えばLinux上では
文字列変換ではなく、printfコマンドを通せば一発だが。

$ printf '%s' "aaa \"bbb\" \"ccc\" ddd"
# aaa "bbb" "ccc" ddd
2023/08/21(月) 23:52:08.69ID:Frb3PbHb
見落としてたので補足しておくと、>>831のコメントの件もUnixの書式に則ったものなら大丈夫。
$ printf '%s' "aaa \"bbb\" \"ccc\" ddd" # ←のようにコメントがあっても、↓になる
# aaa "bbb" "ccc" ddd
2023/08/22(火) 01:30:15.60ID:RW2iO7Jr
>>perl 正規表現で一発変換できませんか

まあ参考にはなるけど質問の条件無視してドヤ顔で語られてもねえ‥
836デフォルトの名無しさん
垢版 |
2023/08/22(火) 02:16:49.08ID:NJ9SPgik
>>833
単にシェルが引数処理してるだけじゃん
これで十分だろ
echo "aaa \"bbb\" \"ccc\" ddd" #
2023/08/22(火) 12:38:02.82ID:NJ9SPgik
>>831
(perlの)コメントがあっても動作するよ
8380824
垢版 |
2023/08/23(水) 09:58:00.37ID:yShv/GWA
>>837
ありがとうございます、勘違いしてました
eval評価だからコメントあっても行けますね
2023/09/02(土) 20:40:48.54ID:PozNjemk
●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
IPアドレス部分だけ抽出したいです
各セグメントが1-255の範囲内かどうかのチェックは無くてもOKです
※対象データの内xは文字としてのアルファベットのxです
 \r\nは改行コードです
よろしくお願いします

●対象データ
x\r\n192.168.10.1\r\n0\r\n\r\n

●希望する結果
192.168.10.1
840デフォルトの名無しさん
垢版 |
2023/09/02(土) 22:43:12.64ID:JbZUXP6Y
(%d+%.%d+%.%d+%.%d+)
841839
垢版 |
2023/09/03(日) 01:48:07.24ID:BSGxD5eG
ありがとうございました
2023/09/03(日) 01:50:43.78ID:BSGxD5eG
●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
コロンとスペースの右側の数字だけ抽出したいです
よろしくお願いします

●対象データ
abe-gkm: 12

●希望する結果
12
2023/09/03(日) 06:04:52.16ID:ldBVlws1
自分で覚える気は一切ないんですね
2023/09/03(日) 14:44:19.10ID:QHfhMJE9
LUA5.1リファレンスマニュアル 文字列操作
http://milkpot.sakura.ne.jp/lua/lua51_manual_ja.html#5.4
2023/09/03(日) 17:01:33.87ID:7kfz6vsc
訂正がありました
よろしくお願いします

●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
最後に現れるコロンの右側だけ抽出したいです

●対象データ
ab:e-gkm: 12

●希望する結果
12
846デフォルトの名無しさん
垢版 |
2023/09/03(日) 17:20:26.33ID:ruPOb/mk
訂正がありました
よろしくお願いします

●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
最後に現れるコロンの右側だけ抽出したいです

●対象データ
ab:e-gkm: ::12

●希望する結果
12
2023/09/03(日) 17:22:38.45ID:7kfz6vsc
>>846は別の人なのでトリップを付けておきます
よろしくお願いします
848デフォルトの名無しさん
垢版 |
2023/09/03(日) 17:42:25.87ID:ruPOb/mk
訂正がありました
よろしくお願いします

●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
最後に現れるコロンの右側だけ抽出したいです

●対象データ
ab:e-gkm: 121212

●希望する結果
12
849デフォルトの名無しさん
垢版 |
2023/09/04(月) 00:12:22.18ID:SsZQexqW
>>843-844
>>846-848
夏休みキッズ達よ、答えられないor嫌なら見なければいい

>>845
[^: ]*$
2023/09/04(月) 13:01:20.01ID:c5K3sEzk
Excelの文字を取り出すLEFT関数、RIGHT関数、MID関数
正規表現でも相当がんばれば再現できなくはないけれど、努力に見合った意味が見つからない
2023/09/04(月) 13:08:00.64ID:nyO3ndTW
>[^: ]*$
こういうの後ろから見るよう最適化されるのかな
2023/09/04(月) 15:41:22.66ID:zA8RUwS0
ややこしい検索は正規表現だけよりも
awkなどで簡単な正規表現とif文や関数を組み合わせる方が早い
2023/09/04(月) 18:55:45.65ID:BoKCZaYW
今回のはややこしくはない
むしろ簡単
854デフォルトの名無しさん
垢版 |
2023/09/04(月) 19:08:28.07ID:8gjbapjk
>>849
アホらしすぎて・・・
855デフォルトの名無しさん
垢版 |
2023/09/04(月) 20:45:35.27ID:DgpCgO2R
>>854
相手の技量は千差万別
自分を基準に考えるからキッズなんだ
たとえそれがHello World!レベルであったとしても
テンプレ使ってちゃんと質問されているのだから
2023/09/04(月) 20:55:42.10ID:Tkae+foX
>>855
気に入らないレスに絡んでるのは貴方も同じ
嫌なら見るな
857デフォルトの名無しさん
垢版 |
2023/09/04(月) 20:58:59.14ID:DgpCgO2R
>>856
気に入る気に入らないじゃなくて
スレを荒らさないで欲しいって事
858デフォルトの名無しさん
垢版 |
2023/09/04(月) 21:05:24.79ID:NKgrLrxG
訂正がありました
よろしくお願いします

●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
最後に現れるコロンの右側だけ抽出したいです

●対象データ
ab:e-gkm: 33

●希望する結果
12
2023/09/04(月) 21:07:00.10ID:3GWjSEvz
>>849
ありがとうございました
860デフォルトの名無しさん
垢版 |
2023/09/04(月) 21:16:52.45ID:NTqFdCv7
自演荒らしが捗るなw
2023/09/04(月) 22:23:04.68ID:0+pR+e5l
コロンが無い場合はマッチでよかったのかな?

>>851
されない
right to leftにするオプションが必要
対象文字列が短ければ大差ない
862デフォルトの名無しさん
垢版 |
2023/09/06(水) 02:59:30.44ID:lSkku4oe
インフラ屋は性格良い
プログラマは性格悪い
2023/09/06(水) 07:21:34.46ID:yobQfJn+
俺はインフラ屋
性格良いよ
864デフォルトの名無しさん
垢版 |
2023/09/06(水) 09:14:00.91ID:UTcPybKQ
プログラマは正確悪いというより
無駄な事をしたくないだけっていう人が多い
865デフォルトの名無しさん
垢版 |
2023/09/06(水) 09:18:47.39ID:BQBp+rCO
無駄な事をしたくないと思いつつ性格が悪いから文句だけは言う人が多い
2023/09/06(水) 09:44:01.14ID:HD7oM5sP
態度と性格を区別できない人々
2023/09/06(水) 09:45:30.51ID:Ygn1Ao5e
>>866
能書きだけはいっちょまえ
2023/09/06(水) 09:57:30.15ID:tVigPql1
それがプログラマの性分
2023/09/08(金) 08:44:01.58ID:07e9DMWQ
ぼくはインフラ屋だけど性格悪い(´・ω・`)すまんね
2023/09/11(月) 00:45:50.96ID:cvO0nzmM
●Regular Expressionの使用環境
サクラエディタ

●検索か置換か?
検索

●説明
REM半角スペースを検索してREM部分のみに一致させたい

●対象データ
REM TEST

●希望する結果
REM
871870
垢版 |
2023/09/11(月) 00:53:10.22ID:cvO0nzmM
/REM(?= )/kで出来ました
872デフォルトの名無しさん
垢版 |
2023/09/13(水) 16:39:29.09ID:qhl2oEPa
●Regular Expressionの使用環境
javascript

●検索か置換か?
検索

●説明
( ) 括弧の中の文字列の特定の文字の時だけ一致させたいです
例でいえば括弧の中が「横浜」の時だけヒットさせたいです

●対象データ
東京都(ただし新宿区は除く)に住みたいけれど、神奈川県(だけど横浜は家賃が)でもいい

●希望する結果
だけど横浜は家賃が
873デフォルトの名無しさん
垢版 |
2023/09/13(水) 16:41:17.76ID:qhl2oEPa
ごめんなさい872の追記です
括弧は半角全角どちらでも対応できるようにしていただけると助かります
2023/09/13(水) 18:37:54.95ID:3qYEVVGq
>>872
[((]\K[^))]*横浜[^))]*+(?=[))])
2023/09/13(水) 20:55:54.73ID:T8/GYmvT
対象データがそれだけきれいに整っているならこれでいいんじゃないかな
[^()()]*横浜[^()()]*(?=[))])
2023/09/13(水) 21:32:58.14ID:qhl2oEPa
>>874-875
ありがとうございます。875さんの方でプログラムがパーフェクトに動くものが叶いました。
2023/09/14(木) 00:22:01.99ID:L47o5ku7
鬼車は結局Unicode15対応版がリリースされなかったな
2023/09/16(土) 22:56:08.84ID:dIGSEJlt
同じワードの繰り返し(回数指定)を除外する正規表現を教えてください
2023/09/17(日) 07:04:17.16ID:jNYPDoV+
除外??
2023/09/17(日) 10:23:51.82ID:ht+84nM7
こういうこと?
abcxyzacz → bxy
2023/09/17(日) 14:29:52.53ID:yn1jo0MJ
"にゃんたま"が3回以上登場する文字列から全ての"にゃんたま"を取り除く

\A(?=(?:(?:(?!にゃんたま)[\s\S])*にゃんたま){3})((?:(?!にゃんたま)[\s\S])*)にゃんたま|\G((?:(?!にゃんたま)[\s\S])*)にゃんたま
2023/09/17(日) 14:33:30.19ID:yn1jo0MJ
置換後の文字列: $1$2
2023/09/17(日) 15:23:07.94ID:yn1jo0MJ
スマン、\Gの前に(?!\A)を置いてくれ
2023/09/17(日) 16:53:03.56ID:oNTID2ix
3回連続して出現する単語を削除
//javascript
s = '鼠牛虎兎龍蛇ねこねこねこ牛牛牛虎虎蛇蛇蛇蛇蛇龍龍兎';
console.log(s.replace(/(?:(.+)\1{2})/g, ''));

#python
s = '鼠牛虎兎龍蛇ねこねこねこ牛牛牛虎虎蛇蛇蛇蛇蛇龍龍兎'
print(re.sub(r'(?:(.+)\1{2})', '', s))
2023/09/17(日) 17:05:16.38ID:Fm9hMrUa
\nを30回以上は非表示するにはどうしたらいいですか
2023/09/17(日) 17:18:53.47ID:jNYPDoV+
非表示??
2023/09/17(日) 17:41:10.52ID:PjfamyxI
\nがn回以上除外で
2023/09/17(日) 22:51:45.08ID:jyrM2LRG
●Regular Expressionの使用環境
Perl

●検索か置換か?
検索

●説明
後ろから2つ目の/以降を取得したい

●対象データ
/a/bb/ccc/dddd/eeeee/cgi/sample.cgi

●希望する結果
/cgi/sample.cgi

お願いします
2023/09/18(月) 01:07:38.93ID:e1xt8o+y
.*\K/.*/.*
2023/09/23(土) 15:35:56.62ID:UU1JiicL
何回連続とか何番目とかってのは正規表現じゃなくて言語でなんとかした方がいいのでは
可読性的な観点からでも
2023/09/25(月) 14:32:09.00ID:w/fMdm7Q
正規表現じゃなく言語表現をなんとかした方がいい
2023/09/25(月) 15:45:13.07ID:b6Bm13IE
正規表現じゃなく性器表現とした方がいい
2023/09/25(月) 15:46:57.59ID:b6Bm13IE
正規表現じゃなく性器表現とかなんとかにした方がいい
2023/09/26(火) 17:43:27.65ID:WhLFttTP
添削って受け付けてたっけ?
自分が求める結果は得られてるけど、それでいいのかどうか
2023/10/03(火) 15:05:59.66ID:pjWozC8L
>>894
You ここで見せちゃいなよ、meが見てあげるよ
896デフォルトの名無しさん
垢版 |
2023/10/15(日) 05:59:22.52ID:qeiyy+lM
oniguruma Release 6.9.9

Update Unicode version 15.1.0
NEW API: ONIG_OPTION_MATCH_WHOLE_STRING
Fixed: (?I) option was not enabled for character classes (Issue #264).
Changed specification to check for incorrect POSIX bracket (Issue #253).
Changed [[:punct:]] in Unicode encodings to be compatible with POSIX definition. (Issue #268)
Fixed: ONIG_OPTION_FIND_LONGEST behavior


> ONIG_OPTION_MATCH_WHOLE_STRING マッチした終端の位置がendになることを要求

マッチした開始の位置はstartでなくても良いらしい

oniguruma/test/test_options.c
x2(ONIG_OPTION_MATCH_WHOLE_STRING, "a", "aaaa", 3, 4); // OK (4文字目のaにマッチ)


> [[:punct:]]

Changed the definition of [:punct:] in Unicode encodings from \p{P} to \p{PosixPunct} = \p{P} + \p{S}.
(PosixPunct is a new addition.)
2023/10/15(日) 06:13:36.53ID:qeiyy+lM
> Fixed: ONIG_OPTION_FIND_LONGEST behavior

oniguruma/test/test_options.c
x2(ONIG_OPTION_FIND_LONGEST, "a(b|bc)", "ab", 0, 2); // OK ( "ab" にマッチ)

最左最長一致からガチ最長一致になってる
898デフォルトの名無しさん
垢版 |
2023/10/15(日) 06:27:13.95ID:qeiyy+lM
間違えた、こっちだった

oniguruma/test/test_options.c
x2(ONIG_OPTION_FIND_LONGEST, "a(b|bc)", "abc", 0, 3); // OK ( "abc" にマッチ)


// マルチバイト文字には非対応のまま
x2(ONIG_OPTION_FIND_LONGEST, "ab|あ", "abあ", 2, 5); // OK ( "あ" にマッチ)

UTF-32 にエンコードしてから使えばいいのかしら
2023/10/20(金) 08:36:56.63ID:S3IcPVBq
Strawberry Perl
https://strawberryperl.com/releases.html

32bit版が出なくなった。64bitに乗り換えよう。(全銀)
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況