Regular Expression(正規表現) Part16

レス数が950を超えています。1000を超えると書き込みができなくなります。
1デフォルトの名無しさん
垢版 |
2021/11/03(水) 19:50:01.71ID:ebAE+z9+
Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part15
https://mevius.5ch.net/test/read.cgi/tech/1568640311/


次スレは>>980宜しく
天ぷら等>>2以降
2023/09/04(月) 13:08:00.64ID:nyO3ndTW
>[^: ]*$
こういうの後ろから見るよう最適化されるのかな
2023/09/04(月) 15:41:22.66ID:zA8RUwS0
ややこしい検索は正規表現だけよりも
awkなどで簡単な正規表現とif文や関数を組み合わせる方が早い
2023/09/04(月) 18:55:45.65ID:BoKCZaYW
今回のはややこしくはない
むしろ簡単
854デフォルトの名無しさん
垢版 |
2023/09/04(月) 19:08:28.07ID:8gjbapjk
>>849
アホらしすぎて・・・
855デフォルトの名無しさん
垢版 |
2023/09/04(月) 20:45:35.27ID:DgpCgO2R
>>854
相手の技量は千差万別
自分を基準に考えるからキッズなんだ
たとえそれがHello World!レベルであったとしても
テンプレ使ってちゃんと質問されているのだから
2023/09/04(月) 20:55:42.10ID:Tkae+foX
>>855
気に入らないレスに絡んでるのは貴方も同じ
嫌なら見るな
857デフォルトの名無しさん
垢版 |
2023/09/04(月) 20:58:59.14ID:DgpCgO2R
>>856
気に入る気に入らないじゃなくて
スレを荒らさないで欲しいって事
858デフォルトの名無しさん
垢版 |
2023/09/04(月) 21:05:24.79ID:NKgrLrxG
訂正がありました
よろしくお願いします

●Regular Expressionの使用環境
Lua

●検索か置換か?
検索

●説明
最後に現れるコロンの右側だけ抽出したいです

●対象データ
ab:e-gkm: 33

●希望する結果
12
2023/09/04(月) 21:07:00.10ID:3GWjSEvz
>>849
ありがとうございました
860デフォルトの名無しさん
垢版 |
2023/09/04(月) 21:16:52.45ID:NTqFdCv7
自演荒らしが捗るなw
2023/09/04(月) 22:23:04.68ID:0+pR+e5l
コロンが無い場合はマッチでよかったのかな?

>>851
されない
right to leftにするオプションが必要
対象文字列が短ければ大差ない
862デフォルトの名無しさん
垢版 |
2023/09/06(水) 02:59:30.44ID:lSkku4oe
インフラ屋は性格良い
プログラマは性格悪い
2023/09/06(水) 07:21:34.46ID:yobQfJn+
俺はインフラ屋
性格良いよ
864デフォルトの名無しさん
垢版 |
2023/09/06(水) 09:14:00.91ID:UTcPybKQ
プログラマは正確悪いというより
無駄な事をしたくないだけっていう人が多い
865デフォルトの名無しさん
垢版 |
2023/09/06(水) 09:18:47.39ID:BQBp+rCO
無駄な事をしたくないと思いつつ性格が悪いから文句だけは言う人が多い
2023/09/06(水) 09:44:01.14ID:HD7oM5sP
態度と性格を区別できない人々
2023/09/06(水) 09:45:30.51ID:Ygn1Ao5e
>>866
能書きだけはいっちょまえ
2023/09/06(水) 09:57:30.15ID:tVigPql1
それがプログラマの性分
2023/09/08(金) 08:44:01.58ID:07e9DMWQ
ぼくはインフラ屋だけど性格悪い(´・ω・`)すまんね
2023/09/11(月) 00:45:50.96ID:cvO0nzmM
●Regular Expressionの使用環境
サクラエディタ

●検索か置換か?
検索

●説明
REM半角スペースを検索してREM部分のみに一致させたい

●対象データ
REM TEST

●希望する結果
REM
871870
垢版 |
2023/09/11(月) 00:53:10.22ID:cvO0nzmM
/REM(?= )/kで出来ました
872デフォルトの名無しさん
垢版 |
2023/09/13(水) 16:39:29.09ID:qhl2oEPa
●Regular Expressionの使用環境
javascript

●検索か置換か?
検索

●説明
( ) 括弧の中の文字列の特定の文字の時だけ一致させたいです
例でいえば括弧の中が「横浜」の時だけヒットさせたいです

●対象データ
東京都(ただし新宿区は除く)に住みたいけれど、神奈川県(だけど横浜は家賃が)でもいい

●希望する結果
だけど横浜は家賃が
873デフォルトの名無しさん
垢版 |
2023/09/13(水) 16:41:17.76ID:qhl2oEPa
ごめんなさい872の追記です
括弧は半角全角どちらでも対応できるようにしていただけると助かります
2023/09/13(水) 18:37:54.95ID:3qYEVVGq
>>872
[((]\K[^))]*横浜[^))]*+(?=[))])
2023/09/13(水) 20:55:54.73ID:T8/GYmvT
対象データがそれだけきれいに整っているならこれでいいんじゃないかな
[^()()]*横浜[^()()]*(?=[))])
2023/09/13(水) 21:32:58.14ID:qhl2oEPa
>>874-875
ありがとうございます。875さんの方でプログラムがパーフェクトに動くものが叶いました。
2023/09/14(木) 00:22:01.99ID:L47o5ku7
鬼車は結局Unicode15対応版がリリースされなかったな
2023/09/16(土) 22:56:08.84ID:dIGSEJlt
同じワードの繰り返し(回数指定)を除外する正規表現を教えてください
2023/09/17(日) 07:04:17.16ID:jNYPDoV+
除外??
2023/09/17(日) 10:23:51.82ID:ht+84nM7
こういうこと?
abcxyzacz → bxy
2023/09/17(日) 14:29:52.53ID:yn1jo0MJ
"にゃんたま"が3回以上登場する文字列から全ての"にゃんたま"を取り除く

\A(?=(?:(?:(?!にゃんたま)[\s\S])*にゃんたま){3})((?:(?!にゃんたま)[\s\S])*)にゃんたま|\G((?:(?!にゃんたま)[\s\S])*)にゃんたま
2023/09/17(日) 14:33:30.19ID:yn1jo0MJ
置換後の文字列: $1$2
2023/09/17(日) 15:23:07.94ID:yn1jo0MJ
スマン、\Gの前に(?!\A)を置いてくれ
2023/09/17(日) 16:53:03.56ID:oNTID2ix
3回連続して出現する単語を削除
//javascript
s = '鼠牛虎兎龍蛇ねこねこねこ牛牛牛虎虎蛇蛇蛇蛇蛇龍龍兎';
console.log(s.replace(/(?:(.+)\1{2})/g, ''));

#python
s = '鼠牛虎兎龍蛇ねこねこねこ牛牛牛虎虎蛇蛇蛇蛇蛇龍龍兎'
print(re.sub(r'(?:(.+)\1{2})', '', s))
2023/09/17(日) 17:05:16.38ID:Fm9hMrUa
\nを30回以上は非表示するにはどうしたらいいですか
2023/09/17(日) 17:18:53.47ID:jNYPDoV+
非表示??
2023/09/17(日) 17:41:10.52ID:PjfamyxI
\nがn回以上除外で
2023/09/17(日) 22:51:45.08ID:jyrM2LRG
●Regular Expressionの使用環境
Perl

●検索か置換か?
検索

●説明
後ろから2つ目の/以降を取得したい

●対象データ
/a/bb/ccc/dddd/eeeee/cgi/sample.cgi

●希望する結果
/cgi/sample.cgi

お願いします
2023/09/18(月) 01:07:38.93ID:e1xt8o+y
.*\K/.*/.*
2023/09/23(土) 15:35:56.62ID:UU1JiicL
何回連続とか何番目とかってのは正規表現じゃなくて言語でなんとかした方がいいのでは
可読性的な観点からでも
2023/09/25(月) 14:32:09.00ID:w/fMdm7Q
正規表現じゃなく言語表現をなんとかした方がいい
2023/09/25(月) 15:45:13.07ID:b6Bm13IE
正規表現じゃなく性器表現とした方がいい
2023/09/25(月) 15:46:57.59ID:b6Bm13IE
正規表現じゃなく性器表現とかなんとかにした方がいい
2023/09/26(火) 17:43:27.65ID:WhLFttTP
添削って受け付けてたっけ?
自分が求める結果は得られてるけど、それでいいのかどうか
2023/10/03(火) 15:05:59.66ID:pjWozC8L
>>894
You ここで見せちゃいなよ、meが見てあげるよ
896デフォルトの名無しさん
垢版 |
2023/10/15(日) 05:59:22.52ID:qeiyy+lM
oniguruma Release 6.9.9

Update Unicode version 15.1.0
NEW API: ONIG_OPTION_MATCH_WHOLE_STRING
Fixed: (?I) option was not enabled for character classes (Issue #264).
Changed specification to check for incorrect POSIX bracket (Issue #253).
Changed [[:punct:]] in Unicode encodings to be compatible with POSIX definition. (Issue #268)
Fixed: ONIG_OPTION_FIND_LONGEST behavior


> ONIG_OPTION_MATCH_WHOLE_STRING マッチした終端の位置がendになることを要求

マッチした開始の位置はstartでなくても良いらしい

oniguruma/test/test_options.c
x2(ONIG_OPTION_MATCH_WHOLE_STRING, "a", "aaaa", 3, 4); // OK (4文字目のaにマッチ)


> [[:punct:]]

Changed the definition of [:punct:] in Unicode encodings from \p{P} to \p{PosixPunct} = \p{P} + \p{S}.
(PosixPunct is a new addition.)
2023/10/15(日) 06:13:36.53ID:qeiyy+lM
> Fixed: ONIG_OPTION_FIND_LONGEST behavior

oniguruma/test/test_options.c
x2(ONIG_OPTION_FIND_LONGEST, "a(b|bc)", "ab", 0, 2); // OK ( "ab" にマッチ)

最左最長一致からガチ最長一致になってる
898デフォルトの名無しさん
垢版 |
2023/10/15(日) 06:27:13.95ID:qeiyy+lM
間違えた、こっちだった

oniguruma/test/test_options.c
x2(ONIG_OPTION_FIND_LONGEST, "a(b|bc)", "abc", 0, 3); // OK ( "abc" にマッチ)


// マルチバイト文字には非対応のまま
x2(ONIG_OPTION_FIND_LONGEST, "ab|あ", "abあ", 2, 5); // OK ( "あ" にマッチ)

UTF-32 にエンコードしてから使えばいいのかしら
2023/10/20(金) 08:36:56.63ID:S3IcPVBq
Strawberry Perl
https://strawberryperl.com/releases.html

32bit版が出なくなった。64bitに乗り換えよう。(全銀)
2023/10/20(金) 16:11:58.36ID:8kCGh912
>>899
ZIP edition が無い…
2023/10/21(土) 14:33:23.21ID:43n7K7Fq
tar.gzで我慢しなさい
2023/10/29(日) 10:19:38.81ID:zDgIETfO
アルファベットのみにマッチする文字クラスを[a-Z]と書けない
ASCIIコード表を決めた人達は今頃失敗したと思ってるんだろうか
2023/10/29(日) 12:34:50.74ID:vOjtdftv
初心者向けクイズ
Q: /w にマッチするアルファベット以外の文字がひとつあります。その文字とは、一体何でしょうか?
2023/10/29(日) 12:42:28.97ID:BaFdPLsN
アンダースコート
2023/10/29(日) 12:45:28.88ID:zDgIETfO
アンダースロー
2023/10/29(日) 13:20:31.22ID:y5KdwCim
アンダーニンジャ
2023/10/29(日) 15:41:31.84ID:zDgIETfO
ニンジャリバンバン
2023/10/29(日) 19:20:26.89ID:dO2GnsiA
正解はスラッシュでした
2023/10/29(日) 19:49:37.09ID:zDgIETfO
(/w\)
2023/10/30(月) 20:06:53.46ID:wzEyUd/K
ASCIIコード表について調べてみたら特定の1ビットを0にするか1にするかで
大文字小文字が変換出来るようにするための順番らしい
並びの便利さより処理効率が優先されてた、先人の知恵に敬礼
2023/10/30(月) 20:59:27.53ID:dhg2pdyL
どうせ範囲チェックはしないといけないんだから
それだったら引き算や足し算で大文字小文字変換できちゃう
まあ昔はbit演算より算術演算にステップ数が掛かってたからその当時は良かったんだろうけど
2023/10/31(火) 18:36:44.19ID:X00tNW2d
今時のマシンのことしか考えなくていいなら足し引きで良さそうだけど
遅いマシンのことまで考えるならビット演算一択になるんだろうな

アルファベットが32文字だったら隙間出来なかったのに
SHIFT_JISのダメ文字問題も最初からEUC-JPにしとけば苦労しなかったのにな
2023/10/31(火) 21:57:53.63ID:27STA2Pg
正規表現は改行の扱いが難しいなあ
やらかすときはたいてい改行の処理でミスる
2023/11/01(水) 09:19:33.19ID:DBguvWIQ
. が改行にマッチしないのを失念してってのは何度もやってる
915デフォルトの名無しさん
垢版 |
2023/11/01(水) 11:38:27.61ID:ikHnu6pN
●Regular Expressionの使用環境
サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0)

●検索か置換か?
検索

●説明
キムラタクヤの略称を検索するために
(キムラ)と(タクヤ)からそれぞれ1字以上使って並べた単語にマッチする正規表現を作りました
^(キ|ム|ラ|キム|ムラ|キラ|キムラ)(タ|ク|ヤ|タク|クヤ|タヤ|タクヤ)$
文字数や単語数が増えたときひどいのでもっと上手な書き方を教えてください

●マッチする文字列
キク
キラク
ムラタヤ

●マッチさせない文字列
キム
キムラ
タクヤ
916デフォルトの名無しさん
垢版 |
2023/11/01(水) 11:38:37.53ID:ikHnu6pN
●Regular Expressionの使用環境
サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0)

●検索か置換か?
検索

●説明
キムラタクヤの略称を検索するために
(キムラ)と(タクヤ)からそれぞれ1字以上使って並べた単語にマッチする正規表現を作りました
^(キ|ム|ラ|キム|ムラ|キラ|キムラ)(タ|ク|ヤ|タク|クヤ|タヤ|タクヤ)$
文字数や単語数が増えたときひどいのでもっと上手な書き方を教えてください

●マッチする文字列
キク
キラク
ムラタヤ

●マッチさせない文字列
キム
キムラ
タクヤ
2023/11/01(水) 12:08:10.81ID:oh2mJ3WA
^(?:キ?ム?ラ?)(?<=\S)(?=\S)(?:タ?ク?ヤ?)$
2023/11/01(水) 14:40:34.08ID:DBguvWIQ
同じ人かは分からないけど超優秀な回答者がここ1,2年前から来てくれてる
多くの閲覧者にとっても勉強になるからありたがいことです
2023/11/01(水) 16:00:59.53ID:G1jsC9Xy
じつはその人AIだよ
2023/11/01(水) 17:01:21.99ID:ikHnu6pN
>>917
ありがとうございます動きました
3語以上の場合はこれでできてますか?
^(?:キ?ム?)(?<=\S)(?=\S{2})((?:ラ?タ?)(?<=\S{2})(?=\S)(?:ク?ヤ?))$
2023/11/01(水) 17:03:51.95ID:DBguvWIQ
AIと言われても違和感が無いから困る、人間だったほうがいい

サクラエディタを少し触ってみたが
\r を \c-
\n を \c*
に書き換えてもマッチした

このことは恐らくbregoing.dllの作者氏でも知らないのでは
2023/11/01(水) 18:26:59.70ID:upaRAmPk
>>920
キムクヤにマッチするから駄目だね
>>916のように自分で組み合わせを展開する以外の方法はわからないね
2023/11/01(水) 21:03:12.97ID:bvA/YDb8
最後で語数チェックすれば?
(?<=\S{3})$
2023/11/01(水) 22:35:57.76ID:8ROMQdip
^(キ?ム?ラ?)(タ?ク?ヤ?)$(?!\1|\2)

^(キ?ム?)(ラ?タ?)(ク?ヤ?)$(?!\1)(?!\2)(?!\3)
^(キ?ム?)(?!.*+$\k<-1>)(ラ?タ?)(?!.*+$\k<-1>)(ク?ヤ?)(?!.*+$\k<-1>)$
^(?=(.++))(?:キ?ム?)(?!\k<-1>)(?=(.++))(?:ラ?タ?)(?!\k<-1>)(?=(.++))(?:ク?ヤ?)(?!\k<-1>)$
2023/11/02(木) 08:03:41.39ID:ztJD977Y
文字数も単語数も拡張性もばっちりです
ご指導ありがとうございました
2023/11/02(木) 09:18:56.98ID:/CeYlFrx
> $(?!\1|\2)
これもすごい、こんなの思い付かない
私なら(?(1))を使おうとしてグチャる
こういうのを作れる人になりたかった、羨ましい限りだ
927デフォルトの名無しさん
垢版 |
2023/11/02(木) 09:22:55.91ID:kxWwWLf8
>>910
アルファベットが32文字だったら誰も困らなかったはず
2023/11/02(木) 11:56:22.72ID:YMFW9tw8
各文字列から最低2文字以上含まれてる略称にだけマッチすることもできる?
2023/11/02(木) 13:01:27.99ID:eLjTHeK1
^(?=.(.++))(?:キ?ム?ラ?)(?!.?\k<-1>)(?=.(.++))(?:タ?ク?ヤ?)(?!.?\k<-1>)$
^(?=.{1}(.++))(?:キ?ム?ラ?)(?!.{0,1}\k<-1>)(?=.{1}(.++))(?:タ?ク?ヤ?)(?!.{0,1}\k<-1>)$
2023/11/02(木) 19:36:53.03ID:/CeYlFrx
ラノベ 「1日でキムタクの一般項が出来てるからパソコンそっと閉じて見なかったことにする」
2023/11/03(金) 08:34:37.96ID:cY7DSC5H
^[キムラ]{1,2}[タクヤ]{1,2}$
2023/11/03(金) 09:08:43.70ID:PqFUo1lf
それはラキクタにマッチするからボツ(==.)
2023/11/03(金) 10:43:13.94ID:cY7DSC5H
ラキクタにマッチしたらダメって条件にはないんだけど‥
2023/11/03(金) 11:44:22.65ID:PqFUo1lf
確かに言葉ではそんな条件は書いてないね、曖昧3cm
2023/11/03(金) 11:50:18.95ID:zxzLPr4V
^?キ?ム?ラ?タ?クヤ?$が略称条件な流れ?
2023/11/03(金) 12:14:21.11ID:sAJhyk0D
^(?=A)(?=B).*$
2023/11/03(金) 12:18:03.55ID:PqFUo1lf
>>916を読めば文字順通りと受け取るのが妥当だね

ちなみにもしこのコマンドがあったら簡単に書けた
https://www.proxomitron.info/45/help/Matching-Commands.html#TST

^(キ?ム?ラ?)$TST(\1=..+)(タ?ク?ヤ?)$TST(\2=..+)$

perlなら(??{code})でこのコマンドと同じことが出来るけどサクラエディタのdllでは無理
dllに$SETと$TSTが実装されたら正規表現の幅がめっちゃ広がるけど無理そう

// \1 に日本語表記での色が代入される
blue$SET(1=青)|yellow$SET(1=黄)|red$SET(1=赤)
2023/11/03(金) 13:00:30.59ID:RnAsJxc7
>>924
^(?=(キ?ム?ラ?)(タ?ク?ヤ?)$)[キムラ]{1,}[タクヤ]{1,}$

(?=(キ?ム?ラ?)(タ?ク?ヤ?)(.*+))[キムラ]{1,}[タクヤ]{1,}(?=\3)
キキムタククク
2023/11/03(金) 18:04:12.94ID:328LomOy
キムラタクヤ人気で🌿
940デフォルトの名無しさん
垢版 |
2023/11/03(金) 19:14:55.49ID:3J2AA+3k
>>937
他人には厳しい条件はたすくせに外部コマンドやperl使うのはokなのかw
2023/11/03(金) 20:09:52.31ID:PqFUo1lf
知ってる外部コマンドは使っていいに決まってる
頭の中では質問見た瞬間に出来てたよ
2023/11/03(金) 20:13:40.11ID:/gQFYHMn
「課す」を「はたす」って読んでるってマ?🤣
2023/11/03(金) 21:12:42.60ID:PqFUo1lf
この外部コマンドを考えた方は2004年に亡くなっている
https://en.wikipedia.org/wiki/Scott_R._Lemmon

20年前にこのコマンドを実装済みだったのはやばいな
perlの正規表現ですらそんなに機能が無かった時代だ
2023/11/03(金) 21:17:14.08ID:N1OKG/2k
最初から略称と言ってるのに文字順不問だと思うほうがどうかしてる
2023/11/04(土) 08:36:40.13ID:w1sIftMp
(正直|ぶっちゃけぇ?)高度すぎて理解が追いつかない
2023/11/04(土) 11:16:01.85ID:PZuBSK2Q
カラクリを簡単に説明しよう

1、 (?:キ?ム?ラ?) で文字順を固定
2、 その他の部分でカッコ内でマッチする文字数の制限をかけている

例、 (?:キ?ム?ラ?) が0文字にマッチしたとしよう

\1が捕獲した中身は0文字になる
(?!\1) の\1の中身が0文字だったら (?!\1) は (?!) と同じ動作になる
(?!) は常にマッチを失敗させるから\1が0文字ならマッチ出来ない
結果的にこれが文字数制限になっている

ちなみに正規表現にカウント機能があればもっと簡単に書けていた
(
 (?:キ$COUNT(x))?
 (?:ム$COUNT(x))?
 (?:ラ$COUNT(x))?
)
$COUNT(0<x)

perlは(?{code})でカウント可能、鬼車もカウント機能を実装済
2023/11/04(土) 14:47:51.87ID:Xn6+uSVd
perlジジイこのスレでも自演してんのかw
2023/11/04(土) 17:37:08.01ID:PZuBSK2Q
COBOLジジイからperlジジイにランクアップ
2023/11/05(日) 13:03:00.89ID:q8heJbgz
サクラエディタ

// 1
\1(a)

// 2
\k<name>(?<name>a)

2は1を名前付き括弧にしただけ
1は実行してもマッチに失敗するだけだが2はエラー
これはどちらもエラーになるほうが良い
2023/11/05(日) 13:07:33.08ID:q8heJbgz
ん?本当にそうか?分からん
2023/11/05(日) 15:52:16.56ID:q8heJbgz
2がエラーになるのは誤りだ、異論ある?
いつもの超優秀な人(AI?)の意見を聞かせて欲しい
レス数が950を超えています。1000を超えると書き込みができなくなります。
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況