Regular Expression(正規表現) Part16

**デフォルトの名無しさん** · 2021/11/03(水) 19:50:01.71

Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part15
https://mevius.5ch.net/test/read.cgi/tech/1568640311/

次スレは>>980宜しく
天ぷら等>>2以降

**デフォルトの名無しさん** · 2021/11/03(水) 19:51:06.60

スルーされにくい質問のテンプレと例

●Regular Expressionの使用環境
Java1.5

●検索か置換か？
検索

●説明
各行の1番目のAまでを検索したい

●対象データ
ABCA
BCAA
CABA

●希望する結果
ABCA
^
BCAA
^^^
CABA
^^

※ ^ はアンダーラインだそうな ^^;

**デフォルトの名無しさん** · 2021/11/03(水) 19:51:26.32

◆関連サイト
正規表現メモ
http://www.kt.rim.or.jp/~kbk/regex/regex.html
Perl正規表現雑技
http://www.din.or.jp/~ohzaki/regex.htm

詳説正規表現
http://www.oreilly.co.jp/books/9784873113593/
正規表現クックブック
http://www.oreilly.co.jp/books/9784873114507/

正規表現プログラミングFAQ
http://capslockabcjp.kitunebi.com/faq.html
.NET Framework の正規表現 | Microsoft Docs
https://docs.microsoft.com/ja-jp/dotnet/standard/base-types/regular-expressions
正規表現 - JavaScript | MDN
https://developer.mozilla.org/ja/docs/Web/JavaScript/Guide/Regular_Expressions
鬼車
https://github.com/kkos/oniguruma
鬼雲
https://github.com/k-takata/Onigmo
bregonig.dll(鬼雲の正規表現をサクラエディタ等で使用するためのライブラリ)
http://k-takata.o.oo7.jp/mysoft/bregonig.html
Boost.Regex 1.45.0 (日本語訳)
http://alpha.sourceforge.jp/devel/boost.regex_ja_1_45_0.pdf

秀丸：複数行にまたがる検索について
http://homepage2.nifty.com/jr-kun/hidemaru_qa/4_regulr.html#RETURNS

サクラエディタ：改行
http://d.hatena.ne.jp/myokoym/20101219/1292779058
※ サクラエディタでは複数行に渡る検索・置換は出来ません。

**デフォルトの名無しさん** · 2021/11/03(水) 19:54:20.40

正規表現技術入門
https://gihyo.jp/book/2015/978-4-7741-7270-5

↑の著者の一人であり Onigmo(鬼雲)やbregonig.dll の作者でもあるtakata先生のツイとQiitaの記事
https://twitter.com/k_takata

鬼雲に非包含オペレータを実装した話
https://qiita.com/k-takata/items/4e45121081c83d3d5bfd
https://twitter.com/5chan_nel (5ch newer account)

**デフォルトの名無しさん** · 2021/11/03(水) 20:59:16.79

>>1
スレ立てありがとう

ところで、C++コンパイラごとにbasic_regex::replace()の置換後文字列のバックスラッシュがエスケープされたりされなかったりするのが厄介ですね

**デフォルトの名無しさん** · 2021/11/03(水) 21:43:29.56

https://troutlurefishing.jp/regex.htm
https://murashun.jp/article/programming/regular-expression.html
https://www.itmedia.co.jp/news/articles/2111/02/news174.html

**デフォルトの名無しさん** · 2021/11/04(木) 11:16:22.06

nifty の URL 死んでるな

**デフォルトの名無しさん** · 2021/11/04(木) 11:42:25.33

DeNAが個人ブログから正規表現の表丸パクりしてたのワロタ

**デフォルトの名無しさん** · 2021/11/04(木) 11:59:17.47

丸パクリならまだいい
改変もまともにできないのはヤバい

正規表現の例　マッチする例
Coo+el　　　　Coopel

https://pbs.twimg.com/media/FC7n-5zaUAETKej.jpg

**デフォルトの名無しさん** · 2021/11/04(木) 12:31:32.50

>>9
どゆこと？

**デフォルトの名無しさん** · 2021/11/04(木) 12:38:22.63

>>10
oの1回以上の繰り返しじゃ
pにマッチするわけないです

**デフォルトの名無しさん** · 2021/11/04(木) 12:48:06.96

元がgoogleを例にしてたからこうなったのかな
いずれにしてもワロタ

**デフォルトの名無しさん** · 2021/11/04(木) 12:49:09.54

>>10
https://regex101.com/r/8ri3Js/1

**デフォルトの名無しさん** · 2021/11/04(木) 14:21:26.74

>>11
ああ、勝手に.入れてた
ほんとだひどいな

**デフォルトの名無しさん** · 2021/11/04(木) 14:53:30.31

劣化コピーだから責められてて
上品だったら叩けない訳か

**デフォルトの名無しさん** · 2021/11/05(金) 08:20:43.21

本歌取りと言う言葉もありますし

**デフォルトの名無しさん** · 2021/11/05(金) 11:40:57.68

オマージュ・インスパイア→胡散臭い
本歌取り→凄そう

**デフォルトの名無しさん** · 2021/11/05(金) 12:37:40.52

本歌取りに良いイメージがあるのは、この行為が和歌の世界で伝統的に許されてきたからだ。

**デフォルトの名無しさん** · 2021/11/06(土) 20:39:20.57

祝☆ vim 3o+年

**デフォルトの名無しさん** · 2021/11/06(土) 21:18:49.31

>>19
スレ違い

**デフォルトの名無しさん** · 2021/11/07(日) 00:36:45.12

(/(>>1)/,'$1乙')

**デフォルトの名無しさん** · 2021/11/15(月) 00:01:22.12

今までに無いかつら、非包含オペレータ
https://bokete.jp/odai/533281

**デフォルトの名無しさん** · 2021/11/15(月) 10:09:56.72

vimで文字列処理ってマイナーなのか？
UIでマッチをハイライトしながらパターンを書けるし、書いたパターンと処理はperlやsedのようにコマンドライン引数で渡してシェルスクリプトに組み込める(UI無し、非インタラクティブモード)

vimはバッファするからストリーム処理には向かないくて、パイプにはperlを使うけど、バッチ処理ならvimの方が速い

あと、個人的にアサーションの記法(\@<=等)も、()が深くなりがちなperl系の(?<=等)より好みだ

**デフォルトの名無しさん** · 2021/11/15(月) 10:57:59.40

惜しむらくは、マッチ後の単純でない処理を委託するvimscriptがクソなところだと思う、regex自体は十分パワフル
perlは任意のロジックをperl式に移譲するのが楽、パターンにも書けるし、大抵インラインで済む

vim9で大幅に言語変えるっぽいけど、どうなるやら

**デフォルトの名無しさん** · 2021/11/15(月) 11:19:19.50

()が減るケースって実用的にはあまり無いんじゃないか？アサーションの修飾対象がグループなら、どうせ()が必要になるわけだし

アサーションの\@が後置なのはperl系より一貫性があって良い設計だと思う、?,+,* etcと同列の修飾子とみなせる

**デフォルトの名無しさん** · 2021/11/15(月) 21:36:14.28

非包含オペレータの提案者の方の過去ログ漁ってたらすごいの出てきた
ttp://www.a-k-r.org/pub/2013-06-02-rubyhiroba-akr.pdf

これを使えば２次元の彼女が見つかりそう

**デフォルトの名無しさん** · 2021/11/17(水) 00:30:09.97

pythonで文字列分割をする時
１：・ー└等の1文字と、半角スペース3つ以上のいずれかで文字列を分解したい
re.splitで、思いつく限りやってみましたが、うまく行きませんでした。
[・ー└]|( ){3,}
[・ー└( ){3,}]
[・ー└(( ){3,})]
試しにre.sub(〜, "", ・・・)で文字列が削除出来るかどうか試したときは半角スペース3つが消えました。
いくつかの文字もしくは特定の文字の繰り返し、で文字列を分解する書き方はありますでしょうか

**デフォルトの名無しさん** · 2021/11/17(水) 00:32:30.60

上記で、分かりにくくてすみません、
>１：・ー└等の1文字と、半角スペース3つ以上のいずれかで文字列を分解したい
この「１：」は気にしないでください。
また、re.subで上手く行ったのは、１つめに書いた [・ー└]|( ){3,} です

**デフォルトの名無しさん** · 2021/11/17(水) 01:31:56.09

[・ー└]|( ){3,}　→　合ってる
[・ー└( ){3,}]　→　間違い
[・ー└(( ){3,})] 　→　間違い

文字コードが uft-8 以外で書かれている文書を扱ってるとか？
そうなら　python 文字コード　でググって文書を uft-8 に変換してから split

**デフォルトの名無しさん** · 2021/11/17(水) 02:52:26.84

( → (?:

**デフォルトの名無しさん** · 2021/11/17(水) 04:06:28.28

>>29
そもそも単文字なんだしグループにする必要なくね？

**デフォルトの名無しさん** · 2021/11/17(水) 09:04:44.07

>>28
上でも書かれているが()は要らんよ。
import re
s='これ・はテスートなの└かテストなのです'
print(re.split('[・ー└]| {3,}',s))

**デフォルトの名無しさん** · 2021/11/17(水) 10:12:43.95

正規表現に生の半角スペース使うのは一見気づきにくくて余り好きじゃないなぁ
\x20 にしない人多いのかな

**デフォルトの名無しさん** · 2021/11/17(水) 10:36:58.04

俺は生派
\sを使う人もいるけど俺は嫌

**デフォルトの名無しさん** · 2021/11/17(水) 10:39:17.25

エディタの設定で可視化もできるしね。>半角スペース

**デフォルトの名無しさん** · 2021/11/17(水) 10:39:47.05

this is a pen
を
this\x20is\x20a\x20pen
とかも嫌

**デフォルトの名無しさん** · 2021/11/17(水) 10:56:31.05

文章になってるものまで生で使わないと言うわけじゃないけどな
ブラケットの中で使う場合なんかは生は避けたいわ
[ 　]とかよく見かけるけど、分かりづらい

なお、\sは半角スペースを含むけどそれ自体じゃないので普通は区別して使うでしょ

29 · 2021/11/17(水) 11:01:36.46

this[ ]is[ ]a[ ]pen

proxomitronのフィルタ職人をやってるときはこうやってた
今だと this\ is\ a\ pen かな？使ったことないけどｗ
\s は環境によっては全角スぺにマッチするから気を付けないとね

**デフォルトの名無しさん** · 2021/11/17(水) 11:32:27.19

>>37
エディタ上でははっきりと区別がつくけど
こんな所へ貼る場合は確かに分かり難いね
まあこの場合は目的が分かってるので分かりやすいとも言えるけど

**デフォルトの名無しさん** · 2021/11/17(水) 20:33:29.63

Jane用の正規表現を掲示板に貼るときにはタブ文字のところを【tab】って
書き換えて貼ってたなぁ、しかしJane自体が廃れて使うことが無くなった

27 · 2021/11/17(水) 23:51:26.36

27です
こんなにも早く教えてくださってとても助かりました！
()が要らなかったんですね。勉強になります！
ありがとうございました！

29 · 2021/11/19(金) 20:58:09.22

これの検証してみた

Absence operator is broken #150
https://github.com/k-takata/Onigmo/issues/150

・検証コード (ruby 3.0.2p107 (2021-07-07 revision 0db68f0233) [x64-mingw32])
p /(?~a.*[bv].*c)/.match("000a111v222c333b444c555")

・結果
#<MatchData "000a111v222c333b444">

a～v～c を含んでしまってるのでバグで確定
原因は最初にマッチした段階で検索を打ち切ってしまっていて
別のパターンを見逃している

別のパターンを見つける必要があることは非包含オペレータ提案者さんの論文で
図付きで説明されてるけどこれを見落としてしまったオチ？

直すには論文通りに実装すれば良いだけなので直せないことは無さそう
自分がプログラミング出来れば直したいけどミジンコなので手も足も出ず..
-------------------------------------------------------
>>41 おつー

29 · 2021/11/19(金) 23:35:42.78

ついでにもう１つだけ

Use of \K when the string to match after \K can be empty #152
https://github.com/k-takata/Onigmo/issues/152

これは \K を使ってゼロ幅マッチになった場合に次の検索開始位置が
予期せず1つ進んでしまう問題のようだ

gsubの仕様かなと思ったけど (?<=\w) と \w\K の2つが違う結果になるのは
違和感ある、\K でのゼロ幅マッチ後の pos を進まないようにすれば直りそう

takata先生の代わりにちゃちゃっと始末してくれるスーパーハカーさん募集

29 · 2021/11/20(土) 00:06:32.69

\K より前で文字を消費していない場合は pos は進まないようだ
/\K/　 → pos進まず
/.\K/　→ 予期せずpos進んでしまう

**デフォルトの名無しさん** · 2021/11/20(土) 13:49:08.95

>>42
イシュー150の起票者がオリジナルの鬼車作者さんやんけｗ

29 · 2021/11/20(土) 14:09:45.26

>>45 そうなんだよね、だから気になってた

-------------------------------------------------
>>42 とは別の検証をしてみた

p /(?~a.*b.*c|222)/.match("000a111b222c333")
#<MatchData "000a111b22">

これは期待通りにマッチした、これが正しく動くということは
論文の読み落としではないね、失礼しました

問題は同一posでマッチ文字数が最短になるマッチを見つけなければいけないが
それをしていないことみたいだ
この処理って結構な処理量になりそうだけど大丈夫なのかな？

オペレータ提案者さんのサンプルコードではどうなってるんだろ？
プログラムが読めないから対応出来てるのか分からない..

あまりに重いようなら量指定子を使えるようにしたほうが良いかもしれない
.*　を　.{0,1000}　に書き換えて処理量を限定させるのと同じで
(?~abc){0,1000}　みたいな指定が出来るようにすれば..

29 · 2021/11/25(木) 18:40:51.33

Onigmo のバグの原因となった個所が判明したので書いておこう

正規表現における非包含オペレータの提案
ttps://staff.aist.go.jp/tanaka-akira/pub/prosym49-akr-paper.pdf

この論文のサンプルコードに下記のメソッドがある

def try_alt(r1, r2, str, pos, &block)
try(r1, str, pos, &block)
try(r2, str, pos, &block)
end

これは正規表現で言うと r1|r2 の "|" にあたる動作をする部分のメソッドだが
このサンプルコードでは r1 のマッチが成功した後でも必ず r2 を試す仕様になっている

しかし Onigmo の検索方式では r1 がマッチした後に正規表現の最後までマッチが
成立した場合には r2 が試されない仕様になっている
これにより r2 を通る一部パターンが見落とされる結果となりバグとして出現した

論文中の非包含オペレータのメソッドである def try_absent(r, str, pos) は
上記の def try_alt を使う前提で書かれたものなのでこれをそのまま Onigmo には移植出来ない

サンプルコード方式での処理量を考えるとおそらくこれとはまったく別のアルゴリズムで動く
動作の軽いメソッドを自作しないと Onigmo には導入出来ないのではないだろうか..

29 · 2021/11/25(木) 19:06:15.35

論文3ページ目の右半分に表３がある

r1r2　　｜　　[:seq, r1, r2]

ここの :seq は r1 と r2 を連接するという意味で使われているが
サンプルコードでは :seq を使わず :cat になっている
ここで疑問なのが何故違う名前を使うことになったのか？である

(仮説１)　非包含オペレータ提案者さんは猫が好き

ごろにゃんしながらバックトラックにゃんである

(仮説２)　cat は Unix でよく使われる連結コマンドであり catenate から由来する

これもなかなかの難問である

**デフォルトの名無しさん** · 2021/11/29(月) 20:58:37.88

ある短い英単語が文章に含まれているかどうかを判定したいのですが、
他の英単語の一部に含まれているようなときは除外したいです。
例：検索単語：ap、
○：ap is short of...
○：これはapです
NG：pen pineapple apple pen
つまり、『単語の前後に文字がある場合は、それらがアルファベットでない』という条件を加えたいのですが、
これの実現方法に詰まっています。
[^a-zA-Z]ap[^a-zA-Z]
の至るところに、.*や*や+を様々なパターン試したのですがうまく行かず。。。
うまく行ったと思っても、指定単語が文頭や文末に来て、前後のどちらかに文字がないときはうまく行きません。
どなたかご教授頂けませんでしょうか。

**デフォルトの名無しさん** · 2021/11/29(月) 21:09:24.49

>>49
(?<![a-zA-Z])ap(?![a-zA-Z])
もし英文のみなら
\bap\b
でも可

**デフォルトの名無しさん** · 2021/11/29(月) 21:22:37.81

こんなに早く教えていただいてありがとうございます。
試してみたのですが、うまく行きませんでした。検証方法間違ってますでしょうか？
----------------
value="abc ap abc"
pattern = "(?<![a-zA-Z])ap(?![a-zA-Z])"
re.match(pattern, value)
※何も取得できず
----------------

**デフォルトの名無しさん** · 2021/11/29(月) 21:35:41.08

re.matchじゃなくてre.search
matchは先頭位置からしかマッチするか調べない

**デフォルトの名無しさん** · 2021/11/29(月) 21:41:33.24

ところで
ap'ｓとかap-dataとかもろもろの扱いはいいのか？

**デフォルトの名無しさん** · 2021/11/29(月) 22:02:03.30

>>52
ありがとうございます！うまく行きました！
大変初歩的な間違い、失礼いたしました。。。ご助言ありがとうございます

>>53
ご指摘ありがとうございます。そこの考慮をしていませんでした。
今回はたまたま問題ありませんでしたが、これからは考えます。
ありがとうございました。

29 · 2021/12/06(月) 21:53:22.08

rubyのコードが読めたから調子に乗って鬼車のソースからのインストールと
simple.c の実行に挑戦してみたら成功するまで10日くらいかかった

win10 パソコンで VMware を動かして中に ubuntu 20.04 を入れて
oniguruma 6.9.7 をインストした
あとは C言語で書かれたサンプルコードを解析すれば oniguruma の
色々なオプションを試せるようになる..

Unix も C言語も知らないしプログラマでもないミジンコだけどググりまくれば
意外と何とかなりそうだ、次は Onigmo を入れよう..

29 · 2021/12/07(火) 02:27:56.29

Onigmo もインスト出来たけど simple.c の実行結果がおかしい

// oniguruma の場合
match at 4
0: (4-14)
1: (5-13)

// Onigmo の場合
match at 4
0: (21474836484-55834574862)
1: (0-0)

インスト失敗か？

README_japanese に書いてある "onig-config --cflags" での構成確認は
oniguruma と Onigmo で同じコマンドだけど共通のコマンドなのかな？
両方入れたからどっちの構成を確認してるのか分からない

29 · 2021/12/07(火) 04:28:00.86

↑の構成確認の件はOnigmo の README.ja の 111 ～ 114 行目が
oniguruma の説明のままなだけだった、takata先生更新を..
.ja が付いてない英語版も同様です

github の Onigmo のトップページでは正しく
"onigmo-config --cflags" と書いてありました

29 · 2021/12/07(火) 15:13:24.06

↑ の件ですが README.ja の 61 行目の

＞以下、鬼車の README.ja:

を見落としておりました、鬼車の説明書きのコピペだったのね..orz

>>56 の Onigmo の結果がおかしかったのも↓で正常動作しました

間違い： cc sample.c -L/usr/local/lib -lonig
正しい： cc sample.c -L/usr/local/lib -lonigmo

お騒がせして申し訳ありません m(__)m

29 · 2021/12/14(火) 23:52:24.48

perl5と鬼車、鬼雲の動作を比べて遊んでたらperl5の変な挙動を発見
\d{1} の {1} を付けるか消すかで結果が変わる

---------------------------
my $str = '12';
$str =~ s/(?<name>\d{1}){0}(?&name)/<match=$&>/;
print "$str\r\n";
---------------------------
↓{0} での定義を (?(DEFINE) ... ) に変えると正常動作する
---------------------------
my $str = '12';
$str =~ s/(?(DEFINE)(?<name>\d{1}))(?&name)/<match=$&>/;
print "$str\r\n";
---------------------------
perl 5, version 32, subversion 1 (v5.32.1) built for MSWin32-x64-multi-thread

29 · 2021/12/15(水) 05:01:54.34

・ {0} での定義ではマッチせず
---------------------------
my $str = '123';
$str =~ s/(?<name>123){0}(?&name)/<match=$&>/;
print "$str\r\n";

・DEFINEを使うと正常動作する
---------------------------
my $str = '123';
$str =~ s/(?(DEFINE)(?<name>123))(?&name)/<match=$&>/;
print "$str\r\n";
---------------------------

perl5 では {0} で定義するのは想定外？

29 · 2021/12/16(木) 22:14:43.92

onigurumaの非包含オペレータの動作が論文と違う
正規表現　^(?~abc)　をテキスト　0123abcd　に対して検索して比較すると..

論文の動作　　　　：　0123ab　がマッチする
onigurumaの動作　：　0123　　がマッチする

逆に Onigmo は分岐が含まれない正規表現なら論文通りに動作するので
この場合は論文と同じ動作をする

動作的には　((?!abc).)*　と同じなので論文で指摘されているように
形式言語理論から逸脱しているし、後ろに続く正規表現によっては
マッチ出来ずに検索が終わってしまうケースが発生する　例、 ^(?~abc)c

非包含オペレータは提案から14年経ってもなお未完のままということに..

**デフォルトの名無しさん** · 2021/12/17(金) 13:32:58.43

>>61
^(?~(?<=ab)c)

**デフォルトの名無しさん** · 2021/12/17(金) 15:12:28.90

記号が同じなだけで名称も説明上の動作も違うからそもそも似て非なる別物
ではなくて？

29 · 2021/12/17(金) 19:59:50.60

>>62 それ反則ｗ　ちなみにこんなのもある
Perl正規表現雑技 : ある文字列を含まないものにマッチする正規表現
http://www.din.or.jp/~ohzaki/regex.htm#Without

>>63 その解釈で間違ってないと思う、oniguruma の (?~abc) は仕様が
決まった時点で別物だね、(?:(?!abc).)*　の拡張版と言ったほうがしっくりくる
実用上は oniguruma 版のほうが使いやすそうだしあえて変えたんだろうね

**デフォルトの名無しさん** · 2021/12/17(金) 20:49:06.88

いやぁ、、ヒネくれちゃっただけでしょ

**デフォルトの名無しさん** · 2021/12/19(日) 06:09:19.30

成果だけ横から頂いてこっちで改変流用するわｗおまえ除名なｗとか言われちゃったらまあ拗ねもするさ

**デフォルトの名無しさん** · 2021/12/19(日) 08:57:20.74

(?s:^(?=.*(?:トビラ|280|２８０|[内外]製|純正|公式))(?=.*(?:ガイジ|発狂|長文|必死|キチガイ|キチキチ)))

これが効かないんすけど何か間違えてますか？
https://egg.5ch.net/test/read.cgi/android/1638738146/

**デフォルトの名無しさん** · 2021/12/19(日) 10:54:25.85

少なくともchmateだとマッチしてる
正規表現と文字列の切り替えの設定間違えてるんじゃないの

**デフォルトの名無しさん** · 2021/12/20(月) 20:18:42.66

●Regular Expressionの使用環境
サクラエディタ（bregoing.dll Ver4.20 with Onigmo 6.2.0)

●検索か置換か？
検索

●説明
IPv4アドレスに一致させたい

●対象データ
2021.12.19.06
192.168.1.1

●希望する結果
192.168.1.1

下の正規表現だと2021.12.19.06の021.12.19.06に一致していまいました。
/(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)/k

69 · 2021/12/20(月) 20:22:55.66

すみません
対象データの訂正です
最初と最後に文字列があります

●対象データ
AB2021.12.19.06E
CD192.168.1.1E

**デフォルトの名無しさん** · 2021/12/20(月) 20:25:28.02

https://www.google.co.jp/search?q=%E6%AD%A3%E8%A6%8F%E8%A1%A8%E7%8F%BE+IPv4

**デフォルトの名無しさん** · 2021/12/20(月) 20:55:56.04

度々すみません
訂正があったので再度質問させてください

●Regular Expressionの使用環境
サクラエディタ（bregoing.dll Ver4.20 with Onigmo 6.2.0)

●検索か置換か？
検索

●説明
IPv4アドレスに一致させたい
条件
前後に何も含まない場合
前後に[]を含む場合
前後に半角を含む場合

●対象データ
A2021.12.19.06B
B192.168.1.01B
192.168.1.1
[192.168.1.1]
_192.168.1.1_　←_は半角空白

●希望する結果
192.168.1.1
[192.168.1.1]
_192.168.1.1_　←_は半角空白

下の正規表現だと2021.12.19.06の021.12.19.06に一致していまいました。
/(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)/k

よろしくお願いします

72 · 2021/12/20(月) 21:00:55.82

希望する結果では[]や半角を含まずIP部分だけ一致させたいです
よろしくお願いします

**デフォルトの名無しさん** · 2021/12/20(月) 21:13:35.36

(?<![.0-9])(IPv4の正規表現ggrks)(?![.0-9])

72 · 2021/12/20(月) 21:27:00.64

>>74
ありがとうございます
それだとIPv4アドレスではない部分に一致してしまいダメ
(?<![.0-9])([0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3})(?![.0-9])

72 · 2021/12/20(月) 21:31:02.39

>>74
こういった結果を希望しています
よろしくお願いします

●対象データ
A2021.12.19.06B
B192.168.1.01B
192.168.1.1
[192.168.1.1]
_192.168.1.1_　←_は半角空白

●希望する結果
一致しない
一致しない　←.01という表記が正しくない為
192.168.1.1　←一致
192.168.1.1　←[]の中を一致
192.168.1.1　←前後の半角を除いて一致

**デフォルトの名無しさん** · 2021/12/20(月) 21:50:00.81

[192.168.1.1_

72 · 2021/12/20(月) 22:36:54.07

>>74
下の通りにしたら出来ました
ありがとうございました
/(?<![.0-9])(((25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])\.){3}(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9]))(?![.0-9])/k

**デフォルトの名無しさん** · 2021/12/21(火) 05:04:20.96

(?<![.\d])(?:(2(?:5[0-5]|[0-4]\d)|1\d\d|[1-9]?\d)\.){3}\g'1'(?![.\d])

72 · 2021/12/21(火) 12:15:02.94

>>79
できました
ありがとうございました！

**デフォルトの名無しさん** · 2021/12/21(火) 12:48:39.34

(?<![.\d])(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(?:\.\g'1'){3}(?![.\d])

72 · 2021/12/21(火) 12:54:34.52

>>81
できました
ありがとうございます！
みなさん頭いいんですね・・・私は単純な正規表現しか分からず

72 · 2021/12/21(火) 13:04:04.34

ちなみに>>79さんや>>81さんの正規表現だと
こういった正規表現チェッカーでは一致しないのは何故なんでしょうか？
https://www.debuggex.com/
JavaScriptと表示されているリストをPythonに指定して試しました

**デフォルトの名無しさん** · 2021/12/21(火) 16:35:44.32

後方参照の記法絡みかなあ

**デフォルトの名無しさん** · 2021/12/21(火) 16:46:05.57

￥をつかうか、＄を使うかは、なかなか思い出せないから困る

**デフォルトの名無しさん** · 2021/12/21(火) 18:31:43.92

>>79 >>81
サクラエディタ(というか鬼車や鬼雲、bregonig.dllの正規表現)
の\dは全角数字にもマッチするから
[0-9]で検索すべき

全角が含まれてしまう話は\s,\wなども同様

サクラエディタBBSでの高田先生の過去発言
https://sakura-editor.github.io/bbslog/sf/ansi/4874.html#4887

72 · 2021/12/21(火) 18:47:26.57

>>86
なぜか分かりませんが全角には一致しなかったので大丈夫でした

72 · 2021/12/21(火) 18:54:30.58

>>86
よく確認したら全角にも一致していました
すみません

**デフォルトの名無しさん** · 2021/12/21(火) 19:19:25.77

左端に(?a)をつければ\dのままでも？

**デフォルトの名無しさん** · 2021/12/21(火) 19:35:57.99

Meryの\dは半角のみ
正規表現まわり含め検索はサクラよりMeryのが良いな
サクラは複数行検索不可だし

**デフォルトの名無しさん** · 2021/12/21(火) 20:39:47.81

●Regular Expressionの使用環境
サクラエディタ（bregoing.dll Ver4.20 with Onigmo 6.2.0)

●検索か置換か？
検索

●説明
IPv6アドレスに一致させたい
条件

●対象データ
2603:1096:0604:00bc:0000:0000:0000:0009
(2603:1096:0604:00bc:0000:0000:0000:0009)　←半角括弧の中だけに一致させたい
_2603:1096:0604:00bc:0000:0000:0000:0009_　←_は半角スペースの中だけに一致させたい
2603:1096:604:bc::9
(2603:1096:604:bc::9)
_2603:1096:604:bc::9_

●希望する結果
2603:1096:0604:00bc:0000:0000:0000:0009
2603:1096:0604:00bc:0000:0000:0000:0009　
2603:1096:0604:00bc:0000:0000:0000:0009
2603:1096:604:bc::9
2603:1096:604:bc::9
2603:1096:604:bc::9

○試した正規表現
下の正規表現だと最後の:以降(上の例だと最後の9)が一致しませんでした
(\:\:([a-f0-9]{1,4}\:){0,6}?[a-f0-9]{0,4}|[a-f0-9]{1,4}(\:[a-f0-9]{1,4}){0,6}?\:\:|[a-f0-9]{1,4}(\:[a-f0-9]{1,4}){1,6}?\:\:([a-f0-9]{1,4}\:){1,6}?[a-f0-9]{1,4})(\/\d{1,3})?

よろしくお願いします

**デフォルトの名無しさん** · 2021/12/21(火) 23:04:26.56

>>86
鬼車なら、オプション指定(?D)でdigitをASCIIだけにできる
(?D)..¥d..

**デフォルトの名無しさん** · 2021/12/22(水) 00:48:17.09

正直\dを[0-9]以外にもマッチさせる仕様ってどういう時に便利なのか今一つ分からん

**デフォルトの名無しさん** · 2021/12/22(水) 03:24:15.78

[0-469bc:]++

**デフォルトの名無しさん** · 2021/12/22(水) 09:44:58.18

住所にしろ日付にしろ上から順に書いた方が齟齬が生じないだろうに
西洋文化圏のやつらは何が何でも省略しなきゃ気が済まないんだろうな
こんなもん略記許さない仕様の方が逆に全体的な効率は良いだろうに
フロッピーディスクの時代なら少しでも容量減らしたいのは分からなくも無いけど

91 · 2021/12/22(水) 10:25:10.40

>>94
ありがとうございます
IPv6アドレス以外には一致させたくないのです

●対象データ
1
01
2603:1096:0604:00bc:0000:0000:0000:0009
(2603:1096:0604:00bc:0000:0000:0000:0009)　←半角括弧の中だけに一致させたい
_2603:1096:0604:00bc:0000:0000:0000:0009_　←_は半角スペースの中だけに一致させたい
2603:1096:604:bc::9
(2603:1096:604:bc::9)
_2603:1096:604:bc::9_

●希望する結果
2603:1096:0604:00bc:0000:0000:0000:0009
2603:1096:0604:00bc:0000:0000:0000:0009　
2603:1096:0604:00bc:0000:0000:0000:0009
2603:1096:604:bc::9
2603:1096:604:bc::9
2603:1096:604:bc::9

**デフォルトの名無しさん** · 2021/12/22(水) 11:10:46.72

>>95
個人的な本名や住所が先頭に来るのは西洋文化圏というよりイスラム圏も含めた地中海世界
プログラミング言語だと名前空間が上から順で統一されてるのに不思議だよね

**デフォルトの名無しさん** · 2021/12/22(水) 11:53:44.33

>>96
>>74と同じ手法でやればいいじゃない

91 · 2021/12/22(水) 12:01:15.82

>>98
ありがとうございます
どういうことでしょうか？例えば>>94さんの例を元にして下の通りにしてもIPv6以外に一致してしまいます
(?<![.0-9])([0-469bc:]++)(?![.0-9])

**デフォルトの名無しさん** · 2021/12/22(水) 16:45:06.37

IP アドレスの正規表現ぐらい、公式が発表しているのでは？

**デフォルトの名無しさん** · 2021/12/22(水) 17:23:12.37

>>99
最小がわからんので{8,}は適当だが、例文の限りではこれでいける。
ちょいと調べたら16進数とのことなので0-9,a-fなんでないの？
[0-9a-f:]{8,}

**デフォルトの名無しさん** · 2021/12/22(水) 17:29:20.12

IPv6を正確に捕捉するのは難しいだろ
2001:db8:0:0:1::1は×で、2001:db8::1:0:0:1が正しい
::ffff:c000:0280　＝　::ffff:192.0.2.128
2001:db8:a::123/64
fe80::3%1

91 · 2021/12/22(水) 17:33:56.16

>>101
ありがとうございます
それだと16:54:09みたいな日付にも一致してしまいました

**デフォルトの名無しさん** · 2021/12/22(水) 17:41:16.95

>>103
そのパターン限定なら{8,}を{15,}とかで回避できる

91 · 2021/12/22(水) 17:52:56.27

>>104
ありがとうございます
{9,}にしたら出来ました！

ちなみにこういうものに一致しないようにする方法はありますか？
:2603:1096:604:bc::9　←先頭に:がある
こういう出現はないはずなんですが、もし簡単な正規表現の追加で出来たら嬉しいなあと

91 · 2021/12/22(水) 17:58:56.91

>>105
出来た・・・と思ったんですが、文字数の調整で対応できない数字や英字の連続に一致してしまいダメでした

**デフォルトの名無しさん** · 2021/12/22(水) 18:06:08.63

これでどう？
ただし頭:への対応は無理
([0-9a-f:]+:){4,}[0-9a-f]+

91 · 2021/12/22(水) 18:17:32.37

>>107
度々ありがとうございます
それでも数字や英字の連続に一致してしまいダメでした
08d9c24701be

合ってるか分からないのですが、今のところ>>91の正規表現の末尾に[0-9]*を加えています・・・
(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4}){1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4}){1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4}){1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4}){1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4}){1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:){0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:){1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))[0-9]*

**デフォルトの名無しさん** · 2021/12/22(水) 18:29:09.14

>>108
ところどころfe80とかffffみたいにベタ書きしてるのはなぜ？

**デフォルトの名無しさん** · 2021/12/22(水) 21:01:48.91

忘年会ネタにどうぞ
https://github.com/tonco-miyazawa/regex_etc/blob/master/Abcent_Zero.txt
https://github.com/tonco-miyazawa/regex_etc/blob/master/OneLineDefineOperator.txt

**デフォルトの名無しさん** · 2021/12/23(木) 03:07:53.75

(?<!\h)(IPv6の正規表現ググレカス)(?!\h)

**デフォルトの名無しさん** · 2021/12/23(木) 09:13:03.87

>>108
>08d9c24701be
([0-9a-f:]+:){4,}[0-9a-f]+
俺の環境ではマッチしないし、しないはずだけど？

**デフォルトの名無しさん** · 2021/12/23(木) 09:14:21.91

>>108
ちなみにipv6の正規表現で検索して色々出てきたけど、下のやつから頭とお尻の(^$)とるとマッチするんだが、改行が含まれてしまう。
他は>>96がイレギュラーすぎてマッチしないのが多い。

http://tech-uh-oh.blogspot.com/2010/02/ipv6.html

91 · 2021/12/23(木) 12:05:51.36

>>111
ありがとうございます
IPv6の正規表現も含めて教えてほしいです

>>112
ありがとうございます
すみません、もう一度試したところ08d9c24701beには一致しませんでした
これは対象データと希望する結果に書き忘れていたのですが、
教えてもらった([0-9a-f:]+:){4,}[0-9a-f]+だと2002:a05:622a:15cc::に一致しませんでした

91 · 2021/12/23(木) 12:10:08.55

>>113
度々ありがとうございます
そのURLにある正規表現だと長すぎてサクラエディタに登録できませんでした

**デフォルトの名無しさん** · 2021/12/23(木) 12:30:01.85

>>114
([0-9a-f:]+:){4,}[0-9a-f:]+にすれば、それもマッチするけど
また要らないがマッチする可能性も出てくる。

91 · 2021/12/23(木) 12:52:17.35

>>116
何度もありがとうございます
1つの正規表現にまとめることにこだわらずに、
>>116で教えてもらったものと>>108の2つで対応したいと思います
どうもありがとうございました

>>108だと以下のようなものが一致せず困っていたので・・・
2001:db8::1:0:0:1
2001:db8::0:1:0:0:1
2001:0db8::1:0:0:1

**デフォルトの名無しさん** · 2021/12/23(木) 18:54:52.16

(?<![\h:])(?:(\h{1,4}:)(?:(:\h{1,4}){1,6}|:)|\g'1'{2}(?:\g'2'{1,5}|:)|\g'1'{3}(?:\g'2'{1,4}|:)|\g'1'{4}(?:\g'2'{1,3}|:)|\g'1'{5}(?:\g'2'{1,2}|:)|\g'1'{6}(?:\g'2'{1}|:)|\g'1'{7}(?:\h{1,4}|:))(?![\h:])

91 · 2021/12/23(木) 18:57:04.64

>>118
わたし宛でしょうか？
それを試したら何にも一致しませんでした・・・

**デフォルトの名無しさん** · 2021/12/23(木) 20:41:17.01

>>113
\sに改行が含まれるからでしょ

Rubyとかなら0x09～0x0D(水平タブHT,LF改行,垂直タブVT,改頁,CR改行)と0x20(スペース)

サクラエディタの鬼雲なら上記に加えて、
その他の改行種(NEL,PS,LS)や空白種(全角スペースやNBSPなど)

**デフォルトの名無しさん** · 2021/12/23(木) 21:45:21.05

([0-9a-f]{1,4}:)(?:(:[0-9a-f]{1,4}){1,6}|:)|\g'1'{2}(?:\g'2'{1,5}|:)|\g'1'{3}(?:\g'2'{1,4}|:)|\g'1'{4}(?:\g'2'{1,3}|:)|\g'1'{5}(?:\g'2'{1,2}|:)|\g'1'{6}(?:\g'2'{1}|:)|\g'1'{7}(?:[0-9a-f]{1,4}|:)

(?<![0-9a-f:])(?:([0-9a-f]{1,4}:)(?:(:[0-9a-f]{1,4}){1,6}|:)|\g'1'{2}(?:\g'2'{1,5}|:)|\g'1'{3}(?:\g'2'{1,4}|:)|\g'1'{4}(?:\g'2'{1,3}|:)|\g'1'{5}(?:\g'2'{1,2}|:)|\g'1'{6}(?:\g'2'{1}|:)|\g'1'{7}(?:[0-9a-f]{1,4}|:))(?![0-9a-f:])

(?<![0-9a-f])(?:([0-9a-f]{1,4}:)(?:(:[0-9a-f]{1,4}){1,6}|:)|\g'1'{2}(?:\g'2'{1,5}|:)|\g'1'{3}(?:\g'2'{1,4}|:)|\g'1'{4}(?:\g'2'{1,3}|:)|\g'1'{5}(?:\g'2'{1,2}|:)|\g'1'{6}(?:\g'2'{1}|:)|\g'1'{7}(?:[0-9a-f]{1,4}|:))(?![0-9a-f:])

**デフォルトの名無しさん** · 2021/12/24(金) 07:37:01.80

(([0-9a-f]{1,4}):){7}(?:\g'2'|:)|\g'1'{6}(?:(:\g'2')|:)|\g'1'{5}(?:\g'3'{1,2}|:)|\g'1'{4}(?:\g'3'{1,3}|:)|\g'1'{3}(?:\g'3'{1,4}|:)|\g'1'{2}(?:\g'3'{1,5}|:)|\g'1'(?:\g'3'{1,6}|:)

**デフォルトの名無しさん** · 2021/12/24(金) 12:59:57.29

短くするの？
(([0-9a-f]{1,4}):){7}(\g'2'|:)|(\g'1'()|(?=\5)(?!\6):()){1,6}\g'2'?(?=\6)

**デフォルトの名無しさん** · 2021/12/24(金) 15:17:06.00

すげえｗ
()で文字間の位置をキャプチャ出来る事もそれを参照で先読みで使える事も知らなかったわ

**デフォルトの名無しさん** · 2021/12/24(金) 16:07:46.99

>>124
ごめん、先読みにする必要なかった
(([0-9a-f]{1,4}):){7}(\g'2'|:)|(\g'1'()|\5(?!\6):()){1,6}\g'2'?\6

**デフォルトの名無しさん** · 2021/12/24(金) 16:09:42.73

https://www.perlmonks.org/?node_id=1226058

**デフォルトの名無しさん** · 2021/12/24(金) 23:23:23.50

>>125
その表現だと↓みたいなポート番号にまで一致しちゃうYO!
2001:db8::1:80
これは表記がそもそも推奨されないからいいっちゃいいけど

**デフォルトの名無しさん** · 2021/12/25(土) 12:25:23.75

世界でもトップレベルの秀才たちが決めた規格なのになんでこんなに扱いづらいんだ？
そういえばメールアドレスの規格も酷かったな～(>>3の雑技を参照)

**デフォルトの名無しさん** · 2021/12/25(土) 12:36:10.52

むしろ　出来る人　は難しいかどうかが分からないからじゃない？
なんでこの程度の事でこの人たち四苦八苦してるんだろう、ってね
税制などと同じで敢えてややこしく作って仕事作ってるという側面もあるのかもね

**デフォルトの名無しさん** · 2021/12/25(土) 12:50:35.23

頭が良すぎるのも考えものだな、IT土方の気持ちなんて分からないだろうな

頭が良すぎる人の考える正規表現は大抵論理的に正しく動くが
検索効率を上げる書き方には興味が無いらしく強欲を使ったり
今回のIP6の例で言えば先頭に (?=[\h:]{6}) を置いて検索スピードを
上げようというIT土方ならではの実践的手法が使われないことが多い ex. >>125

**デフォルトの名無しさん** · 2021/12/25(土) 13:00:34.13

老舗旅館の増築みたいなもんでしょ
後方互換性を保とうとしたらそうならざるを得ない
MS-DOSをひきずるWindowsのようなもん

**デフォルトの名無しさん** · 2021/12/25(土) 13:21:44.54

windowsは増築しすぎてグシャっといきそうになってるね

**デフォルトの名無しさん** · 2021/12/25(土) 13:46:31.03

まあ俺も底辺ドカタの気持ちなんてさっぱりだわ悪いけどｗ

**デフォルトの名無しさん** · 2021/12/25(土) 14:30:45.29

ね

**デフォルトの名無しさん** · 2021/12/25(土) 14:38:13.23

たまにでいいからIT土方のことも考えて下さい
うちの会社で>>125みたいな正規表現を使ったら怒られます
チェック担当の子がヤムチャになっちゃったからやめてねって言われます

**デフォルトの名無しさん** · 2021/12/25(土) 20:41:20.89

無法地帯

**デフォルトの名無しさん** · 2021/12/25(土) 22:12:05.75

kkosさんここ見に来てるかな
https://github.com/kkos/oniguruma/blob/master/doc/RE.ja
539行目
×　　+ 不在停止 (?|...)
〇　　+ 不在停止 (?~|...)

来年はISO-2022-JPの年、今年も１年お疲れ様

**デフォルトの名無しさん** · 2021/12/26(日) 10:52:57.40

なんだこれ

鬼雲
https://ideone.com/cefWj1

**デフォルトの名無しさん** · 2021/12/27(月) 00:34:46.64

>>126
これやっと理解出来た、勉強になった、ありがとう

１、他の分岐に移っても捕獲したものは保持される
２、()が捕獲してないと\1は空文字列にマッチ出来ない

がキモになってるんだな
onigurumaの後方参照値有効性確認器でも同じことが出来そうだ

>>138
>>47
. は (?:a|b|c|........) と書き換えられる、すなわち分岐を含む正規表現だ
これだけじゃ説明付かない結果になってるけど . を使ってる以上考えても無駄かと

**139** · 2021/12/27(月) 19:30:29.63

あれ、でも他の分岐に行っても保持されるのならどの分岐を抜けてきたかの
判断はどうやってするんだろう？
繰り返しをしてる中ですべての分岐で保持が成功していたら区別が付かない
まぁ正規表現でやらずにコード書けばいいだけだけど

**デフォルトの名無しさん** · 2021/12/28(火) 01:38:40.34

高度IT人材、富士通は最大年収3500万円へ

「富士通年収3500万！」日本のIT企業の年収も、高額化してきました

AI人材の獲得に超本気　NECが新人事制度を9人に適用、富士通は最大年収3500万円へ

【年収３５００万円も】富士通、「ジョブ型」人事制度を導入幹部社員から高度IT人材

来年度から副業解禁　人材多様化へ―大同生命次期社長

副業・兼務の解禁から４年、ロート製薬流で進めるキャリア支援

ロート製薬が副業をいち早く導入した「超人間的」な理由

ロート製薬会長が「副業を受け入れない会社は発展しない」と断言する理由

**デフォルトの名無しさん** · 2021/12/28(火) 08:15:55.40

富士通は電子カルテがクソ

**デフォルトの名無しさん** · 2021/12/28(火) 11:45:39.94

捕獲したものを手放してnilに戻すメタ文字があればいいのか？

# \2, \3, \4 の中身をnilにするメモリクリア
\mc{2-4} or \mc{2,3,4}

中身をクリア出来るなら任意の文字列の代入も出来る

# \2, \3, \4の中身を書き換え
\m{2=foo,3=bar,4=hoge}

(?{code})が使えない環境では重宝する機能になる
当然名前付きのものも書き換えられるようにするのが望ましい

**デフォルトの名無しさん** · 2021/12/30(木) 00:46:28.20

>>126
https://www.perlmonks.org/?displaytype=displaycode;node_id=1226069
これすご、理論屋さんの作った芸術作品て感じ

貪欲の繰り返しがどう動くかを分かってないとこれは書けないし
(*F)の入れ方も無駄がなくて素晴らしい

**デフォルトの名無しさん** · 2021/12/30(木) 19:53:03.05

IPv6アドレスのテキスト表記
https://www.youtube.com/watch?v=EvIUZwkGWQE

予想以上に自由度が高くてワロタ
>>91にまともな回答が付かないのは必然だったのか
正規表現を作れたとしてもサクラエディタの検索欄にはたぶん入らないね

**デフォルトの名無しさん** · 2021/12/30(木) 20:19:42.39

そもそもIPを簡単に取り出せないようなデータというのはどんなデータだったんだろ？
普通はIPならIPと分かるようなデータの入れ方をする

非包含オペレータ (absence operator) (実験的)
https://docs.ruby-lang.org/ja/latest/doc/spec=2fregexp.html#absenceop
>例えば (?~abc) は "", "ab", "aab", "abb", "ccdd" などにはマッチしますが、
>"abc", "aabc", "ccabcdd" などにはマッチしません。

この説明では意味が伝わりにくいな
"例えば ^(?~abc)$ は" に修正したほうがいい

鬼雲は放置気味だけどこの先どうするのかな

**デフォルトの名無しさん** · 2021/12/30(木) 22:40:15.48

>>145
そうなんです
サクラエディタで使えないIPv6の正規表現方法なら見つかったのですが・・・
なので諦めて複数の正規表現で対応することにしました

**デフォルトの名無しさん** · 2021/12/30(木) 23:19:26.02

>>147
これはperl等でパーサを作って検索すべき案件だろうから
テキストエディタではなかなか厳しいね
正規表現の基本的なことで分からないことがあったらまた聞きに来てね
上の正規表現の猛者たちよりも親切な回答を付けるよｗ

**デフォルトの名無しさん** · 2022/01/01(土) 01:28:53.52

[あ-うけてめでとおござします]+

**デフォルトの名無しさん** · 2022/01/01(土) 18:17:24.41

^(?~厄)$

**デフォルトの名無しさん** · 2022/01/01(土) 21:13:00.82

.replace(/謹/g,'新年')

**デフォルトの名無しさん** · 2022/01/02(日) 00:08:00.18

2022-01-01【ランダムな文字列】
の【ランダムな文字列】にマッチさせるにはどのように書いたら良いですか？

**デフォルトの名無しさん** · 2022/01/02(日) 00:24:32.24

テンプレを読めるようになってから出直そう

**デフォルトの名無しさん** · 2022/01/02(日) 01:16:44.72

Onigmo の非包含オペレータのバグを再現する方法
https://github.com/tonco-miyazawa/regex_etc/blob/master/Absence_reappear_bug.txt

>>152 正規表現エンジンは何？

**デフォルトの名無しさん** · 2022/01/02(日) 01:27:24.76

(?<=^2022-01-01).++$

**デフォルトの名無しさん** · 2022/01/02(日) 02:23:07.29

なんで強欲？

**デフォルトの名無しさん** · 2022/01/03(月) 03:43:07.67

サクラエディタおじさんなのだが
よほど古くなければ検索文字数に上限はほぼない
ただし履歴とウインドウ間共有には259文字の上限がある
再利用にはマクロにしておくべし
あとWindowsダイアログの1行エディットコントロールには文字列幅が32767pxを超えると真っ白になるバグがある
正規表現キーワードは1000文字

**デフォルトの名無しさん** · 2022/01/03(月) 19:36:44.28

今時の正規表現エンジンを使えるエディタなら３０００文字くらいは許容して欲しい
欲を言えば正規表現をテキストエディタ画面で作ってそのまま実行出来るように
なったらいいな、/x オプションが設定されるのがデフォで・・

Jane用に作った鬼雲用の正規表現は1600文字超だった
https://github.com/tonco-miyazawa/regex_etc/blob/master/ReplaceStr_Part11_res549.txt

**デフォルトの名無しさん** · 2022/01/03(月) 21:53:14.12

常用漢字表外漢字を検索する正規表現をお願いします！

**デフォルトの名無しさん** · 2022/01/03(月) 23:25:26.42

テキストエディタをまた～り語ろう ver.25
https://pc11.2ch.net/test/read.cgi/software/1201173972/193

193 174 sage 2008/02/19(火) 03:19:25 ID:W6zn4Vm/0
K2Editorが検索テキストボックスに20000桁超の文字列入れられるから
正規表現「|」でつないだOR検索するのに便利ってだけなんだけどね
（秀丸はそもそもOR検索で「|」が10個くらいまでしか使えないという制限がある
サクラエディタは検索条件テキストボックスに258桁までしか入力できない）

他にはEmEditorが優秀な部類で検索条件に数千桁までは指定できたんだけど、
20000桁はさすがに無理でしたｗ

**デフォルトの名無しさん** · 2022/01/04(火) 16:23:29.29

2万文字じゃなくて２万桁か、入力して検索ボタン押したらエディタが凍りそう
こういうのをエディタでやろうとする人はスクリプト書けない人なのかな

**デフォルトの名無しさん** · 2022/01/04(火) 16:26:30.10

変な使い方すんなし

**デフォルトの名無しさん** · 2022/01/05(水) 02:42:52.49

emEditorちゃんの新しいアピールポイント発見されたやん
作者さんに伝えたら喜ぶぞお～

**デフォルトの名無しさん** · 2022/01/05(水) 03:17:14.08

otbeditをアップデートしたら正規表現が進化しててびっくりしたな
\=A で "選択範囲の先頭にマッチ" みたいな独自のものもあって面白い
ただ正規表現の入力ダイアログは変わってなさそう
複雑な正規表現を使うならperlでやっちゃうから結局は使わないんだけどね

**デフォルトの名無しさん** · 2022/01/15(土) 15:07:39.96

鬼車の更新きた、が>>137の件はそのままだった
作者氏のブログを読んでたらいつの間にか下山事件について調べてたｗ
この事件があったことは前に国鉄事故一覧を読んでたから知ってたけど
ミステリー要素に興味が無い自分はスルーしてた

**デフォルトの名無しさん** · 2022/01/15(土) 20:13:16.46

5chで化けるキャリア絵文字をNGにしたいんだけど、もっとマシな書き方ある？

&(hearts|#[0-9]{3,6});(?# キャリア絵文字NG)

**デフォルトの名無しさん** · 2022/01/16(日) 21:51:20.72

(^&clubs;^)

**デフォルトの名無しさん** · 2022/01/17(月) 07:41:03.81

>>165
kkosさんが5ちゃんねる見てるという情報はないしねえ
ちなみにk.takataさんの方はサクラエディタスレでbregonig.dllのデバッグ進めてたこともあるし
このスレ見てても不思議ではない

**デフォルトの名無しさん** · 2022/01/17(月) 20:57:45.62

>>168
kosako先生もブログのログによると2chをチェックされてたことが
あるようだけど今は見てないようですね
>>137程度のことでgithubに書き込むのは敷居が高いな・・
takata先生のほうはツイッターやメールで簡単に連絡取れるんですけどね

これからonigurumaをいじり倒す予定なので他に何かバグを見つけたら
一緒に報告しようと思います^^;

**デフォルトの名無しさん** · 2022/01/21(金) 06:38:47.99

Rubyの闇
https://kkos.hatenadiary.org/entry/20070525/1180100250

**デフォルトの名無しさん** · 2022/01/21(金) 18:07:28.01

闇でもなんでもなく松本の狭量さを示す事実だけだろ

**デフォルトの名無しさん** · 2022/01/21(金) 18:44:15.58

onigurumaの話題を出すとこうなってしまうんならよそでやるか・・
ここでの書き込みはこれが最後です、スレ汚しすみませんでした

**170** · 2022/01/21(金) 19:13:35.61

>>172
私の方こそすみません
170は書くべきじゃありませんでした
個人的にtoncoさん(ですよね？)の書き込み好きなので
5chでonigurumaやonigmoの検証続けて下さい

**170** · 2022/01/21(金) 19:16:55.46

ちなみにこのツイートかなり気になります
Rubyの正規表現エンジンを鬼雲から鬼車に戻す構想があるのかな？
https://twitter.com/kokuyouwind/status/1436202765101928461

P.S.
ツイートは鬼雲(Onigmo)のスペルを間違えています
https://twitter.com/5chan_nel (5ch newer account)

**デフォルトの名無しさん** · 2022/01/22(土) 01:55:21.54

rubyは内部のエンコーディングを固定してないそうだから鬼車系から離れられないんじゃないか
re2はutf-8/iso-8859-1の2択だし

**デフォルトの名無しさん** · 2022/01/22(土) 18:56:13.90

いろいろあるんだな

**デフォルトの名無しさん** · 2022/01/24(月) 20:07:59.38

メモ
https://regex101.com/
https://rubular.com/
https://ideone.com/

https://developer.android.com/reference/java/util/regex/Pattern

**デフォルトの名無しさん** · 2022/01/24(月) 23:09:01.61

すみません空行を表すモノは「^\n」以外に何かありますでしょうか？

**デフォルトの名無しさん** · 2022/01/24(月) 23:16:14.46

言葉不足すぎて何も言えない
>>2のテンプレ通り書いて

**デフォルトの名無しさん** · 2022/01/24(月) 23:35:46.42

^$ とか？

**デフォルトの名無しさん** · 2022/01/25(火) 00:03:53.36

\n{2,}
(?<=\n)\n+

**デフォルトの名無しさん** · 2022/01/25(火) 00:05:00.68

>>179
すみません

●Regular Expressionの使用環境
会社（工場）で使っている親会社の人が作ったソフトに内蔵されているエディタです
特殊な用途で使うもので制作者に問い合わせは出来るけれど聞くところによりますと
Delphi純正の正規表現ライブラリでは「^\n」がヒットしないらしいです
TPerlRegEx という名前らしいので恐らく Perl 準拠らしい、です
「^」や「\n」と他の組み合わせは問題ないです

●検索か置換か？
検索も置換もです

●説明
空行を検索したい

●対象データ
複数行あるテキストデータです

>>180
「^$」は文頭にしかヒットしませんでした

**デフォルトの名無しさん** · 2022/01/25(火) 00:06:24.26

>>181
うわ凄っ
(?<=\n)\n+
でヒットしました！

唐突でわちゃくちゃな質問におつきあいありがとうございました

**デフォルトの名無しさん** · 2022/01/25(火) 00:15:07.84

(?m)^\n

**デフォルトの名無しさん** · 2022/01/25(火) 13:46:33.02

解決してなによりだけど
親会社が作った特殊ソフトとか
親会社の担当に聞くべき案件なのでは

**デフォルトの名無しさん** · 2022/01/29(土) 12:49:12.10

JaneStyle
【　正規表現ライブラリ　】 bregonig.dll Ver.1.46 with Oniguruma 5.9.2

検索

競馬　競輪　競艇　競泳

競(?:馬|輪|艇|泳)
競[馬輪艇泳]

この場合　上、式集合　と　下、文字集合　どちらが好ましいでしょうか

**186** · 2022/01/29(土) 13:01:44.15

検索文字が増えていくので処理速度で考えるとどちらが速いでしょうか

**デフォルトの名無しさん** · 2022/01/29(土) 13:32:54.07

予想でしかないけどパースは文字集合の方が簡単だろうし動作も文字集合の方が軽い気がする
基本的に出来ることが少ない方が処理は楽だから
まあよほど大量の文書を処理しないと認識できる違いが出るとは思えないけど

**デフォルトの名無しさん** · 2022/01/29(土) 14:55:24.78

>>188
ありがとうございます

**デフォルトの名無しさん** · 2022/01/31(月) 21:41:49.66

どうして[aa][aa][aa]や[aa]b[aa]ab[aa]にはならないのですか
https://ideone.com/WKK9DO

my $str = 'abab';
$str =~ s/(?<=\Ka)b/[$&]/g;
print ${str}; # [ab][ab]

my $str = 'aaaaaa';
$str =~ s/(?<=\K.)./[$&]/g;
print $str; # [aa]aaaa

my $str = 'aabaaabaa';
$str =~ s/(?<=\Ka)a/[$&]/g;
print $str; # [aa]b[aa]abaa

**デフォルトの名無しさん** · 2022/02/01(火) 08:22:41.99

>>190
>>1

**デフォルトの名無しさん** · 2022/02/01(火) 12:52:35.33

\K not permitted in lookahead/lookbehind in regex; marked by <-- HERE in m/(?<=\K <-- HERE a)b/

**デフォルトの名無しさん** · 2022/02/01(火) 20:14:34.81

>>192
ありがとうございました

https://perldoc.perl.org/perl5320delta#%5CK-now-disallowed-in-look-ahead-and-look-behind-assertions

**デフォルトの名無しさん** · 2022/02/11(金) 15:34:16.36

[<"]{1,2}[^<>"].+[>"]{1,2}

と書いたのですが
"C:\Windows\System32\calc.exe"と"C:\Windows\System32\notepad.exe"

"と"←この部分もヒットしていまいます
この部分をヒットしないようにするにはどうしたらいいですか？

**デフォルトの名無しさん** · 2022/02/11(金) 15:43:32.09

最短マッチで上手くいきそう

**デフォルトの名無しさん** · 2022/02/11(金) 15:47:22.25

>>194
ドットいらない

**デフォルトの名無しさん** · 2022/02/11(金) 15:50:16.57

"\w:[^"]++"

**デフォルトの名無しさん** · 2022/02/11(金) 17:26:42.82

>>196
有難うございます
上手く行きました

最短マッチも勉強します

**デフォルトの名無しさん** · 2022/02/11(金) 18:08:03.21

>>197
java以外では最長と強欲の挙動って一緒なのかな？

**デフォルトの名無しさん** · 2022/02/11(金) 18:24:50.25

>>199
一緒だったらわざわざ別表記を作らないよ