Regular Expression(正規表現) Part15

**デフォルトの名無しさん** · 2019/09/16(月) 22:25:11.87

Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part14
https://mevius.5ch.net/test/read.cgi/tech/1489511075/

次スレは>>980宜しく
天ぷら等>>2以降

**デフォルトの名無しさん** · 2020/07/03(金) 13:00:37.53

Ruby で、" を、\" に置換してから、
冒頭・末尾に、" を追加する

str = '"ja"'
str.gsub!( '"', '\"' )

puts '"' + str + '"'
#=> "\"ja\""

**デフォルトの名無しさん** · 2020/07/03(金) 13:11:32.91

VScodeのプラグインにSnippet Generatorてのがあるみたいだがそれじゃダメなん？

**302** · 2020/07/03(金) 14:28:11.33

漏れなら、Ruby, PowerShell で、
クリップボード経由で変換するスクリプトを書いて、

ダブルクリックで起動できるように、起動部分をVBS で書くかな？

**デフォルトの名無しさん** · 2020/07/03(金) 14:33:24.34

正規表現よりもJSON.strinfigy()を使ったほうが簡単
スニペット用のJSONを出力すればいいだけだからJSでもRubyでも好きなの使えばいい

**デフォルトの名無しさん** · 2020/07/13(月) 00:17:50.71

JavaScript

const kaoru = '薫'

'[薫子]'.match(`[${kaoru}]`)
'[薫子]'.match(`\[${kaoru}\]`)
'[薫子]'.match(new RegExp(`[${kaoru}]`))
'[薫子]'.match(new RegExp(`\[${kaoru}\]`))

全てマッチしてしまうようですが、マッチさせたくありません
[　や　]　そのものを文字として扱って判定するにはmatchの引数をどうすればよいでしょうか

**デフォルトの名無しさん** · 2020/07/13(月) 00:49:50.36

>>306
それはJSの質問やろ
RegExpコンストラクターを使って2回エスケープ

**デフォルトの名無しさん** · 2020/07/13(月) 19:20:45.29

教えてください。基本的な質問で恐縮です。

20200706T030000Z
SUMMARY:打合せ
LOCATION:中野
DTEND:20200706T043000Z

から、
$1　0300
$2　打合せ
$3　中野
$4　0430
を抜き出すにはどのようにすればよいでしょうか。

**デフォルトの名無しさん** · 2020/07/13(月) 19:49:46.79

^\d{8}T(\d{4}).*+\nSUMMARY:(.*+)\nLOCATION:(.*+)\nDTEND:\d{8}T(\d{4})

**デフォルトの名無しさん** · 2020/07/14(火) 13:34:31.12

今まで何となくで使ってきたけどキャプチャの変数って式に対し1つしか用意されず
部分式呼び出しや量指定子の繰り返しで増やされずに上書きするみたいですね

^(?<y>2020[01]\d[0-3]\dT([0-2]\d[0-5]\d)00Z)(?:\n[^:\n]++:(.*+)){2}\n[^:]++:\g<y>
\1 \2 \3 \4 \5 \6
20200706T043000Z 0430 中野___

どの環境でもこういう仕様なの？

**デフォルトの名無しさん** · 2020/07/14(火) 13:41:52.76

>>310
深く考えてなかったがそういうもんだと思ってた
キャプチャグループが増殖するとは考えもしなかった

**デフォルトの名無しさん** · 2020/07/14(火) 13:50:15.90

もしキャプチャグループが増えるとして
与えられた文字列によって増える順番が異なってくることが考えられるしね

**デフォルトの名無しさん** · 2020/07/14(火) 21:21:06.51

キャプチャしたけりゃ繰り返しや\gで省略するなってことなんだろうけど
気になって出来る方法無いか調べてたら鬼雲で捕獲履歴参照なるものがあった
デフォでは無効になってるみたいだけど

ttps://github.com/k-takata/Onigmo/blob/master/doc/RE.ja
補記 5. 実装されているが、既定値では有効にしていない機能
+ 捕獲履歴参照
　(?@...) と (?@<name>...)
　例. /(?@a)*/.match("aaa") ==> [<0-1>, <1-2>, <2-3>]
　使用方法は、sample/listcap.cを参照
　有効にしていない理由は、どの程度役に立つかはっきりしないため

**デフォルトの名無しさん** · 2020/07/20(月) 23:26:29.84

●Regular Expressionの使用環境
サクラエディタ

●検索か置換か？
置き換え

●説明
３の倍数行あるテキストを、３行ごとに１行にまとめたい

●対象データ　※対象データは、必ず半角英数字です。
e
A8
11A9
c
2
LB5
3
d
8X5

●希望する結果
e A8 11A9
c 2 LB5
3 d 8X5

よろしくお願いいたします。

**デフォルトの名無しさん** · 2020/07/21(火) 00:07:21.07

>>314
サクラエディタはよく知らないけど
一般的な正規表現なら /(.*?)¥n(.*?)¥n(.*?¥n)/g を "$1 $2 $3”で置換すればいいと思う

**デフォルトの名無しさん** · 2020/07/21(火) 10:14:18.12

(?:^.*+|\G.*+[\r\n]+.*+)\K[\r\n]+(.*+)[\r\n]+
_\1_
"_" は半角sp
最終行末尾に改行が無くても可

**デフォルトの名無しさん** · 2020/07/21(火) 10:18:39.84

[\r\n]+
は空行がある場合にズレるから使ってる改行文字に直して
CRLFなら\r\n

**デフォルトの名無しさん** · 2020/07/25(土) 05:22:11.92

質問です。デリミタが基本的に「/」が選ばれるのなぜですか？慣例だから？

**デフォルトの名無しさん** · 2020/07/25(土) 08:47:52.57

人間というのは楽をしようとする生き物なんだ

**デフォルトの名無しさん** · 2020/07/25(土) 17:47:34.31

>>318
ここに来るような人は論理的思考をすると思ってたんだけど、
慣例とか持ち出す奴まで来るのな
|や@なんかと比べれば分かるだろ

**デフォルトの名無しさん** · 2020/07/27(月) 13:00:24.19

●Regular Expressionの使用環境
Ruby2.5
●検索か置換か？
置換
●説明
スペースを削除したい。ただしダブルクオーテーション内は処理対象から除外
●対象データ
ABC, DE F,"G HI"
●希望する結果
ABC,DEF,"G HI"
ダブルクオーテーション内以外に対して処理するって結構ありそうだけど見つからないような・・

**デフォルトの名無しさん** · 2020/07/27(月) 13:15:08.91

そのフォーマット通りなのか
あるいは任意でダブルクォーテーションの処理をするのかで変わってくるな

**デフォルトの名無しさん** · 2020/07/27(月) 14:36:52.94

[ ](?![^",\n]*+"(?:,|$))

**デフォルトの名無しさん** · 2020/07/27(月) 15:27:53.85

(?>".*?"|[^"スペース]++)*+\Kスペース
を削除

**デフォルトの名無しさん** · 2020/07/28(火) 23:58:50.39

HTML中に

<a href="/a.html"><img src="test.jpg"></a>

と

<img src="test.jpg">

リンクに囲まれた test.jpg または、画像だけののどちらかがあって。
どちらにも引っかかる正規表現が書けません。

PHPの正規表現キボンヌ
自力では2つの正規表現を書いてしのいでいるので、一つで対応できますか？

現状は

リンクに囲まれた画像
/(^.*)(<a href=".*?>\n*<img .*?test.jpg.*?>\n*<\/a>)(.*$)/s

画像のみ
/(^.*)(<img .*?test.jpg.*?>)(.*$)/s

で対応しています。

**デフォルトの名無しさん** · 2020/07/29(水) 01:26:58.01

/<img[^>]+test\.jpg[^>]+>/g

JavaScript では、これで両方に一致する。
[^>]+ で、> 以外の文字を、1文字以上。
g で、すべての箇所に一致する

test.jpg だと、. は任意の1文字を表すから、意味が異なる。
ドットという文字に一致させるには、\. とエスケープが必要

**デフォルトの名無しさん** · 2020/07/29(水) 01:58:17.28

aタグ含めてマッチさせたいんでね？
それでも単純に|で繋げば済む話だと思うけど

**デフォルトの名無しさん** · 2020/07/29(水) 03:04:25.73

あってもなくてもいいものは末尾に?を付ければいいよ
((<a [^>]++>)?(?:<img[^>]+test\.jpg[^>]+>)(</a>)?)

**デフォルトの名無しさん** · 2020/07/29(水) 05:46:17.91

>>9
これ面白いな。プログラミング授業に採用すべき。

**デフォルトの名無しさん** · 2020/07/29(水) 11:18:17.76

>>326
ありがとうございます！
[^>]+　って発想がありませんでした・・。

>>328
ありがとうございます。
++　のところは一つですよね？

こんな感じをベースにやってみようと思います。
https://regexper.com/#%7C%28%28%3Ca%20%5B%5E%3E%5D%2B%3E%29%3F%28%3F%3A%3Cimg%5B%5E%3E%5D%2Btest%5C.jpg%5B%5E%3E%5D%2B%3E%29%28%3C%5C%2Fa%3E%29%3F%29%7C

**デフォルトの名無しさん** · 2020/07/29(水) 11:23:00.16

>>325
こういうの正規表現じゃなくcss selectorやxpath使った方が簡単だよ

**デフォルトの名無しさん** · 2020/07/29(水) 14:14:44.18

> リンクに囲まれた test.jpg または、画像だけののどちらかがあって
> /(^.*)(<a href=".*?>\n*<img .*?test.jpg.*?>\n*<\/a>)(.*$)/s
> /(^.*)(<img .*?test.jpg.*?>)(.*$)/s

^(?=.*test\.jpg).++$
こういう事では？

**325** · 2020/07/29(水) 14:47:56.12

>>331
ありがとうございます。
たしかにその2つのほうがphpソースとしては分かりやすくなりそうですね。

**デフォルトの名無しさん** · 2020/07/31(金) 01:03:19.74

>>329
前半はいいけど、後半がきつい
総当たりで力技ぐらいしか思いつかんわ・・・

**デフォルトの名無しさん** · 2020/08/01(土) 06:04:54.43

cssなんですが、
margin:10px;padding:10px;border:1px solid red;backgroun-color:red;font-size:16px;
というものがあったとして、正規表現でborderのプロパティと内容だけを削除できないでしょうか？
欲しい結果どす
margin:10px;padding:10px;backgroun-color:red;font-size:16px;

ちなみにborderの値は
1px red solidの場合もあれば
solid 1px redの場合もあります

つまり、borderプロパティに不随する値を消したいのです(´・ω・`)

**デフォルトの名無しさん** · 2020/08/01(土) 06:13:27.50

～; か、;～; の、～の中に、border という文字列が、あれば良いのか？

**デフォルトの名無しさん** · 2020/08/01(土) 06:32:02.40

どういうことですか？
borderプロパティとその値を削除したい感じです
border(プロパティ):red 1px solid(値);

**デフォルトの名無しさん** · 2020/08/01(土) 06:38:27.91

border[^;\n]++;

**デフォルトの名無しさん** · 2020/08/01(土) 06:52:53.24

\rも入れといたほうがいいだろ

**デフォルトの名無しさん** · 2020/08/01(土) 06:59:35.99

あとborder-color:～とかも消えちゃうね

**デフォルトの名無しさん** · 2020/08/01(土) 07:21:39.09

あとプロパティじゃなくて値やコメントにborderって入る可能性が無いかな？
\bborder\s*:[^;}\r\n]++;?
ぐらいがいいのではないかな
これでもxx-borderとかプロパティがあったり？（無いだろうけど）
、また値を改行されて書かれたりしたらダメなんだが

**デフォルトの名無しさん** · 2020/08/01(土) 07:38:14.81

処理系がかかれてないので++がダメだったら+に代えるように

**デフォルトの名無しさん** · 2020/08/01(土) 09:01:52.60

すみません
meryです

**デフォルトの名無しさん** · 2020/08/01(土) 12:04:03.32

border(-[a-z]+)?:[^;]+;

**デフォルトの名無しさん** · 2020/08/01(土) 18:09:27.98

ありがとうございます
できましたが、解説サイトありませんか？
記号がヒットしないもんで、、、

**デフォルトの名無しさん** · 2020/08/01(土) 18:40:27.24

https://github.com/k-takata/Onigmo/blob/master/doc/RE.ja

**デフォルトの名無しさん** · 2020/08/01(土) 19:21:49.80

(自分の投稿分だけ)
[]は[]内に挙げた任意の1文字
+は直前の文字だけで構成される文字列,*は0文字以上、+は1文字以上
つまり[a-z]+はa-zの範囲の文字だけで構成される長さ1以上の任意の文字列
?は直前の文字(列)がないものも対象(あってもなくてもいいということになる)

[]内先頭の^は否定
つまり[^;]は;以外の任意の文字

まとめると:の前は
border, border-width等borderファミリーまとめて対象にしている
:の後は:直後～最初の;までが対象

>>344では:以前にスペースがあると対象にならない

**デフォルトの名無しさん** · 2020/08/01(土) 22:21:06.56

丁寧にありがとうございます。難しいですね。
border(-[a-z]+)?:の部分はなぜグループ化する必要があるんでしょうか？

**デフォルトの名無しさん** · 2020/08/01(土) 22:43:25.14

>>348
それは>>347の
> まとめると:の前は
> border, border-width等borderファミリーまとめて対象にしている

border:を対象にするために
border(-[a-z]+)?:というborder《【頭に-付いたa-z任意文字列1文字以上】があってもなくても》:指定になってる

>>347のいってる空白云々はborder :のようにrと:の間に空白あるとマッチしないという意

元cssの書き方次第で漏れるからあまり向いてるとは言えない気がする
空白を気にして\s?や[:blank:]?を間に入れ込むのも精神的にツラい
その場限りならいいけど

**デフォルトの名無しさん** · 2020/08/01(土) 22:57:20.65

borderとborder-styleなどを対象にする場合、括弧を使うことで不足分を補うというイメージでしょうか？
borderとborder-styleという指定になってるんですね

**デフォルトの名無しさん** · 2020/08/01(土) 23:05:44.88

>>350
border(-[a-z]+)?:　の　?　をどこに効かせるか
border-([a-z]+)?:　だと　-　が必須になる（-　に　?が効かない）ので　border:　にマッチしない（border-abcdef:　にはマッチする）

正規表現入門　でググってそれ見ながら　↑のパズルで遊んでみたら？

**デフォルトの名無しさん** · 2020/08/01(土) 23:08:11.58

border-radiusも忘れないであげてください...

**デフォルトの名無しさん** · 2020/08/01(土) 23:12:41.55

説明が下手だと良く言われるでしょ？
笑えるくらいグダグダなのなｗ

**デフォルトの名無しさん** · 2020/08/01(土) 23:38:46.09

>>353
はいどうぞw

**デフォルトの名無しさん** · 2020/08/02(日) 04:53:04.96

Mery(鬼雲の仕様?)なら
border\s*(-[a-z]+)?:[^;]+;
で:前の改行や空白文字も対象にしてくれるけど
エンジンによっては対象にならないし
可能なパターン全てに対応させようと思ったら正規表現メモになってしまう(相当面倒だということ)

どーでもいいけど
[-a-z]か(-[a-z]+)*にした方が良かったか
border-なんとか-かんとか
みたいなのもある?

**デフォルトの名無しさん** · 2020/08/02(日) 07:34:01.59

最小一致のやり方を教えて下さい
<h1>aaa</h1><h1>aaa</h1>
最初のh1要素だけ取り出すことはできないでしょうか？

<h1>(*?)</h1>

これではだめです。

>>351
ありがとう
手を動かします

**デフォルトの名無しさん** · 2020/08/02(日) 07:46:47.76

<h1>[^>]+h1>

[^>]+ は、> 以外の文字が、1文字以上

**デフォルトの名無しさん** · 2020/08/02(日) 08:08:51.02

**デフォルトの名無しさん** · 2020/08/02(日) 08:08:54.84

^.*?<h1>\K.*?(?=</h1>)

**デフォルトの名無しさん** · 2020/08/02(日) 08:16:49.14

(?~</?+h1>)(?=</h1>)

**デフォルトの名無しさん** · 2020/08/02(日) 08:18:05.24

あ、ダメだこれ>>360

**デフォルトの名無しさん** · 2020/08/02(日) 10:46:18.27

>>357,358,359
全部だめでした
ちなみにmeryです
いつもいい忘れます
ごめんなさい

**デフォルトの名無しさん** · 2020/08/02(日) 10:54:32.92

>>357
これでいけました
しかし順番にマッチするんですね

**デフォルトの名無しさん** · 2020/08/02(日) 10:55:57.37

順番に置き換えていくならいいですが、全て置き換えを行う場合
>>357だと出来ないですね

**デフォルトの名無しさん** · 2020/08/02(日) 11:08:50.52

削除
^.*?\K<h1>.*?</h1>(.*)
\1

ABCに置換
ABC\1

**デフォルトの名無しさん** · 2020/08/03(月) 01:53:48.18

すべてにマッチする、オプションは無いの？

**デフォルトの名無しさん** · 2020/08/03(月) 03:15:13.61

>>365
ありがとう
むずかしい

**デフォルトの名無しさん** · 2020/08/05(水) 13:11:50.02

●Regular Expressionの使用環境
サクラエディタ

●検索か置換か？
置換

●説明
空白を除去するのに\sで検索してますが
アルファベットの文字間では空白を残したい

●対象データ
ジャッキーチェン：Jackie Chan
●希望する結果
ジャッキーチェン：Jackie Chan

**デフォルトの名無しさん** · 2020/08/05(水) 14:03:13.77

スペースの直前直後が[a-zA-Z]ならマッチせず
それ以外ならマッチするという正規表現でいいのかな？
もうちょっと仕様を詰めたほうがいい気がする

John Paul IIの2つ目のスペースは削除？
George W. Bushの2つ目のスペースは削除？

**デフォルトの名無しさん** · 2020/08/05(水) 14:03:44.33

(?<=[^A-Za-z])\s(?=[^A-Za-z])|(?<=[^A-Za-z])\s(?=[A-Za-z])|(?<=[A-Za-z])\s(?=[^A-Za-z])

**デフォルトの名無しさん** · 2020/08/05(水) 16:38:08.92

>>369
スペースの前後ともアルファベットならマッチせず、それ以外ならマッチするです。
その他の条件はありません。ちなみに行頭と行末のスペースにはマッチさせたいです。

>>370
ありがとうございます。行頭が残るようですが希望のことができました。

**デフォルトの名無しさん** · 2020/08/05(水) 16:57:46.08

>>371
^\s++|\s++$|(?<=[^A-Za-z])\s(?=[^A-Za-z])|(?<=[^A-Za-z])\s(?=[A-Za-z])|(?<=[A-Za-z])\s(?=[^A-Za-z])

**デフォルトの名無しさん** · 2020/08/05(水) 17:13:59.30

ORでは1つで良いような

(?<![a-zA-Z])¥s|¥s(?![a-zA-Z])

**デフォルトの名無しさん** · 2020/08/05(水) 20:14:19.67

ゼロ個でも
\s(?!(?<=[A-Za-z].)(?=[A-Za-z]))

**デフォルトの名無しさん** · 2020/08/05(水) 21:50:35.87

>>374
へぇーー
速度的にも有利っぽいしこのパターン覚えとくわ

**デフォルトの名無しさん** · 2020/08/06(木) 11:27:45.13

成り立ってるそれ？

**デフォルトの名無しさん** · 2020/08/06(木) 11:59:29.23

\s(?!(?<=[A-Za-z].)[A-Za-z])
肯定先読み要らないよね。ある方が見やすい気がしなくもないけど

**デフォルトの名無しさん** · 2020/08/06(木) 16:39:38.24

374の「選択子がゼロ個」と「集合の否定」の話じゃなければアサーションを入れ子にする必要もないのですよ
\s(?>(?![A-Za-z])|(?<![A-Za-z].))

**デフォルトの名無しさん** · 2020/08/10(月) 00:32:29.15

●使用環境
RegEx Lab(iOSアプリ,ICU Regex)
iOSショートカットアプリ

●検索か置換か？
検索

●説明
以下の2パターンのデータから"あいうえお"を取り出す正規表現を教えてください。
自分なりに考えたのですが↓ではうまくいきませんでした。
名前(?:：<.+?>|：)(.*?)(?:</a>|$)
ちなみにCotEditorでは↑の正規表現でも検索できました。

●対象データ1
～
<div class="abcde_abcde">
名前：あいうえお
</div>
～

●対象データ2
～
<div class="abcde_abcde">
名前：<a href="https://www.google.com";>あいうえお</a>
</div>
～

●希望する結果
あいうえお

**デフォルトの名無しさん** · 2020/08/10(月) 01:07:48.09

>>379
RegEx Labちょうど使ってたので
https://i.imgur.com/4xeRITQ.png

**デフォルトの名無しさん** · 2020/08/10(月) 01:16:40.29

>>379
$が行末にマッチしてないだけなら、単に改行\Rに置き換えてみてもいいし正規表現の頭におまじない(?m)を足してみてもいい
置換じゃなくて検索なら
(?<=名前：<[^>]{0,99}?>).*?(?=</a>)|(?<=名前：)(?!<).*+

**デフォルトの名無しさん** · 2020/08/10(月) 01:36:35.46

>>380
>>381
こんなに色々なやり方があるんですね……勉強になります。
無事検索できるようになり本当に助かりました。
ありがとうございました！

**デフォルトの名無しさん** · 2020/08/11(火) 13:59:29.59

grepのperl正規表現オプションを使ってURLのホスト名を抽出したいです

https://mevius.5ch.net/test/read.cgi/tech/1568640311/l50
http://www.google.co.jp/

このスレだったら”mevius”
googleなら”www”
「https://」or「http://」と「.」に挟まれた文字列の最短一致でできそうなのですがなぜか上手くいきません

1文字に挟まれたパターンは検索して出てくるのですが、複数文字に挟まれたパターンはあまり出てこなくて、この際はっきりしたいので「〇〇〇と△△△に挟まれた文字列の中身のみを最短一致で抽出」パターンも教えてください

**デフォルトの名無しさん** · 2020/08/11(火) 14:15:33.95

>>383
/https?:\/\/([^./]+)/
grepもperlも知らないけどこんな感じでどうや
△△△が一文字なら△を含まない文字の連続で取るといいと思う
複数文字の場合は知らない

**デフォルトの名無しさん** · 2020/08/11(火) 14:17:58.02

grep知らずにここに居る人が存在するのか…

**デフォルトの名無しさん** · 2020/08/11(火) 14:33:07.25

>>384
早速ありがとうございます
ですがそのやり方ですとgrepでは抽出できませんでした

△△△は複数の種類の文字ですね言葉足らずでした
正しくは「ABC」と「DEF」に挟まれた文字みたいなものですね

**デフォルトの名無しさん** · 2020/08/11(火) 14:36:19.90

$ cat input.txt
https://mevius.5ch.net/test/read.cgi/tech/1568640311/l50
http://www.google.co.jp/

$ grep -Po '(?<=:\/\/).+?(?=\.)' input.txt
mevius
www

**デフォルトの名無しさん** · 2020/08/11(火) 14:37:41.53

>>386
できなかったか、すまん
これは自分には無理だわ
知識もないのにでしゃばるべきじゃなかったな

**デフォルトの名無しさん** · 2020/08/11(火) 14:45:43.81

pcregrepならキャプチャグループを番号指定して出力可能

$ pcregrep -o1 ':\/\/(.+?)\.' input.txt

**デフォルトの名無しさん** · 2020/08/11(火) 15:47:36.92

>>388
いえいえ

>>387
>>389
おー、これでできました
pcregrepのやり方もありがとうございます

**デフォルトの名無しさん** · 2020/08/11(火) 20:17:56.42

Javaで

setMethod();
getMethod();
setBake();

みたいなgetter,setterは検出したくなく、

Methoda();
Methodb();
bake();

みたいなset, getで始まっていない()付きの文字列を含む
行を正規表現一行で検出するするのはどうしたらいいのですか?

**デフォルトの名無しさん** · 2020/08/11(火) 21:07:16.11

^(?=.*?\b(?!set|get)[A-Za-z]++;).*
^(?=.*\b(?!set|get)[A-Za-z]+;).*

**デフォルトの名無しさん** · 2020/08/11(火) 21:55:37.51

申し訳ありません。

Methoda() {
Methodb(){
c = z.Methoda().Methodb(a,b)

みたいな行は検索の対象にいれたいのですが
よろしくお願いします。

**デフォルトの名無しさん** · 2020/08/11(火) 22:14:19.40

もうちょい目的と仕様をはっきりさせたほうがいいんじゃない？

get/setではじまってない()付きの文字列を含む行なら問題ないけど
get/setではじまってないメソッド定義やメソッド呼び出しをもれなく抽出したいということなら
正規表現だときつい気がする

後者ならコードをパースして使ってるメソッド一覧を出力するようなツールを探したほうがいいかも

**デフォルトの名無しさん** · 2020/08/11(火) 22:27:44.94

^(?=.*?\b(?!set|get)[A-Za-z]++).*

**デフォルトの名無しさん** · 2020/08/11(火) 22:36:31.67

(?<=(?:\n|^|\.))(?<!set|get)[a-zA-Z]+\(

**デフォルトの名無しさん** · 2020/08/11(火) 22:52:10.25

引数が無い and setter, getterではないメソッドを含んでいる行です
ひょっとして正規表現内では表現できないかもしれません。
文脈自由レベルでしょうか?

**デフォルトの名無しさん** · 2020/09/20(日) 19:06:52.11

5chのスレタイはこん感じで入っている

<a href="1599110613/l50">1: ぶっちゃけ始めるのにいい言語て何　part3 (78)</a>
<a href="1545032904/l50">2: 文字コード総合スレ Part12 (95)</a>
<a href="1598112455/l50">3: Rust part9 (198)</a>
<a href="1598336253/l50">4: 小6におすすめな言語 (32)</a>
<a href="1594528940/l50">5: C++相談室 part152 (404)</a>
<a href="1596690797/l50">6: Xamarin Part7 (97)</a>
<a href="1598527450/l50">7: くだすれPython(超初心者用) その50【まず1嫁】 (423)</a>

ここからたとえば「言語」とついたスレタイだけ抽出するのは無理だった

<a href="1599110613/l50">1: ぶっちゃけ始めるのにいい言語て何　part3 (78)</a>
<a href="1598336253/l50">4: 小6におすすめな言語 (32)</a>

**デフォルトの名無しさん** · 2020/09/20(日) 20:06:08.38

>>397
いやもう
\b(?!set|get)\w+
でいいんでしょ

**デフォルトの名無しさん** · 2020/09/20(日) 23:02:18.72

JavaScript では、これで複数行マッチ(g)できた
/<a[^>]+>.*言語.*<\/a>/g

<a で始まって、> 以外の文字が、1文字以上続いて、>
言語の前後に、.*
<\/a> で終わる

他には、Ruby でスクレイピングすれば？

**デフォルトの名無しさん** · 2020/09/21(月) 00:25:21.75

>>400
おかしいな、それでうまくいかなかったのに

と思ったら入ってくるHTMLソースに改行がないようだ
</a>のあとに改行入れるとうまくいくように見えるけど、HTMLソースがおかしくなる

正規表現以前の問題だったわ

**400** · 2020/09/21(月) 02:18:58.27

別に抜き出すだけなら、
一旦、</a> の後ろに、改行を追加してから、正規表現を使えば？

それか、HTML をコピーしてから、やるとか