Regular Expression(正規表現) Part15

**デフォルトの名無しさん** · 2019/09/16(月) 22:25:11.87

Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part14
https://mevius.5ch.net/test/read.cgi/tech/1489511075/

次スレは>>980宜しく
天ぷら等>>2以降

**デフォルトの名無しさん** · 2020/05/29(金) 21:49:09.90

>>232
オートマトンを組むので速度は変わらないと思うが

**デフォルトの名無しさん** · 2020/06/18(木) 21:13:18.22

https://i.imgur.com/ngqWoOX.jpg

上を下としたいのですが、２回に分けることは可能ですが、１回でやれますでしょうか？スラッシュが含まれる場合、そこをエスケープしたいのです
scriptタグ貼ると怒られますので、画像です(´・ω・`)、、、

**デフォルトの名無しさん** · 2020/06/18(木) 22:17:30.24

>>234
正規表現：　(<([^>]+)>[^<]*<)(/\2>)
置換　　　：　"$1\$3"

**デフォルトの名無しさん** · 2020/06/18(木) 22:21:10.54

環境によっては
置換：　"$1\\$3"
としないとダメなこともあり

**デフォルトの名無しさん** · 2020/06/18(木) 22:28:45.36

>>235 は.NET
>>236 はperl

sed だと
置換：　"\1\\\3"

**デフォルトの名無しさん** · 2020/06/18(木) 22:37:34.06

<スクリプト>(ここが変化)</スクリプト>
って感じでスクリプトとスクリプトの間が変化するだけじゃない？

**デフォルトの名無しさん** · 2020/06/18(木) 22:42:36.83

間があるのなら通常1行ではないだろう

**デフォルトの名無しさん** · 2020/06/18(木) 22:48:48.44

＜script>([^\b]*?)</script>
"＜script>\1<\\/script>"

**デフォルトの名無しさん** · 2020/06/19(金) 02:59:23.82

厚生労働省がガイドラインを発表…「副業」公認の時代が来た？
https://www.iza.ne.jp/kiji/economy/news/200516/ecn20051620000005-n1.html
フリーランス向け報酬即日払いサービス『先払い』受付開始7ヶ月で申込件数1,000件突破
https://prtimes.jp/main/html/rd/p/000000026.000047439.html
副業プラットフォーム「Kasooku」が約1.9億円調達、マッチング件数は5000件突破
https://jp.techcrunch.com/2020/04/30/kasooku-fundraising/
副業がしやすくなった？リモートワークを実施してよかったと思うことTOP5
https://dime.jp/genre/914967/
ポストコロナ時代の人生に副業は欠かせない
https://www.gentosha.jp/article/15457/
副業が社員を強くする　コロナ・ショックが加速する新しい雇用の形
https://business.nikkei.com/atcl/gen/19/00149/042300009/
4割以上が「副業意欲向上」「副業しやすくなった」と変化｜
新型コロナウイルスの影響下における働き方の実態・意識調査
https://prtimes.jp/main/html/rd/p/000000009.000040832.html

**デフォルトの名無しさん** · 2020/06/19(金) 05:44:59.40

https://ideone.com/jkDxgX
ごめんなさい
scriptタグだけではないです
行頭と行末に"を挿入し、スラッシュをコメントアウトしたいのです、、、(´・ω・`)

**デフォルトの名無しさん** · 2020/06/19(金) 07:43:33.01

>>242
タグ内にタグ(正確には < )が入らないなら >>235さんので出来るよ
> 行頭と行末に"を挿入し
タグの間に改行が入ることは無いの？タグは関係なしに文字通りに行頭と行末？
環境も分からないし>>2のテンプレ通りに条件を例示して

**デフォルトの名無しさん** · 2020/06/19(金) 10:22:50.49

鬼雲
(?<!")(<([^>\s]++).*?>[^\b]*?<)(/\2>)(?!")
"\1\\\3"

制限
ネストの回数分、全置換の繰り返しが必要
<div id=a><div id=b>test</div></div> こういうのも行けるが
id=aの開始タグとid=bの終了タグの組み合わせで置換され次にid=bの始、id=aの終で処理される
<div id=a>"abc"<div id=b>test</div>"def"</div> タグの外側直近に"があるものは否定(先|戻り)読みで"を見ているので無理

**デフォルトの名無しさん** · 2020/06/19(金) 11:06:15.25

●Regular Expressionの使用環境
mery2.6.7です
●検索か置換か？
置き換えしたいです
●説明
先頭と行頭に"を追加し、/をエスケープしたいです
●対象データ
https://ideone.com/mNblKp

>>243
了解です
　直しました
複数回に分けてやるのが普通なんでしょうか？

**デフォルトの名無しさん** · 2020/06/19(金) 11:47:09.20

>>245
これダブルクォーテーションもエスケープしなきゃいけないんじゃないの？

**デフォルトの名無しさん** · 2020/06/19(金) 12:02:33.17

>>246
すみません、勘違いしていました
エスケープ対象は"で、/はエスケープ対象ではないです。

vscodeのスニペットに登録する際に、"をエスケープしないといけないんです
これ、なにげに面倒ですね

**デフォルトの名無しさん** · 2020/06/19(金) 14:19:20.57

>>247
HTMLが一般的ではないんだけど
通常はタグと閉じタグとが別の行になることが多いし
あるいは全てが一行というものもあるんだけど
こんな特殊なものにだけ対応でいいのか？
また各タグ毎に""だとダメなのか？
こうすれば行が違ってても大丈夫となるけど
【例】　<h1>h1</h1> → "<h1>"h1"</h1>"

**デフォルトの名無しさん** · 2020/06/19(金) 16:14:22.39

自分macなのでmery使えないの試せない
javascriptのマクロが使えるみたいじゃん
正規表現だけだと厳しいかも

var code =`<!DOCTYPE html> ～省略～ </html>`
var code = code.replace(/(<.*?>)\n/g, '"$1"\n').replace(/\//g, '\\\/')
console.log(code)

javascriptの置き換え部分だけ書くと上のでいけるはず
meryのマクロの体裁に整えればこれでいけると思う

環境によって\はバックスラッシュだし$もバックスラッシュです

**デフォルトの名無しさん** · 2020/06/19(金) 16:33:24.58

var2回もいらんし。
¥nは$にしないとそのスクリプト自体動作失敗してるでしょ。

**デフォルトの名無しさん** · 2020/06/19(金) 16:45:53.57

>¥nは$にしないと

へえそうなんだ
macだとそのままいけるんだよね
var 2回いらねはさすがに難癖だね

**デフォルトの名無しさん** · 2020/06/19(金) 16:49:07.22

>>248
vscodeのスニペット登録はそういうルールのようです
やはり複数回に分けるのが利口でしょうか
プログラムだって何回かに処理を分けますもんね

必須ではないですが、知識として知りたいなあと思った次第です

**デフォルトの名無しさん** · 2020/06/19(金) 17:06:56.57

>>251
無駄にプライドが高そうなタイプだなw
varの意味がわかってれば2回はつけんよ。
それだと最終行に¥nがなかったら処理されない。

https://ideone.com/QOYdYP

**デフォルトの名無しさん** · 2020/06/19(金) 18:05:26.45

>>249
自分はpythonでやってみますです

**デフォルトの名無しさん** · 2020/06/19(金) 18:07:51.43

ひょっとするけど
タグ関係なく単に各行を""で括るってだけなんじゃ？

**デフォルトの名無しさん** · 2020/06/19(金) 18:24:29.90

スニペット登録でググってみたら
jsonで記述と書かれてる
やっぱりタグは無関係で
行の前後を""で括るだけだし、カンマ区切りも要る
"Inner": {
"prefix": "in",
"body": [
"<section id=\"$1\">",
"\t<div class=\"inner\">",
"\t\t$2",
"\t</div>",
"</section>"
],
},

**デフォルトの名無しさん** · 2020/06/19(金) 18:36:21.20

え、そうなのですか、、、

**デフォルトの名無しさん** · 2020/06/19(金) 18:57:56.53

そもそもキー入力の短縮だし、基本はテンプレート登録だ
"Print to console": {
"prefix": "log",
"body": [
"console.log('$1');",
"$2"
],
"description": "Log output to console"

あと、スニペット登録入力用のvscode拡張機能もあるようだ

**デフォルトの名無しさん** · 2020/06/19(金) 21:44:28.86

ggrks
https://www.google.com/search?q=vscode スニペット登録拡張

**デフォルトの名無しさん** · 2020/06/20(土) 00:03:50.12

#一行目
AAAランダム文字列1AAAランダム文字列2BBBランダム文字列3BBBランダム文字列4CCC
#二行目
AAAランダム文字列5BBB

このような文章があって
AAAランダム文字列2BBB
だけを1回の処理で抽出することは可能ですかね？
AAA～CCCで挟まれ、かつAAA～BBBの真の最短マッチというのでしょうか
二行目は抽出したくないです

AAA((?!AAA).)*CCC
↓
AAA((?!AAA|BBB).)*BBB

と2回の処理ではできたのですがどうも悔しいです

**デフォルトの名無しさん** · 2020/06/20(土) 00:10:55.64

>>260
AAA.*(AAA.*?BBB).*CCC

**デフォルトの名無しさん** · 2020/06/20(土) 00:29:48.90

ランダム文字列の最初（最後）の文字がA（B)だった時は？

**デフォルトの名無しさん** · 2020/06/20(土) 00:44:31.03

>>177
画像を右クリック、キャッシュ処理-NGファイル
リンクからでも出来るが再度取得しに行ってしまうのが無駄になるかも

**デフォルトの名無しさん** · 2020/06/20(土) 00:44:59.32

誤爆ｽﾏﾝ

**デフォルトの名無しさん** · 2020/06/20(土) 00:52:46.51

>>261
早速ありがとうございます
ですがそのやり方ですと自分が確認した限り最初のAAA～CCCまで全て抽出されてしまうようです

言い忘れてしまい申し訳ないのですがperl正規表現を使いgrepで抽出しようとしています

>>262
すいませんわかりやすくAAAと表記していますが実際はhttpsから始まるURLでBBBも複雑な固定文字列ですのでまず連続することはないと思います
あったとしてもそれは仕方ないのでここでは考えないものとしていただければ…

**デフォルトの名無しさん** · 2020/06/20(土) 02:01:55.18

>>265
それは正規表現の問題じゃなくgrepの使い方の問題で
キャプチャグループを取り出せてないだけだと思う

pcregrep -o1 'AAA.*?(AAA.*?BBB).*CCC' <input>
とか
grep -oP 'AAA.*?¥K(AAA.*?BBB)(?=.*?CCC)' <input>
とか工夫して

**デフォルトの名無しさん** · 2020/06/20(土) 02:35:31.58

>>266
失礼しました
grepの使い方が悪かったのですね
そちらの方法で無事抽出できました
ありがとうございました

**デフォルトの名無しさん** · 2020/06/21(日) 11:54:44.04

マークダウンのマッチのさせ方について
この２つのうち、上だけをマッチさせたいです
#半角スペースh1
#半角スペース半角スペース半角スペースh1

しかし
^# .*$
だと、両方マッチします。半角スペースが１つの場合のみマッチさせられるでしょうか

**デフォルトの名無しさん** · 2020/06/21(日) 12:19:16.08

^# [^ ]

**デフォルトの名無しさん** · 2020/06/21(日) 14:46:34.76

ありがとうございます

# h
の部分だけマッチします
一文字の繰り返しの部分は、どう指定してるんでしょうか？

**デフォルトの名無しさん** · 2020/06/21(日) 14:58:06.74

[^ ]+

**デフォルトの名無しさん** · 2020/06/21(日) 15:46:15.97

だとスペースがマッチしません
ありがとうございます

**デフォルトの名無しさん** · 2020/06/21(日) 16:11:36.93

>>2

**デフォルトの名無しさん** · 2020/06/21(日) 18:30:44.16

^#[ ]([^ ].*)$
これでいけたブリ

**デフォルトの名無しさん** · 2020/06/27(土) 20:14:07.00

chmateから改行コードが見えるレスのNGワードはどうやって登録すればいいですか？

https://i.imgur.com/eWpnlIM.jpg

**デフォルトの名無しさん** · 2020/06/28(日) 00:20:52.36

chmateとやらのスレで聞いた方がいいと思うが

**デフォルトの名無しさん** · 2020/06/28(日) 20:47:34.83

わかる方教えてください

yyyy/mm/dd の形式で、下記のような0埋め処理をしたいのですが、一発処理方法がわかりません
大量にあるファイルを秀丸にてgrep置換予定です。空白がジャマすぐる
今後も処理の必要があるので、できれば一発、無理なら２周かな…

ex.) 2020/ 6/ 1 ⇒ 2020/06/01

([0-9]{4})/( [0-9]|[0-9]{2})/( [0-9]|[0-9]{2})
これで全条件拾えるが処理できないし、下記だと３周しないといけないし

([0-9]{4})/ ([0-9])/([0-9]{2}) ⇒ \1/0\2/\3 //月のみ1桁
([0-9]{4})/([0-9]{2})/ ([0-9]) ⇒ \1/\2/0\3 //日のみ1桁
([0-9]{4})/ ([0-9])/ ([0-9]) ⇒ \1/0\2/0\3 //両方1桁

どなたか、お願いしますm(_ _)m

**デフォルトの名無しさん** · 2020/06/28(日) 22:32:55.02

> 大量にあるファイルを
> 今後も処理の必要がある
スクリプトでやるものじゃね？

以下で2週で出来るが秀丸の正規表現は知らんからヒントにでもして
(?<=\d{4}/) (?=\d/[\d ]\d)
0
(?<=\d{4}/\d\d/) (?=\d)
0

(先|戻り)読みが使えないなら
(\d{4})/ (\d/[\d ]\d)
\1/0\2
(\d{4}/\d\d)/ (\d)
\1/0\2

**デフォルトの名無しさん** · 2020/06/28(日) 22:57:55.61

>>277
秀丸は使えないのでうまくいくかは不明だが
検索文字列：\d{4}/\K (?=\d/(?:\d\d\D| \d\D))|\d{4}/\d\d/\K (?=\d\D)|\G\d{1,2}/\K (?=\d\D)
置換文字列：0
\Kがダメなら、(?<=\d{4}/)とかに変えてみる（3箇所）
ただし誤爆は起きるかもしれない

**デフォルトの名無しさん** · 2020/06/28(日) 23:14:26.22

なお誤爆の可能性は、
1) ファイル先頭に、 6/28 xxx で始まっていた場合
2) 2020/ 6/28/ 9 xxx とか引き続き/ 9とかがある場合
3)ファイル末尾で、2020/ 6/28（改行コードなし）で終わっている場合は変換されない
　まあ改良すれば3)は問題なくなるけど

**デフォルトの名無しさん** · 2020/06/28(日) 23:16:24.29

2)は間違い　2020/ 6/ 8/ 9 とかの場合に訂正

**デフォルトの名無しさん** · 2020/06/28(日) 23:19:24.85

あ、1）も間違ってる
6/ 8 xxxに訂正（空白なしで数字1文字で始まる場合）

**デフォルトの名無しさん** · 2020/06/29(月) 00:31:06.80

秀丸なら普通にマクロでプログラム書いた方が楽じゃない？

**デフォルトの名無しさん** · 2020/06/29(月) 00:32:15.99

1)は、\G(?!^)というふうに先頭の場合を除けばいける
残りの2)3)は工夫次第

**デフォルトの名無しさん** · 2020/06/29(月) 16:30:01.33

難しく考えなくても置換対象以外に"/ "が無いなら
/[ ]
/0
で一発

**デフォルトの名無しさん** · 2020/06/29(月) 16:59:50.16

これでできないかい？
FIND:(?<=¥d{4}/[ ¥d]¥d/) (¥d)|(?<=¥d{4}/) (¥d)(?=/)
REP:0$1$2

**デフォルトの名無しさん** · 2020/06/29(月) 17:05:41.11

こっちのほうが確実か。
FIND:(?<=¥d{4}/) (¥d)(?=/[ ¥d]¥d)|(?<=¥d{4}/[ ¥d]¥d/) (¥d)
REP:0$1$2

**デフォルトの名無しさん** · 2020/06/29(月) 17:28:03.91

>>287
それ試した？それが可能な処理系って何？
選択子で両方を対応するなら>>279の用に\G使わないとスペースが両方にある場合に失敗するぞ

**デフォルトの名無しさん** · 2020/06/29(月) 17:41:18.50

>>288
pythonでもCotEditorでもいけるが？

https://ideone.com/zhrSCV

**デフォルトの名無しさん** · 2020/06/29(月) 17:54:20.25

277 です
皆さんありがとうございます！
レベルが低くて理解できないのもありますが、勉強のためにしっかり精査してみます

>>285
まさにそれですわ
てゆーか別に正規表現使わなくても実現できるという罠
勉強になりました m(_ _)m

改めましてありがとうございました。

**デフォルトの名無しさん** · 2020/06/29(月) 18:05:49.23

>>289
で？質問者はなんて書いている？
pythonとかCotEditorとか書いてあるかい？
質問者の環境で失敗する式を書くならせめて
pythonでならこれで出来る、くらい書けやks

**デフォルトの名無しさん** · 2020/06/29(月) 18:09:28.38

>>291
質問者が文句を言うならともかく、なんでお前が切れてるんだよ。
自分が正解書いてるのに余計なこと書くなって言いたいのか？www
カルシウムとっとけよ

**デフォルトの名無しさん** · 2020/06/29(月) 18:13:56.28

>>290
なんとなくそうじゃないかなーと思った
俺も昔同じ罠にハマった事あるからｗ
解決して何より

**デフォルトの名無しさん** · 2020/06/29(月) 18:25:35.41

>>292
あぁ？理由なら書いてんだろ
おまえのような底意地の悪いゴミカスが気に食わないからじゃ
さっさ死ね

**デフォルトの名無しさん** · 2020/06/29(月) 23:31:59.63

質問者そっちのけの場外乱闘にﾜﾛﾀ

**デフォルトの名無しさん** · 2020/06/30(火) 01:41:09.48

だが、そこがいい

**デフォルトの名無しさん** · 2020/06/30(火) 13:15:03.17

>>279で\Gの使い方が分かった。thx

**デフォルトの名無しさん** · 2020/07/02(木) 02:54:39.72

アプリからファイアウォールにまで使われる正規表現を標的にした「ReDoS攻撃」とは？
https://gigazine.net/news/20200701-redos-cheet-sheet/

ネット中は正規表現を使わないではだめなのか
でもブラウザも中で使っているだろうし

**デフォルトの名無しさん** · 2020/07/03(金) 10:38:52.53

正規表現についてですが、このhtmlの置き換えは一発でできますか？
この前からいろいろ試してるんですが、、
https://ideone.com/vpxoNS

行頭と行末にダブルクォーテーションをつけ、urlの部分はエスケープしています。
vscodeでスニペットを登録する際に、このようにダブルクオーテーションを使用する必要があるのです。

**デフォルトの名無しさん** · 2020/07/03(金) 11:07:40.28

(^<.*?)(".*?)(".*>)$
"$1¥¥$2¥¥$3"
↑vscode内の検索置換

それと全く同じパターンであれば可能だが、dqが複数出てくる場合はできない。
他のパターンも考えたら、
1.dqのみエスケープ、
2.行頭行末にdqをつける
の2アクションにするか、vscodeでそれ用のjsでも書いて処理するか。

スニペット登録したいものをまとめて書き出しておいて2アクションで処理しても大して手間は変わらんだろ。

**デフォルトの名無しさん** · 2020/07/03(金) 12:32:41.29

そうですね　2回でやります

**デフォルトの名無しさん** · 2020/07/03(金) 13:00:37.53

Ruby で、" を、\" に置換してから、
冒頭・末尾に、" を追加する

str = '"ja"'
str.gsub!( '"', '\"' )

puts '"' + str + '"'
#=> "\"ja\""

**デフォルトの名無しさん** · 2020/07/03(金) 13:11:32.91

VScodeのプラグインにSnippet Generatorてのがあるみたいだがそれじゃダメなん？

**302** · 2020/07/03(金) 14:28:11.33

漏れなら、Ruby, PowerShell で、
クリップボード経由で変換するスクリプトを書いて、

ダブルクリックで起動できるように、起動部分をVBS で書くかな？

**デフォルトの名無しさん** · 2020/07/03(金) 14:33:24.34

正規表現よりもJSON.strinfigy()を使ったほうが簡単
スニペット用のJSONを出力すればいいだけだからJSでもRubyでも好きなの使えばいい

**デフォルトの名無しさん** · 2020/07/13(月) 00:17:50.71

JavaScript

const kaoru = '薫'

'[薫子]'.match(`[${kaoru}]`)
'[薫子]'.match(`\[${kaoru}\]`)
'[薫子]'.match(new RegExp(`[${kaoru}]`))
'[薫子]'.match(new RegExp(`\[${kaoru}\]`))

全てマッチしてしまうようですが、マッチさせたくありません
[　や　]　そのものを文字として扱って判定するにはmatchの引数をどうすればよいでしょうか

**デフォルトの名無しさん** · 2020/07/13(月) 00:49:50.36

>>306
それはJSの質問やろ
RegExpコンストラクターを使って2回エスケープ

**デフォルトの名無しさん** · 2020/07/13(月) 19:20:45.29

教えてください。基本的な質問で恐縮です。

20200706T030000Z
SUMMARY:打合せ
LOCATION:中野
DTEND:20200706T043000Z

から、
$1　0300
$2　打合せ
$3　中野
$4　0430
を抜き出すにはどのようにすればよいでしょうか。

**デフォルトの名無しさん** · 2020/07/13(月) 19:49:46.79

^\d{8}T(\d{4}).*+\nSUMMARY:(.*+)\nLOCATION:(.*+)\nDTEND:\d{8}T(\d{4})

**デフォルトの名無しさん** · 2020/07/14(火) 13:34:31.12

今まで何となくで使ってきたけどキャプチャの変数って式に対し1つしか用意されず
部分式呼び出しや量指定子の繰り返しで増やされずに上書きするみたいですね

^(?<y>2020[01]\d[0-3]\dT([0-2]\d[0-5]\d)00Z)(?:\n[^:\n]++:(.*+)){2}\n[^:]++:\g<y>
\1 \2 \3 \4 \5 \6
20200706T043000Z 0430 中野___

どの環境でもこういう仕様なの？

**デフォルトの名無しさん** · 2020/07/14(火) 13:41:52.76

>>310
深く考えてなかったがそういうもんだと思ってた
キャプチャグループが増殖するとは考えもしなかった

**デフォルトの名無しさん** · 2020/07/14(火) 13:50:15.90

もしキャプチャグループが増えるとして
与えられた文字列によって増える順番が異なってくることが考えられるしね

**デフォルトの名無しさん** · 2020/07/14(火) 21:21:06.51

キャプチャしたけりゃ繰り返しや\gで省略するなってことなんだろうけど
気になって出来る方法無いか調べてたら鬼雲で捕獲履歴参照なるものがあった
デフォでは無効になってるみたいだけど

ttps://github.com/k-takata/Onigmo/blob/master/doc/RE.ja
補記 5. 実装されているが、既定値では有効にしていない機能
+ 捕獲履歴参照
　(?@...) と (?@<name>...)
　例. /(?@a)*/.match("aaa") ==> [<0-1>, <1-2>, <2-3>]
　使用方法は、sample/listcap.cを参照
　有効にしていない理由は、どの程度役に立つかはっきりしないため

**デフォルトの名無しさん** · 2020/07/20(月) 23:26:29.84

●Regular Expressionの使用環境
サクラエディタ

●検索か置換か？
置き換え

●説明
３の倍数行あるテキストを、３行ごとに１行にまとめたい

●対象データ　※対象データは、必ず半角英数字です。
e
A8
11A9
c
2
LB5
3
d
8X5

●希望する結果
e A8 11A9
c 2 LB5
3 d 8X5

よろしくお願いいたします。

**デフォルトの名無しさん** · 2020/07/21(火) 00:07:21.07

>>314
サクラエディタはよく知らないけど
一般的な正規表現なら /(.*?)¥n(.*?)¥n(.*?¥n)/g を "$1 $2 $3”で置換すればいいと思う

**デフォルトの名無しさん** · 2020/07/21(火) 10:14:18.12

(?:^.*+|\G.*+[\r\n]+.*+)\K[\r\n]+(.*+)[\r\n]+
_\1_
"_" は半角sp
最終行末尾に改行が無くても可

**デフォルトの名無しさん** · 2020/07/21(火) 10:18:39.84

[\r\n]+
は空行がある場合にズレるから使ってる改行文字に直して
CRLFなら\r\n

**デフォルトの名無しさん** · 2020/07/25(土) 05:22:11.92

質問です。デリミタが基本的に「/」が選ばれるのなぜですか？慣例だから？

**デフォルトの名無しさん** · 2020/07/25(土) 08:47:52.57

人間というのは楽をしようとする生き物なんだ

**デフォルトの名無しさん** · 2020/07/25(土) 17:47:34.31

>>318
ここに来るような人は論理的思考をすると思ってたんだけど、
慣例とか持ち出す奴まで来るのな
|や@なんかと比べれば分かるだろ

**デフォルトの名無しさん** · 2020/07/27(月) 13:00:24.19

●Regular Expressionの使用環境
Ruby2.5
●検索か置換か？
置換
●説明
スペースを削除したい。ただしダブルクオーテーション内は処理対象から除外
●対象データ
ABC, DE F,"G HI"
●希望する結果
ABC,DEF,"G HI"
ダブルクオーテーション内以外に対して処理するって結構ありそうだけど見つからないような・・

**デフォルトの名無しさん** · 2020/07/27(月) 13:15:08.91

そのフォーマット通りなのか
あるいは任意でダブルクォーテーションの処理をするのかで変わってくるな

**デフォルトの名無しさん** · 2020/07/27(月) 14:36:52.94

[ ](?![^",\n]*+"(?:,|$))

**デフォルトの名無しさん** · 2020/07/27(月) 15:27:53.85

(?>".*?"|[^"スペース]++)*+\Kスペース
を削除

**デフォルトの名無しさん** · 2020/07/28(火) 23:58:50.39

HTML中に

<a href="/a.html"><img src="test.jpg"></a>

と

<img src="test.jpg">

リンクに囲まれた test.jpg または、画像だけののどちらかがあって。
どちらにも引っかかる正規表現が書けません。

PHPの正規表現キボンヌ
自力では2つの正規表現を書いてしのいでいるので、一つで対応できますか？

現状は

リンクに囲まれた画像
/(^.*)(<a href=".*?>\n*<img .*?test.jpg.*?>\n*<\/a>)(.*$)/s

画像のみ
/(^.*)(<img .*?test.jpg.*?>)(.*$)/s

で対応しています。

**デフォルトの名無しさん** · 2020/07/29(水) 01:26:58.01

/<img[^>]+test\.jpg[^>]+>/g

JavaScript では、これで両方に一致する。
[^>]+ で、> 以外の文字を、1文字以上。
g で、すべての箇所に一致する

test.jpg だと、. は任意の1文字を表すから、意味が異なる。
ドットという文字に一致させるには、\. とエスケープが必要

**デフォルトの名無しさん** · 2020/07/29(水) 01:58:17.28

aタグ含めてマッチさせたいんでね？
それでも単純に|で繋げば済む話だと思うけど

**デフォルトの名無しさん** · 2020/07/29(水) 03:04:25.73

あってもなくてもいいものは末尾に?を付ければいいよ
((<a [^>]++>)?(?:<img[^>]+test\.jpg[^>]+>)(</a>)?)

**デフォルトの名無しさん** · 2020/07/29(水) 05:46:17.91

>>9
これ面白いな。プログラミング授業に採用すべき。

**デフォルトの名無しさん** · 2020/07/29(水) 11:18:17.76

>>326
ありがとうございます！
[^>]+　って発想がありませんでした・・。

>>328
ありがとうございます。
++　のところは一つですよね？

こんな感じをベースにやってみようと思います。
https://regexper.com/#%7C%28%28%3Ca%20%5B%5E%3E%5D%2B%3E%29%3F%28%3F%3A%3Cimg%5B%5E%3E%5D%2Btest%5C.jpg%5B%5E%3E%5D%2B%3E%29%28%3C%5C%2Fa%3E%29%3F%29%7C

**デフォルトの名無しさん** · 2020/07/29(水) 11:23:00.16

>>325
こういうの正規表現じゃなくcss selectorやxpath使った方が簡単だよ

**デフォルトの名無しさん** · 2020/07/29(水) 14:14:44.18

> リンクに囲まれた test.jpg または、画像だけののどちらかがあって
> /(^.*)(<a href=".*?>\n*<img .*?test.jpg.*?>\n*<\/a>)(.*$)/s
> /(^.*)(<img .*?test.jpg.*?>)(.*$)/s

^(?=.*test\.jpg).++$
こういう事では？