Regular Expressionスレです。
質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。
前スレ
Regular Expression(正規表現) Part14
https://mevius.5ch.net/test/read.cgi/tech/1489511075/
次スレは>>980宜しく
天ぷら等>>2以降
探検
Regular Expression(正規表現) Part15
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
2019/09/16(月) 22:25:11.87ID:enU8we0d2019/10/06(日) 13:19:25.82ID:MVlRtd/O
3つ目の,以降から,field5までの間をキャプチャで良さそう。
23デフォルトの名無しさん
2019/10/06(日) 21:18:49.15ID:QazjZrDG >>21
perl -ne '($a,$b,$c)=m/^((?:[^,]+,){3})(.*[^,])((?:,[^,\n]+){1})$/; $b=~s/,/、/g; print "$a$b$c\n"' input.csv
先頭の三つはカンマの数を数えて取り出し
^((?:[^,]+,){3})
フィールド数は固定とのことなので末尾側もカンマの数で取り出せる
((?:,[^,\n]+){1})$
その間が置換対象
(.*[^,])
ということで数字(3 と 1)を調整すれば実際のデータにも適用できると思います
perl -ne '($a,$b,$c)=m/^((?:[^,]+,){3})(.*[^,])((?:,[^,\n]+){1})$/; $b=~s/,/、/g; print "$a$b$c\n"' input.csv
先頭の三つはカンマの数を数えて取り出し
^((?:[^,]+,){3})
フィールド数は固定とのことなので末尾側もカンマの数で取り出せる
((?:,[^,\n]+){1})$
その間が置換対象
(.*[^,])
ということで数字(3 と 1)を調整すれば実際のデータにも適用できると思います
24デフォルトの名無しさん
2019/10/06(日) 21:30:20.48ID:QazjZrDG2019/10/07(月) 01:52:14.06ID:iyJYb3kL
質問を読んで直ぐにこれを書けるのなら速いけど
もし自分だったらあれをこうしてこれをこうしてと考えて試してる
間にテキストエディタとエクセルを行ったり来たりしながら
タブの挿入と置換と削除を繰り返した方が速いところが
悩ましいw
もし自分だったらあれをこうしてこれをこうしてと考えて試してる
間にテキストエディタとエクセルを行ったり来たりしながら
タブの挿入と置換と削除を繰り返した方が速いところが
悩ましいw
2019/10/07(月) 03:37:15.45ID:21LgfgEW
Ruby で、下のコードを、script.rb に書いて、
入力ファイル名を、input.csv とすると、
端末で、ruby script.rb input.csv と入力する。
つまり、ruby スクリプトファイル名 入力ファイル名
require 'csv'
# 引数はファイル名
CSV.filter( File.open( ARGV[ 0 ] ) ) do |row| # 1行ずつ処理する
row[ 3 ] = row[ 3 ].tr( ",", "、" ) # 列4
end
入力ファイル名を、input.csv とすると、
端末で、ruby script.rb input.csv と入力する。
つまり、ruby スクリプトファイル名 入力ファイル名
require 'csv'
# 引数はファイル名
CSV.filter( File.open( ARGV[ 0 ] ) ) do |row| # 1行ずつ処理する
row[ 3 ] = row[ 3 ].tr( ",", "、" ) # 列4
end
2726
2019/10/07(月) 04:17:44.92ID:21LgfgEW >>26
修正
tr ではなく、tr! で、直接レシーバー(文字列)を変更できる
>row[ 3 ] = row[ 3 ].tr( ",", "、" ) # 列4
row[ 3 ].tr!( ",", "、" ) # 列4
修正
tr ではなく、tr! で、直接レシーバー(文字列)を変更できる
>row[ 3 ] = row[ 3 ].tr( ",", "、" ) # 列4
row[ 3 ].tr!( ",", "、" ) # 列4
2019/10/07(月) 08:59:18.56ID:fodStNL1
それ splice でできるんじゃね? と思ったのでやってみた。
perl -nF, -e 'splice( @F,3,0,join("、",splice( @F,3,@F-5+1))); print( join(",",@F));'
perl -nF, -e 'splice( @F,3,0,join("、",splice( @F,3,@F-5+1))); print( join(",",@F));'
29あ
2019/10/07(月) 21:08:31.31ID:cbxlkLVD >>26
カンマでカラム分割してるからrow[3]にはカンマが含まれないよ
ARGF.each do |line|
line.match(/((?:.+?,){3})(.+)((?:,.+){1})/) do |match|
puts match[1] + match[2].gsub(",", "、") + match[3]
end
end
こういうのって力技で変換するよりも
CSV生成側でクウォートし直したほうがいいよね
カンマでカラム分割してるからrow[3]にはカンマが含まれないよ
ARGF.each do |line|
line.match(/((?:.+?,){3})(.+)((?:,.+){1})/) do |match|
puts match[1] + match[2].gsub(",", "、") + match[3]
end
end
こういうのって力技で変換するよりも
CSV生成側でクウォートし直したほうがいいよね
2019/10/07(月) 22:07:48.83ID:fodStNL1
手間をかけたくないなら、そんなフィールドは末尾に置くのが良い。
そうしておけば何を書こうと邪魔にならない。
いつかは手作業の限界を感じるかもしれないが、それを遅らせることはできる。
そうしておけば何を書こうと邪魔にならない。
いつかは手作業の限界を感じるかもしれないが、それを遅らせることはできる。
31デフォルトの名無しさん
2019/10/07(月) 23:06:48.69ID:gEYFs1Cq AIDS治療みたいなもんか
3226
2019/10/07(月) 23:29:10.22ID:21LgfgEW2019/10/07(月) 23:56:45.43ID:cbxlkLVD
3426
2019/10/08(火) 00:22:31.74ID:cRqslSem クォートしてなかったら、そもそも、CSV にならない!
列内に、カンマが含められないから、列数も変動する
列内に、カンマが含められないから、列数も変動する
2019/10/08(火) 00:32:16.98ID:brYPe3Nc
それがわかってるから変形したいんじゃん。
3626
2019/10/08(火) 02:16:13.41ID:cRqslSem バグのほとんどが設計段階で生じる、典型的な例かw
バグを設計段階で修正せず、実装段階で修正しようとするから、
ますますダメになるという例w
SE・上流工程が馬鹿だと、こういうのが多いw
Ruby などで実装した事がないからだろうw
ダメな事をやる香具師が、あまりにも多いw
バグを設計段階で修正せず、実装段階で修正しようとするから、
ますますダメになるという例w
SE・上流工程が馬鹿だと、こういうのが多いw
Ruby などで実装した事がないからだろうw
ダメな事をやる香具師が、あまりにも多いw
2019/10/08(火) 06:58:17.53ID:nEU/9wkt
なにこの人
要望・仕様を満たせないバグありのプログラムを書いておいて
それを指摘されたら「設計が悪い」と逆ギレしだしたよ
Ruby使う人ってこんなしょうもないおっさんに成り下がるのか
要望・仕様を満たせないバグありのプログラムを書いておいて
それを指摘されたら「設計が悪い」と逆ギレしだしたよ
Ruby使う人ってこんなしょうもないおっさんに成り下がるのか
38デフォルトの名無しさん
2019/10/08(火) 07:25:01.06ID:daf3ib6k >>21
Vim
:%s/^\%([^,]*,\)\{3\}\zs\(.*\)\%(\%(,[^,\n]*\)\{1\}$\)\@=/\=substitute(submatch(0), ',', '、', 'g')/
Emacs
M-x query-replace-regexp
正規表現:
^\(\(?:[^,]*,\)\{3\}\)\(.*\)\(\(?:,[^,
]*\)\{1\}\)$
置換:
\1\,(replace-regexp-in-string "," "、" \2)\3
正規表現は>>23とほぼ同じだけど、空のフィールドに対応するよう + をすべて * に変更した
「第4フィールド」の内容がカンマだけの場合にも対応 (.*[^,]) → (.*)
Vim
:%s/^\%([^,]*,\)\{3\}\zs\(.*\)\%(\%(,[^,\n]*\)\{1\}$\)\@=/\=substitute(submatch(0), ',', '、', 'g')/
Emacs
M-x query-replace-regexp
正規表現:
^\(\(?:[^,]*,\)\{3\}\)\(.*\)\(\(?:,[^,
]*\)\{1\}\)$
置換:
\1\,(replace-regexp-in-string "," "、" \2)\3
正規表現は>>23とほぼ同じだけど、空のフィールドに対応するよう + をすべて * に変更した
「第4フィールド」の内容がカンマだけの場合にも対応 (.*[^,]) → (.*)
39デフォルトの名無しさん
2019/10/12(土) 19:38:36.96ID:vBnCHMzu2019/10/29(火) 11:16:30.73ID:czk9+d/A
●Regular Expressionの使用環境
サクラエディタ bregoning.dll ver 4.12
●検索か置換か?
置換
●説明
をふくむ行(複数)を削除
●対象データ
A.jpg
B.jpg
C.jpg
●希望する結果
A.jpg
Bだけを削除するなら^.*B.*\nってわかるんですけど
B、Cを削除する方法がわかりません
誰か教えてください よろしくお願いします
サクラエディタ bregoning.dll ver 4.12
●検索か置換か?
置換
●説明
をふくむ行(複数)を削除
●対象データ
A.jpg
B.jpg
C.jpg
●希望する結果
A.jpg
Bだけを削除するなら^.*B.*\nってわかるんですけど
B、Cを削除する方法がわかりません
誰か教えてください よろしくお願いします
2019/10/29(火) 11:28:33.00ID:Ef61zXRp
2019/10/30(水) 12:29:04.54ID:n2bLSC2q
を含む行を削除
でググればすぐに見付かるんだが
ttps://yanohirota.com/regex-delete-row/
キーワードを含む行(複数指定) ^.*(キーワード1|キーワード2).*$(\r\n|\r|\n)?
でググればすぐに見付かるんだが
ttps://yanohirota.com/regex-delete-row/
キーワードを含む行(複数指定) ^.*(キーワード1|キーワード2).*$(\r\n|\r|\n)?
43デフォルトの名無しさん
2019/10/31(木) 18:25:55.12ID:KC+T8umE ●Regular Expressionの使用環境
Mery
●検索か置換か?
置換
●説明
パターンにマッチする行までの全ての行をキャプチャしたい
●対象データ
20191001
吾輩は猫である
名前はまだ無い
……
20191002
親譲りの無鉄砲で
子供の頃から
損ばかりしている
……
●希望する結果
20191001[Tab]"吾輩は猫である
名前はまだ無い
……"
[改行]
20191002[Tab]"親譲りの無鉄砲で
子供の頃から
損ばかりしている
……"
日付と本文が交互に現れるテキストを日付と本文とに分けてキャプチャして置換したいのですが、上手く行きません。
最短一致を使用すると本文が一行しかキャプチャできないし、最長一致ですと最後の日付までの全行がキャプチャされてしまいます。
どうかご教示下さい。
Mery
●検索か置換か?
置換
●説明
パターンにマッチする行までの全ての行をキャプチャしたい
●対象データ
20191001
吾輩は猫である
名前はまだ無い
……
20191002
親譲りの無鉄砲で
子供の頃から
損ばかりしている
……
●希望する結果
20191001[Tab]"吾輩は猫である
名前はまだ無い
……"
[改行]
20191002[Tab]"親譲りの無鉄砲で
子供の頃から
損ばかりしている
……"
日付と本文が交互に現れるテキストを日付と本文とに分けてキャプチャして置換したいのですが、上手く行きません。
最短一致を使用すると本文が一行しかキャプチャできないし、最長一致ですと最後の日付までの全行がキャプチャされてしまいます。
どうかご教示下さい。
2019/10/31(木) 20:12:39.29ID:qSOPmN+b
>43
検索
(^[0-9]{8})\n
置換
\n$1\t
検索
(^[0-9]{8})\n
置換
\n$1\t
2019/11/01(金) 00:19:13.27ID:l+SDkm5c
Ruby では、
text = <<"EOT"
20191001
あ
20191002
い
う
EOT
# キャプチャー部分の、#{ $1 } は、8桁の数字
p res = text.gsub( /^(\d{8})\n/ ) { "\n#{ $1 }\t" }
print res
出力
[空行]
20191001[Tab]あ
[空行]
20191002[Tab]い
う
text = <<"EOT"
20191001
あ
20191002
い
う
EOT
# キャプチャー部分の、#{ $1 } は、8桁の数字
p res = text.gsub( /^(\d{8})\n/ ) { "\n#{ $1 }\t" }
print res
出力
[空行]
20191001[Tab]あ
[空行]
20191002[Tab]い
う
46デフォルトの名無しさん
2019/11/01(金) 08:08:52.32ID:TORoDjzQ2019/11/01(金) 09:29:10.19ID:M2kmurNA
2019/11/01(金) 09:30:04.91ID:M2kmurNA
一応置換はこれ
$1¥t"$2"
$1¥t"$2"
2019/11/01(金) 11:19:24.96ID:XqhX+0kD
(^\d{8})\n((?~^\d{8}))$
\1\t"\2"
最後の行が改行されてると"がズレるからそこだけ手作業
\1\t"\2"
最後の行が改行されてると"がズレるからそこだけ手作業
2019/11/01(金) 11:25:13.23ID:zrbJp7o3
negative lookahead
https://regex101.com/r/DBWwcI/1
最下行に日付+改行を付け足せばORが一つ減って少し読みやすい
https://regex101.com/r/R3MQz7/1
https://regex101.com/r/DBWwcI/1
最下行に日付+改行を付け足せばORが一つ減って少し読みやすい
https://regex101.com/r/R3MQz7/1
51デフォルトの名無しさん
2019/11/01(金) 13:33:34.02ID:i0nQhs53 >>43
^([0-9]{8})\n((?:(?!\n[0-9]{8}\n)[\S\s])+)
^([0-9]{8})\n((?:(?!\n[0-9]{8}\n)[\S\s])+)
2019/11/01(金) 13:55:21.62ID:IH7Homqm
(?m)(^[0-9]{8}$)\n(.*?)(?=\n[0-9]{8}$|\Z)
(?m)(^[0-9]{8}$)\n(.*?)(?=\n[0-9]{8}$|\z)
↓
$1\t"$2"
(?m)(^[0-9]{8}$)\n(.*?)(?=\n[0-9]{8}$|\z)
↓
$1\t"$2"
2019/11/01(金) 14:05:57.48ID:zrbJp7o3
>>50
negative lookaheadとか書きつつ全然negativeじゃなかったわ
negative lookaheadとか書きつつ全然negativeじゃなかったわ
54デフォルトの名無しさん
2019/11/02(土) 07:00:29.25ID:Y+w4hll1 皆様ありがとうございます
最短一致と先読みを組み合わせて
(\d{8})((?:.*\n)*?)(?=\d{8})
のような感じでマッチしました
単に.*だけだと行末までで止まってしまうので明示的に.*\nの繰り返しと指定しないといけなかったようです
最短一致と先読みを組み合わせて
(\d{8})((?:.*\n)*?)(?=\d{8})
のような感じでマッチしました
単に.*だけだと行末までで止まってしまうので明示的に.*\nの繰り返しと指定しないといけなかったようです
2019/11/18(月) 01:09:59.81ID:B3FWH6HK
/(A|B*|C+|D?|E?|)+/ は /[A-E]*/ と同じなんだろうか。
2019/11/23(土) 19:09:02.72ID:S+7ZA2D+
=を含まない行を検索できる表現方法は?
2019/11/23(土) 21:06:16.66ID:8xX8HZu8
>>56
^[^=]*$
^[^=]*$
58デフォルトの名無しさん
2019/11/24(日) 19:30:30.97ID:BlMs70wA PCRE2 Version 10.34 21-November-2019
https://www.pcre.org/
https://www.pcre.org/
2019/12/07(土) 04:27:54.74ID:Dhp88CPz
今でもアクティブに更新してるのってPCREの他はre2と鬼車系くらいなのかな
昔はライブラリの話も結構してた気がするけど
昔はライブラリの話も結構してた気がするけど
2019/12/07(土) 11:10:24.58ID:hNCBwRLG
Hyperscan
2019/12/07(土) 19:19:38.35ID:S05zsHBk
テキストエディタで見えないけど何かがある状態
MacのBBEditだと逆さまの赤い「?」が表示される状態なんですけど
こういうのを正規表現で捕まえる事って出来ないですか?
MacのBBEditだと逆さまの赤い「?」が表示される状態なんですけど
こういうのを正規表現で捕まえる事って出来ないですか?
2019/12/07(土) 19:21:06.34ID:+kYKAjJc
否定で出来ない?
2019/12/07(土) 20:27:35.79ID:S05zsHBk
64デフォルトの名無しさん
2019/12/07(土) 20:32:56.16ID:tj55yZgB そういうときはバイナリエディタで開いて該当部の文字コード引きなよ。
2019/12/07(土) 20:51:47.44ID:S05zsHBk
ありがとうです
\x{7F}
でいけました
\x{7F}
でいけました
66デフォルトの名無しさん
2019/12/07(土) 21:19:40.77ID:b/g70Kck ウムラウトなどのアクセント付きアルファベットにのみ一致させる正規表現をお教えください。
2019/12/07(土) 21:54:33.96ID:hNCBwRLG
正規表現だけではまだできないんじゃないかな?
一般的には各言語が持ってるUnicodeの正規化機能を使って検索対象を基底文字+結合文字の形に正規化してから、結合文字を検索する
一般的には各言語が持ってるUnicodeの正規化機能を使って検索対象を基底文字+結合文字の形に正規化してから、結合文字を検索する
2019/12/07(土) 22:53:57.20ID:/3OJwFPr
日本語なら、NKF というライブラリがあるように、
ウムラウトなら、その国のライブラリがあるかも知れない
知らないけど
まあ、日本人に聞いても、ムダだと思うw
使っている国の人に、聞いた方がよい
ウムラウトなら、その国のライブラリがあるかも知れない
知らないけど
まあ、日本人に聞いても、ムダだと思うw
使っている国の人に、聞いた方がよい
2019/12/07(土) 23:41:45.44ID:FrJsgiML
cpanライブラリの中に一般的な正規表現集めたものがあるから
その中にあるかもね
その中にあるかもね
2019/12/08(日) 03:11:20.97ID:BNiynU8G
あるいは文字コードで標準ラテンのz(U+007A)よりあとを全て拾うように範囲指定するとか。
2019/12/08(日) 12:38:28.10ID:h14g0YSH
>>66
数は知れてるんだから普通に[ÄäÏï …]ってやればいいんじゃね?
数は知れてるんだから普通に[ÄäÏï …]ってやればいいんじゃね?
72デフォルトの名無しさん
2019/12/08(日) 14:00:42.26ID:0T/Za1/I サクラエディタの正規表現ライブラリbregonig with Onigmoの場合、大文字小文字区別なしでßや\x{00DF}がssにヒットするので困る。
2019/12/08(日) 14:15:46.03ID:B7mwO2xN
2019/12/08(日) 14:19:04.55ID:B7mwO2xN
2019/12/08(日) 17:17:16.59ID:qQWD6Mfj
[=a=]
equivalence class
equivalence class
2019/12/08(日) 17:27:54.65ID:DxA2hCcs
●Regular Expressionの使用環境
鬼雲6.2.0 &Mery
●検索か置換か?
検索
●説明
行中の1個目の=にだけマッチさせたい
意味合いとしては
(?<=^[^=\n]+)=
なんだけど
>戻り読みの式は固定文字長でなければならない。
>しかし、最上位の選択子だけは異なった文字長が許される。
だそうで+はダメみたい
(?<=^(?~=))=
戻り読みの中に非包含もダメだった
(?<=^[^=\n]|^[^=\n]{2}|^[^=\n]{3}| .... |^[^=\n]{1000})=
とかすれば無理矢理出来そうだけどもっとスマートな書き方無いかな?
鬼雲6.2.0 &Mery
●検索か置換か?
検索
●説明
行中の1個目の=にだけマッチさせたい
意味合いとしては
(?<=^[^=\n]+)=
なんだけど
>戻り読みの式は固定文字長でなければならない。
>しかし、最上位の選択子だけは異なった文字長が許される。
だそうで+はダメみたい
(?<=^(?~=))=
戻り読みの中に非包含もダメだった
(?<=^[^=\n]|^[^=\n]{2}|^[^=\n]{3}| .... |^[^=\n]{1000})=
とかすれば無理矢理出来そうだけどもっとスマートな書き方無いかな?
2019/12/08(日) 17:35:15.85ID:X/tkXkh9
^.*?\K=
2019/12/08(日) 17:45:34.12ID:DxA2hCcs
2019/12/08(日) 18:23:57.85ID:B7mwO2xN
>>75
それだとウムラウトついてないのも引っかかるよね
それだとウムラウトついてないのも引っかかるよね
2019/12/08(日) 22:21:07.36ID:DSHI20Cf
\K
いいなそれと思ったけど自分の環境では使えなかった残念
いいなそれと思ったけど自分の環境では使えなかった残念
2019/12/09(月) 17:04:00.86ID:o6YMciNa
>固定文字長で >最上位の選択子だけは異なった文字長
これはこういう意味かな
(?<=^[^=\n]{1,1000})=
これはこういう意味かな
(?<=^[^=\n]{1,1000})=
2019/12/09(月) 21:21:57.03ID:wMFl4+9a
鬼車のは (?<=ab|cd) だけじゃなく (?<=ab|cde) みたいなのも可ってことだったと思う
戻り読みを本当に後戻りしながらマッチングしてる実装ってほとんどなくて
大抵は文字列を一旦n文字分巻き戻して先読み相当の処理をするって感じになってるんで
パターンコンパイル時に「n文字分」が確定できない表現は弾かれる
戻り読みを本当に後戻りしながらマッチングしてる実装ってほとんどなくて
大抵は文字列を一旦n文字分巻き戻して先読み相当の処理をするって感じになってるんで
パターンコンパイル時に「n文字分」が確定できない表現は弾かれる
2019/12/11(水) 02:25:16.21ID:ue3GcKd8
グレップ坊や というソフト使ってますが
正規表現で、データだけ検索 データーを除外したい
どいう表記になりますか?
正規表現で、データだけ検索 データーを除外したい
どいう表記になりますか?
2019/12/11(水) 02:56:43.47ID:ivhCTlPt
データを表現する正規表現が基本
除外については反転オプションないの?
本家 grep には -v で反転する
除外については反転オプションないの?
本家 grep には -v で反転する
2019/12/11(水) 13:45:29.55ID:Jxz7JQeN
データ(?!ー)
データ(?=[^ー])
否定先読みか先読みが使えるならこれで出来る
独自のものだと適切なエスケープが必要かも
VB6ランタイム必要とあるからたぶんVBだろうけど
データ(?=[^ー])
否定先読みか先読みが使えるならこれで出来る
独自のものだと適切なエスケープが必要かも
VB6ランタイム必要とあるからたぶんVBだろうけど
8684
2019/12/14(土) 01:37:01.84ID:atjDTluR 下のほうで行けました
2020/01/02(木) 13:19:03.26ID:MApT2CVk
●Regular Expressionの使用環境
sed-4.7-x64.exe
(Gnu sed4.7のwindows版 https://github.com/mbuilov/sed-windows)
Windows 8.1(64)のPowerShellで実行
●検索か置換か?
置換(削除)
●説明
行頭から6文字目を削除して、行頭から2文字目の後に一文字挿入したい
●対象データ
1229日 1400
1230月 1500
1231火 1500
●希望する結果
12/29日1400
12/30月1500
12/31火1500
sed.exe -e "s/(?<=^.{5})\s//" .\ファイル.txt
としたら6文字目のスペースが削除されるかと思ったけどうまくいかない
ファイルはUTF-8で改行はCRLFです
sed-4.7-x64.exe
(Gnu sed4.7のwindows版 https://github.com/mbuilov/sed-windows)
Windows 8.1(64)のPowerShellで実行
●検索か置換か?
置換(削除)
●説明
行頭から6文字目を削除して、行頭から2文字目の後に一文字挿入したい
●対象データ
1229日 1400
1230月 1500
1231火 1500
●希望する結果
12/29日1400
12/30月1500
12/31火1500
sed.exe -e "s/(?<=^.{5})\s//" .\ファイル.txt
としたら6文字目のスペースが削除されるかと思ったけどうまくいかない
ファイルはUTF-8で改行はCRLFです
2020/01/02(木) 13:33:45.38ID:LqVuN/CI
2020/01/02(木) 13:48:39.30ID:MApT2CVk
何も削除されずに元のファイルがそのままです。
エラー表示等はないです。
エラー表示等はないです。
2020/01/02(木) 16:53:21.09ID:gZNl6+48
^(.{2})(.{3}).(.*)$
$1/$2$3
$1/$2$3
2020/01/02(木) 17:35:51.43ID:fx8yTANL
sed -i ?
2020/01/02(木) 18:35:38.12ID:gZNl6+48
sed -E "s/^(..)(...)\s(.*)/\1\/\2\3/" .\ファイル.txt
2020/01/13(月) 16:24:20.40ID:pG6qAwQV
●Regular Expressionの使用環境
正規表現の本・テキストで疑問に思った部分ですので特に環境は無いです
●対象データ
太郎はテニス部のキャプテンです。
太郎はサッカー部のキャプテンです。
太郎は野球部のキャプテンです。
太郎はバスケ部のキャプテンです。
●検索か置換か?
検索
●希望する結果
太郎はテニス部のキャプテンです。
太郎はサッカー部のキャプテンです。
太郎は野球部のキャプテンです。
●説明
通常の 太郎は(テニス|野球|サッカー)部のキャプテンです では無く
バスケ という単語を使い正規表現を作りたいのです
()を使った場合(使わなくても バスケ を用いた方法であれば良い)
の否定文・除くの書き方がわかりません
^ を使っってみましたが上手く行きませでした
太郎は(^バスケ)部のキャプテンです。 ・・ダメ
太郎は^(バスケ)部のキャプテンです。 ・・ダメ
太郎は(\^バスケ)部のキャプテンです。 ・・ダメ
バスケ を使った場合どの様に記述すれば良いのでしょうか?
正規表現の本・テキストで疑問に思った部分ですので特に環境は無いです
●対象データ
太郎はテニス部のキャプテンです。
太郎はサッカー部のキャプテンです。
太郎は野球部のキャプテンです。
太郎はバスケ部のキャプテンです。
●検索か置換か?
検索
●希望する結果
太郎はテニス部のキャプテンです。
太郎はサッカー部のキャプテンです。
太郎は野球部のキャプテンです。
●説明
通常の 太郎は(テニス|野球|サッカー)部のキャプテンです では無く
バスケ という単語を使い正規表現を作りたいのです
()を使った場合(使わなくても バスケ を用いた方法であれば良い)
の否定文・除くの書き方がわかりません
^ を使っってみましたが上手く行きませでした
太郎は(^バスケ)部のキャプテンです。 ・・ダメ
太郎は^(バスケ)部のキャプテンです。 ・・ダメ
太郎は(\^バスケ)部のキャプテンです。 ・・ダメ
バスケ を使った場合どの様に記述すれば良いのでしょうか?
2020/01/13(月) 16:54:41.37ID:omefpgVu
否定は、(?!文字列)
でも、太郎は(?!バスケ)部の、とは書けないよ
「太郎は」に続く「バスケでない任意の1文字以上の文字列」部のキャプテンという風に考えてみてくれ
でも、太郎は(?!バスケ)部の、とは書けないよ
「太郎は」に続く「バスケでない任意の1文字以上の文字列」部のキャプテンという風に考えてみてくれ
95デフォルトの名無しさん
2020/01/13(月) 17:05:50.06ID:KqHO+Fgo2020/01/13(月) 17:19:50.81ID:isx+DaHv
太郎は(?!バスケ).*部のキャプテンです。
太郎は(?!バスケ).*
(?!.*バスケ)太郎は.*部のキャプテンです。
(?!.*バスケ)太郎.*
(?!.*バスケ).*
太郎は(?!バスケ).*
(?!.*バスケ)太郎は.*部のキャプテンです。
(?!.*バスケ)太郎.*
(?!.*バスケ).*
2020/01/13(月) 17:32:26.06ID:isx+DaHv
鬼雲 非包含
^(?~バスケ|\n)$
^(?~バスケ|\n)$
2020/01/13(月) 18:15:40.74ID:pG6qAwQV
2020/01/13(月) 18:19:19.63ID:isx+DaHv
100デフォルトの名無しさん
2020/01/14(火) 22:34:44.82ID:kxfWTRop ^(?!.*バスケ)(?=.*キャプテン)(?=.*太郎).*
101デフォルトの名無しさん
2020/01/15(水) 00:24:06.58ID:qFZTgD7k 'あ'.match(/[あ゙い゙ゔえ゙お゙]/u)
(環境依存文字ですが、[]の中身は濁点つきの「あいうえお」です)
'あ'は濁点なしなのでマッチさせたくないのですがしてしまいます
これってマッチしないようにする方法はないですか?
JavaScriptです
(環境依存文字ですが、[]の中身は濁点つきの「あいうえお」です)
'あ'は濁点なしなのでマッチさせたくないのですがしてしまいます
これってマッチしないようにする方法はないですか?
JavaScriptです
102101
2020/01/15(水) 00:30:34.00ID:qFZTgD7k103デフォルトの名無しさん
2020/01/15(水) 12:08:15.81ID:lFvJ7mPZ ^(?!.*バスケ(?!ット(?!ボール(?!選手)))).*
バスケ ←不一致
バスケット ←一致
バスケットボール ←不一致
バスケットボール選手 ←一致
太郎はバスケットボール選手としてバスケ部に入部している ←不一致
太郎はバスケットボール選手としてバスケット部に入部している ←一致
バスケ ←不一致
バスケット ←一致
バスケットボール ←不一致
バスケットボール選手 ←一致
太郎はバスケットボール選手としてバスケ部に入部している ←不一致
太郎はバスケットボール選手としてバスケット部に入部している ←一致
104デフォルトの名無しさん
2020/01/15(水) 14:36:24.87ID:mWwHDwCD んなことよりバスケやろうぜ
105デフォルトの名無しさん
2020/02/09(日) 22:06:03.00ID:XBEo77KP マッチしたカッコ内の文字列をを利用する方法ってどうやるんでしたか?
http://hogehoge.jp
http://(.*).jp
このアスタリスクの部分を利用するのはどうやるんでしたかね
t1ではないです
http://hogehoge.jp
http://(.*).jp
このアスタリスクの部分を利用するのはどうやるんでしたかね
t1ではないです
106デフォルトの名無しさん
2020/02/09(日) 22:18:21.72ID:6++kPC7v107デフォルトの名無しさん
2020/02/09(日) 22:22:12.18ID:XBEo77KP $1ですねどうも
108デフォルトの名無しさん
2020/02/09(日) 22:34:23.16ID:XBEo77KP 同じ行にあるurlにhrefを加える正規表現はどうするのでしょうか
http://hoge1.jp http://hoge2.jp
↑これを
<a href="http://hoge1.jp">http://hoge1.jp</a> <a href="http://hoge2.jp">http://hoge2.jp</a>
こうしたいです
1つだけならこうできます
http://(.*).jp
http://hoge1.jp http://hoge2.jp
↑これを
<a href="http://hoge1.jp">http://hoge1.jp</a> <a href="http://hoge2.jp">http://hoge2.jp</a>
こうしたいです
1つだけならこうできます
http://(.*).jp
109デフォルトの名無しさん
2020/02/09(日) 22:34:49.85ID:XBEo77KP http://$1.jp
を忘れていました
を忘れていました
110デフォルトの名無しさん
2020/02/10(月) 14:37:14.41ID:8D13KkA5 正規表現よりも、HTML パーサーの方がよい。
Ruby のnokogiri で、HTML をパースすると、
require 'nokogiri'
doc = Nokogiri::HTML(<<EOT)
<html><body>
<a href="http://hoge1.jp">http://hoge1.jp</a>
<a href="http://hoge2.jp">http://hoge2.jp</a>
</body></html>
EOT
elements = doc.css( "a" )
# 属性・テキスト
elements.each { |elem| puts elem.get_attribute( "href" ), elem.text }
出力
http://hoge1.jp
http://hoge1.jp
http://hoge2.jp
http://hoge2.jp
Ruby のnokogiri で、HTML をパースすると、
require 'nokogiri'
doc = Nokogiri::HTML(<<EOT)
<html><body>
<a href="http://hoge1.jp">http://hoge1.jp</a>
<a href="http://hoge2.jp">http://hoge2.jp</a>
</body></html>
EOT
elements = doc.css( "a" )
# 属性・テキスト
elements.each { |elem| puts elem.get_attribute( "href" ), elem.text }
出力
http://hoge1.jp
http://hoge1.jp
http://hoge2.jp
http://hoge2.jp
111デフォルトの名無しさん
2020/02/10(月) 18:02:57.53ID:cKG4UD69112デフォルトの名無しさん
2020/02/11(火) 07:15:58.31ID:Kcy+Q8b9 >>108
.jpが末尾につく行がリンクだと仮定してjavascript
/^(.+\.jp)$/gm
上記の正規表現で
<a hef=“http://$1”>http://$1</a>
正規表現のフラグのmで複数行対応、gで複数の結果で対応出来ん?
.jpが末尾につく行がリンクだと仮定してjavascript
/^(.+\.jp)$/gm
上記の正規表現で
<a hef=“http://$1”>http://$1</a>
正規表現のフラグのmで複数行対応、gで複数の結果で対応出来ん?
113デフォルトの名無しさん
2020/02/11(火) 13:30:47.89ID:yXLnwJ70 (https?://\S+)
<a href=“\1”>\1</a>
<a href=“\1”>\1</a>
114デフォルトの名無しさん
2020/02/12(水) 09:21:48.77ID:iIu6BAwU 1) (hoge)
2) (hoge, fuga)
3) (hoge, fuga, piyo)
2) のみにマッチする正規表現のご教示よろしくお願いいたします
鬼雲
2) (hoge, fuga)
3) (hoge, fuga, piyo)
2) のみにマッチする正規表現のご教示よろしくお願いいたします
鬼雲
115デフォルトの名無しさん
2020/02/12(水) 10:28:49.15ID:bUEb5r3d hogeとfugaを後で使うと仮定して
\((.+),(.+)\)
\((.+),(.+)\)
116デフォルトの名無しさん
2020/02/12(水) 10:51:06.48ID:NK/UnlDo >>115
それだと3)にもマッチするよ
それだと3)にもマッチするよ
117デフォルトの名無しさん
2020/02/12(水) 11:05:14.78ID:W9U9giTl >>114
a\)
a\)
118デフォルトの名無しさん
2020/02/12(水) 15:06:59.76ID:bUEb5r3d .を[^,]でどう?
119デフォルトの名無しさん
2020/02/12(水) 15:37:27.75ID:iIu6BAwU ID:bUEb5r3d 様
ありがとうございました。m(_ _)m
「\([^,]*,[^,]*?\)」で希望動作になりました
ありがとうございました。m(_ _)m
「\([^,]*,[^,]*?\)」で希望動作になりました
120デフォルトの名無しさん
2020/02/12(水) 18:44:57.81ID:bUEb5r3d どういたしまして。
ちなみに+じゃなくて*にしてるのは
(,)
にも一致させたいという事?
あと?は無くても動かん?
ちなみに+じゃなくて*にしてるのは
(,)
にも一致させたいという事?
あと?は無くても動かん?
121デフォルトの名無しさん
2020/02/12(水) 18:51:28.08ID:gdzQpnag [^,]*だと改行と閉じ括弧を含んでしまい
次の行まで選択してしまうのでは?
次の行まで選択してしまうのでは?
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- NY円、一時1ユーロ=180円台まで下落…1999年のユーロ導入以来初 [蚤の市★]
- 国内ホテル、既にキャンセルも 訪日客関連業界、事態見守る ★3 [蚤の市★]
- 【外交】日中関係悪化、長期化の様相 2012年には自動車輸出80%減も ロイター★3 [1ゲットロボ★]
- 「どうしようもない」 ため息つくアジアの玄関口 中国の訪日自粛で−福岡市 [蚤の市★]
- NHK、受信料の未払い世帯に督促強化へ 民事手続きの新組織を設置 差し押さえなどの強制執行も ★2 [1ゲットロボ★]
- 橋下徹氏 外務省幹部の訪中受け「口だけ番長」へ痛烈指摘 「喧嘩は日本の完敗…なんとかっこ悪い日本か」★2 [冬月記者★]
- んなっても良いお🏡
- 【悲報】高市早苗を妄信している今の日本人見ると80年前も市民は進んで戦争協力してたんだって理解出来るよね🥺 [616817505]
- 【超悲報】中国への武力行使、世論調査で「賛成」「どちらかといえば賛成」48.8% 「反対」「どちらかといえば反対」の44.2%を上回る [314039747]
- 日本人、歴史も経済も分からず貧乏に耐えかねて第二次日中戦争を求めてしまう…ヤバイよ [819729701]
- 【朗報】中国との戦争、世論調査で「賛成」が「反対」を上回るwwwwwwwww
- 識者「『フリーパレスチナ』とかイキってる連中が台湾の話になると『中国を怒らせるな!』ってなる。ほんと左翼の正義って薄っぺらい」 [279254606]
