Regular Expression(正規表現) Part14 [無断転載禁止]©2ch.net

**デフォルトの名無しさん** · 2017/03/15(水) 02:04:35.47

Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part13
http://echo.2ch.net/test/read.cgi/tech/1415149975/

次スレは>>980宜しく
天ぷら等2以降

**デフォルトの名無しさん** · 2019/09/12(木) 18:04:49.29

>951
ヒントありがとうございます。
残りは自分でがんばってみます。

**デフォルトの名無しさん** · 2019/09/12(木) 18:08:37.95

文字列 "プログラマー" を "プロクライマー" に書き換える正規表現を教えて下さい

**デフォルトの名無しさん** · 2019/09/12(木) 21:50:17.55

そこにソースがあるから登るんだ。

**デフォルトの名無しさん** · 2019/09/12(木) 22:19:07.70

正規表現の使い方じゃなく作り方、バックトラックなど理論から解説している書籍やそれに準ずるサイトなど知っていたらご教示ください。
こうやればこうなるよ、こういうときはこうすればいいんだよ的な学習では身に付かなくて…

**デフォルトの名無しさん** · 2019/09/12(木) 22:56:30.12

自分が参考にしたのはここだったかな
http://fussy.web.fc2.com/algo/search5_regex.htm

実装の仕方がある程度分かれば鬼車の作者さんのブログ(rubyの一件以前の記事)も参考になると思う

**デフォルトの名無しさん** · 2019/09/12(木) 23:14:33.93

ありがとうございます！
rubyの一件って何ですか？（何て検索したらいいですか？）

**デフォルトの名無しさん** · 2019/09/12(木) 23:43:24.49

Rubyの作者さんと何かあったようで嫌気が差したのかそれ以後ブログで正規表現のことを
取り上げる頻度がめっきり減っちゃったんですよ

**デフォルトの名無しさん** · 2019/09/13(金) 08:32:54.25

>>958
ありがとうございます！
なるほど、残念ですね…

**デフォルトの名無しさん** · 2019/09/13(金) 10:47:34.78

955
https://codezine.jp/article/detail/3158
https://tociyuki.hatenablog.jp/entry/20070222/1172158021
http://hellocode.jugem.jp/?eid=748

**デフォルトの名無しさん** · 2019/09/13(金) 11:54:40.09

正規表現はどの言語でも共通で使えますか？それともちょっと違ったりしますか？

**デフォルトの名無しさん** · 2019/09/13(金) 12:02:22.73

ちょっと違ったりします

**デフォルトの名無しさん** · 2019/09/13(金) 13:25:46.31

Ruby で作った。
一旦、パターンで一致させてから、一致した行だけを変換した。
ただし、同じ行に、id="～" が複数あると、バグる！

src = <<'EOT'
id="aAxy Xz"
あ
id=""
id="9"
id="9y"
EOT

# id=" で始まって、" 以外の文字が続いて、" で終わる
re = /id\=\"([^\"]+)\"/ # ( ) 内は、$1

dest = src.gsub( re ) do |line|
'id="' + $1.delete( "a-z" ) + '"'
end

print dest

出力
id="A X"
あ
id=""
id="9"
id="9"

**963** · 2019/09/13(金) 13:43:10.59

>>963
修正

>ただし、同じ行に、id="～" が複数あると、バグる！
大丈夫だった。正常に動く

**デフォルトの名無しさん** · 2019/09/16(月) 02:45:59.31

JSで
101 dogs
7 little goats
30 8 year old humans

↑をそれぞれ
["101", "dogs"]
["7", "little goats"]
["30", "8 year old humans"]
と切り分けるにはどんな正規表現を使えばよいでしょうか？

["7", " ", "little goats"]のような形でもかまいません

.match(/^\d+\s|.+$/)
だと
["7 ", "little goats"]
になってしまい、数字のあとの余計な半角スペースをあとで取り除かなければならなくなるのがなんか嫌で…

**デフォルトの名無しさん** · 2019/09/16(月) 02:59:29.74

正規表現を使えないなら文字列操作でやればいいだけ
正規表現を使いこなせてない人が使うとバグの温床になるからお勧めしない

**デフォルトの名無しさん** · 2019/09/16(月) 07:18:26.85

>>965
.split(' ', 2)

**デフォルトの名無しさん** · 2019/09/16(月) 12:07:55.69

Ruby では、

chomp で、末尾の改行を削除する。
split の2 は、分割の最大数

text = <<'TEXT'
101 dogs
30 8 year old humans
TEXT

p ary = text.lines( chomp: true ).map { |line| line.split( " ", 2 ) }

出力
[["101", "dogs"], ["30", "8 year old humans"]]

**デフォルトの名無しさん** · 2019/09/16(月) 15:25:40.41

JSでは、
["30", "8 year old humans"]
ではなく
["30","8"]
となる
limitは、分割結果の制限であり、見つかった要素の数をそこまでで打ち切る

**968** · 2019/09/16(月) 15:36:25.96

>969
えー!!

**デフォルトの名無しさん** · 2019/09/16(月) 15:52:31.08

>>970
https://developer.mozilla.org/ja/docs/Web/JavaScript/Reference/Global_Objects/String/split#Returning_a_limited_number_of_splits

**デフォルトの名無しさん** · 2019/09/16(月) 16:04:28.98

matchじゃなくてsplitで

str.split(/(?<=^\d+) /)

か

array = str.split(" ");
array[0] + array.slice(1).join(" ")

とかじゃない？

**デフォルトの名無しさん** · 2019/09/16(月) 16:06:13.84

間違えた
下の最後こうか

[array[0], array.slice(1).join(" ")]

**デフォルトの名無しさん** · 2019/09/16(月) 16:24:50.88

素直に
"30 8 years old".match(/^(\d+) (.*)$/).slice(1)
じゃいかんの？

**デフォルトの名無しさん** · 2019/09/16(月) 16:28:11.45

正規表現逆引きcgiとかないの？
雑に日本語で書き込んだらAIが判断して正規表現を返してくれる
そんなの

**デフォルトの名無しさん** · 2019/09/16(月) 17:07:19.10

>>974
マッチしない場合でもエラーにならないよう保険かけとく方がよいのでは？
(str.match(/～/)||[]).slice(1)

**デフォルトの名無しさん** · 2019/09/16(月) 17:20:26.44

var ary = new Array( 2 )
var str = "30 8 year old humans"

var pos = str.indexOf( " " );
console.log( pos ) // 2

if( pos === -1 ) { // 見つからない
// 何かの処理
} else {
ary[ 0 ] = str.substring( 0, pos )
ary[ 1 ] = str.substring( pos + 1 )
}

console.log( ary ) // [ '30', '8 year old humans' ]

**デフォルトの名無しさん** · 2019/09/16(月) 17:34:55.93

>>976
そう言うのは質問者に適宜やってもらえば良い
絶対マッチするという前提かもしれないし

**デフォルトの名無しさん** · 2019/09/16(月) 17:40:28.59

>>969
知らなかった

**デフォルトの名無しさん** · 2019/09/16(月) 18:09:34.33

const str = '30 8 year old humans'
(([first, ...rest]) => [first, rest.join(' ')])(str.split(' '))
//=> ["30", "8 year old humans"]

あ、正規表現がねぇｗ

**デフォルトの名無しさん** · 2019/09/16(月) 20:46:14.05

.split(/ (.*)/,2)

**デフォルトの名無しさん** · 2019/09/16(月) 22:28:40.71

次スレ立てたんだけど、
Regular Expression(正規表現) Part15
https://mevius.5ch.net/test/read.cgi/tech/1568640311/

テンプレ貼ってたら>>3 がNGワードとやらで貼れません。
というわけであとよろしく。

**デフォルトの名無しさん** · 2019/09/17(火) 10:37:10.53

>>982
>>3
のテンプレにある

【初心者】正規表現【入門】　←閉鎖
ｈｔｔｐ：／／ｆｕｎｃｃｈａｎ．ｂｌｏｇ１６．ｆｃ２．ｃｏｍ／

5ch では、ｆｃ２は、宣伝禁止かも！
これは、半角で書き込めないので、全角に変換した

このURL を削除すれば？

MANGO 板で、NG ワードを調べられる

**977** · 2019/09/17(火) 12:02:24.99

>>977
を修正した

const str = `101 dogs
30 8 year old humans`

const lines = str.split( "\n" ); // 配列

const results = lines.map( line => {
var ary = new Array( 2 )
const pos = line.indexOf( " " );

if( pos === -1 ) { // 見つからない
// 何かの処理
} else {
ary[ 0 ] = line.substring( 0, pos )
ary[ 1 ] = line.substring( pos + 1 )
}
return ary
} );

console.log( results ); // [ [ '101', 'dogs' ], [ '30', '8 year old humans' ] ]

**デフォルトの名無しさん** · 2019/09/17(火) 16:12:25.16

amazonもダメみたいだね、本の紹介しようとしたら弾かれた

**983** · 2019/09/17(火) 17:07:52.35

Ａｍａｚｏｎも、半角で書けないだろ

一番恐ろしいのは、はてなブログ！
書き込み禁止画面が出ずに、いきなり吸い込まれて、アクセス禁止にされる！

同様に、twitter の長いURL も、吸い込まれるものがあるらしい！

5ch で、しつこく宣伝する香具師をはめるために、いきなりのアク禁！

MANGO 板に書き込んで、何がNG ワードが、地道に判定していくしかない

**デフォルトの名無しさん** · 2019/09/17(火) 17:46:48.25

test
https://www.ama%7Aon.co.jp/dp/4938939703

**デフォルトの名無しさん** · 2019/09/17(火) 17:53:38.97

はてブのURL、5ちゃんに書けないのか。気づいてなかったわ。

**デフォルトの名無しさん** · 2019/09/17(火) 17:56:58.73

test
http://d.h%61tena.ne.jp/keyword/%A5%E2%A5%CE%A5%B7%A5%EA%A5%C3%A5%AF%A5%AB%A1%BC%A5%CD%A5%EB

**デフォルトの名無しさん** · 2019/10/02(水) 17:34:34.60

U . M . E

**デフォルトの名無しさん** · 2019/10/12(土) 20:41:17.72

以下を正規表現で行うにはどうしたらよいでしょうか。
-----元データ------------------
<aaa bbb
ccc
ddd>
<eee>
ffff ggg
<hhh
iiii>
-----------------------------
-----欲しいデータ----------------
aaa bbb ccc ddd
eee
ffff ggg
hhh iiii
------------------------------

**デフォルトの名無しさん** · 2019/10/12(土) 20:46:20.53

改行無視のオプション+<>の間を取得して改行を空白に変更でどう？

**デフォルトの名無しさん** · 2019/10/12(土) 22:51:54.37

>>991
Ruby
$ cat input.txt | ruby -e 'puts ARGF.read.gsub(/<(.*?)>/m) { |m| $1.gsub("\n", "") }'

Node
$ cat input.txt | node -e 'process.stdout.write(fs.readFileSync(0).toString().replace(/<([\s\S]*?)>/mg, ($0,$1)=>$1.replace(/\n/g, "")))'

sed
$ echo $(cat input.txt) | sed -E 's/<([^>]*)>/\n\1\n/g' | sed -e '/^ *$/d' | sed -e 's/^ *//'

sedのは一旦改行削除して、<..>の前後に改行追加して、空行削除して、行頭の空白を削除してる

**デフォルトの名無しさん** · 2019/10/13(日) 01:09:33.88

Ruby で、

text = <<"EOT"
<aaa bbb
ccc
ddd>
<eee>
ffff ggg
<hhh
iiii>
EOT

# m option は、multi-line。$1 は、キャプチャー部分。
# [^>]+ は、> 以外の文字が、1文字以上続く
puts text.gsub( /<([^>]+)>/m ) { |matched| $1.gsub( "\n", " " ) }

>>993
>$1.gsub("\n", "")
"" は、" "(半角空白)の間違いだろ

**デフォルトの名無しさん** · 2019/10/13(日) 01:37:59.89

>>994
コピペしたら元データに行末スペースが入ってたからそうしたんだけどこれは5chの仕様なのかな？
行末スペースがないなら空文字じゃなく半角スペースに置換だね

**994** · 2019/10/13(日) 03:33:31.81

5ch からコピーすると、行末に半角空白が入るから、
漏れは、Ruby で削除してる

# クリップボード内の複数行文字列の、各行の先頭・末尾から、
# 連続する空白類を除去して、クリップボードに入れる

str = `powershell Get-Clipboard`
str.encode! Encoding::UTF_8, Encoding::CP932 # UTF_8 へ変換

ary = str.each_line.map( &:strip ) # 連続する空白類を除去する

IO.popen( 'clip', 'w:cp932' ) do | clip | # CP932 へ戻す
clip.print( ary.join "\n" )
end

**デフォルトの名無しさん** · 2019/10/13(日) 07:48:23.30

>>992-994
皆さんありがとうございました。
後方参照をさらに置換すれば良かったんですね。そんな方法があったとは！！
助かりました。

**デフォルトの名無しさん** · 2019/10/13(日) 22:01:19.92

>>996
エディタのコマンドで対応できることだから
わざわざスクリプト書くのはちょっとオーバーキルかな

**デフォルトの名無しさん** · 2019/10/13(日) 22:05:59.26

VScodeの正規表現検索、置換はjavascriptだろうか？

**デフォルトの名無しさん** · 2019/10/13(日) 22:42:48.39

>>999
ripgrep

**1001** · Over 1000

このスレッドは１０００を超えました。
新しいスレッドを立ててください。
life time: 942日 20時間 38分 13秒

**1002** · Over 1000

5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。

───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────

会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。

▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/

▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php