Regular Expression(正規表現) Part14 [無断転載禁止]©2ch.net

レス数が1000を超えています。これ以上書き込みはできません。
1デフォルトの名無しさん
垢版 |
2017/03/15(水) 02:04:35.47ID:e01p03UP
Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part13
http://echo.2ch.net/test/read.cgi/tech/1415149975/


次スレは>>980宜しく
天ぷら等2以降
2019/09/16(月) 20:46:14.05ID:RGmahsTZ
.split(/ (.*)/,2)
982デフォルトの名無しさん
垢版 |
2019/09/16(月) 22:28:40.71ID:enU8we0d
次スレ立てたんだけど、
Regular Expression(正規表現) Part15
https://mevius.5ch.net/test/read.cgi/tech/1568640311/

テンプレ貼ってたら>>3 がNGワードとやらで貼れません。
というわけであとよろしく。
2019/09/17(火) 10:37:10.53ID:aFTX7+W5
>>982
>>3
のテンプレにある

【 初心者 】 正規表現 【 入門 】 ←閉鎖
http://funcchan.blog16.fc2.com/

5ch では、fc2 は、宣伝禁止かも!
これは、半角で書き込めないので、全角に変換した

このURL を削除すれば?

MANGO 板で、NG ワードを調べられる
984977
垢版 |
2019/09/17(火) 12:02:24.99ID:aFTX7+W5
>>977
を修正した

const str = `101 dogs
30 8 year old humans`

const lines = str.split( "\n" ); // 配列

const results = lines.map( line => {
var ary = new Array( 2 )
const pos = line.indexOf( " " );

if( pos === -1 ) { // 見つからない
// 何かの処理
} else {
ary[ 0 ] = line.substring( 0, pos )
ary[ 1 ] = line.substring( pos + 1 )
}
return ary
} );

console.log( results ); // [ [ '101', 'dogs' ], [ '30', '8 year old humans' ] ]
2019/09/17(火) 16:12:25.16ID:sjKTVv5w
amazonもダメみたいだね、本の紹介しようとしたら弾かれた
986983
垢版 |
2019/09/17(火) 17:07:52.35ID:aFTX7+W5
Amazon も、半角で書けないだろ

一番恐ろしいのは、はてなブログ!
書き込み禁止画面が出ずに、いきなり吸い込まれて、アクセス禁止にされる!

同様に、twitter の長いURL も、吸い込まれるものがあるらしい!

5ch で、しつこく宣伝する香具師をはめるために、いきなりのアク禁!

MANGO 板に書き込んで、何がNG ワードが、地道に判定していくしかない
987デフォルトの名無しさん
垢版 |
2019/09/17(火) 17:46:48.25ID:+bGUkqkJ
test
https://www.ama%7Aon.co.jp/dp/4938939703
2019/09/17(火) 17:53:38.97ID:Xou3E6HC
はてブのURL、5ちゃんに書けないのか。気づいてなかったわ。
989デフォルトの名無しさん
垢版 |
2019/09/17(火) 17:56:58.73ID:+bGUkqkJ
test
http://d.h%61tena.ne.jp/keyword/%A5%E2%A5%CE%A5%B7%A5%EA%A5%C3%A5%AF%A5%AB%A1%BC%A5%CD%A5%EB
990デフォルトの名無しさん
垢版 |
2019/10/02(水) 17:34:34.60ID:dOlpIXop
U . M . E
991デフォルトの名無しさん
垢版 |
2019/10/12(土) 20:41:17.72ID:VAjNOt6S
以下を正規表現で行うにはどうしたらよいでしょうか。
-----元データ------------------
<aaa bbb
ccc
ddd>
<eee>
ffff ggg
<hhh
iiii>
-----------------------------
-----欲しいデータ----------------
aaa bbb ccc ddd
eee
ffff ggg
hhh iiii
------------------------------
2019/10/12(土) 20:46:20.53ID:osgjxuFW
改行無視のオプション+<>の間を取得して改行を空白に変更でどう?
2019/10/12(土) 22:51:54.37ID:7TGqmTiW
>>991
Ruby
$ cat input.txt | ruby -e 'puts ARGF.read.gsub(/<(.*?)>/m) { |m| $1.gsub("\n", "") }'

Node
$ cat input.txt | node -e 'process.stdout.write(fs.readFileSync(0).toString().replace(/<([\s\S]*?)>/mg, ($0,$1)=>$1.replace(/\n/g, "")))'

sed
$ echo $(cat input.txt) | sed -E 's/<([^>]*)>/\n\1\n/g' | sed -e '/^ *$/d' | sed -e 's/^ *//'

sedのは一旦改行削除して、<..>の前後に改行追加して、空行削除して、行頭の空白を削除してる
2019/10/13(日) 01:09:33.88ID:Gu1oNPJo
Ruby で、

text = <<"EOT"
<aaa bbb
ccc
ddd>
<eee>
ffff ggg
<hhh
iiii>
EOT

# m option は、multi-line。$1 は、キャプチャー部分。
# [^>]+ は、> 以外の文字が、1文字以上続く
puts text.gsub( /<([^>]+)>/m ) { |matched| $1.gsub( "\n", " " ) }

>>993
>$1.gsub("\n", "")
"" は、" "(半角空白)の間違いだろ
2019/10/13(日) 01:37:59.89ID:5y3mzviq
>>994
コピペしたら元データに行末スペースが入ってたからそうしたんだけどこれは5chの仕様なのかな?
行末スペースがないなら空文字じゃなく半角スペースに置換だね
996994
垢版 |
2019/10/13(日) 03:33:31.81ID:Gu1oNPJo
5ch からコピーすると、行末に半角空白が入るから、
漏れは、Ruby で削除してる

# クリップボード内の複数行文字列の、各行の先頭・末尾から、
# 連続する空白類を除去して、クリップボードに入れる

str = `powershell Get-Clipboard`
str.encode! Encoding::UTF_8, Encoding::CP932 # UTF_8 へ変換

ary = str.each_line.map( &:strip ) # 連続する空白類を除去する

IO.popen( 'clip', 'w:cp932' ) do | clip | # CP932 へ戻す
clip.print( ary.join "\n" )
end
997デフォルトの名無しさん
垢版 |
2019/10/13(日) 07:48:23.30ID:0NSyRtEU
>>992-994
皆さんありがとうございました。
後方参照をさらに置換すれば良かったんですね。そんな方法があったとは!!
助かりました。
2019/10/13(日) 22:01:19.92ID:5y3mzviq
>>996
エディタのコマンドで対応できることだから
わざわざスクリプト書くのはちょっとオーバーキルかな
2019/10/13(日) 22:05:59.26ID:w1EMiXuT
VScodeの正規表現検索、置換はjavascriptだろうか?
2019/10/13(日) 22:42:48.39ID:5y3mzviq
>>999
ripgrep
10011001
垢版 |
Over 1000Thread
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 942日 20時間 38分 13秒
レス数が1000を超えています。これ以上書き込みはできません。