Regular Expressionスレです。
質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。
前スレ
Regular Expression(正規表現) Part15
https://mevius.5ch.net/test/read.cgi/tech/1568640311/
次スレは>>980宜しく
天ぷら等>>2以降
Regular Expression(正規表現) Part16
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
2021/11/03(水) 19:50:01.71ID:ebAE+z9+2021/11/03(水) 19:51:06.60ID:ebAE+z9+
スルーされにくい質問のテンプレと例
●Regular Expressionの使用環境
Java1.5
●検索か置換か?
検索
●説明
各行の1番目のAまでを検索したい
●対象データ
ABCA
BCAA
CABA
●希望する結果
ABCA
^
BCAA
^^^
CABA
^^
※ ^ はアンダーラインだそうな ^^;
●Regular Expressionの使用環境
Java1.5
●検索か置換か?
検索
●説明
各行の1番目のAまでを検索したい
●対象データ
ABCA
BCAA
CABA
●希望する結果
ABCA
^
BCAA
^^^
CABA
^^
※ ^ はアンダーラインだそうな ^^;
2021/11/03(水) 19:51:26.32ID:ebAE+z9+
◆関連サイト
正規表現メモ
http://www.kt.rim.or.jp/~kbk/regex/regex.html
Perl正規表現雑技
http://www.din.or.jp/~ohzaki/regex.htm
詳説 正規表現
http://www.oreilly.co.jp/books/9784873113593/
正規表現クックブック
http://www.oreilly.co.jp/books/9784873114507/
正規表現プログラミングFAQ
http://capslockabcjp.kitunebi.com/faq.html
.NET Framework の正規表現 | Microsoft Docs
https://docs.microsoft.com/ja-jp/dotnet/standard/base-types/regular-expressions
正規表現 - JavaScript | MDN
https://developer.mozilla.org/ja/docs/Web/JavaScript/Guide/Regular_Expressions
鬼車
https://github.com/kkos/oniguruma
鬼雲
https://github.com/k-takata/Onigmo
bregonig.dll(鬼雲の正規表現をサクラエディタ等で使用するためのライブラリ)
http://k-takata.o.oo7.jp/mysoft/bregonig.html
Boost.Regex 1.45.0 (日本語訳)
http://alpha.sourceforge.jp/devel/boost.regex_ja_1_45_0.pdf
秀丸: 複数行にまたがる検索について
http://homepage2.nifty.com/jr-kun/hidemaru_qa/4_regulr.html#RETURNS
サクラエディタ: 改行
http://d.hatena.ne.jp/myokoym/20101219/1292779058
※ サクラエディタでは複数行に渡る検索・置換は出来ません。
正規表現メモ
http://www.kt.rim.or.jp/~kbk/regex/regex.html
Perl正規表現雑技
http://www.din.or.jp/~ohzaki/regex.htm
詳説 正規表現
http://www.oreilly.co.jp/books/9784873113593/
正規表現クックブック
http://www.oreilly.co.jp/books/9784873114507/
正規表現プログラミングFAQ
http://capslockabcjp.kitunebi.com/faq.html
.NET Framework の正規表現 | Microsoft Docs
https://docs.microsoft.com/ja-jp/dotnet/standard/base-types/regular-expressions
正規表現 - JavaScript | MDN
https://developer.mozilla.org/ja/docs/Web/JavaScript/Guide/Regular_Expressions
鬼車
https://github.com/kkos/oniguruma
鬼雲
https://github.com/k-takata/Onigmo
bregonig.dll(鬼雲の正規表現をサクラエディタ等で使用するためのライブラリ)
http://k-takata.o.oo7.jp/mysoft/bregonig.html
Boost.Regex 1.45.0 (日本語訳)
http://alpha.sourceforge.jp/devel/boost.regex_ja_1_45_0.pdf
秀丸: 複数行にまたがる検索について
http://homepage2.nifty.com/jr-kun/hidemaru_qa/4_regulr.html#RETURNS
サクラエディタ: 改行
http://d.hatena.ne.jp/myokoym/20101219/1292779058
※ サクラエディタでは複数行に渡る検索・置換は出来ません。
2021/11/03(水) 19:54:20.40ID:ebAE+z9+
正規表現技術入門
https://gihyo.jp/book/2015/978-4-7741-7270-5
↑の著者の一人であり Onigmo(鬼雲)やbregonig.dll の作者でもあるtakata先生のツイとQiitaの記事
https://twitter.com/k_takata
鬼雲に非包含オペレータを実装した話
https://qiita.com/k-takata/items/4e45121081c83d3d5bfd
https://twitter.com/5chan_nel (5ch newer account)
https://gihyo.jp/book/2015/978-4-7741-7270-5
↑の著者の一人であり Onigmo(鬼雲)やbregonig.dll の作者でもあるtakata先生のツイとQiitaの記事
https://twitter.com/k_takata
鬼雲に非包含オペレータを実装した話
https://qiita.com/k-takata/items/4e45121081c83d3d5bfd
https://twitter.com/5chan_nel (5ch newer account)
2021/11/03(水) 20:59:16.79ID:554LNcID
6デフォルトの名無しさん
2021/11/03(水) 21:43:29.56ID:K+2zXBgv7デフォルトの名無しさん
2021/11/04(木) 11:16:22.06ID:JyTL4wpj nifty の URL 死んでるな
8デフォルトの名無しさん
2021/11/04(木) 11:42:25.33ID:diIHvWke DeNAが個人ブログから正規表現の表丸パクりしてたのワロタ
2021/11/04(木) 11:59:17.47ID:iRkMc3Gk
丸パクリならまだいい
改変もまともにできないのはヤバい
正規表現の例 マッチする例
Coo+el Coopel
https://pbs.twimg.com/media/FC7n-5zaUAETKej.jpg
改変もまともにできないのはヤバい
正規表現の例 マッチする例
Coo+el Coopel
https://pbs.twimg.com/media/FC7n-5zaUAETKej.jpg
2021/11/04(木) 12:31:32.50ID:B00ATyI8
>>9
どゆこと?
どゆこと?
2021/11/04(木) 12:38:22.63ID:Gz31zHb0
12デフォルトの名無しさん
2021/11/04(木) 12:48:06.96ID:diIHvWke 元がgoogleを例にしてたからこうなったのかな
いずれにしてもワロタ
いずれにしてもワロタ
2021/11/04(木) 12:49:09.54ID:iCxb5Ekd
2021/11/04(木) 14:21:26.74ID:B00ATyI8
15デフォルトの名無しさん
2021/11/04(木) 14:53:30.31ID:/D1z+6Mc 劣化コピーだから責められてて
上品だったら叩けない訳か
上品だったら叩けない訳か
2021/11/05(金) 08:20:43.21ID:+Hevqd/d
本歌取りと言う言葉もありますし
2021/11/05(金) 11:40:57.68ID:pLniUbgZ
オマージュ・インスパイア→胡散臭い
本歌取り→凄そう
本歌取り→凄そう
2021/11/05(金) 12:37:40.52ID:1iAtfRIf
本歌取りに良いイメージがあるのは、この行為が和歌の世界で伝統的に許されてきたからだ。
2021/11/06(土) 20:39:20.57ID:oKHbtIv+
祝☆ vim 3o+年
2021/11/06(土) 21:18:49.31ID:G8Zn1Puj
>>19
スレ違い
スレ違い
2021/11/07(日) 00:36:45.12ID:kpV1ZjX8
(/(>>1)/,'$1乙')
2021/11/15(月) 00:01:22.12ID:5vPB6h42
今までに無いかつら、非包含オペレータ
https://bokete.jp/odai/533281
https://bokete.jp/odai/533281
2021/11/15(月) 10:09:56.72ID:xJpmlO5M
vimで文字列処理ってマイナーなのか?
UIでマッチをハイライトしながらパターンを書けるし、書いたパターンと処理はperlやsedのようにコマンドライン引数で渡してシェルスクリプトに組み込める(UI無し、非インタラクティブモード)
vimはバッファするからストリーム処理には向かないくて、パイプにはperlを使うけど、バッチ処理ならvimの方が速い
あと、個人的にアサーションの記法(\@<=等)も、()が深くなりがちなperl系の(?<=等)より好みだ
UIでマッチをハイライトしながらパターンを書けるし、書いたパターンと処理はperlやsedのようにコマンドライン引数で渡してシェルスクリプトに組み込める(UI無し、非インタラクティブモード)
vimはバッファするからストリーム処理には向かないくて、パイプにはperlを使うけど、バッチ処理ならvimの方が速い
あと、個人的にアサーションの記法(\@<=等)も、()が深くなりがちなperl系の(?<=等)より好みだ
2021/11/15(月) 10:57:59.40ID:Y0jbpZIM
惜しむらくは、マッチ後の単純でない処理を委託するvimscriptがクソなところだと思う、regex自体は十分パワフル
perlは任意のロジックをperl式に移譲するのが楽、パターンにも書けるし、大抵インラインで済む
vim9で大幅に言語変えるっぽいけど、どうなるやら
perlは任意のロジックをperl式に移譲するのが楽、パターンにも書けるし、大抵インラインで済む
vim9で大幅に言語変えるっぽいけど、どうなるやら
2021/11/15(月) 11:19:19.50ID:vc2enCPn
()が減るケースって実用的にはあまり無いんじゃないか?アサーションの修飾対象がグループなら、どうせ()が必要になるわけだし
アサーションの\@が後置なのはperl系より一貫性があって良い設計だと思う、?,+,* etcと同列の修飾子とみなせる
アサーションの\@が後置なのはperl系より一貫性があって良い設計だと思う、?,+,* etcと同列の修飾子とみなせる
2021/11/15(月) 21:36:14.28ID:5vPB6h42
非包含オペレータの提案者の方の過去ログ漁ってたらすごいの出てきた
ttp://www.a-k-r.org/pub/2013-06-02-rubyhiroba-akr.pdf
これを使えば2次元の彼女が見つかりそう
ttp://www.a-k-r.org/pub/2013-06-02-rubyhiroba-akr.pdf
これを使えば2次元の彼女が見つかりそう
27デフォルトの名無しさん
2021/11/17(水) 00:30:09.97ID:pGjzwEdG pythonで文字列分割をする時
1:・ー└等の1文字と、半角スペース3つ以上のいずれかで文字列を分解したい
re.splitで、思いつく限りやってみましたが、うまく行きませんでした。
[・ー└]|( ){3,}
[・ー└( ){3,}]
[・ー└(( ){3,})]
試しにre.sub(〜, "", ・・・)で文字列が削除出来るかどうか試したときは半角スペース3つが消えました。
いくつかの文字 もしくは 特定の文字の繰り返し、で文字列を分解する書き方はありますでしょうか
1:・ー└等の1文字と、半角スペース3つ以上のいずれかで文字列を分解したい
re.splitで、思いつく限りやってみましたが、うまく行きませんでした。
[・ー└]|( ){3,}
[・ー└( ){3,}]
[・ー└(( ){3,})]
試しにre.sub(〜, "", ・・・)で文字列が削除出来るかどうか試したときは半角スペース3つが消えました。
いくつかの文字 もしくは 特定の文字の繰り返し、で文字列を分解する書き方はありますでしょうか
28デフォルトの名無しさん
2021/11/17(水) 00:32:30.60ID:pGjzwEdG 上記で、分かりにくくてすみません、
>1:・ー└等の1文字と、半角スペース3つ以上のいずれかで文字列を分解したい
この「1:」は気にしないでください。
また、re.subで上手く行ったのは、1つめに書いた [・ー└]|( ){3,} です
>1:・ー└等の1文字と、半角スペース3つ以上のいずれかで文字列を分解したい
この「1:」は気にしないでください。
また、re.subで上手く行ったのは、1つめに書いた [・ー└]|( ){3,} です
2021/11/17(水) 01:31:56.09ID:vtK5EVRE
[・ー└]|( ){3,} → 合ってる
[・ー└( ){3,}] → 間違い
[・ー└(( ){3,})] → 間違い
文字コードが uft-8 以外で書かれている文書を扱ってるとか?
そうなら python 文字コード でググって文書を uft-8 に変換してから split
[・ー└( ){3,}] → 間違い
[・ー└(( ){3,})] → 間違い
文字コードが uft-8 以外で書かれている文書を扱ってるとか?
そうなら python 文字コード でググって文書を uft-8 に変換してから split
2021/11/17(水) 02:52:26.84ID:CiQU0O+7
( → (?:
2021/11/17(水) 04:06:28.28ID:PbEjqT95
>>29
そもそも単文字なんだしグループにする必要なくね?
そもそも単文字なんだしグループにする必要なくね?
2021/11/17(水) 09:04:44.07ID:GPq3lXDW
2021/11/17(水) 10:12:43.95ID:A6BSd3Zu
正規表現に生の半角スペース使うのは一見気づきにくくて余り好きじゃないなぁ
\x20 にしない人多いのかな
\x20 にしない人多いのかな
2021/11/17(水) 10:36:58.04ID:6wJ0temu
俺は生派
\sを使う人もいるけど俺は嫌
\sを使う人もいるけど俺は嫌
2021/11/17(水) 10:39:17.25ID:GPq3lXDW
エディタの設定で可視化もできるしね。>半角スペース
2021/11/17(水) 10:39:47.05ID:6wJ0temu
this is a pen
を
this\x20is\x20a\x20pen
とかも嫌
を
this\x20is\x20a\x20pen
とかも嫌
2021/11/17(水) 10:56:31.05ID:A6BSd3Zu
文章になってるものまで生で使わないと言うわけじゃないけどな
ブラケットの中で使う場合なんかは生は避けたいわ
[ ]とかよく見かけるけど、分かりづらい
なお、\sは半角スペースを含むけどそれ自体じゃないので普通は区別して使うでしょ
ブラケットの中で使う場合なんかは生は避けたいわ
[ ]とかよく見かけるけど、分かりづらい
なお、\sは半角スペースを含むけどそれ自体じゃないので普通は区別して使うでしょ
3829
2021/11/17(水) 11:01:36.46ID:vtK5EVRE this[ ]is[ ]a[ ]pen
proxomitronのフィルタ職人をやってるときはこうやってた
今だと this\ is\ a\ pen かな? 使ったことないけどw
\s は環境によっては全角スぺにマッチするから気を付けないとね
proxomitronのフィルタ職人をやってるときはこうやってた
今だと this\ is\ a\ pen かな? 使ったことないけどw
\s は環境によっては全角スぺにマッチするから気を付けないとね
2021/11/17(水) 11:32:27.19ID:6wJ0temu
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 中国国連大使「日本が中国に武力行使すると脅しをかけたのは初めて」 国連事務総長に書簡★5 [♪♪♪★]
- 【芸能】篠田麻里子「水戸黄門」のオフショット公開!「くの一姿が可愛い」「うっひゃー」「スケさんカクさんが羨ましい!」 [湛然★]
- 高市首相告白「『なめられない服』を選ぶことに数時間を費やしました」「外交交渉でマウント取れる服、買わなくてはいかんかもなぁ」★4 [ぐれ★]
- 【🐼】パンダ、日本で会えなくなる? 中国との関係悪化で不安の声 ★2 [ぐれ★]
- 【芸能】44歳・池脇千鶴、激変ぶりにネット衝撃 「まるで別人…」「変化が凄い!!」の声 [冬月記者★]
- 竹中平蔵氏、万博は大成功だったと持論 批判していた人々にチクリ「反省の弁の一つも聞きたい」 [バイト歴50年★]
- 【速報】高市、今度はロシアに喧嘩を売る [329271814]
- 適当な嘘をついてその場を切り抜けてるけど
- 【📛専】とうふさんすこすこ😊👎スレッド【とうふゲームズ🏡】
- ケノンとかゆう光脱毛器メルカリで買った(⸝⸝•̀ω•́⸝⸝)
- 明日A型作業所だよ?😊
- (´・ω・`)🚪(*´ω`*)💤🚽
