X



Regular Expression(正規表現) Part17
0001デフォルトの名無しさん
垢版 |
2023/12/16(土) 08:59:20.50ID:uVHZ7e2j
Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part16
https://mevius.5ch.net/test/read.cgi/tech/1635936601/

次スレは>>980宜しく
テンプレ>>2以降
0002デフォルトの名無しさん
垢版 |
2023/12/16(土) 08:59:57.66ID:uVHZ7e2j
スルーされにくい質問のテンプレと例

●Regular Expressionの使用環境
Java1.5

●検索か置換か?
検索

●説明
各行の1番目のAまでを検索したい

●対象データ
ABCA
BCAA
CABA

●希望する結果
ABCA
^
BCAA
^^^
CABA
^^

※ ^ はアンダーラインだそうな ^^;
0003デフォルトの名無しさん
垢版 |
2023/12/16(土) 09:00:18.14ID:uVHZ7e2j
◆関連サイト
正規表現メモ
http://www.kt.rim.or.jp/~kbk/regex/regex.html
Perl正規表現雑技
http://www.din.or.jp/~ohzaki/regex.htm

詳説 正規表現
http://www.oreilly.co.jp/books/9784873113593/
正規表現クックブック
http://www.oreilly.co.jp/books/9784873114507/

正規表現プログラミングFAQ
http://capslockabcjp.kitunebi.com/faq.html
.NET Framework の正規表現 | Microsoft Docs
https://docs.microsoft.com/ja-jp/dotnet/standard/base-types/regular-expressions
正規表現 - JavaScript | MDN
https://developer.mozilla.org/ja/docs/Web/JavaScript/Guide/Regular_Expressions
鬼車
https://github.com/kkos/oniguruma
鬼雲
https://github.com/k-takata/Onigmo
bregonig.dll(鬼雲の正規表現をサクラエディタ等で使用するためのライブラリ)
http://k-takata.o.oo7.jp/mysoft/bregonig.html
Boost.Regex 1.45.0 (日本語訳)
http://alpha.sourceforge.jp/devel/boost.regex_ja_1_45_0.pdf

秀丸: 複数行にまたがる検索について
http://homepage2.nifty.com/jr-kun/hidemaru_qa/4_regulr.html#RETURNS

サクラエディタ: 改行
http://d.hatena.ne.jp/myokoym/20101219/1292779058
※ サクラエディタでは複数行に渡る検索・置換は出来ません。
0007デフォルトの名無しさん
垢版 |
2023/12/16(土) 21:11:50.18ID:ZkpISsx+
正規表現スレのテンプレにperl公式が無かったのかw

詳説 正規表現ももうだいぶ古い
近頃の正規表現エンジンが進化しすぎてもう本に全部まとめられないよね
perlの正規表現の解説だけで1冊分になってしまいそう

>スルーされにくい質問のテンプレと例

いつもスルーしてる
0009デフォルトの名無しさん
垢版 |
2023/12/17(日) 07:18:27.92ID:FEe4n35c
俺すげぇ面白い事思い付いたわ
天才じゃね?
って深夜に思い付いちゃったんだろうな
異世界転生モノ好きそう
0010デフォルトの名無しさん
垢版 |
2023/12/17(日) 10:40:09.52ID:KG6/TFz3
俺も思ったけど書き込まなかった
「包茎」「空目」「深夜」どこにもかかってないんだが
>9 は異世界転生モノに親でも殺されたのか流行り物が嫌いなだけなのか
0015デフォルトの名無しさん
垢版 |
2023/12/17(日) 16:47:12.08ID:C55sNZf7
以下のあぼーん用正規表現を教えて下さい

文字列3文字
文字列5文字
(空白改行)
文字列3文字

よろしくお願い致します
0016デフォルトの名無しさん
垢版 |
2023/12/17(日) 22:44:10.33ID:WFgQcr7d
文字列3文字が固有の3文字なのか任意の3文字なのかがわからん
空白と空は意味がちがうから空白改行もどうとらえていいかわからん
そういう厳格さがないと正規表現は使い切れない
0018デフォルトの名無しさん
垢版 |
2023/12/18(月) 00:25:33.88ID:gHmacq4F
>>16-17
某板に荒らしが発生しているので
荒らしレスの冒頭の
─────────────────────
>>1
岡村ほまれ

可愛い
─────────────────────をあぼーんワードにしたいのです
よろしくお願い致します
0019デフォルトの名無しさん
垢版 |
2023/12/18(月) 00:54:45.24ID:zFl9jE+m
情報を小出し後出しにするやつってうざいよな
もう遅いけど使用環境を最初に示すべきだった
0020デフォルトの名無しさん
垢版 |
2023/12/18(月) 10:40:38.35ID:pykETp8J
改行の扱いは専ブラによって違うということを知っておこう
<br>だったり\sだったりする
0023デフォルトの名無しさん
垢版 |
2023/12/20(水) 09:54:40.16ID:HDpQovyo
UPLIFT プレミアム・サービスのお知らせ

https://uplift.5ch.net/

UPLIFT 主な特典
・連続投稿の規制を緩和します。
・スレッド作成時の規制を緩和します。
・5ch.netのスレッド表示画面に表示される広告を除去します。
・5ch.net専用ブラウザで5ch.netの過去ログを閲覧できるようになります。
・海外からのアクセス・ホスト経由からでも書き込みができるようになります。
・書き込みが規制されているプロバイダーからでも書き込みができるようになります。
・5ch.netを安定して利用できるように運営を支援できます。

5ちゃんねるを存続させるためには、皆様のご協力が必要です。

最後まで御精読いただきありがとうございました。
0024デフォルトの名無しさん
垢版 |
2023/12/20(水) 13:16:05.38ID:kMNBqppc
他は無料で良いサービス提供出来てるのに金払えは甘え
5ch運営が殿様商売で無策だったツケが回って来てるだけの自業自得だから、5chなんか潰れちまえ
取り敢えずNG突っ込んだわ
0025デフォルトの名無しさん
垢版 |
2023/12/20(水) 19:23:53.60ID:owPAm/QX
このスレも役目を終えつつあるね、今時の子はこんなところには来ないと思う
yahoo掲示板にでも行ってるのかな
0028デフォルトの名無しさん
垢版 |
2023/12/20(水) 23:36:14.45ID:z/5Qp7sj
そして「ChatGPTでXXをやってみたいんですがうまくいきません、どうしたら」というクレクレ質問が大量発生
0030デフォルトの名無しさん
垢版 |
2023/12/22(金) 12:31:09.65ID:ivJ9ZoTT
あるプログラムのコーディングはすごく処理速度を意識してるのに
そのプログラムに使ってる正規表現はまったく効率を考えてない,というケースをよく見かける
正規表現をAIが作るようになれば改善されるかもね
0031デフォルトの名無しさん
垢版 |
2023/12/22(金) 18:21:26.60ID:55x+HPTI
人「おいAI、お前が作った正規表現とてつもなく遅いじゃないか」
AI「はい、ヒトが解読しやすい方が良いと判断しました。速度の問題は時が経てばマシンの性能向上で解決しますが、ヒトの解読力の方は...」
0032デフォルトの名無しさん
垢版 |
2023/12/23(土) 21:28:49.10ID:jMjD4WOY
> 速度の問題は時が経てばマシンの性能向上で解決しますが

海原雄山「このポンコツAIを作ったのは誰だー」
0038デフォルトの名無しさん
垢版 |
2024/01/31(水) 22:37:07.48ID:jTCZHTVk
.Netが正規表現エンジンを改良したと話には聞いてたけど
6年でこんなに変わるもんなんだな

      Language Email(ms) URI(ms) IP(ms) Total(ms)
2018年 C# .Net Core 1952.13  1681.00 111.32 3744.45
2024年 C# .Net Core   6.46    3.79  19.35  29.59
https://github.com/golang/go/issues/26623
0042デフォルトの名無しさん
垢版 |
2024/02/04(日) 21:10:13.35ID:GiV0zbjO
旧エンジンにマシンパワーをどれだけ積んでもネットブックで動かす新エンジンに勝てなそう
0043デフォルトの名無しさん
垢版 |
2024/02/04(日) 22:35:02.60ID:FtEwRyHG
それ同じ環境と条件で比較テストしてるわけじゃないから単純にエンジンの違いによる性能差じゃないからね
0044デフォルトの名無しさん
垢版 |
2024/02/04(日) 23:23:40.51ID:l8NY0XdM
正規表現は昔からあるのに未だに進化するスピードが尋常じゃないのはすごいことだ
AIの登場でこれからどうなるのか想像付かない
0045デフォルトの名無しさん
垢版 |
2024/02/05(月) 03:06:40.22ID:UJ2m14qd
正規表現はオートマトンに変換するだけだから
AIとは何の関係もないぞ

高速化もこれ以上は理論的にできないし
書き方で速さが違うのは当たり前
0046sage
垢版 |
2024/02/05(月) 15:59:30.46ID:6V7y69ze
現代の正規表現エンジンは純粋なオートマトンだけで動いているわけではないよ
0047デフォルトの名無しさん
垢版 |
2024/02/14(水) 22:19:25.22ID:2oHCpHj3
例えをあげると以下の正規表現を使った検索では

[^a]+c[^b]+

まず"c"を検索して見つからなければマッチ失敗を返す
このときオートマトンは使用されないまま検索が終わる

これは実在する正規表現エンジンの動作ではなくあくまでイメージ
AIならもっと柔軟にこういう処理が出来るかも
0048デフォルトの名無しさん
垢版 |
2024/03/18(月) 04:18:56.57ID:LIfqFVfX
そういう高速化はワイルドカードで
数パターンに分類してやったことはあるな

というわけで前段階で複数のワイルドカードをand/orでつなげた表記も受け付けるようにすれば
シンプルな分結構高速化できる
0050デフォルトの名無しさん
垢版 |
2024/03/24(日) 19:41:23.90ID:aAFJLVlH
正規表現って現実の何かで例えるなら何?
パズル?
言語学的な感じも数学的な感じもしないような
0053デフォルトの名無しさん
垢版 |
2024/03/25(月) 17:12:10.55ID:vkyh3m8T
ますたーまいんど
0055デフォルトの名無しさん
垢版 |
2024/03/28(木) 23:34:35.78ID:WoHbaWvj
正規表現を初めて使ったのがken氏でOnigmoもken氏
そして現代で正規表現と言えばPerl

この3つの要素を合わせるとなんと>>51になる
0058デフォルトの名無しさん
垢版 |
2024/04/01(月) 17:41:25.33ID:Jdw9gPZP
つまりムトゥ神か
0060デフォルトの名無しさん
垢版 |
2024/04/04(木) 03:53:18.24ID:X4Q29337
使用環境メモ帳
☑正規表現を使うにチェック
検索するにAAA _ BBB _ CCC _DDD
置換にBBB AAA
0063デフォルトの名無しさん
垢版 |
2024/04/28(日) 08:09:34.58ID:bvIrnysh
カ)ミツカン カカ)ミツカン
の単語の始まりにある「カ)」を取ってきたいのだが、
[カ\カユユ][)\)]
だと両方ヒットする。
\b[カ\カユユ][)\)]
だと両方ヒットしない。
\bて単語の始まりじゃないの?
0065デフォルトの名無しさん
垢版 |
2024/04/28(日) 08:43:14.02ID:rlAkFFFr
>>63
一般に正規表現の \b 及び \B の文脈における「単語」とは「\w+」のこと
「か」は単語ではないので、当然ながらその直前の位置(境界)に \b はマッチしない
0066デフォルトの名無しさん
垢版 |
2024/04/28(日) 08:44:57.81ID:w8Q1u9O5
単語の境界の単語とは\wかどうか
先頭が\w、\wと\W(又は\Wと\w)の間、最後が\w
空白も括弧も全角文字も\wではなく、全てが\Wの連続なので境界がない

(?<=^|\s| )[カ\カユユ][)\)]
こんな感じかなあ?
0069デフォルトの名無しさん
垢版 |
2024/04/28(日) 10:39:11.02ID:bvIrnysh
>>66
サンクス。
正規表現チェッカーだとうまく行くが、VBAだとエラーする。
カカ)ミツカンていう会社名なんてないから諦めるわ。
0070デフォルトの名無しさん
垢版 |
2024/05/01(水) 06:39:29.77ID:QLRpEQs1
=?UTF-8?Q?=F0=9F=91=BBIt's_Halloween_Sale_=E2=80=93_Time_To_Save!?=
=?UTF-8?Q?=F0=9F=91=BBIt's_Halloween_Sale_=E2=80=93_Time_To_Save!?=

quoted-printableを切り出すのは難しいな
0071デフォルトの名無しさん
垢版 |
2024/05/01(水) 10:32:16.36ID:G90j3Kau
切り出しするのはMIMEパートで
中身はすべてQPだから難しくなさそうだけど罠がある?
レスを投稿する


ニューススポーツなんでも実況