●Regular Expressionの使用環境
PCRE2
●検索か置換か?
検索
●説明
(..[\0@-g]\0){147}などを高速に検索したい
●対象データ
メガ単位のバイナリファイル(リトルエンディアン)
●希望する結果
説明は一例なので前中後にリテラルパターンが入る事もありますが(16KiBを越える事も)、固定長で
一定範囲だが不明な32bit値(0または0x00400000〜0x00670000付近)を含むブロック位置を列挙したいです
現状PCRE2で検索は出来ていますが、Intel Hyperscanだと
util/determinise.h:determinise:162:succ_id 16383 >= state_limit 16383
ng_mcclellan.cpp:buildMcClellan:590:state limit exceeded
rose_build_add.cpp:addOutfix:1779:could not build as either an NFA or a DFA
ng.cpp:addGraph:507:could not compile component 0 with 592 vertices
と言われて説明の例に限っては正規表現のコンパイルすら不可能です
32bit値は4バイト境界に限りませんが、ブロック先頭は4バイト境界なのでそこから高速化したいのですが
「(?>....)*?\K」を接頭しようとするとPCRE2_ANCHOREDはJITで使えませんし、そもそも遅くなるようです
今のところプログラム側でオフセットが4バイト境界のみを拾い、次の検索開始もアライメントしています
コールアウトもお察し…こういったパターンに適した書き方、又はCライブラリが有れば教えて欲しいです
探検
Regular Expression(正規表現) Part16
■ このスレッドは過去ログ倉庫に格納されています
538デフォルトの名無しさん
2022/10/29(土) 13:09:46.30ID:ec13kmtS■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【速報】WBC世界バンタム級王座決定戦 井上拓真判定勝利! 那須川天心、初黒星 [牛丼★]
- 【速報】盗難車ひき逃げで歩行者ら12人死傷 逃走した“運転手”の37歳男を逮捕 東京・足立区 ★2 [Ailuropoda melanoleuca★]
- 【速報】盗難車ひき逃げで歩行者ら12人死傷 逃走した“運転手”の37歳男を逮捕 東京・足立区 ★3 [Ailuropoda melanoleuca★]
- 【東京・足立の車暴走】赤信号無視か 危険運転致死傷疑いも視野に捜査 逮捕された職業不詳の男性(37)は精神疾患で通院歴も [ぐれ★]
- 石破前総理「どうすれば台湾有事にならないかを考えるべき」 [1ゲットロボ★]
- 〈台湾からも批判の声〉完全に詰んだ高市首相「存立危機事態」発言「愛国心はあっても外交能力がない」 [バイト歴50年★]
- WBC世界バンタム級 那須川天心 vs 井上拓真 9
- WBC世界バンタム級 那須川天心 vs 井上拓真 8
- WBC世界バンタム級 那須川天心 vs 井上拓真 4
- WBC世界バンタム級 那須川天心 vs 井上拓真 7修
- WBC世界バンタム級 那須川天心 vs 井上拓真 9
- 競輪実況★1610
- 【実況】博衣こよりとホロックスのえちえちウミガメのスープ🧪 ★3
- 【実況】WBC世界バンタム級王座決定戦 那須川天心vs井上拓真 2
- 白上フブキ🦊🤘とすこん部🌽のお🏡
- 【実況】WBC世界バンタム級王座決定戦 那須川天心vs井上拓真
- 那須川天心敗北wwwwwwwwwwwwwwwwwwww [802034645]
- ぶんぶんぶーん!押忍!hololive DEV_IS ReGLOSSの番長!轟はじめ!🐧⚡🏡
