Regular Expression(正規表現) Part15

**デフォルトの名無しさん** · 2019/09/16(月) 22:25:11.87

Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part14
https://mevius.5ch.net/test/read.cgi/tech/1489511075/

次スレは>>980宜しく
天ぷら等>>2以降

**デフォルトの名無しさん** · 2021/01/11(月) 15:31:25.19

初学者なのでうまく伝わるか心配ですが、固定長で末尾に改行が入っているレコードファイルを扱っています
その中で、末尾だけでなくレコード中にも改行コードが含まれるようなデータがあり、それを置換したいといった具合です。

UNIX上での話なので、Perlやsedで置換できればと思います。
よろしくお願いいたします。

**デフォルトの名無しさん** · 2021/01/11(月) 15:41:19.51

sedはデフォルト行ベースなので改行コードを全部置換すればいい

**デフォルトの名無しさん** · 2021/01/11(月) 15:43:13.55

/[\r\n]++(?!$)/@/g
こんな感じじゃね？分からんけど

**デフォルトの名無しさん** · 2021/01/11(月) 16:15:14.39

s/\r?\n/@/gm;

どうよ？

**デフォルトの名無しさん** · 2021/01/11(月) 16:20:44.13

固定長ごとに出てくる改行以外の改行ってことじゃね
改行含めて80文字固定長なら80文字目や160文字目以外の37文字目や53文字目に出てくる改行

**デフォルトの名無しさん** · 2021/01/11(月) 17:26:33.52

あーすまんそういうことか
それだと固定長単位に読み取って置換と出力のループかな

while read -N10 line || [ "$line" ]; do
echo "$line" | tr -d '¥r¥n'
echo
done < input.txt

**デフォルトの名無しさん** · 2021/01/11(月) 17:59:11.32

やりたいことは、 >>477 さんの仰る通りです。
少ない情報の中、皆さん色々とありがとうございます。

明日以降試してみます、本当にありがとうございます。

**デフォルトの名無しさん** · 2021/01/11(月) 18:31:58.04

改行コードは、cr・lf・crlf の3種類あるのか？

固定長の末尾の改行の後には、何が入っている？
ヌル文字か？

例えば、100バイトの固定長で、内容が80バイトなら、
残りの20バイトには、何が入っている？

それとも、内容の80バイトの部分だけが、渡ってくるのか？

**デフォルトの名無しさん** · 2021/01/11(月) 18:43:53.19

CR なんとかReturn
LF LineFeed
CRLF なんとかReturnLineFeed

**デフォルトの名無しさん** · 2021/01/11(月) 20:39:57.39

echo -en "abcde
a\ncde
a\rcde
a\r\nde
abcdef
a\ncdef
a\nc" |
sed -re ':b;y/\r\n/@@/;/.{5}/!{N;bb};'

**デフォルトの名無しさん** · 2021/01/11(月) 21:38:18.11

>>471
CRLFは@2個に置換でいいんだよね？
CRLFを@1個に置換したら固定長ファイルとして
ファイル構造がおかしくなるわけだし

**デフォルトの名無しさん** · 2021/01/12(火) 17:48:10.93

>>481 carriage

**デフォルトの名無しさん** · 2021/01/14(木) 20:15:05.94

>>479
解決しましたか？

**デフォルトの名無しさん** · 2021/01/14(木) 20:19:20.00

うざｗ

**デフォルトの名無しさん** · 2021/01/15(金) 04:04:23.16

先日質問させていただいた471です。
色々と試した結果、
perl -pe ‘s/¥r/@/g $INFILE | perl -pe ‘s/¥n/@/g > $TMPFILE

cat $TMPFILE | perl -e ‘while(read(STDIN, $tmp , 100)){print $tmp, “¥n”}’ > $OUTFILE

と言った具合に、改行を消してから固定長に区切って再度改行付与という形でうまくいきました！

皆さんに教えてもらった方法とは少し異なりますが、ここで質問しなければ検索ワードすら導き出せませんでした。
皆様には感謝してもしきれません。
ありがとうございました。

**デフォルトの名無しさん** · 2021/02/02(火) 23:52:09.94

[]で囲まれた単語は/\[.+\]+/gで見つかるけど
文中に複数[]で囲まれた範囲があるとうまくいかない
'['以降で一番近い']'にマッチさせたいんだがどうやるか教えて

**デフォルトの名無しさん** · 2021/02/03(水) 00:24:53.98

/\[[^\]]+\]+/g

**デフォルトの名無しさん** · 2021/02/03(水) 01:04:29.59

>>489
ありがとう！

**デフォルトの名無しさん** · 2021/02/03(水) 18:02:08.71

英数字7桁[0-9a-zA-Z]の文字列から(改行を経て)先程とは異なる英数字7桁の文字列まで最短一致させる正規表現を書きたいのですがわかりません…

一つ目の7桁の英数字は変数fistに入ってます
new Reg(first +"(.*\n)*?"+ここから先がわかりません

どなたかよろしくお願いしますm(_ _)m

**デフォルトの名無しさん** · 2021/02/03(水) 18:33:27.05

最短一致ということは行当たりが[0-9a-zA-Z]{7}ではなく別の文字列も含んでいそうな
つまり「0123abc\ndef4567」だけではなく「あいう0123abc\ndef4567かきく」もあるとか

見本出した方がいいのではないかな

**デフォルトの名無しさん** · 2021/02/03(水) 18:41:43.46

とりあえずこんな感じであとは調整して
https://regex101.com/r/aLWgGd/1

**デフォルトの名無しさん** · 2021/02/03(水) 19:08:15.83

>>492
すいません、簡単にするために設定をちょっと変えさせてください。
[0-9A-Z]
大雑把で大丈夫なんですが
あいうえお01ABC23あいうえお01abc23あいうえお01abc23 　←ここの01ABC23から
あいうえお01abc23あいうえお01ABC23あいうえお01abc23
あいうえお01abc23あいうえお01ABC23あいうえお01abc23
あいうえお01abc23あいうえお01DEF23あいうえお01abc23 　←ここの01DEF23まで切り抜きたい
あいうえお01abc23あいうえお01ABC23あいうえお01abc23
あいうえお01abc23あいうえお01HIJ23あいうえお01abc23

first = "01ABC23"　が入ってるので、正規表現の最後を01DEF23にしたいのですが
[0-9A-Z]{7}から"01ABC23"だけを除外する方法がわからず困ってます。

**デフォルトの名無しさん** · 2021/02/03(水) 19:12:17.69

>>494
訂正　「大文字と数字だけの7桁に設定変更させてください」って文言が抜けてました

>>493
すいません、その後の調整方法がわからないんです...

**デフォルトの名無しさん** · 2021/02/03(水) 19:16:51.84

日本語がおかしくなってました

01ABC23～01DEF23と切り抜きたいのですが、
first = "01ABC23"と入っているので、firstという変数を使いつつ[0-9A-Z]{7}から"01ABC23"だけを除外する方法がわからず困ってます。

**デフォルトの名無しさん** · 2021/02/03(水) 19:28:51.74

>>496
"(?!" + first + ")[0-9A-Z]{7}"

**デフォルトの名無しさん** · 2021/02/03(水) 19:41:14.94

>>497
ありがとうございますm(_ _)m
↓だと最短一致しないのですが、真ん中がおかしいのでしょうか？

let reg = new RegExp(first+"(.*\n)*?"+"(?!"+first+")[0-9A-Z]{7}");

改行を含めた最短一致は([\s\S]*?)か(.*\n)*?でできていたのですが、何故か最短にならず困ってます

**デフォルトの名無しさん** · 2021/02/03(水) 19:49:30.28

>>498
真ん中とは+で繋げた"(.*\n)*?"の部分のことです
日本語すら怪しくてすみません

**デフォルトの名無しさん** · 2021/02/03(水) 20:21:28.10

>>498
自己解決しました
スレ汚しすみませんでした
答えてくださった方々ありがとうございました

**デフォルトの名無しさん** · 2021/02/04(木) 12:49:19.54

[正規表現の[表現力[は]ネストに]勝てない]
※Perlの拡張とかは除く

**デフォルトの名無しさん** · 2021/02/04(木) 15:31:37.02

繰り返しの中で使う時、時間のかかる正規表現を避けたいが、結局試すのが一番
if x=="abc" と if x=~/^abc$/ の比較など（簡単すぎる例）

重要なシステム内で複雑な表現を使う場合テストも重要だが、
どうしてもおかしくなったら調べる式になってしまう

**デフォルトの名無しさん** · 2021/02/06(土) 14:47:08.00

お願いします

●Regular Expressionの使用環境
VBScript

●検索か置換か？
置換

●説明
[hoge]をブラケットごと消したい
[[hoge]]の場合は残したい

●対象データ
abc[hoge]def
ghi[[hoge]]jkl

●希望する結果
abcdef
ghi[[hoge]]jkl
^^^^^^^

否定戻り読み否定先読みで試してみたのですが、ブラケット2回の場合にマッチせずブラケット1回の場合にのみマッチさせる方法が分かりませんでした
よろしくお願いします

**デフォルトの名無しさん** · 2021/02/06(土) 15:07:35.62

(?<!\[)\[hoge\](?!\])

**デフォルトの名無しさん** · 2021/02/06(土) 16:56:52.18

>>503
VBSには否定戻り読みは無いので、工夫するしかない
すぐには思いつかないけどもっといい方法もあるかもしれないのでググってみては？
愚直には、一つの方法として以下の場合に分ける
1) [hoge]で始まる場合
2) 文字列があって [ 以外で終わって [hoge] がある場合
3) 文字列があって [ で終わってる場合、[hoge] があって ] が続かないこと

pattern : "^(?:\[hoge]|(.*?\[)\[hoge\](?!\])|(.*?[^\[])\[hoge\])(.*)$"
replace : "$1$2$3"

abcdef → abcdef
[hoge]def → def
[[abc]]def → [[hoge]]def
abc[hoge]def → abcdef
abc[[hoge]]def → abc[[hoge]]def
abc[[hoge]def → abc[def
abc[hoge]]def → abc]def

下2つの場合が無ければもう少し簡易にできる
では[hoge]が2つ以上ある場合はどうするか？
すぐ思いつく方法としては、変換をループさせて、文字列に変化がなければ終わりとか

**デフォルトの名無しさん** · 2021/02/06(土) 17:17:15.94

(¥[hoge¥])(?!¥])|[^¥[](¥[hoge¥])
https://regex101.com/r/xhea5T/1

**デフォルトの名無しさん** · 2021/02/06(土) 17:31:09.15

(\[\[hoge\]\])|\[hoge\] → $1
https://regex101.com/r/xhea5T/2

**デフォルトの名無しさん** · 2021/02/06(土) 17:40:46.95

([^\[])\[hoge\]([^\]])
$1$2

(^|[^\[])\[hoge\]([^\]]|$)
$1$2

**デフォルトの名無しさん** · 2021/02/06(土) 17:44:51.10

>>504->>508
ありがとうございます。
やってみます。

**デフォルトの名無しさん** · 2021/02/06(土) 18:09:33.55

>>507
すばらしいです
>>506,>>508
残念

**デフォルトの名無しさん** · 2021/02/06(土) 18:21:12.27

発想の転換だな
目鱗

**デフォルトの名無しさん** · 2021/02/06(土) 18:57:27.44

>>507
へぇー、これは面白い

**デフォルトの名無しさん** · 2021/02/06(土) 19:33:52.91

>>507
これは賢い

**デフォルトの名無しさん** · 2021/02/16(火) 18:09:22.76

※間はタブです
●Regular Expressionの使用環境
サクラエディタ

●検索か置換か？
置き換え

●説明
(ABC|JKLHI7)を反転させたい

※(ABC|JKLHI7)→空に置き換え
ABC　　　　DEF　　　　　123
FGH　　　　JKL　　　　　956
GBN　　　　MJK　　　　HI7

↓こうなります

　　　　DEF　　　　　123
FGH　　　　　　　　　956
GBN　　　　MJK

(ABC|JKLHI7)を反転させて
ABC　　　　
　　　　JKL　　　　　
　　　　　　　　HI7

というデータに置き換えたいです。
よろしくお願いいたします。

　　　　

**デフォルトの名無しさん** · 2021/02/16(火) 18:10:03.36

>>514
説明の部分に誤りがありました。
●説明
(ABC|JKLHI7)を反転させたい

でなく
(ABC|JKL|HI7)を反転させたい

でした。

**デフォルトの名無しさん** · 2021/02/16(火) 18:30:01.16

区切りは全角空白なのかい？
まあこんなのでどう？
(ABC|JKL|HI7)|[0-9A-Z]*→$1

**デフォルトの名無しさん** · 2021/02/16(火) 19:29:55.89

>>516
ありがとうございます。
その発想まったくありませんでした。

ほしいものカッコで包んで|要らないもので置き換え
御見それしました。

ありがとうございます。

**デフォルトの名無しさん** · 2021/02/16(火) 20:11:15.08

>>516
>>507再び
再度>>511感想

**デフォルトの名無しさん** · 2021/02/17(水) 00:48:24.95

XABCXのようなものまでABCにしたいなら、末尾を+?に変えた方がいいかも

**デフォルトの名無しさん** · 2021/02/18(木) 23:51:52.71

面白いなあ
逆に正規言語じゃない言語ってどんなのか気になる

**デフォルトの名無しさん** · 2021/02/19(金) 07:25:19.97

言語？

**デフォルトの名無しさん** · 2021/02/19(金) 18:55:29.37

文脈自由言語とか文脈依存言語とか?

**デフォルトの名無しさん** · 2021/02/19(金) 20:03:11.77

文脈も先読み後読みrematch駆使すれば取れそうに思うけど、本来どこまでやっていいんだっけ理論とか分からん

**デフォルトの名無しさん** · 2021/02/19(金) 20:05:33.21

正規表現で記述可能な文字列の集合を指して正規言語という

が、その意味で使われたのかは定かでない

**デフォルトの名無しさん** · 2021/02/19(金) 20:15:12.89

取り敢えずその言語がn要素の有限集合ならstr1|str2|...|strn で表現できるのでは
文字列の長さを制限して、有限の文字集合なら
すげーつまらないけど

**デフォルトの名無しさん** · 2021/02/19(金) 20:33:20.22

無作為な文字列から、特定の言語に属する部分列を検出しろ、って問題にどれだけ簡潔に答えられるかってことだよな
どう計ったものか

**デフォルトの名無しさん** · 2021/02/20(土) 01:01:18.47

AIに正規表現を設計させたらどんなものになるのだろう

**デフォルトの名無しさん** · 2021/03/03(水) 06:22:13.41

●Regular Expressionの使用環境
python 3.x

●検索か置換か？
検索

●説明
ここをアクセスの次に出てくるURL(ttp://xxxx2/)をとってきたい
pattern = re.search("▼ここをアクセス.*(http.*\n)+?",a_text,flags=re.DOTALL)
複数行検索してるが最後のURLをとってきてしまう

●対象データ

URL1です
ttp://xxxx2/

　□　　　　　　　【▼ここをアクセス】
ttp://xxxx2/

URL2です
ttp://xxxx3/

●希望する結果
ttp://xxxx2/

**デフォルトの名無しさん** · 2021/03/03(水) 06:44:56.40

> "▼ここをアクセス.*(http.*\n)+?"
python分からんけど
"▼ここをアクセス.*?(http.*?\n)"

**デフォルトの名無しさん** · 2021/03/03(水) 07:02:17.82

>>529
レスサンクスですが、最後のttp://xxxx3/を拾ってきてしまいます

**デフォルトの名無しさん** · 2021/03/03(水) 07:20:09.73

自己解決
"▼ここをアクセス.+?(http.+?)\n"
でいいみたい

**デフォルトの名無しさん** · 2021/03/07(日) 14:22:59.84

正規表現ってパズルとしては面白いけど
https://oraclesqlpuzzle.ninja-web.net/regex/index.html
可読性に問題あるんじゃね?
もっとマシな別の表記方法が必要じゃないか？

**デフォルトの名無しさん** · 2021/03/07(日) 16:02:01.74

自分が解らないものは悪

**デフォルトの名無しさん** · 2021/03/07(日) 16:17:46.75

理解の過程で可読性に問題があるのではと疑問を抱き、
別の表記法の必要性を考え、
そのあと別の表記を実際に考えるところまでやると、
正規表現考えたケン・トンプソンすげーなってなる

**デフォルトの名無しさん** · 2021/03/07(日) 17:26:15.98

>>532
> もっとマシな別の表記方法が必要じゃないか？
定期的にそう言うのが話題になるけどなかなかいい記法が無いんだよね
abc+
程度の簡単な奴と
^((?!aaa).)*((?=aaa)a((?!aaa).)*){3,5}((?!aaa).)*$
みたいなパット見よく分からん奴を１つの記法で簡単に見易くするのはなかなか難しい

**デフォルトの名無しさん** · 2021/03/07(日) 17:53:05.78

やるとしたらアスキー文字以外の文字や記号を加えてもうちょっと役割を分散させると、機能を保持しつつ見やすくはなるが、そうすると今度はラテン文字圏の人が「自分が解らないものは悪」でいかに不要かを全力で説き始めると思う。

**デフォルトの名無しさん** · 2021/03/07(日) 17:56:22.71

ASCII外の文字使うと入力コストが高くなるじゃん

**デフォルトの名無しさん** · 2021/03/07(日) 18:04:15.76

?とか^とか二つの意味を持つのは何とかしてほしかったよな
まあ分かるからいいんだけど

**デフォルトの名無しさん** · 2021/03/07(日) 20:25:01.40

可読性を犠牲にして短く書けるのが正規表現
正規表現と同じことを可読性の高い表現で記述しようとすればなにかと長くなる
ただある一定以上複雑な正規表現は普通のプログラミング言語で書き直したほうが可読性も保守性も高い

**デフォルトの名無しさん** · 2021/03/07(日) 21:12:54.42

普通のプログラミング言語で正規表現ライブラリ使ってます

**デフォルトの名無しさん** · 2021/03/07(日) 21:23:44.60

例えば.NETみたいに正規表現中に改行入れたりコメント書けるようにするとかして可読性を上げる試みはあるね
https://www.atmarkit.co.jp/fdotnet/dotnettips/582regexcomment/regexcomment.html

**デフォルトの名無しさん** · 2021/03/07(日) 21:31:45.50

>>539
それしかなさそうだ

**デフォルトの名無しさん** · 2021/03/07(日) 21:36:49.39

>>541
改行してコメント書くのは Perl の正規表現でもできたりする

**デフォルトの名無しさん** · 2021/03/07(日) 21:55:32.23

>>541
その例にある(?<url>.*?)みたいな名前付きキャプチャも
可読性を上げられる数少ない要素だと思うけど

**デフォルトの名無しさん** · 2021/03/07(日) 22:46:53.20

https://oraclesqlpuzzle.ninja-web.net/regex/regex-2-30.html
これは解読無理やろｗ　課題→正規表現を思いつくことはできるかも知れんが
正規表現→課題の解読は不可能に近い

課題：行ごとで、
文字列CABと
文字列ABCのみの行を検索する。

^((C(?=AB))|((?<=C)A(?=B))|((?<=CA)B)
|(A(?=BC))|((?<=A)B(?=C))|((?<=AB)C))*$

**デフォルトの名無しさん** · 2021/03/07(日) 23:05:17.93

>>545
^(?:CABC?|ABC(?:AB)?)+$

でよくない？

**デフォルトの名無しさん** · 2021/03/07(日) 23:21:37.42

それで同じ結果になるな　regex 101 でやると

**デフォルトの名無しさん** · 2021/03/07(日) 23:53:47.53

正規表現には「必ず」コメントが欲しいな
できれば例も
典型例と境界例も

**デフォルトの名無しさん** · 2021/03/11(木) 21:40:27.72

お願いします
●Regular Expressionの使用環境
JavaScript

●検索か置換か？
置換

●説明
数字の文字列の間の1個以上の空白や改行を　カンマで置換して繋げたい

33034640, 33034640, 21703214
●対象データ
33034640 30203225

21703214

**デフォルトの名無しさん** · 2021/03/11(木) 22:14:06.84

>>549
¥s+をカンマで置換

**デフォルトの名無しさん** · 2021/03/11(木) 22:15:56.92

https://regex101.com/r/h90Hqy/1

**デフォルトの名無しさん** · 2021/03/11(木) 22:29:51.41

前後の数字チェック入り(区切りに\t,\fを除く）
（JavaScriptって言ってもWSH(JScript)や古いとダメ）
text.replace(/(?<=\d)[ \r\n]+(?=\d)/,", ")

**デフォルトの名無しさん** · 2021/03/11(木) 22:30:57.72

text.replace(/(?<=\d)[ \r\n]+(?=\d)/g,", ")

**デフォルトの名無しさん** · 2021/03/11(木) 23:04:03.06

>>550
それすると文頭や文末にあるスペースにもカンマがついて変になっちゃいます。

**デフォルトの名無しさん** · 2021/03/11(木) 23:08:30.44

>>553
iPadのtextwellっていうアプリでやってるんですが・・・何故か動かないです

**デフォルトの名無しさん** · 2021/03/11(木) 23:29:09.19

>>554
うーんなんだかなぁって感じだけど
look-behindが使えない環境ならキャプチャして上書きすればいいよ
https://regex101.com/r/ttVIeE/1

**デフォルトの名無しさん** · 2021/03/11(木) 23:33:53.05

文頭,文末のスペース,改行を残す必要がないなら先にtrimしちゃえば良いのでは
str.trim().replace(/\s+/gm, ',')

**デフォルトの名無しさん** · 2021/03/12(金) 07:31:49.43

>>557
できました！ありがとうございました！

**デフォルトの名無しさん** · 2021/03/25(木) 17:05:14.58

浮動小数点数の仮数部の正規表現がたとえば
https://qiita.com/hitsumabushi845/items/1b1a4921d515f662b416
を見ると
([0-9]+(\.[0-9]*)?|\.[0-9]+)
とかなり煩雑な感じなんですが、これを[0-9]+と\.?のインターリービングとして表記できればより簡潔になるはずなのに、なぜ正規表現にインターリービングがないのか、ご存知の方いらっしゃいませんか?

**デフォルトの名無しさん** · 2021/03/25(木) 18:34:43.45

インターリービングとは

**デフォルトの名無しさん** · 2021/03/25(木) 18:35:20.79

>>559
どういう意味？
[0-9.]+
っていうことか？
12.34.56
こういうものも拾うことになるけど

**デフォルトの名無しさん** · 2021/03/25(木) 18:44:54.48

正規表現でやるものなのかそれ？

**デフォルトの名無しさん** · 2021/03/25(木) 20:05:19.84

0-9が１回以上、.が1回以下現れるパターンを簡潔に書ければいいんだよね

**デフォルトの名無しさん** · 2021/03/25(木) 20:51:18.60

>>559
0.123とかだけでなく.123みたいな表記も含めてるから煩雑に見えるだけでしょ

**デフォルトの名無しさん** · 2021/03/25(木) 20:57:31.28

例えばpythonだと、

\d

と書くと、

[0-9]

と同じ意味になるんだが、その程度の省略ができるだけでは不満?

**デフォルトの名無しさん** · 2021/03/26(金) 12:59:11.27

まず\dと[0-9]は一致しないケースがあるからダメでしょ

単なるバイトシーケンスとして扱っているときは \d == [0-9] だけど、
Unicodeの文字列として扱っているときはUnicodeのNdカテゴリに一致するかを見るので
\dが全角の「０」に一致したりする

Pythonもこういう仕様持ってた気がするけどちょっと最近触ってないから怪しい

**デフォルトの名無しさん** · 2021/03/26(金) 13:48:50.07

([0-9]+(\.[0-9]*)?|\.[0-9]+)

なんかほかのものもマッチする
0.
0.0.0
https://regex101.com/r/MK7ZcW/

**デフォルトの名無しさん** · 2021/03/26(金) 13:50:58.63

\dより\wで嵌ることが絶対多い（Unicodeの場合）

**デフォルトの名無しさん** · 2021/03/26(金) 14:50:30.80

動きそうで動かないのは、\s\Sかな
改行かなにかで引っ掛からなくて困る事がある

**デフォルトの名無しさん** · 2021/03/26(金) 19:09:23.59

>>567
部分列にマッチしたんだろうな

**デフォルトの名無しさん** · 2021/03/27(土) 07:24:19.21

>>567
0. にマッチするのは仕様通り
0.0.0 にマッチしてるのはグローバルフラグを付けるてるから 0.0 と .0 にマッチしてる
外せばマッチしないよ

**デフォルトの名無しさん** · 2021/03/27(土) 07:53:26.38

>>571
.0にマッチするのは正しいんじゃないの？
要らないなら[0-9]+(\.[0-9]*)?で済むでしょ

**デフォルトの名無しさん** · 2021/03/27(土) 07:59:48.48

数値として正しくないものの一部にマッチするのがいやなんだろ
そりゃ前後の条件を指定してないからマッチするのは当然なんだから
(?<![0-9.])と(?![0-9.])を前後につけりゃ弾けるよ