Regular Expression(正規表現) Part14 [無断転載禁止]©2ch.net

**デフォルトの名無しさん** · 2017/03/15(水) 02:04:35.47

Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part13
http://echo.2ch.net/test/read.cgi/tech/1415149975/

次スレは>>980宜しく
天ぷら等2以降

**デフォルトの名無しさん** · 2017/04/20(木) 21:29:57.11

●Regular Expressionの使用環境
Becky!

●検索か置換か？
検索

●説明
+0900以外に一致

●対象データ
+
-
+0
-0
+09
-09
+090
-090
+0900
-0900
+09000
-09000
+09010
-09010

**デフォルトの名無しさん** · 2017/04/20(木) 21:30:53.51

+
-
+0
-0
+09
-09
+090
-090

-0900
+09000
-09000
+09010
-09010

よろしくお願いします
※"+0900を含まない"を"+0900以外"を含むで実現したいです

**デフォルトの名無しさん** · 2017/04/21(金) 08:10:19.34

Beckyで使えるかは知らんけど
^(?!\+0900$).*

**デフォルトの名無しさん** · 2017/04/21(金) 12:02:05.13

zip版をダウロードしてchmヘルプファイルを見てみたら、
正規表現は本当に基本的なものしか無かった
(?!)はおろか()とかのキャプチャ自体無い（括弧は優先順位が上になるだけ）
[abc-d]もダメ（ ([ab]|[c-d])と分けて書くらしい）
だから、やるなら
^[^+]|^\+$|^\+[^0]|^\+0]$|^\+0[^9]|…と全ての場合を併記するしかないかも

**デフォルトの名無しさん** · 2017/04/21(金) 14:10:39.59

鬼車や鬼雲使わず独自実装なんだね。シェアウェアだからかな
非包含か先読みを使えなきゃ実質無理だと思う
^\+0900$ の方をどうにかする運用を考えた方が良い
Beckyの公式のメーリングリストや掲示板で正規表現じゃなく具体的にやりたい事を質問してみたら？
上手い運用方法を思い付いてくれる人が居るかも

**デフォルトの名無しさん** · 2017/04/21(金) 16:15:06.41

GPLならいざ知らずPCREや鬼車, 鬼雲もBSDライセンスだからなぁ
誰か外部の高機能正規表現ライブラリを利用するプラグインとか作ってそうだけど

**デフォルトの名無しさん** · 2017/04/22(土) 00:09:10.84

>>57
if ≠"+0900" みたいなやり方が1番簡単だけど正規表現だと面倒

≠ や＝にまで拡張した正規表現があればいいんだ

56 · 2017/04/22(土) 01:50:21.67

>>56分かる方いたら教えてください
よろしくお願いします

**デフォルトの名無しさん** · 2017/04/22(土) 04:17:39.78

ほらよ。使い物になるかは知らんが示された対象データにおいては要件を満たす
^(.{,4}|-0900|.{6,})$

量指定子の{}が使えないなら
^(.|..|...|....|-0900|......)$

Beckyの仕様が一般的なPerlの正規表現とは違うならここで聞いても分かるやつ少ないだろうし
後出しする必要が出たらBeckyの方で聞いた方がいいぞ

**デフォルトの名無しさん** · 2017/04/22(土) 17:13:13.21

>>63
+0900のみのデータなんて普通は無いよね
こういうのはJSTとかの時刻の後ろにつくもんじゃないの？
何がしたいのかよく解からないんだが？

フィルタで使うんなら、～が「ある時」「ない時」と選択できるようだから、
「ない時」にチェックすれば君の要件どうりなら、指定は^+0900$でよいことになる（+0900のみがない時ということになるけど）

だけど、上で疑問視したように+0900の前に時刻があるならマッチしなくなるよ

**デフォルトの名無しさん** · 2017/04/22(土) 17:16:27.15

+のエスケープし忘れた（仕様にエスケープはあるよね？）

56 ◆mUjtBupG2M · 2017/04/22(土) 21:58:03.61

レスくださったみなさんありがとうございます
>>58>>60
使えませんでした
>>59
そうなんです、基本的なものしかないのでどうすればいいのか分からず
>>62
ですね
>>64
使い物にならん！
>>65
+0900以外がある時（>>56の求める結果）と+0900がない時だと、前者
じゃないと駄目なんです

自分でなんとか書いてみました
(\-[0-9][0-9]*)|(\+0[0-8][0-9]*)|(\+09[1-9][0-9]+)|(\+[0-9]*[1-9]$)|(\+09[0-9]?[1-9]+[0-9]?)|(\+0900[0-9]+)|(\+090$)|(\+0$)

**デフォルトの名無しさん** · 2017/04/23(日) 02:31:41.68

Beckyって基本的なものとはいえ正規表現使えるのか、いいなぁ
会社で強制使用のOutlookなんか and or しかない上に
検索語を入力中に変なところで勝手にor区切りするわフォーカス外れるわでもうムチャクチャ
仕事で何年も前のメール探すのに絞り込めなくて、最終的には数百通人間grep状態しょっちゅう…

**デフォルトの名無しさん** · 2017/04/23(日) 05:21:48.35

^(\+|-|-0900)(.?|..|...|([1-9].|.[0-8])..|..([1-9].|.[1-9])|.....+)$

**デフォルトの名無しさん** · 2017/04/23(日) 05:33:24.87

^(.|-0900)(.?|..|...|(([1-9]|\D).|.([0-8]|\D))..|..(([1-9]|\D).|.([1-9]|\D))|.....+)$

**デフォルトの名無しさん** · 2017/04/23(日) 05:44:27.04

^(.|-0900)(.?|..|...|([^0].|.[^9])..|..([^0].|.[^0])|.....+)$

**デフォルトの名無しさん** · 2017/04/23(日) 05:52:59.96

^(-0900|.(.?|..|...|([^0].|.[^9])..|..([^0].|.[^0])|.....+))$

**デフォルトの名無しさん** · 2017/04/23(日) 07:11:51.07

^[^+]*$|\+(|0*[0-9]|0*[1-9][0-9]|[1-9][0-9][0-9]|0([1-7][0-9][0-9]|8[0-9][0-9])|0(90[1-9]|9[1-9][0-9])|[1-9][0-9][0-9][0-9]|[0-9][0-9][0-9][0-9][0-9]+)([^0-9]|$)

●入力と結果(✓一致 ❌不一致)
✓ Sat May 24 08:05:44 2014
✓ Tue Mar 28 06:21:47 2017 +
✓ Tue, 26 Jul 2016 23:55:46 -0
✓ Wed, 05 Oct 2016 15:24:09 -0900
✓ Wed, 4 Mar 2015 08:39:08 +09000
✓ Fri, 30 Oct 2015 07:56:41 +00900
✓ Wed, 4 Mar 2015 08:39:08 0900
❌ Wed, 25 Mar 2009 14:18:41 +0900
❌ Tue, 8 Mar 2016 16:11:55 +0900 (JST)
❌ Sat, 24 Jul 2004 03:48:21 +0900<br>

**デフォルトの名無しさん** · 2017/04/23(日) 14:27:49.79

>>68
wanderlust使ってて十分だがmaildirでファイル保存してるのでなんでもありだ

56 ◆mUjtBupG2M · 2017/04/23(日) 22:57:55.33

>>72
質問に忠実な正規表現ありがとうございました

>>73
きゃー素敵！と冗談はさておき
まさに望んでいたものでした、本当にどうもありがとうございました！

**デフォルトの名無しさん** · 2017/04/28(金) 19:19:48.10

正規表現を勉強し始めた者です
>>73の正規表現について2つ質問させて下さい

展開すると以下のようになりますよね
^[^+]*$　　　「+」が無い行に一致。残りは「+」が在る行
(
「+」に数字が続く場合の0～3桁とその先頭に0が続くパターン　※Q1
\+
\+0*[0-9]
\+0*[1-9][0-9]　　　[1-9]なのは0*0[0-9]は0*[0-9]に含まれているから
\+[1-9][0-9][0-9]　　3桁目で0*とすると0900にマッチしてしまう

4桁で「0900以外」のパターン　※Q2
\+0[1-7][0-9][0-9]
\+08[0-9][0-9]
\+090[1-9]
\+09[1-9][0-9]
\+[1-9][0-9][0-9][0-9]

\+[0-9][0-9][0-9][0-9][0-9]+　　5桁以上
)
([^0-9]|$)　　続く文字が数字以外もしくは行末。これが無いと+0900に3桁以下の式でマッチしてしまう

Q1
3桁までの表現に0*としてるのはなぜなのでしょうか？
素人考えには
[0-9]?
[0-9][0-9]
[0-9][0-9][0-9]
で良いのでは？と思うのです。 [0-9]?|[0-9][0-9][0-9]?　これでも0～1桁と2～3桁になりますよね？
「0*」という書き方の方が処理が速くなったりとか何か理由があるのでしょうか？

76 · 2017/04/28(金) 19:24:12.30

Q2
\+0[1-7][0-9][0-9]
\+08[0-9][0-9]
[1-7]なのは00の場合1～3桁の式と被るから1からなのだと思うのですが
この2つは合わせて \+0[1-8][0-9][0-9] としてはダメなのでしょうか？

「0900以外」の4桁の数字のパターンは以下のようになるかと思います
[1-9][0-9][0-9][0-9]　　0xxx
[0-9][0-8][0-9][0-9]　　x9xx
[0-9][0-9][1-9][0-9]　　xx0x
[0-9][0-9][0-9][1-9]　　xxx0

被っているところを数値に置き換え
[1-9][0-9][0-9][0-9]
0　　[0-8][0-9][0-9]
0　　9　　[1-9][0-9]
0　　9　　0　　[1-9]

一応Q1と合わせ疑問に思ったところを書き換えて>>73さんのサンプルと+0～+10000と+0000～+9999をテキストに書き出して
テストしてみたところ問題無さそうなのを確認したのですがそれでも確信が持てず質問させて頂きました
試した式は以下になります
^[^+]*$|\+([0-9]?|[0-9][0-9]|[0-9][0-9][0-9]|[1-9][0-9][0-9][0-9]|0[0-8][0-9][0-9]|09[1-9][0-9]|090[1-9]|[0-9][0-9][0-9][0-9][0-9]+)([^0-9]|$)
^[^+]*$|\+((|[0-9][0-9])[0-9]?|([1-9][0-9]|0[0-8])[0-9][0-9]|09([1-9][0-9]|0[1-9])|[0-9][0-9][0-9][0-9][0-9]+)([^0-9]|$)
^[^+]*$|\+(|090[1-9]|((([0-9][0-9]+|(|[1-9]))[0-9]|(|0[0-8]))[0-9]|(|09[1-9]))[0-9])([^0-9]|$)

身近に聞ける人が居ないので自分の解釈が間違っていたり何か見落としているのではないか？と悶々としております
どなたか分かる方が居られましたら2つの疑問点の回答をお願いしたいです
また解釈を間違えている箇所がありましたらそちらも指摘下さい。よろしくお願いします

**デフォルトの名無しさん** · 2017/04/29(土) 18:45:01.61

>>76-77
どちらも深い意味はないよ
行き当たりばったりで何とかテストに通るようにしただけだから

> 3桁までの表現に0*としてるのはなぜなのでしょうか？

コメント付けてくれた通りまさしく「0～3桁とその先頭に0が続くパターン」
という順序で考えてたから結果的にそうなったのだと思う
まず0から999に一致するパターンを書いて、それに 0 が先行する場合 0* を足して
でも 0900 には一致しないように… とかそんな感じ

> この2つは合わせて \+0[1-8][0-9][0-9] としてはダメなのでしょうか？

ダメじゃない
その辺りはこのジェネレーターで生成した正規表現をもとにしてる

Regex Numeric Range Generator
http://gamon.webfactional.com/regexnumericrangegenerator/
100–899 ⇒ ([1-7][0-9]{2}|8[0-8][0-9]|89[0-9])

たまたま 8[0-8][0-9] と 89[0-9] がまとめられると気がついたのでそこは直したけど
全部まとめられるとは気づいてなかっただけ

**デフォルトの名無しさん** · 2017/04/30(日) 00:11:00.00

>>78
回答ありがとうございます
つい先日覚え始めた身ながらも>>73さんの式に感銘を受け是非とも理解したく思い
分からない事だらけの中、自分であれこれ分解したり試したりしていたのですが
疑問に思った点を自力で晴らす事が出来ず質問させて頂きました
未熟故に不理解な部分があるのではないかと思っておりましたが
「どちらも深い意味はない」との事で少々肩透かしでしたが安心しました
無知故に身構え過ぎていたようです
作成の経緯や方法まで丁寧に説明して頂きありがとうございました
今後の参考にさせて頂きます。感謝！

**デフォルトの名無しさん** · 2017/04/30(日) 03:04:48.91

慇懃無礼でうぜえ

**デフォルトの名無しさん** · 2017/04/30(日) 04:34:43.13

>>80
確かに邪魔だけど、おこるほどじゃない

**デフォルトの名無しさん** · 2017/04/30(日) 07:25:58.21

>>80
それも少し思ったんだが重箱の隅をつついてると受け取られ答えてもらえないんじゃないかとか色々悩んだ末出来るだけ丁寧にとこうなった
もし次があったら気を付ける。すまんかったな

**デフォルトの名無しさん** · 2017/04/30(日) 07:50:01.45

丁寧な方がいいに決まってる
>>80はバカだから長文がウザいことに気付かず
丁寧語がウザいと的外れな指摘をしている。

**デフォルトの名無しさん** · 2017/04/30(日) 08:21:18.33

>>83
自分を非難している相手を擁護するのは変な感じだが
バカかどうかはあの一文からは分からないでしょ
それに自分も慇懃無礼にあたらないかとは危惧していたし的外れとは言えないと思う
何でも度が過ぎるのは良くない
だが齟齬を生じさせないようにする為にはこういったスレで長文になるのは仕方なくないか？
身の丈に合わない質問して「この解釈で合ってる？」みたいな聞き方した自分にも非があるとは思うが
バカ丁寧禁止より長文禁止の方が厳しいと思うわ

**デフォルトの名無しさん** · 2017/04/30(日) 09:47:52.98

正規表現で数字は、[0-9] または、\d

[0-9][0-9] なら、\d{2} と同じ

**デフォルトの名無しさん** · 2017/04/30(日) 12:18:27.09

丁寧なことが必ずしも良いとは限らない
質問するときは相手のことも考えて無駄を省くことが大事
質問を整理している間に自分で気付くこともある

**デフォルトの名無しさん** · 2017/04/30(日) 15:52:39.90

>>84
＞バカ丁寧禁止より長文禁止の方が厳しいと思うわ
読む側は馬鹿丁寧な長文＝好感が持てる、長文でも許せる
丁寧でないけど長文＝丁寧でない癖に長文だとぉ～？！許せん
ってなる

**デフォルトの名無しさん** · 2017/04/30(日) 20:35:41.23

お前ら仲良くしろ

**デフォルトの名無しさん** · 2017/05/01(月) 09:32:05.11

長文NGしてれば見なくて済むのにわざわざ見てウゼェ言ってる奴って
マゾなの？やり方分かんないバカなの？ウゼェ言ってる俺カッケーな池沼？

**デフォルトの名無しさん** · 2017/05/01(月) 11:29:31.86

３行でまとめろ

**デフォルトの名無しさん** · 2017/05/01(月) 18:42:02.68

ダ・ヴィンチ曰く「単純であることは究極の洗練だ」
今回の例にどれほど当てはまるかはわからんが、目指すのはそこだ。

**デフォルトの名無しさん** · 2017/05/03(水) 15:46:12.05

検索置換を教えて下さい。
行末の半角数字（桁数はまちまち）を行頭に移動したいです。
──────────────
■置換前■

abc1
東44
4-123
あいうえお02
──────────────
■置換後■

1abc
44東
1234-
02あいうえお
──────────────
使ってるエディタはgpadです。サクラエディタもあります。宜しくお願い致します。

**デフォルトの名無しさん** · 2017/05/03(水) 16:08:53.89

>>92
gpadやサクラエディタは知らんけどJSならこんな感じ

replace(/(.*?)([0-9]*)¥n/g, "$2$1¥n")

最後の行にも改行がある前提
なければ入力の最後を示す$をOR条件として指定する

**デフォルトの名無しさん** · 2017/05/03(水) 17:09:36.61

>>93
ありがとうございます。レスをいただき申し訳ないのですが、
最初に書いているようにテキストエディタでできる検索置換を教えて頂きたいのです。

**デフォルトの名無しさん** · 2017/05/03(水) 17:53:10.90

>>94
gpad の[検索]-[置換]で
検索文字列　^(.*\D)(\d+)
置換文字列 $2$1
とかかな

**デフォルトの名無しさん** · 2017/05/03(水) 18:09:12.54

>>95
すごいできます！即レスありがとうございました！感謝です！

**デフォルトの名無しさん** · 2017/05/04(木) 02:53:36.15

●Regular Expressionの使用環境
Bash on Ubuntu on Windows での sed

●検索か置換か？
置換

●説明
[ と ] で括られた最初の文言以外を削除したい

●対象データ
aaa[bbb]ccc
[ddd]eee
fff[ggg]hhh[iii]jjj
kkk

●希望する結果
bbb
ddd
ggg
空行、もしくは、そのまま（上記だとkkk）

cat hoge.txt | sed -e 's/.*$\[.*]$/\1/g'

で行けそうな気がしたんですが、結果は
[bbb]ccc
[ddd]eee
[iii]jjj
kkk
この有様。誰か助けてください。

**デフォルトの名無しさん** · 2017/05/04(木) 03:21:35.65

>>97
s/\].*\|.*\[//g

**デフォルトの名無しさん** · 2017/05/04(木) 03:22:48.12

cat test.txt | sed -E 's/[^\[]*(\[[^\[]*\]).*/\1/g'

sedはnon-greedyサポートしてないので[^\[]*で
"["以外の文字にマッチするように指定する

**デフォルトの名無しさん** · 2017/05/04(木) 10:29:51.92

>>98
cat hoge.txt | sed -e 's/\].*\|.*\[//g'
これだと３行目が２つ目の [ ] のを拾ってしまった。

bbb
ddd
iii
kkk

>>99
cat hoge.txt | sed -E 's/[^\[]*(\[[^\[]*\]).*/\1/g'

[bbb]
[ddd]
[ggg]
kkk

狙い通りのが拾えました。[ ] が付いてくるけどそれは自分で外します。
どうもありがとうございました。

**デフォルトの名無しさん** · 2017/05/05(金) 08:29:26.53

「Regular Expression」ってことは
RegularじゃないExpressionもあるのかな？

**デフォルトの名無しさん** · 2017/05/05(金) 11:21:47.47

>>101
https://www.google.co.jp/search?q=irregular+expression&;ie=UTF-8&oe=UTF-8&hl=ja-jp&client=safari

**デフォルトの名無しさん** · 2017/05/05(金) 13:41:26.64

＞「irregular expression」に関連するキーワード
＞
＞保守速報

ワロタ

**デフォルトの名無しさん** · 2017/05/07(日) 03:23:46.82

>>101
正規表現で表される集合の標本それぞれが正規でない表現じゃないの

**デフォルトの名無しさん** · 2017/05/07(日) 07:31:07.21

そもそも誤訳だし

**101** · 2017/05/07(日) 16:34:35.27

>>104
なるほどおおおおぉぉぉ！！！
合点がいきまくりんぐです。ありがとうございます！

**デフォルトの名無しさん** · 2017/05/13(土) 23:19:52.64

書き込めない？

**デフォルトの名無しさん** · 2017/05/14(日) 17:21:45.80

●Regular Expressionの使用環境
サクラエディタ

●検索か置換か？
検索

●説明
「ABC」の英大文字と小文字を区別せずに検索したいのですが
書き方はあるのでしょうか？
今は『abc|Abc|ABC』という正規表現を使っていますが
書くのがめんどうだし、aBcやabCにもヒットさせたいので
もっと簡潔な書き方があれば教えて下さい。

**デフォルトの名無しさん** · 2017/05/14(日) 18:29:13.61

>>108
(?i:ABC)
で行けるんではなかろうか

**デフォルトの名無しさん** · 2017/05/14(日) 18:30:36.34

そのものズバリのチェックボックスがあるのに釣りかメクラか

**デフォルトの名無しさん** · 2017/05/14(日) 20:19:12.83

>>110
すみません、実はJaneStyleなど複数の環境で正規表現を使っていて、一番よく使うサクラエディタを例に出してしまいました。
確かにサクラエディタだと「英大文字と小文字を区別する」ってチェックがありますよね・・・

>>109
ありがとうございます！バッチリいけました。＞＜

**デフォルトの名無しさん** · 2017/05/27(土) 19:51:02.34

●Regular Expressionの使用環境
テキストエディタMeryでの強調文字列指定について質問です
http://www.haijin-boys.com/
Onigmo (Oniguruma-mod) (regular expression library) 5.15.0
https://github.com/k-takata/Onigmo

●検索か置換か？
検索？

●対象データ
"D:\PATH\HOGE",1,307,,0,"15/01/01 00:00:00","12/12/31 00:00:00",1,1,,,,"著者X",,,,,"タイトルA",,,2,,,,,1,1101,1101
"D:\PATH\FUGA",,,,,,"15/02/01 00:00:00",1,1,,,,,,,,,"名前B",4,,0
"E:\FOLDER\PIYO",20,197,91,0,"16/03/01 00:00:00","15/04/01 00:00:00",1,1,,,,"著者Y,Z","出版社",,,,"題名C"

●希望する結果
上のようなテキスト各行の最後に出現するダブルクォーテーション囲いの文字列
"タイトルA"
"名前B"
"題名C"
を取得して強調表示したいのですがどのような正規表現で記述すればよいのでしょうか？
あるいはダブルクォーテーションを含まない状態（タイトルA、名前B、題名C）でも差し支えありません

●説明？
・各行でカンマや "" 囲いの数はまちまちで、"" 囲いの中にカンマがある場合もあります
・"" 囲いの中のカンマを無視した場合、17番目のカンマの直後の "" 囲い部分です
・"タイトルA"、"名前B"、"題名C"のあとに続く文字列の長さ、形式は不定です
・対照データはマンガミーヤのブックリストです

よろしくお願いします

**デフォルトの名無しさん** · 2017/05/28(日) 06:04:53.01

"[^"]*"(?=[^"]*$)
(?<=")[^"]*(?="[^"]*$)

**112** · 2017/05/28(日) 07:52:06.42

>>113
両方のパターンを教えていただきまして、ありがとうございます

"フォルダパス" の "[A-Z]:\\.+?" と "年/月/日時:分:秒 "の "../.+?"
タイトルフィールドだけは全/半スペースで字下げして "[ 　]+.+?" というパターンまでは作れましたが
字下げなしで強調表示できるようになり、一層見分けやすく、編集しやすくなりました

なぜこれらが最後の "タイトル" 部分にマッチするのか、まだ理解できてはいないのですが
読み解けるように頑張ってみます

**112** · 2017/05/28(日) 11:31:39.10

先読みと後読みの使い方をなんとなく理解できるようになったかも？という感じで、自分で同じ表現をすぐに導き出せるかとなるとまだまだ難しそうです

調子にのって後読みで12番目のカンマの後ろの "著者" にマッチさせようとやってみましたが、繰り返し表現をふくむ後読みはダメだとか…
^".+?"([^,]*,){12}".+?" で「行頭から"著者"まで」はできても ^(?<=".+?"([^,]*,){12})".+?" では機能しないんですね
あれこれ弄り回して "タイトル" からカンマ５つ戻るかたちで先読みにして "[^"]*"(?=(,[^,]*){5}"[^"]*"(?=[^"]*$)) にしたら "著者" に
同様に {4} で "出版社" にマッチしました

おかげさまで色々と勉強になり、あらためてありがとうございました

**デフォルトの名無しさん** · 2017/05/28(日) 12:13:46.77

こんな古代呪文みたいなの、実際に仕事とかで使ってないとなかなか覚えないし
覚えてもすぐ忘れてしまうよなｗ
全てのパターンを記憶して空で完全詠唱できる人なんているんだろうか？

**デフォルトの名無しさん** · 2017/05/28(日) 13:15:52.74

暗唱できる必要性があるのか？
使うときにそういうのがあったなあって思う出すだけでいいだろ
あとは詳細を見て使えばいいだけ

**デフォルトの名無しさん** · 2017/05/28(日) 13:26:02.06

仕事じゃなく趣味で覚えたけど
間違いなく覚えた方が便利

どっかに正規表現化してるだけでお金貰える仕事ないかな

**デフォルトの名無しさん** · 2017/05/28(日) 15:27:00.29

>>116
わたしレベルになると詠唱破棄すら可能ｗ

**デフォルトの名無しさん** · 2017/05/28(日) 16:06:45.06

言語環境ごとに使える使えない、エスケープ必要不必要を間違えたりする
サポートしてない環境の多い先読みとかは他の手段使っちゃったりするからなかなか使いこなせない

**デフォルトの名無しさん** · 2017/05/28(日) 16:10:29.49

$1 と \1 を間違えて泣きをみて以来、むしろ記憶しないようにしている……・

**デフォルトの名無しさん** · 2017/05/28(日) 16:18:27.70

perlから初めるとカタワになるな

**デフォルトの名無しさん** · 2017/05/29(月) 08:14:03.69

えっ！？

**デフォルトの名無しさん** · 2017/05/29(月) 11:05:33.03

コマンドプロンプトのfindstrコマンドで使えるやつより貧弱な正規表現環境なんてないよね？

**デフォルトの名無しさん** · 2017/05/29(月) 11:21:53.73

http://imgur.com/a/Yk1JN

**デフォルトの名無しさん** · 2017/05/29(月) 11:24:10.17

貼り間違えた
http://i.imgur.com/CTLs1wr.jpg

**デフォルトの名無しさん** · 2017/05/29(月) 21:58:39.79

>>124
おれの彼女の胸

**デフォルトの名無しさん** · 2017/05/30(火) 13:16:32.07

>>118
とある地方の区画整理の際、住所表記が変わるので
住所を正規化するために正規表現と簡単なDB処理とを組み合わせた
単純な処理を行うだけの1日仕事で、
そこらのリーマンの3ヶ月分ぐらいお金になった事とかあったな

仕事柄色んな会社を訪問するけど
テキストの簡単な置換すらできない（まずテキスト置換という概念を知らない）人って
事務程度でしかパソコン使わない人にはめちゃくちゃ多いんだよね

そんなに人達に (.+)abcd\n みたいな初歩的な正規表現を教えると
物凄く驚かれる

見下すようだけど世の中そんなもん

**デフォルトの名無しさん** · 2017/05/30(火) 17:50:42.66

>>128
まぁハードル高いよね、低くないと言うべきか

知らなきゃ「正規表現」というチェックボックスがあっても、それが何をするものなのか
言葉から具体的イメージが全く湧かないし
ヘルプ見てはじめて何をするものなのかわかるという、といっても具体例が
無ければヘルプ見たところで「難しそう＞便利そう」になりがち
一目で「難しそう＜便利そう」になるならとっくに正規表現を使ってる層だろうし

ファイルの検索や excel や word やメモ帳、IE、Edge あたりに正規表現が
最初っからあれば話は違ってくるんだろうなと

Mac触った事ないからアレだけど、Macなら充実してるのかしら？

**デフォルトの名無しさん** · 2017/05/30(火) 22:14:32.37

>>129
システム屋やってる人間からしても正規表現って見るからにとっつきにくそうだもんな。
システム会社なのに知らない人間の方が多いというｗ

**デフォルトの名無しさん** · 2017/05/30(火) 22:28:36.41

>>130
えー
プログラム組む人種なら例外なく好物だと思ってたんだが(^^;;

**デフォルトの名無しさん** · 2017/05/31(水) 02:32:02.26

システム屋とかシステム会社って何のシステム？

**デフォルトの名無しさん** · 2017/05/31(水) 05:29:32.86

使い捨てコードといったらPerlで書いてた世代は正規表現に抵抗無さそう

**デフォルトの名無しさん** · 2017/05/31(水) 05:30:03.72

>>131
VBとかでポチポチやってる人は嫌いそう
GUIで書けるいいツールがあったら広まるかもね

**デフォルトの名無しさん** · 2017/05/31(水) 08:06:38.95

小さな会社だと他より少しPC関連に詳しいってだけでIT部長とか言われこき使われる
勿論そんな役職なんて無い
正規表現なんて言葉を発したらセクハラだの変態だの言われかねん

**デフォルトの名無しさん** · 2017/05/31(水) 11:16:23.49

>>135
正規表現で置換
とか知らない人が聞いたらアレだもんなｗ

>>133
正にその世代だけど
昔のperlは正規表現抜きでも変態記法満載だったから
だんだん昔のコードは読めない人が増えてきてる

$line =~ s/(?:\x0D\x0A|[\x0D\x0A])?$/,/;
@values = map {/^"(.*)"$/s ? scalar($_ = $1, s/""/"/g, $_) : $_}
10年ぐらい前のメモからのコピペだけど見ただけで目眩がするｗ

**デフォルトの名無しさん** · 2017/05/31(水) 11:27:09.17

>>132
一概にシステムといっても色々あるからね

機器制御系システムなんかだと正規表現を使う機会なんてまず無いだろうし
WEB系の事やってるなら何だかんだで正規表現を使う機会はそこそこあるだろうし

**デフォルトの名無しさん** · 2017/05/31(水) 11:46:52.88

CSV は、" などのエスケープについて、様々な方言があるから、正規表現では無理。
CSV の方言・規格を確定させてから、Ruby を使うべき

バグのほとんどが設計段階・仕様で生じる。
方言さえ確定していれば、バグらない

**デフォルトの名無しさん** · 2017/05/31(水) 11:53:36.36

>>135
会社の忘年会では正規表現やりますって言ってパンツ脱ぐのか？

**デフォルトの名無しさん** · 2017/05/31(水) 12:15:57.63

>>138
仕事内容にもよるけどそんな事はない
なんせ世の中にはExcelのデータが糞ほどあるので
「Excelルールのcsvを正規表現で処理する＋α」の仕事だけでも
たぶんそこらのリーマンよりは稼がせてもらってきたよ

日本の企業の大半は中小企業なわけだけど
ほんと信じられないほど無駄な事やってる会社がたくさんあるからね
こんな時間に2chなんてやってられるのも、そのお陰ですわ

**デフォルトの名無しさん** · 2017/05/31(水) 12:35:12.54

万能な処理って得てして使いにくいしな

**デフォルトの名無しさん** · 2017/05/31(水) 12:44:32.50

>>138
Rubyを使うべき、と言う唐突な結論以外は同意できる。
Ruby （のようなスクリプト）を使うべきなら完全に同意できたのに。

**デフォルトの名無しさん** · 2017/05/31(水) 16:04:23.05

>>142
少し日本語は下手だが、
事前にCSV の方言・規格を確定すべし
という主張と読んだ。

**デフォルトの名無しさん** · 2017/05/31(水) 17:04:05.88

なぜrubyなのかよく分からん
多少正規表現エンジンの種類やバージョンの違いはあれど
正規表現はperlでもPHPでもJavaScriptでもPythonでも使えるし
rubyの正規表現なんて昔はコールバック処理するのがくそ面倒だった筈だが

**デフォルトの名無しさん** · 2017/05/31(水) 17:10:42.06

正規表現を使わずにrubyでやれと言いたいのでは
まあ確かにrubyは標準で簡単強力なcsv処理ができるけど
ruby以外でのcsvの処理の仕方を知らない知識不足な人の戯言にしか見えない

**デフォルトの名無しさん** · 2017/05/31(水) 17:29:50.80

excelでも正規表現使えるけどな

**デフォルトの名無しさん** · 2017/05/31(水) 17:55:47.82

>>144
たぶんrubyのような言語と言いたかったのだと推察致しまする

**デフォルトの名無しさん** · 2017/06/01(木) 04:08:09.64

>>134
VB（今時は.NET）では入力チェックとかでよく使うからお前の偏見だよ。

**デフォルトの名無しさん** · 2017/06/01(木) 04:08:53.15

>>134
いい忘れたがサクラのマクロもよく使う。

**デフォルトの名無しさん** · 2017/06/01(木) 05:13:28.59

>>148
VBやってるやつが皆そうやってると思うか?
それこそ偏見だ

**デフォルトの名無しさん** · 2017/06/01(木) 05:24:23.62

>>149
お前個人の話かよ

**デフォルトの名無しさん** · 2017/06/01(木) 05:39:57.85

そもそもテキスト処理じゃないと使わんよ
使う使う言う奴はプログラミングの分野が偏ってるんじゃないか？

**デフォルトの名無しさん** · 2017/06/01(木) 06:10:29.36

エンドユーザーに近い分野で使うというより、開発者が使うものでしょ。SQLとかと同じ。

**デフォルトの名無しさん** · 2017/06/01(木) 08:16:36.86

>>153
そりゃプログラムから使うものだから開発者しか使わんよ
そう言う意味じゃなくて利用者が入力した値の妥当性確認とかに使うケースが多いんじゃね？
って話なんだろ

**デフォルトの名無しさん** · 2017/06/01(木) 09:37:01.51

>>148
これが偏見な

**デフォルトの名無しさん** · 2017/06/01(木) 10:35:10.56

エマ中尉の盾になって死んだ人？