awkについて語るスレ $2
■ このスレッドは過去ログ倉庫に格納されています
腐っても鯛? 騏も老いては駑馬に劣る? 三人の碩学が生み出したスクリプト言語AWKについて語るスレ ◆ 前スレ awkについて語るスレ http://pc10.2ch.net/test/read.cgi/tech/1023556171/ ◆ 関係スレ シェルスクリプト相談室 http://pc10.2ch.net/test/read.cgi/tech/1112553783/ AWKでCGI http://pc10.2ch.net/test/read.cgi/php/1171804314/ 【sed】シェルスクリプト総合@LINUX Part2【awk】 http://pc10.2ch.net/test/read.cgi/linux/1154578200/ ◆ 参考 The AWK Programming Language (Brian Kernighan): ttp://cm.bell-labs.com/cm/cs/awkbook/index.html GAWK (GNU Projedt): ttp://www.gnu.org/software/gawk/ 生きていることを願って質問を。 WIN32のEXE一つで、下のTEST.AWKがマトモに動くAWKを探しています。 これら以外にありますか? http://hinadori.atnifty.com/ ~wills/program/gawkm115.zip http://my.vector.co.jp/servlet/System.FileDownload/download/http/0/376460/pack/win95/util/text/awk/gawk-mbcs-win32-20051223.zip?ds http://my.vector.co.jp/servlet/System.FileDownload/download/http/0/80308/pack/win95/util/text/awk/mw32r27.lzh?ds Cygwin版も試したのですがダメでした。 TEST.AWK { gsub("[0-9]","x",$0) ; gsub("ソ","ソ",$0) ; gsub("T","T",$0) ; print } TEST.DAT アイウエオカキクケコサシスセソ ココココサフサコココココ ココココサフサココココ ココココサフサコココココ ココココサフサコココココ サフサフサフサフサフサ ココココサフサコココココ ココココサフサココココ ココココサフサコココココ ココココサフサコココココ サフサフサフサフサフサ TEST.DATは、空白が入っています。 専ブラのポップアップをコピペして下さい。 >>627 −628 cygwinのawk(GNU Awk 3.1.8)で動くけど、どうなるはずがどう動かないと言っている? >627のtest.datなら、当然「ソ」だけが変換されるけど。 (CygwinならUTF8じゃないとうまく動かないけど)Shift JISで動作させたいってことかな? 事前にTEST.DATをnkf -wに通したら駄目かな。 >>627 スクリプトもDATもSJISで試したけど、上記3つのうち、gawk-mbcs-win32-20051223.zipはダメだったよ。 1行目がこんなんなる。 アxxエオカキクxコサxxxソ 手持ちの GNU Awk 3.1.7(windows special Nov 24 2009) で、--ctype=SJISやっても同じ結果になるね。 スクリプト、DATをUTF-8にして、--ctype=UTF8やってリダイレクトしたファイルは正常な結果が出るよ。 リダイレクトしないでコマンドプロンプトに表示させると化けるけど。 gawkはガンガン機能を拡張してるけど、 そろそろOOP対応してくれないかな。 awk++とかあるけど、標準でOOPできれは便利。 > OOP ...もはやawkでやる意味が無いw 他にいくらでもある別の言語でいいじゃん awkに在ると便利かもと思うのは参照値くらいかな 配列や関数への参照を値として取り出し格納したり 逆にその値から元の配列にアクセスしたり元の関数を呼んだり出来ると 相当に複雑なデータ構造が表現可能になる、それこそOOPっぽいことも可能だし でもあんまりややこしいことやるならPerlでいいから必須ではないね > 関数を呼んだり 変数の値を関数名として var = "sage"; @var(); ってできるけど、それとは違うのん? およ、もうあるのかw 最近のawkは分からねえ…ってことは、配列への参照を使って入れ子の配列とか既に作れちゃったりするのか? class human { property name property sex property age method new(x, y, z) { name = x sex = y age = z } method say() { printf("私は%s。%d歳の%sです。\n",name, age, sex) } } class japanese : human { property name property sex property age method say() { printf("私は%s。%d歳の%sです。国籍は日本です。\n", name, age, sex) } } BEGIN { alice = human.new("アリス", "女", 11) taro = japanese.new("太郎", "男", 15) yuka = japanese.new("由佳", "女", 18) alice.say() taro.say() yuka.say() } >>635 http://code.google.com/p/lawker/source/browse/fridge/lib/bash/awk%2B%2B/ これを使えばこの程度のOOPはどうにかできる。 本当にこの程度でいいからOOPに対応してほしい。 使う人はほとんどいないと思うが、全くできないのも困る。 function Human(self,name,sex,age) { self["property___name"] = name self["property___sex"] = sex self["property___age"] = age self["method___say"] = "Human___say" } function Human___say(self) { printf "私は%s。%d歳の%sです。\n", self["property___name"], self["property___age"], self["property___sex"] } function Japanese(self,name,sex,age) { Human(self,name,sex,age) self["method___say"] = "Japanese___say" } function Japanese___say(self) { printf "私は%s。%d歳の%sです。国籍は日本です。\n", self["property___name"], self["property___age"], self["property___gender"] } function methodcall(obj,methodname, m) { m = obj["method___" methodname] @m(obj) } BEGIN { Human(alice, "アリス", "女", 11) Japanese(taro, "太郎", "男", 15) Japanese(yuka, "由佳", "女", 18) methodcall(alice,"say") methodcall(taro,"say") methodcall(yuka,"say") } ごめん一部genderになってるからsexに直しといて とりあえず、こんな感じでgawk4でもOOP自体は出来るよって話 >>644 なるほどねー とても勉強になります でも、やっぱりOOP用の構文が使えればベストですね そのほうがわかりやすいと思います 本当に欲しいんなら、gawkのMLにこうすればOOP実現できることを発見したんだけど、 これの糖衣構文を用意してくれって投稿するといいんじゃね switchも実装されてるし、欲しい人が居ると分かれば付けてくれるかもよ #! /usr/bin/env python # -*- coding: utf-8 -*- class human: def __init__(self, name, sex, age): self.name = name self.sex = sex self.age = age def say(self): print("私は" + self.name + "。" + str(self.age) + "歳の" + self.sex + "です。") class japanese(human): def __init(self): super(human, self).__init__(self) def say(self): print("私は" + self.name + "。" + str(self.age) + "歳の" + self.sex + "です。国籍は日本です。") if __name__ == "__main__": alice = human("アリス", "女", 11) taro = japanese("太郎", "男", 15) yuka = japanese("由佳", "女", 18) alice.say() taro.say() yuka.say() pythonで書いてみると、 >>641 と比べると特にわかりやすいわけでもないけど >>644 よりはわかりやすい そりゃawkはOOPLではないからな あくまでシェルのお供でいいと思うんだ そしてそこに高度なOOP機能は要るとは思えない どちらかと言えばフィールド抽出とかをもっと便利にすべきだよ cygwin以外でgawk4.0をwindowsで使おうと思ったら、バイナリはどこで入手できもうすかね? cygwin で駄目な理由が分からないから教えられない。 >654 さんくすこ >653 awkの実行形式だけ入手すれば良いようにしたいのさ。 バイナリ互換のWindowsなのに、cygwinてexeをもってくだけじゃ使えないの? 物によっては使えたような気がする。 cygwin1.dllだっけ?にパスが通ってれば大体使えたような気がする。 教えてください。英語得意な人 http://www.gnu.org/s/gawk/manual/gawk.html#Array-Sorting-Functions の asort(), asorti()で使うユーザー定義の比較関数について 3番目の引数とPROCINFO["sorted_in"]に設定するのと違うのか同じなのか? それと http://www.gnu.org/s/gawk/manual/gawk.html#String-Functions に書いてある3番目の引数の説明("descending"とか)が両立してんの? http://www.gnu.org/s/gawk/manual/gawk.html#Array-Sorting-Functions As with PROCINFO["sorted_in"], this argument may be the name of a user-defined function, .... http://www.gnu.org/s/gawk/manual/gawk.html#String-Functions The third argument can also be a user-defined function name .... 第三引数の値と同名の関数が定義済みならそれを利用するとか、 そういう方法で区別してるんじゃないの >>659 比較関数の与え方はPROCINFO["sorted_in"]の場合と同じってことだろ。 自分で定義した関数の名前でもいいし、11.2.1.2に書いてあるようにすでに用意 されている@〜を使ってもいい。 個人的には、GAWKにはあと、Cで書いた関数の呼び出しというか GAWKで呼ぶ関数をCで書ける機能が欲しいと思ってるんだけど、 ここ見る限り世間的にはあんまり需要ないんかねぇ。 まぁ、それやるくらいならGAWK自体に変更を加えて再コンパイルしろってことかもしれないけど。 >>662 ttp://www.gnu.org/s/gawk/manual/html_node/Dynamic-Extensions.html じゃダメ?将来的にさらに拡張される可能性はあるみたいだけど 最近awkcardを知って座右に置いてるのだが、日本語版って存在するのだろうか。 ttp://gauc.no-ip.org/awk-users-jp/blis.cgi/DoukakuAWK_271 ここに書いてある通りにしても日本語に翻訳されません どうしてですか? 環境は LinuxMint12 、 GNU Awk 3.1.8 です >>666 その通りにやったと言うのなら、何故poファイルを提示しないのかね、ダミアン君。 >>667 poは作成しましたし、moも所定のディレクトリにあります。 poは自分で編集しても、そのサイトの内容をコピペしてもダメでした。 $ cat gettext.po #: gettext.awk:10 msgid "********** Count Prime Number **********" msgstr "========== 素数を数える ==========" #: gettext.awk:14 msgid "2 is a prime number." msgstr "2 は素数です。" #: gettext.awk:24 msgid "%d is a prime number.\n" "" msgstr "%d は素数です。\n" $ ls ja_JP/LC_MESSAGES/ gettext.mo 結果はこの通りです。 $ LC_ALL=ja_JP gawk -f gettext.awk 10 ********** Count Prime Number ********** 2 is a prime number. 3 is a prime number. 5 is a prime number. 7 is a prime number. ずいぶんawkから離れていて久しぶりに使ったら nawkに日本語のバグがあることにしばらく気づかなかった substr()でutf-8のテキストを切り出すとおかしな値になる gawkでは直っている ttp://blog.livedoor.jp/corbie/archives/cat_94960.html 残念ながら、シフトJIS、UTF-8両方で正常に動作しそうなWindows版gawkは候補の中にありませんでした。 ファイル名が"*.txt"の一覧を取得するとき、"\.txt"でマッチさせると、任意の一文字.(ドット)と解釈されてしまうんですが、いい方法無いでしょうか? GNU Awk 3.1.7だとドットにマッチしたけどそもそもawkの話? 具体的にコマンドがほしいな 昭和の頃覚えたアセンブラとC言語 これがあったから いまだに自分が損な業界で飯を食ってる >>676 そこからjavaに行ってスマホアプリ開発ならもう一花咲いたかもしれませんねw >>675 ls | awk '{ if( match($0,"\.txt") > 0) print $0 }' ↑会社のサーバ上でこんな感じのことやろうとしてたんですが、 「gawk: 警告: エスケープシーケンス `\.' は `.' と同等に扱われます」 とメッセージが出力され、ドットが任意の一文字?と解釈されて困っていましたが、 自己解決しました。(自宅のLinuxPCで動作確認しました。GAWK3.1.7及び4.0.1) "\.txt"では無くて、".txt"で良かったんですね。 お騒がせしました。 もしかしたら、会社のサーバ(RHEL)のGAWKが古くて解決できてないかもしれませんが。 >>679 match() の第二引数に文字列を与えた場合は事前に正規表現への型変換が行われるが、 その際にエスケープが外れて /.txt/ と同等になってしまう、 ということかと。 つまり "\\.txt" とするか、 正規表現の /\.txt/ を与えればよい。 The GNU Awk User's Guide にもこの現象についての説明はあるが、 ~ !~ 演算子についてしか触れられていない。 ttp://www.kt.rim.or.jp/~kbk/gawk-30/gawk_5.html#SEC32 FIFOな感じの先入れ先出しのバッファには何使えばいい? というか、 Arrayで、たとえばA[3] からA[8]までのデータをA[1]からA[6]に動かすには何が一番早い? できれば配列は1つしか使いたくないのだが、無理だろうか… 速さを求めるなら毎度全要素ずらすより、読み出し位置と書き込み位置の添字持って 管理した方がたいてい速い >>682 BEGIN{ QMAX=3 QTopPos=0;QTailPos=0;QNum=0; deQ(); enQ("1");deQ(); enQ("a");enQ("b");enQ("c");enQ("x");deQ();deQ();deQ();deQ(); } function enQ(PushVal){ if (QNum+1 > QMAX){print "おなかいっぱい"; return;} nextPos = (QTopPos+1) % QMAX; queue[QTopPos] = PushVal; QTopPos=nextPosQNum++; } function deQ(){ if (QNum < 1){print "からっぽ"; return} QNum--; TailVal=queue[QTailPos] QTailPos = (QTailPos +1) % QMAX; print TailVal; return TailVal; } ↑の結果はこんな感じ。 >からっぽ >1 >おなかいっぱい >a >b >c >からっぽ >>685 の書いているリングバッファ実装です。 enqueue,dequeue回数が多いならリングバッファで良いと思う。 大抵の場合はQMAXに大きな値を設定すれば事足りるハズだけど 上限が決定できない等の事情があればdelete arrayを使った単純な配列管理かな。 ただ添え字が数値上限を超えない様な工夫は必要だね。 リングでも上限を定めると入力ストリームの上限が不明な場合まずいことになるので、現在は A=入力Array,C一時保管,i,k,n,p k=1;C[0]=0; for(i=1;i<=A[0];i++){n=0;while(k<i && A[k++]=C[n+=1]);if(n){ delete C[C[0]+1];C[0]-=n;p=0;while(C[p+=1]=C[n+=1]);}p=1; while(match(substr(A[i],p),re)){p+=RSTART-1;n=substr(A[i],p,RLENGTH); if(k<i){A[k++]=n;}else{C[C[0]+=1]=n;};p+=RLENGTH;}};n=1; while(A[k++]=C[n]){delete C[n++];};A[0]+=C[0]-1;C[0]=0; を使っている。 re=regexpとして、Array Aに一致するデータがあれぼそれを取得、結果をArray Aに出力、A[0]に合計が記載。 これ以上(コードサイズ、ある程度の速度、メモリの使用量を極力少なく)という条件で最適化できるだろうか… だれか頼む。 入力と出力先が同じでも、別でも作動するコードなら尚のこと良いのだが… 基本的に一度作って後は必要に応じてコピペだがらな。他には function grep( o, re, p, B, this, a ){ B[0]=0;if(o~"-v"){while((getline v < p)>0){if(!match(v,re))B[B[0]+=1]=v;}return B[0];}; if(o~"-o"){while((getline v < p)>0){a=v;while(match(a,re)){B[B[0]+=1]=substr(a,RSTART,RLENGTH); a=substr(a,RSTART+RLENGTH);}};return B[0];};while((getline v < p)>0){if(match(v,re))B[B[0]+=1]=v;}return B[0]; } なんかも良く使う。grep("-o","pattern","/var/log",data);みたいな感じで。前のはagrep("-v",pattern,B,C)の一部分。 日ごろのメンテでちょっとした手作業じゃめんどいの組むときに、ほぼ数分で組みあがるのが楽なんだよ。 サブプロセスとしてgrep呼び出すのがコストかかる時とか、perlが破損した状況でのリカバリースクリプトとして組んだのが元だけど。 カーネルさえ生きていれば後はawkバイナリ流し込めば使え、shが半分死んでいてもなんとか動くし。 >>688 BEGIN{ QMAX=9007199254740991 QTopPos=QTailPos=QNum=0; hitTop=0; A[++z]="hoge"; A[++z]="1 2 3 4 5"; A[++z]="fuga"; A[0]=z; for(i=1;i<=A[0];i++){ p=1; while(match(substr(A[i],p),/[0-9]+/)){ p+=RSTART-1; enQ(substr(A[i],p,RLENGTH)); p+=RLENGTH; } if(QNum>0){ while(QNum && hitTop<i)A[++hitTop]=deQ(); }else{ delete A[i]; } }; if(QNum>0) while(QNum)A[++A[0]]=deQ(); for(z=1;z<=A[0];z++)print "A[" z "]:" A[z]; } 691の続き ちなみに、A[1]〜A[A[0]]をgrepして結果はA[1]〜A[?]に戻すスクリプトね。 複数件マッチする事があるので未処理行を上書きしないようにキュー使ってる。 function enQ(PushVal){ if (QNum+1 > QMAX){print "Queue Overflow"; exit;} nextPos = (QTopPos+1) % QMAX; QBody[QTopPos]=PushVal; QTopPos=nextPos QNum++; } function deQ(){ if (QNum<1){print "Illigal dequeue"; exit;} QNum--; TailVal=QBody[QTailPos]; delete QBody[QTailPos]; QTailPos=(QTailPos +1) % QMAX; return TailVal; } リングバッファの上限超えたら終了させてるけど>>688 の実装も上限超えたらバグるし許して。 計ってないけどループがない分早い筈。コードサイズはお察し。 メモリはA[]にデータ抱えてる時点でアウトな感じだけどA[]を適宜消すようにしといた。 出力先を別にしたいならA[]にdeQ()せず別変数にすればおk。 これで良い? >QMAX=9007199254740991 ワロタwww 俺のも確かにwhile(C[p+=1]=C[n+=1]);の部分で保持してるのすべて消費分だけ上に移動させてるのが無駄なので そのループが無い分は確かに早いはず。 あと、恥ずかしながら尋ねたいのですが、俺>>688 の実装で上限超えたらバグるをkwsk なんか見落としてたのか今更ながら心配になってきた。 昔作ったやつなんで、結構な頻度使ってきたのだが今までバグに気づかなかった しかしデータをメモリ上に展開するからどうしても上限が出てくるな… awkで10GBぐらいの扱う時はgetlineでなんとかなるけど、やはりメモリマップやポインタが使えたら便利だよなぁ パッチ作ったら需要あるかな? >>693 691、ちょっと訂正。無駄にキュー使う分、元スクリプトから劣化してた。 > p+=RSTART-1; >- enQ(substr(A[i],p,RLENGTH)); >+ if(hitTop+1<i){ >+ A[++hitTop]=substr(A[i],p,RLENGTH) >+ }else{ >+ enQ(substr(A[i],p,RLENGTH)); >+ } > p+=RLENGTH; あと、良く考えたら出力先を別にするなら、そもそもキュー不要。 バグってのは687で数値上限云々と書いたとおり、 ”C[0]+=1”がawkの整数の精度誤差なし演算可能上限を考慮していないだけ。 どのawkも多分そうだと思うけど、手元の環境下での実行結果↓ C:\>gawk --version GNU Awk 3.1.7(windows special Nov 24 2009) C:\>gawk "BEGIN{print 9007199254740990+1}" nul 9007199254740991 C:\>gawk "BEGIN{print 9007199254740991+1}" nul 9007199254740992 C:\>gawk "BEGIN{print 9007199254740992+1}" nul 9007199254740992 実際は(hddやメモリが先に死ぬので) 一行でこれだけ正規表現がhitする事は事実上無いし、 仮に発生しても検索結果が潰れるだけで、気付かない筈。 >9007199254740992 理論上、8192ペタバイトの同じデータ[aaa...]でregexp="."とすれば、発生するな… IEEE 754の52bit制限だから、これ以上のでかい数字扱うならbig numbert対応のライブラリか, "bc -q" |& で動かすか、xgawk、dnawkあたり使うべきだなぁ 昔誰かがbignumのawkスクリプト書いて放流していた覚えがあるのだが、 ググッても見つからん。手元にあるのはビット演算のやつだけだわ いつかそれだけのデータをメモリ上に保持できるマシンを扱ってみたいものだ… awkってabsとかacosなどの基本的な算術関数が用意されてないんですね 今後も実装されることはないんでしょうか? パイプでサクッとつないでワンラインで処理するのに重宝してたんですが・・・ 代わりとなると、何使うのがよろしいですか? できればperlは使いたくないです(どうしても好きになれない absは自分で書けばいいし、acos(x)はatan2(x, √(1.0 - x*x))と書けるから、 どちらも基本的ではないと判断して組み込みじゃないんだと思うけど。 PythonかRubyでいいんじゃない? ワンライナー向きではないけど。 >>696 必要な関数値を計算するだけのプログラムをCで作っておいたら? Rubyはそこそこワンライナーも書ける感じがする、awkやPerlほどじゃないけどね Pythonは流石にコード起こさないと辛いことが多いが awkでmatlabみたいなベクトル演算できるようにしてほしい Awk++ http://awk.info/?doc/dsl/awkplusplus.html OO in AWK++ The awk++ language provides object oriented programming for AWK that includes: classes class properties (persistent object variables) methods inheritance, including multiple inheritance http://lawker.googlecode.com/svn/fridge/lib/bash/awk++/version21/awkpp21.zip デバッグ大変過ぎて死ぬる $ cat witch.awkpp class Witch { var spell method new() { spell = "mahalic mahalita" } method perform() { print spell } } class Samantha : Witch { method perform() { print "twitch" } } BEGIN { # wife = Witch.new() エラー要因行 wife = Samantha.new() wife.perform() } $ gawk -f awkpp -r witch.awkpp gawk: -:10: () エラー要因行 gawk: -:10: ^ syntax error gawk: -:10: () エラー要因行 gawk: -:10: ^ 表現の char '?' は不正です。 size: 656 byte, supports -o -v option. Array A and B can be the same (NEW) function xagrep( o, re, A, B, this, a, i,k ){ k=0;B[0]=A[0];if(o~"-v"){for(i=1;i<=A[0];i++){if(!match(A[i],re)) B[k+=1]=A[i];}B[0]=k;return k}; if(o~"-o"){B[B[0]+1]=0;for(i=1;i<=A[0];i++){a=A[i];if(i==k){i=i-B[B[0]+1]+1;B[B[0]+1]=k;k=B[0]+2; while(i<=B[B[0]+1]){B[i++]=B[k];delete B[k++];}i=B[B[0]+1];k=i;B[B[0]+1]=0;}while(match(a,re)){ if(i>k){B[k+=1]=substr(a,RSTART,RLENGTH);}else{B[B[0]+1+(B[B[0]+1]+=1)]=substr(a,RSTART,RLENGTH); k++}a=substr(a,RSTART+RLENGTH)}}if(i<k){i=k-i;k=B[0]+1;B[0]=i+B[B[0]+1];while(i<B[0])B[i+=1]=B[k+=1]; while(i<k)delete B[i+=1];}return B[0]}for(i=1;i<=A[0];i++){if(match(A[i],re))B[k+=1]=A[i];}B[0]=k;return k; } これ以上削れるところ無いかな? 高速化+サイズ優先で、変数はできるだけ使う数を少なくとの条件で >>708 その3つの条件の優先度がわからんな。 結構同じ部分式があるので変数に入れた方が変数は増えるけど短くなるし 場合によっては速度も速いとかありそうだけどどうなん? 例えばB[0]は特別な用途っぽいけどxとか1文字変数にしてreturnの直前に 書き戻した方が文字数は稼げる。 あと細かいがhoge+=1より++hogeの方が1文字短いとか、いらない「;」が 残ってるとか詰めが甘いところがまだあるね。 以下のようなデータの処理について質問いいでしょうか。 $1に経過時間(時刻)、$2に「速度」があれば$3の数値は速度を、$2$3に 「up a」「down a」などとあればその時刻での行動を示します。 このデータからup、downの場所を求めたいと思います。 つまり、下の例で移動開始からの距離3でup a、距離3.5でup b、という具合です。 経過時間と速度から場所を計算するだけですが。速度を変更するタイミング・ 回数は不定、速度データと行動データはともに経過時間順に記録されています。 速度変更をどう扱えばいいのか、ちょっと頭が回りません。 ---元データ例--- 0 速度 10 50 速度 20 200 速度 25 30 up a 35 up b 40 down a 40 down b 50 up a 70 down a 200 up c 250 down c ---処理後--- 3 up a 3.5 up b 4 down a 4 down b 5 up a 6 down a 12.5 up c 14.5 down c 疑問を提示。 $1が常に時刻で$2が速度のときの$3が速度なら、 30 up aのときに30 * 10で300 up aになるんじゃないだろうか。 同じように、70 down aのときに50 * 10 + (70 - 50) * 20で900 down aになるんじゃないだろうか。 $3が速度(単位時間当たりの移動量)ではなく単位移動量当たりの所要時間なのであれば、 30 up aで30 / 10 = 3、70 down aで50 / 10 + (70 - 50) / 20 = 6になるんだけどね。 実装してみた。速度が途中に出てきてもいいようにposを毎回計算するから効率悪いけど。 -- BEGIN { sCount = 0; } $2 == "speed" { sTime[sCount] = $1; sSpeed[sCount] = $3; ++sCount; next; } { pos = 0; for (ic = 1; ic < sCount; ++ic) { if (sTime[ic] > $1) break; pos += (sTime[ic] - sTime[ic - 1]) / sSpeed[ic - 1]; } pos += ($1 - sTime[ic - 1]) / sSpeed[ic - 1]; print pos, $2, $3; } >>711 すみません、前者ですね。なんだろう、恥ずかしい。 >>712 なので、アクション部の / を * に変えればよさそうです。 お二方、ありがとうございます。 “任意の記号”を含んだシェル変数をawkに渡すことは可能ですか?たとえば [user@localhost ~]$ var='hoge' [user@localhost ~]$ echo "hoge" | awk -v var="$var" ' $0 ~ var {print var} END {print var} ' hoge hoge ここで、varに$を含ませると [user@localhost ~]$ var='hoge$fuga' [user@localhost ~]$ echo "hoge" | awk -v var="$var" ' $0 ~ var {print var} END {print var} ' hoge$fuga とうまくマッチしませんでした。var自体は渡されているはずですが、何が原因でしょうか? >>720 いちぎょうめのひだりがわの var は、ひょうかのさいに せいきひょうげんへのかたへんかんがおこなわれる。 $0 ~ /hoge$fuga/ {print "hoge$fuga"} END {print "hoge$fuga"} めたもじとなってしまうものは、じぜんあるいはこーどのなかで えすけーぷするひつようがある。 ~(チルダ)の右辺は正規表現として解釈されるから、"hoge" ~ /hoge$fuga/ でマッチするわけがない。 逆に寧ろ、"hoge$fuga" ~ /hoge/ ならマッチする。 >>720 >721も>722もどちらも原因。やりたいことをよく整理しよう。 すいません、echo "hoge"ではなくecho "$var"でした。 ただ、結果は>>720 と同じです。 要は入力ファイル内の「メタ文字込みの任意の文字列」を、別の「メタ文字と改行込みの任意の文字列」で置換する、 というのをメタ文字のエスケープ等の面倒な処理をせずにサクッとやりたいのですが、できますか? ムリ 予め「メタ文字と言っても $ しか出てこない」とか判ってるなら大したこと無いけど 一般化すればするほど面倒になる >>725 やはりそうですか。 今までこういった処理はsedでしこしこエスケープしてやってたんですが、いい加減面倒になったので、 たとえばfgrepみたいに正規表現をオフにして処理する方法はないかと探しているんですが、 awkでは無理ですか・・・。 >>726 単に一致なら正規表現なんか使わずに比較すればいいじゃん。 fgrepで事が足りるのならawkからfgrepを起動すればいいじゃん。 ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる