awkについて語るスレ $2

**デフォルトの名無しさん** · 2007/02/23(金) 23:55:42

腐っても鯛？騏驎も老いては駑馬に劣る？
三人の碩学が生み出したスクリプト言語AWKについて語るスレ

◆ 前スレ
awkについて語るスレ
http://pc10.2ch.net/test/read.cgi/tech/1023556171/

◆ 関係スレ
シェルスクリプト相談室
http://pc10.2ch.net/test/read.cgi/tech/1112553783/
AWKでCGI
http://pc10.2ch.net/test/read.cgi/php/1171804314/
【sed】シェルスクリプト総合@LINUX Part2【awk】
http://pc10.2ch.net/test/read.cgi/linux/1154578200/

◆ 参考
The AWK Programming Language (Brian Kernighan)：
ttp://cm.bell-labs.com/cm/cs/awkbook/index.html

GAWK (GNU Projedt):
ttp://www.gnu.org/software/gawk/

**デフォルトの名無しさん** · 2018/03/09(金) 13:30:21.59

ある行に　20 と 34　とはいってる
この行ごと除外したいけど・・・
　

**デフォルトの名無しさん** · 2018/03/09(金) 14:33:06.31

grep -v '　20 と 34　'

**デフォルトの名無しさん** · 2018/03/09(金) 21:38:00.87

こうかな
gawk "$0!~/20|34/{print}"

**デフォルトの名無しさん** · 2018/03/09(金) 23:45:36.30

AWK プログラムの基本構造となっている「パターンとアクションの対」のうち、
アクションが省略されている場合は入力行がそのまま出力される。
またパターンが単一の正規表現である場合は、その正規表現と $0 との照合が行われる。

gawk '!/20と34/'
gawk '!/20|34/'

**デフォルトの名無しさん** · 2018/03/10(土) 21:39:17.88

こぴぺしてやってみたけど　両方消えちゃうんだよね

20　と 34があった場合　出力しない
片方でもあれば　出力する

awk '!/01 / && !/03 /' 　これも両方消えてる・・

**なんか日本語がおかしいな。** · 2018/03/11(日) 06:07:55.06

>>876
「20 と 34 を両方含む時だけ出力しない。片方だけの場合は出力する。」
そう言いたいのか?
gawk '!(/20/&&/34/)'

**デフォルトの名無しさん** · 2018/03/11(日) 10:58:35.24

ありがとう　
（）はきがつかなかった・・

**デフォルトの名無しさん** · 2018/05/23(水) 20:10:48.40

僕の知り合いの知り合いができたパソコン一台でお金持ちになれるやり方
役に立つかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法　モニアレフヌノ』

0VDE5

**デフォルトの名無しさん** · 2018/06/08(金) 22:00:41.48

split関数より$0へ代入したほうが速いage

**デフォルトの名無しさん** · 2018/07/04(水) 22:29:02.55

02P

**デフォルトの名無しさん** · 2018/07/05(木) 16:52:56.22

0VDE5

**デフォルトの名無しさん** · 2018/09/11(火) 09:26:39.50

シェルスクリプト書いててどうしようもないときだけ使ってる

**デフォルトの名無しさん** · 2018/12/02(日) 13:44:27.64

AWKって重いと勝手に思ってたけど下手にシェルで制御構文作るより早いね
尤もWSLでやってるのでforkの時間とかそういう問題かもしれないが。

**デフォルトの名無しさん** · 2018/12/02(日) 14:22:41.55

>>884
重いと言ってもC比だからな。
今時の超大富豪言語PythonやRubyとなら同程度でもおかしくはない。

Cygwinのshが重かったのはご存じの通りforkが原因だ。
気になるならVirtualBox等でlinux環境を構築してその上でテストしてみればいい。

**デフォルトの名無しさん** · 2018/12/22(土) 02:10:55.36

gawk4にて配列の配列に存在する全要素数を
カウントする関数を作ったんですが、
もっと早いコードにならないでしょうか？
どなたかヒントをください。お願いします。

function count_array(arr, n, i) {
for (i in arr) {
if (isarray(arr[i])) count_array(arr[i], n);
else n[0]++;
}
return n[0];
}

**デフォルトの名無しさん** · 2018/12/22(土) 02:57:46.65

length(arr) でダメなの？

**デフォルトの名無しさん** · 2018/12/22(土) 20:12:58.98

886です。
ダメなんです。
BEGIN {
a[1] = 1;
a[2][1] = 21;
a[2][2] = 22;
a[3] = 3;
a[4][1][1] = 411;
a[4][2] = 42;
a[4][3][2][1] = 256;
for (i = 0; i < 9; i++) b[i] = i;
c["foo"]["corge"] = "grault";
c["foo"]["bar"] = "garply";
c["baz"]["corge"] = "waldo";
c["baz"]["quux"] = "fred";
print "length(a) = " length(a);
print "length(a) = " length(b);
print "length(a) = " length(c);
print "count_array(a) = " count_array(a);
print "count_array(b) = " count_array(b);
print "count_array(c) = " count_array(c);
}
length(a) = 4
length(b) = 9
length(c) = 2
count_array(a) = 7
count_array(b) = 9
count_array(c) = 4
再帰を使う以外に方法があれば、
と思い質問した次第です。

**デフォルトの名無しさん** · 2018/12/22(土) 21:58:49.47

要素を追加するときに
ﾉｰﾄﾞ毎に集計値が必要ならそれぞれのﾉｰﾄﾞ毎の集計値を保存しとけばいい
そうすれば集計しなおす必要ない

超速いﾊｽﾞ
集計しないからな

**デフォルトの名無しさん** · 2018/12/22(土) 22:19:10.29

こういった集計値がほしいのは分かる

aho(9)
┣aho1(5)
┃┣aho11(3)
┃┃┣aho111(1)
┃┃┗aho112(1)
┃┗aho12(1)
┗aho2(3)
　　┣aho21(1)
　　┗aho22(1)

lengthでは、きっとこんな感じでしかとれない

aho(2)
┣aho1(2)
┃┣aho11(2)
┃┃┣aho111(n/a)
┃┃┗aho112(n/a)
┃┗aho12(n/a)
┗aho2(2)
　　┣aho21(n/a)
　　┗aho22(n/a)

**デフォルトの名無しさん** · 2018/12/22(土) 23:48:44.15

>>888
lengthは、配列aの要素に配列があると要素としての配列の
中の要素数まではカウントしない、やりたいのは要素としての配列に
含まれる要素もカウントしたい、ということか。

function count_array2(arr, cnt, i) {
n=0;
for (i in arr) {
if(isarray(arr[i])){
cnt+=length(arr[i]);
}
else n++;
}
return n;
}
だと

a[1] = 1;
a[2][1] = 21;
a[2][2] = 22;
a[3] = 3;
a[4][1][1] = 411;
a[4][2] = 42;
a[4][3][2][1] = 256;
a[4][3][3][2] = 257;

みたいなのでうまくいかない（1番目と2番目の添え字(?)が同じ）。
arr[i][j]...と続ければ（最初にlength(arr)で続ける深さを決めて）
いけるように思うが、だったら再帰するのが素直か。

**デフォルトの名無しさん** · 2018/12/23(日) 00:54:43.50

886です。889さんこんな感じでしょうか？
BEGIN {
addnode(a, "1-1", "start");
addnode(a, "1-2", "done");
addnode(a, "1-3", "result");
addnode(a, "1-4", "print");
addnode(a, "2", "count");
addnode(a, "3-1-1", "return");
for (i in a[1]) print "a[1][" i "] = " a[1][i];
print "a[2] = " a[2];
print "a[3][1][1] = " a[3][1][1];
print "\n_ele_sum = " _ele_sum;
}
function addnode(arr, i, val, p) {
ct = split(i, list, "-");
switch (ct) {
case 1: arr[list[1]] = val; break;
case 2: arr[list[1]][list[2]] = val; break;
case 3: arr[list[1]][list[2]][list[3]] = val; break;
default:
}
_ele_sum++;
}
a[1][1] = start
a[1][2] = done
a[1][3] = result
a[1][4] = print
a[2] = count
a[3][1][1] = return
_ele_sum = 6

**デフォルトの名無しさん** · 2018/12/23(日) 01:05:13.25

886です。
pとか関係ないパラメータ入れてしまってごめんなさい。
addnode(a, "1-5-1", "connot");
これができません。
a["5"]がスカラーだと言っています。

**デフォルトの名無しさん** · 2018/12/23(日) 01:15:19.57

訂正a["1"]["5"]がスカラーの文脈だと言っています。でした

**デフォルトの名無しさん** · 2018/12/23(日) 01:41:32.84

886です
for (i in a[1]) print "a[1][" i "] = " a[1][i];
でa[1][5][1]が引っかかっていたようです。
自爆でした。すみません。

**デフォルトの名無しさん** · 2018/12/23(日) 02:59:04.54

886です。
親ノード毎?に保存する方法がまだわかりませんが、
明日以降考えます。
みなさん、ご協力ありがとうございました。

**デフォルトの名無しさん** · 2018/12/23(日) 08:49:07.73

gawk4でとにかく速いのが良いならcで拡張関数作るのが良いかと（反則？）

flatten_array_typed関数（4.1.4はflatten_array関数）でawk_flat_array_t構造体のメンバ変数countに要素数が入りますので
要素がAWK_ARRAYなら再帰するように処理すれば出来上がり

APIの使い方は
extension\rwarray.cとか
https://www.gnu.org/software/gawk/manual/html_node/Flattening-Arrays.html#Flattening-Arraysを参考に

gawkだけでやる場合、もし配列の要素数が10万とか100万あるのなら、関数の引数を出来るだけ減らして
関数内からグローバル変数を直接参照したほうが速くなると思います

**デフォルトの名無しさん** · 2018/12/23(日) 11:20:10.63

もともと添え字がすべて文字列で保存する仕様というのはしってはいたが
多次元配列はaho[i,j]という形式にして工夫して使えということらしいな

awkで多次元配列なんか使ったことないから知らんかったわ

とういﾜｹでにその形式で多次元配列をlengthでとると>>886で取得したい値になる
当然といえば当然
特定の次元の列だけのとりかたはよくわからん　とれんのかｺﾚ

　http://www.kt.rim.or.jp/~kbk/gawk-30/gawk_12.html#SEC119
　Using Numbers to Subscript Arrays

　　配列について重要なのは、配列の添え字は常に文字列として扱われるということである。
　　配列の添え字に数字を使った場合、それは添え字付けに使われる前に文字列に変換される

　http://www.kt.rim.or.jp/~kbk/gawk-30/gawk_12.html#SEC121
　Multi-dimensional Arrays

　　多次元配列とは、配列要素の指定を複数の添字の並びによって行う配列である。例えば二次元の配列は二つの添字を必要とする。
　　一般的な(awkも含めた大多数の言語では) 二次元配列の要素に対する参照は grid[x,y]このように行う。 (gridは配列の名前)

　　セパレータには組み込み変数SUBSEPに格納されている値が使われる。

**デフォルトの名無しさん** · 2018/12/23(日) 11:43:46.94

>>898
それを踏まえて>>886で
> gawk4
とわざわざことわっているんじゃないの?

**デフォルトの名無しさん** · 2018/12/23(日) 22:29:12.74

まず入力から多次元配列を読込む処理でも作ってみるか
できるのかがよく分からん

ｺﾚがすんなりできないとｺﾚ自体が使えるｼﾛﾓﾉにならなそうだしな

ﾃｽﾄﾃﾞｰﾀは作ってみた
https://ideone.com/Sir0IE

awkのこの多次元配列についてほかのとこで書いてあるの読んでみると
色々と面倒なことがおきるはのは分かった

特に問題がおきそうなのは一度配列やｽｶﾗｰで要素を追加すると、
その配列やｽｶﾗｰを変えて上書きする場合明示的にそれを削除しないと上書きして使えない

きっとなﾉｰﾄﾞを削除するときはその要素ﾞから辿って一番深いとこから再帰的に削除しないと残骸が残る
cのﾒﾓﾘﾘｰｸと同じことが起きると推定される

いまいちこの多次元配列に使い道があるのかどうかが分からない

**デフォルトの名無しさん** · 2018/12/23(日) 23:32:19.00

lispが最適
awkは不適

**デフォルトの名無しさん** · 2018/12/24(月) 01:01:19.83

https://ideone.com/PFBwQU

どうにかして動的に配列を構成できないか調べてみたが
やりかたが分からん

>>892の質問してるのが書いた方法で
一旦多次元配列を読む込むようにはしてみた

質問してるのが欲しいといってる要素の数は
結局入力の行数と同じになる

**デフォルトの名無しさん** · 2018/12/24(月) 01:07:37.50

https://ideone.com/zTUFL2

switch分のcaseが1つ少なかったから追加しといた

**デフォルトの名無しさん** · 2018/12/24(月) 09:11:50.63

>>900
> きっとなﾉｰﾄﾞを削除するときはその要素ﾞから辿って一番深いとこから再帰的に削除しないと残骸が残る
delete a は a[1][2] や a[3][4][5] などの子配列含む配列a全体の使用メモリをまとめて "再利用" にまわす
一部の要素を残しておきたい事情が無ければ、delete a[1][2]; delete a[3][4][5]; ... のように子配列を個別に
deleteする必要は無い

たとえば下の(2)は多次元配列bが多次元配列aの使用済みメモリを再利用するので
終了間際のメモリ使用量は(1)(2)どちらも同じになるが、(2)の delete a を消すと倍程度に増える
(1) BEGIN{for(i=1; i<=1000000; i++){a[i%10][i]=i}}
(2) BEGIN{for(i=1; i<=1000000; i++){a[i%10][i]=i} delete a; for(i=1; i<=1000000; i++){b[i%10][i]=i}}

メモリ再利用の仕組みはThe GAWK Manualには書いていないけどAharon Robbinsが↓で回答している
https://groups.google.com/forum/#!topic/comp.lang.awk/CKwoes0_63U

**デフォルトの名無しさん** · 2018/12/24(月) 15:58:51.02

なるほど
ありがとう

きっと再利用されるから
気にせず放置でいいのか

**デフォルトの名無しさん** · 2018/12/24(月) 17:27:46.25

>>902 886です。ありがとうございます。動的とはこんな感じでしょうか？
一度作って、削除するという変な仕様ですが。
BEGIN {
a[1] = "foo";
a[2][1] = "bar";
a[2][2] = "baz";
a[3] = "qux";
a[4][1][1] = "quux";
a[4][2] = "corge";

for (i = 1; i < 5; i++) {
meta_ar_init(b, i);
clone(b[i], a);
}
}
function meta_ar_init(ar, init_num) {
ar[init_num][1] = "";
delete ar[init_num][1];
}
function clone(lhs, rhs, i) {
for (i in rhs) {
if (isarray(rhs[i])) {
lhs[i][1] = "";
delete lhs[i][1];
clone(lhs[i], rhs[i]);
} else
lhs[i] = rhs[i];
}
}

**デフォルトの名無しさん** · 2018/12/27(木) 20:01:48.39

よく分からんが
例えばそれで>>902の入力ﾃﾞｰﾀなんかを読み込めたりするのか

>>903のswitchだと事前に何次元かわかってないと読み込めない

何次元になるか不明な入力ﾃﾞｰﾀの場合
どうやれば格納できるかよくわからんんかった

**デフォルトの名無しさん** · 2018/12/27(木) 22:46:53.38

>>906の「一度作って、削除する」というのは
https://www.gnu.org/software/gawk/manual/gawk.html#Arrays-of-Arrays
ここの一番下のsplitがエラー吐く例の回避策で、配列の要素を最初から配列扱いすることはできないから
予め次階層にダミー要素をぶら下げておき、本命を格納し終えたらダミーは消すって意味かな

自分で書いたらこんなんなったけど、いちおう何次元でも格納できそう
https://ideone.com/83ykKF#stdin

**デフォルトの名無しさん** · 2019/01/01(火) 00:00:01.96

2019年もawkのお世話になります

**デフォルトの名無しさん** · 2019/02/05(火) 18:58:36.44

60くらいの教授が40年くらい前にAWKでアセンブラ作ったとか言ってたんだけど
当時に既にあったということと当時から小規模なコンパイラなら作れるくらい高性能だったことに驚いた

**デフォルトの名無しさん** · 2019/02/05(火) 19:10:49.73

アセンブラをコンパイラとは呼ばないが

**デフォルトの名無しさん** · 2019/02/06(水) 10:31:17.59

aho

**デフォルトの名無しさん** · 2019/02/06(水) 13:09:33.86

asort、asortiがよくわからなかったので試した結果
# a
a[5] ="a5"
a[1] ="a1"
a[3] ="a8"
# asort(a,as)
as[1] ="a1"
as[2] ="a5"
as[3] ="a8"
# asorti(a,asi)
asi[1]=1
asi[2]=3
asi[3]=5

なんだそういうことだったのかとわかった

**デフォルトの名無しさん** · 2019/02/06(水) 17:39:23.37

>>910
思わず "assembler by awk" でググって The Amazing Awk Assembler by Henry Spencer を
ダウンロードしちゃったじゃないか。

**デフォルトの名無しさん** · 2019/02/23(土) 17:41:13.06

awkでファイルがあるかどうかの判別は、どのようにしたらよいのでしょうか？

具体的にはBEGINの中で

getline a < "/dev/stdin";
fn = a".txt"

と任意のファイル名を作った後、そのファイルがあるかどうかを確認したいんです。

もしファイルがすでにあったら処理は終了、無ければ以後の処理をそのファイルにリダイレクトする、という感じです。

**デフォルトの名無しさん** · 2019/02/24(日) 00:16:02.91

if(getline<fn!=-1)exit
とか？

**デフォルトの名無しさん** · 2019/02/24(日) 11:45:53.93

>>916
できました！ありがとうございます！！

**デフォルトの名無しさん** · 2019/03/21(木) 08:10:09.34

答えが出ないなんで？

#!/usr/bin/awk -f

BEGIN{
print game(10, 24);
}

function game(coin,depth, i,j){
if(memo[coin,depth]){
return memo[coin,depth];
}
if(coin == 0){
return 0;
}
if(depth == 0){
return 1;
}
win = game(coin + 1, depth - 1);
lose = game(coin - 1, depth - 1);
memo[coin,depth] = win + lose;
}

**デフォルトの名無しさん** · 2019/03/21(木) 09:51:18.96

最後の memo[coin,depth] = win + lose はそのまま関数の戻り値として
return しなければならないが、それを忘れている。

さらに、正しい答えが返らない原因が 2 点。
関数定義の引数名間違い: i,j → win,lose。
if(depth == 0) と if(coin == 0) の判定を行う順序が逆。

**デフォルトの名無しさん** · 2019/03/21(木) 14:19:16.55

>>919
ありがとうございます。
そっか。returnがいるんですね。
perlだと最後はreturn省略可能だけどawkは省略不可みたい。
あと、引数名も間違っていました。
正しい答え出ました！

**デフォルトの名無しさん** · 2019/03/21(木) 21:25:33.68

それぐらいの処理は、Ruby で作れ！

**デフォルトの名無しさん** · 2019/03/21(木) 23:54:47.78

オーク英雄物語　～忖度列伝～
https://ncode.syosetu.com/n8418ff/1/ 👀
Rock54: Caution(BBR-MD5:0be20a4887bc3d3353f527d3636c44e3)

**デフォルトの名無しさん** · 2019/04/01(月) 17:01:28.78

>>921
awkの方がいいときもある

installしなくていい
タスクマネージャでみているとrubyよりメモリを食わない時もある
融通の利く配列が超便利

通信、Hash、sortなど使いまくる時はrubyのほうがいいけど

**デフォルトの名無しさん** · 2019/04/01(月) 17:12:08.21

いや、Perlだ。

理由
俺が慣れてるから。

**デフォルトの名無しさん** · 2019/04/01(月) 22:48:54.89

Perlはまぁ慣れ以外に使う意味はあまり見出せない。

**デフォルトの名無しさん** · 2019/04/02(火) 04:44:16.86

漏れは、Windows 10・WSL・Ubuntu 16.04 だけど、
sudo apt install ruby だけで、Ruby 2.3 が入った

2.4 以降の新しい書き方さえしなければ、動く

Perl, Python は、最初から入っているけど

**デフォルトの名無しさん** · 2019/04/02(火) 10:00:50.55

>>926
死ね

**デフォルトの名無しさん** · 2019/04/02(火) 10:29:57.68

Perl脳だとdieなどと言いたがるんかね。

**デフォルトの名無しさん** · 2019/04/02(火) 12:24:56.71

Perl die好き

**デフォルトの名無しさん** · 2019/04/02(火) 12:34:58.56

ｗ

**デフォルトの名無しさん** · 2019/04/17(水) 15:16:55.69

GNU AWK 5.0がリリース。8年ぶりのメジャーバージョンアップ。正規表現ライブラリが
GLIBCからGNULIBへ移行、名前空間が実装　2019年4月17日
https://www.publickey1.jp/blog/19/gnu_awk_508glibcgnulib.html

UnixやLinuxにおいてsedやgrepなどと並んでよく知られているツールの1つがawk（オーク）
です。このawkのGNUプロジェクトによる実装の最新版「GNU AWK 5.0」（gawk 5.0）の
リリースが発表されました。

2011年にリリースされたGNU AWK 4.0から8年ぶり、直前のバージョンでとして2017年10月に
リリースされた4.2.0からは約1年半ぶりとなります。

AWKはいわゆるスクリプティング言語の一種。変数や関数、制御文など基本的な構文を備え、
テキストファイルを効率的に処理できるのが特徴です。

GNU AWK 5.0の新機能としては、printfの%aおよび%Aの書式がPOSIX標準に準拠したこと、
正規表現のルーチンが、長年にわたってメンテナンスされてきたGLIBCからGNULIBに
置き換わったことなど。

また、識別子に非英語文字を使うためのドキュメント化されていなかったオプションなどは
削除され、ソースコードはC99環境が想定されるようになっています。

そして新たに名前空間が実装されています（詳細はマニュアルを参照とのこと）。

**デフォルトの名無しさん** · 2019/04/17(水) 17:19:50.38

sedとawkで簡単にできることを
他の方法でやってるアホを見ると優越感に浸れるよな

**デフォルトの名無しさん** · 2019/04/17(水) 21:27:37.50

5.0.0じゃなくて4.3.0でいいじゃんって更新内容だな・・・

**デフォルトの名無しさん** · 2019/04/17(水) 23:57:17.65

今時っぽく定期的にメジャーバージョンアップしていく作戦？
そろそろAWKCARD印刷してみようかな…

**デフォルトの名無しさん** · 2019/04/18(木) 00:37:48.90

>>932
簡単な変換なのにWindowsとかでいきなりExcelでやろうとしちゃう人を見るとそこまでせんでも良いじゃないかとは思ってしまうな。
まあ日頃Windowsで事務処理的な事している人からすればそれ以上最良で分かりやすい環境はないんだろうけどな。
なんでもかんでもそれでやろうとして余計に分かりづらく複雑になってうまく行かずにハマっているのを見ると哀れに感じる。

**デフォルトの名無しさん** · 2019/06/01(土) 01:13:44.70

こういう記法ができることを知らず、気づくのに数年かかった
正規表現比較のifで変数を使える、gsubなどで変数を使える

ｔｘｔ＝”ａａｂｂｃｄｅｆｇ１２３４”
ｘ＝”＾” ｓｕｂｓｔｒ｛＄０，１，１｝ ”＋”
ｉｆ｛ｔｘｔ～ｘ｝ｐｒｉｎｔ ”ｏｋ”

ｙ＝ｓｕｂｓｔｒ｛＄０，１，１｝
ｚ＝ｓｕｂｓｔｒ｛＄０，２，１｝
ｇｓｕｂ｛ｙ，ｚ，＄０｝

(半角だと書き込みエラーになるので全角に変換)

**デフォルトの名無しさん** · 2019/06/01(土) 01:15:01.39

>>936
あれ変換おかしい
｛｝ → ()

**デフォルトの名無しさん** · 2019/06/01(土) 05:25:56.80

ふふふ知ってた。

**デフォルトの名無しさん** · 2019/06/05(水) 00:27:37.11

The AWK Programming Language (の邦訳本) から入ったので知ってはいるけど、
エスケープ文字を考慮してコードを書くのが面倒なので極力避けてるな。
文字列が正規表現へ「型変換」されるときの振舞いについて、本には一応書いてある。

**デフォルトの名無しさん** · 2019/06/19(水) 04:52:26.36

【出資】松本卓朗人工知能詐欺【注意】
https://rio2016.5ch.net/test/read.cgi/rikei/1560859403/

**デフォルトの名無しさん** · 2019/06/30(日) 05:07:43.82

AWKが巨大なテキストファイルを処理できないみたいな話を知ってる方いらしゃいますか。
大体1.4GiBくらいのファイルをAWKで編集しようとすると「ファイルの空きがない」みたいなエラーが出るので。

**デフォルトの名無しさん** · 2019/06/30(日) 12:11:04.21

UNIXというかまともなPIPE実装されてるOSならそんなことはないが
WINDOWSとかいうアホなOSだと出るだろうね

**デフォルトの名無しさん** · 2019/06/30(日) 12:19:57.44

「ファイルの空きがない」っていうメッセージは "No space left on device" の事？

**デフォルトの名無しさん** · 2019/06/30(日) 15:28:11.21

>>942
コマンドラインでリダイレクト使ってればそうかも知れんが
スクリプト内で出力先を指定してたらわからんぞー

**デフォルトの名無しさん** · 2019/06/30(日) 21:02:48.49

>>942
なるほど。

**デフォルトの名無しさん** · 2019/06/30(日) 21:56:09.12

>>941
改行コードの違いにより全体が長い一行と認識されてしまい・・・なんて事はないか？

あ、でも、ファイルの空きがないってのは出力先の空き容量が足りないってことかな？

**デフォルトの名無しさん** · 2019/07/01(月) 01:34:15.60

>>943
そうです。
でもファイルシステムとしては全く余裕がある状態なんです。

**デフォルトの名無しさん** · 2019/07/01(月) 02:30:15.69

なんだろうね。作業用ファイルが作られるパーティションの空きが足りないとかかな？

**デフォルトの名無しさん** · 2019/07/01(月) 02:35:44.08

64bit版か32bit版かで違わないか
1.4GBは入力で出力も同じなのかはるかに小さいのか
出力が速すぎることはないのか、ゆっくり出力するようにしたらどうか

**947** · 2019/07/01(月) 07:19:02.17

>>948
すいません。これが原因でした。
AWKは全く悪くありませんでした。ご迷惑&&スレ汚し、大変失礼しました……。

**デフォルトの名無しさん** · 2019/07/01(月) 07:38:04.28

Ruby でも、File.read なら、ファイルの内容を、メモリ内にすべて読み込んでしまうから、
500MB 以上なら、読み込めずにエラーになるだろう

File.foreach なら、メモリ内に、1行ずつ読み込んでは捨てるから、大きいファイルでも大丈夫

まあ、RubyVM 起動時に、そのアプリが使うメモリのサイズを、指定できると思うけど。
JavaVM には、そういうオプションがある

**デフォルトの名無しさん** · 2019/07/02(火) 21:28:41.07

awkで dateを使ったのですが、秒数が更新されず悩んでます。仕様とかそういう情報ご存知のかた教えて
頂けないでしょうか
■ コード
BEGIN {
for( intCounter = 0; intCounter < 3; intCounter++ )
{
"date +\"%Y/%m/%d %I:%M:%S\" " | getline datTmp
print "Start:" datTmp
system("sleep 2")
}
}
END {
for( intCounter = 0; intCounter < 3; intCounter++ )
{
"date +%I:%M:%S" | getline datTmp1
print "End:" datTmp1
system("sleep 2")
}
}
■ 結果
Start:2019/07/02 09:18:36
Start:2019/07/02 09:18:36
Start:2019/07/02 09:18:36
End:09:18:42
End:09:18:42
End:09:18:42
■ 疑問
Start, End 共に最初の 1 回目のみ秒数が取れているようで、2回目からは2秒後のはずなのに、秒数が変わっていない orz..

**952** · 2019/07/02(火) 21:47:38.82

お騒がせしました。自己解決しました。
https://stackoverflow.com/questions/2391272/gawk-awk-piping-date-to-getline-sometimes-wont-work
closeを使う必要が有ったようです。
■ コード
BEGIN {
for( intCounter = 0; intCounter < 3; intCounter++ )
{
"date +\"%Y/%m/%d %I:%M:%S\" " | getline datTmp
print "Start:" datTmp
system("sleep 2")
close("date +\"%Y/%m/%d %I:%M:%S\" ")
}
}
END {
for( intCounter = 0; intCounter < 3; intCounter++ )
{
"date +%I:%M:%S" | getline datTmp2
print "End:" datTmp2
system("sleep 2")
close("date +%I:%M:%S")
}
}
■ 結果
Start:2019/07/02 09:44:49
Start:2019/07/02 09:44:51
Start:2019/07/02 09:44:53
End:09:44:55
End:09:44:57
End:09:44:59

**デフォルトの名無しさん** · 2019/07/03(水) 06:22:07.32

gawkなら時間関数群あるんじゃ。

**デフォルトの名無しさん** · 2019/07/04(木) 01:05:04.08

ここいいね。Web上でawkの実行とその結果が見れるサービス。
https://www.tutorialspoint.com/execute_awk_online.php

**デフォルトの名無しさん** · 2019/07/05(金) 19:29:13.12

　　　　　　　　　　　fi
　　　　　　　　　　､Jｊ
　　　　　　　　　　 Й　
　　　　　　　　　／⌒ヽ
　　　　　　　　　l＿ 0..0
　　　　　　　　　　}{ l冊
　　　　　　　　-=-v=-
　　　　　　　　}{ 彡ミﾉ{
　　　　　　　　}{　非　}{
　　　　　　　匁OTO)匁
　　　　　　　　　}{　}{
　　　　　　　　　}{　}{
　　　　　　　　及及

**デフォルトの名無しさん** · 2019/08/05(月) 11:42:29.38

Windows10 のコマンドプロンプトで awk を使いたいです。
vector で検索するといろいろでてくるのですが、
これがお勧めっていうのありますでしょうか。
日本語も扱えるのがいいです。
よろしくお願いします。

**デフォルトの名無しさん** · 2019/08/05(月) 11:44:36.72

Windows 10なら、標準機能のWSL（+Ubuntu）をインストールするのが一般的
vectorとかもうあんなのいらない

**デフォルトの名無しさん** · 2019/08/05(月) 12:04:58.85

WSLって使ったことなかったんですけど、
ググってみたらもう Win で Linux が標準で使えるんですね。
これなら cygwin とかも、もういらないのかな。
情報どうもです。

**デフォルトの名無しさん** · 2019/08/05(月) 12:06:14.91

cygwinもいらない。遅いし互換性低いし

**デフォルトの名無しさん** · 2019/08/05(月) 12:06:57.54

WSL って pro だけ？
home だったら付いてない？
msys とか入れれば解決するけど

**デフォルトの名無しさん** · 2019/08/05(月) 12:18:30.48

マイクロソフトもビルゲイツがいなくなって
多少は良い事もするようになったかな。

**デフォルトの名無しさん** · 2019/08/05(月) 12:33:33.70

>>962
いや、まだ足りない。何でもかんでもWindowsの上で動くようにしているだけだしね。すると何を動かすにしてもWindowsのライセンス料が掛かる。
まあ仕方のないことではあるがな。

**デフォルトの名無しさん** · 2019/08/05(月) 12:42:57.45

WSLはhomeでも使える。WSL2も使えるようにすると発表があった。

**デフォルトの名無しさん** · 2019/08/05(月) 12:59:49.23

>>963
> 何でもかんでもWindowsの上で動くようにしているだけだしね。すると何を動かすにしてもWindowsのライセンス料が掛かる。

それがLinuxでも動くようになり、Windowsのライセンス料もかからなくなってきてるから
最近のMSの評判が抜群に上がってるんだろ

**デフォルトの名無しさん** · 2019/08/05(月) 15:30:49.20

>>962
windows育ちでないunix系を知っている今のCEOに変わってから変化し始めた
ダメな旧MS文化からunix系やandroid系に転換をはかっている
ダメだったのは前CEOバルマー

**デフォルトの名無しさん** · 2019/08/05(月) 17:45:26.88

いっそのこと UNIX のカーネルに Windows のシェルを
被せてもらいたいですね。
Mac はもうそうなってるし。

**デフォルトの名無しさん** · 2019/08/05(月) 17:59:46.21

そのわりに、MacってUNIXを全然活かせてないよな？
forkは遅いし、仮想マシン使ったほうがMacよりも速いし。

**デフォルトの名無しさん** · 2019/08/05(月) 18:09:58.23

まあ、AppleはUNIXを真似ることしかできなかったわけで
UNIXと双璧をなす独自OSを作り上げたMSと同じことをしろというのも酷な話だが、
UNIX/Linuxを取り込むなら、WSLと同じ仕組みで十分な気がする。

あとAppleが運が悪かったのは、Linuxがここまで普及すると予測できなかったことかな
BSD系を採用しちゃったので、Linuxとコマンド体系が微妙に変わってしまった。
標準でUnixコマンドが搭載されてるにも関わらず、サードパーティのHomebrewを使って
Linux互換（GNU版）のコマンドに置き換える人も多いし。

**デフォルトの名無しさん** · 2019/08/05(月) 20:09:15.04

> UNIXと双璧をなす独自OSを作り上げたMS
ゴミをでっち上げ、OSとかよく解らない池沼層に売っただけ。

**デフォルトの名無しさん** · 2019/08/05(月) 20:51:07.86

MSはOSというよりはUIを作った感じだな。