X



sed
0001名無しさん@お腹いっぱい。
垢版 |
NGNG
sedスレッド
0295名無しさん@お腹いっぱい。
垢版 |
2008/07/07(月) 21:50:58
行頭から4文字目のxをyに
echo xxxxxxxxxx | sed 's/^¥(...¥)x/¥1y/'

行頭から4個目のxをyに
echo x-x-x-x-x | sed 's/¥([^x]*x[^x]*x[^x]*x[^x]*¥)x/¥1y/'

とかとか?

4を変数にするのは漏れには粍
0297290 293
垢版 |
2008/07/08(火) 10:30:38
ありがとうございます
確かに.×4みたいに表現できたらかっこいいですが
これで文句なしです!
0300名無しさん@お腹いっぱい。
垢版 |
2008/08/29(金) 17:04:29
01101,"0600031","ホッカイドウ","サッポロシチュウオウク","キタ1ジョウヒガシ","北海道","札幌市中央区","北一条東",0

01101,"0600031","ホッカイドウ","サッポロシチュウオウク","キタ1ジョウヒガシ","北海道","札幌市中央区","北一条東",0

この第5フィールドの半角英数だけ(2個有る場合もあり)全角にしたいのですが
どのようにsedを作ればいいでしょうか?
0302名無しさん@お腹いっぱい。
垢版 |
2008/08/29(金) 21:15:26
その形式は、郵便屋の郵便番号データだろ。
エクセルか何かの一覧表をcsvに落としただけの代物だから
そのままでは役に立たないよ。
 そのままDBに格納し、専用プログラムで変換かけて正規化してる。
0303名無しさん@お腹いっぱい。
垢版 |
2008/10/08(水) 23:13:50
aaa.hoge
bbb.hage
ccc.foge

とかいう文字列があって、*.hoge以外にマッチする正規表現って出来るのでしょうか?
0305名無しさん@お腹いっぱい。
垢版 |
2008/10/09(木) 21:57:14
>>303

その文を素直に読むと、当該文字列にだけはマッチしない
正規表現と読めるが、書き込み子の心情を忖度すると、
sed 's/[a-c]{3}\.hoge/==matched==/' って事かな?
まあ、[a-c]* でも、(aaa|bbb|ccc) でも、[[:alpha:]]* でも、
マッチする表現は無数に有るけど、(・・に、だけマッチする)
を、求めているなら、そもそも*.hoge って見当外れだし、
要するに、何が知りたいのか良く分からん。
0307名無しさん@お腹いっぱい。
垢版 |
2008/10/27(月) 23:08:07
ファイル内の、スペース+改行をスペースのみに置換したいのですが、
どのように記述すればよいのでしょうか。

データ数が数十万行あるため、ファイルを全部読み込んでから
置換する方法では、容量がオーバーしてしまいました。
0309名無しさん@お腹いっぱい。
垢版 |
2008/10/27(月) 23:29:29
>>308
環境上、Perlを使用することができないんです。
sedでは難しいでしょうか。
0311名無しさん@お腹いっぱい。
垢版 |
2008/10/28(火) 00:07:58
>>310
自分の環境では、\nが認識されませんでした。
0313312
垢版 |
2008/10/28(火) 02:56:53
すまん。勘違いした。

sed はPerlと違って、入力したときに改行を取り除いてからパターンスペースに送るから、
そこで改行探しても見つかりっこない。
んで、出力時に自動的に改行は付くし、これを抑制する手段はない。

せめて awk使っとけ。Perlなくてもawkはあるだろ。
0314312
垢版 |
2008/10/28(火) 02:58:41
すまん勘違いしてた。

sedはPerlと違って入力時に改行を取り除くから、置換時に改行探したって見つかりっこない。
Nとかで次の入力を読んでくれば間に挟まるけど。

0316名無しさん@お腹いっぱい。
垢版 |
2008/10/28(火) 07:09:08
ありがとうございました。
sedでは難しそうですね。別の方法を探してみます。
0321名無しさん@お腹いっぱい。
垢版 |
2009/02/16(月) 16:23:57
sedの公式ホームページってないのでしょうか
awkは一応gawkがあって一応開発も続いているようですが
sedはどのような状態なのでしょうか?
いつまでたっても最短マッチを搭載しない理由もお教えねがいます。
0322名無しさん@お腹いっぱい。
垢版 |
2009/02/16(月) 23:57:10
そういう機能を追加すると、既存のスクリプトが動作しなくなるから。
ポータビリティを失ってまで実装する必要がない。(それこそ、perlでもawkでも使えばいい)
0323名無しさん@お腹いっぱい。
垢版 |
2009/02/17(火) 09:03:12
なるほど、参考になりました。
もし開発に参加できるなら参加したいと思っていたのですが
そのような理由ならそういったときはperlやawkに頼る事にします。
0330名無しさん@お腹いっぱい。
垢版 |
2009/06/29(月) 20:49:52
質問させてください。
sedでホワイトスペースを解除または増やす方法ってあるのでしょうか?
0331名無しさん@お腹いっぱい。
垢版 |
2009/06/29(月) 20:52:21
間違い。ホールドスペースです。
0334名無しさん@お腹いっぱい。
垢版 |
2009/07/03(金) 03:11:56
sedで、
/pattern/r file
ってするとマッチした行の次にfileの内容が出力されますが、
その行の前に出力する方法はないでしょうか?
ちなみにマッチする行は1個しかありません。
0338336
垢版 |
2009/07/04(土) 00:17:53
出てなかった。

sed -n -e 'x;p;g' -e '/pattern/r file' -e '$p'

という感じで最後の行を出力することは出来るけど
patternが最後の行の場合だけ、fileの内容が次行に出ちゃう。
自分はギブアップ
0339名無しさん@お腹いっぱい。
垢版 |
2009/07/04(土) 12:34:06
いろいろありがとうございます。
sed 1個では難しいようですね。
patternより前とpattern以後に別けて、
間にfileをcatするしかないのかもしれません。
0341名無しさん@お腹いっぱい。
垢版 |
2009/09/24(木) 17:28:09
>>295 の例に似てますが、
バイナリファイル(1行めの)4バイトめを ASCII 文字 0x02 -> 0x03 に
変更するにはどうすればいいでしょう?

# sed -e '1s/^\(...\)\x02/\1\x03/' in > out

ではだめでした。
試した環境は FreeBSD 7.2 です。
0344名無しさん@お腹いっぱい。
垢版 |
2009/09/25(金) 10:46:05
>>343
最初の3バイトに改行文字がない保証がないから一般的にはだめそうだな。
やっぱ行指向のsedでバイナリファイルを操作するのは無理があると思う。
0345341
垢版 |
2009/09/25(金) 12:31:36
\x02 などは GNU sed の拡張仕様でした。

 # pkg_add -r gsed
 # rehash
 # gsed -e '1s/^\(...\)\x02/\1\x03/' in > out

でできました。
0346名無しさん@お腹いっぱい。
垢版 |
2009/09/25(金) 12:37:49
>>342-344 ありがとうございます。
>>342 の dd を使った方法は大変参考になります。

あと、
 # sed -e '1s/^\(...\)^V^B/\1^V^C/' in > out
でもできました。
^V^B は <Ctrl>V<Ctrl>B 、
^V^C は <Ctrl>V<Ctrl>C です。
0347名無しさん@お腹いっぱい。
垢版 |
2010/02/20(土) 21:42:41
ひとつ、お聞きいたします。

Nコマンドって、最後の行で次行が読めない場合、何もせず終了、
のはずですよね。すると、
sed 'sed ':l;N;bl' <file>
とすると何も出力されないんじゃないかと思うんですが、
私の使っているGNU sed 4.1.5版だと<file>の全部を出力してしまいます。
つまり、「何もせず終了」じゃなくて、「デフォルト出力して終了」
になっているように思われるわけですが、これは、どうなんでしょうか。
0349名無しさん@お腹いっぱい。
垢版 |
2010/07/01(木) 23:39:24
なるほど
0352350
垢版 |
2010/08/17(火) 23:26:44
そうか、区切り文字変えられるのsコマンドばかりじゃないんですね。
どうもありがとうございました。
0353初心者
垢版 |
2010/10/23(土) 20:01:51
sedでシェルすくりぷとの行つなぎバックスラッシューを消して、繋ぐことできますか?
perlなら-pe "s/\\\n//g"でできます。
edでも、awkでもできれば、教えていただけませんか?
0354名無しさん@お腹いっぱい。
垢版 |
2010/10/24(日) 13:40:00
できる
0355初心者
垢版 |
2010/10/24(日) 21:13:33
できました ありがとう
0356初心者
垢版 |
2010/10/25(月) 22:07:05
できないようですね、残念です。
0357名無しさん@お腹いっぱい。
垢版 |
2010/10/26(火) 19:38:19
sed -e ':lbl' -e '/[^\\]$/b' -e 's/\\$//' -e N -e 's/\n//' -e 'b lbl'

置換パターンに\nを許さない場合は
sed -e ':lbl' -e '/[^\\]$/b' -e 's/\\$//' -e N -e 's/
//' -e 'b lbl'
0359名無しさん@お腹いっぱい。
垢版 |
2010/11/28(日) 18:33:17
sedでファイルのある部分までをファイル1、それ以降をファイル2に出力ってスマートにできませんか?
例えば100行のsample.txtというファイルで、

sed -e "50q" < sample.txt > sample1.txt
sed -e "1,50d" < sample.txt > sample2.txt

の様にするのは無駄におもえてしまいます。
0360名無しさん@お腹いっぱい。
垢版 |
2010/11/28(日) 18:39:52
sed -ne '1,50w sample1.txt' -e '51,$w sample2.txt' < sample.txt
とか?
0363名無しさん@お腹いっぱい。
垢版 |
2010/12/22(水) 23:54:50
入力テキストを

1行目の内容 2行目の内容
2行目の内容 3行目の内容
:
最終-2行目の内容 最終-1行の内容
最終-1行目の内容 最終行の内容

という形(隣り合った行の値を空白で連結する)に変換するにはどう書けば
よいでしょうか。
sed -ne '1!p;$!p'
と通せば先頭末尾以外の行を2回出力できたので、
これを2行分ずつくっつければ出来そうなのですが…
0364名無しさん@お腹いっぱい。
垢版 |
2010/12/23(木) 00:03:02
¥n ってどのsedでも使えるんだっけ?

$ seq 1 10 | sed -ne '1!p;$!p' | sed 'N;s/¥n/ /'
1 2
2 3
3 4
4 5
5 6
6 7
7 8
8 9
9 10
0367名無しさん@お腹いっぱい。
垢版 |
2011/01/15(土) 11:45:22
unixの基礎概念という本の中に
a 21
is 10
this 3
というtest.txtファイルに対して、
sed 's/\(.*\)\( *\)\(.*\)/\3\2\1/' test.txt
とすると結果は
21 a
10 is
3 this
になると書いてありましたが、実行してみると並びはかわりませんでした。
0368名無しさん@お腹いっぱい。
垢版 |
2011/01/15(土) 11:49:07
>>367
確かに。それじゃぁ一番左側の .* が、最長一致で行全体に一致しちゃうから、
並びが変わらなくて正解。

悪書の書名晒して。
0372名無しさん@お腹いっぱい。
垢版 |
2011/01/15(土) 12:01:42
>>371
はいそれです。解説にも
「これはどう読むかというと、『入力行を任意の文字列1と、空白のならび2と、また別の任意の文字列3
にマッチさせ、それ全体を3、2、1の順でつなげたものに置き換える』という意味になる。」と書いてあります。
0377名無しさん@お腹いっぱい。
垢版 |
2011/01/15(土) 12:36:36
>>373
空白2個ならいけるのですか。

>>376
そういう、└┘└┘みたいな感じはなかったです。文字数的にも一文字分の感じ
ですし。編集上のミスかもしれませんけど。
0381名無しさん@お腹いっぱい。
垢版 |
2011/01/15(土) 14:34:38
>>378
正規表現を理解してないバカ発見。

任意の文字列 → \1
空白の並び → \2
別の任意の文字列 → \3

と言ってるだけのこと。それとスペース2つ書くのとは意味が違う。
0383名無しさん@お腹いっぱい。
垢版 |
2011/03/25(金) 20:16:28.23
任意の文字列の前か後ろの少なくともどちらかは、任意でない特定の文字・文字列(含^$)でないと困ったことになるということですね?
俺も前それで失敗した。
0384名無しさん@お腹いっぱい。
垢版 |
2011/04/21(木) 06:41:06.41
sedの話題はこっちへ
くれぐれもシェルスクリプトスレに書き込まないように!
0387名無しさん@お腹いっぱい。
垢版 |
2011/04/27(水) 12:11:27.62
>>386
sed -e "s/1/0/g"
0388名無しさん@お腹いっぱい。
垢版 |
2011/04/27(水) 12:35:36.38
>>386
> sed -e 's/BBB=111/BBB=000/'
これじゃ、お題
> この行の111を000に置き換えするのに
を満たさない。

矛盾を含む質問に答えることは不可能。
0389386
垢版 |
2011/04/27(水) 13:29:23.92
>この行の111を000に置き換えするのに
この行のBBB=111だけをBBB=000にする書式でした
すいません。
0394名無しさん@お腹いっぱい。
垢版 |
2011/05/18(水) 23:11:59.71
sed -e 's/<space><space>*/<space>/g' test.txt
って動かないんですが?
レスを投稿する


ニューススポーツなんでも実況