シェルスクリプト総合その33

**デフォルトの名無しさん** · 2020/03/23(月) 01:12:30.31

シェルスクリプトに関する総合スレッドです。

全般
・荒しは無視しましょう。
・丁寧な姿勢を心掛けましょう。
・ネチケット（死語）を意識しましょう。
・「○○（他の言語）でいいやん」は禁止。他のスレに行ってください。

シェルスクリプト総合その32
https://mevius.5ch.net/test/read.cgi/tech/1571929725/

**デフォルトの名無しさん** · 2020/06/30(火) 13:45:57.96

結局文字コードに関しての理解が浅いから
Windowsはcp932なんだよ！だからcp932を使うんだよ！
そしてcp932扱おうとすると難しいんだよ！ってなるんだよ

普通にUTF-8を使っていれば、Windows（Unicodeがネイティブの文字コード）とも
Linuxとも相性がいいのに

**デフォルトの名無しさん** · 2020/06/30(火) 14:08:10.20

テキストの中身はいいとしてファイル名()

**デフォルトの名無しさん** · 2020/06/30(火) 16:43:12.21

ファイル名でも同じだな
結局文字コードに関しての理解が浅いから()

**デフォルトの名無しさん** · 2020/06/30(火) 17:02:50.63

cp932を使ってる環境が今でもある以上、それに対応する必要はあるだろ
自分で管理できる環境しかいじらないのであれば、utf-8にでも統一すればいいが
そうじゃない場合はそのままではどうしようもない

utf-8が当たり前だと思ってるやつは、euc-jpとかも使ったこともないんだろうな
以前はperlなんかのcp932ダメ文字対策にはこれしかなかった

**デフォルトの名無しさん** · 2020/06/30(火) 17:11:34.24

めんどくさいのを知ってるからUTF-8に統一できるのだからそれにしたそれにするって話なのに
未だにcp932だの言ってるのはめんどくさくないんだろ？文句言うなw

**デフォルトの名無しさん** · 2020/06/30(火) 18:38:38.55

めんどくさいけどそれを避けられないという場合もあるという話だろ
巷にはまだまだ古い環境が残ってるんだよ
自分のせいじゃないんだから文句くらい言わせろw

**デフォルトの名無しさん** · 2020/06/30(火) 19:14:10.54

チラ裏にでも書いてろって話だな

**デフォルトの名無しさん** · 2020/06/30(火) 19:24:16.74

cp932 を UTF-8 にマイグレーション：めんどくさいからやりたくない
cp932 <> UTF-8 処理中に逐次相互変換：めんどくさいからやりたくない
cp932 <> UTF-8 フロントエンドで相互変換：めんどくさいからやりたくない
自分で対応できることをやりたくないから、誰かがcp932対応しろ
って話ですね

**デフォルトの名無しさん** · 2020/06/30(火) 20:52:19.85

すでにcp932に対応しているので遠慮しておきます

**デフォルトの名無しさん** · 2020/06/30(火) 21:00:48.27

>>540
> cp932を使ってる環境が今でもある以上

UTF-8に変換して処理が終わったら戻せばいいだけ

**デフォルトの名無しさん** · 2020/06/30(火) 21:54:26.59

それを世の人は「対応」という

**デフォルトの名無しさん** · 2020/07/01(水) 00:00:33.48

元レスのヤツがその対応してないのに対してのだろ
とんちんかんじゃね

**デフォルトの名無しさん** · 2020/07/01(水) 00:55:56.18

日本語でおk

**デフォルトの名無しさん** · 2020/07/01(水) 01:31:07.01

Windows を使うのは大変なんだな。
…ああ、それが無理だから Linux しか使わなくなったんだった。

**デフォルトの名無しさん** · 2020/07/01(水) 06:57:53.27

多分なcp932をUTF-8に変換して戻せばいいって聞いた時
間抜けなやつは、コードの中でいちいち変換してるんだよ

func() {
　str_sjis=$1
　str_utf8=$(sjis_to_utf8 "$1")
　ret_utf8=$(foo "$str_utf8")
　ret_sjis=$(utf8_to_sjis "$ret_utf8")
　echo "$ret_sjis"
}

こんな感じでな。コードのあちこちでこのような変換を行ってる。
あー、あほあほ、ばからしすぎる

コマンド呼び出しの前に外部コマンドで変換してしまうという発想がない

**デフォルトの名無しさん** · 2020/07/01(水) 07:44:48.00

cp932からutf8は不可逆変換

**デフォルトの名無しさん** · 2020/07/01(水) 08:54:24.38

>>552
それがどうかしたの？

**デフォルトの名無しさん** · 2020/07/02(木) 00:24:14.35

自己紹介しなくてもいいのにねぇ

**デフォルトの名無しさん** · 2020/07/02(木) 00:53:42.38

テキストエディタを作る時、内部のデータをUnicodeで持つか
あらゆる文字コードでデータが持てるようにするかの違い

あらゆる文字コードに対応するのは大変だから
ファイル読み書き時に変換し内部データはUnicodeでもつのが普通

シェルスクリプトで言えばiconvやnkfなどのフィルタを使って
文字コードを変換すれば、シェルスクリプトでは全てUTF-8として扱うことができる
シェルスクリプト以外の各言語でも同じことができる
なぜ未だにcp932のことを考える必要があるのかわからない

**デフォルトの名無しさん** · 2020/07/02(木) 00:58:14.59

そもそもWindowsはUTF-16がネイティブで
すべてのCLIコマンドはUTF-16で出力するのに
一体誰がcp932を出力するのかわからない

なおWindowsから標準出力にUTF-16で出力したデータは
WSL上のコマンドで受け取ったときには自動的にUTF-8に変換されている
（ファイル読み込み時に勝手にデータが変換されるという意味ではない）

**デフォルトの名無しさん** · 2020/07/02(木) 04:04:30.63

>内部データはUnicodeでもつのが普通
厳密にはOS(API)のネイティブな文字コードだな
今時のOSのはUnicodeだから間違ってもいないけど、多分、古いWindowsのはShift-JISなんじゃないかな

**デフォルトの名無しさん** · 2020/07/02(木) 04:37:48.98

古いWindowsとか適当なことを言うな
Windows 95よりも早く開発していた
Windows NTは最初からUnicodeだ

**デフォルトの名無しさん** · 2020/07/02(木) 04:57:08.09

XPでCygwinでシコシコやってた頃は、
cp932やらeuc-jpやらで大変だったなぁ
対応版が出るまで、utf-8？何それ美味しいの？状態で、
まともに使えるように、いろいろおまじないしてたっけ

**デフォルトの名無しさん** · 2020/07/02(木) 10:38:14.71

>>95
Windows 95よりも早く開発していたなんて嘘言うなよ
内部と表層は違う。Unicodeが表層にもなったのは最近だろ
Windows 95よりも早くとか曖昧なとこで完全な嘘だしな。痴呆で忘れたか？

**デフォルトの名無しさん** · 2020/07/02(木) 10:39:39.66

>>560
誤 >>59
正 >>558

**デフォルトの名無しさん** · 2020/07/02(木) 12:02:46.70

>>560
https://ja.wikipedia.org/wiki/Microsoft_Windows_NT#%E3%83%90%E3%83%BC%E3%82%B8%E3%83%A7%E3%83%B3%E3%81%AE%E5%A4%89%E9%81%B7%E5%8F%8A%E3%81%B3%E3%81%9D%E3%82%8C%E3%81%9E%E3%82%8C%E3%81%AE%E7%89%B9%E5%BE%B4

> IBMと共同で開発していたOS/2のバージョン2の次期バージョンをWindows NTとし、
> IBMとは別に製品を開発していくこととなる。最初のバージョンは3.1であり、
> これ以前に発売されていたWindows 3.1と互換性があるため、Windows NTの
> 最初のバージョンも3.0ではなく3.1として発売した。これはWindows3.1と歩調を揃えるという、
> マーケティング上の理由による。
>
> 以下、英語版の発売年を併記する。
>
> Windows NT 3.1（1994年）
>
> 初期バージョン。コードネームはWNT。デスクトップシェルとしてWindows 3.1と
> 同じユーザインタフェースを採用していた。英語版は1993年7月27日に発売された。

**デフォルトの名無しさん** · 2020/07/02(木) 12:05:14.83

>>560
表層とか曖昧なことを言うなよ
アプリの問題とOSの問題は違う

Windows NTの表層（笑）はUnicodeだ
9x系用アプリの表層が違うだけ

**デフォルトの名無しさん** · 2020/07/02(木) 13:33:50.59

Windows API にはシステムエンコーディング対応のとUnicode対応のがある
日本語に限っては、システムエンコーディングがUTF-8対応になったのはつい最近、当然それ以前はShift-JIS
てとこかな、ググったとこでは

UTF-8に対応してないのにわざわざUnicodeに対応しようとはしないわな当たり前に
システム内部でUnicode対応していようが、Shift-JIS APIしか「使えない」んだったら内部で対応していようがデベロッパーには見えない部分だし、そんなアプリが普通でもおかしくはないな

**デフォルトの名無しさん** · 2020/07/02(木) 13:45:58.39

>>562
なんの引用かいまいちわからんけど、Windowsが内部的にUnicodeになったのはWindows NTからみたいだけど。普及したというならWindows 2000からか
(それでも内部でUnicodeだろうがShift-JISがデフォのようだけど）

Windows 9x 前(もちろん 3.1も)までは限定的なUnicode文字列操作ライブラリがあったとかかな

**デフォルトの名無しさん** · 2020/07/02(木) 15:28:28.91

>>564
> 日本語に限っては、システムエンコーディングがUTF-8対応になったのはつい最近、当然それ以前はShift-JIS
> てとこかな、ググったとこでは

日本語がおかしい。知らないなら適当なこと書くなよ

> システム内部でUnicode対応していようが、Shift-JIS APIしか「使えない」んだったら
人の問題を持ち出すな。
無能が使えないからってなんなんだ

> (それでも内部でUnicodeだろうがShift-JISがデフォのようだけど）
根拠は？日本語以外の国があるのしらんの？ｗ

**デフォルトの名無しさん** · 2020/07/02(木) 16:07:07.26

Windows UTF-8 ベータ
知らないのはどっちかなとしか思えないw

**デフォルトの名無しさん** · 2020/07/02(木) 16:13:26.48

ああ、
システムエンコーディングがUTF-8対応になったのはつい最近、日本語だとそれ以前はシステムエンコーディングはShift-JIS
だよ。すまんなw

**デフォルトの名無しさん** · 2020/07/02(木) 21:31:15.20

アホだな。

それはUnicodeに対応してないアプリ用のエンコーディングに
UTF-8が使えるようになったのが最近なだけだろ

システムエンコーディングが9x用アプリのための設定のことだって知らないんだろうな

**デフォルトの名無しさん** · 2020/07/02(木) 22:29:06.37

OSでいくらutf8に対応しようが末尾AのAPI使ったアプリはsjisの入出力前提で書かれてるんだし
対応しようとすれば文字列周りは全部作り直しだよ
VBAやVBScriptとかのWSHも同じ問題を抱えてる
Windowsのutf8完全移行なんて10年後すら怪しい

**デフォルトの名無しさん** · 2020/07/02(木) 23:58:17.21

だからそれはアプリの問題じゃん

Windowsの標準コマンドはUnicode前提（対応）で書かれている。
PowerShell等から利用するUnicode前提
WSLもUnicode（透過的に変換されるUTF-8）

VBAやVBScriptとかのWSHも同じ問題を抱えてるというが
問題があるのはそれとバッチファイルぐらいでしょ。
今は殆ど使われてない

**デフォルトの名無しさん** · 2020/07/03(金) 10:48:21.18

今は殆ど使われてない[要出典]

**デフォルトの名無しさん** · 2020/07/03(金) 13:31:14.36

Windowsを使うな(暴論)

**デフォルトの名無しさん** · 2020/07/03(金) 22:08:43.15

エディタが対応した時点で932とか捨てたわ
変換する必要すらない(更新予定のない)古いメモ以外に残っていない
21世紀も20年目に入ってるというのにまだそんなの使ってる自体遅れいるのか

**デフォルトの名無しさん** · 2020/07/03(金) 22:26:00.04

俺がcp932を捨てたのいつだっけな？
Windowsになってからlzhを捨ててzipにした。
日本語が含まれる可能性がある個人用のファイル圧縮に
Unicodeを使う7zを使うようになったのは、うーん？2000年頃かなぁ

9x系に見切りをつけて（動かなければソフトの方を諦める）Windows 2000にした頃には
ファイルはどうしても無理な場合を除いてUTF-8を使うようにしていたし

cp932を使っていた時代は、LinuxもEUC-JPだったし大変だったね
LinuxでEUC-JPからUTF-8に変わった時には、WindowsもUTF-8を使うようにした

**デフォルトの名無しさん** · 2020/07/03(金) 23:44:56.51

文字コードとしてのcp932と
システムロケールとしてのcp932をごっちゃにしてるやつが多すぎる

前者は単なる文字コードだから、個人レベルでどうにでもなる
長いことWindowsでutf-8を使ってると言う場合はこれに当たる

後者は現在のwin10でもバリバリの現役で、utf-8は1803から追加されたものの、未だベータ扱い
一部の古いソフトだと不具合がでるので、そう簡単な話ではない
たとえば、このレスを書くために開いているJane Style

**デフォルトの名無しさん** · 2020/07/03(金) 23:59:49.05

システムロケールはOSではなくてソフトの問題なんだよな
Windows自体はシステムロケールの設定に依存していない
なぜならすべてUnicode（UTF-16）で処理してるから
（もちろん互換性のための処理として一部例外はあるだろうが）

**デフォルトの名無しさん** · 2020/07/04(土) 00:30:48.50

ソフト側でロケールを理解できなかったらダメだからねぇ

そういえば、Linuxもutf-8への移行期（Fedora Core 1が最初だっけ？）に、
それまでのRed Hat 9で問題のなかったeuc-jp前提のソフトがダメダメだった
まぁシェルスクリプトは問題なかったはず

**デフォルトの名無しさん** · 2020/07/04(土) 05:09:47.82

Windowsの場合Unicodeで作ってれば
システムロケールなんて関係ないよ

システムロケールを理解する必要があるのは
Unicode（UTF-16）非対応アプリの話

システムロケールと使用する言語（表示する言語）は別だからね

**デフォルトの名無しさん** · 2020/07/05(日) 00:52:27.71

メモ帳の保存形式にあるUnicodeとかいう多重トラップ嫌い

**デフォルトの名無しさん** · 2020/07/13(月) 19:16:41.40

Austinで大規模なファイル更新があって，
お，何か重要な局面を迎えたのかな？と期待して報告書を読んだら，
全文書に存在する"POSIX.1-201x"を"POSIX.1-202x"に書き換える作業だったていうオチ。

**デフォルトの名無しさん** · 2020/07/15(水) 10:35:51.78

組み込み系のash環境です。

以下のコードは、外部テキストファイル(shift-jis)をwhileで1行ずつ読み込んで、
シリアルポートの/dev/ttyUSB0へ1行の内容をそのまま送信する処理の一部です。

ファイルの中に日本語の0x5cのバックスラッシュがあると、文字化けしてしまいます。
0x5c混在のサンプルとして「表示」の漢字が正常に送れるかの試験コードを作りました。

以下のスクリプトの文字コードはshiftJISで保存し実行しました。

text=ダメ文字表示テスト
filtered_text=`echo $text | sed -e 's/\\/\\\\/g'`

echo -e "ORG text $text"
echo -e "filtered_text $filtered_text"
echo -e "$filtered_text" > /dev/ttyUSB0

結果
sed: unmatched '/'
ORG text ダメ文字侮ｦテスト
filtered_text
やりたいこと
シェルスクリプト内の変数に格納して、/dev/ttyUSB0へ「ダメ文字表示テスト」とそのまま送信したいです。
1行ずつ送信する理由は、たまに行間で制御コードを混ぜる必要があるためです。

sedの行が肝になると思い、作例を1日探しましたが、探し方が下手で見つけられませんでした。
sed以外のコマンドでも使えるコマンドがあれば何でもいいです。

nkfは無しでした。iconvはありましたがShiftjisのコードが含まれていませんでした。
そもそも最終的に送信するデータがshiftjisなので、これらは関係ないと気づきました。

どのような書き方でできるか、お知恵をいただけないでしょうか。

**デフォルトの名無しさん** · 2020/07/15(水) 11:54:50.30

ダメ文字は、数十年前の話w

**デフォルトの名無しさん** · 2020/07/15(水) 12:02:36.35

>>582
> 以下のスクリプトの文字コードはshiftJISで保存し実行しました。

それは絶対ダメ
ASCIIと互換性がない文字コードには対応してないのが普通

**デフォルトの名無しさん** · 2020/07/15(水) 12:03:29.33

>>582
> 以下のコードは、外部テキストファイル(shift-jis)をwhileで1行ずつ読み込んで、
同様に対応してないのが普通

**デフォルトの名無しさん** · 2020/07/15(水) 12:04:14.63

いい加減文字コードはUTF-8に一括変換してから
処理して戻すってことを覚えたほうがいい

**デフォルトの名無しさん** · 2020/07/15(水) 12:07:30.43

>>582
echoは使うなprintfを使え

**デフォルトの名無しさん** · 2020/07/15(水) 12:09:01.51

> 1行ずつ送信する理由は、たまに行間で制御コードを混ぜる必要があるためです。
意味がわからん。制御コード1文字が二行に分かれたりでもするんか？

**デフォルトの名無しさん** · 2020/07/15(水) 13:17:28.61

>>582
とりあえずシングルクォートは要るんじゃないの？
text='ダメ文字表示テスト'

**デフォルトの名無しさん** · 2020/07/17(金) 17:54:07.38

>>582
>sed: unmatched '/'
SJIS云々の前にsedのコマンドがちゃんと認識されてないじゃん。
とりあえず、バックスラッシュの数を変えたり``じゃなくて$()を使ってみたらどう?

**デフォルトの名無しさん** · 2020/07/18(土) 06:32:49.36

ひょっとしてSJIS完全対応のテキストエディタってLinuxには存在しない？
昔mousepadで盛大に化けた覚えが

**デフォルトの名無しさん** · 2020/07/18(土) 07:03:52.09

Emacs

**デフォルトの名無しさん** · 2020/07/18(土) 10:26:12.51

Vim

**デフォルトの名無しさん** · 2020/07/18(土) 10:38:54.42

vscode

**デフォルトの名無しさん** · 2020/07/18(土) 11:38:05.10

バカな投稿をすると釣られた人間が正しい知識を教えてくれるメソッド
よかったな，>>591！

**デフォルトの名無しさん** · 2020/07/18(土) 11:44:04.46

つまりvscodeが正しいと？

**デフォルトの名無しさん** · 2020/07/18(土) 12:39:31.97

俺のスレ読んでないの？w

**デフォルトの名無しさん** · 2020/07/18(土) 13:28:14.79

お前のレス？釣られた人間が正しい知識を教えてくれるんでしょう？
それ以外になんかあるの？

**デフォルトの名無しさん** · 2020/07/18(土) 13:48:08.58

エディタも使いこなせないならwinのメモ帳でも使いなよ。sjis対応だよ

**デフォルトの名無しさん** · 2020/07/19(日) 08:53:42.63

お前いつも壁と話してんな

**デフォルトの名無しさん** · 2020/07/19(日) 10:23:03.44

壁だと思ってるのはお前だけで、実は人間なんだぜ（ホラー風）

**デフォルトの名無しさん** · 2020/07/19(日) 11:15:59.84

ぬりかべ「かべっ！？」

**デフォルトの名無しさん** · 2020/07/27(月) 19:01:06.79

manコマンドはPOSIXに取り入れられそうなのに
その表示に関わるroffコマンドは影も形もないって、
なんつーか意味あんのかそれって思う。

**デフォルトの名無しさん** · 2020/07/27(月) 20:34:03.79

>>603
roff 使わなくても cat1 とか cat8 に成形済みテキスト置いておくだけで man
は動くんだから、別に roff なくても良いといえばいいとか、そんな理屈なのかも。

**デフォルトの名無しさん** · 2020/07/27(月) 20:48:14.37

manをPOSIXに取り入れるぐらいなら
HTMLビューワーをPOSIXに取り入れたほうが良い
JavaScriptとCSSに対応させる必要はないからさ

**デフォルトの名無しさん** · 2020/07/27(月) 20:50:03.70

curlをPOSIXに入れればいいのに
フル機能じゃなくていいけどREST API叩けるぐらい

**デフォルトの名無しさん** · 2020/07/27(月) 21:12:03.12

>>603
おお、するどい。
でもmanが入ってないというのはどう言う意味? POSIXとSUSの意味の違いにこだわる?

で実際manの記述を見ると文章の整形とかそれをどう作るとかは書いてないので、
そういうレベルのものは規定しないという態度なのかも。

あと事実上GNU roffが標準だと思うが、さすがにそれを規格には入れられないのかも。
かといって今更大昔のroffに制限するのもなあと。

しかし最近GNUで検索するとKingの方がヒットしやすくてうざいw

**デフォルトの名無しさん** · 2020/07/27(月) 21:16:04.45

というか、King Gnuと言ったらRMSしかありえないだろw

**デフォルトの名無しさん** · 2020/07/28(火) 08:42:48.22

こんなのか?
https://www.e-hon.ne.jp/bec/SA/Detail?refShinCode=0100000000000030681001&;Action_id=121&Sza_id=F3

まだ役に立ってるよ。俺が持ってるのは 20.3 だけど。

**デフォルトの名無しさん** · 2020/07/28(火) 13:13:59.11

質問。
次のような行からいずれかのvalueをきれいに削除するにはどうすれば？
name=value0,value1,value2,value3

たとえば次のコマンドだと、value1を削除できるものの、先頭か末尾か連続かのカンマが残ってしまう。。。
sed 's/^(name=.*)value1(.*)$/¥1¥2/'

残ったカンマを後で処理したらいいんだけど、そもそも一発でうまくやることができるんでは？という気がどうしても。

**デフォルトの名無しさん** · 2020/07/28(火) 13:23:54.46

^(name=.*)�bvalue1,?(.*)$
こうかな

**デフォルトの名無しさん** · 2020/07/28(火) 13:24:17.04

文字化けてるとこは円記号な

**デフォルトの名無しさん** · 2020/07/28(火) 13:53:56.25

King Gnu?
どっかで聞いたことあるようなないような▪▪▪

**デフォルトの名無しさん** · 2020/07/28(火) 14:07:36.32

>>611
value3の場合、末尾にカンマが残るよね？
また、value0なら先頭に残る。

どれでも一発できれいに削除できないかな？

**デフォルトの名無しさん** · 2020/07/28(火) 14:08:46.03

残らないが？

**デフォルトの名無しさん** · 2020/07/28(火) 14:25:35.27

残るが。
value3直前のカンマが¥1に含まれるので。

**デフォルトの名無しさん** · 2020/07/28(火) 23:58:59.24

>>610
>name=value0,value1,value2,value3

頭を柔らかくして、
最初に、この末尾に、カンマを追加すれば、処理しやすい形式になる

name=value0,value1,value2,value3,

**デフォルトの名無しさん** · 2020/07/29(水) 00:10:05.86

sed縛りなの？
後方参照する必要ないんじゃない？
value[0-2] については冗長だけど、以下の形式なら全部同じようにできるかと。
'?'の正規表現って、sedだとGNU sed とかだとつかえるのかな？
'?'はウチでは使えない。

echo 'name=value0,value1,value2,value3' | sed -e 's/value0,*//' -e 's/,$//'
echo 'name=value0,value1,value2,value3' | sed -e 's/value1,*//' -e 's/,$//'
echo 'name=value0,value1,value2,value3' | sed -e 's/value2,*//' -e 's/,$//'
echo 'name=value0,value1,value2,value3' | sed -e 's/value3,*//' -e 's/,$//'

**デフォルトの名無しさん** · 2020/07/29(水) 03:25:12.86

>>617
Perlとかならそうするが、sedだとなかなか？
sedはあんまり使わないので、そうしたくてもよくわからない。。。

>>618
sed縛りではないけど、Linux最小インストールでも対応したいので、sedくらいしか？
ほかに使えるならそれも可。

後方参照してるのは、「name=」で始まる行だけに限定したいから。
それ以外の行はそのままで。

「?」が使えない正規表現があるの？
POSIXに含まれてなかったっけ？

ちなみに現在はこうしてたっけかな？
細かいところはちょっと違うかも。
sed -r 's/^(name=.*)value1,?(.*)$/¥1¥2/;s/^(name=.*),+$/¥1/' -i file.txt

なんかくどくて、もっとさっぱり書けるやろと。。。

**デフォルトの名無しさん** · 2020/07/29(水) 05:18:27.85

Ruby で作った

text = <<"EOT"
a
name=value0,value1,value2,value3
x
EOT

word = "value2,"

text.each_line do | line | # 1行ずつ処理する
# 先頭が、name= 以外は処理しない
next unless line.start_with? "name="

line.chomp! # 末尾の改行を削除する
line += "," # 処理しやすいように一旦、末尾にカンマを付ける

line.slice! word # 取り除く
line.slice! -1 # 末尾のカンマを取り除く

puts line #=> name=value0,value1,value3
end

**デフォルトの名無しさん** · 2020/07/29(水) 06:28:49.20

sedの正規表現で最短一致は使えないって地味に罠だよな
[^]で工夫すれば行けるらしいが

**デフォルトの名無しさん** · 2020/07/29(水) 07:17:15.52

for((aa=-1;aa<4;aa++)); do echo name=value0,value1,value2,value3 |sed -e"/^name=/{s/$/,/; s/value${aa},//; s/,$//;}"; done

**618** · 2020/07/29(水) 11:42:17.47

>>622
完全に同意。個人的には {} 使わないで -e で並べたい派だけど。
*を使うより厳密に置換できてよいと思う。

619には以下の書き方のほうが分かりやすそう。
sed -e '/^name=/{s/$/,/; s/value0,//; s/,$//;}'

>>619
sedの正規表現では '?' 使えないはず。
GNU sed でもオプション使わないと通らないのが確認できた。
できれば -E を使ってほしいかな。個人的には。
-E, -r, --regexp-extended
use extended regular expressions in the script
(for portability use POSIX -E).

**デフォルトの名無しさん** · 2020/07/29(水) 11:58:07.49

そうやって、外部コマンドをあれこれ駆使して
どうにかして簡単に書ける方法はないか？に
無駄な時間使ってるのを見るとアホやなぁって思う
一般的なやり方でできないなら諦めろよ
そのコマンドを使うのが間違ってるんだ

**デフォルトの名無しさん** · 2020/07/29(水) 12:32:30.11

>>622
なるほど。
sコマンドで全行置換することしか頭になかった。。。
パターンマッチで行を特定してから、複数の置換を{}でまとめて行えばいいのか。

なんかsedの要領がわかった気がするぞ。
どうもありがとう。

>>620
Rubyなら、split()とjoin()を使ったらもっとさっぱりにできそう。

**デフォルトの名無しさん** · 2020/07/29(水) 12:44:55.15

>>623
いや、>>622でちゃんとわかったで？
# ちょっとかんがえたけど。

正規表現の「?」は確認するとたしかにダメだった。
-Eは、「¥bvalue」としたい都合でつけてたから、あんまり意識してなかった。
と思ったら、こっちは-Eがなくてもよかったのか。
なんかもうメチャクチャだなー。ｗ

**デフォルトの名無しさん** · 2020/07/29(水) 13:19:38.86

データがカンマを含む場合はどうしますか？

name1=v0,"v,,1",v2,,,vvv,unko,
name2=,sss,"hdj,du,n",,ss,,,,kkkk

**デフォルトの名無しさん** · 2020/07/29(水) 15:37:47.77

特定の行で区切った塊ごとで処理したいんだけどいい方法ない？
例えばこんなのだったら====で区切って

abc
def
==== 1
ghi
jkl
==== 2
mno
pqr

abc～def、ghi～jkl、mno～pqrという3つの塊をそれぞれ処理したい。
それと ghi～jklという塊を処理している時は1ですよ。という数字も知りたい
（最初の塊の時は数字なし）

**デフォルトの名無しさん** · 2020/07/30(木) 06:16:08.96

>>628
cat |sed -ne "/^===/! {H;}; $ b ll; /^=/ {:ll; s/=//g; x; s/\n/ /g; p;}" << EOL
abc
def
==== 1
ghi
jkl
==== 2
mno
pqr
EOL
abc def
1 ghi jkl
2 mno pqr

**デフォルトの名無しさん** · 2020/07/30(木) 06:42:42.05

>>629
条件を忘れましたが、画面に出力するのではなく
任意の処理をしたいのです。

つまり

foo() {
# $1 = 番号
# $2 = 塊
}

のようなことがしたいのです。

**デフォルトの名無しさん** · 2020/07/30(木) 06:43:43.55

あと塊から改行を取り除いてはいけません

**デフォルトの名無しさん** · 2020/07/30(木) 14:54:43.85

$!をリセットする方法はないですかね？
空とかunsetとか0とか

**デフォルトの名無しさん** · 2020/07/30(木) 15:15:25.11

Perl 使うと楽だが、シェルスクリプトで、か・・・

**デフォルトの名無しさん** · 2020/07/31(金) 00:34:30.45

Ruby なら、

def f( num, line )
puts num, line
end

# num は、inject の蓄積変数。0 は初期値
File.foreach( "input.txt" ).inject( 0 ) do |num, line|
if line.start_with? "==== " # 先頭が、これなら
line.chomp! # 末尾の改行を削除する
num = line[ 5..-1 ].to_i # 数字の部分を取り出して、整数にする
next num
end

f( num, line )
num
end

出力
0
abc
0
def
1
ghi
1
jkl
2
mno
2
pqr

**デフォルトの名無しさん** · 2020/07/31(金) 01:26:11.97

>>630
Bashなら、プロセス置換(process substitution)でできるのでは。

<(echo;最初のデリミタ行までを抽出するコマンドライン)
<(echo 1;最初から次のデリミタ行までを抽出するコマンドライン)
<(echo 2;最後のデリミタ行からを抽出するコマンドライン)

としたら、先頭行が番号、それ以降がテキスト行として読み込める。

個人的には、さすがここまでのレベルならPerlとかでやったほうが。

**デフォルトの名無しさん** · 2020/07/31(金) 19:26:43.51

bashの#!でのオプションについて質問。

先頭行を次のようにすると、「invalid option name」エラーになります。
#!/usr/bin/bash -o pipefail
...

しかし、コマンドラインに同じように書くとエラーになりません。
/usr/bin/bash -o pipefail -c '...'

どうして？
-eならどっちも問題ないので、#!行のオプションの解釈になにか秘密があるんだろうけど。

シェルスクリプト総合 その33

シェルスクリプト総合その33