シェルスクリプト総合 その33

■ このスレッドは過去ログ倉庫に格納されています
2020/03/23(月) 01:12:30.31ID:TYte82vJ
シェルスクリプトに関する総合スレッドです。

全般
・荒しは無視しましょう。
・丁寧な姿勢を心掛けましょう。
・ネチケット(死語)を意識しましょう。
・「○○(他の言語)でいいやん」は禁止。他のスレに行ってください。

シェルスクリプト総合 その32
https://mevius.5ch.net/test/read.cgi/tech/1571929725/
2020/07/02(木) 00:58:14.59ID:9cYvmHwP
そもそもWindowsはUTF-16がネイティブで
すべてのCLIコマンドはUTF-16で出力するのに
一体誰がcp932を出力するのかわからない

なおWindowsから標準出力にUTF-16で出力したデータは
WSL上のコマンドで受け取ったときには自動的にUTF-8に変換されている
(ファイル読み込み時に勝手にデータが変換されるという意味ではない)
2020/07/02(木) 04:04:30.63ID:7rdALa4M
>内部データはUnicodeでもつのが普通
厳密にはOS(API)のネイティブな文字コードだな
今時のOSのはUnicodeだから間違ってもいないけど、多分、古いWindowsのはShift-JISなんじゃないかな
2020/07/02(木) 04:37:48.98ID:9cYvmHwP
古いWindowsとか適当なことを言うな
Windows 95よりも早く開発していた
Windows NTは最初からUnicodeだ
2020/07/02(木) 04:57:08.09ID:mSCtcEnU
XPでCygwinでシコシコやってた頃は、
cp932やらeuc-jpやらで大変だったなぁ
対応版が出るまで、utf-8? 何それ美味しいの? 状態で、
まともに使えるように、いろいろおまじないしてたっけ
2020/07/02(木) 10:38:14.71ID:6iBChMal
>>95
Windows 95よりも早く開発していたなんて嘘言うなよ
内部と表層は違う。Unicodeが表層にもなったのは最近だろ
Windows 95よりも早くとか曖昧なとこで完全な嘘だしな。痴呆で忘れたか?
2020/07/02(木) 10:39:39.66ID:6iBChMal
>>560
>>59
>>558
2020/07/02(木) 12:02:46.70ID:9cYvmHwP
>>560
https://ja.wikipedia.org/wiki/Microsoft_Windows_NT#%E3%83%90%E3%83%BC%E3%82%B8%E3%83%A7%E3%83%B3%E3%81%AE%E5%A4%89%E9%81%B7%E5%8F%8A%E3%81%B3%E3%81%9D%E3%82%8C%E3%81%9E%E3%82%8C%E3%81%AE%E7%89%B9%E5%BE%B4

> IBMと共同で開発していたOS/2のバージョン2の次期バージョンをWindows NTとし、
> IBMとは別に製品を開発していくこととなる。最初のバージョンは3.1であり、
> これ以前に発売されていたWindows 3.1と互換性があるため、Windows NTの
> 最初のバージョンも3.0ではなく3.1として発売した。これはWindows3.1と歩調を揃えるという、
> マーケティング上の理由による。
>
> 以下、英語版の発売年を併記する。
>
> Windows NT 3.1(1994年)
>
> 初期バージョン。コードネームはWNT。デスクトップ シェルとしてWindows 3.1と
> 同じユーザインタフェースを採用していた。英語版は1993年7月27日に発売された。
2020/07/02(木) 12:05:14.83ID:9cYvmHwP
>>560
表層とか曖昧なことを言うなよ
アプリの問題とOSの問題は違う

Windows NTの表層(笑)はUnicodeだ
9x系用アプリの表層が違うだけ
2020/07/02(木) 13:33:50.59ID:ACoXsYjy
Windows API には システムエンコーディング対応のとUnicode対応のがある
日本語に限っては、システムエンコーディングがUTF-8対応になったのはつい最近、当然それ以前はShift-JIS
てとこかな、ググったとこでは

UTF-8に対応してないのにわざわざUnicodeに対応しようとはしないわな当たり前に
システム内部でUnicode対応していようが、Shift-JIS APIしか「使えない」んだったら内部で対応していようがデベロッパーには見えない部分だし、そんなアプリが普通でもおかしくはないな
2020/07/02(木) 13:45:58.39ID:ACoXsYjy
>>562
なんの引用かいまいちわからんけど、Windowsが内部的にUnicodeになったのはWindows NTからみたいだけど。普及したというならWindows 2000からか
(それでも内部でUnicodeだろうがShift-JISがデフォのようだけど)

Windows 9x 前(もちろん 3.1も)までは限定的なUnicode文字列操作ライブラリがあったとかかな
2020/07/02(木) 15:28:28.91ID:9cYvmHwP
>>564
> 日本語に限っては、システムエンコーディングがUTF-8対応になったのはつい最近、当然それ以前はShift-JIS
> てとこかな、ググったとこでは

日本語がおかしい。知らないなら適当なこと書くなよ

> システム内部でUnicode対応していようが、Shift-JIS APIしか「使えない」んだったら
人の問題を持ち出すな。
無能が使えないからってなんなんだ

> (それでも内部でUnicodeだろうがShift-JISがデフォのようだけど)
根拠は?日本語以外の国があるのしらんの?w
2020/07/02(木) 16:07:07.26ID:ACoXsYjy
Windows UTF-8 ベータ
知らないのはどっちかなとしか思えないw
2020/07/02(木) 16:13:26.48ID:ACoXsYjy
ああ、
システムエンコーディングがUTF-8対応になったのはつい最近、日本語だとそれ以前はシステムエンコーディングはShift-JIS
だよ。すまんなw
2020/07/02(木) 21:31:15.20ID:9cYvmHwP
アホだな。

それはUnicodeに対応してないアプリ用のエンコーディングに
UTF-8が使えるようになったのが最近なだけだろ

システムエンコーディングが9x用アプリのための設定のことだって知らないんだろうな
2020/07/02(木) 22:29:06.37ID:SkSFT8E6
OSでいくらutf8に対応しようが末尾AのAPI使ったアプリはsjisの入出力前提で書かれてるんだし
対応しようとすれば文字列周りは全部作り直しだよ
VBAやVBScriptとかのWSHも同じ問題を抱えてる
Windowsのutf8完全移行なんて10年後すら怪しい
2020/07/02(木) 23:58:17.21ID:9cYvmHwP
だからそれはアプリの問題じゃん

Windowsの標準コマンドはUnicode前提(対応)で書かれている。
PowerShell等から利用するUnicode前提
WSLもUnicode(透過的に変換されるUTF-8)

VBAやVBScriptとかのWSHも同じ問題を抱えてるというが
問題があるのはそれとバッチファイルぐらいでしょ。
今は殆ど使われてない
2020/07/03(金) 10:48:21.18ID:D1jLBB9V
今は殆ど使われてない[要出典]
573デフォルトの名無しさん
垢版 |
2020/07/03(金) 13:31:14.36ID:adDL+CTN
Windowsを使うな(暴論)
574デフォルトの名無しさん
垢版 |
2020/07/03(金) 22:08:43.15ID:pyXUrnYQ
エディタが対応した時点で932とか捨てたわ
変換する必要すらない(更新予定のない)古いメモ以外に残っていない
21世紀も20年目に入ってるというのにまだそんなの使ってる自体遅れいるのか
2020/07/03(金) 22:26:00.04ID:uIgOlo/V
俺がcp932を捨てたのいつだっけな?
Windowsになってからlzhを捨ててzipにした。
日本語が含まれる可能性がある個人用のファイル圧縮に
Unicodeを使う7zを使うようになったのは、うーん?2000年頃かなぁ

9x系に見切りをつけて(動かなければソフトの方を諦める)Windows 2000にした頃には
ファイルはどうしても無理な場合を除いてUTF-8を使うようにしていたし

cp932を使っていた時代は、LinuxもEUC-JPだったし大変だったね
LinuxでEUC-JPからUTF-8に変わった時には、WindowsもUTF-8を使うようにした
2020/07/03(金) 23:44:56.51ID:9C03Lp22
文字コードとしてのcp932と
システムロケールとしてのcp932をごっちゃにしてるやつが多すぎる

前者は単なる文字コードだから、個人レベルでどうにでもなる
長いことWindowsでutf-8を使ってると言う場合はこれに当たる

後者は現在のwin10でもバリバリの現役で、utf-8は1803から追加されたものの、未だベータ扱い
一部の古いソフトだと不具合がでるので、そう簡単な話ではない
たとえば、このレスを書くために開いているJane Style
2020/07/03(金) 23:59:49.05ID:uIgOlo/V
システムロケールはOSではなくてソフトの問題なんだよな
Windows自体はシステムロケールの設定に依存していない
なぜならすべてUnicode(UTF-16)で処理してるから
(もちろん互換性のための処理として一部例外はあるだろうが)
2020/07/04(土) 00:30:48.50ID:1qYUKBUR
ソフト側でロケールを理解できなかったらダメだからねぇ

そういえば、Linuxもutf-8への移行期(Fedora Core 1が最初だっけ?)に、
それまでのRed Hat 9で問題のなかったeuc-jp前提のソフトがダメダメだった
まぁシェルスクリプトは問題なかったはず
2020/07/04(土) 05:09:47.82ID:ve9MtcL4
Windowsの場合Unicodeで作ってれば
システムロケールなんて関係ないよ

システムロケールを理解する必要があるのは
Unicode(UTF-16)非対応アプリの話

システムロケールと使用する言語(表示する言語)は別だからね
2020/07/05(日) 00:52:27.71ID:m0wz7oid
メモ帳の保存形式にあるUnicodeとかいう多重トラップ嫌い
2020/07/13(月) 19:16:41.40ID:Xa4f7njE
Austinで大規模なファイル更新があって,
お,何か重要な局面を迎えたのかな?と期待して報告書を読んだら,
全文書に存在する"POSIX.1-201x"を"POSIX.1-202x"に書き換える作業だったていうオチ。
582デフォルトの名無しさん
垢版 |
2020/07/15(水) 10:35:51.78ID:GO+Zaox3
組み込み系のash環境です。

以下のコードは、外部テキストファイル(shift-jis)をwhileで1行ずつ読み込んで、
シリアルポートの/dev/ttyUSB0へ1行の内容をそのまま送信する処理の一部です。

ファイルの中に日本語の0x5cのバックスラッシュがあると、文字化けしてしまいます。
0x5c混在のサンプルとして「表示」の漢字が正常に送れるかの試験コードを作りました。

以下のスクリプトの文字コードはshiftJISで保存し実行しました。

text=ダメ文字表示テスト
filtered_text=`echo $text | sed -e 's/\\/\\\\/g'`

echo -e "ORG text $text"
echo -e "filtered_text $filtered_text"
echo -e "$filtered_text" > /dev/ttyUSB0

結果
sed: unmatched '/'
ORG text ダメ文字侮ヲテスト
filtered_text
やりたいこと
シェルスクリプト内の変数に格納して、/dev/ttyUSB0へ「ダメ文字表示テスト」とそのまま送信したいです。
1行ずつ送信する理由は、たまに行間で制御コードを混ぜる必要があるためです。

sedの行が肝になると思い、作例を1日探しましたが、探し方が下手で見つけられませんでした。
sed以外のコマンドでも使えるコマンドがあれば何でもいいです。

nkfは無しでした。iconvはありましたがShiftjisのコードが含まれていませんでした。
そもそも最終的に送信するデータがshiftjisなので、これらは関係ないと気づきました。

どのような書き方でできるか、お知恵をいただけないでしょうか。
2020/07/15(水) 11:54:50.30ID:IqfNcqeZ
ダメ文字は、数十年前の話w
2020/07/15(水) 12:02:36.35ID:gwK3CNky
>>582
> 以下のスクリプトの文字コードはshiftJISで保存し実行しました。

それは絶対ダメ
ASCIIと互換性がない文字コードには対応してないのが普通
2020/07/15(水) 12:03:29.33ID:gwK3CNky
>>582
> 以下のコードは、外部テキストファイル(shift-jis)をwhileで1行ずつ読み込んで、
同様に対応してないのが普通
2020/07/15(水) 12:04:14.63ID:gwK3CNky
いい加減文字コードはUTF-8に一括変換してから
処理して戻すってことを覚えたほうがいい
2020/07/15(水) 12:07:30.43ID:gwK3CNky
>>582
echoは使うなprintfを使え
2020/07/15(水) 12:09:01.51ID:gwK3CNky
> 1行ずつ送信する理由は、たまに行間で制御コードを混ぜる必要があるためです。
意味がわからん。制御コード1文字が二行に分かれたりでもするんか?
2020/07/15(水) 13:17:28.61ID:4eO2mC8f
>>582
とりあえずシングルクォートは要るんじゃないの?
text='ダメ文字表示テスト'
2020/07/17(金) 17:54:07.38ID:pKRyHByg
>>582
>sed: unmatched '/'
SJIS云々の前にsedのコマンドがちゃんと認識されてないじゃん。
とりあえず、バックスラッシュの数を変えたり``じゃなくて$()を使ってみたらどう?
2020/07/18(土) 06:32:49.36ID:belUdedc
ひょっとしてSJIS完全対応のテキストエディタってLinuxには存在しない?
昔mousepadで盛大に化けた覚えが
2020/07/18(土) 07:03:52.09ID:6UJBCs7F
Emacs
2020/07/18(土) 10:26:12.51ID:PyiwbgQS
Vim
2020/07/18(土) 10:38:54.42ID:W7WHirLG
vscode
2020/07/18(土) 11:38:05.10ID:PyiwbgQS
バカな投稿をすると釣られた人間が正しい知識を教えてくれるメソッド
よかったな,>>591
2020/07/18(土) 11:44:04.46ID:fwbEJCvA
つまりvscodeが正しいと?
2020/07/18(土) 12:39:31.97ID:PyiwbgQS
俺のスレ読んでないの?w
2020/07/18(土) 13:28:14.79ID:fwbEJCvA
お前のレス?釣られた人間が正しい知識を教えてくれるんでしょう?
それ以外になんかあるの?
2020/07/18(土) 13:48:08.58ID:W7WHirLG
エディタも使いこなせないならwinのメモ帳でも使いなよ。sjis対応だよ
2020/07/19(日) 08:53:42.63ID:b8gde26L
お前いつも壁と話してんな
2020/07/19(日) 10:23:03.44ID:HNDAT4gV
壁だと思ってるのはお前だけで、実は人間なんだぜ(ホラー風)
2020/07/19(日) 11:15:59.84ID:W3hSYpRn
ぬりかべ「かべっ!?」
2020/07/27(月) 19:01:06.79ID:prTniRCc
manコマンドはPOSIXに取り入れられそうなのに
その表示に関わるroffコマンドは影も形もないって、
なんつーか意味あんのかそれって思う。
2020/07/27(月) 20:34:03.79ID:Sw4i8xv6
>>603
roff 使わなくても cat1 とか cat8 に成形済みテキスト置いておくだけで man
は動くんだから、別に roff なくても良いといえばいいとか、そんな理屈なのかも。
2020/07/27(月) 20:48:14.37ID:9y96d1KX
manをPOSIXに取り入れるぐらいなら
HTMLビューワーをPOSIXに取り入れたほうが良い
JavaScriptとCSSに対応させる必要はないからさ
2020/07/27(月) 20:50:03.70ID:9y96d1KX
curlをPOSIXに入れればいいのに
フル機能じゃなくていいけどREST API叩けるぐらい
2020/07/27(月) 21:12:03.12ID:vTLRE8Va
>>603
おお、するどい。
でもmanが入ってないというのはどう言う意味? POSIXとSUSの意味の違いにこだわる?

で実際manの記述を見ると文章の整形とかそれをどう作るとかは書いてないので、
そういうレベルのものは規定しないという態度なのかも。

あと事実上GNU roffが標準だと思うが、さすがにそれを規格には入れられないのかも。
かといって今更大昔のroffに制限するのもなあと。

しかし最近GNUで検索するとKingの方がヒットしやすくてうざいw
2020/07/27(月) 21:16:04.45ID:vTLRE8Va
というか、King Gnuと言ったらRMSしかありえないだろw
2020/07/28(火) 08:42:48.22ID:UlETHBDV
こんなのか?
https://www.e-hon.ne.jp/bec/SA/Detail?refShinCode=0100000000000030681001&;Action_id=121&Sza_id=F3

まだ役に立ってるよ。俺が持ってるのは 20.3 だけど。
2020/07/28(火) 13:13:59.11ID:R16GmJU5
質問。
次のような行からいずれかのvalueをきれいに削除するにはどうすれば?
name=value0,value1,value2,value3

たとえば次のコマンドだと、value1を削除できるものの、先頭か末尾か連続かのカンマが残ってしまう。。。
sed 's/^(name=.*)value1(.*)$/¥1¥2/'

残ったカンマを後で処理したらいいんだけど、そもそも一発でうまくやることができるんでは?という気がどうしても。
2020/07/28(火) 13:23:54.46ID:Mb4DOiRz
^(name=.*)bvalue1,?(.*)$
こうかな
2020/07/28(火) 13:24:17.04ID:Mb4DOiRz
文字化けてるとこは円記号な
613デフォルトの名無しさん
垢版 |
2020/07/28(火) 13:53:56.25ID:DVrEteyf
King Gnu?
どっかで聞いたことあるようなないような▪▪▪
2020/07/28(火) 14:07:36.32ID:R16GmJU5
>>611
value3の場合、末尾にカンマが残るよね?
また、value0なら先頭に残る。

どれでも一発できれいに削除できないかな?
2020/07/28(火) 14:08:46.03ID:3p32kQjL
残らないが?
2020/07/28(火) 14:25:35.27ID:R16GmJU5
残るが。
value3直前のカンマが¥1に含まれるので。
617デフォルトの名無しさん
垢版 |
2020/07/28(火) 23:58:59.24ID:2KWkEgO3
>>610
>name=value0,value1,value2,value3

頭を柔らかくして、
最初に、この末尾に、カンマを追加すれば、処理しやすい形式になる

name=value0,value1,value2,value3,
2020/07/29(水) 00:10:05.86ID:bLm2KFbe
sed縛りなの?
後方参照する必要ないんじゃない?
value[0-2] については冗長だけど、以下の形式なら全部同じようにできるかと。
'?'の正規表現って、sedだとGNU sed とかだとつかえるのかな?
'?'はウチでは使えない。

echo 'name=value0,value1,value2,value3' | sed -e 's/value0,*//' -e 's/,$//'
echo 'name=value0,value1,value2,value3' | sed -e 's/value1,*//' -e 's/,$//'
echo 'name=value0,value1,value2,value3' | sed -e 's/value2,*//' -e 's/,$//'
echo 'name=value0,value1,value2,value3' | sed -e 's/value3,*//' -e 's/,$//'
2020/07/29(水) 03:25:12.86ID:ZD2Ud5DP
>>617
Perlとかならそうするが、sedだとなかなか?
sedはあんまり使わないので、そうしたくてもよくわからない。。。

>>618
sed縛りではないけど、Linux最小インストールでも対応したいので、sedくらいしか?
ほかに使えるならそれも可。

後方参照してるのは、「name=」で始まる行だけに限定したいから。
それ以外の行はそのままで。

「?」が使えない正規表現があるの?
POSIXに含まれてなかったっけ?

ちなみに現在はこうしてたっけかな?
細かいところはちょっと違うかも。
sed -r 's/^(name=.*)value1,?(.*)$/¥1¥2/;s/^(name=.*),+$/¥1/' -i file.txt

なんかくどくて、もっとさっぱり書けるやろと。。。
2020/07/29(水) 05:18:27.85ID:W2ZwK0DF
Ruby で作った

text = <<"EOT"
a
name=value0,value1,value2,value3
x
EOT

word = "value2,"

text.each_line do | line | # 1行ずつ処理する
# 先頭が、name= 以外は処理しない
next unless line.start_with? "name="

line.chomp! # 末尾の改行を削除する
line += "," # 処理しやすいように一旦、末尾にカンマを付ける

line.slice! word # 取り除く
line.slice! -1 # 末尾のカンマを取り除く

puts line #=> name=value0,value1,value3
end
2020/07/29(水) 06:28:49.20ID:Fq72tfsf
sedの正規表現で最短一致は使えないって地味に罠だよな
[^]で工夫すれば行けるらしいが
622デフォルトの名無しさん
垢版 |
2020/07/29(水) 07:17:15.52ID:SoSaYlfN
for((aa=-1;aa<4;aa++)); do echo name=value0,value1,value2,value3 |sed -e"/^name=/{s/$/,/; s/value${aa},//; s/,$//;}"; done
623618
垢版 |
2020/07/29(水) 11:42:17.47ID:bLm2KFbe
>>622
完全に同意。個人的には {} 使わないで -e で並べたい派だけど。
*を使うより厳密に置換できてよいと思う。

619には以下の書き方のほうが分かりやすそう。
sed -e '/^name=/{s/$/,/; s/value0,//; s/,$//;}'

>>619
sedの正規表現では '?' 使えないはず。
GNU sed でもオプション使わないと通らないのが確認できた。
できれば -E を使ってほしいかな。個人的には。
-E, -r, --regexp-extended
use extended regular expressions in the script
(for portability use POSIX -E).
2020/07/29(水) 11:58:07.49ID:10XNhQ52
そうやって、外部コマンドをあれこれ駆使して
どうにかして簡単に書ける方法はないか?に
無駄な時間使ってるのを見るとアホやなぁって思う
一般的なやり方でできないなら諦めろよ
そのコマンドを使うのが間違ってるんだ
2020/07/29(水) 12:32:30.11ID:ZD2Ud5DP
>>622
なるほど。
sコマンドで全行置換することしか頭になかった。。。
パターンマッチで行を特定してから、複数の置換を{}でまとめて行えばいいのか。

なんかsedの要領がわかった気がするぞ。
どうもありがとう。

>>620
Rubyなら、split()とjoin()を使ったらもっとさっぱりにできそう。
2020/07/29(水) 12:44:55.15ID:ZD2Ud5DP
>>623
いや、>>622でちゃんとわかったで?
# ちょっとかんがえたけど。

正規表現の「?」は確認するとたしかにダメだった。
-Eは、「¥bvalue」としたい都合でつけてたから、あんまり意識してなかった。
と思ったら、こっちは-Eがなくてもよかったのか。
なんかもうメチャクチャだなー。w
2020/07/29(水) 13:19:38.86ID:E/WNSRes
データがカンマを含む場合はどうしますか?

name1=v0,"v,,1",v2,,,vvv,unko,
name2=,sss,"hdj,du,n",,ss,,,,kkkk
2020/07/29(水) 15:37:47.77ID:iTLEUVw7
特定の行で区切った塊ごとで処理したいんだけどいい方法ない?
例えばこんなのだったら====で区切って

abc
def
==== 1
ghi
jkl
==== 2
mno
pqr



abc〜def、ghi〜jkl、mno〜pqrという3つの塊をそれぞれ処理したい。
それと ghi〜jklという塊を処理している時は1ですよ。という数字も知りたい
(最初の塊の時は数字なし)
629デフォルトの名無しさん
垢版 |
2020/07/30(木) 06:16:08.96ID:ixil7w/z
>>628
cat |sed -ne "/^===/! {H;}; $ b ll; /^=/ {:ll; s/=//g; x; s/\n/ /g; p;}" << EOL
abc
def
==== 1
ghi
jkl
==== 2
mno
pqr
EOL
abc def
1 ghi jkl
2 mno pqr
2020/07/30(木) 06:42:42.05ID:oWxKF5YB
>>629
条件を忘れましたが、画面に出力するのではなく
任意の処理をしたいのです。

つまり

foo() {
# $1 = 番号
# $2 = 塊
}

のようなことがしたいのです。
2020/07/30(木) 06:43:43.55ID:oWxKF5YB
あと塊から改行を取り除いてはいけません
2020/07/30(木) 14:54:43.85ID:Ws4Sjpc9
$!をリセットする方法はないですかね?
空とかunsetとか0とか
2020/07/30(木) 15:15:25.11ID:l+t/gnGC
Perl 使うと楽だが、シェルスクリプトで、か・・・
634デフォルトの名無しさん
垢版 |
2020/07/31(金) 00:34:30.45ID:h2BvMEZJ
Ruby なら、

def f( num, line )
puts num, line
end

# num は、inject の蓄積変数。0 は初期値
File.foreach( "input.txt" ).inject( 0 ) do |num, line|
if line.start_with? "==== " # 先頭が、これなら
line.chomp! # 末尾の改行を削除する
num = line[ 5..-1 ].to_i # 数字の部分を取り出して、整数にする
next num
end

f( num, line )
num
end

出力
0
abc
0
def
1
ghi
1
jkl
2
mno
2
pqr
2020/07/31(金) 01:26:11.97ID:1vLgXRtq
>>630
Bashなら、プロセス置換(process substitution)でできるのでは。

<(echo;最初のデリミタ行までを抽出するコマンドライン)
<(echo 1;最初から次のデリミタ行までを抽出するコマンドライン)
<(echo 2;最後のデリミタ行からを抽出するコマンドライン)

としたら、先頭行が番号、それ以降がテキスト行として読み込める。

個人的には、さすがここまでのレベルならPerlとかでやったほうが。
2020/07/31(金) 19:26:43.51ID:qTuk7lt4
bashの#!でのオプションについて質問。

先頭行を次のようにすると、「invalid option name」エラーになります。
#!/usr/bin/bash -o pipefail
...

しかし、コマンドラインに同じように書くとエラーになりません。
/usr/bin/bash -o pipefail -c '...'

どうして?
-eならどっちも問題ないので、#!行のオプションの解釈になにか秘密があるんだろうけど。
2020/07/31(金) 20:01:20.64ID:j/9/9lyu
>>636
MacOSやFreeBSDだと上手くいく。
原因はLinuxのexecl()関数が
「/usr/bin/bash」と「-o pipefail」という
二つの引数を実行しているせい。
とうぜん「o pipefail」というオプションはないので,怒られる。
2020/07/31(金) 20:03:04.24ID:j/9/9lyu
さらに言うと,
シバンはPOSIXが「実装ごとに挙動がバラバラなんで俺はこの動作を規定しません」
って公言するくらい,各種OSごとに扱われかたが違う。

今調べられないけど,古いAIXとかだと
「!/usr/bin/bash -o pipefail」とかいうコマンドを探しにいってエラー吐いてた記憶がある。
2020/07/31(金) 20:39:05.80ID:k/mzlDiC
>>636
/usr/bin/bash -o pipefail ではなく
/usr/bin/bash "-o pipefail" を実行している

まあ素直に
#!/bin/bash
set -o pipefail
って書けってことだな
2020/07/31(金) 21:40:13.69ID:j/9/9lyu
もう書いたんだが…
2020/07/31(金) 21:44:42.11ID:qTuk7lt4
>>637
>>639
どうもありがとう。
要するにLinuxの不具合みたいなもんだけど、しかし「仕様」ってことか。。。

AIXかは知らないけど、シバンのトラブルはたしかに昔、Perlのドキュメントかなにかで見た気もする。
今でもあるとは。

ちなみに最終的にはこうしといた。
#!/usr/bin/bash -euC
set -o pipefail
...
2020/07/31(金) 21:56:20.95ID:k/mzlDiC
/usr/bin/bashにbashがあるとは限らない
というか普通無い
2020/07/31(金) 22:30:39.13ID:j/9/9lyu
>>642
Bashの位置に依存しない為には
#!/usr/bin/env bash
↑こうする。

しかし,envが/usr/bin/envにあるかどうかも分からない(以後無限ループ)
2020/07/31(金) 22:35:57.38ID:h2BvMEZJ
普通は、/bin/bash
じゃないの?
2020/07/31(金) 22:55:43.76ID:qTuk7lt4
>>642
ないのは見たことがない。
たとえばどんな環境?

>>644
HFSかRHELのドキュメントかなにかで、/binはシングルユーザー用、/usr/binはマルチユーザー用となってたような。
さらに環境によっては/bin→/usr/binのシンボリックリンクでさえあるようなので、わりきって区別せずに/usr/binだけを使うことに決めた。
2020/07/31(金) 23:03:07.55ID:w9lTjcUH
$ lsb_release -d
Description: Ubuntu 20.04.1 LTS

$ ls -1 /bin/bash
/bin/bash

$ ls -1 /usr/bin/bash
ls: cannot access '/usr/bin/bash': No such file or directory
2020/07/31(金) 23:31:35.93ID:BwwodwaD
>>645
Linuxの場合/usr/binにbashがあるのは/bin -> /usr/binになっている環境ぐらい。それ以外はほぼ間違いなく/binにある。元々シングルユーザーモード用の/binになかったら、シングルユーザーモードでシェルが使えないでしょ。
最近は/binと/usr/binを統合する動きが進んでいるから将来はどっちでも良くなるかもしれないし、あるいは/binがなくなるかもしれないけど、今はまだ従来の環境も普通にあるから/bin/bashがいい。その為にシムリンクを張っているわけなので。
UbuntuやDebianは、今インストールすると統合されるけど、従来の環境からアップデートした場合は統合されない。
あとGentooとかは今クリーンインストールしても統合されない。
2020/08/01(土) 01:21:21.09ID:6XTg5Iao
>>647
シングルユーザー環境はまったく想定外なので。。。
ファイルパスをあわせても、実際の具体的な環境は把握できてないし、どうせ動作確認もしないから、きっぱりわりきることにしたのだ。

binの統合の話は、RHEL8のドキュメントで見た気がするけど、だったらもうとっととのっとこう、と思ったのもある。
うちのメインはCentOSだし、そうなってない環境を使うことになったら自分でシンボリックリンクを追加したらええんやろ、ということで。
2020/08/01(土) 08:14:01.78ID:6JQgXAfu
又聞きで悪いが,Oracleかなにかだと,/usr/bin/にはGNU系の製品が入ってなかったとか。
/export/以下にあるとかなんとか。
2020/08/01(土) 08:30:02.46ID:2HCIDb75
/opt/bin とかに入ってるのもあったなぁ
651649
垢版 |
2020/08/01(土) 10:05:25.94ID:6JQgXAfu
>>650
あー。これで思い出した。
/opt/bin/だわ。
/export/は利用者のホームディレクトリとかがある所だわ。

Bashの場所とは関係ない話になるけど,
昔$HOME変数とか使わずに/home/***以下にあるやろって決め打ちしてたら
Solarisではまさかの/export/home/***にあるっていう罠に引っ掛かったw
2020/08/01(土) 13:49:06.35ID:U7vGE7b3
何十年経ってもディレクトリが分類できる未来はないんやな
653デフォルトの名無しさん
垢版 |
2020/08/01(土) 17:25:34.94ID:WzMhf7ZH
>>652
OS作る時にOSの仕様として組み込んでしまうぐらいしか方法無いと思う。ちょっとでも自由があると必ずそこから崩れる。
2020/08/01(土) 23:28:16.58ID:huzWWnKB
10MBぐらいのテキストファイルでさ
指定したバイト目から〜バイトの範囲を取得っていうのを
やるととしたらどういう方法が一番高速だろうか?
bashismなし。外部コマンドは呼び出してもいいけど遅いな
2020/08/02(日) 00:54:32.67ID:hIQzyyzC
Perlでワンライナーが速そう。w
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況