シェルスクリプト総合その27

**名無しさん＠お腹いっぱい。** · 2018/05/03(木) 17:54:23.25

シェルスクリプトの総合スレです。
□お約束
・特記なき場合はBourne Shell(/bin/sh)もしくはPOSIX準拠の互換シェルがデフォルトです。
　bash/zsh/ksh/ash/dash/yash/poshなどの専用機能に依存する場合は明示しましょう。
　Linuxユーザは/bin/shの正体がbashまたはdashなので特に注意。
　FreeBSDユーザは/bin/shの正体がashなので注意。
・POSIXについてのリンクは https://en.wikipedia.org/wiki/POSIX にまとめられています
　最新の仕様はこちらへ http://pubs.opengroup.org/onlinepubs/9699919799/
　（左上の「Shell & Utilities」から参照することができます。）
・v7 shに一番近くて、現役（？）のshは、OpenSolaris由来のheirloom sh。
　 http://src.illumos.org/source/xref/illumos-gate/usr/src/cmd/sh/
　 http://heirloom.sourceforge.net/sh.html
・csh/tcshのシェルスクリプトは推奨されません。
　(理由は「csh-whynot」でググれ)
・UNIXにはシェルスクリプトに便利な小さなコマンドがいろいろあります。
　manや参考リンクを見ましょう。
　aproposないしはman -kでそれらしい単語による簡単な検索もできます。
・シェルで使えるワイルドカード等は正規表現ではありません。
　正規表現の話題はスレ違い(正規表現スレへ)
・シェルスクリプトのことをシェルってゆうな
□初心者へのアドバイス:
・適した道具を判断するのも頭の重要な使い方。シェルスクリプトよりも
　awkまたはperlの方が適した処理にはそちらを使いましょう。
・知らないコマンドが出てきたらmanを引きましょう。
・思い通りに動かないときは、まずは sh -x でトレースしましょう。
□回答者への注意事項:
・シェルスクリプトでの処理方法を質問しているのに、よくわからずに
　「そういうのはperl使いましょう」と回答するのはやめましょう。
　安易にperlに逃げずにシェルスクリプトで処理するのが頭のいいやり方。
　質問に対して問題が間違ってるといちゃもんをつけるのもやめましょう
前スレシェルスクリプト総合その26
https://mevius.5ch.net/test/read.cgi/unix/1489979246/

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:10:06.96

>>345
だったら好きにすれば？

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:10:50.12

>>343
> 一度全部置換してから読み取ればいいんじゃないですか（名推理

そして一行ずつ読み取るわけですねｗ

そりゃそうでしょう。\nを全部改行コードに戻してしてしまったら、
区別できないですからね

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:11:08.39

>>345
既にCSVをどうするのかという話題に変わってるんですよ。
空気読んでくださいよ。

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:11:30.84

>>346は>>345っぽいけど、そうなら他人を頭が悪いとは言えんだろうw

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:12:08.78

>>347
> だったらお前がそのわけわからんCVS形式でない答えを応えれtばええんちゃんですかね

データの中に改行コードがあるってだけで、
フォーマットは最初から指定してないよ？

その場合どういうやり方があるでしょうって話なんだが、
CSVだと思いこんで効率の悪い方法しか思いつかず
指摘したら逆ギレするのやめなよ？ダサいから

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:12:51.65

>>338
MINIX でも使ってるの？

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:13:10.06

>>351
なにが言いたいのかわからんが、RFCのCSVの仕様に改行コードを
エスケープするという仕様はない。ダブルクォートでくくればいいだけ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:13:34.23

>>353
へー、MINIXも遅いんですねー

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:14:28.24

えっ、一行づつ fork + exec してるって本気で思い込んでるんだ…

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:16:58.31

>>352,354
...はあ...
マジで言ってるの？

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:22:35.88

>>356
外部コマンドを呼び出すならそうだね
まさか外部コマンドを呼び出さないで置換できるとでも思ってのかい？ｗ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:23:33.86

データ | フィルタ | シェルスクリプト(関数なり) | フィルタ > データ
フィルタをどう作るかは具体的じゃないとでCVSしか例にあげてないからCVSなだけなんだが
っていういたって普通のことなのに。そうじゃないナニかを想定しているらしけど、そのナニかの具体的なことは全く言わずに指摘wという否定なだけだもんな
その指摘もトンチンカンなこともあり、ただただ無闇に偉ぶりたいだけにしか見えんなあ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:24:15.94

>>357
仕様よんでこい

http://www.kasai.fm/wiki/rfc4180jp

CSVの仕様においてエスケープとは
ダブルクォート " を "" と二つ連続させるものだ
\記号でエスケープする仕様はない

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:25:32.32

>>360
それは最初＆最終形態だよ。途中で処理の都合のよいようにするのに仕様もなんもないわっ
マジあほとしか思えない

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:26:22.60

もう一つ解説記事

https://codezine.jp/article/detail/2364

> 　改行コードはプラットフォームによって異なります。一般的にWindowsは
> <CR><LF>、UNIXは<LF>です。

> 　※2008/04/16追記：RFCでは末尾(レコードの区切りとして)の改行は
> <CR><LF>を推奨しています。CSVを解釈するプログラムではどちらの
> 改行コードでも読めるように作ることをお勧めします

> ダブルクォートで囲む場合
> "山田","太郎","値に
> 改行や,カンマや""ダブルクォートが含まれても問題ありません。"

>　まれにCSVの方言で\エスケープを行うことがあります。
>
>\エスケープを行う特殊な例
>"山田","太郎","値に改行\nや\,カンマや\"ダブルクォートが含まれても問題ありません。"
>　この方言はあまり普及していませんので、利用するのは避けましょう。
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:26:49.29

>>361
最終形態とか何いってんだ？
RFCの仕様の話をしている

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:27:48.82

>>363
シェルスクリプトでどう扱うかだぞ？処理をどうするかだぞ？なに言ってるの？プログラミング知らないの？

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:28:23.86

CSVスレになってんのはなぜなんだ
勉強にはなるけど

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:28:48.64

もう一つｗ
https://www.upken.jp/kb/csv.html

> RFC4180準拠
> 　基本
> 　ヘッダーはあってもなくてもよい
> 　空データフィールドがある
> 　前後にスペースがあっても無視しない
> 　ダブルクォーテーションで囲む場合は同じレコードのすべてのフィールドをダブルクォーテーションで囲む
> 　改行、ダブルクォーテーション、カンマを含むフィールドは、ダブルクォーテーションで囲むべき
> 　ダブルクォーテーションで囲まれているフィールドでダブルクォーテーションを使用する場合は、ダブルクォーテーションでエスケープする
> 　非常に長い文字列を考慮
> 　複合パターン

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:29:45.29

>>364
> シェルスクリプトでどう扱うかだぞ？

CSVを扱うという話はしてない
\ でエスケープするのは遅くて無駄という話ならしたがね

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:31:47.04

>>367
お前はどうかしてる。ここにきてCVSの仕様を得意げにあげてるのと同じヤツってことはないよな？

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:34:02.42

>>358
左手でつり革に捕まっていても、左手で痴漢できるそうですよ
日本の裁判所は素晴らしいです

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:35:15.34

>>368
どうかしてるって言うなら、答えを書きなよ
なんど言われれば分かるんだ？

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:36:40.96

>>368
CSVの仕様を得意げにーっていうのは

> 因みにCSVはRFCで「内部改行はCRLF」と定まっているので
↑こいつのことですかな？ｗ

まあ、RFCでCRLFと決まってないんですがｗ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:36:59.71

>>370
答えって...だいたい想像できるだろう。めんどくさいだけで
お前のやり方がわからんわ。指摘するお前が出せよw

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:39:16.71

>>372
「だいたい」しか「想像」出来てないのに偉そうだなおい
かけないんだろう？だから人にいちゃもんつけるだけなんだろ
いい加減ごめんなさいって言った方がいいぞ？

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:39:21.31

1データの中に改行が含まれてる
そのままだとデータ区切りの改行と見分けがつかない
CSV形式の話はしていない

\nにエスケープする方法では、1データずつ処理しなければならず
外部コマンド呼び出しの必要があるから遅い

ここまでは理解できてんのかなー？

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:39:51.59

>>371
いや、お前のこと。たぶん
それは単に利用できそうなキーポイントでそれを利用してって話でしかないな
たぶん、お前だろうが、得意げには仕様が絶対でどうであれ利用しちゃダメっていう変なヤツ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:40:34.63

>>375
俺は最初からCSV形式のデータを扱う話なんかしてないんですが？

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:42:26.75

>>373
だいたいの普通の人はその処理方法を想像できる「だいたい」だし、想像＝書けるってことなんだが
お前が無闇に絡んでる＆お前も具現生ゼロなのになんで謝らなきゃならんのねん

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:43:16.71

>>376
だったら何を言いたいのかさっぱり。単に絡みたいだけか

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:45:59.83

今更なんの話かわかってませんっていうのかよｗ
↓この話だろ。「？」で聞いているところが質問だよ。それぐらいわかれアホ

Excelから出力したCSVのように一行（？）の中に改行が含まれた
データを扱うにはどうしたら良いでしょうか？

もう少し具体的に書きます。

カンマ区切りのCSVデータだと仮定して、
シェルスクリプトの中に関数を一行ごとに呼び出し、
列を引数に対応させたいです。

例えば以下のような内容のファイルがあったとして
a1,a2,a3,a4
b1,b2,b3,b4
c1,c2,c3,c4

syori "a1" "a2" "a3" "a4"
syori "b1" "b2" "b3" "b4"
syori "c1" "c2" "c3" "c4"

という風にsyori関数を呼び出したいのです。

ただし実際には各項目（a1等の部分）にExcelから出力したデータのように
改行やカンマやダブルクォートやシングルクォートや空白が入ることがあるのです

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:50:13.04

何を言っているのだか。最初からCSV形式のデータ扱う話なんかしてないって言っておきながら、前レスではCVSのこと「だけ」のレスなことだから、そのCVSのことだけのことを何を言いたいのかだよ

すでに書いたが、
データ | フィルタ | シェルスクリプト(関数なり) | フィルタ > データ
でしかない。CVSはどうフィルタを書く上では具体的にそれしかでしかないからだけだな

てか、その設問がそんなにきになるならお前が答えろよっw

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:54:06.97

>>380
お前、実際に脳内でどう変換されるか考えてないだろ？
最初のフィルタで\nを全部改行コードにしてしまうと
シェルスクリプトで区別できなくなるんだよ。

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:54:09.52

>>380
× CVS
○ CSV
まあ、たぶん他でもやってるだろうけど、すまんが、読み替えてください

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:55:28.23

>>381
はあ？？？？
最初のフィルタでやることは改行コードを他の何かにするに決まってるだろ。なんで逆のことをするねん？さっぱりわからん

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:56:05.49

ダメだ。異次元すぎる>>381なんて言われると、バカだろとしかおもえん

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 16:57:43.94

>>383
>改行コードを他の何かに
行端／レコードの終わりでない改行コードだけな。異次元な人なので、行端／レコードの終わりもと思われそうなので、いちおうw

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 17:01:19.44

>>383
> 最初のフィルタでやることは改行コードを他の何かにするに決まってるだろ。
はい、言質を取りました

**386** · 2018/06/10(日) 17:02:32.48

最　初　の　フ　ィ　ル　タ　で　デ　ー　タ　に　含　ま　れ　る
改　行　コ　ー　ド　を　他　の　な　に　か　に　変　換　す　る　な　ら　ば
今度はシェルスクリプトの関数に渡す前に
改行コードに戻さないといけません

でないとこれが実現できません

> syori "a1" "a2" "a3" "a4"
> syori "b1" "b2" "b3" "b4"
> syori "c1" "c2" "c3" "c4"
>
> という風にsyori関数を呼び出したいのです。

なので1データごとに改行コードをもとに戻す処理が必要になります。
すでに指摘してますがforkが発生し遅くなります。

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 17:02:57.65

言質ww
まあ、永遠に「否定だけ」してろ。もうオツムの具合わかったので、いいよ、どう思われようが

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 17:04:45.37

>>385
それを実現するには1データずつ処理　
しなければいけませんね。

デ　ー　タ　全　体　を　一　気　に　変　換　し　よ　う　と　す　る　と、
区別できないんで

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 17:05:24.55

>>387
言い方が伝わらなかったようで、それは残念。データの改行を他の何かにな。そういう意味での>>386なんだがなあ。まあ、言い方は悪かったかもしれない
で、その指摘はなんらアホな指摘にしかなってません...もう、いいや、勝手にしてくれ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 17:07:18.69

>>388
「言質」しらんのか？
そんなことじゃ不慮の事故で死んだ時困るぞ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 17:07:51.94

多分\エスケープ云々は途中でなんらか処理をする時にRFC準拠のエスケープだと不都合だからじゃないかな
「Mika says "I'm Happy"」という文を一つのフィールドとして処理するとき
RFC準拠だと
「Mika says ""I'm Happy""」になるけど、例えばこれをsed(1)やらawk(1)に通したいと思ったときは
「Mika says \"I'm Happy\"」という形にしたほうが処理しやすいでしょう？

そういうことなんじゃないかな。

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 17:09:13.29

>>389
シェルスクリプトに合わせた出力すればええねん

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 17:09:28.43

>>390
だから　デ　ー　タ　の中の改　行を何かに変　換すると
もとに戻す処　理を　一　行　一　行やらない　といけないから
遅くなるって指摘をずーっと前にした
その遅く　なる理由を思　いつかなかった　んだろ？

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 17:09:57.89

>>393
>>392 でも言ってるよ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 17:10:08.09

つーかなんでさっきから、おっぱいがいっぱいとかで
書き込めないんだ？変な言葉書いてないだろ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 17:17:21.14

>>394
なんで一行一行なんだか。sedかtrでやりゃええことやん。それが一行一行か？
遅くなる遅くなるって遅くなるに決まってるやん。条件によりそれが妥当かどうかなんてなんでそう否定できるのか不思議でならない
んな速度速度言うなら、Cなりでやればって言うw 遅い遅い言うてるけど、お前のもじゃどうすんの？ってのがさっぱりだな

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 17:18:30.12

>>395
何を言いたのかわかりません

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 17:22:11.92

>>392
> 「Mika says \"I'm Happy\"」という形にしたほうが処理しやすいでしょう？
今の話はもっと複雑で

「Mika says "I'm Happy
'couse picked up \10."」

という文だったらどうするか？って話なんだけどな。
いやわかるよ。どうすればいいかは。
問題はどうやってそれを実現するかって話

sedやawkに通す前に、変換すんの？

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 17:24:25.73

>>399
最後にマジれすすると最初のフィルタはひとつのawkだけでできる。めーんどくさいけど

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 17:25:37.95

>>397
sedやtrを使うと遅いfork、子プロセス生成が行われるからね
データ量に比例してその回数が増えるやり方は駄目
1回か固定の数回でできるって言うなら話は別だけど

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 17:26:19.38

>>400
最初だけできてもだめ駄目

これが実現できないと駄目

> syori "a1" "a2" "a3" "a4"
> syori "b1" "b2" "b3" "b4"
> syori "c1" "c2" "c3" "c4"
>
> という風にsyori関数を呼び出したいのです。

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 17:39:23.49

>>401,402
ダメダメ言ってないで、少しは考えろ。どっちも指摘がトンチンカン

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 17:48:10.30

思ったんだが
正規表現でやらずに有限状態機械を作って
if ダブルクオートで始まらない
　　コンマを探して終了
else
　　""でない"に続くコンマを探して終了

とすれば解決するんじゃないかな。少なくともRFC勧告に則ってるCSVは。

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 18:47:23.27

どういうことだ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 19:24:35.96

盛り上がりすぎだろwwww一日100近く伸びるってどんだけだwwww

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 20:05:44.39

>>385
どうやってそれを区別するの？

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 20:07:14.87

>>397
sedは改行コードで切れちゃうから、データ中の改行と行の区切りの区別をつけられないだろ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 20:08:19.79

>>404
CSVじゃないらしいので、"が閉じてる必要はないだろう？

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 20:27:13.49

【またカミカゼ暴走、群馬のスーパー、重傷９人】　放射能が原因だけど、国防上、トップシークレット？
http://rosie.5ch.net/test/read.cgi/liveplus/1528627781/l50

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 20:50:13.84

>>408
後処理のだぞ。そのデータ中の改行と行の区切りの区別をつけるために最初にータ中の改行を処理して、終わったらデータ中の改行を戻すって話だぞ？
少しは処理を想像そしてからなんか言ったら？すごい近視眼で明後日な文句言う前に

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 20:55:32.25

>>409
CSVじゃないからあって言うのもいるけど、だったらデータはどう表すのだろうな
データ中の改行と行の区切りの改行ってわからなくね？そのためにデータの始め終わりを表す何かが必要でそれが何かを言ってないんだったら、それを " として話をしてもおかしくはないってか、それしかないだろう
なんでそんな近視眼なツッコミばかりやねん

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 20:56:07.54

>>282

GNU awk の FPAT を使ってみる。一論理行のデータ数は4個で固定、という前提。

gawk -v RS='\0' -v FPAT='"(([^,\n]*)|(([^"]|\\\\"|\"\")*))"' \
'function syori(v1,v2,v3,v4){ ## ここで何らかの処理 ## }
{
i=1
while(i<NF){
syori($(i++),$(i++),$(i++),$(i++))
}
}' data.txt

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 22:03:59.12

>>411
> 終わったらデータ中の改行を戻すって話だぞ？
そのときに全データの改行を一度に戻すとデータの中の改行と
データ区切りの改行の区別がつかなくなってしまうので、
1データずつ処理する＝1行ずつsedなどを実行して遅くなるってことには
気づきましたか？

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 22:29:15.51

>>411
データ中の改行とデータの区切りの改行はどう区別するんだよ。
同じコードだろ。しかもCSVじゃないんだろ？""でくくられてないんだぜ。

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 22:30:35.05

>>412
だからさ、それ、sedで書いてみろよ。
絶対おまえにはかけないから。

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 22:42:11.32

>>414-416
前処理と後処理を混同してあーだこーだ言われても。アホかっ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 22:48:58.34

>>417
言い訳はいいから書いてみろよ
前提条件は後出しでどんどん追加していいからｗ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 22:49:09.09

もうそろそろ、安全な文字に変換するというアプローチ
（例えば>>289のようなもの）が
ムダで効率が悪いってことに気づきませんかね？

もう一回煽りますね？

>>323
正直、そういう解答を出してほしかったね。だせるかなーって思っていたけど
シェルスクリプトでそういうデータを扱うなんておかしいとかのたまうばかり
\x1c（ファイル分離）、\x1d（グループ分離）、\x1e（レコード分離）、\x1f（ユニット分離）は
まさにそういう用途で使うもの。ここの連中の技術力の低下を感じる。

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 22:49:14.03

もう一から説明しないと、情報処理の基本すらわかってないようなので
バカバカしすぎだけど、

・改行がデータ中とレコードの終わりを示すのが混在している
・シェルスクリプトは基本、改行は改行でしかなく、データ中なんて知らんただの一行＝レコードがブッタ切られる
・データ中の改行を他のナニかに変えれば、シェルスクリプトは一行＝1レコードと認識する

前処理：データ中の改行だけをナニかに変える
本処理：改行が終端の一行＝1レコードを処理する
後処理：ナニかに変えたのを改行に戻す

たった、これだけのことをなぜ理解できないでトンチンカンなことばっかり言うのか。前処理をsedでできるなんて言ったことないぞ(できるかもだが、それはもっと面倒なの俺は考えんw)。後処理はsedでできることは馬鹿でもわかるだろうにぃぃぃ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 22:50:39.10

>>418
なんでそんなに出せ出せ言うのかww
その頭の悪さというか未経験ぶりは、元の質問者か？と疑うぞ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 22:50:59.99

>>420に補足すると、
（POSIXの範囲では）readは必ず改行コードでぶった切られる

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 22:53:10.76

>>420
> 前処理：データ中の改行だけをナニかに変える
> 本処理：改行が終端の一行＝1レコードを処理する
> 後処理：ナニかに変えたのを改行に戻す

それは理解しているが、
1. 改行を何かにまた何かを改行にするには、どうやるのか？
2. 変えるまたは戻す処理は1コマンドで実行できるのか？

の答えが、1行ずつfork、execしなきゃならないから
データ量に比例して遅くなるって話をしてる

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 22:55:00.78

>>423
お前にじゃねえよ。お前は面倒なのでいいよw
遅い遅い言っていれば。1行ずつfork、execしなくてもいい方法もあるのにそこには考えが及ばないだろうし

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 22:55:49.68

やたらスレが延びてるけど動くモノが出来上がる気配がない
さっさと手を動かせよ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 22:56:51.41

>>419
「効率悪い」のに「そういう解答を出してほし」かったの？
ちょっと意図が分かりかねるな

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 22:56:58.92

> 1行ずつfork、execしなくてもいい方法もあるのに

それがもっと遅くなる方法だったら笑うがねｗ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 22:58:11.88

>>426
お前馬鹿だわ
U+001EやU+001Fを区切り文字として利用するんだから
わざわざ改行コードなどを使われない文字に変換する必要ねーだろｗ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 22:58:14.56

最初の質問者じゃなかった、何を目的に延々と絡んでるのか意味不明すぎ
できないできないってばかりで

**426** · 2018/06/10(日) 22:59:16.28

あ、「安全な文字」っていうのは「通常の用途に使われるけれども日本語圏では滅多に使われない文字」の意味だったのね。
俺の解釈としてはUnicodeに収録されてる四種の区切り文字も「安全な文字」の類に入るからさ。

勘違いしてすまんな

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 22:59:31.44

bash拡張は置換命令あるけど、
POSIXシェルの場合、外部コマンドを呼び出す以外に
置換命令はないんだよ。知ってる？

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 23:03:46.06

>>430
> 俺の解釈としてはUnicodeに収録されてる四種の区切り文字も「安全な文字」の類に入るからさ。
まさに、ぽか～んだわｗ
今度はお前にUTF-8の講釈をしないといかんのか？

Unix系で簡単に使えるUnicodeはUTF-8しかないが
（その他のエンコードは、文字の中にNULL文字が入るためシェルスクリプトで扱えない）

そのUTF-8はASCII互換であるため、U+001EやU+001Fは
ASCIIコードの0x1Eと0x1Fと全く同じであるため、
この文脈で、Unicodeかどうかなんて考える必要ないんだよ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 23:05:23.11

>>428
それは元々のデータがそうであるってこと？そんなんだったら別にこのスレで話題にするようなもんじゃないだろう
いつからそんなのが前提になってるねんwなんかムチャクチャぶりが...ww

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 23:07:34.36

>>430
なんか変に絡まれてるな
全く理解できるから気にすんなw

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 23:13:46.83

>>433
> それは元々のデータがそうであるってこと？

ちょっと違うな
「元々のデータがそうであってもよい」ってこと

元々のデータ形式について指定はないのだから
（処理するには効率の悪い）CSVデータでもOKだし、
どんなデータでもよい

そのデータ形式も含めて、
どうしたらいいでしょうか？という話だ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 23:15:22.00

>>435
データの改行とそうじゃない改行をどうすんの？どうやんの？

**435** · 2018/06/10(日) 23:16:17.88

まあ、そのデータもシェルスクリプトで生成はするんだけどな

シェルスクリプト１ → 何らかのデータ形式 → シェルスクリプト２

「何らかのデータ形式」のデータの中に（データ区切りの改行とは別に）
１データの値として改行等が含まれることがあるのでどうすっかなーって話

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 23:16:40.28

>>432
お前は>>323を引用して
> そういう解答を出してほしかった
と言ってるんだろ？ UnicodeはASCIIの範囲ではそれと互換なんだからUnicodeかそうじゃないかなんてどうでもいいだろうが
お前が言ってるのは
「フィールド区切りにはカンマやアルメニア文字ではなくそれ専用に用意されている文字種を使いましょうね」
ってことだろ？なんか間違ってる？
「ポカーン」とするのもいいけれど、その前に文章をよく読め。脊髄反射でレスするな。

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 23:17:19.92

>>436
> データの改行とそうじゃない改行をどうすんの？どうやんの？

そこをどうするのが質問だって～の

> Excelから出力したCSVのように一行（？）の中に改行が含まれた
> データを扱うにはどうしたら良いでしょうか？
って書いてあるんだろ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 23:18:11.57

>>437
ん？変換するんじゃないの？変換するなら別にコードがどの値とかは関係ないだろうし？？ん？？

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 23:19:01.94

>>438
> ってことだろ？なんか間違ってる？

間違ってるよ。
>>289 の案に対して置換すんなボケっていってる

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 23:19:23.68

>>439
初期から出てるだろ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 23:20:29.10

>>440
だから　改行コードとか\を　安全な文字に置換すんなってｗ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 23:21:35.91

また変換すんな君が出てるし。代替案を何も言わずに遅い遅いだけな。お前が遅々として進まんわっ

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 23:21:59.29

>>442
> 初期から出てるだろ

残念　ながら出てない。 \ を安全　な文字に変　換ってことは
つまりデータを　変　換すると言ってる　わけだが、
データは　変換（置換）するななってのが
俺の煽ってる内容

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 23:22:01.17

>>435
CSVのRFCはフィールド・レコード区切りにU+001F/Eを使えなんて一言も言ってねぇぞ
つーかそれこそコンマと改行が区切り文字ですよと言ってる。
そういうデータを扱うことを議論してる時に、横から偉そうな態度で
「データ区切り専用の文字があるんだから元のデータにそれを使うべき」
なんて言われてもなぁ……。
あなたは論理的思考に弱いようだからもう一度同じことを違う言い方で繰り返すと、
「前提を無視した発言は控えてください」
分かった？

**名無しさん＠お腹いっぱい。** · 2018/06/10(日) 23:22:47.84

>>445
お前は何も進まないので、もう以後無視します