CSVファイルのスレ
おそらく一番簡単なデータベースと思われるCSVファイルについていろいろ語りましょう。 CSVファイルは駄目ですね。TSVの方がいい。
あとダブルクオートでくくられたりすると処理するのが面倒。 >>1
csvを略語から元の名称に直せ。
csv形式のさまざまな種類をその名称とともに挙げよ。
csv形式を扱う各言語の有名なプログラム、モジュールを列挙せよ。
(少なくともC++, Perl, ruby)
それから議論しましょ。
>>4
1.の解答: comma separated value
2.の解答: コンマ区切りCSV、空白区切りCSV、TAB区切りCSV、K3形式
3.の解答: 誰か書いて
お前みたいにクソスレ立てるやつもドラゴンボール厨と一緒なんだよ
シネ
このホストでは、しばらくスレッドが立てられません。
またの機会にどうぞ。。。
ホストW144096.ppp.dion.ne.jp
データ構造と探索アルゴリズム
名前: 名無しさん@お腹いっぱい。
E-mail:
内容:
データベースと言うとその操作方法の方が重要視されがちですが、
底辺にあるデータの構造とアルゴリズムの理解も時には必要かと思います。
ここではそういった話をしていきましょう。 >>6
オペラ信者氏のニセモノまで出てきてますねー( ´∀`) >>6
小手半引っ込め!
>>5
残念でした〜
Comma Separated Valuesが正解。
>>5
>2.の解答: コンマ区切りCSV、空白区切りCSV、TAB区切りCSV、K3形式
和訳すると
コンマ区切りカンマ区切り値
空白区切りカンマ区切り値
TAB区切りカンマ区切り値
K3形式
という事ですね。意味和漢ネーヨ。 >>4
3.の解答
C++…Boost::Regex++::Split
Perl…標準のSplit
ruby…氏ね >>11
ruby氏ねモジュールに萌え♀
ダウソ先教えれ
>>6
本当に騙されている人を見かけたので、一応。 偽者です。 そんなもん見りゃわかるよ。
なんで必死に弁解してんの。本人?
スレに沿った話してくんない >>15
言葉が足りなかったね。書き直す。
「本当に騙されている人を見かけたので、一応。 偽者です。
ドラゴンボール側の荒らしです。」
http://pc2.2ch.net/test/read.cgi/db/1057073735/8
> 荒れてるねえ。DB板住人と思われるヒトまですごいレスしてるし。
彼はドラゴンボール側の荒らしと分からなかったみたいだから。
分かった? 俺は荒らしに反応するやつも荒らしだから
無視してCSVファイルの話してくれって言ってんだよ・・・・
もういいよ好きにしてム板に帰るから 荒らしに騙されて反応するのを防ぐために、1行注意書きがあればいいかなと思っただけ。
悪かった。もうここでやめとく。 荒らしの煽りや釣りに反応する低脳は荒らしと同じ
荒らしは放置するのが定説。
さて、ム板に帰ります。 友達のハッカーに頼んで個人情報解析してもらいますんでそのつもりで(^^;)
さて、ム板に帰ります。 >>2 あとダブルクオートでくくられたりすると処理するのが面倒。
しかし、データの中にまぎらわしい記号があると処理が大変なんで
必要に応じてダブルクオートでくくった方が良くないか?
さて、ム板に帰ります。 ニュ速からきました
/ \ ______
/ / \ \ /
| (゚) (゚) | < ちんちん シュ!シュ!シュ!
| )●( | \______
\ ▽ ノ
\__∪ /
/  ̄ ̄ \
>>1
csvの概要が出揃ったとして、新しい話題はないか。
ruby は 1.8.0 preview4 から cvs モジュールが標準で付いてくるようになった。 ∧_∧ ∧_∧
ピュ.ー ( ・3・) ( ^^ ) <これからも僕たちを応援して下さいね(^^)。
=〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
= ◎――――――◎ 山崎渉&ぼるじょあ (⌒V⌒)
│ ^ ^ │<これからも僕を応援して下さいね(^^)。
⊂| |つ
(_)(_) 山崎パン (⌒V⌒)
│ ^ ^ │<これからも僕を応援して下さいね(^^)。
⊂| |つ
(_)(_) 山崎パン 山崎パンバスター
_
/ _`j
/ /`ー'ヽ←ジャム
〈 `ヽ `ヽ ↓
`、 ヽ,∧_∧ ゜。 '(⌒V⌒) <<これからも..ボクヲ..
イッタダキ 〉 ( ゚) ゚' o.ヽ^^/ グニュウゥゥッ
マーース./ ノ  ̄⌒ヽ ⊂「 〉つ
ノ ' L `ヽ./ ∠)
/ , ' ノ\ ´ /
( ∠_ ヽ、_, '
i ( ヽ
_,, ┘ 「`ー-ァ j
f" ノ { /
| i⌒" ̄ / /_
ヾ,,_」 i___,,」
ファイルメーカーがなんか別なの吐いてたような。
なんだっけ。 CSV(Comma Separated Value)を扱うクラス
CSVTokenizer & CSVLine
http://www.wakhok.ac.jp/~tomoharu/Java/csv/index.html
こんなんあったぞ。
詳しく見てないからよくわからんが・・・・。 改行が行の区切りのフォーマットなんだから、セル内に改行なんて無いだろ。 >>41
MS製品から吐かれるCSVには入っている事がある
しかも吐いた製品自身で読めないというバカ仕様 某M$のOfficeXPは、CSV形式で保存しても、各行のカンマの数が違ったりするのだが、あれはいったいなんなんだ?
てっきりCSVってのは各行の項目数は一定なのだと思って、そうシステム作ったらOffice2Kの頃はよかったが、いよいよOfficeXPになったら牙をむきやがった。
つーか、カンマで区切っただけのテキストデータに対して、nullだとか、数値だとか夢見事を語る人間もどうかと思うが。 規則を守って皆と仲良くするのではなく、
わざと他と違う同名の独自規格を作って喜ぶ会社だし。
Officeは97で終わったんだよ。 文字列ダブルクォート囲みのCSVなら、タブも改行も文字として格納できる。他形式では真似できんだろ。 >>45
それが出来たらCSVと言うフォーマットではない。 >>46 >>41
事実上の標準という言葉は知ってるんだろ。
CSV1形式とCSV2形式は知ってるか?
レコード区切りは CRLF、セル内改行は LF
>>43
カンマの数は規定行数ごとに判定されている。
Excel の CSV 仕様嫁。
>>42 は Excel で出力した後、エディタかプログラムが
改行の形式を変えてしまったのを気づいてないだけ。 >>48
要するに、
マ イ ク ロ ソ フ ト 製 品 を つ か え !
ということですね。 >>49
客が Excel で作った CSV が認識できない! とか読み込めない!
とか言うから 「現バージョン Excel 以外での読み書きはサポートしない」
ことを明言した上でそうした。他の PJ も結局そうなった。
昔は Excel の独自形式なんかダメですよ、とわざわざ説明していたが
Excel がExcel がって何回も聞くと、なんかアホらしくなってきてな。
MS が死んだら死んだでその時の標準に合わせるよ。 分かります、分かります。
漏れも、文献データベース作るっていうから、
SQLとかUnixDBMとか考えて構想練ってたら、
みんなExcel使ってるはずだから、Excelで作る、
ときやがった。じゃあ、公開は?てぇと、XML形式
でも保存して、DHTMLかXHTMLかで表示させる
プログラム書くだってよ。何かなぁ。
エクセルはCSVの最初の行の最初のフィールドがIDから始まると読めない。
かなりはまった。
>>54
おー、こんなのあったんだ。やられたって感じがする。
古くからあるみたいなんで、なんとなく信頼性も高そうだ。 read onlyなんだからそりゃ信頼性もあるでしょー みんな、camelliaって使ってる?
もうExcel持ってるなら別にいいけど。 OpenOfficeでいいだろ。
CSVしか編集できないツール入れても仕方ない。 Excelは
,"009",
と書いても文字列「009」は渡せず、数値「9」になってしまうあたりが糞。 Excelって、データの型変換の操作がいまいちよく分からない。 >>62
Excelは
,"1/2",
と書いても文字列「1/2」は渡せず、日付「1月2日」になってしまうあたりが糞。
こ れ っ て 、 ど う し よ う も な い ん か ? ,"'1/2",
ってシングルクオート入れて書け。 CSVファイル最強!!って思い込んでる客が多すぎて困ってんだよ!!
ってかDBとかシラネーだけなんだけど。 >>68
すまそ、Excel 2000 もそうなりますね。
昔はこれでよかったのに...
読んだ後にそのセル選んで F2 キー押すとちゃんと
「1/2」になるのは確認しました。なので、
一旦読みこんでから、全セルに select かけて
そのまま値をぶちこみ返すマクロでなんとかなりそう。
そのうちソースあげます。 excelでCSVファイル読むなら
めんどうだけど
「データ」→「外部データの取り込み」
で区切り文字や列のデータ型を指定して読み込む
CSV自体無理がある仕様だから
一概にExcelが悪いとは言えないと思う CSVの標準化(標準化団体とかによって)された規格ってないの? >>71
> 「データ」→「外部データの取り込み」
> で区切り文字や列のデータ型を指定して読み込む
そもそもCSVである時点で、その中にある文字は数値や日時ではなく、文字列として
取り扱うべきだと思ってるんだがなぁ。 >>74
Excelに取り込むならその時点で
日付とか数値とかで認識してくれたほうが便利(な場合が多い)ってことでしょ。
おれはこの機能は便利だと思うよ。
ただ素人には分かりづらいし、それによる問い合わせが
システム開発者にくるのはマンドクサイ >>48
自分が出力した改行入りCSVファイルを
自分で読めないのはAccessですが?
誰がExcelなんて書きましたっけ? >>76
2ヶ月ごしですか。
Excel とは書いてなかったな。スマン。 >>74
半家堂。
>>75
"1/2"が「1月2日」になったり、"001"が「1」になるのは大きなお世話。
>>79
001 -> 1を回避する方法はありますか?
教えて君でごめん!! >>81
CSVファイルはCSVファイル用エディタで弄るのが一番だぞ。
Excelにやらすからそんなつまらない悩みで時間を無駄にすることになる。
回答としては、「開くな。インポートして文字列として取り込め」だ。
面倒?知らんよそんなこと。 みんな何かね。Excelファイルをテキストファイルに変換する
ツールいろいろあるの知らんのかね。「テキスト屋さん」とか
使ってみ。そんで、上で出てきた問題点、どうなるか教えて
ください。おながいします。
Excelは一行目の一要素目をIDにするとおかしくなるバグをなんとかしる 今まさに >>42 なCSVファイルを目前にして戸惑い中。
ちくしょーめんどくせーなー。 CSVいじるんならCASSAVAって言う良いソフトがありますよ?
なんでエクセルはたった32000行くらいで悲鳴を上げる仕様を続けますか? ExcelはあくまでGUIの表計算ソフトだから、
数十万行とか許容するとインターフェースから変えなくちゃいけなくなる。
)'ーーノ( / /i \ ヽ |ー‐''"l
/ C | | | ///.ノ | | | |\、|l| l C ヽ
l ・ i´ i' | | -=・=| ト=・= |.||| / ・ /
| S l トー-ト|| | 'ー―‐,! '――' .|| | S |
| ・ |/ | l || (_^_) | ||ヽl ・ |
| V | | l .|、 =⇒ /| || l V |
| !! | / | | | \ /| | | | | !! |
ノー‐---、,| / │l、l| ~`ー‐/ |レ' ノハ、_ノヽ