CSVファイルは検索が速いって聞きました
ではなぜソートが遅いのでしょうか?
探検
10GBのCSVファイルのソートが遅いのはなぜですか?
2023/06/12(月) 21:20:45.91ID:F1HJC183
2デフォルトの名無しさん
2023/06/13(火) 08:52:56.97ID:JBnp9ago べ、べつに遅くないし!
2023/06/13(火) 09:49:32.67ID:Xu7LyXF8
4デフォルトの名無しさん
2023/06/13(火) 09:53:59.11ID:meEyuUg2 マジレスしとくと
スレタイの "10GB" と >>1 の質問が無関係だな
スレタイの "10GB" と >>1 の質問が無関係だな
2023/06/13(火) 13:36:34.95ID:4HUnX0Fj
さっき霊魂を見たんですが、どうしたらいいですか
2023/06/13(火) 16:18:52.30ID:u7AmJNUj
「…見なかったことにしといてやる!」と宣言すればおけ
2023/06/13(火) 19:37:20.82ID:ixSRP7mF
よかろう、ならばビットマップファイルだ
2023/06/22(木) 06:41:18.88ID:k/qBouFf
9デフォルトの名無しさん
2023/06/29(木) 13:51:47.41ID:IO1TL2jD 10GBだから
10デフォルトの名無しさん
2023/06/30(金) 03:16:09.95ID:KO9roK1Y 昭∞!!!!
大∞!!!!!
昇∞!!!!!!
漠∞!!!!!!!
大∞!!!!!
昇∞!!!!!!
漠∞!!!!!!!
11デフォルトの名無しさん
2023/08/09(水) 07:21:27.86ID:Bb1AJAu+12デフォルトの名無しさん
2023/08/09(水) 07:46:15.85ID:Aj0Whal0 >>11
じゃあ君は速いとでも?w
じゃあ君は速いとでも?w
13デフォルトの名無しさん
2023/08/09(水) 07:47:25.44ID:Aj0Whal0 CSVのソートが遅いのは社会的共同体の中で自然に共有されうる普遍的事実である
2023/08/09(水) 10:35:23.16ID:ZMTba8c6
まぁRDBMS使った方がいいわな
15デフォルトの名無しさん
2023/08/09(水) 11:06:02.05ID:qEKEd4/l 何をつかっても遅いものは遅いw
2023/08/09(水) 15:27:00.04ID:a25ApkGr
実装次第で遅くなりそうなケースだな
フレームワークとコピペだけで戦ってきたやつには荷が重いだろう
フレームワークとコピペだけで戦ってきたやつには荷が重いだろう
2023/08/09(水) 16:22:02.52ID:coMLMuQp
jsonやmessagepackよりは速いかも知れないな
18デフォルトの名無しさん
2023/08/10(木) 00:02:20.56ID:gjwqjVE1 10GBはファイルの大きさであって、データの件数ではないんだよな
2023/08/10(木) 01:18:52.99ID:qMn8aig+
10GB のデータをソートするには、
並べ替えた途中経過のデータも持っておく必要があるから、
100GBぐらいのメモリが必要なのでは?
メモリが少ないと、途中経過のデータをハードディスクに保存して、
メモリを空けないといけない。スワップ
並べ替えた途中経過のデータも持っておく必要があるから、
100GBぐらいのメモリが必要なのでは?
メモリが少ないと、途中経過のデータをハードディスクに保存して、
メモリを空けないといけない。スワップ
20デフォルトの名無しさん
2023/08/10(木) 01:20:23.88ID:lIBN6+0k >>18
レコード数を3とする、ソートせよ
レコード数を3とする、ソートせよ
21デフォルトの名無しさん
2023/08/10(木) 02:07:49.13ID:ljCEt4I+ ソートのキーだけでいい
2023/08/10(木) 10:55:32.60ID:AypbHuiV
メモリーに乗りそうな大きさに分割してソートして
それをマージソートするのが一番早いんじゃね?
それをマージソートするのが一番早いんじゃね?
23デフォルトの名無しさん
2023/08/10(木) 11:29:41.03ID:YYBOmFjO >>20
レコード数が1でソートの必要がないかも知れない。
レコード数が1でソートの必要がないかも知れない。
24デフォルトの名無しさん
2023/08/10(木) 11:33:16.87ID:YYBOmFjO >>1
検索早くないのでは?要するにただのテキストの塊なので grep コマンドとか使って検索できるってだけのことで、その状態ではインデックスなしの全検索だから遅くなると思う。
検索早くないのでは?要するにただのテキストの塊なので grep コマンドとか使って検索できるってだけのことで、その状態ではインデックスなしの全検索だから遅くなると思う。
25デフォルトの名無しさん
2023/08/10(木) 20:54:16.43ID:TWiH3Zx3 10GBのファイルを書き換えながらソートしているのかな?
レスを投稿する
ニュース
- 高市首相、円安・物価高で利上げ容認 昨年「あほ」と批判も…就任後は財政拡張批判も意識 [蚤の市★]
- 【東京】駅員が屋外に男性放置し通報せず 通行人が通報 搬送後死亡、都営地下鉄大江戸線清澄白河駅 [ぐれ★]
- 人気YouTuberヒカル、進撃のノアとの離婚を発表! 「0日婚」からわずか6か月、スピード離婚の真相を激白 [冬月記者★]
- 玉川徹氏「高市総理の余計な一言で2兆円超の損失。どう考えてんだ」中国怒らせ観光客減→1500万円損失のバス会社も…モーニングショー [少考さん★]
- 中国人訪日客の激減で白タクや闇民泊が危機。当事者が明かす危機と混乱「このままだと、すべて手放すしかない」 [♪♪♪★]
- 日銀、0.75%に利上げ - 30年ぶり高水準、物価高抑制 ★6 [ぐれ★]
- サウナの「整う」ってなに?カルトだろ [329329848]
- 虹夏「ぼっちちゃんのお父さんって素敵だね///」ぼっち「あ、はい///」俺ぼっちちゃんパパ「よーし今夜はみんなで乱交パーティーだ!」
- 高市早苗ショック★2 [115996789]
- 🏡エッチ全開ぶるんぶるん!
- ネトウヨw
- 【悲報】ホロライブ、また1人病んでしまう
