C++ vs Rust
レス数が900を超えています。1000を超えると表示できなくなるよ。
2021/04/24(土) 08:04:49.48ID:nPKzA798
競え
804デフォルトの名無しさん
2021/12/04(土) 22:41:59.72ID:4fIXFJG6 天才の心は、自分が天才になった時、初めて理解できるのではないでしょうか。
805デフォルトの名無しさん
2021/12/04(土) 23:15:15.65ID:fLZLWJ8o 見上げてErlang夜の星を
806デフォルトの名無しさん
2021/12/04(土) 23:41:44.19ID:4fIXFJG6 美少女の国に行きたいが、美少女じゃないので入れない。
807デフォルトの名無しさん
2021/12/05(日) 10:16:06.18ID:HAXCanWR808デフォルトの名無しさん
2021/12/05(日) 10:27:47.16ID:thYcMvTR 数学100点が自慢の自称天才と
歴史的に有名な超天才を比べる変なスレ
板的にはチューリングが出てこないのは変
歴史的に有名な超天才を比べる変なスレ
板的にはチューリングが出てこないのは変
809デフォルトの名無しさん
2021/12/05(日) 11:52:13.76ID:KOPBFOTo チューリングの話題はLGBT板で。
810デフォルトの名無しさん
2021/12/05(日) 12:45:24.80ID:KOPBFOTo じゃあ、モンティホール問題に納得できない人は、手を上げて。
811デフォルトの名無しさん
2021/12/05(日) 12:47:11.55ID:mf3NqWAC 板違い
812デフォルトの名無しさん
2021/12/05(日) 13:23:53.66ID:KOPBFOTo 良スレ。
アゲ。
アゲ。
813デフォルトの名無しさん
2021/12/05(日) 15:04:30.36ID:RsIoD/ak >>803
>オーダーの話と実時間の話をシレっと往ったり還ったりするところなんかは、私には変だと思いましたね、
>アルゴリズムの評価はオーダーで行うのが普通で他はほとんどみない…
書くのが長くなるからオーダーで書いているだけで、オーダーだけでは正しい特徴を捉えられない
場合がある。
例えば、同じオーダーでも乗算や条件分岐の両方が使われているアルゴリズムとマシン語の
1クロックの命令1個にコンパイルされるものでは全然違う。
また、N個のデータを持っているハッシュ構造は、1回の検索は、数学的に厳密にはO(N)
だが、実験的(実際的)にはO(1)のように振舞うと言われており、厳密に扱うには、
オーダーの記号だけでは表現しきれない。
もし、オーダーだけで評価すればいいのなら、チューリング完全なあらゆる言語は、
同じアルゴリズムを使うことは可能で、同じオーダーの時間で計算できてしまうから、
速度比較には役立たない。
>オーダーの話と実時間の話をシレっと往ったり還ったりするところなんかは、私には変だと思いましたね、
>アルゴリズムの評価はオーダーで行うのが普通で他はほとんどみない…
書くのが長くなるからオーダーで書いているだけで、オーダーだけでは正しい特徴を捉えられない
場合がある。
例えば、同じオーダーでも乗算や条件分岐の両方が使われているアルゴリズムとマシン語の
1クロックの命令1個にコンパイルされるものでは全然違う。
また、N個のデータを持っているハッシュ構造は、1回の検索は、数学的に厳密にはO(N)
だが、実験的(実際的)にはO(1)のように振舞うと言われており、厳密に扱うには、
オーダーの記号だけでは表現しきれない。
もし、オーダーだけで評価すればいいのなら、チューリング完全なあらゆる言語は、
同じアルゴリズムを使うことは可能で、同じオーダーの時間で計算できてしまうから、
速度比較には役立たない。
814デフォルトの名無しさん
2021/12/05(日) 15:19:38.16ID:HAXCanWR >>813
>1回の検索は、数学的に厳密にはO(N)だが、実験的(実際的)にはO(1)のように振舞う
ハッシュテーブルの構築は O(N) ですが、既存のデータをハッシュで引く割合が多ければ多いほど O(1) に近くなるでしょう
ハッシュテーブルには衝突がつき物ですが、そういうところも厳密に評価するのは難しいかもしれませんね
ただし、
>同じオーダーでも乗算や条件分岐の両方が使われているアルゴリズムとマシン語の
>1クロックの命令1個にコンパイルされるものでは全然違う。
そのとおりですが、それは所詮 O(f) の f の係数が違うだけでしょう、というか、そういうものはケースバイケースで一般論には載せ難いかと
そもそもあなたは、Σクロック(命令種)、で近似的に評価しようとしてますが、その姿勢は評価しますが、CPU 内の RISC 変換と並列実行、投機実行等までは及んでおらず、ある意味これも粗粗の近似だと思います
CPU 種類やメモリ構成などによって大きく変わるのですから、オーダーでの評価にとどめておくのが妥当なのでは?
>もし、オーダーだけで評価すればいいのなら、チューリング完全なあらゆる言語は、
>同じアルゴリズムを使うことは可能で、同じオーダーの時間で計算できてしまうから、
>速度比較には役立たない。
そりゃそうです、言語間の速度比較にオーダーを使う方が間違っています
総じて評価センスの問題かと
>1回の検索は、数学的に厳密にはO(N)だが、実験的(実際的)にはO(1)のように振舞う
ハッシュテーブルの構築は O(N) ですが、既存のデータをハッシュで引く割合が多ければ多いほど O(1) に近くなるでしょう
ハッシュテーブルには衝突がつき物ですが、そういうところも厳密に評価するのは難しいかもしれませんね
ただし、
>同じオーダーでも乗算や条件分岐の両方が使われているアルゴリズムとマシン語の
>1クロックの命令1個にコンパイルされるものでは全然違う。
そのとおりですが、それは所詮 O(f) の f の係数が違うだけでしょう、というか、そういうものはケースバイケースで一般論には載せ難いかと
そもそもあなたは、Σクロック(命令種)、で近似的に評価しようとしてますが、その姿勢は評価しますが、CPU 内の RISC 変換と並列実行、投機実行等までは及んでおらず、ある意味これも粗粗の近似だと思います
CPU 種類やメモリ構成などによって大きく変わるのですから、オーダーでの評価にとどめておくのが妥当なのでは?
>もし、オーダーだけで評価すればいいのなら、チューリング完全なあらゆる言語は、
>同じアルゴリズムを使うことは可能で、同じオーダーの時間で計算できてしまうから、
>速度比較には役立たない。
そりゃそうです、言語間の速度比較にオーダーを使う方が間違っています
総じて評価センスの問題かと
815デフォルトの名無しさん
2021/12/05(日) 15:34:15.66ID:HAXCanWR >>810
高卒の私は、いくら考えても意味がわかりませんでした…
高卒の私は、いくら考えても意味がわかりませんでした…
816デフォルトの名無しさん
2021/12/05(日) 16:04:00.19ID:L/b/spZ8817デフォルトの名無しさん
2021/12/05(日) 16:12:34.15ID:L/b/spZ8 >>816
ハッシュ構造は、「一回の検索」でも、数学的には、O(N)の時間が掛かる。
ハッシュ構造へのデータの書き込みとは全く関係無い。
検索自体が、数学的にはO(N)なのだ。
しかし、実際問題は、Nが常識の範囲内の大きさではO(1)のように振舞うことが
分かっているので、とても高速。
数学的には、O(f(N))とは、Nを無限に大きくしても、処理時間をf(N)で割るとある
上限値未満であるという意味。ハッシュテーブルの検索は、Nを無限に大きくすると、
定数的ではないので、O(1)ではない。
なお、g(N)=O(f(N))のように書いた時の意味で定義されているが、左辺は関数で、
右辺は集合のようなもので、両辺が等しいという意味ではない。なので、記法として
O(1)=O(N)であるが、O(N)=O(1)ではない。
不定積分の等号も集合論的な意味であって、等しいという意味ではないと聞いたことが
あると思うが、それと同じような定義。
ハッシュ構造は、「一回の検索」でも、数学的には、O(N)の時間が掛かる。
ハッシュ構造へのデータの書き込みとは全く関係無い。
検索自体が、数学的にはO(N)なのだ。
しかし、実際問題は、Nが常識の範囲内の大きさではO(1)のように振舞うことが
分かっているので、とても高速。
数学的には、O(f(N))とは、Nを無限に大きくしても、処理時間をf(N)で割るとある
上限値未満であるという意味。ハッシュテーブルの検索は、Nを無限に大きくすると、
定数的ではないので、O(1)ではない。
なお、g(N)=O(f(N))のように書いた時の意味で定義されているが、左辺は関数で、
右辺は集合のようなもので、両辺が等しいという意味ではない。なので、記法として
O(1)=O(N)であるが、O(N)=O(1)ではない。
不定積分の等号も集合論的な意味であって、等しいという意味ではないと聞いたことが
あると思うが、それと同じような定義。
818デフォルトの名無しさん
2021/12/05(日) 16:15:03.84ID:L/b/spZ8819デフォルトの名無しさん
2021/12/05(日) 16:36:22.78ID:5+FKsWbz 実時間が重要なら黙ってベンチ出せや
820デフォルトの名無しさん
2021/12/05(日) 16:50:30.44ID:HAXCanWR >>817
>しかし、実際問題は、Nが常識の範囲内の大きさではO(1)のように振舞うことが分かっているので
それには理由があるのでしょう?その理由はなんですか?「振舞うことがわかっている」という観測事実のみが根拠とは到底考えられませんね
>>814 が間違っているのであれば、あなたの解釈はなんですか?
>数学的には、O(f(N))とは、Nを無限に大きくしても、処理時間をf(N)で割るとある
>上限値未満であるという意味。ハッシュテーブルの検索は、Nを無限に大きくすると、
>定数的ではないので、O(1)ではない。
そりゃ、衝突が頻繁に発生するようになると、それを連鎖法で処理するか、あるいはオープンハッシュ法&セカンドハッシュ関数で処理するか、
いずれにしても N がハッシュテーブルサイズに比して大きくなりすぎるとO(1)から程遠くなるでしょう
しかし、今はハッシュテーブルサイズが N に比してそんなに大きくないことが前提だと思っていましたが、そういうハッシュテーブルの重要な性質を無視して N→∞にいきなり振るとか、やはり実装経験が不足しているとしか考えられません
あなたには、オープンハッシュ法でも連鎖法でもいいから、一度実装してみることをお勧めします、そうすれば、そんな無茶な話をふったり出来ないはずです
>しかし、実際問題は、Nが常識の範囲内の大きさではO(1)のように振舞うことが分かっているので
それには理由があるのでしょう?その理由はなんですか?「振舞うことがわかっている」という観測事実のみが根拠とは到底考えられませんね
>>814 が間違っているのであれば、あなたの解釈はなんですか?
>数学的には、O(f(N))とは、Nを無限に大きくしても、処理時間をf(N)で割るとある
>上限値未満であるという意味。ハッシュテーブルの検索は、Nを無限に大きくすると、
>定数的ではないので、O(1)ではない。
そりゃ、衝突が頻繁に発生するようになると、それを連鎖法で処理するか、あるいはオープンハッシュ法&セカンドハッシュ関数で処理するか、
いずれにしても N がハッシュテーブルサイズに比して大きくなりすぎるとO(1)から程遠くなるでしょう
しかし、今はハッシュテーブルサイズが N に比してそんなに大きくないことが前提だと思っていましたが、そういうハッシュテーブルの重要な性質を無視して N→∞にいきなり振るとか、やはり実装経験が不足しているとしか考えられません
あなたには、オープンハッシュ法でも連鎖法でもいいから、一度実装してみることをお勧めします、そうすれば、そんな無茶な話をふったり出来ないはずです
821デフォルトの名無しさん
2021/12/05(日) 16:51:42.71ID:HAXCanWR822デフォルトの名無しさん
2021/12/05(日) 18:19:46.95ID:KOPBFOTo INTEL Core N4200。
823デフォルトの名無しさん
2021/12/05(日) 19:15:19.02ID:F58n2Ec9 この数学100点の人はプログラミングできないんだから、ベンチ出せは禁句だよ
824デフォルトの名無しさん
2021/12/05(日) 19:16:59.90ID:3Mcy6QkY825デフォルトの名無しさん
2021/12/05(日) 19:54:51.36ID:HAXCanWR826デフォルトの名無しさん
2021/12/05(日) 22:25:34.77ID:MGzOS3+Z Ruby のハッシュでは、データ数と共に、バケット数を増やしていく。
バケット数は、2 の累乗の次に現れる素数。
2^n + a, 2 <= n <= 30
8 + 3 = 11
16 + 3 = 19
32 + 5 = 37
64 + 3 = 67
128 + 3 = 131
256 + 27 = 283
512 + 9 = 521
データ数が、バケット数の5倍を超えると、ハッシュが再構成される。
再構成時には、極端に遅くなる
11 * 5 = 55 だから、データ数が56 個になると、バケット数が19 になる。
19 * 5 = 95 だから、データ数が96 個になると、バケット数が37 になる
バケット数は、2 の累乗で大きくなっていくから、
大きいほど、線形(全)探索に比べて、ハッシュが有利
増え方が、N に比例しなくて、log N に比例するから
例えば、2^20 = 百万で、2^21 = 2百万では、
線形探索では毎回、百万回増えるけど、
ハッシュでは、1回だけ再構築して、その後は、21回で見つかる
バケット数は、2 の累乗の次に現れる素数。
2^n + a, 2 <= n <= 30
8 + 3 = 11
16 + 3 = 19
32 + 5 = 37
64 + 3 = 67
128 + 3 = 131
256 + 27 = 283
512 + 9 = 521
データ数が、バケット数の5倍を超えると、ハッシュが再構成される。
再構成時には、極端に遅くなる
11 * 5 = 55 だから、データ数が56 個になると、バケット数が19 になる。
19 * 5 = 95 だから、データ数が96 個になると、バケット数が37 になる
バケット数は、2 の累乗で大きくなっていくから、
大きいほど、線形(全)探索に比べて、ハッシュが有利
増え方が、N に比例しなくて、log N に比例するから
例えば、2^20 = 百万で、2^21 = 2百万では、
線形探索では毎回、百万回増えるけど、
ハッシュでは、1回だけ再構築して、その後は、21回で見つかる
827デフォルトの名無しさん
2021/12/05(日) 22:30:23.53ID:GkhJF2sm >>826
Rustのハッシュそうなんだ?
Rustのハッシュそうなんだ?
828デフォルトの名無しさん
2021/12/05(日) 22:55:00.31ID:5+FKsWbz Rubyだぞ
829デフォルトの名無しさん
2021/12/05(日) 23:55:41.03ID:o2Lx+v4j830デフォルトの名無しさん
2021/12/06(月) 00:01:51.71ID:3rXx+R7R ベンチをもっと気楽に行うために単体テストフレームワークを使ってベンチ書いてる。
831デフォルトの名無しさん
2021/12/06(月) 00:03:31.65ID:kjD6KzfX832デフォルトの名無しさん
2021/12/06(月) 00:07:28.71ID:kjD6KzfX なお、ハッシュ値の最大数を動的に増やしていくのならば、本来のハッシュ構造ではない。
本来のハッシュ構造は振り分けられる量は固定サイズ。
だから、ハッシュ値の計算も固定されたアルゴリズムで処理が固定された関数で
行う。
色々と勝手に定義を変えてはいかん。
言葉を勝手に再定義すれば議論になるわけ無い。
本来のハッシュ構造は振り分けられる量は固定サイズ。
だから、ハッシュ値の計算も固定されたアルゴリズムで処理が固定された関数で
行う。
色々と勝手に定義を変えてはいかん。
言葉を勝手に再定義すれば議論になるわけ無い。
833デフォルトの名無しさん
2021/12/06(月) 00:25:08.26ID:3rXx+R7R (キリッ)が抜けてるのでは?
834デフォルトの名無しさん
2021/12/06(月) 00:25:34.03ID:O1qGwT+t リンクリストの次はハッシュテーブルかよ
データ構造スレでやれ
データ構造スレでやれ
835デフォルトの名無しさん
2021/12/06(月) 00:49:48.95ID:3rXx+R7R 良スレ。
アゲ。
アゲ。
836826
2021/12/06(月) 01:37:20.07ID:siDRvkcR >>826
修正
>増え方が、N に比例しなくて、log N に比例するから
>例えば、2^20 = 百万で、2^21 = 2百万では、
>線形探索では毎回、百万回増えるけど、
>ハッシュでは、1回だけ再構築して、その後は、21回で見つかる
これはデータベースで使う、2分探索の事だった。
ハッシュは、バケット数で割った余りで決まるから、O(1)だった
修正
>増え方が、N に比例しなくて、log N に比例するから
>例えば、2^20 = 百万で、2^21 = 2百万では、
>線形探索では毎回、百万回増えるけど、
>ハッシュでは、1回だけ再構築して、その後は、21回で見つかる
これはデータベースで使う、2分探索の事だった。
ハッシュは、バケット数で割った余りで決まるから、O(1)だった
837デフォルトの名無しさん
2021/12/06(月) 01:49:17.06ID:kjD6KzfX >>836
ハッシュの表の様なものが固定サイズであるところの
素朴なハッシュの検索は、Nが大きい時には、O(N)。N が小さい時には、O(1)。
Nが大きくなるに従ってその表を時々大きくしていくようなものは、
考慮の対象にはしない。
ハッシュの表の様なものが固定サイズであるところの
素朴なハッシュの検索は、Nが大きい時には、O(N)。N が小さい時には、O(1)。
Nが大きくなるに従ってその表を時々大きくしていくようなものは、
考慮の対象にはしない。
838デフォルトの名無しさん
2021/12/06(月) 01:53:00.58ID:kjD6KzfX >>837
[補足]
以下、ハッシュの表の様なものが固定サイズであるところの素朴なハッシュの検索
についてだけを考える。
ハッシュの中に入っているデータの個数が N 個の時に、あるキーを持つ
データを1個だけ探すのに掛かる平均時間を g(N)とすると、数学的には
g(N)=O(N)。
しかし、この g(N) は、g(N) = a N + b と近似した場合の a の値が極端に小さい。
なので、N が小さい時には、O(1)であるかのように振舞う。
そういう意味だ。
これで理解できないなら、数学的想像力や理解力が足りてない。
[補足]
以下、ハッシュの表の様なものが固定サイズであるところの素朴なハッシュの検索
についてだけを考える。
ハッシュの中に入っているデータの個数が N 個の時に、あるキーを持つ
データを1個だけ探すのに掛かる平均時間を g(N)とすると、数学的には
g(N)=O(N)。
しかし、この g(N) は、g(N) = a N + b と近似した場合の a の値が極端に小さい。
なので、N が小さい時には、O(1)であるかのように振舞う。
そういう意味だ。
これで理解できないなら、数学的想像力や理解力が足りてない。
839デフォルトの名無しさん
2021/12/06(月) 02:05:17.38ID:McsJgKJD RubyガイジとRustガイジの熱いマッチが今始まる
840デフォルトの名無しさん
2021/12/06(月) 02:22:55.84ID:XuzXkdX2 >>839
この数学100点マンはRustを叩いてる人で常に生ポインタ派のC/C++史上主義な人
ただしコードを出したことがないのでプログラミング能力がないと推定されている
さらにオーダーについても勝手な定義で無茶な主張を繰り返している
この数学100点マンはRustを叩いてる人で常に生ポインタ派のC/C++史上主義な人
ただしコードを出したことがないのでプログラミング能力がないと推定されている
さらにオーダーについても勝手な定義で無茶な主張を繰り返している
841デフォルトの名無しさん
2021/12/06(月) 02:24:44.88ID:McsJgKJD842デフォルトの名無しさん
2021/12/06(月) 02:33:01.01ID:kjD6KzfX >>840
お前もとことん馬鹿だな。
コード書いても抽象理解が出来ない人には、そのコードの本質は分からんし、
こんなところに書ききれるわけでも無いからかけないだけだ。
なお、抽象 = シンボライズ、シンボリック
という意味で、曖昧や玉虫色という意味では無いぞ。
本質的な部分を記号化、定理化、規則化、一般化して理解できるようにしたもの
を「抽象化」と言う。
お前もとことん馬鹿だな。
コード書いても抽象理解が出来ない人には、そのコードの本質は分からんし、
こんなところに書ききれるわけでも無いからかけないだけだ。
なお、抽象 = シンボライズ、シンボリック
という意味で、曖昧や玉虫色という意味では無いぞ。
本質的な部分を記号化、定理化、規則化、一般化して理解できるようにしたもの
を「抽象化」と言う。
843デフォルトの名無しさん
2021/12/06(月) 03:29:12.50ID:rYDKtnCr linkedlistの計算量を勘違いし
平衡二分木とハッシュセットを混同する
数学100点マンがいると聞いて
平衡二分木とハッシュセットを混同する
数学100点マンがいると聞いて
844デフォルトの名無しさん
2021/12/06(月) 05:30:40.66ID:lQ57RfmU845デフォルトの名無しさん
2021/12/06(月) 05:43:24.70ID:4SyL85E7 >>838
>、g(N) = a N + b と近似した場合の a の値が極端に小さい。…@
なぜですか?
ハッシュテーブルの実装方法から論じてみください
もしかして、あなたは@を数学の公理、みたいに扱っているのですか?そんなことではコンピューターサイエンスは無意味だし面白くないでしょう?
でもC/C++ 至上主義者というのなら、私と気が合いますね
>、g(N) = a N + b と近似した場合の a の値が極端に小さい。…@
なぜですか?
ハッシュテーブルの実装方法から論じてみください
もしかして、あなたは@を数学の公理、みたいに扱っているのですか?そんなことではコンピューターサイエンスは無意味だし面白くないでしょう?
でもC/C++ 至上主義者というのなら、私と気が合いますね
846デフォルトの名無しさん
2021/12/06(月) 08:46:35.08ID:XZMNlO6i847デフォルトの名無しさん
2021/12/06(月) 10:07:17.08ID:OAOUQrou なんでハッシュテーブルの話になったのかと思えば>>813にいちゃもん付けたいだけか
848デフォルトの名無しさん
2021/12/06(月) 11:16:09.54ID:O1qGwT+t ベンチマークもなしに実時間の話をされてもなぁ
しかも具体的な実装上の問題点の指摘もなく他人のベンチマークは信用できないとか宣われてしまうとこちらとしては会話しても意味がない人なんだと判断せざるを得ないんですよね
しかも具体的な実装上の問題点の指摘もなく他人のベンチマークは信用できないとか宣われてしまうとこちらとしては会話しても意味がない人なんだと判断せざるを得ないんですよね
849デフォルトの名無しさん
2021/12/06(月) 11:52:31.39ID:q0VGOju1 >>845
公理ではなくて、処理時間の平均値を確率論で書いている。
公理ではなくて、処理時間の平均値を確率論で書いている。
850デフォルトの名無しさん
2021/12/06(月) 11:57:28.95ID:q0VGOju1851デフォルトの名無しさん
2021/12/06(月) 12:01:12.30ID:EOOuRFRK852デフォルトの名無しさん
2021/12/06(月) 12:06:08.85ID:q0VGOju1 >>851
確率論では、ランダム性を仮定する。
確率論では、ランダム性を仮定する。
853デフォルトの名無しさん
2021/12/06(月) 12:43:27.37ID:XuzXkdX2 >>842
ここはC++ vs Rustスレなのだからコードを出さなければ何も判定できない
机上の空論ばかり書き綴るよりも現実に使われるCPUと向き合わなければならない
例えばRustの標準ライブラリHashMapでも用いているSwiss Tables法ではハッシュ衝突時の別エントリ探索にSIMD命令を用いている
CPU命令4つで16エントリ同時に探索候補を判別していきメモリキャシュも活かすようこのためのメタデータを連続領域に配置している
ここはC++ vs Rustスレなのだからコードを出さなければ何も判定できない
机上の空論ばかり書き綴るよりも現実に使われるCPUと向き合わなければならない
例えばRustの標準ライブラリHashMapでも用いているSwiss Tables法ではハッシュ衝突時の別エントリ探索にSIMD命令を用いている
CPU命令4つで16エントリ同時に探索候補を判別していきメモリキャシュも活かすようこのためのメタデータを連続領域に配置している
854デフォルトの名無しさん
2021/12/06(月) 13:08:20.11ID:PE/XVSQC855デフォルトの名無しさん
2021/12/06(月) 13:21:52.08ID:iO91q1zt856デフォルトの名無しさん
2021/12/06(月) 13:46:42.22ID:lQ57RfmU >>848
ずっとそんな感じ
計算量ではちゃんとわからない、コストがかかって遅くなる、とか言いつつ、忙しいから実装はできない、お前は馬鹿だから理解できない、みたいなことを数ヶ月に渡って大量に書き込み続けてる
数学でいつも100点取るらしいし、さぞ偉いお方なんでしょうなあ…
ずっとそんな感じ
計算量ではちゃんとわからない、コストがかかって遅くなる、とか言いつつ、忙しいから実装はできない、お前は馬鹿だから理解できない、みたいなことを数ヶ月に渡って大量に書き込み続けてる
数学でいつも100点取るらしいし、さぞ偉いお方なんでしょうなあ…
857デフォルトの名無しさん
2021/12/06(月) 18:09:07.25ID:cGshi4Y2858デフォルトの名無しさん
2021/12/06(月) 19:52:13.50ID:4SyL85E7 >>856
リジェクトされたネタだとか…
リジェクトされたネタだとか…
859デフォルトの名無しさん
2021/12/06(月) 20:04:46.70ID:h+yNZQm8 >>857
意味不明
意味不明
860デフォルトの名無しさん
2021/12/06(月) 21:08:31.14ID:4qQbBrsy ハッシュが衝突しやすいコリジョンデータを使ったDDos攻撃が出来るのでは?
861デフォルトの名無しさん
2021/12/07(火) 13:11:29.70ID:jcfwZSTS >>854
最大M個の振り分け能力があるハッシュ構造にN個の(key, value)ペアを
書き込んでいる場合を考える。
ただし、Mは 定数とし、N が大きくなっても拡張していかないものとする。
このとき、一回の検索に掛かる平均時間をg(N,M)とすると、
ほぼ、
g(N,M)=b・(ceil(N/(2M))
ただし、
・b は、一回の文字列比較に掛かる時間。
・ceil(x)は、xを越えない最小整数。
と書ける。これは、ほぼ、
g(N,M)=b・((int)(N/(2M) + 1)
=(int)(N/(2M))*b + b
と書ける。Nが大きい時には、
g(N,M)=a*N + b
a = b / (2M)
と書ける。
Mが大きい時、aは、小さいが0ではないので、処理時間は、O(1)ではなく、O(N)である。
最大M個の振り分け能力があるハッシュ構造にN個の(key, value)ペアを
書き込んでいる場合を考える。
ただし、Mは 定数とし、N が大きくなっても拡張していかないものとする。
このとき、一回の検索に掛かる平均時間をg(N,M)とすると、
ほぼ、
g(N,M)=b・(ceil(N/(2M))
ただし、
・b は、一回の文字列比較に掛かる時間。
・ceil(x)は、xを越えない最小整数。
と書ける。これは、ほぼ、
g(N,M)=b・((int)(N/(2M) + 1)
=(int)(N/(2M))*b + b
と書ける。Nが大きい時には、
g(N,M)=a*N + b
a = b / (2M)
と書ける。
Mが大きい時、aは、小さいが0ではないので、処理時間は、O(1)ではなく、O(N)である。
862デフォルトの名無しさん
2021/12/07(火) 13:27:33.41ID:pFZAiCY5 Wikipediaでも明記されている
・ハッシュテーブルの検索や追加はO(1)
・ハッシュテーブルの拡張もO(1)
> ハッシュテーブルはキーをもとに生成されたハッシュ値を添え字とした配列である。
> キーを要約する値であるハッシュ値を添え字として値を管理することで、検索や追加を要素数によらず定数時間O(1)で実現する。
>
> 利用率が一定を超えた場合に、より大きいサイズのハッシュテーブルを用意して格納し直す操作が必要となる。これをリハッシュ (rehash) と呼ぶ。
> この操作はすべての要素のハッシュ値を再計算して新たなハッシュテーブルに格納するためO(n)であるが、
> 配列のサイズを指数的に拡張する事で、動的配列の末尾追加操作と同様に償却解析によって計算量をO(1)とみなす事ができる。
・ハッシュテーブルの検索や追加はO(1)
・ハッシュテーブルの拡張もO(1)
> ハッシュテーブルはキーをもとに生成されたハッシュ値を添え字とした配列である。
> キーを要約する値であるハッシュ値を添え字として値を管理することで、検索や追加を要素数によらず定数時間O(1)で実現する。
>
> 利用率が一定を超えた場合に、より大きいサイズのハッシュテーブルを用意して格納し直す操作が必要となる。これをリハッシュ (rehash) と呼ぶ。
> この操作はすべての要素のハッシュ値を再計算して新たなハッシュテーブルに格納するためO(n)であるが、
> 配列のサイズを指数的に拡張する事で、動的配列の末尾追加操作と同様に償却解析によって計算量をO(1)とみなす事ができる。
863デフォルトの名無しさん
2021/12/07(火) 14:35:15.82ID:iH9Jzajc >>862
例えば、M=128で、128種類のハッシュ値に振り分けられるなっている
ハッシュ構造の場合、N=128万にすると、1つのハッシュ値に1万個の
(key, value)のペアが対応している。
そして、1個のkeyを検索する時、平均的には、1万個の半分の5000回
くらいkey値の比較を行うと一致するものが見つかる。
なのでこの場合、1個のkeyに対する検索時間は
5000*(keyの比較に要する時間)
となる。
Nを128億にすると、
5000万*(keyの比較に要する時間)
になる。
例えば、M=128で、128種類のハッシュ値に振り分けられるなっている
ハッシュ構造の場合、N=128万にすると、1つのハッシュ値に1万個の
(key, value)のペアが対応している。
そして、1個のkeyを検索する時、平均的には、1万個の半分の5000回
くらいkey値の比較を行うと一致するものが見つかる。
なのでこの場合、1個のkeyに対する検索時間は
5000*(keyの比較に要する時間)
となる。
Nを128億にすると、
5000万*(keyの比較に要する時間)
になる。
864デフォルトの名無しさん
2021/12/07(火) 14:52:05.46ID:iH9Jzajc >>863
誤:128種類のハッシュ値に振り分けられるなっている
正:128種類のハッシュ値に振り分けられるようになっている
誤:5000*(keyの比較に要する時間)
正:5000*(1回のkeyの比較に要する時間) // ()内は、keyが文字列の場合、1回の文字列比較に掛かる時間。
誤:5000万*(keyの比較に要する時間)
正:5000万*(1回のkeyの比較に要する時間) // ()内は、keyが文字列の場合、1回の文字列比較に掛かる時間。
>>862
> 利用率が一定を超えた場合に、より大きいサイズのハッシュテーブルを用意して格納し直す操作が必要となる。これをリハッシュ (rehash) と呼ぶ。
>>861 の4行目で、リハッシュは行わないと断った。
はっきり、Mを定数とすると書いている。
誤:128種類のハッシュ値に振り分けられるなっている
正:128種類のハッシュ値に振り分けられるようになっている
誤:5000*(keyの比較に要する時間)
正:5000*(1回のkeyの比較に要する時間) // ()内は、keyが文字列の場合、1回の文字列比較に掛かる時間。
誤:5000万*(keyの比較に要する時間)
正:5000万*(1回のkeyの比較に要する時間) // ()内は、keyが文字列の場合、1回の文字列比較に掛かる時間。
>>862
> 利用率が一定を超えた場合に、より大きいサイズのハッシュテーブルを用意して格納し直す操作が必要となる。これをリハッシュ (rehash) と呼ぶ。
>>861 の4行目で、リハッシュは行わないと断った。
はっきり、Mを定数とすると書いている。
865デフォルトの名無しさん
2021/12/07(火) 17:09:08.05ID:Io+x78vq 数学100点マンの机上の空論がさらに輪をかけてるな
>>864
> 最大M個の振り分け能力があるハッシュ構造にN個の(key, value)ペアを書き込んでいる場合を考える。
> M=128で、128種類のハッシュ値に振り分けられるようになっている
> Nを128億にすると、5000万*(keyの比較に要する時間)になる。
つまり128億個のデータを128個のハッシュ値パターンでハッシュテーブルに格納か
現実の世界ではなく一人だけの特殊な妄想世界で空論
>>864
> 最大M個の振り分け能力があるハッシュ構造にN個の(key, value)ペアを書き込んでいる場合を考える。
> M=128で、128種類のハッシュ値に振り分けられるようになっている
> Nを128億にすると、5000万*(keyの比較に要する時間)になる。
つまり128億個のデータを128個のハッシュ値パターンでハッシュテーブルに格納か
現実の世界ではなく一人だけの特殊な妄想世界で空論
866デフォルトの名無しさん
2021/12/07(火) 17:09:50.30ID:q8J3SSC4 worst caseはO(n)って言えば一言で終わる話だった
867デフォルトの名無しさん
2021/12/07(火) 18:11:38.99ID:U30hRDTM 平均もO(n)だろ
868デフォルトの名無しさん
2021/12/07(火) 18:19:10.70ID:j/zIE0U5 でそれにC++やRustとどう関係が?
869デフォルトの名無しさん
2021/12/07(火) 18:22:43.53ID:U30hRDTM さあ
870デフォルトの名無しさん
2021/12/07(火) 18:27:32.38ID:2dc6hCU/ とにかく、この >>813 の書き込みはすごい、ってことだ
このスレの集大成に近い出来だと思う
このスレの集大成に近い出来だと思う
871デフォルトの名無しさん
2021/12/07(火) 18:35:18.60ID:U30hRDTM872デフォルトの名無しさん
2021/12/07(火) 18:37:25.57ID:U30hRDTM 計算可能性 > 計算オーダー > 計算時間
混ぜるな危険
混ぜるな危険
873デフォルトの名無しさん
2021/12/07(火) 19:22:19.85ID:hXWP+cLq874デフォルトの名無しさん
2021/12/07(火) 19:28:32.42ID:XGUQnarH 確率論では衝突の発生確率が一様分布と仮定した場合、衝突回数はポアソン分布に従う
875デフォルトの名無しさん
2021/12/07(火) 19:37:51.93ID:smG53G6j 要するに衝突回数は幾何平均(算術平均)とは異なる
876デフォルトの名無しさん
2021/12/07(火) 19:51:15.50ID:EZ68mIS/ >>873
衝突が起きるとしても、5chのIDが被る程度の稀な確率となる程度のランダム性を想定しています。
衝突が起きるとしても、5chのIDが被る程度の稀な確率となる程度のランダム性を想定しています。
877デフォルトの名無しさん
2021/12/07(火) 20:13:15.75ID:hXWP+cLq >>876
分布については特に何も想定してないということですね
分布については特に何も想定してないということですね
878デフォルトの名無しさん
2021/12/07(火) 20:15:39.60ID:EZ68mIS/ >>877
データに合わせてハッシュアルゴリズムを変更する、アダプティブ・ハッシュ・テクノロジー™をご提案いたします。
データに合わせてハッシュアルゴリズムを変更する、アダプティブ・ハッシュ・テクノロジー™をご提案いたします。
879デフォルトの名無しさん
2021/12/07(火) 20:16:48.35ID:EfSST75b 結局のところ衝突回数が算術平均に従う場合はO(n)であるが、この場合確率そのものが極めて小さく分布の期待値が小さいためO(1)に極めて近いとしか評価の仕様がない
880デフォルトの名無しさん
2021/12/07(火) 20:23:38.39ID:EZ68mIS/ >>813は、言語のバイナリ生成能力を論じるときに計算オーダーは意味がないと言っているのでは?
その理由として、同一の計算オーダーを持つアルゴリズム、あるいは同一のアルゴリズムから、どちらが優れたバイナリを生成できるか論じているので、それはベンチでしか判明しない、と挙げていると思うのです。
その理由として、同一の計算オーダーを持つアルゴリズム、あるいは同一のアルゴリズムから、どちらが優れたバイナリを生成できるか論じているので、それはベンチでしか判明しない、と挙げていると思うのです。
881デフォルトの名無しさん
2021/12/07(火) 20:33:30.11ID:U30hRDTM 特定のアルゴリズムを特定の計算オーダーで実装出来ない言語もあるので
全く意味がない事はない
全く意味がない事はない
882デフォルトの名無しさん
2021/12/07(火) 21:45:05.70ID:Io+x78vq RustとC++は万能
883デフォルトの名無しさん
2021/12/07(火) 21:53:06.58ID:WxNsBn2X リンクリストの話は?リンクリスト、皆のアドバイスを受け入れて辞め、ハッシュテーブルに絞ることにしたんですか…
884デフォルトの名無しさん
2021/12/07(火) 21:54:51.19ID:EZ68mIS/ リンクトリストね?
885デフォルトの名無しさん
2021/12/07(火) 23:00:58.24ID:APR/hTgK >>873
異なるキーに対するハッシュ値が、可能な限り異なるランダム性。
異なるキーに対するハッシュ値が、可能な限り異なるランダム性。
886デフォルトの名無しさん
2021/12/07(火) 23:07:18.00ID:APR/hTgK >>866
処理時間を g(N)とすると、worst case ではなく、平均が、g(N) = O(N)。
O(N)という記号を使わずに、詳細に書くと、
g(N) = a * N + b
だが、利用されるハッシュ値の振り分け数が M 個の場合、
a = b / M
程度となり、M = 1024 の場合、a は、0.001 * b 程度の小さな値になる。
横軸を N、縦軸を g(N) とするグラフを書くと、一次関数となり、y 切片が b、
傾きが 0.001 * b 程度となり、ほぼ水平であるが、僅かに右肩上がりとなる。
もしこれが完全に水平なら O(1)。
今回の場合、非常に水平に近いが確実に単調増加であるので、O(1)のように
見えるが本当は O(N)。
処理時間を g(N)とすると、worst case ではなく、平均が、g(N) = O(N)。
O(N)という記号を使わずに、詳細に書くと、
g(N) = a * N + b
だが、利用されるハッシュ値の振り分け数が M 個の場合、
a = b / M
程度となり、M = 1024 の場合、a は、0.001 * b 程度の小さな値になる。
横軸を N、縦軸を g(N) とするグラフを書くと、一次関数となり、y 切片が b、
傾きが 0.001 * b 程度となり、ほぼ水平であるが、僅かに右肩上がりとなる。
もしこれが完全に水平なら O(1)。
今回の場合、非常に水平に近いが確実に単調増加であるので、O(1)のように
見えるが本当は O(N)。
887デフォルトの名無しさん
2021/12/07(火) 23:13:13.90ID:Io+x78vq >>886
O(1)とO(N)の間にはO(logN)やO(√N)など無数にある
O(1)とO(N)の間にはO(logN)やO(√N)など無数にある
888デフォルトの名無しさん
2021/12/07(火) 23:15:17.87ID:APR/hTgK889デフォルトの名無しさん
2021/12/07(火) 23:18:01.46ID:APR/hTgK >>888
[補足]
「グラフが水平なら O(1)」とは書いたが、「O(1)ならグラフが水平」とは
書いてない。
つまり、グラフが水平である事はO(1)であることの十分条件であるが、
必要条件ではない。
「グラフが水平 ⇒ O(1)」とは述べているが、その逆の
「O(1) ⇒ グラフが水平」とは述べて無いことに注意。
[補足]
「グラフが水平なら O(1)」とは書いたが、「O(1)ならグラフが水平」とは
書いてない。
つまり、グラフが水平である事はO(1)であることの十分条件であるが、
必要条件ではない。
「グラフが水平 ⇒ O(1)」とは述べているが、その逆の
「O(1) ⇒ グラフが水平」とは述べて無いことに注意。
890デフォルトの名無しさん
2021/12/07(火) 23:59:06.43ID:q8J3SSC4891デフォルトの名無しさん
2021/12/08(水) 00:07:41.43ID:ixfpknHK892デフォルトの名無しさん
2021/12/08(水) 00:20:29.77ID:ixfpknHK893デフォルトの名無しさん
2021/12/08(水) 00:22:38.55ID:ixfpknHK >>892
[補足]
何が正しくないかというと、本当は、ある箇所を2 で割る必要があるから。
例えば次のように :
g(N) = b * (N/(2M) + 1)
しかし、これでも、まだ少し正しくない。
[補足]
何が正しくないかというと、本当は、ある箇所を2 で割る必要があるから。
例えば次のように :
g(N) = b * (N/(2M) + 1)
しかし、これでも、まだ少し正しくない。
894デフォルトの名無しさん
2021/12/08(水) 01:40:32.51ID:qP3Pvuq5 1次関数の試験で100点取れそうな説明
895デフォルトの名無しさん
2021/12/08(水) 01:51:55.62ID:/oyDmL+H 数学100点君は数学用語の定義を誤解釈しまくって理解してしまっている感じ
説明の内容からしても多分中高生か啓蒙書を読みかじったおじさんなんだろ
説明の内容からしても多分中高生か啓蒙書を読みかじったおじさんなんだろ
896デフォルトの名無しさん
2021/12/08(水) 03:16:15.50ID:ixfpknHK なんでここは、数学が理解できない人ばっかりなんだ。
だから、プログラマが馬鹿にされる。
だから、プログラマが馬鹿にされる。
897デフォルトの名無しさん
2021/12/08(水) 03:18:58.91ID:ixfpknHK C++ vs Rust を語る前に、せめて、数学的に明らかに正しいことを理解できるから
でないとどうにもならん。
それ以前の問題。
でないとどうにもならん。
それ以前の問題。
898デフォルトの名無しさん
2021/12/08(水) 03:20:41.94ID:ixfpknHK それと、科学者にとって最も大事なことは、頭の良さでも知識でもなく、
正直さだ。
自説を主張するために正しい主張を否定してはいけない。
正直さだ。
自説を主張するために正しい主張を否定してはいけない。
899デフォルトの名無しさん
2021/12/08(水) 03:21:17.48ID:H0CVJE/p 「ランダムアクセス」って任意の要素にアクセスすることを指すんだけど、乱択的に与えられた要素にアクセスすることをそう呼ぶんだと思い込んでる奴が複数いてクソワロ
900デフォルトの名無しさん
2021/12/08(水) 03:25:58.49ID:ixfpknHK >>894
結果は一時式でも、それを求めるには確率論以前に、イマジネーションが必要。
どこかに書いてある知識の組み合わせでは導出できない。
確率論は、自分の想像力が重要に成るので、計算力だけでは無理な分野。
書いてある定理を組合すだけでも導けない。
数学は、基礎の部分はイマジネーションで作られているから、頭の良い
人以外には作れない。
いくら勉強しても無駄。
結果は一時式でも、それを求めるには確率論以前に、イマジネーションが必要。
どこかに書いてある知識の組み合わせでは導出できない。
確率論は、自分の想像力が重要に成るので、計算力だけでは無理な分野。
書いてある定理を組合すだけでも導けない。
数学は、基礎の部分はイマジネーションで作られているから、頭の良い
人以外には作れない。
いくら勉強しても無駄。
901デフォルトの名無しさん
2021/12/08(水) 04:31:15.37ID:VGgp1CiZ ハッシュに格納するまでの過程は確率論でも格納された後はただのリニア検索だけの話にすり替わってないか?
902デフォルトの名無しさん
2021/12/08(水) 08:47:15.25ID:qP3Pvuq5903デフォルトの名無しさん
2021/12/08(水) 12:57:52.28ID:9TnsTyEO データ追加の話をするのであれば、どのようなアルゴリズムでも無限個数を追加するなら無限時間かかるわw
レス数が900を超えています。1000を超えると表示できなくなるよ。
