X



競技プログラミングにハマるプログラマのスレ
0217デフォルトの名無しさん
垢版 |
2024/05/03(金) 11:39:26.85ID:x0ve7rFX
誰かいるかな
マルチコアなら高速化するコードを試しに書いてみたが遅くなった
競プロのシステム的に1提出に1コアで計算させるような感じなんかな
誰か知ってる人いる?
0218デフォルトの名無しさん
垢版 |
2024/05/03(金) 19:59:13.75ID:x0ve7rFX
あげ
0220デフォルトの名無しさん
垢版 |
2024/05/04(土) 08:15:02.58ID:YMeLqmrF
粒度の細かい並列化になるが、C++ で #pragma を指定して SIMD 命令を明示的に使う公式解説を見たことがある(割と最近)。確か 512 ビットベクトル命令だったかな。
0221デフォルトの名無しさん
垢版 |
2024/05/04(土) 08:23:47.13ID:YMeLqmrF
AtCoder の採点環境は知らんが、マルチスレッド化で遅くなったとしたら、物理コア1つに対してハイパースレッディングで論理コアが2つある状況で、スレッド間でパイプラインのリソースの取り合いが発生していたなんてことも考えられるね。
0222217
垢版 |
2024/05/04(土) 09:55:05.74ID:+W9bSMPh
>>219
ありがとうございます。公式に明示してあったのね
>>220
俺も過去問で見たことある。最近じゃなくてかなり前のやつだけど
n=1000でO(n^3)がSIMDだと通せるみたいな話だったような
SIMDは高速化に役立つみたいね
レスを投稿する


ニューススポーツなんでも実況