競技プログラミングにハマるプログラマのスレ

2024/05/04(土) 08:15:02.58ID:YMeLqmrF
粒度の細かい並列化になるが、C++ で #pragma を指定して SIMD 命令を明示的に使う公式解説を見たことがある(割と最近)。確か 512 ビットベクトル命令だったかな。
2024/05/04(土) 08:23:47.13ID:YMeLqmrF
AtCoder の採点環境は知らんが、マルチスレッド化で遅くなったとしたら、物理コア1つに対してハイパースレッディングで論理コアが2つある状況で、スレッド間でパイプラインのリソースの取り合いが発生していたなんてことも考えられるね。
222217
垢版 |
2024/05/04(土) 09:55:05.74ID:+W9bSMPh
>>219
ありがとうございます。公式に明示してあったのね
>>220
俺も過去問で見たことある。最近じゃなくてかなり前のやつだけど
n=1000でO(n^3)がSIMDだと通せるみたいな話だったような
SIMDは高速化に役立つみたいね
レスを投稿する

5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況