粒度の細かい並列化になるが、C++ で #pragma を指定して SIMD 命令を明示的に使う公式解説を見たことがある(割と最近)。確か 512 ビットベクトル命令だったかな。