>>405
スレチだが、転置行列を作る程度であれば、
x86 の SIMD だと、vector index の VSIB
を使えば効率よく出来るはず。