行列演算って並列処理向きだよな
行と列の数が決まってて、それぞれを掛けて足すだけだし、個々の要素が他に影響も与えないから先読みもできる
SIMDとかそういう感じなんだろうけど、1っ個ずつ掛け算して足してって逐次処理でやってるわけじゃないからね
個々の要素を並列でガッと掛け算してガッと足し算するだけだから2ステップで終わる感じ?
専用プロセッサで並列処理してるから行列の要素の数とかほとんど影響なんじゃね?
まぁ、GPUじゃなくてCPU側で計算させてる所はそうじゃないだろうけど