>>317
PUSH/POPの命令発行クロックが小さくても、外部メモリへの読み書きはレジスタ内の読み書きに比べはるかに遅い。
命令を発行してからバスを通って読み出し、またバスを通ってレジスタにデータを得るまでの経路も長い。
レジスタ内で処理できればバスは関係なくなるし、外部メモリのクロックの遅さにも影響されずに処理できる。
確かにL1キャッシュにデータが入っている間は遅延は少なくて済むが、32個のレジスタで足りないほど多くの
データを扱うとなればL1キャッシュから外れるものも出てくる。プログラムの規模が大きくなればなるほどキャッシュに
ヒットしない場合が出てくる。そうなれば途端に遅くなる。