>>485
なんで遅くなるかがレジスタ足りなくてメモリ書き出しなので、レジスタ(可能なら演算器も)を純粋に大きくする。
それはリソース的にちょっとというのなら性能落ちるけど、スクラッチパッドメモリなどを用いて内部完結させ最後まで書き出さない。
もっと小細工して頭いい回路組めるけど基本はこんなとこ。

そういうこっちゃない?