RISCでコード書いたことあるなら分ると思うが32個レジスタあってもちょっししたコードでも瞬殺で使い尽くす。全く足りない。
しかし、今時のIntelのPush、Popのスループットは1clock、0.5clock。つまりL1データキャッシュ32KBがレジスタの代用として使えるレベル。
だから単純にレジスタ数を倍増してもわずかしか速度が上がらない。とっくの昔にPush/Popの遅さは隠蔽されてるから。