32bit ABI では引数はスタック渡しだが
64bit ABI ではレジスタ渡しになってる。だから
C++とかの無駄にサブルーチン呼出が深いプログラムでは64bitのほうが速い

とかつぶやいてみる