>>698
少しずれてますけどA76からA77で強化された要点を雑に。
まずはL1I以降のフロントエンドからです。
64KBのL1Iから16Byte(4命令)でフェッチし4wayでマクロOp(Mop)にデコードします。
Mopはレジスタリネーミング・ディスパッチにてマイクロOp(μop)に分解されバックエンドに渡されます。
ここらはA76とほぼ変わりません。
では何が違っているかというと、Mopを1.5K収納するL0キャッシュが新設されました。
L0から6Mopをレジスタリネーミング・ディスパッチに渡せます。
最終的にバックエンド側にディスパッチ出来る数はA76で4Mop、A77で6Mopとなっています。
勘違いされている方もいたのですが4+6Mop出来るわけではありません。

バックエンド側。
A76に対しALUとBranchがそれぞれ1機増設されAGUもStoreが倍に強化されました。
A76:ALU*3、Branch*1、AGU*2、FP-SIMD*2
A77:ALU*4、Branch*2、AGU*2(+Store*2)、FP-SIMD*2
両方共にALUフル機能を持っているのは1機だけでFP-SIMDは128bit幅になっています。

これによるIPC向上はA76に対して+20%。(A75からA76は+35%)
A76は4デコードですがALU*3とフロントエンドとバックエンドのバランスが違うアーキテクチャーでした。
A77はL0ばかりが注目されますがALU*4の修正は大きく効いているはずです。

x86を性能で上回るというのはまず無いと思います。
最新のx86ではL1Iからのフェッチが32Byteで以降もその帯域に合わせて設計されています。
バックエンドはさほど変わらないように一見見えますが、実際には機能制限等大差があります。
これはx86が凄くArmがしょぼいと言いたいわけではありません。
x86にもし性能で追い付く可能性があるとしたら、24Byteフェッチ6wayデコードのSamsung Mongoose後継あたりだと勝手に思ってます。
幻のAMD K12が出ていれば色々比較出来て楽しかったのに残念です。