Intelの10nm世代低消費電力コアTremontについて。

Frontend
Tremont = Decode:3*2 Allocate:4 L1I:32KB-8way L1D:32KB-8way IFetch:32B/c
Goldmont+ = Decode:3 Allocate:4 L1I:32KB-8way L1D:24KB-6way IFetch:20B/c

Backend Integer
Tremont = port:7 ALU:3 load:2? store:2? jump:1
Goldmont+ = port:5 ALU:3 load:1 store:1 jump:1

Tremontはバックエンドの強化が少ないと思っていたのですがそうでも無かったです。
プアなのは確かなのですが、Goldmont+は更にプアだったので相当改善しています。
Backend Integerのload/storeは非常にわかりにくいので解説すると、
Tremontはload/storeユニット*2とstore専用ユニット*1(恐らく)持っています。
Goldmont+はALU/loadユニット*1とstore専用ユニット*1です。
Goldmont+はloadを行うとALU*2しか使えませんが、Tremontは*3使える上に帯域も倍増しています。
図を見るとALUとjump、load/storeには条件がありそうです。
しかしこれでも大分同時に発行できる条件は緩和されており、性能改善への寄与はバックエンドの方が大きいかもしれません。

>>278
Backend Vector/Float
Tremont = port:3 FADD/FMUL:128bit*1 FADD:128bit*1 store:1
Goldmont+ = port:3? FADD/FMUL:128bit*1 FADD:128bit*1 store:1?

Backent Vectorは恐らくTremontとGoldmont+は機能的に同じです。
AVX2なども今出ている情報ではサポートされていません。
FMULが足りないのでAVXやるとすれば2回や4回に分けて実行となりますが、多分YMMレジスタも勿論ZMMも追加されて無いので不可能でしょう。
Lakefieldではそういった命令が来た場合は全部Ice Lakeに渡すと思われます。