NVIDIA、1パッケージに2ダイの新型GPU「Blackwell」。AI性能は学習4倍、推論30倍に
https://pc.watch.impress.co.jp/docs/news/1577301.html

プロセスがTSMC N4からN4Pとあまり進まなかったのでニコイチになった。
FP8性能はH100の4PFLOPSから10PFLOPSへと2.5倍に向上。
>GB200の性能はH100と比較してAI学習時には4倍、AI推論時には30倍、電力効率の観点では25倍になっているという。
推論の向上値が学習に比べ大きいのはFP4に対応したから。
H100で814mm^2に達していたダイサイズはさらに大きくなった可能性が高く、また消費電力もH100の350W超えてるはず。
1700mm^2、700Wあたりだろうか。
性能今後も今のペースで上げていくにはチップレットしかなさげ。
メモリ帯域も大問題だが、HBMの進化期待するのと、下位層にSCMなどうまく使って何とか。