Tachyum Prodigy is a Small 128-core Processor with Crazy I/O Options, 64-core Sibling Enroute Production
https://www.techpowerup.com/266650/tachyum-prodigy-is-a-small-128-core-processor-with-crazy-i-o-options-64-core-sibling-enroute-production

2016年にシリコンバレーに設立されたTachyumの新プロセッサProdigyの記事です。
Prodigy T16128は、64bitのメモリアドレス空間と512bitのベクトル拡張、AI/MLアクセラレーターを持ちます。
128Cを4GHzで動作させIPCは4とされています。(デコード幅が4?)
キャッシュはL1I/Dが各32KBで64MBのLLCを有します。
CPUアーキテクチャは不明ですが、10分の一の電力で最速のXeonを上回る性能と、ARMよりも小さいサイズを謳っています。
DDR5*12ch、PCIe5.0*48lane、400GbE*2と非常にリッチなI/Oです。
単精度で16TFLOPS、学習推論で262TFLOPS相当です。

64CのProdigy T864もあり、こちらは既にテープアウトしている模様です。
LLCは128Cの半分の32MBになっており、DDR4/5*8ch、PCIe5.0*72lane、400GbE*2、オプションでHBM3*2が可能です。
7nmで製造されダイサイズは290mm^2、12層メタルレイヤでスタンダードセルを用いられています。
消費電力は4GHz時に180Wです。

今時の高性能を狙ったCPUにしては珍しくコア単位のL2を持ちません。
その為L1からデータを落とした際には、必ずLLCにアクセスすることになります。
かなりピーキーな特性になりそうです。
ベクトル拡張は512bitで128C時に16TFLOPSと分かっているので、通常の構成ならADD/MULは各1ということになります。