>>1お疲れ様です

米アルゴンヌAuroraなどのエクサスケールスパコンが半精度(FP16)で計算しているのではないかという記事があった
京の性能は88,128個のSPARC 64 VIIIfxを使っており1CPUあたり128GFLOPSなので10PFLOPSである
これは倍精度(FP64)での性能なのでFP16で算出すると40PFLOPS既に出ていることになる
ポスト京に使われるA64FXは1CPUで2.7TFLOPS@FP64、5.4TFLOPS@FP32、10.8TFLOPS@FP16以上となっている
1ラックに384ノード=CPU積むのでFP16換算だとラックで4PFLOPS以上を発生させる
これだと僅か250ラックで1EFLOPSを実現できることになる
ちなみに現在最速の米オークリッジのSummitは200PFLOPSをちゃんとFP64で発生できFP16だと800PFLOPSとなる
SummitはIBM POWERとNvidia Teslaが組み合わされている

単精度(FP32)ならともかくFP16はさすがにないのではないかと思う
ただの書き間違いだと思うがもしそうだとすると詐欺が過ぎる
FP32にしても少しがっかり性能になりポスト京が実効性能だけではなくLINPACK値でも上回るかもしれない