>>521
おう失礼しました
倍精度が256要素っす
なのでベクトルレジスターは64*256で2KBレジスター数は64本なので総計128KB
レジスター1本は32要素*8といった形でFMA演算器に送られ8サイクルで処理され
ピーク性能はFMA演算器が3なので192FLOPS/cとなります