SMTなんだからスレッドあたりのSIMDを1.5倍にするという選択もできるんじゃないか
素直にスレッド数に比例させなくとも