512bitフルにパックして速度や効率をとか思うとやってられっかとなるので
新規に追加された豊富なZMMレジスターをほぼ値上限無しに使えて便利な新命令があるSIMDと捉えれば
マスク使って分岐削り最適化していくのが基本だけどまずは使わなくてもいいし