0238デフォルトの名無しさん垢版 | 大砲2017/09/13(水) 18:53:59.90ID:GrxKOJ+a 謎の速度低下で悩んでいたが、キャッシュレイアウトって重要だな。 AVX512で一部分だけ値更新したい時、16バイト読み込んでその位置に64バイト書き戻すようなケース。 そのまま16バイト読み込みで実装すると、読み込み時に16バイト分しかキャッシュがないので、書き込む時に64バイトに拡張というか再配置されて遅くなる。 最初から64バイトで読み出すと、サイズが変化しないので遅くならない。 ついつい、読み出し量が少ない方が速いに違いないと思い込んでしまう罠。