>>50,53
一部抜粋 詳しくは伊藤さんのツイッターで


Yuki@yuk__to
YaneuraOuはryzenと相性が悪いって話があるけど、単純にzenのgather性能が悪いからってだけでは。
gatherを展開すれば早くなる気もする。持ってないけど

確か今のYaneuraOuはEvaluateで30%ぐらい使ってて、一番のネックがgatherで一番ひどい場所はgather一個で10%食ってるのだが、
Intelのスループットが5に対してRyzenのスループットが20なので、いきなり4倍遅くなる。

30%が4倍遅くなれば、全体のパフォーマンスは半分に突き落とされる。RyzenユーザーはAVX2を切って使うか、gatherを手動展開すべき。

ちなみに、http://int.main.jp/txt/instruction/によるとRyzenでgatherを展開すれば、
Skylakeのgatherよりパフォーマンス出るから、やっぱRyzenはそこそこ速いはずだよ。
まあ、すげー真面目に書かなきゃならんわけだが。