>>386
for AlphaZeroだから、予備実験して、勝率5%になる評価値の基準決めたのかもしれない。
実際-900×10手で5%という閾値が予備実験で出ていたのであれば、問題ないってことよね?