Anatomy of a Computer Chess Program
でいろんな既存手法を説明した後

このセクションで説明されている技術のどれもAlphaZeroで使用されていません。
これらの技術のいくつかは、さらにAlphaZeroのパフォーマンスを向上させることができると思われます。
しかし、私たちは、純粋な自己対局強化学習アプローチに焦点を当て、将来の研究のためにこれらの拡張を残しています。


AlphaGo Zeroでrolloutを使わないのも同じ理由