0830名無し名人 (ワッチョイ b748-gvGC)
2017/12/07(木) 07:57:30.12ID:jc5TEGQL0でいろんな既存手法を説明した後
このセクションで説明されている技術のどれもAlphaZeroで使用されていません。
これらの技術のいくつかは、さらにAlphaZeroのパフォーマンスを向上させることができると思われます。
しかし、私たちは、純粋な自己対局強化学習アプローチに焦点を当て、将来の研究のためにこれらの拡張を残しています。
AlphaGo Zeroでrolloutを使わないのも同じ理由