AlphaGo Zeroの自己対戦って
合計で2900万局しかないから
局面数にすると重複込みでも合計で100億局面行かないんだよね
将棋は合計1兆局面絞りとかしてるから
まだまだ学習方法で改善の余地が残ってそう