モンテカルロが間違える局面で間違いを訂正してそれをDNNに学習させる方法ないかなぁ