より勝ちやすい局面を高く評価する関数を作ると人の参考になる気がする
問題は勝ちやすいをどう学習させるかだけど
マルチPVでn手探索させて、優勢局面の多い手を最善手と学習させるとかかね
学習時間が跳ね上がるけど