今回は直前の局面の評価値が既におかしいから探索というよりは評価関数の問題でしょう

自己対戦で棋譜を作る関係上
序盤はランダム化出来ても
終盤になればなるほど評価関数の読み筋がさにある局面をなぞるだけになる

同じ評価関数で対局をして局面評価が共通認識になっているから
50億局面を作ろうと悪手の連続からの逆転は1局も出現しない
だから何回絞ろうと改善される事はないよ