そういう発想自体はソフトにもあると思うけどな。
ただ長手数の場合はそれだけ局面履歴を増やさないと学習できないという理屈で