0281名無し名人 (ワッチョイ 0111-wZSR)
2017/08/17(木) 22:48:30.60ID:m9zG78uM0・2000万ずつ順次作成して貯めていく
・学習時にシャッフルして一気に絞る
・絞った評価関数を元にして最初に戻る
の繰り返しをすることになります。
depth6 to 8で3億局面で食わせてみましたが、正直、ブレンドコマンド改良して作った評価関数とどっこいのまんまで強くないです。
たぶんこの先は、depth9以上で数十億局面は生成しないとダメだというのを実感しています。