【オセロ,将棋】ボードゲーム【囲碁,War】

**310** · 2015/09/02(水) 21:57:59.44

正規化というと、thellさんのlearning.pdfで言うところの、αの設定ですか？

当初はmin（β/100,β/Nj）の正規化型で作ってましたが、上手くいかないので
収束を早めるのは後回にして、今は単純にステージ毎の局面データ件数α=β/Nの
形にしてます。

が、発散を避けようとすると、βをあまりに小さくしなければならないのが、なんか変な
気がしています。今は10の-7～-8乗くらいの値です。やっぱり変ですよね。

最急降下法のコードどこか間違えてるんだろうなぁ。