【オセロ,将棋】ボードゲーム Part2【囲碁,War】
レス数が1000を超えています。これ以上書き込みはできません。
比較的地味なボードゲーム専用のスレが欲しくて立ててみました。
前スレ
【オセロ,将棋】ボードゲーム【囲碁,War】
http://mevius.2ch.net/test/read.cgi/gamedev/1057763418/ あ〜なんか情熱が湧いてこないな。
プログラム書くのがすごい億劫。 とりあえず、囲連星のコード流用してDNN学習回せるところまで来ました。
あとはAIプレイヤーのコードを移植すればひと段落かな。 モンテカルロAIとDNNAIで対戦できるところまで来ました。
DNNAIの動きはまあ第一弾にしては悪くない感じ。 パッと見DNNAIには知性の芽生えのようなものを感じる。
勝率に結びつくかは微妙だけど。 勝率に結びついてませんね…。
残念過ぎる…。
寝るか。。。 うーん、ハッキリと弱くなってますね。
ライフゲーム囲碁って昔勝率DB使った時も勝率落ちたし何でだろう? モンテカルロAIにトリプルスコアで負けてますね〜
かなc ここからどうしていけばいいのかわからんなぁ。
負けるDNNAIで棋譜取りして勝てるようになるのかといえばかなり期待薄。
でもやれることもないし一応やってみるか。 DNNの評価値を得点差から勝率と得点差/81の平均にしたところ
トリプルスコアで負けてたのがダブルスコアになったようです。
まだ負けてるけど。
囲碁では得点差で評価値を付けるのはほぼタブーで勝率を評価値にするのがセオリーなのですが、試してみたかった。 うーむ相手から攻撃されたときに反撃しない癖があるようだ。
反撃さえすれば楽に勝てるはずなんだが…。 DNNの入力にに盤面の情報だけじゃなくて、石がぶつかってるところの情報も与えてみるか。
かなり肝になる情報のはずだから。 うお、メモリがパンクしたorz
もー新スレッドリッパーにメモリ1TB載せたいorz データベースがでかすぎるのかなぁ。
500万局面を4対称で2000万局面分くらいあるんだが、初期アルファ碁でも3000万局面くらいだったっていうし減らそういかなぁ。
うーん。 前も言ったかもしれないけどいたずらにネットワークを巨大化するよりコンパクトにしてエポック数を稼いだほうがいいかもしれないな。 学習するほどに弱くなる理由がさっぱりわからんorz
ちょっと休憩 またgithubでアルファゼロ探ししようかなぁ(懲りてない) スレッドリッパー 32コア ベース3.7GHz ターボ4.5GHz 1999$
素晴らしい
金がないけど せっかく良さそうなの見つけたのに、イマイチモチベーション上がんないな〜
なんでだろ。ホントよさそうなのに。 コツコツpythonやってます。
リストの使い方がわかってくると書く速度あがりそう。 >>972にライフゲーム碁のロジックを実装しました。
ランダムプレーヤーと対戦できるところまで確認しました。
意外と拡張しやすい作りになってるっぽい。 インターフェースの作りがうまいプログラムは心が躍りますね。
見習いたい。 うおおお、遅えええええええ
6x6オセロだと結構速いけど9x9ライフゲーム囲碁だとめちゃ遅いorz
なにか高速化策を考えねば… 今日一日、強化学習回してたんですが途中でOS固まってたorz
でも一応、3回ベストポリシー更新されたみたい。
ランダムボットと対戦させてみます。 ランダムボットと黒白25戦づつやってディープラーニングAIの39勝11敗
でだしとしてはまあまあかな。
純モンテカルロAIともやってみよう。 うーむOS固まるなぁ。
今日も固まった。
グラボの熱が悪いのだろうか? パソコンの調子が悪いのならいっそAWSとか検討するという手も…
でも金が… 固まったけど少し更新されてたようです
ランダムボットと対戦したら48勝2敗
結構ハッキリ強くなってるな。 今日も当たり前のように固まってるorz
どうすりゃいいんだ? そろそろ次スレの季節ですね。
順番的に私の番か。
995くらいで立てたらいいですかね。 どもです。そろそろ次スレですね。
相変わらず、色々小改造しながら相変わらず棋譜作り続けています。
Book確認のデバッグ用プログラム作って、棋譜の間違い特定が飛躍的に早くなり、
その分、訂正用の棋譜が膨れて遡り探索がおろそかになっています。
評価関数の学習は進めていますが、どちらかというと評価関数が怪しくて間違えて
いそうなところで、わざと分岐させてBookで正解手順(に近い)の分岐を登録していく
事で、棋譜の精度を上げようとしています。BookをQ値と考えると、選択的なε-Greedy
でQ学習しているような感じになりつつあります。
もちろん、最終的には評価関数に反映しますが、今はBook構築が先みたいな。
VC++のバージョンアップ通知が来たので更新したら、あちこちワーニングや
エラーが出て来まして、ソースの整理をしながら、ワーニングにならないソース
に書き換え中です。急いでも仕方がないので、裏で棋譜作り動かしながら、
ちんたらやってます。
久々にMCTS部分を見たら、バグだらけだったので、直したところ、マシンパワーが
上がったことからか、残り30手程度ならすぐに終局まで枝が伸びて比較的正確に
最善手順が生成できそうかなと思っています。全てのプログラムの書き換えが
終わったところで、テストしてみたいと思っています。 昨日の晩からいままで連続で動いてます。
なかなかベストポリシーが更新されなくて焦れる ランダムボットに白黒25戦づつやって50勝0敗来ました!
このゲームはほかのゲームと比べてランダムボットが比較的強いから素晴らしいですね。 AWSでいいマシンを使うというのも憧れるが、
買うのとどっちが安いかは微妙かな。 スレッドリッパー11月30日発売。
コア数はいわずもがなベースクロックもかなり高い。 pythonの文法は結局何がいいのかよくわからんな。
ライブラリが充実してるってのはそうなんだろうけど。 1000 !
お疲れさまでした。
次スレでまたお会いしましょう。 このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 769日 3時間 30分 53秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。