比較的地味なボードゲーム専用のスレが欲しくて立ててみました。
前スレ
【オセロ,将棋】ボードゲーム【囲碁,War】
http://mevius.2ch.net/test/read.cgi/gamedev/1057763418/
探検
【オセロ,将棋】ボードゲーム Part2【囲碁,War】
■ このスレッドは過去ログ倉庫に格納されています
1名前は開発中のものです。
2017/10/15(日) 17:34:58.03ID:RaMh0le2196310
2018/01/11(木) 22:48:49.47ID:TAFrfVFR >>191
色々見直して、若干速度は回復しましたが、最初にRollout外した時のびっくりする
ほどの速度は出なくなっちゃいました。ただ、時々瞬間的に速い時があるので、
単純ではないかもしれません。
30手過ぎるとどんどん選択しが狭まっていきますので、ツリーサイズは小さくなって
いきます。ここで、一部の手に探索が集中して、100万探索単位で追加探索したとき
にようやく他の枝を調べ始めるようで、それでもツリーサイズはそれほど大きくならない
ので、メモリーはそれほどボトルネックになっていない感じです。
UCB1のCをいじったり、ポリシーの探索比率をいじったりして様子をみていますが、
あまりフラットに探索すると、正解にたどり着けないまま終盤を迎えてしまうし、
かといってスティープに探索すると、間違いを訂正するまでの追加探索が大量に
必要になるしで、調整が難しいです。そもそも評価関数の精度が十分じゃないと
言う事なんだと思います。
色々見直して、若干速度は回復しましたが、最初にRollout外した時のびっくりする
ほどの速度は出なくなっちゃいました。ただ、時々瞬間的に速い時があるので、
単純ではないかもしれません。
30手過ぎるとどんどん選択しが狭まっていきますので、ツリーサイズは小さくなって
いきます。ここで、一部の手に探索が集中して、100万探索単位で追加探索したとき
にようやく他の枝を調べ始めるようで、それでもツリーサイズはそれほど大きくならない
ので、メモリーはそれほどボトルネックになっていない感じです。
UCB1のCをいじったり、ポリシーの探索比率をいじったりして様子をみていますが、
あまりフラットに探索すると、正解にたどり着けないまま終盤を迎えてしまうし、
かといってスティープに探索すると、間違いを訂正するまでの追加探索が大量に
必要になるしで、調整が難しいです。そもそも評価関数の精度が十分じゃないと
言う事なんだと思います。
197535
2018/01/13(土) 21:35:44.20ID:yngzNrQg コネクト4、マルチスレッド化されてるみたいですね。
何か読みにくいと思ったら。
何か読みにくいと思ったら。
198535
2018/01/13(土) 22:44:48.29ID:yngzNrQg 多分、コードに飛びつくのはまだ時期尚早なんだろな。
もうちょっとAlphaZeroの基本アイディアを理解してからじゃないと。
もうちょっとAlphaZeroの基本アイディアを理解してからじゃないと。
199310
2018/01/14(日) 01:33:25.53ID:Wql34YtP コネクト4のGitHUBってどこにありますか?
ちょっと見てみたいかも。
GUI作ろうと思って調べたら、VS2017からなんかだいぶ変わっているみたいです。
MFCは非推奨との事で、ユニバーサルWindowsとかってやつと、あとはCLRですか。
両方試してみようとしたのですが、ユニバーサルWindowsはWindows10じゃないと
ダメっぽい。CLRはなんかエラーで動かない…。他にもC#だと楽だとか色々ある
みたい。MFCは使えるのですが、もう忘れたし、面倒くさかった記憶しかない(汗
C#で作るって手もあるみたい。
とりあえずC#を勉強してみようかなぁというところです。
脱線しすぎだなぁ。
ちょっと見てみたいかも。
GUI作ろうと思って調べたら、VS2017からなんかだいぶ変わっているみたいです。
MFCは非推奨との事で、ユニバーサルWindowsとかってやつと、あとはCLRですか。
両方試してみようとしたのですが、ユニバーサルWindowsはWindows10じゃないと
ダメっぽい。CLRはなんかエラーで動かない…。他にもC#だと楽だとか色々ある
みたい。MFCは使えるのですが、もう忘れたし、面倒くさかった記憶しかない(汗
C#で作るって手もあるみたい。
とりあえずC#を勉強してみようかなぁというところです。
脱線しすぎだなぁ。
200535
2018/01/14(日) 17:46:25.82ID:NeYy2Zy+201名前は開発中のものです。
2018/01/15(月) 19:10:16.04ID:SOjHonZe >>310
オセロ用の確立された GUI はありませんが、
nboard
http://www.orbanova.com/nboard/
xboard / winboard (alien edition)
http://hgm.nubati.net/alien.html
Othello Engine Protocol (cassio)
http://cassio.free.fr/engine-protocol.htm
Edax はいずれもサポートしているので、プロトコルは
ソースでも見られます。
オセロ用の確立された GUI はありませんが、
nboard
http://www.orbanova.com/nboard/
xboard / winboard (alien edition)
http://hgm.nubati.net/alien.html
Othello Engine Protocol (cassio)
http://cassio.free.fr/engine-protocol.htm
Edax はいずれもサポートしているので、プロトコルは
ソースでも見られます。
202535
2018/01/15(月) 22:46:04.01ID:iBxpq5YC 310さんと私以外の書き込みがあるとは珍しいですね。
実はROMも意外といるんだろうか
実はROMも意外といるんだろうか
203310
2018/01/16(火) 01:56:04.23ID:8d/ib1bw204535
2018/01/18(木) 00:27:09.66ID:+dGVWc2f GitHubでウインドウズでも簡単にビルドできそうなAlphaZeroクローンを物色中。
205201
2018/01/19(金) 19:49:16.63ID:nx2VVS4x ところで、
Learning to Play Othello with Deep Neural Networks
https://arxiv.org/abs/1711.06583
はチェックされていますか?
Learning to Play Othello with Deep Neural Networks
https://arxiv.org/abs/1711.06583
はチェックされていますか?
207535
2018/01/20(土) 23:55:57.24ID:1Kz+zB3+208535
2018/01/21(日) 00:31:51.93ID:qH0IRvSF ん〜なんかアンチウイルスソフトが警告だしてきたorz
どうしようかな…
どうしようかな…
209535
2018/01/21(日) 23:00:34.14ID:qH0IRvSF gflagsとかglogとかいうのが必要らしいんだが
アンチウィルスソフトが勝手に何か裏で削除してるらしく
うまくmakeできないorz
なんなんだこれは?
アンチウィルスソフトが勝手に何か裏で削除してるらしく
うまくmakeできないorz
なんなんだこれは?
210535
2018/01/25(木) 20:47:17.06ID:deBVwh8E モチベ保てなくてガッツリサボリ中w
仕事が忙しいのもあるけど
仕事が忙しいのもあるけど
211310
2018/01/27(土) 00:56:40.42ID:0QPAoXtC 自分もGUIでモチベ保てず、がっつりさぼり中。
技術的に難しそうな事は気合入るんだけど、どっちが黒番とかのラジオボタン
をどうしようかとか考え出すと、思考が止まってしまう(汗
一つの項目で諦めがつくまでに3日づつかかっていますorz
技術的に難しそうな事は気合入るんだけど、どっちが黒番とかのラジオボタン
をどうしようかとか考え出すと、思考が止まってしまう(汗
一つの項目で諦めがつくまでに3日づつかかっていますorz
212535
2018/01/27(土) 23:18:12.98ID:EzLPwnOa213310
2018/01/28(日) 17:18:05.66ID:0oeW9Kee GUIのパスの処理を真剣にチェックしだしたら、特定のケースで動作が
おかしいので、丸々一晩デバッグしていました。ケースは特定できてた
のですが、ぱっと見まったく原因がわからず。
C#はオブジェクトを代入すると参照になるのでした。やられた。
やっぱCというのは名前だけですね。
おかしいので、丸々一晩デバッグしていました。ケースは特定できてた
のですが、ぱっと見まったく原因がわからず。
C#はオブジェクトを代入すると参照になるのでした。やられた。
やっぱCというのは名前だけですね。
214535
2018/01/28(日) 23:56:16.68ID:yuGXDS1r215535
2018/01/29(月) 20:05:24.91ID:WXPd8Jtc human_play.pyでモンテカルロAIは動いたけど深層学習AIが動かないorz.
theanoとかいうライブラリが上手くインストールできてないっぽいorz
theanoとかいうライブラリが上手くインストールできてないっぽいorz
216535
2018/01/29(月) 20:08:40.86ID:WXPd8Jtc うう、心が折れそうorz
217535
2018/01/29(月) 21:03:35.36ID:WXPd8Jtc こんなエラーが出るんだが何がないって言われてるのかわからん。
誰かわかる人いる?
...
File "C:\Python27\lib\site-packages\theano-1.0.1+unknown-py2.7.egg\theano\gof\
lazylinker_c.py", line 127, in <module>
preargs=args)
File "C:\Python27\lib\site-packages\theano-1.0.1+unknown-py2.7.egg\theano\gof\
cmodule.py", line 2359, in compile_str
(status, compile_stderr.replace('\n', '. ')))
Exception: Compilation failed (return status=1): /usr/x86_64-w64-mingw32/bin/ld.
exe: error while loading shared libraries: ?: cannot open shared object file: No
such file or directory. collect2: error: ld returned 127 exit status.
誰かわかる人いる?
...
File "C:\Python27\lib\site-packages\theano-1.0.1+unknown-py2.7.egg\theano\gof\
lazylinker_c.py", line 127, in <module>
preargs=args)
File "C:\Python27\lib\site-packages\theano-1.0.1+unknown-py2.7.egg\theano\gof\
cmodule.py", line 2359, in compile_str
(status, compile_stderr.replace('\n', '. ')))
Exception: Compilation failed (return status=1): /usr/x86_64-w64-mingw32/bin/ld.
exe: error while loading shared libraries: ?: cannot open shared object file: No
such file or directory. collect2: error: ld returned 127 exit status.
218535
2018/01/29(月) 23:39:21.86ID:WXPd8Jtc ライブラリに互換性がないって言われてるような気がする。
Cygwinに入ってるライブラリは互換性ないってことか?
どこでライブラリ入手すりゃいいんだ??
Cygwinに入ってるライブラリは互換性ないってことか?
どこでライブラリ入手すりゃいいんだ??
219310
2018/01/31(水) 00:01:03.41ID:EjEC4Ae7 すまん。わからんけど、collecdt2というフォルダ(ファイルかも)が無いと言ってる?
こちらは、どうしても画面が崩れてしまうので、最初から作り直し。
原因は、トップのFormでauto resizeをtrueにしていた事でした。
ゲームの進行を上手に管理する方法が無いか考えていると、つい寝てしまうorz
こちらは、どうしても画面が崩れてしまうので、最初から作り直し。
原因は、トップのFormでauto resizeをtrueにしていた事でした。
ゲームの進行を上手に管理する方法が無いか考えていると、つい寝てしまうorz
220535
2018/01/31(水) 20:29:33.40ID:u/gx4uXy すいません。
コマンドプロンプトで実行したら>>217のようなメッセージでライブラリ名わからなかったのですが
Cygwinで実行したらライブラリ名が出てきました。
それぞれ4行づつ同じ行が出るのですが1行に削って張ります。
library stdc++ is not found.
library mingw32 is not found.
library gcc_s is not found.
library gcc is not found.
library moldname is not found.
library mingwex is not found.
library msvcrt is not found.
library advapi32 is not found.
library shell32 is not found.
library user32 is not found.
library kernel32 is not found.
library mingw32 is not found.
library gcc_s is not found.
library gcc is not found.
library moldname is not found.
library mingwex is not found.
library msvcrt is not found.
これに続いて同じ名前のライブラリはあるけどコンパチブルでない的なメッセージが出ています。
コマンドプロンプトで実行したら>>217のようなメッセージでライブラリ名わからなかったのですが
Cygwinで実行したらライブラリ名が出てきました。
それぞれ4行づつ同じ行が出るのですが1行に削って張ります。
library stdc++ is not found.
library mingw32 is not found.
library gcc_s is not found.
library gcc is not found.
library moldname is not found.
library mingwex is not found.
library msvcrt is not found.
library advapi32 is not found.
library shell32 is not found.
library user32 is not found.
library kernel32 is not found.
library mingw32 is not found.
library gcc_s is not found.
library gcc is not found.
library moldname is not found.
library mingwex is not found.
library msvcrt is not found.
これに続いて同じ名前のライブラリはあるけどコンパチブルでない的なメッセージが出ています。
221535
2018/02/04(日) 02:31:39.86ID:8N3h1IXY キタ━━━━━━(゚∀゚)━━━━━━ !!!!!
動いたっぽいです。
Theanoってライブラリのバージョンが0.7.0じゃないといけないみたいです。
ここまでめっさ時間かかったorz
遅れを取り戻さんとな。
動いたっぽいです。
Theanoってライブラリのバージョンが0.7.0じゃないといけないみたいです。
ここまでめっさ時間かかったorz
遅れを取り戻さんとな。
222535
2018/02/04(日) 18:58:20.09ID:8N3h1IXY せっかく動いたけどpython読む根性がなかなか湧いてこない。
つか多分pythonじゃなくても読むのしんどいんだけど。
つか多分pythonじゃなくても読むのしんどいんだけど。
223310
2018/02/04(日) 20:16:17.17ID:Wmf+lsae 他人のコードは読みづらいですよね。
1年前に書いた自分のコードもですがorz
Theano動作おめでとうございます。良かったです。
こちらは…GUI作るのに嫌気がさして、学習部をいじっていましたが、
そろそろ〜30手の評価関数もそれほど酷いものではなさそうな気がしてきて、
中盤探索9手読み(なんの工夫も無し)で記譜作れる事に思い至りまして。
つまり、MCTSより短時間で記譜作成できると…。
この学習で、もし中盤探索の読みがそこそこな精度になってしまったら、
そもそもMCTSにする意味ないじゃんという現実からいかに目を背け続けるか
という戦いが始まりました(涙
1年前に書いた自分のコードもですがorz
Theano動作おめでとうございます。良かったです。
こちらは…GUI作るのに嫌気がさして、学習部をいじっていましたが、
そろそろ〜30手の評価関数もそれほど酷いものではなさそうな気がしてきて、
中盤探索9手読み(なんの工夫も無し)で記譜作れる事に思い至りまして。
つまり、MCTSより短時間で記譜作成できると…。
この学習で、もし中盤探索の読みがそこそこな精度になってしまったら、
そもそもMCTSにする意味ないじゃんという現実からいかに目を背け続けるか
という戦いが始まりました(涙
224535
2018/02/05(月) 18:27:38.68ID:Q1ssK5oS やはりこの業界で生きていくには
パイソンの習得は必須…
パイソンの習得は必須…
225535
2018/02/05(月) 20:15:05.78ID:kkO201mJ ということでパイソンの入門本買ってきました。
とりあえず囲連星のルールを実装してみます。
とりあえず囲連星のルールを実装してみます。
226310
2018/02/05(月) 23:37:11.58ID:tGe3CIWd 相変わらず、GUIから逃げています。
アルファ碁でいうところのポリシーネットの学習を放棄して、代わりに評価値から
P(UCT探索に対する絞り込み項)を生成していましたが、これをQ(UCT探索の
予想スコア:これまでの探索の加重平均)から、1プレイアウト毎に再計算するよう
にしてみました。
多少探索速度は落ちますが、良い感じかなぁ。
アルファ碁でいうところのポリシーネットの学習を放棄して、代わりに評価値から
P(UCT探索に対する絞り込み項)を生成していましたが、これをQ(UCT探索の
予想スコア:これまでの探索の加重平均)から、1プレイアウト毎に再計算するよう
にしてみました。
多少探索速度は落ちますが、良い感じかなぁ。
227535
2018/02/08(木) 20:36:12.73ID:BwB5Lh8w パイソン入門本、一回通して読もうとしてますが、ページ数あって結構大変。
コード書きながら読んだほうがいいかなぁ。
コード書きながら読んだほうがいいかなぁ。
228310
2018/02/09(金) 23:42:10.85ID:XzN5+u9b 新言語習得はストレスですよね。
C#ですら混乱して、C++に帰りたくなってます(汗
というか、メモリー管理できないC#にいらついて、記譜作成回りをいじって
慰みにしています。中盤探索に置換表を足して、反復深化っぽくしてみま
したが、あんまり早くならなくてがっかり。
Python本はまだ買ってません。ウェブ上の入門を眺めたくらいです。
Pythonは構造やら変数の型の考えやら、落とし穴になりそうなところが
色々とありますね。計算式だけ見ていればわかったような気になりますが、
どういう順番で処理が進むのか、慣れないとわからん感じ。
C#ですら混乱して、C++に帰りたくなってます(汗
というか、メモリー管理できないC#にいらついて、記譜作成回りをいじって
慰みにしています。中盤探索に置換表を足して、反復深化っぽくしてみま
したが、あんまり早くならなくてがっかり。
Python本はまだ買ってません。ウェブ上の入門を眺めたくらいです。
Pythonは構造やら変数の型の考えやら、落とし穴になりそうなところが
色々とありますね。計算式だけ見ていればわかったような気になりますが、
どういう順番で処理が進むのか、慣れないとわからん感じ。
229535
2018/02/10(土) 21:27:45.30ID:DQEki32w パイソン、変数の型の宣言がないから他人のコード超読みずらいorz
引数に何与えていいのかとかパッとわからないorz
引数に何与えていいのかとかパッとわからないorz
230535
2018/02/12(月) 00:17:40.24ID:eWCzbr3d 9路囲連星の最低限のルールをパイソンに移植しました。
これからテストします。
これからテストします。
232535
2018/02/12(月) 20:42:28.11ID:eWCzbr3d 他人のコード読むの辛いおT△T
これはかなり時間かかる…
これはかなり時間かかる…
233535
2018/02/12(月) 22:23:10.54ID:eWCzbr3d うーん、なんかこのコード五目並べのルールにべったり依存してる感じなのかなぁもしかして。
複数のゲームに対応しているAlpha Zeroプロジェクトのコードを見たほうがゲームのルールが分離されてるのかもしれないなぁ
一応、別のプロジェクトに手を出すことも視野に入れるか…
複数のゲームに対応しているAlpha Zeroプロジェクトのコードを見たほうがゲームのルールが分離されてるのかもしれないなぁ
一応、別のプロジェクトに手を出すことも視野に入れるか…
234535
2018/02/12(月) 23:45:59.40ID:eWCzbr3d アルファゼロって数手前の履歴情報が必要らしいけどなんでこんなものがいるんだろう?
謎だ…
謎だ…
235310
2018/02/13(火) 13:07:22.56ID:SwoVylIU アルファ碁の論文に書いてあったかな。次の1手的には意味なさそうだけど、
有った方が強くなるので外せなかったみたいな事が書いてあったような。
今現在の思いつきですが、ツリーサーチの末端近くでは、手の流れに応じて
点数が変わる事で、そのツリーのルート側の評価(加重平均)に影響が出てくる
可能性はある。
囲碁の場合、同一盤面が出る可能性が非常に高いのだけど、そこに至る経路で
隙があると、相手にその隙を突かれて、分岐が生じる事で、その点数は無意味に
なる。けど、それは途中の分岐をしっかり読まないと判明しない。経路情報によって
評価値(評価関数直)を下げてしまえば、プレイアウトの振り分けが減って、別の
もっと良い手に集中させることができる。こういう事かなぁ。
ま、本当に今思いついたばかりですが。
GUIに気が進まないまま、ぼーっと学習を見ていると、何故か(効果は微妙だけど)
速度アップの方法を思いついてしまうもので…。地味に色々改良しています。
有った方が強くなるので外せなかったみたいな事が書いてあったような。
今現在の思いつきですが、ツリーサーチの末端近くでは、手の流れに応じて
点数が変わる事で、そのツリーのルート側の評価(加重平均)に影響が出てくる
可能性はある。
囲碁の場合、同一盤面が出る可能性が非常に高いのだけど、そこに至る経路で
隙があると、相手にその隙を突かれて、分岐が生じる事で、その点数は無意味に
なる。けど、それは途中の分岐をしっかり読まないと判明しない。経路情報によって
評価値(評価関数直)を下げてしまえば、プレイアウトの振り分けが減って、別の
もっと良い手に集中させることができる。こういう事かなぁ。
ま、本当に今思いついたばかりですが。
GUIに気が進まないまま、ぼーっと学習を見ていると、何故か(効果は微妙だけど)
速度アップの方法を思いついてしまうもので…。地味に色々改良しています。
236535
2018/02/13(火) 22:47:18.55ID:75Woy+K4 310さんほどのプログラマがGUIで躓くというのも謎ですね。
単に凝り性なだけですかね。
単に凝り性なだけですかね。
237310
2018/02/14(水) 20:49:32.16ID:I/pUqAGs 単にGUIが嫌いなんですorz
凝りたい気持ちと、画面遷移の罠から、心がデッドロックを起こして、
しまいに面倒くさくなってしまうという。
凝りたい気持ちと、画面遷移の罠から、心がデッドロックを起こして、
しまいに面倒くさくなってしまうという。
238535
2018/02/14(水) 21:17:25.33ID:XBQY5lLn オセロで画面遷移なんてほぼいらんでしょうに。
まいいけど。
まいいけど。
239535
2018/02/14(水) 22:23:18.42ID:XBQY5lLn 五目並べのプロジェクトだとコウの扱いがよくわからないな
囲碁のプロジェクトもgithubで漁るか…
囲碁のプロジェクトもgithubで漁るか…
240535
2018/02/17(土) 21:19:34.66ID:9/16YNby 藤井聡太さん朝日杯将棋オープン戦優勝ですか
すごいすな
すごいすな
241310
2018/02/17(土) 21:53:57.13ID:vz2S+0Ke ドタバタしながら音だけ聞いていたけど、なんか普通に互角から徐々に優勢を
築いて、相手の奇手にも動ぜずにさばいて、勝利って感じで、強さが際立って
いましたね。
これで勝っても漫画なら編集長にバカにされるレベルと言われていましたが、
本当に笑うしかないですね。
築いて、相手の奇手にも動ぜずにさばいて、勝利って感じで、強さが際立って
いましたね。
これで勝っても漫画なら編集長にバカにされるレベルと言われていましたが、
本当に笑うしかないですね。
242535
2018/02/19(月) 21:32:59.37ID:k/eP19bS >>214のプロジェクトに囲連星ルールを移植してみまして、モンテカルロAIが動いたみたいです。
ただし超絶遅い。絶望しかないってくらい遅い。
10プレイアウトで10秒くらいかかります。
デフォルト1000プレイアウトになっていたのでそれぐらいないとまともな強さは出ないんでしょう。
となると1手1000秒か?
絶望しかない。
orzorzorzorzorz
ただし超絶遅い。絶望しかないってくらい遅い。
10プレイアウトで10秒くらいかかります。
デフォルト1000プレイアウトになっていたのでそれぐらいないとまともな強さは出ないんでしょう。
となると1手1000秒か?
絶望しかない。
orzorzorzorzorz
243535
2018/02/19(月) 21:45:50.40ID:k/eP19bS 小路盤五目並べとかConnect4とかtic tac toe くらい小さなゲームじゃなきゃまともに動かんぞこれ
244535
2018/02/19(月) 21:53:01.97ID:k/eP19bS ,.‐''" ̄`丶、 ひどい…!ひどすぎるっ……!
/ \ こんな話があるかっ…!
/´ \
/ |\_>、_ 、r‐、 \ 命からがら… やっとの思いで…
レ! ||_| |/_ ヽ\} \ 辿り着いたのに… やり遂げたのに……
|八|-/>、∪_ u`i ト、 \
/ / ,くィ夕u' | |/ ``‐- 、_.、__\ 実行速度っ…!
|/ / /_ヽ┐u | ,| / ,-,.=====ゝ
ヾ' / r┘|.l__人 | /\// \ あの計算量がもぎ取ってしまった……!
\ ) | N / //\./´ ̄`丶
|u | /|(l(l「| | | | せっかく手にした
| u| / | ヾ-イ .|| l、 俺の未来…希望…
_| |/| | \_|_|,. く. \
ハ.___ハ >、 \ \ \ Alpha Zero AI を……!
/ \ こんな話があるかっ…!
/´ \
/ |\_>、_ 、r‐、 \ 命からがら… やっとの思いで…
レ! ||_| |/_ ヽ\} \ 辿り着いたのに… やり遂げたのに……
|八|-/>、∪_ u`i ト、 \
/ / ,くィ夕u' | |/ ``‐- 、_.、__\ 実行速度っ…!
|/ / /_ヽ┐u | ,| / ,-,.=====ゝ
ヾ' / r┘|.l__人 | /\// \ あの計算量がもぎ取ってしまった……!
\ ) | N / //\./´ ̄`丶
|u | /|(l(l「| | | | せっかく手にした
| u| / | ヾ-イ .|| l、 俺の未来…希望…
_| |/| | \_|_|,. く. \
ハ.___ハ >、 \ \ \ Alpha Zero AI を……!
245535
2018/02/19(月) 22:39:02.94ID:k/eP19bS つか連想配列とか見るからに遅そうなクラス使いまくりなんだよなぁ
こうなったらC++に移植する方向で考えるか??
こうなったらC++に移植する方向で考えるか??
246535
2018/02/19(月) 22:59:04.05ID:k/eP19bS 囲連星ルール部分をC++で書きなおしてパイソンと結合させるという手もあるんだろか??
とにかく今のままじゃ遅すぎる
囲連星ルール部分がどれくらいネックになってるかもよくわからないですが多分相当遅い
とにかく今のままじゃ遅すぎる
囲連星ルール部分がどれくらいネックになってるかもよくわからないですが多分相当遅い
247535
2018/02/19(月) 23:28:23.57ID:k/eP19bS 五目並べルールだとそこそこのスピード出ますね
当たり前か…
やっぱ囲連星ルール実装がネックか〜
は〜
死にたい
当たり前か…
やっぱ囲連星ルール実装がネックか〜
は〜
死にたい
248310
2018/02/19(月) 23:48:36.73ID:KY7Wcd5F PythonからC++関数を呼べるみたいですね。
C++からPythonも呼べるみたいです。
前にPythonに手を出そうかと思った時にググったら出てきました。
前者の方が解説が多かったと思います。
自分はBitboardを使いまくりなので、Pythonに手を出しあぐねていました。
また、評価関数の学習部と、評価値計算をうまく分離できれば、前者を
Python、後者をC++で書けないかなぁと思っていますが、im2col関数の
うまい実装を考えるのが面倒で、放置になっています。
C++からPythonも呼べるみたいです。
前にPythonに手を出そうかと思った時にググったら出てきました。
前者の方が解説が多かったと思います。
自分はBitboardを使いまくりなので、Pythonに手を出しあぐねていました。
また、評価関数の学習部と、評価値計算をうまく分離できれば、前者を
Python、後者をC++で書けないかなぁと思っていますが、im2col関数の
うまい実装を考えるのが面倒で、放置になっています。
249310
2018/02/19(月) 23:56:04.01ID:KY7Wcd5F ここ数日強化学習の結果がよさげになってきたので、結果の良かった学習方法に
集中させたら、また変な学習になってしまったようで、迷走中です。
学習の具合が良いと、色々な探索も速度アップするんだけど、具合が悪いと全部
悪循環になってしまうという。
仕方無いので、中盤探索の反復深化を作り、その結果を置換表に溜めてオーダ
リングを行うようにしてみましたが、効果があったのかよくわからない罠。
こちらも、学習の具合が良くなったら、急激に効果が表れるのではないかと期待
しているんだけど。
集中させたら、また変な学習になってしまったようで、迷走中です。
学習の具合が良いと、色々な探索も速度アップするんだけど、具合が悪いと全部
悪循環になってしまうという。
仕方無いので、中盤探索の反復深化を作り、その結果を置換表に溜めてオーダ
リングを行うようにしてみましたが、効果があったのかよくわからない罠。
こちらも、学習の具合が良くなったら、急激に効果が表れるのではないかと期待
しているんだけど。
250535
2018/02/21(水) 01:00:17.47ID:65PdIEqg SWIGっての調べてます。
なかなか手ごわい
なかなか手ごわい
251535
2018/02/21(水) 22:17:30.79ID:65PdIEqg まずは簡単なC++関数一個だけのパイソンモジュール作成に成功しました。
つぎは囲連星ルールパイソンモジュールの作成ですね〜
つぎは囲連星ルールパイソンモジュールの作成ですね〜
252535
2018/02/21(水) 23:35:14.72ID:65PdIEqg なんかdeepcopyとかいうのに対応しなきゃいかんようなのだが。
253310
2018/02/22(木) 01:36:26.61ID:pKMuaeJh 評価関数がどんどん悪化していく罠。
頭に来たので、評価関数をステージ分割。
ステージ分割すると学習部分の全面書き直しとなる。
どうせニューラルネットは使わないと決めたので、線形回帰にスケールダウン。
またしてもゴチャゴチャしてきた部分を全面書き直しパターンへ。
もうGUIはすっかり忘れていますorz
頭に来たので、評価関数をステージ分割。
ステージ分割すると学習部分の全面書き直しとなる。
どうせニューラルネットは使わないと決めたので、線形回帰にスケールダウン。
またしてもゴチャゴチャしてきた部分を全面書き直しパターンへ。
もうGUIはすっかり忘れていますorz
254535
2018/02/24(土) 00:20:19.52ID:23+l5SrV キタ━━━━━━(゚∀゚)━━━━━━ !!!!!
動きました!
C++版囲連星ルールパイソンモジュール!!!
10倍くらい速くなりました!
でも1000プレイアウト1手約100秒
まだまだ遅い
でもこれ以上速くするアイディアもないし、とりあえず、これで進めるか。
動きました!
C++版囲連星ルールパイソンモジュール!!!
10倍くらい速くなりました!
でも1000プレイアウト1手約100秒
まだまだ遅い
でもこれ以上速くするアイディアもないし、とりあえず、これで進めるか。
255535
2018/02/24(土) 00:49:09.02ID:23+l5SrV なんかトレーニングが不正終了しますね。。。
zipから解凍したソースそのままで実行しても不正終了になるのでちょっと謎ですね。
zipから解凍したソースそのままで実行しても不正終了になるのでちょっと謎ですね。
256535
2018/02/24(土) 17:22:36.17ID:23+l5SrV なんかteanoてライブラリが悪いっぽいorz
上手くインストールできたと思ってたけど実はまだ駄目だったのかなぁorz
上手くインストールできたと思ってたけど実はまだ駄目だったのかなぁorz
257535
2018/02/24(土) 20:56:43.77ID:23+l5SrV あかん、さっぱりわからんorzorzorz
258535
2018/02/24(土) 23:35:51.51ID:23+l5SrV teano.functionってのが悪いっぽい
259名前は開発中のものです。
2018/02/24(土) 23:45:38.80ID:23+l5SrV teanoじゃなくてtheanoかスマソ
260535
2018/02/26(月) 23:09:59.32ID:iAzX3KQf Linuxインストールしてみようかなぁ(ボソ
261名前は開発中のものです。
2018/02/26(月) 23:28:03.39ID:HIL9tQPi 「インストールした」なら使ってもいい
262535
2018/02/28(水) 21:53:14.78ID:EHGfbJ7U linux入れるならVMWareお勧め?
他に候補ある?
他に候補ある?
263535
2018/02/28(水) 21:54:21.00ID:EHGfbJ7U ちなみにHDDはパーティション切りなおすのメンドイ
264310
2018/02/28(水) 22:12:43.27ID:4D1Jf52Q 評価関数変更ついでにまるっと作り直してます。
自己対戦など、汚いコードを綺麗に書き直し。
かけた工数的には自己対戦の方が大変だったかも。
評価関数を1手毎のステージ分割で60ステージにして、学習し直しです。
これで序盤を学習させると終盤が狂う問題は解消されると信じていますが、
学習に60倍の時間がかかる事が予想されるという状態で、記譜を幾ら作って
も追い付かない感じなので、強化学習主体にするつもりです。
というか、まだ、UCTの所は作りこんでいない。
まあ、ほとんどコピペですが。
で、ここまで来たところで、もういっちょ改造したくなってきた…。
自己対戦など、汚いコードを綺麗に書き直し。
かけた工数的には自己対戦の方が大変だったかも。
評価関数を1手毎のステージ分割で60ステージにして、学習し直しです。
これで序盤を学習させると終盤が狂う問題は解消されると信じていますが、
学習に60倍の時間がかかる事が予想されるという状態で、記譜を幾ら作って
も追い付かない感じなので、強化学習主体にするつもりです。
というか、まだ、UCTの所は作りこんでいない。
まあ、ほとんどコピペですが。
で、ここまで来たところで、もういっちょ改造したくなってきた…。
265535
2018/02/28(水) 23:51:16.48ID:EHGfbJ7U MVWareでubuntu入れました。
267535
2018/03/01(木) 21:09:31.45ID:Jxqcd31Q 囲連星ルールをubuntuに移植してみましたがエラーが出ますね。
合法手が無い、みたいな感じに見えますが…
合法手が無い、みたいな感じに見えますが…
268535
2018/03/01(木) 21:31:25.39ID:Jxqcd31Q くそ〜結局コツコツソース読み解くしかないかorz
いい線行ってると思うんだけどなぁ
いい線行ってると思うんだけどなぁ
269535
2018/03/01(木) 21:44:17.24ID:Jxqcd31Q うおお、しんどい、これはしんどいorzorzorz
270535
2018/03/01(木) 23:35:08.53ID:Jxqcd31Q ん、human_play.pyは動きますね…
train.pyと何が違うんだろう?
train.pyと何が違うんだろう?
271535
2018/03/03(土) 00:08:46.84ID:nviHj1ts C++のクラスをディクショナリのキーに突っ込んでさらに参照しようとしたときにキーの比較に失敗してるっぽく見える
272535
2018/03/03(土) 01:00:19.05ID:nviHj1ts __hash__と__eq__を定義するといいみたいです。
__eq__はC++のoperator==で良いみたいです。
__eq__はC++のoperator==で良いみたいです。
273535
2018/03/03(土) 01:33:37.87ID:nviHj1ts まだエラー出ますね。
行ったと思ったのにorz
行ったと思ったのにorz
274535
2018/03/03(土) 19:12:35.59ID:nviHj1ts お、処理が進み始めました。
Board.init_boardでC++のオブジェクトを初期化してなかったのがエラーの原因だったみたいです。
Board.init_boardでC++のオブジェクトを初期化してなかったのがエラーの原因だったみたいです。
275535
2018/03/03(土) 19:51:05.26ID:nviHj1ts やっぱ小路盤五目並べと比べて時間かかりますね。
焦れるw
とりあえず、これでウェイトファイルが出力されれば第一段階クリアですが…
焦れるw
とりあえず、これでウェイトファイルが出力されれば第一段階クリアですが…
276535
2018/03/03(土) 20:18:47.79ID:nviHj1ts あ〜これシングルスレッドなんですね。
まあ確かにコード読んでてもマルチスレッドには見えなかったけど。
まあ確かにコード読んでてもマルチスレッドには見えなかったけど。
277535
2018/03/06(火) 20:34:35.86ID:4NZM8BU2 ベストポリシーとか言うファイルは出力されましたが…
いかんせん遅すぎますねぇ
並列化してハードも強化してあと30倍は速くしないと…
いかんせん遅すぎますねぇ
並列化してハードも強化してあと30倍は速くしないと…
278535
2018/03/06(火) 22:28:34.91ID:4NZM8BU2 んんん、もしかして仮想環境だとディスクアクセスめっちゃ重くなる?
CPUがほとんど仕事してないんだが…
CPUがほとんど仕事してないんだが…
279535
2018/03/06(火) 22:40:05.64ID:4NZM8BU2 こりゃネイティブLinux環境構築も考えるか…
280535
2018/03/07(水) 20:16:56.97ID:Xay4EsKj ディスクアクセスが100近くいって処理がほとんど進まなくなっちまったorz
いったん止めるべきかな〜
いったん止めるべきかな〜
281310
2018/03/08(木) 00:53:26.17ID:KJS05rsc 新評価関数版ようやく一通りできた。
強化学習にすごーく時間がかかりそう(汗
というわけでNew PC見繕ってます。
ノートPCでi7-8700Kの6コア12スレッドにメモリー32メガで
GTX1080搭載のノートPCがある。
むむむ。
強化学習にすごーく時間がかかりそう(汗
というわけでNew PC見繕ってます。
ノートPCでi7-8700Kの6コア12スレッドにメモリー32メガで
GTX1080搭載のノートPCがある。
むむむ。
282535
2018/03/08(木) 18:17:36.63ID:GeAn+CtF お高いんでしょう?
283535
2018/03/08(木) 19:23:50.24ID:MQ3zVdYu 帰ってきてパソコン見てみたら学習が強制終了してました。
土曜からずっと動かしっぱなしでしたが、ここにきて強制終了は痛いですね。
解決しようにも再現させるだけで数日かかってしまうし目星を付けることすら難しそう。
土曜からずっと動かしっぱなしでしたが、ここにきて強制終了は痛いですね。
解決しようにも再現させるだけで数日かかってしまうし目星を付けることすら難しそう。
284535
2018/03/08(木) 20:05:12.94ID:MQ3zVdYu 途中で出力されたポリシーモデルで対戦してみましたが、
予想してたよりずっとまともな手を返してきますね。
ほぼランダムに着手すると思ってました。
これはちゃんと学習できる環境整えればかなり期待できるかも!
予想してたよりずっとまともな手を返してきますね。
ほぼランダムに着手すると思ってました。
これはちゃんと学習できる環境整えればかなり期待できるかも!
285535
2018/03/08(木) 20:11:16.29ID:MQ3zVdYu 俺も良い目のノート一台買ってLinux入れようかなぁ
デスクトップ2台は手狭だからなぁ
デスクトップ2台は手狭だからなぁ
286535
2018/03/08(木) 21:30:30.05ID:MQ3zVdYu とりあえず、Linuxならパイソン動くことはわかったから
他のもっと高速化に力入れたalpha zeroプロジェクトも試してみようかな
他のもっと高速化に力入れたalpha zeroプロジェクトも試してみようかな
287310
2018/03/08(木) 23:33:49.98ID:KJS05rsc どもです。
お高いですが、デスクトップのフルスペックの1/3以下で済むようです。
回しっぱなしの奴がレアケースで異常終了すると萎えますね。
自分の奴は、たぶん怪しいところはほぼ蓋をしているので、今は安心しています。
とはいえ、評価値の保存に数秒かかるようになってしまったので、保存中にうっかり
終了してウェイトファイルを破壊しないように、いくつか策を講じました。最近はOSの
アップデートで勝手に再起動されちゃうので。
お高いですが、デスクトップのフルスペックの1/3以下で済むようです。
回しっぱなしの奴がレアケースで異常終了すると萎えますね。
自分の奴は、たぶん怪しいところはほぼ蓋をしているので、今は安心しています。
とはいえ、評価値の保存に数秒かかるようになってしまったので、保存中にうっかり
終了してウェイトファイルを破壊しないように、いくつか策を講じました。最近はOSの
アップデートで勝手に再起動されちゃうので。
288535
2018/03/09(金) 20:26:00.14ID:wTwCUiOb デスクトップの1/3って性能がですか?
289310
2018/03/10(土) 19:53:38.63ID:jEGGoWyJ あ、価格と性能です(^^;
強化学習に凡ミス発見。
強化学習が良いのは、学習し続ければ何とか復旧できると思えるところorz
強化学習に凡ミス発見。
強化学習が良いのは、学習し続ければ何とか復旧できると思えるところorz
291310
2018/03/10(土) 23:47:40.15ID:jEGGoWyJ こいつです。
https://www.pc-koubou.jp/products/detail.php?product_id=617093
i9-7080XEのデスクトップだとメモリー頑張ると100万ですからね…
https://www.pc-koubou.jp/products/detail.php?product_id=617093
i9-7080XEのデスクトップだとメモリー頑張ると100万ですからね…
293535
2018/03/12(月) 23:17:36.89ID:t7pU5NWq うわパイソン部分でルール間違ってたorz
やっぱ軽くでもテストはやっておかないとあかんなorz
やっぱ軽くでもテストはやっておかないとあかんなorz
294310
2018/03/14(水) 21:17:53.41ID:Hsr0gVbu うぬぬ。強化学習でどこかおかしい。
強化学習単純化しすぎちゃったかなぁ。
暫定的にひたすら記譜作成&記譜学習に戻しました。
遡り30手が鬼門。記譜学習で、ここをクリアする事を当面の目標にします。
とはいえ、残り29手完全読み切りの記譜がそれなりにあるのは、以前では
考えられない状況ではありますが。
強化学習単純化しすぎちゃったかなぁ。
暫定的にひたすら記譜作成&記譜学習に戻しました。
遡り30手が鬼門。記譜学習で、ここをクリアする事を当面の目標にします。
とはいえ、残り29手完全読み切りの記譜がそれなりにあるのは、以前では
考えられない状況ではありますが。
295310
2018/03/15(木) 22:46:56.01ID:CxmBs8oA 強化学習がおかしいというより、記譜のパターンが圧倒的に足りていなかった
のかもと思い始めました。それによって、着手して分岐しても±0となっている
みたいな。
とりあえず、記譜の増殖手段を模索中。
今は、ヌルウィンドウサーチを使用して、遡り探索を行っている関係で、間違った
着手(石損となる手)を捨ててますが、ある程度までその手も読み切って、記譜に
加えても良いのかなぁと思っています。
とりあえず、βカット(もっと良い手があった)時の評価関数は明らかに読み間違い
をしているので、そこ限定で記譜に加えていますが、ある程度以上の手数は全て
付け足しても良いのかなぁと。
のかもと思い始めました。それによって、着手して分岐しても±0となっている
みたいな。
とりあえず、記譜の増殖手段を模索中。
今は、ヌルウィンドウサーチを使用して、遡り探索を行っている関係で、間違った
着手(石損となる手)を捨ててますが、ある程度までその手も読み切って、記譜に
加えても良いのかなぁと思っています。
とりあえず、βカット(もっと良い手があった)時の評価関数は明らかに読み間違い
をしているので、そこ限定で記譜に加えていますが、ある程度以上の手数は全て
付け足しても良いのかなぁと。
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【🐼🇨🇳】「高市総理VS中国」で日本からパンダはゼロに? 上野動物園「パンダ返還期限」まであと3カ月… [BFU★]
- 「“なり得る”って言っただけだから…」高市早苗“存立危機”答弁後に漏らした本音 ★3 [Hitzeschleier★]
- 【裁判】山上徹也被告の妹「この人は母のふりをした旧統一教会の信者だと思いました」「でも、母の形をしているから突き放せなかった」 [1ゲットロボ★]
- 【速報】 米大使声明 「日本を支えていく」「中国が威圧的手段に訴えるのは断ち難い悪癖」 [お断り★]
- 歩道で93歳男性が女子大学生の自転車にはねられ意識不明 坂を下った先「気付いたときには目の前に」 [七波羅探題★]
- ネット殺到「高市総理の責任」「完全に高市リスク」「負けるな」中国が水産物輸入停止→流石に総理批判の声も「どう責任取る?」 ★5 [樽悶★]
- 中国政府の訪日自粛呼びかけで「目立った影響なし」JR東海・丹羽俊介社長、欧米多く、高市台湾有事発言 [943688309]
- 【悲報】バービー、ついつい高市に苦言を言ってしまい愛国者から袋叩きにあう...「最低限の下調べくらいしろ!💢」 [856698234]
- 【悲報】山上の母親に統一協会を紹介したのは自民党員だった😨 [868050967]
- 高市コインまもなく158円 [931948549]
- 日本「中国のレアアースに71%依存してます。2024年のデータです」 ネトウヨ「え?youtube解説と違うんだけど」 [633746646]
- 🍣にゃっはろ🌸~スシろ~🏡
