【オセロ,将棋】ボードゲーム Part2【囲碁,War】

■ このスレッドは過去ログ倉庫に格納されています
1名前は開発中のものです。
垢版 |
2017/10/15(日) 17:34:58.03ID:RaMh0le2
比較的地味なボードゲーム専用のスレが欲しくて立ててみました。

前スレ
【オセロ,将棋】ボードゲーム【囲碁,War】
http://mevius.2ch.net/test/read.cgi/gamedev/1057763418/
147535
垢版 |
2017/12/11(月) 22:02:11.19ID:fAOHhVpN
白番でも勝てるかもと思ったがそんなに甘くなかったw
148535
垢版 |
2017/12/11(月) 22:20:09.34ID:fAOHhVpN
うあああ、白番で惜しいところまで行ってバグで不正終了w
とりあえずバグとらなきゃorz
149535
垢版 |
2017/12/11(月) 22:31:43.51ID:fAOHhVpN
うーんまだまだだなぁ。
>>146はたまたまかorz.
150535
垢版 |
2017/12/12(火) 19:50:54.43ID:sU/cgenP
新しいパソコン欲しいな〜
現実的な線でいってもメモリ64GBくらい積みたい。
151535
垢版 |
2017/12/12(火) 23:05:56.72ID:sU/cgenP
DB作成をマルチスレッド化したいな〜
でもMCTSのマルチスレッド化って結構難しんだよな〜
152310
垢版 |
2017/12/13(水) 00:38:18.63ID:oWC3TnL7
MCTSのマルチスレッド化は簡単だと思う…
マルチコンピュータは難しいけど。

強化学習がなんかおかしい感じだったので、記譜学習で上書きしたら
かなり過学習になってしまった。強化学習で戻せばよいかと思ったけど
なんかなかなか戻らないorz

強化学習どっかおかしいのかもしれない。
153535
垢版 |
2017/12/13(水) 20:33:14.21ID:6thdoy0s
えーそうですか?
排他制御とかしたら性能出なさそう
154535
垢版 |
2017/12/13(水) 21:57:53.75ID:3yqEn+ak
ID違うと思うけど535です。
DBがTXTで1.7GBに。
実行時7GB程になりました。
std::mapを別のコレクションに変えたらメモリ使用量減らないかな〜?
155535
垢版 |
2017/12/13(水) 22:15:01.22ID:3yqEn+ak
unordered_mapにしてみたけどあんま変わんないやorz
156310
垢版 |
2017/12/14(木) 00:19:28.11ID:9pKHf6s7
排他制御は、まあ普通にしてますけど、PPLのcritical_sectionでlockしたり、
int型ならatomic<int>していたりで、並列ライブラリにお任せです。

またVirtual Lossという方法があって、ツリーを下っていく時は、先に負けた事にして
降りて行って、末端から戻ってくる時に正しい勝敗に置き換える事で、並列探索
の各スレッドが同じ枝に集中しないようにして、排他がかかる可能性を減らしてます。
あとは、排他制御が必要な領域を細かい単位に分割する事ですかね。

#と思って、ソース見たらVirtual Drawになっていた(汗

あ、そうか。DB化しているって事は、合流ありだし、盤面をキーにしなきゃならないから
そうなるとちょっとややこしいのかな?

自分は合流無視で、各ノードに盤面情報を保持していません。直前着手のみ持って
いて、ノードをたどる時に盤面情報を更新しながら降りていきます。着手もBITBOARD
の64bitは無駄なので、char型にしちゃってます(内部的にはintなんだろうけど)。
157535
垢版 |
2017/12/14(木) 21:56:41.20ID:IX7WwuCO
PPLなんてのがあるんですね。
頭の片隅に入れておきます。

とりあえず、子ノードへのポインタが結構メモリを食ってるような気がします。
これを無くして毎回子局面を計算するようにしてメモリ節約するという手もありますがあんまりやる気がしないなぁ。
158310
垢版 |
2017/12/15(金) 10:32:05.09ID:+7BwQo/4
PPLはVC++専用の並列処理ライブラリです。
Intel TBBとかと中身はほぼ同じだと思います。
かなり抽象されていて、わかりやすいです。
自分はこれなしでは並列化できません(汗


ツリー構造だと子ノードへのポインタが一番大事な情報になっちゃいますね。
その場合ポインターと直前着手があれば盤面情報は不要になります。
一方で、ハッシュテーブル構造だと、子ノードポインタ不要で、キー(と衝突検出)
のために盤面情報が必須になります。

DB化するんならハッシュテーブルとかの方が向いていますよね。

自分はMCTSでツリーを作ったり消したりなので、ツリー型にしています。
shared_ptr使って、不要になったノードはシステム任せで自動的に削除して貰って
います。ハッシュテーブルだと、そう簡単にはいきませんね。
159310
垢版 |
2017/12/17(日) 00:21:31.98ID:qILmYkkQ
ノートPCの冷却用(動作周波数に結構影響する)にUSB扇風機使ってましたが、
結構サイズでかくて持ち運び面倒だし、ノートPCのUSBポートに刺していると
安全装置が働いてしまうので、別途電源取っていました。

で、どうせ強化学習回しておくだけで暇だったので、専用のクーリングファンを
自作してみました。

タカチのアルミケースをぴったりサイズに切り欠いて、USBコネクタと5Vの
クーリングファンをセット。ノートPCに装着するとファンが回って冷却開始。
製作時間1時間程度。材料費は3000円くらい。

雑に作った割にはうまくできた。
160310
垢版 |
2017/12/17(日) 02:09:30.95ID:qILmYkkQ
EigenのSparseMatrixのサイズ制限を変える方法が見つかりました。

現在、簡易版と詳細版の2種類の評価関数を学習していますが、
これにより詳細版を完全にBuroさんモデルにする事ができるように
なりました。

というわけで、詳細版は再度学習し直しです。

簡易版は、多少癖があるようだけど、そこそこまともになっています。
一方、詳細版は何度もやり直し中(汗
161535
垢版 |
2017/12/17(日) 19:24:13.96ID:QB4rs7DZ
DBはメモリの勝負になる。
やはりCNNなどでメモリを圧縮する必要がある。
162535
垢版 |
2017/12/17(日) 20:37:59.85ID:QB4rs7DZ
うお、試行回数0回のデータ削除したらメッチャメモリ使用量減ったw
これで当分DBで押せるww
163535
垢版 |
2017/12/18(月) 21:48:20.69ID:2VaG9uC3
ちょっとづつ良くなってるとは思うけど今一歩だな〜
もうちょっとヒューリスティック入れたほうがいいかな〜
164310
垢版 |
2017/12/19(火) 00:06:06.27ID:jyMFUoq3
気が付いたらTensorFlowがWindows対応になってるね。

New PC欲しい病再発の兆し・・・
165535
垢版 |
2017/12/19(火) 22:55:01.32ID:BAiqwtex
とりあえず、ヒューリスティックのアイディアが2つあるんだが、
下手に手を加えないでDB肥大化で押したほうが、
真の棋理に近づくのかもしれないなどとも思ったり。
悩ましい。
166535
垢版 |
2017/12/20(水) 00:23:35.05ID:S+Iz2Vgy
ヒューリスティック一個仮組みしてみたけど上手くいかないや。
がっかりorz.
167535
垢版 |
2017/12/20(水) 22:02:26.64ID:S+Iz2Vgy
ちなみに仮組したヒューリスティックの内容は
適当な回数プレイアウトして7連が一番多くできたところ付近にしぼって
モンテカルロ木を展開するというもの。
168535
垢版 |
2017/12/21(木) 20:13:56.96ID:TDrdSCuN
序盤はそんなに悪くないんだけど終盤がなぁ
やっぱ9路でも必至、詰めろルーチンいるなぁ
169535
垢版 |
2017/12/21(木) 20:14:37.01ID:TDrdSCuN
でも遅くなるの見えてるからちょっとなぁ。
170535
垢版 |
2017/12/22(金) 21:57:55.17ID:fGil/O5L
なんか落ちるバグがあるな。
そういえば直してなかった。
は〜
171310
垢版 |
2017/12/23(土) 09:08:48.88ID:V4gvcHPy
ノードを完全読み切りまで展開した時に、末端ノードの評価が狂う時があるという
バグが以前ありました。おそらく並列処理による2重更新問題だろうと言う事で、
UCT探索の排他部分を強化して対応していましたが、ここにきてまた発生。
昨日原因が判明しました。まさかの、浮動小数点誤差の問題でした。

スコアの合計値と、試行回数を持っていて、合計値÷試行回数で平均スコアを
計算しているのですが、合計値が3500万を超えたあたりで+2をしてもfloat的
には、その2差を表現できる精度が無くなって、少しづつ合計値が不足していく
状態になっていました。

とりあえずfloatをdoubeにしてみましたが、案の定メモリーを消費する速度が大幅
増加してしまいました。小数点以下1桁もあれば十分なのでintに10倍値を持つ
ようにしてみようかなぁと思っています。
172310
垢版 |
2017/12/24(日) 00:22:00.25ID:XlhSPCGK
intに変更。桁溢れが無ければ、これで大丈夫だと思います。
ついでに速度アップしている分だけ、自己対局の探索時間を短くしました。

評価関数を簡易版・詳細版2種類使っていましたが、詳細版も十分に学習
できたようなので、詳細版一本に絞りました。というか、そろそろ追い抜いた
と思えるようになってきました。とはいえ自己対局の評価値を見ていると
30手目以後はそこそこまともな感じですが、序盤はまだデタラメかなぁ。

完全読み切りですが、30手より前に遡る事がなかなかできません。評価関数
の精度のためか、残り28手あたりから急激に読み切り時間がかかるようになり
ます。評価関数の精度が悪いのでオーダリングが正しくできていないからでは
無いかと想像しています。強化学習で補えるかと思っていますが、まだまだの
ようです。

現在、記譜学習は完全読み切りができている盤面しか使用していませんが、
せめてMCTS探索が始まって以後の盤面も学習に使用してみようか悩み中。

これ以上の精度を求めると、やはりDLに行かざるを得ないですね。
今の探索でもツリーがメモリー内に収まるギリギリに係数を設定しているので
探索延長が起きるとあっという間にスワップ開始になってしまいます。
というわけで大きなメモリーが欲しい今日この頃です。
173535
垢版 |
2017/12/25(月) 21:28:02.81ID:iTZFwLsg
すっごい微妙な駆け引きができるようになって会心の勝利!
と思いきや勝利目前でバグが出てパス2回した後エラーはいて落ちたorz
くそくそくそくそ!
いい加減直さなきゃだけど再現性低いからバグ潰すの難しいんだよなぁ
(
;FF[1]GM[1]SZ[9]
;B[ee];W[dc];B[de];W[ce];B[ge];W[df]
;B[hc];W[fg];B[gd];W[gf];B[cf];W[eg]
;B[gg];W[gh];B[cd];W[fe];B[fd];W[dd]
;B[ff];W[hg];B[be];W[cg];B[];W[gg]
;B[];W[dg])
174535
垢版 |
2017/12/26(火) 21:57:37.38ID:vTaELiqs
勝利が目前に近づくとパスする。
マジ原因がわからんorzorzorz
ログでも仕込むか?
175535
垢版 |
2017/12/26(火) 22:08:58.18ID:vTaELiqs
石を取って必勝形になる形だとパスするのか?
条件絞り込みがムズイ。
とりあえず、ログかなぁ?
176535
垢版 |
2017/12/27(水) 20:40:10.55ID:SLxZ+o46
ログ仕込んだら計ったように再現しなくなったwwww
しばらく対局しまくるしかないか
177535
垢版 |
2017/12/27(水) 21:31:50.30ID:SLxZ+o46
バグの原因わかりました。
ノードに盤面情報登録し忘れてるパスがあった。
これで落ちずに連続対戦できるようになるかな。
178535
垢版 |
2017/12/27(水) 22:15:38.79ID:SLxZ+o46
連続対戦上手く動いてるっぽいです。
今のところ黒番で8勝2敗
かなりいい感じ。
179535
垢版 |
2017/12/27(水) 22:57:18.00ID:SLxZ+o46
黒番で13勝7敗
だいぶ追い上げられたorz
でも連続対戦ちゃんと動いてるようで嬉しい。
180310
垢版 |
2017/12/28(木) 00:14:18.22ID:p44JRClR
やっぱりintでオーバーフローしてた(汗。仕方無いのでint64で。doubleでも
メモリーサイズは一緒だけど、intの方がオーバーフローがわかりやすい。

あと、効果あるかわからないけど、置換表再利用回りをちょっと機能追加。

途中でゲーム終了になった時のスコアカウントですが、FFO計算をチェックに
使っている関係で空白マスを勝者総取りにしています。しかし、学習の時には
空白マスを含めない方が回帰の計算的には良いのではないかなと思い始め
ています。MCTS的には終局判定を入れてあり正しく終局時スコアを返すので、
あくまで学習時だけの話です。

ただ、記譜を経由していればスコア再計算で良いのですが、置換表に溜まって
いる盤面情報では、アメリカルールのスコアを割り出しようが無いという…。
181535
垢版 |
2017/12/30(土) 18:56:09.79ID:YPjfi6f/
実家に帰省しました。
DB作成を流しっぱなしにしてきたので
正月あけどれくらいデータ取れてるか楽しみ
182名前は開発中のものです。
垢版 |
2017/12/31(日) 18:54:54.44ID:/rN76OKL
簡単にお金が稼げる方法興味ある人だけ見てください。

グーグル検索⇒『来島のモノノリウエ』

G32792G4ML
183535
垢版 |
2018/01/04(木) 19:09:06.91ID:mx9U9VEK
ふむう。学習は大分進んだと思うのですが、勝率が思うように上がりませんね。
184535
垢版 |
2018/01/04(木) 19:40:03.61ID:mx9U9VEK
もうちょいヒューリスティック入れるか…
185535
垢版 |
2018/01/04(木) 20:05:05.60ID:mx9U9VEK
leela zeroがもう有段者くらいの実力をつけているらしい。
もういちどleela zeroパクれるか検討するか?
うーむ。
186310
垢版 |
2018/01/05(金) 08:48:12.97ID:DiPIPsFr
年末年始で学習進めてました。
学習が進んだ結果、33〜35手目あたりは正確になり、評価値の精度が上がった
事からオーダリングが機能するようになり、遡りチェックの時間は少しづつ減ってきて
いる感じですが、30〜32手目以前はまだまだばらつきがある感じです。

また、以前から気になっていたのですが、MCTSによる記譜作成では35手目以後で
急に頻繁に手を間違える症状が出ています。記譜を膨らますにはちょうど良いので
放置していましたが、いよいよバグ探しを開始。やっぱり、並列処理の排他が不十分
で、末端ノードまでたどり着いて同じノードに探索が集中した時に、スコアの更新が
ぶつかっておかしな値になる事で、別のノードを探索。また探索が集中し、スコアが
狂い別のノードを探索という感じになっていた模様です。

修正したら大幅スピードダウンしてしまいましたが、精度は上がりました。
速度を持ちなおせるか色々調べましたが、ちょっと厳しい感じです。
187310
垢版 |
2018/01/08(月) 02:22:41.34ID:hx3YjBuD
記譜作成ですが、スコア差が大きなものが少ないため、ランダム着手の所に手を
加えてみましたが、今度は極端になりすぎて、パーフェクト勝敗な記譜が増えて
しまいました。どうしよう。

スピードダウンの影響は結構大きく、探索の終盤で、同じツリーに対する探索が集中
するためか、さらに大きく速度低下し、今度はそちらが原因で終盤間違えるように
なった感じです。あちらを立てればこちらが立たずです。

当初は、こういう問題はなかったはずなので、過去のソースを見直してみるつもり。
188535
垢版 |
2018/01/08(月) 19:56:33.71ID:NhsCP7en
alpha zero を参考にしたプロジェクトがgithubにいくつかあるんですがパクれないか物色中。
オセロやコネクト4もあるみたいですね。
189310
垢版 |
2018/01/08(月) 21:48:13.88ID:hx3YjBuD
ありゃ。すでにあるんだ。
たぶんディープラーニングしてるんだろうなぁ。

そりゃそうと、CPUのバグの影響どうなんでしょね。
あまりに時間がかかるので、ちょっと辛い。

記譜作成やめて、ひたすら強化学習にしてみようかなぁ。
後は細かい精度なので、その方が早い気がしてきた。
190310
垢版 |
2018/01/08(月) 22:10:59.88ID:hx3YjBuD
わかりにくい文章でした。

「あまりに時間がかかるので、ちょっと辛い。」

は、現状の学習方法だとあまりに時間がかかるので、やはり新PC欲しいんだけど、
CPUバグの話が出たので、ちょっと様子見すべきかどうかって事です。

ただ、MCTSで排他待ち合わせによる速度低下が出ているのと、読み切り探索では
並列探索の効果が頭打ちになりやすいので、本当にCPUに投資した効果があるの
かが不安になってきている面もあります。

むむむ。
191535
垢版 |
2018/01/08(月) 23:14:47.03ID:NhsCP7en
並列化で速度出すのは結構難しいですよねぇ
まあメモリ増やすだけでも大分違うかもですが。

python 読めるようになったほうが後々いいんだろうなぁ
でもメンドクサイw
192535
垢版 |
2018/01/10(水) 22:40:05.04ID:woZtUoWo
アルファゼロを参考にしたコネクト4のプロジェクトのパイソンコード読んでるんですが
パイソンということを差し引いても結構難しいんだろうなって感じ
193535
垢版 |
2018/01/10(水) 23:42:39.94ID:woZtUoWo
パイソンだからコード眺めるだけでどうせ動かせないやと諦めるのではなく
実際に実行できるところまでこぎつけるべきだろうか
194535
垢版 |
2018/01/10(水) 23:57:49.33ID:woZtUoWo
うーんこれlinux用なのかなぁ
Cygwinじゃきびしいかなぁ
195310
垢版 |
2018/01/11(木) 22:33:43.61ID:TAFrfVFR
しばらく学習しっぱなしというか、デバッグしながら中途半端に遡り状態で放置した
記譜をガッツリ遡りチェック中なので暇です。で、よからぬ蟲が疼きだして、そろそろ
ボードを作ろうかと思い始めました。ソース消失前は、min-Max版時代のボードが
あったのですが、また作り直しです。

オセロにも碁盤ソフトみたいなのがあれば良いのですが、無いようなので自作を検討。
囲碁のGTPみたいなプロトコルを作って、思考エンジンとGUIを分離できたら良いなぁと。

というわけで、匿名パイプを使ったプロセス間通信について勉強してました。
サンプルコードが10年前のC言語しかなくて解読に苦労しましたがエコーサンプル
を修正しながらテスト。coutとcerrを別パイプに分離して、スレッド管理はPPLにお任せ
にするところまでやって、ようやく納得。

ボードGUI作って、プロトコル決めて、AIエンジン部を対応させてと、まだまだやる事が
ありますが、最終的には自動対局までできたら良いなあと。リソースの限界はあります
が、パラメータで強弱が出そうなので、客観的に評価したい。

というか、GUIの作り方から学習し直しだ…
GUI触りたくないからボードソフト探していたのに、無いから自分で作るという罠。
196310
垢版 |
2018/01/11(木) 22:48:49.47ID:TAFrfVFR
>>191
色々見直して、若干速度は回復しましたが、最初にRollout外した時のびっくりする
ほどの速度は出なくなっちゃいました。ただ、時々瞬間的に速い時があるので、
単純ではないかもしれません。


30手過ぎるとどんどん選択しが狭まっていきますので、ツリーサイズは小さくなって
いきます。ここで、一部の手に探索が集中して、100万探索単位で追加探索したとき
にようやく他の枝を調べ始めるようで、それでもツリーサイズはそれほど大きくならない
ので、メモリーはそれほどボトルネックになっていない感じです。

UCB1のCをいじったり、ポリシーの探索比率をいじったりして様子をみていますが、
あまりフラットに探索すると、正解にたどり着けないまま終盤を迎えてしまうし、
かといってスティープに探索すると、間違いを訂正するまでの追加探索が大量に
必要になるしで、調整が難しいです。そもそも評価関数の精度が十分じゃないと
言う事なんだと思います。
197535
垢版 |
2018/01/13(土) 21:35:44.20ID:yngzNrQg
コネクト4、マルチスレッド化されてるみたいですね。
何か読みにくいと思ったら。
198535
垢版 |
2018/01/13(土) 22:44:48.29ID:yngzNrQg
多分、コードに飛びつくのはまだ時期尚早なんだろな。
もうちょっとAlphaZeroの基本アイディアを理解してからじゃないと。
199310
垢版 |
2018/01/14(日) 01:33:25.53ID:Wql34YtP
コネクト4のGitHUBってどこにありますか?
ちょっと見てみたいかも。

GUI作ろうと思って調べたら、VS2017からなんかだいぶ変わっているみたいです。
MFCは非推奨との事で、ユニバーサルWindowsとかってやつと、あとはCLRですか。
両方試してみようとしたのですが、ユニバーサルWindowsはWindows10じゃないと
ダメっぽい。CLRはなんかエラーで動かない…。他にもC#だと楽だとか色々ある
みたい。MFCは使えるのですが、もう忘れたし、面倒くさかった記憶しかない(汗
C#で作るって手もあるみたい。

とりあえずC#を勉強してみようかなぁというところです。
脱線しすぎだなぁ。
200535
垢版 |
2018/01/14(日) 17:46:25.82ID:NeYy2Zy+
https://github.com/Zeta36/connect4-alpha-zero
これです
201名前は開発中のものです。
垢版 |
2018/01/15(月) 19:10:16.04ID:SOjHonZe
>>310
オセロ用の確立された GUI はありませんが、
nboard
http://www.orbanova.com/nboard/
xboard / winboard (alien edition)
http://hgm.nubati.net/alien.html
Othello Engine Protocol (cassio)
http://cassio.free.fr/engine-protocol.htm
Edax はいずれもサポートしているので、プロトコルは
ソースでも見られます。
202535
垢版 |
2018/01/15(月) 22:46:04.01ID:iBxpq5YC
310さんと私以外の書き込みがあるとは珍しいですね。
実はROMも意外といるんだろうか
203310
垢版 |
2018/01/16(火) 01:56:04.23ID:8d/ib1bw
>>200
どもです。ダウンロードしてみました。
酔っぱらって帰ってきたところなので、明日以後見てみます。

>>201
ありがとうございます。
cassioはmin-Max前提みたいですね。
nboardとxboardは明日以後見てみます。

とはいえ、もうすでに作り始めてしまいました(汗
c#はVBみたいな感じですね。10年くらいVBも触っていないので、VB自体も
昔とはだいぶ違うんだと思いますが。

まずは匿名パイプでのやり取りまで確認できました。
色々なソースのつぎはぎでわけわからんけど、何とかC++とAPIで作ったサーバ
側と同じ動作するものが動いています。
204535
垢版 |
2018/01/18(木) 00:27:09.66ID:+dGVWc2f
GitHubでウインドウズでも簡単にビルドできそうなAlphaZeroクローンを物色中。
205201
垢版 |
2018/01/19(金) 19:49:16.63ID:nx2VVS4x
ところで、
Learning to Play Othello with Deep Neural Networks
https://arxiv.org/abs/1711.06583
はチェックされていますか?
206310
垢版 |
2018/01/20(土) 13:01:59.38ID:Zq3gts8j
>>205
ありがとうございます。
さっそくダウンロードしました。
207535
垢版 |
2018/01/20(土) 23:55:57.24ID:1Kz+zB3+
いろいろ試してみてるけどスキルが足りなくてどれもうまくいかないデスネ。
今これ見てます。
https://github.com/adepierre/Caffe_AlphaZero
208535
垢版 |
2018/01/21(日) 00:31:51.93ID:qH0IRvSF
ん〜なんかアンチウイルスソフトが警告だしてきたorz
どうしようかな…
209535
垢版 |
2018/01/21(日) 23:00:34.14ID:qH0IRvSF
gflagsとかglogとかいうのが必要らしいんだが
アンチウィルスソフトが勝手に何か裏で削除してるらしく
うまくmakeできないorz
なんなんだこれは?
210535
垢版 |
2018/01/25(木) 20:47:17.06ID:deBVwh8E
モチベ保てなくてガッツリサボリ中w
仕事が忙しいのもあるけど
211310
垢版 |
2018/01/27(土) 00:56:40.42ID:0QPAoXtC
自分もGUIでモチベ保てず、がっつりさぼり中。

技術的に難しそうな事は気合入るんだけど、どっちが黒番とかのラジオボタン
をどうしようかとか考え出すと、思考が止まってしまう(汗

一つの項目で諦めがつくまでに3日づつかかっていますorz
212535
垢版 |
2018/01/27(土) 23:18:12.98ID:EzLPwnOa
http://postd.cc/alphago-zero-how-and-why-it-works/
これ読んでます。
とりあえず、一旦コードから離れて基礎知識を充実させる方向で。
213310
垢版 |
2018/01/28(日) 17:18:05.66ID:0oeW9Kee
GUIのパスの処理を真剣にチェックしだしたら、特定のケースで動作が
おかしいので、丸々一晩デバッグしていました。ケースは特定できてた
のですが、ぱっと見まったく原因がわからず。

C#はオブジェクトを代入すると参照になるのでした。やられた。
やっぱCというのは名前だけですね。
214535
垢版 |
2018/01/28(日) 23:56:16.68ID:yuGXDS1r
https://github.com/junxiaosong/AlphaZero_Gomoku
すいません。またコード見始めてます。
多分これがウィンドウズで動かすの一番簡単な奴な気がするw
215535
垢版 |
2018/01/29(月) 20:05:24.91ID:WXPd8Jtc
human_play.pyでモンテカルロAIは動いたけど深層学習AIが動かないorz.
theanoとかいうライブラリが上手くインストールできてないっぽいorz
216535
垢版 |
2018/01/29(月) 20:08:40.86ID:WXPd8Jtc
うう、心が折れそうorz
217535
垢版 |
2018/01/29(月) 21:03:35.36ID:WXPd8Jtc
こんなエラーが出るんだが何がないって言われてるのかわからん。
誰かわかる人いる?

...
File "C:\Python27\lib\site-packages\theano-1.0.1+unknown-py2.7.egg\theano\gof\
lazylinker_c.py", line 127, in <module>
preargs=args)
File "C:\Python27\lib\site-packages\theano-1.0.1+unknown-py2.7.egg\theano\gof\
cmodule.py", line 2359, in compile_str
(status, compile_stderr.replace('\n', '. ')))
Exception: Compilation failed (return status=1): /usr/x86_64-w64-mingw32/bin/ld.
exe: error while loading shared libraries: ?: cannot open shared object file: No
such file or directory. collect2: error: ld returned 127 exit status.
218535
垢版 |
2018/01/29(月) 23:39:21.86ID:WXPd8Jtc
ライブラリに互換性がないって言われてるような気がする。
Cygwinに入ってるライブラリは互換性ないってことか?
どこでライブラリ入手すりゃいいんだ??
219310
垢版 |
2018/01/31(水) 00:01:03.41ID:EjEC4Ae7
すまん。わからんけど、collecdt2というフォルダ(ファイルかも)が無いと言ってる?

こちらは、どうしても画面が崩れてしまうので、最初から作り直し。
原因は、トップのFormでauto resizeをtrueにしていた事でした。

ゲームの進行を上手に管理する方法が無いか考えていると、つい寝てしまうorz
220535
垢版 |
2018/01/31(水) 20:29:33.40ID:u/gx4uXy
すいません。
コマンドプロンプトで実行したら>>217のようなメッセージでライブラリ名わからなかったのですが
Cygwinで実行したらライブラリ名が出てきました。
それぞれ4行づつ同じ行が出るのですが1行に削って張ります。

library stdc++ is not found.
library mingw32 is not found.
library gcc_s is not found.
library gcc is not found.
library moldname is not found.
library mingwex is not found.
library msvcrt is not found.
library advapi32 is not found.
library shell32 is not found.
library user32 is not found.
library kernel32 is not found.
library mingw32 is not found.
library gcc_s is not found.
library gcc is not found.
library moldname is not found.
library mingwex is not found.
library msvcrt is not found.

これに続いて同じ名前のライブラリはあるけどコンパチブルでない的なメッセージが出ています。
221535
垢版 |
2018/02/04(日) 02:31:39.86ID:8N3h1IXY
キタ━━━━━━(゚∀゚)━━━━━━ !!!!!
動いたっぽいです。
Theanoってライブラリのバージョンが0.7.0じゃないといけないみたいです。
ここまでめっさ時間かかったorz
遅れを取り戻さんとな。
222535
垢版 |
2018/02/04(日) 18:58:20.09ID:8N3h1IXY
せっかく動いたけどpython読む根性がなかなか湧いてこない。
つか多分pythonじゃなくても読むのしんどいんだけど。
223310
垢版 |
2018/02/04(日) 20:16:17.17ID:Wmf+lsae
他人のコードは読みづらいですよね。
1年前に書いた自分のコードもですがorz

Theano動作おめでとうございます。良かったです。

こちらは…GUI作るのに嫌気がさして、学習部をいじっていましたが、
そろそろ〜30手の評価関数もそれほど酷いものではなさそうな気がしてきて、
中盤探索9手読み(なんの工夫も無し)で記譜作れる事に思い至りまして。
つまり、MCTSより短時間で記譜作成できると…。
この学習で、もし中盤探索の読みがそこそこな精度になってしまったら、
そもそもMCTSにする意味ないじゃんという現実からいかに目を背け続けるか
という戦いが始まりました(涙
224535
垢版 |
2018/02/05(月) 18:27:38.68ID:Q1ssK5oS
やはりこの業界で生きていくには
パイソンの習得は必須…
225535
垢版 |
2018/02/05(月) 20:15:05.78ID:kkO201mJ
ということでパイソンの入門本買ってきました。
とりあえず囲連星のルールを実装してみます。
226310
垢版 |
2018/02/05(月) 23:37:11.58ID:tGe3CIWd
相変わらず、GUIから逃げています。

アルファ碁でいうところのポリシーネットの学習を放棄して、代わりに評価値から
P(UCT探索に対する絞り込み項)を生成していましたが、これをQ(UCT探索の
予想スコア:これまでの探索の加重平均)から、1プレイアウト毎に再計算するよう
にしてみました。

多少探索速度は落ちますが、良い感じかなぁ。
227535
垢版 |
2018/02/08(木) 20:36:12.73ID:BwB5Lh8w
パイソン入門本、一回通して読もうとしてますが、ページ数あって結構大変。
コード書きながら読んだほうがいいかなぁ。
228310
垢版 |
2018/02/09(金) 23:42:10.85ID:XzN5+u9b
新言語習得はストレスですよね。
C#ですら混乱して、C++に帰りたくなってます(汗

というか、メモリー管理できないC#にいらついて、記譜作成回りをいじって
慰みにしています。中盤探索に置換表を足して、反復深化っぽくしてみま
したが、あんまり早くならなくてがっかり。


Python本はまだ買ってません。ウェブ上の入門を眺めたくらいです。

Pythonは構造やら変数の型の考えやら、落とし穴になりそうなところが
色々とありますね。計算式だけ見ていればわかったような気になりますが、
どういう順番で処理が進むのか、慣れないとわからん感じ。
229535
垢版 |
2018/02/10(土) 21:27:45.30ID:DQEki32w
パイソン、変数の型の宣言がないから他人のコード超読みずらいorz
引数に何与えていいのかとかパッとわからないorz
230535
垢版 |
2018/02/12(月) 00:17:40.24ID:eWCzbr3d
9路囲連星の最低限のルールをパイソンに移植しました。
これからテストします。
231535
垢版 |
2018/02/12(月) 02:17:04.85ID:eWCzbr3d
おおむねバグ取れたっぽい
あとはこれを>>214に移植できれば…
232535
垢版 |
2018/02/12(月) 20:42:28.11ID:eWCzbr3d
他人のコード読むの辛いおT△T
これはかなり時間かかる…
233535
垢版 |
2018/02/12(月) 22:23:10.54ID:eWCzbr3d
うーん、なんかこのコード五目並べのルールにべったり依存してる感じなのかなぁもしかして。
複数のゲームに対応しているAlpha Zeroプロジェクトのコードを見たほうがゲームのルールが分離されてるのかもしれないなぁ
一応、別のプロジェクトに手を出すことも視野に入れるか…
234535
垢版 |
2018/02/12(月) 23:45:59.40ID:eWCzbr3d
アルファゼロって数手前の履歴情報が必要らしいけどなんでこんなものがいるんだろう?
謎だ…
235310
垢版 |
2018/02/13(火) 13:07:22.56ID:SwoVylIU
アルファ碁の論文に書いてあったかな。次の1手的には意味なさそうだけど、
有った方が強くなるので外せなかったみたいな事が書いてあったような。

今現在の思いつきですが、ツリーサーチの末端近くでは、手の流れに応じて
点数が変わる事で、そのツリーのルート側の評価(加重平均)に影響が出てくる
可能性はある。

囲碁の場合、同一盤面が出る可能性が非常に高いのだけど、そこに至る経路で
隙があると、相手にその隙を突かれて、分岐が生じる事で、その点数は無意味に
なる。けど、それは途中の分岐をしっかり読まないと判明しない。経路情報によって
評価値(評価関数直)を下げてしまえば、プレイアウトの振り分けが減って、別の
もっと良い手に集中させることができる。こういう事かなぁ。

ま、本当に今思いついたばかりですが。

GUIに気が進まないまま、ぼーっと学習を見ていると、何故か(効果は微妙だけど)
速度アップの方法を思いついてしまうもので…。地味に色々改良しています。
236535
垢版 |
2018/02/13(火) 22:47:18.55ID:75Woy+K4
310さんほどのプログラマがGUIで躓くというのも謎ですね。
単に凝り性なだけですかね。
237310
垢版 |
2018/02/14(水) 20:49:32.16ID:I/pUqAGs
単にGUIが嫌いなんですorz

凝りたい気持ちと、画面遷移の罠から、心がデッドロックを起こして、
しまいに面倒くさくなってしまうという。
238535
垢版 |
2018/02/14(水) 21:17:25.33ID:XBQY5lLn
オセロで画面遷移なんてほぼいらんでしょうに。
まいいけど。
239535
垢版 |
2018/02/14(水) 22:23:18.42ID:XBQY5lLn
五目並べのプロジェクトだとコウの扱いがよくわからないな
囲碁のプロジェクトもgithubで漁るか…
240535
垢版 |
2018/02/17(土) 21:19:34.66ID:9/16YNby
藤井聡太さん朝日杯将棋オープン戦優勝ですか
すごいすな
241310
垢版 |
2018/02/17(土) 21:53:57.13ID:vz2S+0Ke
ドタバタしながら音だけ聞いていたけど、なんか普通に互角から徐々に優勢を
築いて、相手の奇手にも動ぜずにさばいて、勝利って感じで、強さが際立って
いましたね。

これで勝っても漫画なら編集長にバカにされるレベルと言われていましたが、
本当に笑うしかないですね。
242535
垢版 |
2018/02/19(月) 21:32:59.37ID:k/eP19bS
>>214のプロジェクトに囲連星ルールを移植してみまして、モンテカルロAIが動いたみたいです。
ただし超絶遅い。絶望しかないってくらい遅い。
10プレイアウトで10秒くらいかかります。
デフォルト1000プレイアウトになっていたのでそれぐらいないとまともな強さは出ないんでしょう。
となると1手1000秒か?
絶望しかない。
orzorzorzorzorz
243535
垢版 |
2018/02/19(月) 21:45:50.40ID:k/eP19bS
小路盤五目並べとかConnect4とかtic tac toe くらい小さなゲームじゃなきゃまともに動かんぞこれ
244535
垢版 |
2018/02/19(月) 21:53:01.97ID:k/eP19bS
      ,.‐''" ̄`丶、         ひどい…!ひどすぎるっ……!
    /        \          こんな話があるかっ…!
 /´           \
 /    |\_>、_ 、r‐、    \     命からがら… やっとの思いで…
  レ! ||_| |/_ ヽ\}      \    辿り着いたのに… やり遂げたのに……
  |八|-/>、∪_ u`i  ト、      \
    / / ,くィ夕u' |   |/ ``‐- 、_.、__\      実行速度っ…!
     |/ / /_ヽ┐u |  ,|  /  ,-,.=====ゝ
    ヾ' / r┘|.l__人 |  /\//      \ あの計算量がもぎ取ってしまった……!
      \ ) |   N /  //\./´ ̄`丶
      |u  |  /|(l(l「|  | |   |       せっかく手にした
       | u| / | ヾ-イ .||  l、            俺の未来…希望…
       _|   |/| |  \_|_|,. く. \
      ハ.___ハ     >、 \ \  \      Alpha Zero AI を……!
245535
垢版 |
2018/02/19(月) 22:39:02.94ID:k/eP19bS
つか連想配列とか見るからに遅そうなクラス使いまくりなんだよなぁ
こうなったらC++に移植する方向で考えるか??
246535
垢版 |
2018/02/19(月) 22:59:04.05ID:k/eP19bS
囲連星ルール部分をC++で書きなおしてパイソンと結合させるという手もあるんだろか??
とにかく今のままじゃ遅すぎる
囲連星ルール部分がどれくらいネックになってるかもよくわからないですが多分相当遅い
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況