X



【オセロ,将棋】ボードゲーム Part2【囲碁,War】
■ このスレッドは過去ログ倉庫に格納されています
0001名前は開発中のものです。
垢版 |
2017/10/15(日) 17:34:58.03ID:RaMh0le2
比較的地味なボードゲーム専用のスレが欲しくて立ててみました。

前スレ
【オセロ,将棋】ボードゲーム【囲碁,War】
http://mevius.2ch.net/test/read.cgi/gamedev/1057763418/
0299535
垢版 |
2018/03/23(金) 21:13:02.23ID:Z4T42krD
なんかバグ直して再学習したら、ランダムに打ったほうがマシ、くらいに変な手(1の1とか)打つんだが?
もう嫌になっちゃう。
0300535
垢版 |
2018/03/23(金) 21:21:30.45ID:Z4T42krD
そういやLeela Zeroも学習過程では一線うってたな。。。
逆にいい傾向なのか???
0301310
垢版 |
2018/03/25(日) 02:23:39.84ID:Yig4cMbl
分岐をすべて記譜にリストアップするようにしてから、爆発的に記譜が増えてます。
2000程度だったのが、15000超えました。

が、まだまだスカスカみたいです。

ここまでするんなら、真面目に自己対戦して遡りせずに、ランダム着手に対して
分岐をリストアップさせても一緒というか、早い気がしてきています(汗
0302310
垢版 |
2018/03/31(土) 01:38:59.31ID:h3UgGfs1
ランダム着手も追加して記譜増殖中。ただいま32000超え。
もっとも、残り数手とかの記譜もあるけど(汗

ステージ分割しているので、記譜がなかなか生成されない25〜30手近辺で
非常に少ない教師データで何度も学習する事になり、そのあたりが極端な
過学習になってしまった。

解消方法をいくつか検討中です。
1)時間かかっても良いので、25〜30手の記譜ができるまで頑張る
2)前後の盤面を混ぜて、教師データを増やしてみる
3)ランダム強化学習してみる。

2)3)をやると、おそらく、平均化されて評価値がフラットになるが大小関係は
治ってくると思う。

というわけで、今夜は2)3)を試してみる予定。
0303310
垢版 |
2018/03/31(土) 01:43:35.07ID:h3UgGfs1
あと、時々スコア指定(ヌルウィンドウサーチ)の記譜作成処理で
エラー(スコア間違い)が出る時がある。

運が悪い事にハンドリングミスその他で、記譜を残せていないので、
現象の特定ができていない。

頻度としては数日に1回くらい。

たぶん、全滅と直前のパスがらみだと思うんだけど。
0304535
垢版 |
2018/03/31(土) 23:42:05.28ID:4ltMn3J2
Geforce GTX 1060を増設しました。
>>214をpytorchで学習してみます。
0305535
垢版 |
2018/03/31(土) 23:46:58.88ID:4ltMn3J2
んーうごかん。
GPUありとなしでポリシーファイルに互換性がないんですかね?
もしかして。
初めからやり直すか…
0306310
垢版 |
2018/04/01(日) 01:07:10.57ID:OBeH+1OH
おお。どんどん進んでますね。

こちらは、昨夜のバグの現象は特定しました。
スコアが62や−62で、mtd(f)の探索開始が64や−64の時に、
置換表に残った64や−64が悪さして、64や−64と誤答する模様。

とはいえ、どこを直すべきかはわかりません。探索開始が64や−64
の時に、62や−62にしてやる事で、姑息的に回避はできるので後回し。

あと、記譜作成に色々機能を加えていたら、どこかがおかしそうだという
不安な状態になってしまいまして。このまま記譜学習を進めて良いか自信
が無いので、今までのデータで安全な部分をテスト用に回して、新たに
記譜を作成開始。34手目までは全探索しながら普通に遡れる感じです。

33手目から先は探索時間がしんどいので、ひとしきり落ち着いてから、もう
一度、遡りチェックのプログラムをきちっと見直して、追加していこうかな
と思っています。この間に、強化学習混ぜて、過学習部分を解消して
いこうと思います。
0307535
垢版 |
2018/04/01(日) 12:43:33.62ID:lACu3cfl
お、ちゃんと時間測ってないからあれだけど、気持ち速くなってる気がする。
ちゃんと時間測りたいなぁ。
0308310
垢版 |
2018/04/01(日) 13:49:33.48ID:DAl+8Sdv
バグ問題は、結局姑息的手段では回避できず。
全滅がらみでほかのケースでも誤答するケースが発生しました。
元々FFO#59用にmin-Max探索に入れていた、全滅時の処理くらいしか
原因となりそうなものが思い当たらなかったので、とりあえずコメントアウト
して様子見です。全滅時の探索が速度低下しますが、仕方がありません。
0309310
垢版 |
2018/04/02(月) 20:15:06.48ID:9LYme7cN
結局バグ問題は…迷宮入り臭いです。

記譜作成で負荷テスト並みに探索を繰り返すと、全滅絡まなくても間違うケースが
出てきました。再現性が無いのが辛いところ。

その昔悩んでいた時も、やっぱり置換表がらみの問題で迷宮入りでしたが、
今回も、ケチって置換表を極力クリアせずに使用していた事から、何らかの
矛盾が起きているようです。それを言っちゃうと、置換表付mtd(f)でf値を変え
ながら探索することも、またその時に作成された置換表を流用して記譜作成
兼ねた読み切り処理を速度アップすることも、怪しいという事になるわけで。
間違えてしまった事が判明した時点で、その探索は捨てるくらいしか対策が
無いという事になります。

ネットで調べたら、将棋AI界隈でも置換表の問題点を書いている人がいまして。
少なくとも深さがあっていない置換表データは使うべきではない模様。

今の調子だと一晩動かすと結構な頻度で朝見たら止まっているとい状態なので
せめて発生率を下げるべく、mtd(f)に入る前に置換表をクリアする事にしました。
なぜしなかったかというと、記譜データからスコアが確定している盤面を置換表に
入れて、それを見ながら既に読み切りしている盤面は飛ばす処理をしていたから
です。置換表をクリアして盤面再構築に時間がかかるためです。別途盤面キャッシュ
を持って、そちらは追記、置換表は毎回クリアという形に変更しました。
0310535
垢版 |
2018/04/02(月) 22:24:32.85ID:3iK+AnRP
Leela ZeroがKGSでかなり強くなってる。
俺がパクったプログラムも学習し続けたらあれくらい強くなるんだろうか?
0311535
垢版 |
2018/04/04(水) 20:42:51.24ID:Y0WMbzNW
え、ちょっとまってよ。
GPUありなしでポリシーファイルが違うってことは
成果物を配布しようとしたらGPU持ってる人しか遊べないってこと?
0312535
垢版 |
2018/04/04(水) 20:54:25.72ID:Y0WMbzNW
しかもCUDAとかも一緒にインストールしてもらわないといけない?
ええぇ?
0313310
垢版 |
2018/04/06(金) 22:00:28.44ID:952uhqxW
誤答問題は、置換表クリアで解消しました。
違う局面の探索で使用した置換表データは使いまわしてはいけないという事で。
なんか、結果的に、2年くらい前にも同じ事で騒いでいたような。

色々整ってきたので、あとはひたすら記譜作成しながら学習を回すだけになって
しまって、暇になってます。別PC買ってそっちで学習させながら、別の事をはじめ
ようかなぁと思い始めています。
0314535
垢版 |
2018/04/07(土) 20:43:17.69ID:SqbCC315
うーん、つよくならないorz
学習は継続しつつ別のalpha zero プロジェクトも物色するか…
0315535
垢版 |
2018/04/08(日) 22:10:18.77ID:ZB9Bj6DG
ん、なんかメモリリークあんのかな…
swigでC++から移植したクラスってデフォルトでガベージコレクトされないのかなぁ?
もしかして。
0316535
垢版 |
2018/04/08(日) 22:43:04.99ID:ZB9Bj6DG
VMWareの設定がメモリ1GBになってた。
とりあえず8GBに増やしてみた。
0317535
垢版 |
2018/04/08(日) 22:53:48.62ID:ZB9Bj6DG
お、メモリ増やして再起動かけたら結構いい感じで進みだした?
メモリ増やしたのと再起動かけたのどっちが効いたのかわからんが。
0318535
垢版 |
2018/04/09(月) 20:58:16.91ID:500BArdX
くそ〜ベストポリシー更新が全く来ないorz
もう何回目だ?TT
0319535
垢版 |
2018/04/11(水) 20:46:51.70ID:uiOmKVU+
お、メモリ増やしたせいか連続運転が安定している。
しかしベストポリシー更新は相変わらずなしorz
0320535
垢版 |
2018/04/11(水) 23:07:04.06ID:uiOmKVU+
もしかして、ネットワークの初期値が糞すぎるんだろうか。
でも確かめようがないorz
0321535
垢版 |
2018/04/15(日) 20:07:24.81ID:8sCJrZFg
ベストポリシー更新まじコネ〜
でも他のプロジェクトに浮気しようにもなかなか手ごろなのがないんだよなぁ
0322535
垢版 |
2018/04/15(日) 20:21:37.51ID:8sCJrZFg
いっそ実績のあるLeelaZeroを本気でパクりに行ってみるべきか…
でも多分、難解なんだろうな〜
0323535
垢版 |
2018/04/16(月) 20:30:05.64ID:6KBtspgu
あんまりおかしいんでソースをオリジナルとdiffとったら学習係数が1/100になってたんだがwww
え〜何時いじったかな全く記憶にないwww
これで学習が進んでくれれば!!
0324535
垢版 |
2018/04/16(月) 23:37:28.33ID:6KBtspgu
loss も entropyも減ってきてる!
これでベストポリシー更新が来れば!!
0325535
垢版 |
2018/04/17(火) 22:16:19.94ID:E16XJnGD
キタ━━━━━━(゚∀゚)━━━━━━ !!!!!
ベストポリシー更新きました!
次の切りのいいところで止めてプレーしてみよう
0326535
垢版 |
2018/04/17(火) 22:34:03.78ID:E16XJnGD
それはそうとzen+の発売日が迫ってますね。
金がないから買えないけど情報だけは追っかけてみます。
爆速だといいな。
0327535
垢版 |
2018/04/18(水) 23:48:24.10ID:7NtNWbU1
あとちょっとだけ待とう
終局までの手数も順調に減ってきてるから意味のある手を打ってるんだろう多分
ワクワク
0328535
垢版 |
2018/04/19(木) 20:50:17.33ID:lyvIQrMy
打ってみました。
序盤、中盤は棋理の芽生えみたいなものが感じられました。
伸ばせそうなところを伸ばすとか伸ばされそうなところを止めに来るとか
でもわざと負けようとしても5連までは積極的に作りに来るのにそこからパタッと伸ばすのをやめて7連を作ってくれませんw
なぜw?

でもまあ、希望は感じられました。
もうすこし学習してみます。
0329535
垢版 |
2018/04/19(木) 23:51:35.82ID:lyvIQrMy
zen+なかなかよさげですね。
前世代と比べて一割前後性能アップ?
0330310
垢版 |
2018/04/20(金) 09:40:06.18ID:HgLFJ5UM
うーん。AMDはSIMD命令で遅い命令があって、速度低下するかもって
どこかで読んじゃったからなぁ。


こちらは地道に記譜作成しながら学習させてます。
深さ優先で記譜作成すると、分岐が少ない手筋ばかり増えていくので、
幅優先で、同じ深さである程度記譜溜まってから、次の深さとするように
したのですが、空きマス27からの記譜展開で、時間がかかるようになって
なかなか空き28マスに行けない。オーダリングの精度が出ていないから
だと思いますが、同時に選択肢も増えてきて、余計時間がかかる感じ。

空き30マス突破したら、かかる時間の増加率は下がるはずなんだけど。
0331535
垢版 |
2018/04/20(金) 22:59:48.32ID:1YRRGto3
もしかして終盤はあえてランダム性を残すことによって学習が進みやすくなるなどの深い理由があるのだろうか?
わからんが。
0332535
垢版 |
2018/04/20(金) 23:02:21.21ID:1YRRGto3
それとも序盤は同一局面のデータがたくさん現れるから学習できるけれど
終盤に行くとデータが散らばっちゃって学習できなくなるということだろうか
0333名前は開発中のものです。
垢版 |
2018/04/20(金) 23:03:29.26ID:1YRRGto3
あるいは一線や二線は打たないほうがいいと学習してしまっているがため、7連を作れないのだろうか?
0334310
垢版 |
2018/04/21(土) 20:32:42.81ID:AdkW58BW
オセロは記譜生成させてるだけで暇なので、将棋の事を考えてました。

KKPとかよくわからないし、同じ事をやってもつまらないので、利きを点数化
しようかと考えてみまして、実際の計算方法を考えていたら、自玉周辺と
相手玉に対する利きがKKPなのではないかと思い至ってしまいました。

持ち駒の点数は駒種毎に固定で振られていて、駒同士のぶつかりによる優劣
特に駒交換はmin-Maxにて補間しているのかなと。評価関数自体は意外と単純
な事しか学習していない感じで、探索で補っている部分が大きいように感じます。

こうやって見ると、上手く単純化しているなぁと。
自分で勝手に想像した内容に感心してしまいました。

ただ、これならこれで、自玉KPと相手玉KPの合算で、2駒関係に次元を落とせ
そうではないかと思ってしまいました。まあ、無理なんでしょうけど。

自分がやる上での一番のネックは、オセロの評価関数が点数だったために、
なんちゃって強化学習しかやった事がな点ですね。あと、みなさんライブラリ化
されていて、それに則れば色々な人の考えた高速化・高効率化のネタが利用
できる点で、一から車輪の再発明していては追い付けないよなぁと。
0335535
垢版 |
2018/04/21(土) 20:39:59.86ID:8g8p+RpI
ほう、将棋に進出ですか。
将棋AI界はオープンソースが進んでる感じなんですかね。
0336535
垢版 |
2018/04/21(土) 20:50:54.10ID:8g8p+RpI
alpha zero のパクりプログラムgithubから丸パクしてきたわけだけど
そろそろちゃんとソース読み解いてみようかな。難しいだろうけど

丁寧な解説がどこかにあればいいんだけどね
0337535
垢版 |
2018/04/22(日) 17:35:27.70ID:QOhFsFyf
お、AIが7作った。
いままではわざと負けようとしても勝ってくれなかったけど今回は勝ってくれた。
まだまだ弱いけどもっと学習させてみよう
0338535
垢版 |
2018/04/22(日) 19:13:47.98ID:QOhFsFyf
俺も学習見守るだけで暇になっちゃったからなんか始めたいけど
計算リソースが学習にもってかれちゃってるからそこどうするか。

やっぱPC新調か?

グラボも効果あるみたいだし今度はGeforce 1080 Tiとか試してみたいな。

金がないけど。
0339310
垢版 |
2018/04/22(日) 19:48:13.41ID:wf3ukgDl
だよね。自分も脳内妄想で我慢です。
PC新調しちゃうか思いっきり悩み中。
0340535
垢版 |
2018/04/25(水) 20:09:35.29ID:QZIUF0Ri
もっとネットワーク大きくしてみたいな。
でもさらに学習時間がかかると思うと躊躇する。
0341535
垢版 |
2018/04/27(金) 21:32:10.80ID:b1G/gV5U
お、損失が3点台だったのが2点台になった。
いい感じなんじゃないでしょうか?
0342535
垢版 |
2018/04/28(土) 17:38:12.12ID:MUOfiFNK
ジムケラーがインテルに来たとか。
いいCPU作ってくれるならどこでもいいけどね。
0343535
垢版 |
2018/04/29(日) 20:30:57.65ID:mX318X6T
序盤は素晴らしい棋理の芽生えを感じるが、いかんせん終盤がなぁ
ほかのアルファゼロクローンも似たような感じなのだろうか?
0344535
垢版 |
2018/04/29(日) 20:50:13.18ID:mX318X6T
公式AIともやってみたけど序盤センスは互角以上と感じられる。
実際、必至をかける一歩手前まで行った。
終盤力さえ磨かれればおそらく公式AI越えはある。
0345535
垢版 |
2018/04/30(月) 22:51:47.16ID:qAJqtYoj
学習が1000エピソード突破。
1500が規定値だから最後まで回したいな。
0346535
垢版 |
2018/05/01(火) 21:34:25.66ID:bYHVWZMu
もっとパワー、速度が欲しいな。
こんなことなら最初から1080 Ti いっときゃ良かったかな?
0347535
垢版 |
2018/05/03(木) 10:58:16.57ID:gNd8xJ5s
ちょっと思うところがあって、思い切ってネットワーク大きくしてみました。
学習最初からやり直しです。

さて吉と出るか凶とでるか。
0348535
垢版 |
2018/05/03(木) 13:28:58.30ID:gNd8xJ5s
ん、ネットワーク構成変えたら学習率もいじらないと上手くいかないのか?
ネットワークでかくしたら学習率は大きくすればいいのか小さくすればいいのか…
0349535
垢版 |
2018/05/03(木) 13:42:41.42ID:gNd8xJ5s
ネットワークでかくしたら学習率は小さくするのがいいみたい?
0350310
垢版 |
2018/05/03(木) 20:31:46.75ID:EAR7zekO
なんか順調でうらやましい。
俺もやっぱGPU付きのPC買うべかな。

一般的にLRでは、学習率は発散しない限界まで大きくするのが良いらしく、
昔は、最初大きく、試行回数増えるごとにだんだん小さくみたいな事をしてました。
NNではRMSPropとかADAMとかで自動調整する流れだと当時理解していました。
ただ、Googleの論文読むと、普通に学習率固定っぽく読めてしまうんですよね。
強化学習だと学習率固定が良いのかも知れません。

表現力大きいからあんまり問題ない気がするのですが、学習率は小さくすると
学習に時間がかかる代わりに、収束しやすくなります。局所解には陥りやすく
なるのではないかと愚考しますが、強化学習における局所解と、教師付学習に
おける局所解は現象が違うから、よくわかりません。
0351310
垢版 |
2018/05/03(木) 20:37:19.91ID:EAR7zekO
こちら、例によってひたすら分岐付き記譜を作成しています。
空きマス27の所(完全読みとしては26)のところから、計算時間が案の定すごく
かかるようになってしまって、遅々として進まなくなりました。

最後の手段でとっておいた、UCT探索で仮PV作成し、それでmtd(f)にて評価値を
迅速に確定して、その評価値で正しいPVを求めるという流れにしたところ、恐らく
数倍程度に高速化され、それによって記譜が集まり正確になる事で、評価関数の
精度が上がって、仮PVが正確になりという好循環に、ようやく入る事ができました。

ただ、それでもまだ時間はかかるというか、今空きマス28まで持っていったら、
また時間がかかる地獄に入りそう。最低でも空きマス30までは持っていきたい。

つか、待っている時間が長い…セカンドPCが欲しい。
0352310
垢版 |
2018/05/03(木) 20:41:41.51ID:EAR7zekO
>>351
>数倍程度に高速化され

あくまで仮PVが数手分合っている時の話で、仮PVが間違っていると、
むしろ遅くなる可能性があります。


あと、一つの局面に対し、最善手が複数あるケースでは、例えば最善手
が2つあると2倍程度時間がかかるという問題があるのは認識していて、
対策は可能なのですが、そうするとバグった時にβカットのエラーを吐か
ないという恐ろしい状態になってしまうので躊躇しています。
0353310
垢版 |
2018/05/04(金) 19:57:24.12ID:5CQB8Di3
世界コンピュータ将棋選手権の2次予選までで強さをみせつけている
T.N.K(通称たぬき)ですが、DL勢にして高速評価関数という事なので
アピール文書を見てみました。

これ、CNNではなく、全結合のDeep Networkの模様。追加で論文も
出ているので、見たところ5層のMLPです。

入力層に玉との2駒関係を使っていて、そこは計算量が多いので、
ここだけ差分計算で高速化しているとの事。自分は行列をEigenに
任せちゃってるので差分計算していませんが、オセロでも結構使え
るはず。

もう一度オセロをMLPに拡張したくなってきた(汗
0354535
垢版 |
2018/05/07(月) 20:19:04.83ID:m+uVPKyG
ネットワーク大きくすると学習が収束する確率下がるんですかね?
なんか学習がうまく進んでないようです。
0355535
垢版 |
2018/05/08(火) 00:21:37.96ID:VKk6NsC2
もしかして学習率だけでなく、ほかのパラメータにも手を加えなければならないってことですかね?
0356310
垢版 |
2018/05/08(火) 01:01:09.30ID:6noaUyVY
バックプロパゲーションで計算している以上、深さが深くなると、
その分初段まで誤差を遡らせるのに時間がかかるから、収束が
遅くなって当然かと思います。

あと、初期値のランダム値の幅も、適切に設定しないとなかなか
収束しなくなりますし、それでも初期値の運が悪いとまったく収束
しないなんて事もあり、ちょこっと不安定なところがあります。

XavierとかHeとか初期値の設定項目はありませんか?
本で読んだ知識なので、現実にどれくらい影響するのか良くわかりませんが(^^;
0357535
垢版 |
2018/05/08(火) 19:21:19.88ID:3yhYJr6O
おお、ありがとうございます。
しらべてみます。
0358535
垢版 |
2018/05/09(水) 21:58:37.29ID:53SriW94
パソコン壊れたかと思ったが放電したらなおった
あー怖かったTT
0359535
垢版 |
2018/05/10(木) 20:05:15.86ID:X+P+UxO/
学習率の変動率?を下げたら結構うまく動いてるっぽいです。
0360535
垢版 |
2018/05/11(金) 20:15:31.62ID:TPpBGuAT
loss とか entropyはいい感じに減ってるのに自己対局の結果がついてこないですね。
うーん、なんだろう?
0361535
垢版 |
2018/05/12(土) 17:16:50.40ID:UY4N1vvW
いや、自己対局もちょっとづつ改善してるみたいです。
もっと時間が必要かな。
0362535
垢版 |
2018/05/13(日) 18:33:11.99ID:jNzVm6ts
windowsがたまに夜中に勝手に再起動してしまうんだが?
マジむかつく(怒
0363310
垢版 |
2018/05/13(日) 19:53:17.92ID:i+O998yE
Windows Updateかな?
俺は通知もらうだけにして、タイミング見て自分で再起動かけてる。
まあ、24時間経つとカウントダウンが始まるので、早目に再起動する事になるけど。
0364535
垢版 |
2018/05/16(水) 19:41:44.02ID:zhHRqcbt
いままで50エピソード毎に自己対戦してたけど、自己対戦がかなり重いから200エピソード毎に自己対戦にしたらなかなかいい感じ。
0365535
垢版 |
2018/05/16(水) 20:52:45.23ID:zhHRqcbt
ネットワーク大きくしても詰めが甘いのはかわらないですねorz.
公式AIに勝つチャンスあったのに勝ちを逃してしまいました。
0366310
垢版 |
2018/05/17(木) 20:16:35.67ID:3wU0adoY
Surfaceの電源ケーブル、そろそろ断線しそうだなぁと思っていたら、
PCをひょいと動かした瞬間に、まさかの電源落ち。

ウェイトデータ書き込み中に停まらないように色々工夫していても、
この手の落ちには対処できるわけもなく、また大変に運が悪い事に
またしても後半10ステージ程度のウェイトデータが飛んでしまい
ました。バックアップとっていたのですが、気づかずにいたので、既に
上書き済みという罠。

後ろ10ステージ分のみゼロクリアして、そこだけ今のデータで再度
学習する羽目になりました。

orz
0367535
垢版 |
2018/05/17(木) 20:37:00.03ID:anbc4vLN
乙w
0368535
垢版 |
2018/05/17(木) 23:06:00.81ID:anbc4vLN
これはNew マシンを買えとの神のお告げww
0369535
垢版 |
2018/05/18(金) 20:48:52.38ID:UxmUzKYy
まただよw(再起動)
0371535
垢版 |
2018/05/19(土) 20:01:16.80ID:PB1pw3rI
むう、AlphaZeroのポテンシャルはこんなものではないはずだが。
でも100万局くら学習させないと真価は発揮できないかもなぁ。
0372535
垢版 |
2018/05/20(日) 23:46:47.79ID:A2GqvvmZ
19路囲碁だと20層くらい層がないと駄目だとか。
うーん20層は厳しい。。。
0373310
垢版 |
2018/05/21(月) 20:17:29.25ID:aDShJzMX
畳み込み窓が3×3で、隣との関係を1マス分づつ認識しているとすると、19路で
19層必要で、出力の全結合層つけて20層って事なのかなぁ。

あとフィルタ数も大事だと思う。フィルタで認識する特徴の種類が決まっていると思う。

なんとなくだけど、こう仮定している。検証はしていない(汗
0374535
垢版 |
2018/05/21(月) 21:00:41.57ID:9qAF6usq
いまのところ192 * 6 でやってます。
9路だから192 * 10 にすればよかったかなぁ
0375310
垢版 |
2018/05/22(火) 20:12:53.71ID:do1nJaPu
五目系なら、周辺5マスが把握できていればよいかもよ。
比較検証しなきゃわからんけど。
0376535
垢版 |
2018/05/22(火) 20:18:42.34ID:025jAm4L
うーん、そうなんですか?。
ライフゲーム囲碁はもろ周辺5マスなんですけどね。
囲連星成功したらライフゲーム囲碁もやりたいですね。
0377535
垢版 |
2018/05/23(水) 23:49:25.39ID:z+TgzaXz
くそ〜何時まで経っても一手の重みみたいなものを理解してくれないorz.
なんか足の遅い打ち方するんだよなぁ。
もういっそ20層にしちゃおうかな orz
0378535
垢版 |
2018/05/24(木) 20:38:02.47ID:g5FOS6wP
ん、ちょっとづつだけど強くなってる気がする。。。
くそ〜Googleの計算リソースがあれば30分くらいで名人超えるんだろうけど。。。
0379535
垢版 |
2018/05/24(木) 20:57:44.30ID:g5FOS6wP
自己対戦が勝率100%行ってしまいました。
対戦相手も更新されていくなら勝率100%は行かないと思うんですが。
もともとの実装がなにかおかしいのだろうか…
0380535
垢版 |
2018/05/25(金) 23:18:10.63ID:Wo9ACErv
まだ公式AIに勝てないけど毎日ちょっとづつ進歩しているのは感じる。
まだ希望はある。
0381535
垢版 |
2018/05/26(土) 20:20:48.78ID:qA0Nw26t
Alpha Zeroのアルゴリズムは囲連星よりもライフゲーム囲碁に向いてる気がする。
0382535
垢版 |
2018/05/26(土) 21:33:20.38ID:qA0Nw26t
FacebookがELF OpenGoというのを公開したとか。
プロ棋士にも勝てるみたいですね。
0383535
垢版 |
2018/05/27(日) 19:07:25.97ID:kULpg0Pw
ELF OpenGo もGPU 2000台とか使わないと強くならないみたい?
は〜絶望する。
0384535
垢版 |
2018/05/28(月) 22:00:33.18ID:hqRKJ+dG
昔のLeela zeroもそうでしたがシチョウが読めてないっぽいですねぇ
0385535
垢版 |
2018/05/28(月) 22:12:43.53ID:hqRKJ+dG
でもちょっとづつでも確かに前進してる気がします。
ロールアウトの回数増やしたら学習の質も上がるかなぁ?
やってみるか。。。
0386535
垢版 |
2018/05/29(火) 20:13:27.71ID:LETTkqJf
ん、lossとentropyがかなり増えてますね。
ロールアウトを増やしたえいきょうだろうか?
0387535
垢版 |
2018/05/29(火) 21:44:21.56ID:LETTkqJf
ネットワークを192 * 20 にしたい衝動に駆られるw
危険な賭けだが…
0388535
垢版 |
2018/05/30(水) 22:20:56.63ID:s+sw+z1r
キタ━━━━━━(゚∀゚)━━━━━━ !!!!!
公式AIに初勝利!
内容としては相手のミスに助けられただけだけどそれでも格段に進歩してる!

(
;FF[1]GM[1]SZ[9]
;B[fe];W[fc];B[de];W[dc];B[ed];W[ec]
;B[gc];W[gb];B[ee];W[cb];B[ce];W[hb]
;B[ge];W[fh];B[be];W[gd];B[he])
0389535
垢版 |
2018/05/31(木) 22:06:07.55ID:CLpDRjz4
惜しい!惜しいなぁ。
中盤まで内容は圧倒しておきながら最後の盤端のシチョウが読めずに逆転負け。
学習途中のAlpha Zero系の弱点が出てしまいました。
でも、ここ克服したら100戦100勝もあり得るかも。

(
;FF[1]GM[1]SZ[9]
;B[df];W[fe];B[de];W[cg];B[ef];W[hg]
;B[ff];W[gf];B[cf];W[gd];B[fg];W[gh]
;B[dg];W[gc];B[gg];W[ge];B[dc];W[hb]
;B[dd];W[dh];B[db];W[da];B[eh];W[ha]
;B[eg];W[hc];B[he];W[ie];B[hf];W[if]
;B[hd];W[id];B[he];W[ch];B[hf];W[hd]
;B[he];W[hf];B[di];W[he])
0390535
垢版 |
2018/06/01(金) 22:15:38.64ID:i1DTZ7p0
本来負けてたはずのゲームですが逆転勝利しました!
以前より大分、棋理のようなものが身についてきている感じがします。
ロールアウト増やしたのが効いたかな?

(
;FF[1]GM[1]SZ[9]
;B[df];W[fb];B[ef];W[ff];B[fe];W[ge]
;B[fg];W[gf];B[gg];W[cg];B[cf];W[hg]
;B[fd];W[gd];B[gc];W[hc];B[fc];W[hb]
;B[hf];W[hd];B[he];W[eg];B[dg];W[hh]
;B[eh];W[eb];B[dd];W[gb];B[db];W[dc]
;B[ec];W[de];B[cc];W[bc];B[ed];W[id]
;B[ce];W[ie];B[ei];W[bh];B[ee];W[ba]
;B[eg])
0391535
垢版 |
2018/06/02(土) 21:54:09.55ID:GZGHIXxE
ぼちぼちウインドウズに移植することも考え始めなければ…
0392535
垢版 |
2018/06/04(月) 20:50:12.16ID:Hw4HpbU5
毎日棋風がすこしずつ変わっていくな。
面白い。
3線を重視し始めたようだ。
0393535
垢版 |
2018/06/04(月) 21:29:44.63ID:Hw4HpbU5
なんかネットワークの規模が足りてない気がしてきたわ。orz orz orz
一気に256 * 20くらいに増やしてみようかな?
気が早いかな〜
0394535
垢版 |
2018/06/04(月) 21:42:52.90ID:Hw4HpbU5
うーん、どうせやり直すなら早いほうがいいよね?
でもこのまま学習続けたら何が起こるかも知りたいし…
悩ましい。
0395535
垢版 |
2018/06/04(月) 22:55:50.50ID:Hw4HpbU5
思い切ってネットワーク構成を256 * 24 にしました。
激遅になりそうだが…
0396535
垢版 |
2018/06/04(月) 23:05:36.60ID:Hw4HpbU5
ネットワークを192 * 6 から 256 * 24 にしたら計算量は(256*24)/(192*6)=5.333倍であってる?
まさか指数的に計算量増えたりしないよね?
0397535
垢版 |
2018/06/04(月) 23:18:15.88ID:Hw4HpbU5
メモリが足らんといわれたぜwww
12GBも割り当てたのにwwww

こりゃニューマシン買うしかないな。
0398535
垢版 |
2018/06/05(火) 00:01:42.42ID:2ipfQYrF
とりあえず、64 * 24 にしてみました。
これでも6GB位メモリ食う。

まじでスレッドリッパーに128GB積みたい衝動に駆られるw
0399535
垢版 |
2018/06/06(水) 21:01:18.82ID:/EVpmksK
やっぱ24層は無理かもorz
全然学習が進んでるように見えないorz
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況