比較的地味なボードゲーム専用のスレが欲しくて立ててみました。
前スレ
【オセロ,将棋】ボードゲーム【囲碁,War】
http://mevius.2ch.net/test/read.cgi/gamedev/1057763418/
探検
【オセロ,将棋】ボードゲーム Part2【囲碁,War】
■ このスレッドは過去ログ倉庫に格納されています
1名前は開発中のものです。
2017/10/15(日) 17:34:58.03ID:RaMh0le2310535
2018/04/02(月) 22:24:32.85ID:3iK+AnRP Leela ZeroがKGSでかなり強くなってる。
俺がパクったプログラムも学習し続けたらあれくらい強くなるんだろうか?
俺がパクったプログラムも学習し続けたらあれくらい強くなるんだろうか?
311535
2018/04/04(水) 20:42:51.24ID:Y0WMbzNW え、ちょっとまってよ。
GPUありなしでポリシーファイルが違うってことは
成果物を配布しようとしたらGPU持ってる人しか遊べないってこと?
GPUありなしでポリシーファイルが違うってことは
成果物を配布しようとしたらGPU持ってる人しか遊べないってこと?
312535
2018/04/04(水) 20:54:25.72ID:Y0WMbzNW しかもCUDAとかも一緒にインストールしてもらわないといけない?
ええぇ?
ええぇ?
313310
2018/04/06(金) 22:00:28.44ID:952uhqxW 誤答問題は、置換表クリアで解消しました。
違う局面の探索で使用した置換表データは使いまわしてはいけないという事で。
なんか、結果的に、2年くらい前にも同じ事で騒いでいたような。
色々整ってきたので、あとはひたすら記譜作成しながら学習を回すだけになって
しまって、暇になってます。別PC買ってそっちで学習させながら、別の事をはじめ
ようかなぁと思い始めています。
違う局面の探索で使用した置換表データは使いまわしてはいけないという事で。
なんか、結果的に、2年くらい前にも同じ事で騒いでいたような。
色々整ってきたので、あとはひたすら記譜作成しながら学習を回すだけになって
しまって、暇になってます。別PC買ってそっちで学習させながら、別の事をはじめ
ようかなぁと思い始めています。
314535
2018/04/07(土) 20:43:17.69ID:SqbCC315 うーん、つよくならないorz
学習は継続しつつ別のalpha zero プロジェクトも物色するか…
学習は継続しつつ別のalpha zero プロジェクトも物色するか…
315535
2018/04/08(日) 22:10:18.77ID:ZB9Bj6DG ん、なんかメモリリークあんのかな…
swigでC++から移植したクラスってデフォルトでガベージコレクトされないのかなぁ?
もしかして。
swigでC++から移植したクラスってデフォルトでガベージコレクトされないのかなぁ?
もしかして。
316535
2018/04/08(日) 22:43:04.99ID:ZB9Bj6DG VMWareの設定がメモリ1GBになってた。
とりあえず8GBに増やしてみた。
とりあえず8GBに増やしてみた。
317535
2018/04/08(日) 22:53:48.62ID:ZB9Bj6DG お、メモリ増やして再起動かけたら結構いい感じで進みだした?
メモリ増やしたのと再起動かけたのどっちが効いたのかわからんが。
メモリ増やしたのと再起動かけたのどっちが効いたのかわからんが。
318535
2018/04/09(月) 20:58:16.91ID:500BArdX くそ〜ベストポリシー更新が全く来ないorz
もう何回目だ?TT
もう何回目だ?TT
319535
2018/04/11(水) 20:46:51.70ID:uiOmKVU+ お、メモリ増やしたせいか連続運転が安定している。
しかしベストポリシー更新は相変わらずなしorz
しかしベストポリシー更新は相変わらずなしorz
320535
2018/04/11(水) 23:07:04.06ID:uiOmKVU+ もしかして、ネットワークの初期値が糞すぎるんだろうか。
でも確かめようがないorz
でも確かめようがないorz
321535
2018/04/15(日) 20:07:24.81ID:8sCJrZFg ベストポリシー更新まじコネ〜
でも他のプロジェクトに浮気しようにもなかなか手ごろなのがないんだよなぁ
でも他のプロジェクトに浮気しようにもなかなか手ごろなのがないんだよなぁ
322535
2018/04/15(日) 20:21:37.51ID:8sCJrZFg いっそ実績のあるLeelaZeroを本気でパクりに行ってみるべきか…
でも多分、難解なんだろうな〜
でも多分、難解なんだろうな〜
323535
2018/04/16(月) 20:30:05.64ID:6KBtspgu あんまりおかしいんでソースをオリジナルとdiffとったら学習係数が1/100になってたんだがwww
え〜何時いじったかな全く記憶にないwww
これで学習が進んでくれれば!!
え〜何時いじったかな全く記憶にないwww
これで学習が進んでくれれば!!
324535
2018/04/16(月) 23:37:28.33ID:6KBtspgu loss も entropyも減ってきてる!
これでベストポリシー更新が来れば!!
これでベストポリシー更新が来れば!!
325535
2018/04/17(火) 22:16:19.94ID:E16XJnGD キタ━━━━━━(゚∀゚)━━━━━━ !!!!!
ベストポリシー更新きました!
次の切りのいいところで止めてプレーしてみよう
ベストポリシー更新きました!
次の切りのいいところで止めてプレーしてみよう
326535
2018/04/17(火) 22:34:03.78ID:E16XJnGD それはそうとzen+の発売日が迫ってますね。
金がないから買えないけど情報だけは追っかけてみます。
爆速だといいな。
金がないから買えないけど情報だけは追っかけてみます。
爆速だといいな。
327535
2018/04/18(水) 23:48:24.10ID:7NtNWbU1 あとちょっとだけ待とう
終局までの手数も順調に減ってきてるから意味のある手を打ってるんだろう多分
ワクワク
終局までの手数も順調に減ってきてるから意味のある手を打ってるんだろう多分
ワクワク
328535
2018/04/19(木) 20:50:17.33ID:lyvIQrMy 打ってみました。
序盤、中盤は棋理の芽生えみたいなものが感じられました。
伸ばせそうなところを伸ばすとか伸ばされそうなところを止めに来るとか
でもわざと負けようとしても5連までは積極的に作りに来るのにそこからパタッと伸ばすのをやめて7連を作ってくれませんw
なぜw?
でもまあ、希望は感じられました。
もうすこし学習してみます。
序盤、中盤は棋理の芽生えみたいなものが感じられました。
伸ばせそうなところを伸ばすとか伸ばされそうなところを止めに来るとか
でもわざと負けようとしても5連までは積極的に作りに来るのにそこからパタッと伸ばすのをやめて7連を作ってくれませんw
なぜw?
でもまあ、希望は感じられました。
もうすこし学習してみます。
329535
2018/04/19(木) 23:51:35.82ID:lyvIQrMy zen+なかなかよさげですね。
前世代と比べて一割前後性能アップ?
前世代と比べて一割前後性能アップ?
330310
2018/04/20(金) 09:40:06.18ID:HgLFJ5UM うーん。AMDはSIMD命令で遅い命令があって、速度低下するかもって
どこかで読んじゃったからなぁ。
こちらは地道に記譜作成しながら学習させてます。
深さ優先で記譜作成すると、分岐が少ない手筋ばかり増えていくので、
幅優先で、同じ深さである程度記譜溜まってから、次の深さとするように
したのですが、空きマス27からの記譜展開で、時間がかかるようになって
なかなか空き28マスに行けない。オーダリングの精度が出ていないから
だと思いますが、同時に選択肢も増えてきて、余計時間がかかる感じ。
空き30マス突破したら、かかる時間の増加率は下がるはずなんだけど。
どこかで読んじゃったからなぁ。
こちらは地道に記譜作成しながら学習させてます。
深さ優先で記譜作成すると、分岐が少ない手筋ばかり増えていくので、
幅優先で、同じ深さである程度記譜溜まってから、次の深さとするように
したのですが、空きマス27からの記譜展開で、時間がかかるようになって
なかなか空き28マスに行けない。オーダリングの精度が出ていないから
だと思いますが、同時に選択肢も増えてきて、余計時間がかかる感じ。
空き30マス突破したら、かかる時間の増加率は下がるはずなんだけど。
331535
2018/04/20(金) 22:59:48.32ID:1YRRGto3 もしかして終盤はあえてランダム性を残すことによって学習が進みやすくなるなどの深い理由があるのだろうか?
わからんが。
わからんが。
332535
2018/04/20(金) 23:02:21.21ID:1YRRGto3 それとも序盤は同一局面のデータがたくさん現れるから学習できるけれど
終盤に行くとデータが散らばっちゃって学習できなくなるということだろうか
終盤に行くとデータが散らばっちゃって学習できなくなるということだろうか
333名前は開発中のものです。
2018/04/20(金) 23:03:29.26ID:1YRRGto3 あるいは一線や二線は打たないほうがいいと学習してしまっているがため、7連を作れないのだろうか?
334310
2018/04/21(土) 20:32:42.81ID:AdkW58BW オセロは記譜生成させてるだけで暇なので、将棋の事を考えてました。
KKPとかよくわからないし、同じ事をやってもつまらないので、利きを点数化
しようかと考えてみまして、実際の計算方法を考えていたら、自玉周辺と
相手玉に対する利きがKKPなのではないかと思い至ってしまいました。
持ち駒の点数は駒種毎に固定で振られていて、駒同士のぶつかりによる優劣
特に駒交換はmin-Maxにて補間しているのかなと。評価関数自体は意外と単純
な事しか学習していない感じで、探索で補っている部分が大きいように感じます。
こうやって見ると、上手く単純化しているなぁと。
自分で勝手に想像した内容に感心してしまいました。
ただ、これならこれで、自玉KPと相手玉KPの合算で、2駒関係に次元を落とせ
そうではないかと思ってしまいました。まあ、無理なんでしょうけど。
自分がやる上での一番のネックは、オセロの評価関数が点数だったために、
なんちゃって強化学習しかやった事がな点ですね。あと、みなさんライブラリ化
されていて、それに則れば色々な人の考えた高速化・高効率化のネタが利用
できる点で、一から車輪の再発明していては追い付けないよなぁと。
KKPとかよくわからないし、同じ事をやってもつまらないので、利きを点数化
しようかと考えてみまして、実際の計算方法を考えていたら、自玉周辺と
相手玉に対する利きがKKPなのではないかと思い至ってしまいました。
持ち駒の点数は駒種毎に固定で振られていて、駒同士のぶつかりによる優劣
特に駒交換はmin-Maxにて補間しているのかなと。評価関数自体は意外と単純
な事しか学習していない感じで、探索で補っている部分が大きいように感じます。
こうやって見ると、上手く単純化しているなぁと。
自分で勝手に想像した内容に感心してしまいました。
ただ、これならこれで、自玉KPと相手玉KPの合算で、2駒関係に次元を落とせ
そうではないかと思ってしまいました。まあ、無理なんでしょうけど。
自分がやる上での一番のネックは、オセロの評価関数が点数だったために、
なんちゃって強化学習しかやった事がな点ですね。あと、みなさんライブラリ化
されていて、それに則れば色々な人の考えた高速化・高効率化のネタが利用
できる点で、一から車輪の再発明していては追い付けないよなぁと。
335535
2018/04/21(土) 20:39:59.86ID:8g8p+RpI ほう、将棋に進出ですか。
将棋AI界はオープンソースが進んでる感じなんですかね。
将棋AI界はオープンソースが進んでる感じなんですかね。
336535
2018/04/21(土) 20:50:54.10ID:8g8p+RpI alpha zero のパクりプログラムgithubから丸パクしてきたわけだけど
そろそろちゃんとソース読み解いてみようかな。難しいだろうけど
丁寧な解説がどこかにあればいいんだけどね
そろそろちゃんとソース読み解いてみようかな。難しいだろうけど
丁寧な解説がどこかにあればいいんだけどね
337535
2018/04/22(日) 17:35:27.70ID:QOhFsFyf お、AIが7作った。
いままではわざと負けようとしても勝ってくれなかったけど今回は勝ってくれた。
まだまだ弱いけどもっと学習させてみよう
いままではわざと負けようとしても勝ってくれなかったけど今回は勝ってくれた。
まだまだ弱いけどもっと学習させてみよう
338535
2018/04/22(日) 19:13:47.98ID:QOhFsFyf 俺も学習見守るだけで暇になっちゃったからなんか始めたいけど
計算リソースが学習にもってかれちゃってるからそこどうするか。
やっぱPC新調か?
グラボも効果あるみたいだし今度はGeforce 1080 Tiとか試してみたいな。
金がないけど。
計算リソースが学習にもってかれちゃってるからそこどうするか。
やっぱPC新調か?
グラボも効果あるみたいだし今度はGeforce 1080 Tiとか試してみたいな。
金がないけど。
339310
2018/04/22(日) 19:48:13.41ID:wf3ukgDl だよね。自分も脳内妄想で我慢です。
PC新調しちゃうか思いっきり悩み中。
PC新調しちゃうか思いっきり悩み中。
340535
2018/04/25(水) 20:09:35.29ID:QZIUF0Ri もっとネットワーク大きくしてみたいな。
でもさらに学習時間がかかると思うと躊躇する。
でもさらに学習時間がかかると思うと躊躇する。
341535
2018/04/27(金) 21:32:10.80ID:b1G/gV5U お、損失が3点台だったのが2点台になった。
いい感じなんじゃないでしょうか?
いい感じなんじゃないでしょうか?
342535
2018/04/28(土) 17:38:12.12ID:MUOfiFNK ジムケラーがインテルに来たとか。
いいCPU作ってくれるならどこでもいいけどね。
いいCPU作ってくれるならどこでもいいけどね。
343535
2018/04/29(日) 20:30:57.65ID:mX318X6T 序盤は素晴らしい棋理の芽生えを感じるが、いかんせん終盤がなぁ
ほかのアルファゼロクローンも似たような感じなのだろうか?
ほかのアルファゼロクローンも似たような感じなのだろうか?
344535
2018/04/29(日) 20:50:13.18ID:mX318X6T 公式AIともやってみたけど序盤センスは互角以上と感じられる。
実際、必至をかける一歩手前まで行った。
終盤力さえ磨かれればおそらく公式AI越えはある。
実際、必至をかける一歩手前まで行った。
終盤力さえ磨かれればおそらく公式AI越えはある。
345535
2018/04/30(月) 22:51:47.16ID:qAJqtYoj 学習が1000エピソード突破。
1500が規定値だから最後まで回したいな。
1500が規定値だから最後まで回したいな。
346535
2018/05/01(火) 21:34:25.66ID:bYHVWZMu もっとパワー、速度が欲しいな。
こんなことなら最初から1080 Ti いっときゃ良かったかな?
こんなことなら最初から1080 Ti いっときゃ良かったかな?
347535
2018/05/03(木) 10:58:16.57ID:gNd8xJ5s ちょっと思うところがあって、思い切ってネットワーク大きくしてみました。
学習最初からやり直しです。
さて吉と出るか凶とでるか。
学習最初からやり直しです。
さて吉と出るか凶とでるか。
348535
2018/05/03(木) 13:28:58.30ID:gNd8xJ5s ん、ネットワーク構成変えたら学習率もいじらないと上手くいかないのか?
ネットワークでかくしたら学習率は大きくすればいいのか小さくすればいいのか…
ネットワークでかくしたら学習率は大きくすればいいのか小さくすればいいのか…
349535
2018/05/03(木) 13:42:41.42ID:gNd8xJ5s ネットワークでかくしたら学習率は小さくするのがいいみたい?
350310
2018/05/03(木) 20:31:46.75ID:EAR7zekO なんか順調でうらやましい。
俺もやっぱGPU付きのPC買うべかな。
一般的にLRでは、学習率は発散しない限界まで大きくするのが良いらしく、
昔は、最初大きく、試行回数増えるごとにだんだん小さくみたいな事をしてました。
NNではRMSPropとかADAMとかで自動調整する流れだと当時理解していました。
ただ、Googleの論文読むと、普通に学習率固定っぽく読めてしまうんですよね。
強化学習だと学習率固定が良いのかも知れません。
表現力大きいからあんまり問題ない気がするのですが、学習率は小さくすると
学習に時間がかかる代わりに、収束しやすくなります。局所解には陥りやすく
なるのではないかと愚考しますが、強化学習における局所解と、教師付学習に
おける局所解は現象が違うから、よくわかりません。
俺もやっぱGPU付きのPC買うべかな。
一般的にLRでは、学習率は発散しない限界まで大きくするのが良いらしく、
昔は、最初大きく、試行回数増えるごとにだんだん小さくみたいな事をしてました。
NNではRMSPropとかADAMとかで自動調整する流れだと当時理解していました。
ただ、Googleの論文読むと、普通に学習率固定っぽく読めてしまうんですよね。
強化学習だと学習率固定が良いのかも知れません。
表現力大きいからあんまり問題ない気がするのですが、学習率は小さくすると
学習に時間がかかる代わりに、収束しやすくなります。局所解には陥りやすく
なるのではないかと愚考しますが、強化学習における局所解と、教師付学習に
おける局所解は現象が違うから、よくわかりません。
351310
2018/05/03(木) 20:37:19.91ID:EAR7zekO こちら、例によってひたすら分岐付き記譜を作成しています。
空きマス27の所(完全読みとしては26)のところから、計算時間が案の定すごく
かかるようになってしまって、遅々として進まなくなりました。
最後の手段でとっておいた、UCT探索で仮PV作成し、それでmtd(f)にて評価値を
迅速に確定して、その評価値で正しいPVを求めるという流れにしたところ、恐らく
数倍程度に高速化され、それによって記譜が集まり正確になる事で、評価関数の
精度が上がって、仮PVが正確になりという好循環に、ようやく入る事ができました。
ただ、それでもまだ時間はかかるというか、今空きマス28まで持っていったら、
また時間がかかる地獄に入りそう。最低でも空きマス30までは持っていきたい。
つか、待っている時間が長い…セカンドPCが欲しい。
空きマス27の所(完全読みとしては26)のところから、計算時間が案の定すごく
かかるようになってしまって、遅々として進まなくなりました。
最後の手段でとっておいた、UCT探索で仮PV作成し、それでmtd(f)にて評価値を
迅速に確定して、その評価値で正しいPVを求めるという流れにしたところ、恐らく
数倍程度に高速化され、それによって記譜が集まり正確になる事で、評価関数の
精度が上がって、仮PVが正確になりという好循環に、ようやく入る事ができました。
ただ、それでもまだ時間はかかるというか、今空きマス28まで持っていったら、
また時間がかかる地獄に入りそう。最低でも空きマス30までは持っていきたい。
つか、待っている時間が長い…セカンドPCが欲しい。
352310
2018/05/03(木) 20:41:41.51ID:EAR7zekO >>351
>数倍程度に高速化され
あくまで仮PVが数手分合っている時の話で、仮PVが間違っていると、
むしろ遅くなる可能性があります。
あと、一つの局面に対し、最善手が複数あるケースでは、例えば最善手
が2つあると2倍程度時間がかかるという問題があるのは認識していて、
対策は可能なのですが、そうするとバグった時にβカットのエラーを吐か
ないという恐ろしい状態になってしまうので躊躇しています。
>数倍程度に高速化され
あくまで仮PVが数手分合っている時の話で、仮PVが間違っていると、
むしろ遅くなる可能性があります。
あと、一つの局面に対し、最善手が複数あるケースでは、例えば最善手
が2つあると2倍程度時間がかかるという問題があるのは認識していて、
対策は可能なのですが、そうするとバグった時にβカットのエラーを吐か
ないという恐ろしい状態になってしまうので躊躇しています。
353310
2018/05/04(金) 19:57:24.12ID:5CQB8Di3 世界コンピュータ将棋選手権の2次予選までで強さをみせつけている
T.N.K(通称たぬき)ですが、DL勢にして高速評価関数という事なので
アピール文書を見てみました。
これ、CNNではなく、全結合のDeep Networkの模様。追加で論文も
出ているので、見たところ5層のMLPです。
入力層に玉との2駒関係を使っていて、そこは計算量が多いので、
ここだけ差分計算で高速化しているとの事。自分は行列をEigenに
任せちゃってるので差分計算していませんが、オセロでも結構使え
るはず。
もう一度オセロをMLPに拡張したくなってきた(汗
T.N.K(通称たぬき)ですが、DL勢にして高速評価関数という事なので
アピール文書を見てみました。
これ、CNNではなく、全結合のDeep Networkの模様。追加で論文も
出ているので、見たところ5層のMLPです。
入力層に玉との2駒関係を使っていて、そこは計算量が多いので、
ここだけ差分計算で高速化しているとの事。自分は行列をEigenに
任せちゃってるので差分計算していませんが、オセロでも結構使え
るはず。
もう一度オセロをMLPに拡張したくなってきた(汗
354535
2018/05/07(月) 20:19:04.83ID:m+uVPKyG ネットワーク大きくすると学習が収束する確率下がるんですかね?
なんか学習がうまく進んでないようです。
なんか学習がうまく進んでないようです。
355535
2018/05/08(火) 00:21:37.96ID:VKk6NsC2 もしかして学習率だけでなく、ほかのパラメータにも手を加えなければならないってことですかね?
356310
2018/05/08(火) 01:01:09.30ID:6noaUyVY バックプロパゲーションで計算している以上、深さが深くなると、
その分初段まで誤差を遡らせるのに時間がかかるから、収束が
遅くなって当然かと思います。
あと、初期値のランダム値の幅も、適切に設定しないとなかなか
収束しなくなりますし、それでも初期値の運が悪いとまったく収束
しないなんて事もあり、ちょこっと不安定なところがあります。
XavierとかHeとか初期値の設定項目はありませんか?
本で読んだ知識なので、現実にどれくらい影響するのか良くわかりませんが(^^;
その分初段まで誤差を遡らせるのに時間がかかるから、収束が
遅くなって当然かと思います。
あと、初期値のランダム値の幅も、適切に設定しないとなかなか
収束しなくなりますし、それでも初期値の運が悪いとまったく収束
しないなんて事もあり、ちょこっと不安定なところがあります。
XavierとかHeとか初期値の設定項目はありませんか?
本で読んだ知識なので、現実にどれくらい影響するのか良くわかりませんが(^^;
357535
2018/05/08(火) 19:21:19.88ID:3yhYJr6O おお、ありがとうございます。
しらべてみます。
しらべてみます。
358535
2018/05/09(水) 21:58:37.29ID:53SriW94 パソコン壊れたかと思ったが放電したらなおった
あー怖かったTT
あー怖かったTT
359535
2018/05/10(木) 20:05:15.86ID:X+P+UxO/ 学習率の変動率?を下げたら結構うまく動いてるっぽいです。
360535
2018/05/11(金) 20:15:31.62ID:TPpBGuAT loss とか entropyはいい感じに減ってるのに自己対局の結果がついてこないですね。
うーん、なんだろう?
うーん、なんだろう?
361535
2018/05/12(土) 17:16:50.40ID:UY4N1vvW いや、自己対局もちょっとづつ改善してるみたいです。
もっと時間が必要かな。
もっと時間が必要かな。
362535
2018/05/13(日) 18:33:11.99ID:jNzVm6ts windowsがたまに夜中に勝手に再起動してしまうんだが?
マジむかつく(怒
マジむかつく(怒
363310
2018/05/13(日) 19:53:17.92ID:i+O998yE Windows Updateかな?
俺は通知もらうだけにして、タイミング見て自分で再起動かけてる。
まあ、24時間経つとカウントダウンが始まるので、早目に再起動する事になるけど。
俺は通知もらうだけにして、タイミング見て自分で再起動かけてる。
まあ、24時間経つとカウントダウンが始まるので、早目に再起動する事になるけど。
364535
2018/05/16(水) 19:41:44.02ID:zhHRqcbt いままで50エピソード毎に自己対戦してたけど、自己対戦がかなり重いから200エピソード毎に自己対戦にしたらなかなかいい感じ。
365535
2018/05/16(水) 20:52:45.23ID:zhHRqcbt ネットワーク大きくしても詰めが甘いのはかわらないですねorz.
公式AIに勝つチャンスあったのに勝ちを逃してしまいました。
公式AIに勝つチャンスあったのに勝ちを逃してしまいました。
366310
2018/05/17(木) 20:16:35.67ID:3wU0adoY Surfaceの電源ケーブル、そろそろ断線しそうだなぁと思っていたら、
PCをひょいと動かした瞬間に、まさかの電源落ち。
ウェイトデータ書き込み中に停まらないように色々工夫していても、
この手の落ちには対処できるわけもなく、また大変に運が悪い事に
またしても後半10ステージ程度のウェイトデータが飛んでしまい
ました。バックアップとっていたのですが、気づかずにいたので、既に
上書き済みという罠。
後ろ10ステージ分のみゼロクリアして、そこだけ今のデータで再度
学習する羽目になりました。
orz
PCをひょいと動かした瞬間に、まさかの電源落ち。
ウェイトデータ書き込み中に停まらないように色々工夫していても、
この手の落ちには対処できるわけもなく、また大変に運が悪い事に
またしても後半10ステージ程度のウェイトデータが飛んでしまい
ました。バックアップとっていたのですが、気づかずにいたので、既に
上書き済みという罠。
後ろ10ステージ分のみゼロクリアして、そこだけ今のデータで再度
学習する羽目になりました。
orz
367535
2018/05/17(木) 20:37:00.03ID:anbc4vLN 乙w
368535
2018/05/17(木) 23:06:00.81ID:anbc4vLN これはNew マシンを買えとの神のお告げww
369535
2018/05/18(金) 20:48:52.38ID:UxmUzKYy まただよw(再起動)
370名前は開発中のものです。
2018/05/18(金) 21:21:28.72ID:UxmUzKYy 藤井聡太さんが7段昇格とか。
凄すぎ
凄すぎ
371535
2018/05/19(土) 20:01:16.80ID:PB1pw3rI むう、AlphaZeroのポテンシャルはこんなものではないはずだが。
でも100万局くら学習させないと真価は発揮できないかもなぁ。
でも100万局くら学習させないと真価は発揮できないかもなぁ。
372535
2018/05/20(日) 23:46:47.79ID:A2GqvvmZ 19路囲碁だと20層くらい層がないと駄目だとか。
うーん20層は厳しい。。。
うーん20層は厳しい。。。
373310
2018/05/21(月) 20:17:29.25ID:aDShJzMX 畳み込み窓が3×3で、隣との関係を1マス分づつ認識しているとすると、19路で
19層必要で、出力の全結合層つけて20層って事なのかなぁ。
あとフィルタ数も大事だと思う。フィルタで認識する特徴の種類が決まっていると思う。
なんとなくだけど、こう仮定している。検証はしていない(汗
19層必要で、出力の全結合層つけて20層って事なのかなぁ。
あとフィルタ数も大事だと思う。フィルタで認識する特徴の種類が決まっていると思う。
なんとなくだけど、こう仮定している。検証はしていない(汗
374535
2018/05/21(月) 21:00:41.57ID:9qAF6usq いまのところ192 * 6 でやってます。
9路だから192 * 10 にすればよかったかなぁ
9路だから192 * 10 にすればよかったかなぁ
375310
2018/05/22(火) 20:12:53.71ID:do1nJaPu 五目系なら、周辺5マスが把握できていればよいかもよ。
比較検証しなきゃわからんけど。
比較検証しなきゃわからんけど。
376535
2018/05/22(火) 20:18:42.34ID:025jAm4L うーん、そうなんですか?。
ライフゲーム囲碁はもろ周辺5マスなんですけどね。
囲連星成功したらライフゲーム囲碁もやりたいですね。
ライフゲーム囲碁はもろ周辺5マスなんですけどね。
囲連星成功したらライフゲーム囲碁もやりたいですね。
377535
2018/05/23(水) 23:49:25.39ID:z+TgzaXz くそ〜何時まで経っても一手の重みみたいなものを理解してくれないorz.
なんか足の遅い打ち方するんだよなぁ。
もういっそ20層にしちゃおうかな orz
なんか足の遅い打ち方するんだよなぁ。
もういっそ20層にしちゃおうかな orz
378535
2018/05/24(木) 20:38:02.47ID:g5FOS6wP ん、ちょっとづつだけど強くなってる気がする。。。
くそ〜Googleの計算リソースがあれば30分くらいで名人超えるんだろうけど。。。
くそ〜Googleの計算リソースがあれば30分くらいで名人超えるんだろうけど。。。
379535
2018/05/24(木) 20:57:44.30ID:g5FOS6wP 自己対戦が勝率100%行ってしまいました。
対戦相手も更新されていくなら勝率100%は行かないと思うんですが。
もともとの実装がなにかおかしいのだろうか…
対戦相手も更新されていくなら勝率100%は行かないと思うんですが。
もともとの実装がなにかおかしいのだろうか…
380535
2018/05/25(金) 23:18:10.63ID:Wo9ACErv まだ公式AIに勝てないけど毎日ちょっとづつ進歩しているのは感じる。
まだ希望はある。
まだ希望はある。
381535
2018/05/26(土) 20:20:48.78ID:qA0Nw26t Alpha Zeroのアルゴリズムは囲連星よりもライフゲーム囲碁に向いてる気がする。
382535
2018/05/26(土) 21:33:20.38ID:qA0Nw26t FacebookがELF OpenGoというのを公開したとか。
プロ棋士にも勝てるみたいですね。
プロ棋士にも勝てるみたいですね。
383535
2018/05/27(日) 19:07:25.97ID:kULpg0Pw ELF OpenGo もGPU 2000台とか使わないと強くならないみたい?
は〜絶望する。
は〜絶望する。
384535
2018/05/28(月) 22:00:33.18ID:hqRKJ+dG 昔のLeela zeroもそうでしたがシチョウが読めてないっぽいですねぇ
385535
2018/05/28(月) 22:12:43.53ID:hqRKJ+dG でもちょっとづつでも確かに前進してる気がします。
ロールアウトの回数増やしたら学習の質も上がるかなぁ?
やってみるか。。。
ロールアウトの回数増やしたら学習の質も上がるかなぁ?
やってみるか。。。
386535
2018/05/29(火) 20:13:27.71ID:LETTkqJf ん、lossとentropyがかなり増えてますね。
ロールアウトを増やしたえいきょうだろうか?
ロールアウトを増やしたえいきょうだろうか?
387535
2018/05/29(火) 21:44:21.56ID:LETTkqJf ネットワークを192 * 20 にしたい衝動に駆られるw
危険な賭けだが…
危険な賭けだが…
388535
2018/05/30(水) 22:20:56.63ID:s+sw+z1r キタ━━━━━━(゚∀゚)━━━━━━ !!!!!
公式AIに初勝利!
内容としては相手のミスに助けられただけだけどそれでも格段に進歩してる!
(
;FF[1]GM[1]SZ[9]
;B[fe];W[fc];B[de];W[dc];B[ed];W[ec]
;B[gc];W[gb];B[ee];W[cb];B[ce];W[hb]
;B[ge];W[fh];B[be];W[gd];B[he])
公式AIに初勝利!
内容としては相手のミスに助けられただけだけどそれでも格段に進歩してる!
(
;FF[1]GM[1]SZ[9]
;B[fe];W[fc];B[de];W[dc];B[ed];W[ec]
;B[gc];W[gb];B[ee];W[cb];B[ce];W[hb]
;B[ge];W[fh];B[be];W[gd];B[he])
389535
2018/05/31(木) 22:06:07.55ID:CLpDRjz4 惜しい!惜しいなぁ。
中盤まで内容は圧倒しておきながら最後の盤端のシチョウが読めずに逆転負け。
学習途中のAlpha Zero系の弱点が出てしまいました。
でも、ここ克服したら100戦100勝もあり得るかも。
(
;FF[1]GM[1]SZ[9]
;B[df];W[fe];B[de];W[cg];B[ef];W[hg]
;B[ff];W[gf];B[cf];W[gd];B[fg];W[gh]
;B[dg];W[gc];B[gg];W[ge];B[dc];W[hb]
;B[dd];W[dh];B[db];W[da];B[eh];W[ha]
;B[eg];W[hc];B[he];W[ie];B[hf];W[if]
;B[hd];W[id];B[he];W[ch];B[hf];W[hd]
;B[he];W[hf];B[di];W[he])
中盤まで内容は圧倒しておきながら最後の盤端のシチョウが読めずに逆転負け。
学習途中のAlpha Zero系の弱点が出てしまいました。
でも、ここ克服したら100戦100勝もあり得るかも。
(
;FF[1]GM[1]SZ[9]
;B[df];W[fe];B[de];W[cg];B[ef];W[hg]
;B[ff];W[gf];B[cf];W[gd];B[fg];W[gh]
;B[dg];W[gc];B[gg];W[ge];B[dc];W[hb]
;B[dd];W[dh];B[db];W[da];B[eh];W[ha]
;B[eg];W[hc];B[he];W[ie];B[hf];W[if]
;B[hd];W[id];B[he];W[ch];B[hf];W[hd]
;B[he];W[hf];B[di];W[he])
390535
2018/06/01(金) 22:15:38.64ID:i1DTZ7p0 本来負けてたはずのゲームですが逆転勝利しました!
以前より大分、棋理のようなものが身についてきている感じがします。
ロールアウト増やしたのが効いたかな?
(
;FF[1]GM[1]SZ[9]
;B[df];W[fb];B[ef];W[ff];B[fe];W[ge]
;B[fg];W[gf];B[gg];W[cg];B[cf];W[hg]
;B[fd];W[gd];B[gc];W[hc];B[fc];W[hb]
;B[hf];W[hd];B[he];W[eg];B[dg];W[hh]
;B[eh];W[eb];B[dd];W[gb];B[db];W[dc]
;B[ec];W[de];B[cc];W[bc];B[ed];W[id]
;B[ce];W[ie];B[ei];W[bh];B[ee];W[ba]
;B[eg])
以前より大分、棋理のようなものが身についてきている感じがします。
ロールアウト増やしたのが効いたかな?
(
;FF[1]GM[1]SZ[9]
;B[df];W[fb];B[ef];W[ff];B[fe];W[ge]
;B[fg];W[gf];B[gg];W[cg];B[cf];W[hg]
;B[fd];W[gd];B[gc];W[hc];B[fc];W[hb]
;B[hf];W[hd];B[he];W[eg];B[dg];W[hh]
;B[eh];W[eb];B[dd];W[gb];B[db];W[dc]
;B[ec];W[de];B[cc];W[bc];B[ed];W[id]
;B[ce];W[ie];B[ei];W[bh];B[ee];W[ba]
;B[eg])
391535
2018/06/02(土) 21:54:09.55ID:GZGHIXxE ぼちぼちウインドウズに移植することも考え始めなければ…
392535
2018/06/04(月) 20:50:12.16ID:Hw4HpbU5 毎日棋風がすこしずつ変わっていくな。
面白い。
3線を重視し始めたようだ。
面白い。
3線を重視し始めたようだ。
393535
2018/06/04(月) 21:29:44.63ID:Hw4HpbU5 なんかネットワークの規模が足りてない気がしてきたわ。orz orz orz
一気に256 * 20くらいに増やしてみようかな?
気が早いかな〜
一気に256 * 20くらいに増やしてみようかな?
気が早いかな〜
394535
2018/06/04(月) 21:42:52.90ID:Hw4HpbU5 うーん、どうせやり直すなら早いほうがいいよね?
でもこのまま学習続けたら何が起こるかも知りたいし…
悩ましい。
でもこのまま学習続けたら何が起こるかも知りたいし…
悩ましい。
395535
2018/06/04(月) 22:55:50.50ID:Hw4HpbU5 思い切ってネットワーク構成を256 * 24 にしました。
激遅になりそうだが…
激遅になりそうだが…
396535
2018/06/04(月) 23:05:36.60ID:Hw4HpbU5 ネットワークを192 * 6 から 256 * 24 にしたら計算量は(256*24)/(192*6)=5.333倍であってる?
まさか指数的に計算量増えたりしないよね?
まさか指数的に計算量増えたりしないよね?
397535
2018/06/04(月) 23:18:15.88ID:Hw4HpbU5 メモリが足らんといわれたぜwww
12GBも割り当てたのにwwww
こりゃニューマシン買うしかないな。
12GBも割り当てたのにwwww
こりゃニューマシン買うしかないな。
398535
2018/06/05(火) 00:01:42.42ID:2ipfQYrF とりあえず、64 * 24 にしてみました。
これでも6GB位メモリ食う。
まじでスレッドリッパーに128GB積みたい衝動に駆られるw
これでも6GB位メモリ食う。
まじでスレッドリッパーに128GB積みたい衝動に駆られるw
399535
2018/06/06(水) 21:01:18.82ID:/EVpmksK やっぱ24層は無理かもorz
全然学習が進んでるように見えないorz
全然学習が進んでるように見えないorz
400310
2018/06/06(水) 21:38:17.47ID:dXECgVmr 残り28手のところで1か月足踏み。やっと記譜がたまってきた。
残り30手まで行くのに半年くらいかかりそうw
というか、まだまだパターンが足りていないかも。
>>396
隠れ層のサイズは2乗で効いてくるから、256^2/192^2。
深さは単純に計算量が4倍になるとして、ざっと7倍くらいになるのでは?
学習は深さが増えるとどんどんきつくなるかと。
誤差逆伝播の宿命です。
残り30手まで行くのに半年くらいかかりそうw
というか、まだまだパターンが足りていないかも。
>>396
隠れ層のサイズは2乗で効いてくるから、256^2/192^2。
深さは単純に計算量が4倍になるとして、ざっと7倍くらいになるのでは?
学習は深さが増えるとどんどんきつくなるかと。
誤差逆伝播の宿命です。
401535
2018/06/06(水) 22:38:14.91ID:/EVpmksK >隠れ層のサイズは2乗で効いてくるから
おお、そうなんですか。ありがとうございます。
>学習は深さが増えるとどんどんきつくなるかと。
24層は諦めました。
今12層くらいで試行錯誤しています。
おお、そうなんですか。ありがとうございます。
>学習は深さが増えるとどんどんきつくなるかと。
24層は諦めました。
今12層くらいで試行錯誤しています。
402535
2018/06/07(木) 00:15:51.92ID:FD/EuCH4 うーん、極めて微妙なバランス調整を強いられるのか?これは
403310
2018/06/07(木) 22:47:08.28ID:3tsX2weq マシンパワーが潤沢にあれば、かなり大きいネットワークから学習させて、
最低限どれくらいの大きさなら弱くならないかが求められるんだけどねぇ。
Googleみたいに。
最低限どれくらいの大きさなら弱くならないかが求められるんだけどねぇ。
Googleみたいに。
404535
2018/06/07(木) 22:50:20.44ID:FD/EuCH4 そういえば新しいスレッドリッパーは32コアになるとか。
うーん欲しい。
うーん欲しい。
405310
2018/06/08(金) 09:01:40.50ID:kLQfp5L9 今見た。64スレッドだってw
406535
2018/06/08(金) 21:09:32.65ID:sd8J+TAa あんまりうまくいかないから気分が萎えてきちゃった。
少し気分転換するか…
少し気分転換するか…
407535
2018/06/09(土) 22:29:54.70ID:E47zq0gI 層を9層に減らして再チャレンジ
どんどん後退していくが仕方ない
どんどん後退していくが仕方ない
408535
2018/06/10(日) 22:48:39.36ID:vDwVPN5j Googleが無料で12時間のクラウドGPUを提供してるとかなんとか
https://www.tdi.co.jp/miso/google-colaboratory-gpu
https://www.tdi.co.jp/miso/google-colaboratory-gpu
409535
2018/06/11(月) 20:34:52.58ID:CmwqwxJa くそーどうにもうまく行かね〜
一回試すのに結構時間かかるのも痛いorz
一回試すのに結構時間かかるのも痛いorz
410535
2018/06/12(火) 18:16:53.37ID:ZNBJ6nca あんまり上手くいかないんで頭おかしくなりそう
ちょっと休憩します
ちょっと休憩します
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【🐼🇨🇳】「高市総理VS中国」で日本からパンダはゼロに? 上野動物園「パンダ返還期限」まであと3カ月… [BFU★]
- 「“なり得る”って言っただけだから…」高市早苗“存立危機”答弁後に漏らした本音 ★3 [Hitzeschleier★]
- 【裁判】山上徹也被告の妹「この人は母のふりをした旧統一教会の信者だと思いました」「でも、母の形をしているから突き放せなかった」 [1ゲットロボ★]
- 【速報】 米大使声明 「日本を支えていく」「中国が威圧的手段に訴えるのは断ち難い悪癖」 [お断り★]
- 歩道で93歳男性が女子大学生の自転車にはねられ意識不明 坂を下った先「気付いたときには目の前に」 [七波羅探題★]
- ネット殺到「高市総理の責任」「完全に高市リスク」「負けるな」中国が水産物輸入停止→流石に総理批判の声も「どう責任取る?」 ★5 [樽悶★]
- 中国政府の訪日自粛呼びかけで「目立った影響なし」JR東海・丹羽俊介社長、欧米多く、高市台湾有事発言 [943688309]
- 【悲報】バービー、ついつい高市に苦言を言ってしまい愛国者から袋叩きにあう...「最低限の下調べくらいしろ!💢」 [856698234]
- 【悲報】山上の母親に統一協会を紹介したのは自民党員だった😨 [868050967]
- 高市コインまもなく158円 [931948549]
- 日本「中国のレアアースに71%依存してます。2024年のデータです」 ネトウヨ「え?youtube解説と違うんだけど」 [633746646]
- 🍣にゃっはろ🌸~スシろ~🏡
