【オセロ,将棋】ボードゲーム Part2【囲碁,War】

1名前は開発中のものです。2017/10/15(日) 17:34:58.03ID:RaMh0le2
比較的地味なボードゲーム専用のスレが欲しくて立ててみました。

前スレ
【オセロ,将棋】ボードゲーム【囲碁,War】
http://mevius.2ch.net/test/read.cgi/gamedev/1057763418/

4003102018/06/06(水) 21:38:17.47ID:dXECgVmr
残り28手のところで1か月足踏み。やっと記譜がたまってきた。
残り30手まで行くのに半年くらいかかりそうw

というか、まだまだパターンが足りていないかも。

>>396
隠れ層のサイズは2乗で効いてくるから、256^2/192^2。
深さは単純に計算量が4倍になるとして、ざっと7倍くらいになるのでは?

学習は深さが増えるとどんどんきつくなるかと。
誤差逆伝播の宿命です。

4015352018/06/06(水) 22:38:14.91ID:/EVpmksK
>隠れ層のサイズは2乗で効いてくるから
おお、そうなんですか。ありがとうございます。

>学習は深さが増えるとどんどんきつくなるかと。
24層は諦めました。
今12層くらいで試行錯誤しています。

4025352018/06/07(木) 00:15:51.92ID:FD/EuCH4
うーん、極めて微妙なバランス調整を強いられるのか?これは

4033102018/06/07(木) 22:47:08.28ID:3tsX2weq
マシンパワーが潤沢にあれば、かなり大きいネットワークから学習させて、
最低限どれくらいの大きさなら弱くならないかが求められるんだけどねぇ。
Googleみたいに。

4045352018/06/07(木) 22:50:20.44ID:FD/EuCH4
そういえば新しいスレッドリッパーは32コアになるとか。
うーん欲しい。

4053102018/06/08(金) 09:01:40.50ID:kLQfp5L9
今見た。64スレッドだってw

4065352018/06/08(金) 21:09:32.65ID:sd8J+TAa
あんまりうまくいかないから気分が萎えてきちゃった。
少し気分転換するか…

4075352018/06/09(土) 22:29:54.70ID:E47zq0gI
層を9層に減らして再チャレンジ
どんどん後退していくが仕方ない

4085352018/06/10(日) 22:48:39.36ID:vDwVPN5j
Googleが無料で12時間のクラウドGPUを提供してるとかなんとか
https://www.tdi.co.jp/miso/google-colaboratory-gpu

4095352018/06/11(月) 20:34:52.58ID:CmwqwxJa
くそーどうにもうまく行かね〜
一回試すのに結構時間かかるのも痛いorz

4105352018/06/12(火) 18:16:53.37ID:ZNBJ6nca
あんまり上手くいかないんで頭おかしくなりそう
ちょっと休憩します

4113102018/06/12(火) 22:17:08.85ID:tW9CPEWd
NNの罠ですな。
自分が逃げたのは、それです(汗

4125352018/06/12(火) 22:59:32.98ID:0htatJhS
>>411 くそー
パラメータ100種類くらい用意して同時に実行したい orz

4135352018/06/15(金) 20:18:16.05ID:8McWyxkP
CPU Ryzen 2700X
GPU Geforce 1080
Memory 64GB
SSD 500GB

これを満たそうとするとやはり40万円近くなる。
厳しい。

4145352018/06/15(金) 23:05:29.07ID:8McWyxkP
フロンティアってショップかなり安くない?
なんか裏があんのかな?

4153102018/06/16(土) 09:22:12.72ID:zNyAzUlc
フロンティアと言えば懐かしのフロンティア神代(こうじろう)かなと思ったらビンゴでした。
Wikipedia情報によると、フロンティア神代はヤマダ電機に吸収されて解散していて、
BTOショップにフロンティアという名前だけ残っているみたいです。

ヤマダ電機なので裏は無いでしょうね。

7980XEに1080Tiで128Mとかにしていくと、だいぶ価格差は詰まっていきますが、
それでも多少安いみたいですね。というか、8700Kだったらかなり安いかも。

4165352018/06/16(土) 23:00:41.95ID:Xmjs3i0Q
pytorchってAMDのGPU使えないよね?
Cudaだよね?

4175352018/06/16(土) 23:08:34.52ID:Xmjs3i0Q
多層を重ねるのは諦めてフィルタ数で勝負というのもあるだろうか?

4185352018/06/17(日) 20:06:40.29ID:S/cw4ZOV
実はこっそり再開してましたが9層からさらに後退すべきか悩んでます。
ここから1層づつ減らしていって学習がまともに進むところまで後退するのを考えています。

4195352018/06/18(月) 21:07:45.14ID:Wo5CnXra
8層も望み薄
7層は囲連星が7目並べだからあるいみちょうどいいかも?

4205352018/06/18(月) 23:34:21.39ID:Wo5CnXra
お、7層はうまくいくかも
まだわからないけど

4215352018/06/18(月) 23:35:41.11ID:Wo5CnXra
でも6層でだめで7層でOKというのもちょっと考えづらいといえば考えづらいんだよなぁorz.

4223102018/06/19(火) 00:55:25.28ID:FOfYGuya
ゲームとして必要最低限と思われる最低限の層数から1層づつ増やして行って、
一つ前の奴に有為に勝てる様になるまでの学習時間を図っていくという手もある
かなと思います。

面倒でやりたくないですが。

自分はひたすら記譜作成。
少しづつ改良を加えていますが、残り28手(読み切りとしては27手)で足踏みして
います。早ければ6分程度で終わるのですが、いかんせん25〜26手目の評価
関数が穴だらけみたいで、長いと4時間とかかかってしまい、なかなか棋譜が集め
切れません。記譜が集まると速くなるのですが、集まるまでの時間がかかりすぎ。

4235352018/06/19(火) 22:25:49.15ID:pDwqV+QB
パラメータ調整ってプログラミング本来の楽しみがほとんどなくてそこが辛い。
とくに他人のコードだと。
弱くてもオリジナルのヒューリスティック実装するのは楽しいんだよなぁ。
うーん。

4243102018/06/19(火) 23:13:29.58ID:FOfYGuya
すごくわかりますorz
だから、非効率でも、自分でNNのライブラリ作っちゃおうとしたりするのでする。

4255352018/06/20(水) 20:38:16.59ID:HpjQCtCz
7層も駄目っぽいorz orz orz
もう少し粘るか悩むorz orz orz

4265352018/06/20(水) 21:21:48.36ID:HpjQCtCz
そこそこ上手くいってた6層のバックアップを引っ張り出して続きの学習をさせてみることにしました。
結局、全部無駄だった orz orz orz

4273102018/06/23(土) 00:43:44.99ID:MYOaLSBl
長いと4時間…

出張中に丸48時間動かしっぱなしにしましたが、3つしかできなかった。
一つ16時間w

4285352018/06/24(日) 23:17:32.46ID:+0RpmqDG
なんか異様に辺の星を重視するようになった。
ちょっと単純化しすぎな気がするが、やっぱ層が足りてないのか?

4295352018/06/25(月) 20:09:56.17ID:EkJF+fRZ
んあ、なんか一線打つようになった?
過学習かなんかか?

4305352018/06/25(月) 20:42:46.09ID:EkJF+fRZ
結局6層も駄目なのかなぁ orz orz orz
アルファゼロのポテンシャルはこんなものではないはずだが。orz orz orz

4315352018/06/25(月) 21:48:22.04ID:EkJF+fRZ
もうちょっと粘ってみるけど、アルファゼロ(少なくとも>>214のプログラム)からの撤退も考え始めてるorz orz orz

4325352018/06/26(火) 21:04:26.12ID:1tkUkpm5
お、一線に打つのは治ったようです。

4335352018/06/27(水) 21:01:58.89ID:dPu535sz
お、すごい!
まだ詰めはあまいけど、まるで地を取ることはいいことだという棋理を理解したような打ち方で勝った!
まだ希望はある!
(
;FF[1]GM[1]SZ[9]
;B[ee];W[eg];B[ec];W[ff];B[gd];W[dg]
;B[cd];W[cg];B[fd];W[dd];B[de];W[fh]
;B[gg];W[gh];B[hh];W[gf];B[hg];W[dc]
;B[hf];W[bg];B[he];W[ah];B[hc];W[hd]
;B[id];W[ba];B[hb];W[bi];B[hd])

4345352018/06/28(木) 21:14:27.14ID:Owd80tJ7
まただよ(再起動)

4355352018/06/28(木) 21:14:59.02ID:Owd80tJ7
ネイティブリナックスにしたら再起動なくなるんだろか

4365352018/06/29(金) 21:22:30.04ID:24sRxbs9
ふと思ったけど詰みルーチンをルールに組み込んで詰みがあるときは詰みを打たなきゃいけないルールにして学習させて
十分学習したら詰みルールを外したら学習時間短縮できたりしないんだろうか?
ルールが違ったら全く重みが役に立たなくなっちゃうかな?

4375352018/06/29(金) 22:02:45.79ID:24sRxbs9
2線を重視し始めたようです。
毎日棋風が変わっていくな。
AIが自らいろいろ試してるみたいでホントに知性があるかのような錯覚を覚える。

4385352018/06/29(金) 22:37:39.80ID:24sRxbs9
相変わらず隅のシチョウが読めてないですね。
7連を作るにはほぼ必須なので克服してほしい。

4395352018/06/30(土) 22:29:57.74ID:8vhkC7kM
圧勝の形勢を築いておきながら隅の石が取れずに逆転負け。
ここは何としても克服せねばなりませんなぁ。

(
;FF[1]GM[1]SZ[9]
;B[hh];W[df];B[cg];W[fg];B[gc];W[ef]
;B[gf];W[ge];B[cc];W[fc];B[ce];W[ed]
;B[cf];W[cd];B[bd];W[dd];B[bc];W[bh]
;B[bg];W[ff];B[fb];W[eh];B[ec];W[fi]
;B[fd];W[dc];B[db];W[eb];B[ea];W[cb]
;B[bb];W[dh];B[be];W[bf];B[ca];W[gb]
;B[cb];W[ch];B[gh];W[hb];B[de];W[ee]
;B[af];W[ba];B[fh];W[hc];B[ah];W[hd]
;B[eg];W[dg];B[gg];W[fe];B[ei];W[gd]
;B[ig];W[bi])

4403102018/07/01(日) 09:58:13.46ID:rTgUJVKi
強化学習は一通り失敗をして、ダメな手を覚えていくものですからね。

4413102018/07/01(日) 16:25:08.28ID:rTgUJVKi
過去に途中でプログラム止めて、中途半端な状態になっている記譜(棋譜としては
成立しているけど、他の記譜との接点が無い)を見つけて、続きを実行するような
仕組みを作りました。

これで心置きなく途中で止められる。

4425352018/07/01(日) 23:21:40.95ID:1CvUBjWR
いったん学習中断します。
気分を変えて囲連星やめてライフゲーム囲碁に逃げようかと思ってます。
プログラムもgithubから別の拾ってこようかと思います。
マルチスレッドに対応してて大規模ネットワークを想定してそうな奴。

4435352018/07/04(水) 19:57:24.45ID:t+xDGMvg
githubに落ちてて大規模ネットワークに対応してるとなるとleela zero とかだろうか?

4445352018/07/04(水) 21:32:30.05ID:t+xDGMvg
とりあえずAQって囲碁ソフトのソース見てます。

4455352018/07/04(水) 21:43:59.79ID:t+xDGMvg
んんん、AQってヒューリスティックてんこ盛りなんですかね?
他ゲームに応用が利かなさそうな怪しげなコードが見受けられるw
シチョウのコードとかあるっぽいし。
つっても囲連星なら応用効くだろうけど。

逆に19路囲連星に走るというのも考えられるw

4465352018/07/04(水) 23:19:04.05ID:t+xDGMvg
あかん、これは相当キツイわw
まあ勉強にはなるかもしれんがモノになるかは微妙だww

4475352018/07/08(日) 22:10:22.48ID:cyFrinl7
がっつりさぼってますw

4485352018/07/12(木) 22:46:30.45ID:sqTgsSS4
やる気が出なくて、昔作ったモンテカルロのAIを動かしたりしていますが
モンテカルロでも割といい線行ってたんだとちょっと思いました。

なにかもう一度動き出すきっかけが欲しい。

4493102018/07/12(木) 23:01:05.40ID:x4U4b182
相変わらずひたすら記譜作成中。

現状の記譜の中に、ランダム着手の記譜が混じっていて、そいつらを
遡るのにものすごく時間がかかる事が経験的にわかっています。
つまり、そこそこ最善に近い手を打っている記譜の遡りは早く、悪い手
ばかりの記譜は遅い。

現状、最善に近い手に対しては、そこそこまともな評価関数になっている
という事は言えるので、一旦遡り対象の記譜を消して、この評価関数で
作られる新しい記譜で継続学習させた方が良いかもと思い始めています…。

4505352018/07/15(日) 19:54:25.23ID:I+Rk5Prr
だめぽ
3連休も無為に過ごしてしまったorz
あと一日あるけど

新着レスの表示
レスを投稿する