【オセロ,将棋】ボードゲーム Part3【囲碁,War】

2019/11/23(土) 19:09:58.05ID:0YM91Vba
比較的地味なボードゲーム専用のスレが欲しくて立ててみました。

前スレ
【オセロ,将棋】ボードゲーム Part2【囲碁,War】
https://mevius.5ch.net/test/read.cgi/gamedev/1508056498/
222535
垢版 |
2020/04/15(水) 22:01:14.83ID:rifVao0V
とりあえず、五目並べでちゃんと強くなるかどうか2〜3日学習させてみます。
223535
垢版 |
2020/04/15(水) 22:19:15.19ID:rifVao0V
ん、GPUの使用率が1%くらいから上がりませんね。
でも0%じゃないからちゃんと使ってんのかな…
224535
垢版 |
2020/04/15(水) 22:36:14.51ID:rifVao0V
お、早くも石が中央に寄り始めた??
そうだとしたら凄い。
225535
垢版 |
2020/04/15(水) 22:48:39.68ID:rifVao0V
しかし、4すら止めないw。
ホントに0からの学習なんだなぁ
226535
垢版 |
2020/04/16(木) 19:32:35.61ID:y39ZfUyK
お、凄い!たった一日で五目並べっぽくなってる!
たまにそっぽ打つのは乱数でランダムな手を打つようになってるんでしょうね。
2020/04/16(木) 19:37:25.76ID:y39ZfUyK
うお、早くも人間(俺)に勝った!!
あり得ね〜〜〜!!!
2020/04/16(木) 19:38:07.71ID:y39ZfUyK
ヤバイ、これはヤバイww
229535
垢版 |
2020/04/16(木) 19:40:53.49ID:y39ZfUyK
15路という非常に広い盤面でここまで早く強くなるとは…
230535
垢版 |
2020/04/16(木) 19:44:25.68ID:y39ZfUyK
もう五目並べの学習は十分ですね。
となると次のステップはライフゲーム囲碁か囲連星を移植ですね。
231535
垢版 |
2020/04/16(木) 19:54:51.08ID:y39ZfUyK
ライフゲーム囲碁はパスを実装しないといけないからまずは9路囲連星かなぁ
232535
垢版 |
2020/04/16(木) 20:15:49.42ID:y39ZfUyK
すぐにでもコード書き始めたくなるけどぐっと我慢して>>208のソースを少し読み解かねば。。。
233535
垢版 |
2020/04/16(木) 21:57:22.76ID:y39ZfUyK
あれ、モチベすげー湧いてくると思ったのに意外とそうでもないな…
仕事で疲れてんのかな…
234535
垢版 |
2020/04/18(土) 17:12:26.15ID:FJQxs35t
実はライフゲーム囲碁を移植しようとしてたのですがパスの実装がやはり意外と難しそうです
9路囲連星に転進しようかな
235535
垢版 |
2020/04/18(土) 20:23:03.93ID:dW+TeRwf
は〜目の前に理想のalpha zeroがあるというのになぜかモチベが湧いてこない、踏ん張りがきかない。
さぼりモードに入りつつあるorz。
ていうか思ってるより移植が工数かかる作業なのかもしれない。
236535
垢版 |
2020/04/19(日) 14:29:45.72ID:w4GEcYV8
9路囲連星はコードを消失していたので19路囲連星を移植してます。
237535
垢版 |
2020/04/19(日) 17:44:45.53ID:w4GEcYV8
多分移植完了した。バグが無ければ。
学習フェーズへ移項します。
238535
垢版 |
2020/04/19(日) 17:58:16.33ID:w4GEcYV8
うーん。これGUIの盤のひろさとプログラム上での盤の広さが違いますね。
まあ論理的には整合性は取れているので見た目だけの問題なので放置。
239535
垢版 |
2020/04/19(日) 18:02:39.80ID:w4GEcYV8
まだ学習始めたばっかなので全然見当違いのところに打ちまくるの見てて切ないw
でもまあ、五目並べではわずか一日で人間(俺)に勝てるところまで来たのだから期待して待ちましょう。
240535
垢版 |
2020/04/19(日) 18:42:21.72ID:w4GEcYV8
メモリ10GBくらい使ってる。
思ったよりでかい。
241535
垢版 |
2020/04/19(日) 21:12:09.10ID:w4GEcYV8
GPUのファンが五月蠅い。
タスクマネージャーだと1%とかなのに。
タスクマネージャーじゃ使用率ちゃんと測れないのかな?
242535
垢版 |
2020/04/20(月) 18:56:48.06ID:fRC4t5vc
強くなってないと思ったら致命的なバグがorz
勝敗データをパイソンに渡す個所にバグがあったようです。
丸一日の学習がパーorz
243535
垢版 |
2020/04/20(月) 21:27:15.82ID:fRC4t5vc
ん、付けにははねよを覚えたっぽい?
だとしたら凄い。
244535
垢版 |
2020/04/21(火) 20:44:10.63ID:JovHD0OJ
1日学習させたけど強くなってるように見えませんね
15路五目並べと19路囲連星じゃ勝手が違うか
とりあえず1週間位は粘ってみます
245535
垢版 |
2020/04/22(水) 18:48:41.18ID:mXEm0GNy
強くなってませんね。
完全なランダムでないにせよ。
もう少し様子見します。
246535
垢版 |
2020/04/22(水) 20:21:27.03ID:mXEm0GNy
は〜じれったい。ハード性能があと10000倍くらいあればな〜
247535
垢版 |
2020/04/22(水) 20:23:13.93ID:mXEm0GNy
むしろ一生懸命7並ばないようにしているとさえ思えるw
バグなのかなぁ
248310
垢版 |
2020/04/22(水) 20:43:03.08ID:ZptezZKq
相変わらず棋譜作成中。

プログラムはそれなりに改良しているつもりだけど、成果は全くなし。
まあ、思いついて試すのが楽しいんだけどね。

つか、逆順探索での棋譜訂正。やってるそばからあまりに間違っている筋を
見つけて、修正かける過程で、新しい棋譜どんどん増えて、バックログがどんどん
増えていく地獄になっています。まだまだ重要な分岐でも間違いというか未探索
が多すぎる。

手作業で修正箇所見つけるの面倒なので、延々やらないといけないけど、
ε-Greedy的な何か導入しようかなぁと思い始めています。
249535
垢版 |
2020/04/22(水) 21:56:00.26ID:mXEm0GNy
お、もしかしてポン抜き覚えたか?
しかしこの学習速度で線形の速度で強くなるとしたらとてもじゃないが時間かかりすぎるが、
ある地点から爆発的に強くなったりしないのかなぁ
250310
垢版 |
2020/04/22(水) 22:21:38.60ID:ZptezZKq
あるところまでは、間違いは間違いと学習するための時間かも知れませんね。
251535
垢版 |
2020/04/23(木) 18:58:28.20ID:ynaVt4IB
うーん、少し囲連星っぽくなってきてるかなぁ?
ま、当分様子見かな。
252535
垢版 |
2020/04/23(木) 21:04:31.79ID:ynaVt4IB
でもまあディープラーニングってルールも知らないネットワークが勝敗結果だけで強くなるって凄いことだよな。
人間がルール知らずに勝敗結果だけで強くなろうとしたら発狂するw
253535
垢版 |
2020/04/24(金) 19:11:09.10ID:aNVKQhdF
囲連星本来の棋譜とはまだまだ程遠いけど、何かをつかみつつあるような気配がする。。。
様子見続行。
254535
垢版 |
2020/04/24(金) 19:47:38.96ID:aNVKQhdF
あーネットワークの層増やしてみたいな。
囲連星は7目並べだから7層がちょうどよかったかも…
今デフォルトの4層でやってるんだけど。
でもいまさら後に引けないか。
255310
垢版 |
2020/04/24(金) 19:50:11.65ID:wU9GyZ2x
DCNNなら層数よりもフィルタ数の方が大事かも。
256535
垢版 |
2020/04/24(金) 19:55:02.17ID:aNVKQhdF
まじすか
現状でもフィルタは256(デフォルト)とかなり贅沢に使ってるんですが。。。
オリジナルの作者もフィルタ数が大事と思ったのかもしれませんね。
257310
垢版 |
2020/04/24(金) 22:19:55.86ID:wU9GyZ2x
>>256
256フィルタあるんなら流石に大丈夫そうだね。
258535
垢版 |
2020/04/25(土) 21:48:41.17ID:wwp+rt8W
やっぱ9路囲連星にしとけばよかったかな〜
でもいまさら後に引けない…orz
259535
垢版 |
2020/04/26(日) 17:31:58.54ID:73Aw05p/
うーむ、進むべきか引き返すべきか段々悩ましくなってきた。
まあもうちょい様子見続行か。。。
260535
垢版 |
2020/04/26(日) 19:51:54.61ID:73Aw05p/
知性の芽生えみたいなものを全く感じないわけじゃないから打ち切るのも躊躇われるが、
いかんせん成長速度が遅いんだよなぁ。ウーム悩ましい。
261535
垢版 |
2020/04/27(月) 17:44:36.98ID:bKact/KJ
囲めば石取れることはわかってるっぽいんだよなぁ
もう少し粘ろう
262535
垢版 |
2020/04/27(月) 21:17:34.75ID:bKact/KJ
あーパソコン複数台ほしいなぁ
でも置き場所がないからなぁ
となるとAWSとかGCPとかかなぁ
でもあれ、金がやばいらしいからなぁ
263535
垢版 |
2020/04/27(月) 21:37:15.24ID:bKact/KJ
囲連星もやりたいけど、ライフゲーム囲碁もやりたいんだよなぁ。
>>208のやつはパス実装するのが難しいからなんか別の奴探してこようかなぁ。
ルール的にはオセロのクローンから移植すればライフゲーム囲碁移植しやすいはず。
264535
垢版 |
2020/04/28(火) 19:29:54.42ID:VfQhex7P
打ち筋は確かに改善されてるような気がするんだよなぁ。
ただ、あまりに上達が遅い。
265535
垢版 |
2020/04/28(火) 20:06:48.30ID:VfQhex7P
何で五目並べはあんなうまく行くんだろう?
やっぱ複雑度が全然違うのだろうか?
266535
垢版 |
2020/04/30(木) 18:36:10.38ID:6uxMdcsM
どんなに早くてもleela zeroが強くなるのに必要だったぐらいの時間はかかるのかもしれないなこれ…
267535
垢版 |
2020/05/02(土) 20:07:05.00ID:ppsdwWbz
あかん、超長期戦になりそうorz
マシンパワーがあと10000倍あればorz
268535
垢版 |
2020/05/03(日) 19:21:36.29ID:6By0oz27
らちが明かないので19路囲連星はいったん止めて9路囲連星に移行します。
でもいつかは戻ってきたい。
I shall return.
269535
垢版 |
2020/05/03(日) 22:42:03.10ID:6By0oz27
お、9路囲連星は結構強くなるかも。
早くもランダムではない何かを感じる。
270535
垢版 |
2020/05/03(日) 23:03:31.98ID:6By0oz27
もしかしたら19路囲連星は層の数が足りなかったってことなのかも。
9路囲連星は6層でやってます。
5目並べが4層でうまく行ったから7目並べの囲連星なら6層かな?と思ったのですが当たりだったかも。
271535
垢版 |
2020/05/03(日) 23:32:54.33ID:6By0oz27
これは…
明らかに知性がある…
272535
垢版 |
2020/05/05(火) 17:29:46.91ID:3PlXxhBg
おっとバグがあったorz
でもこれで行けるはず。
273535
垢版 |
2020/05/06(水) 10:40:38.68ID:Oyc/dCE2
うおお、公式ボットに勝った〜
凄い!!
274535
垢版 |
2020/05/06(水) 15:40:57.35ID:Oyc/dCE2
しかしalpha zero てこの手のゲームの最終解答にちかいな。
単に移植しただけで既存ボットに勝つとは。
275535
垢版 |
2020/05/07(木) 19:53:48.31ID:LRbJj7fv
学習が進んだので既存ボットと対戦してみましたが、大幅に負け越しますね。。。
過学習?
276535
垢版 |
2020/05/07(木) 20:07:16.58ID:LRbJj7fv
うーん、わからん。層数をさらに増やして学習させてみようかな…
囲碁AIにならって20層くらい一気にいってみるかな…
277535
垢版 |
2020/05/07(木) 20:19:50.05ID:LRbJj7fv
チャネル数 384
層数 20

の超ビッグネットワークで再挑戦します。
278535
垢版 |
2020/05/07(木) 20:59:06.64ID:LRbJj7fv
ん、CPU使用率が上がらない?
ネットワークでかすぎたか?
279535
垢版 |
2020/05/07(木) 21:03:55.67ID:LRbJj7fv
GPUのメモリが溢れてるっぽいorz
しょうがない、小さくするか。
280535
垢版 |
2020/05/07(木) 21:25:17.52ID:LRbJj7fv
GTX 1080 でもメモリ足らんとかorz
気安くいってくれるぜ
281535
垢版 |
2020/05/07(木) 21:27:42.59ID:LRbJj7fv
バッチサイズもでかくしたのまずかったっぽい
282535
垢版 |
2020/05/07(木) 22:52:16.50ID:LRbJj7fv
うーん、もしかしたらCPUはあんま必要なくてGPUに金使ったほうがいいのかもしれないな。これは。
283535
垢版 |
2020/05/08(金) 20:21:50.28ID:vYlFFPu/
層増やしたけどあんまうまく行ってないのかなぁ。
それともまだまだ学習が足りないだけなのか…
284310
垢版 |
2020/05/09(土) 00:56:41.26ID:tOwbW1Pp
棋譜作成触りすぎるとなかなかはかどらなくなるので、しばし回しっぱなし。

そろそろBookが巨大化しすぎているので、メモリーからSDDに移せないか検討中。
concurrent_unordered_mapを自作した経緯があるので、同じような感じでランダム
アクセスなDB化をしてます。確定分は探索で使うのでメモリーにおいて、速度を
必要としないアクセスをDBにしようかなと。

巨大Bookの作成処理の類を並列処理にしているので、何とか並列にできないかと
色々やっていますが、色々と罠がある。複数プロセスからの並列更新はあきらめた
けど、単一プロセスからの並列更新でロック範囲がまだいまいち。

専門書買ってコード見て勉強した方が早いんだろうけど、まあ、しばらく楽しみます。
285535
垢版 |
2020/05/12(火) 21:24:42.90ID:autiDqQV
1ゲームすら勝てない…
何が悪いんだ?
286535
垢版 |
2020/05/12(火) 21:56:06.70ID:autiDqQV
いままで新旧のAIを比較するとき10戦中6勝以上でAI更新にしてたのを50戦中30勝以上で更新にしてみます。
もしかしたら試行回数が少なすぎて弱くなっていてもAI更新してたかもしれないので。
287310
垢版 |
2020/05/12(火) 23:05:51.81ID:AcB4a3UT
うぬぬ。DB化は並列諦めてみたけど、やはり更新が遅すぎる。
もうちょっと工夫してみるけど。
288535
垢版 |
2020/05/14(木) 19:16:54.03ID:7UgQPtyV
ただ待ってるだけってのもつらいな。
結果も出ないし。
289535
垢版 |
2020/05/15(金) 18:59:37.53ID:55GCUZ0E
心が折れそうorz
290535
垢版 |
2020/05/15(金) 19:20:34.85ID:55GCUZ0E
自己対局みてると結構強そうに見えるだけどな。
公式AIと対局すると勝てねんだよな。
291535
垢版 |
2020/05/15(金) 19:53:09.72ID:55GCUZ0E
ギブアップです。
何か次のこと考えよう。
2020/05/16(土) 11:39:42.73ID:n0PK2vlL
AlphaGoは計算資源をコスト度外視で使って1000年分対局してるから……
293名前は開発中のものです。
垢版 |
2020/05/16(土) 15:42:40.24ID:G8tru4l4
IT掲示板群 ttp://x0000.net/forum.aspx?id=15

学術の巨大掲示板群 - アルファ・ラボ ttp://x0000.net
数学 物理学 化学 生物学 天文学 地理地学
IT 電子 工学 言語学 国語 方言 など

simulationライブラリで純粋な関数式プログラミングをする
ttp://x0000.net/topic.aspx?id=3631-0
UIライブラリ (C#, 2D) を作ったよ
ttp://x0000.net/topic.aspx?id=3688-0
連続と離散を統一した!
ttp://x0000.net/topic.aspx?id=3709-0
4Dエンジン
ttp://x0000.net/topic.aspx?id=3677-0
matrixのライブラリ
ttp://x0000.net/topic.aspx?id=3711-0
ある強力なFor関数
ttp://x0000.net/topic.aspx?id=3630-0
SQLライブラリ
ttp://x0000.net/topic.aspx?id=3675-0
294535
垢版 |
2020/05/16(土) 18:10:49.03ID:BsSPHqoG
>>292

     / ̄⌒⌒ヽ
      | / ̄ ̄ ̄ヽ
      | |   /  \|
    .| |    ´ ` |
     (6    つ /   ちくしょう・・・
    .|   / /⌒⌒ヽ
      |    \  ̄ ノ
     |     / ̄

  ,冖 ,、  冖   / //      ,. - ―- 、
 `,-. -、'ヽ' └ァ --'、 〔/ /   _/        ヽ
 ヽ_'_ノ)_ノ    `r=_ノ    / /      ,.フ^ー- j
  ,冖 ,、   ,へ    /  ,ィ     /      \
 `,-. -、'ヽ'   く <´   7_//     /     _/^  、`、
 ヽ_'_ノ)_ノ    \>     /       /   /  _ 、,.;j ヽ|
   n     「 |      /.      |     -'''" =-{_ヽ{
   ll     || .,ヘ   /   ,-、  |   ,r' / ̄‐-..,フ!
   ll     ヽ二ノ__  {  / ハ `l/   i' i    _   `ヽ
   l|         _| ゙っ  ̄フ.rソ     i' l  r' ,..二''ァ ,ノ
   |l        (,・_,゙>  / { ' ノ     l  /''"´ 〈/ /
   ll     ,冖 ,、  >  >-'     ;: |  !    i {
   l|     `,-. -、'ヽ'  \ l   l     ;. l |     | !
   |l     ヽ_'_ノ)_ノ   トー-.   !.    ; |. | ,. -、,...、| :l
   ll     ,冖 ,、 |\/    l    ; l i   i  | l
   ll     `,-. -、'ヽ' iヾ  l     l   ;: l |  { j {
   |l     ヽ_'_ノ)_ノ  {   |.      ゝ  ;:i' `ー‐-' }
. n. n. n        l  |   ::.   \ ヽ、__     ノ
  |!  |!  |!         l  |    ::.     `ー-`ニ''ブ
  o  o  o      ,へ l      :.         |
295535
垢版 |
2020/05/18(月) 18:55:35.95ID:ErVFXYqV
次のアイディアもなくすっかりさぼりモード
296310
垢版 |
2020/05/18(月) 21:57:15.59ID:lyHQ6R5E
Hash関数変更
DBのハッシュキーの効率が悪かったので、ちょっと考えてみた。
今まではshuffle_epi8でバイト単位シャッフルしていたのを、BMIのpextでビット単位の
シャッフルと、rotateしたものを、xorでまとめていく方法。以前よりは、ちょっと良くなった
気がする。

何をもってよくなったかの指標が欲しくなり、ネットを探索したけど、数値指標みたいなの
は見つからない。確率論の誕生日問題の反対みたいな状況なのでしばらく考えてみる。
要するに、1万人くらいの生徒がいる学校で、誰一人誕生日ではない日が何%くらい存在
するのかという類の問題です。

また、そう考えてみると、現状では直観よりかなり未使用キーが多い気がしています。
xorを繰り返してビットのオンオフをすると、いずれ立っているビット数が32個を平均と
した正規分布(二項分布)になって、一様分布にならないのではないかという疑念が。
正規分布だと、中央に近いところは重複しやすく、立っているビット数が0とか64とか
の出現確率が下がる事になります。xor繰り返すと正規分布に本当に近づいていくのか、
ちょっと検証してみたい。
297310
垢版 |
2020/05/18(月) 22:17:24.43ID:lyHQ6R5E
DBの件
たぶんあるだろうとネットで検索してみたら、Kyoto Cabinetなるキーバリュー型の
簡易DBライブラリがある事が判明。ほかにもLevelDBとか、何種類かあるみたい。
RDB使うまでもないけど、データ量が多いとメモリーだとリソース勿体ないみたいな。
やはりみんな考える事は一緒だなと。せっかくなので導入の方向で検討。

DBの速度問題
また、おそらく1棋譜単位でのBook更新は速度的に問題ないのですが、DAG(合流)
時に、棋譜外の合流元の方の更新がされないという問題があり、学習前に一括で
再構築しています。この一括更新が件数の関係ですごく時間がかかる事が問題です。

一応、1棋譜単位で更新した時に、DAG分もちゃんと処理するロジックを検討中です。
バグさえなければ速度問題はかなり解消できるはず。とはいえ、何回もループを回す
処理となるため、速度に自信なし。
298310
垢版 |
2020/05/18(月) 23:50:13.18ID:lyHQ6R5E
DBの件…
確定探索の時にはメモリーに確定分だけおいとくと考えていましたが、
今件数確認したらおよそ2/3は確定分として確保しなきゃならない
事に気づきました(汗

棋譜作成時はメモリーでやるしかないかも。

1棋譜更新でのDAG問題回避はやりたいかな。
Book再構築にだいたい20分くらいかかる。
DAG回避で1棋譜分更新するのが1秒として1000棋譜追加でおよそ16分。
これ以下の時間で済むならやる価値ありそう。
299310
垢版 |
2020/05/20(水) 01:15:22.70ID:Xgj8E+2H
久々に完全読み切りでバグ発生。

ProbCutを広げながらmtd(f)している時に、どうもパス絡みで発生しているっぽい。
ProbCutによるIterative Wideningを止めたらちゃんと読み切る。

まあ、置換表絡みなんだとは思うけど、事例が少なすぎて(数か月に1回程度)、
前の記録消しちゃったので、とりあえず記録を残し、絆創膏当てて続行。

気が向いたらデバッグしてみる。可能性があるところはなんとなくわかっている
つもりだけど。


Book更新時のDAG回避は、かなり悩ましい。というか頭がこんがらがる。
未使用Hashの期待値計算も頭が未だにこんがらがってます。。
2020/05/20(水) 03:14:41.24ID:kE3dJxL+
お姉さん問題で有名な、北大の湊教授のZDD を使えないの?

本も出てる
301535
垢版 |
2020/05/20(水) 16:25:53.99ID:BUng/tdF
katagoを使った9路囲碁の巨大Book作成、やってみようかなぁ。
難しそうだけど。
302310
垢版 |
2020/05/20(水) 17:28:20.84ID:Xgj8E+2H
Hash関数の効率判断基準できました。

同じキーにデータが8つくらい入っているようなものもあり、それが適正かどうか
判断できなくてゴチャゴチャしていましたが、昨夜しれっと書いたように未使用キー
の数の期待値に着目したら簡単でした。

キーサイズと、データ件数からExcelなどで簡単に計算できます。

3件程度調べてみましたが、理想的な一様ランダム値で生じる未使用キー数の
期待値との差は0.1%未満で、このHash関数も一様ランダム化するものと言って
良いレベルでした。

逆に言えば、自分の典型的な使用方法だと20〜30%のキーが未使用になる
という事のようです。これはこれで…。
303535
垢版 |
2020/05/20(水) 18:41:29.84ID:BUng/tdF
やっぱライフゲーム囲碁やりてぇなぁ。
ウーム悩ましい。
304310
垢版 |
2020/05/21(木) 00:46:28.65ID:ahADKaci
Hash値、1件2件…と期待値出そうと思ったら、なんとなく昔の記憶が戻ってきて、
0件の時は不要だけど、こちらではPとかCとかが必要になるような気がしてきた。
確率の勉強するかな。

ZDDちらっと見てみたけど、ちょっと目的と違うような感じがしている。
本買ってみるけど。

脱線はこれくらいにして、DAG考慮したBook更新に戻ろう。
305535
垢版 |
2020/05/22(金) 19:57:06.06ID:khQY98T/
自己流でライフゲーム囲碁に取り組むべきか。
なぜalpha zeroがうまく行かなかったのかを調査すべきか。

まあしばらくさぼりモードだけど。
2020/05/26(火) 02:09:09.91ID:dgMv5Qb/
・19路盤での定石の発見とかを可視化して、強さを判断する
・まず5〜9路盤で最強目指す

俺なら後者を選択する
バグが出なくなったら前者に取り組む
307535
垢版 |
2020/05/26(火) 18:51:39.27ID:QRHJU3eS
>>306
実際に自分で手を動かす人なら歓迎するぞ?
口先だけならいらない。
308310
垢版 |
2020/05/29(金) 00:49:53.42ID:wYh6jGrP
DAG時のBook更新の件、めっちゃ悩み中。
普通にやったら1件更新に14秒とかかかって使い物にならない。
逆引きDBを作ろうかと思うのだけど、結構なサイズになるので、それこそメモリーに
置きたくない。形としてはunordered_multimapになるんだけど、Kyoto Cabinetが重複
キーを許すのか英文読まなきゃならないので止まってる。

そうこうするうちに完全読み切りのバグがまた発生して、事例が3件になったので、
調査開始。2か所間違いを発見。一つ目はケアレスミス。

2つ目は最善手の直後にパスが来るケース。置換表登録はパス後、オーダリングなどで
読む時はパス前の盤面になっていた。これで値が狂う理由がいまいち理解できないの
だけど、修正したら正しい答えが出るようになった。パスの処理は本当に鬼門。

たぶんバグは取れたけど、50%くらい速度低下。どこかにまだバグがありそう。
309310
垢版 |
2020/05/29(金) 00:56:37.17ID:wYh6jGrP
速度低下は50%どころではなかった…150〜200%だorz
310310
垢版 |
2020/05/29(金) 20:25:58.86ID:wYh6jGrP
orderingの中でパス処理をしていたのでmobility関数を呼びまくっているのが遅い原因
ではないかと思い、パスの処理の仕方を変えて、パスも1手とするように変更したところ、
15〜20%の速度低下まで戻りました。他にも、つられてバグが発覚したので修正。

かなりのレアケースでしか発生しないバグですが、今まで自信満々で完全読み切りは
間違っていないと思っていましたが、なんか自信なくなった。

中盤探索も同様に修正したら、浅い探索の読み筋が変わったみたいで、少しは精度が
良くなるのかなぁと期待しています。
311535
垢版 |
2020/05/30(土) 18:11:38.04ID:TznaFVwY
以前もちょろっと触れたけど囲碁ディープラーニングプログラミングという本の12章にあるactor-critic法というのがまた気になり始めた。
自分なりに解釈して実装してみようかな。
312310
垢版 |
2020/05/31(日) 10:02:44.30ID:/CnVYfEH
またエラーが…

なんとなく記憶をたどっていくと、初段で並列処理してMap-Reduceすると、βカットの関係で
評価値は合っていても、ordering次第で間違った手を返す事を思い出しました。
で、たまたま回避策となっていた処理を>>201で外してしまったのではないかと。

並列探索だと本質的に回避できない気がするので、初段を順次処理に変更。残り空きマス
26での平均処理時間。一時は20〜25秒くらいまで来ていたのが、30秒程度に悪化orz
313535
垢版 |
2020/06/04(木) 21:00:10.17ID:asDXFlye
藤井センセw
314310
垢版 |
2020/06/05(金) 22:28:59.18ID:TnykYlJh
藤井7段凄かったね。今年中に8段行っちゃうんじゃないかと思った。

エラーの原因を冷静に見直したところ、どこをどう変えたか覚えていないレベルの
ちょっとした修正を加えたところからドツボって、修正するたびに更にバグを仕込んで
いたような。結局、元々のプログラムに戻して、速度も復旧しました。むむむ。
こういうのがあるからから、終盤探索に手を入れたくないorz

Bookの遡り修正ですが…行き詰っています。
Kyoto Cabinetはやはり単一キーしか扱えず。
メモリー上に逆引きDBを作ると、たぶんBookよりサイズが大きくなるためメモリーにおけない。
しばし悩み中。

息抜きで、棋譜作成のロジックをちょこっと修正。
同じような評価値が並んでいたり、最善手より評価値が良くなる分岐について、今までは
見つけて気になったところだけ手で追加していましたが、適度なペースで見つけて自動的
に追加する様にしました。
315535
垢版 |
2020/06/15(月) 22:53:27.40ID:SQc2KJ2b
長期サボりモードに突入
なんか本で読んだけどモンテカルロ木探索の訪問回数をdnnの教師データとして使うようなやり方もあるらしい
316310
垢版 |
2020/06/15(月) 23:12:30.86ID:r41RfhWg
DB化、未だに方法が見いだせずストップしてます。
パブリックドロー臭いのにそうじゃない筋を手動で修正して、20件ほどもとに戻った。

その間に、棋譜が100万件突破しました。
が、Book眺めていると、まだまだ間違い多い。
Zebraも結構間違えているけどね。
317535
垢版 |
2020/06/17(水) 21:35:01.75ID:nCYZMpcd
2020/05/11 グロービス、囲碁AI「GLOBIS-AQZ」のプログラムをオープンソース化 プロジェクトの集大成としてソースコードを公開
https://www.globis.co.jp/news/release/20200511_globis.html

知らなかった。
ちょっと見てみようかなぁ
318535
垢版 |
2020/06/17(水) 23:13:34.58ID:nCYZMpcd
なお、公開しているソースコードは対局・解析のみの実装で、学習に関する機能は含まれていません。


駄目じゃんorz
319535
垢版 |
2020/06/18(木) 19:28:02.18ID:i+asT3Px
ライフゲーム囲碁でモンテカルロ木探索の訪問回数をdnnの教師データにするのやり始めました。
今教師データを収集してるところです。
320535
垢版 |
2020/06/19(金) 19:58:32.47ID:Y5lRzoqU
教師データを学習させてみましたがあんまり強くなりませんでした。orz
321535
垢版 |
2020/06/19(金) 20:44:26.89ID:Y5lRzoqU
そもそもモンテカルロ木探索を教師にしてる時点で、モンテカルロ木探索の強さを大きくは超えられないわけで。
根本的に駄目な気はしてきたorz
322535
垢版 |
2020/06/19(金) 23:03:06.10ID:Y5lRzoqU
結局、現状、良い教師データがないと厳しい。
アルファゼロ方式の自己対局で強くなるのは1000年かかりそうだし。
むうぅ
レスを投稿する

5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況