コンピュータ将棋スレッド 157
■ このスレッドは過去ログ倉庫に格納されています
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512
↑スレ立て時は1行目と2行目に「!extend:checked:vvvvv:1000:512」をコピペして立てて下さい
荒らし対策のために強制コテハン(ワッチョイ)を表示するコマンドです
第29回世界コンピュータ将棋選手権 参加チーム
https://www.apply.computer-shogi.org/wcsc29/team.html
詰将棋メモ コンピュータ将棋2019
http://toybox.tea-nifty.com/memo/2019/01/post-33f0.html
世界コンピュータ将棋選手権参加ソフトリンク集
http://www.ne.jp/asahi/tetsu/toybox/soft/softlink.htm
floodgate 最新2週間レーティング
http://wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html
コンピュータ将棋協会
http://www.computer-shogi.org/
コンピュータ将棋
http://ja.wikipedia.org/wiki/コンピュータ将棋
コンピュータ将棋 まとめサイト(コンピュータ将棋レーティング)
https://www.qhapaq.org/shogi/
前スレ
コンピュータ将棋スレッド156
http://mevius.5ch.net/test/read.cgi/bgame/1574060414/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured BookOnTheFlyって普通有効にするものじゃないの?
WCSCみたいな大会時は最初に定跡丸読みする時間が消費時間にカウントされないからBookOnTheFly無効にするけど、普段使いでは起動するたびに定跡丸読みタイムとか無駄でしかないと思うんだが >>436
評価関数の読み込み時間に比べたらゴミみたいなもんだと思うけど 数百MBくらいの巨大な定跡ならまだしも丸読みで困らんよな別に >>435
やねうら王のテラショック定跡は後手番のときに相手の初手が2六歩だと相掛かりを受けずに横歩取りにしてしまう欠点があった
横歩取りは後手番の勝率がかなり下がっていてやるメリットがない
偶然にもWCSC29のやねうら王後手番はほとんどの対戦相手が初手7六歩だったので問題なかったが水匠だけが一次予選も二次予選も2六歩でやねうら王が横歩取りにして悪くしてしまった
ちなみに決勝ラウンドでもやねうら王は後手番で水匠と対戦したがこれは角換わりで力負けした >>437
>>438
テラショック定跡の場合はNNUE評価関数読み込みよりも定跡読み込みのほうが時間かかるよ
嘘だと思うならBookOnTheFlyオンオフ切り替えて試してみて >>441
評価関数はファイル読み込むだけだが定跡はファイル読み込んだ上で定跡ツリーを構成するんだから時間かかるのは当たり前だろ エンジン起動で時間かかるのはtthash用のメモリ確保じゃないか?
120GB確保するのに2分くらいかかっているので、16GBとかでやってる人も15秒くらいかかってるはず
ShogiGUIのタイムアウトが30秒設定なので、自分はメモリ確保の間エンジン側からkeep aliveのための空行送るコード追加した >>443
確かにメモリ確保が一番時間かかる
ハッシュサイズをやねうら王のデフォルトくらいにしてる場合は定跡読み込みが一番時間かかることになるだろうが、普通はハッシュ大きくするからメモリ確保だよな メモリを高速化するだけでNPSが20%も上がるらしいからねぇ
場合によってはCPUの換装よりも資金効率はいいかもしれない >>445
ハニワさん、noteで進捗書いてるけど今年もまた定跡作成だけで評価関数作れずに大会突入しそうな雰囲気だな
この時期に飛車を振っただけで評価値下がるかどうか実験してるのはもうデスマのタイムリミット諦めてるだろ
振り飛車党はW@ndreさんのほうが期待できるわ
Qhapaqさんも今年は振り飛車で出ても優勝争いする自信ありと宣言してるので一番期待してるのはQhapaqさんだが 思えばハニワさんはSDT5で決勝初戦敗退したときが一番輝いていた
振り飛車狂評価関数を完成させて振り飛車党評価関数を実現したからな
ところがWCSC28になるとSDT5のAperyにSDT5の振り飛車狂評価関数を1%の割合で混ぜただけというほぼAperyの手抜き評価関数になり、
WCSC29では手抜きキメラすらやらずに前回のと同じ評価関数で出た
定跡はその分毎年アップグレードされていくからさすがに第一人者なんだけどね 起動時間ノーカウントルールの大会以外でBookOnTheFlyをオフにするメリットある?
ハッシュが小さい場合は起動のボトルネックが定跡がオンにすべきだしハッシュが大きくても多少起動時間が短縮できるならオンにして損はないはず
起動時間なんか気にしないからどっちでもいいって意見はありうるだろうけど積極的にオフを選ぶ理由はない気がする BookOnTheFlyを有効にすると起動時間が短縮される代わりに定跡手を指すのがほんの少しだけ遅くなる
もちろんテラショック定跡みたいな大きな定跡を使ってるなら起動時間短縮のほうが圧倒的に大きな効果があるだろうが
しかしご存知の通りWCSCは起動時間がどれだけかかっても持ち時間減らないから少しでも指し手が早くなるならBookOnTheFly無効にするのが当然
教師局面生成時も起動しっぱなしで連続対局させるならBookOnTheFly無効のほうがいい
ユーザーは有効にすればいいだろうが結局開発者視点ならBookOnTheFlyなんぞ有効にする意味が分からないんだよね 多少とか少しでもとか言うけど具体的にどれくらいなの?
メモリ確保時間のほうは秒とか分とかの数値が出ててそっちのほうが大きいだろうと言われているのだから、
これ以上議論したいならオーダーくらい示してよ 多くて0.5秒くらいじゃね?体感だけど
気になるなら自分でやってみればいいじゃん そもそも議論も何もオンにしたいやつはオンにしとけ、で結論は最初から出とる
検討用設定はこうしろとか勝手にテンプレ作ってTwitterで拡散してやねさんに叱られたのを忘れたんだろうか HDDなのかSSDなのかでだいぶパフォーマンスが変わってくるような? やねうら王がRyzenだとNPS出ない問題って結局なんだったの?
一般的なベンチだと3950Xのスコアはかなりすごいのにやねベンチだとインテルに比べると伸びが悪いやつ >>454
どうせ微々たる差なんでしょ、と言いたかっただけで、誤解させてしまったのなら申し訳ない
「どちらにするべき」と言うほどの差はないだろうから各自好きにすれば良い、と思います >>457
AVX2の命令が使わないほうがいいぐらいに遅い >>457
インテル向けのチューニングが進みすぎって可能性も。
実際CPU過熱しすぎるからねぇ。 >>459
それはZen+以前の話で3950Xとは関係ない avx2とかbmi2とか諸々の命令は使えるようにはなってるけど実は軒並み遅いってことなのかね
IPCはZen2のほうがIntelよりいいって話もあるくらいだし流石にNPS出なさすぎよな Ryzenは浮動小数点得意って話だから何が悪いんだろうね 伊藤A紀さんが公開していた
Ryzen用の改造をマージできる猛者はいないのか? >>447
W@ndreさんのアピール文見てきたが今年は振るか怪しそうだぞ
Qhapaqさんが振り飛車で優勝できるなら、その方が振り飛車党にはよさそう 今年はカパックが優勝争い本命かな?
振り飛車でもorqhaより強いってさすがに異次元だろ
あとはkai4を完成させた白ビールか
やねさんは特に進展ないみたいだし直前で参加取りやめそうだな dlshogiはApery WCSC28超えてきたから、もう少し強くなれば優勝あるかもな
NNUE勢がほとんど強くなっていなければだけど NNUE勢……Kristallweizen、Qhapaq、やねうら王、PAL、tanuki-、水匠、elmo、大合神クジラちゃん、nozomi、名人コブラ、HoneyWaffle、koron
DL勢……Crazy Shogi、dlshogi
KPPT勢……Novice、Apery
この中で半分は予選落ちするわけだからな…
去年のNNUE勢8チームに加えて今年はnozomiもコブラもハニワもNNUEだしkoronもNNUEでそこそこ強いみたいだし
Crazy ShogiはAWSに10万ドル課金して学習進めたとか言ってるしdlshogiも急速に伸びてるしNoviceとAperyはすでにKPPTでQQR超え達成してるし
水匠やelmoあたりが予選落ちしても全然不思議じゃないんだよな dlshogiはR4200だから決勝残れる可能性の有るレベルまでは来たけど
ここからR100上げても優勝にはまだどうかってとこか
crazyshogiはゼニの力でどこまで迫れるかね
aobazeroに冷たくして悪かったと思う俺 ビール、Qhapaq、やね、PALはすでに4400超え
コブラは当然ライブラリで去年のビールを使ってくるから4370クラス
koronは新人なので信用はできんがTwitterで4500超えたと言ってるので少なくともorqhaには勝ち越してるんだろう
水匠やelmoは去年からの上乗せで少なく見積もっても4350くらいは超えてくるだろう
そうすると予選通過ラインは最低4350
KPPT勢は現実的に不可能なレベル
DL勢もAlphaZeroですら4400くらいとされているので10万ドル課金したくらいでは到達できないと思う
順当に行けば今年もNNUE大会になる
NNUEを独自実装したらしいnozomiには期待 4350と4300が対戦しても勝率にしたら57%とかだからね
もうほとんど差がないし定跡やら相性やらでいくらでも逆転あると思う
Crazy Shogi、dlshogi、Novice、Aperyあたりはチャンスあるはず SDTでなくてWCSCだからねー
評価関数以外の要因がでかそう スイス式8回戦とか9回戦だと通過8チームのうち6枠までは実力通りに決まる可能性が高いけど残り2枠は紛れが起きやすいからね
紛れで決勝進んでもタコ殴りにされてしまうってことはここ数年の傾向だが、接戦傾向だと一回戦総当たりではapery初優勝みたいなことも起こりうる
(ponanzaが頭一つくらいは抜けてたあの年でもそのくらいは起こった) nozomiは大森さんがモティベーション保ててる間に一回は最終日行って欲しいんだよなあ
一次予選敗退の時といい、スイス式の紛れに翻弄されやすい
シード2枠増&通過2枠増で実質4枠増えた一次予選は久々にほのぼのしそう
R3500くらいでも二次には進めるのでは? MCTS勢が2080Tiからp3.16(Tesla V100 x8)にしたときと、NNUE+αβ勢が4コア8スレCPUからm5 metal(96スレ)にしたときのレート上昇はどっちが大きい? koronはTwitterでR4583だの優勝狙うだのイキってるけどWCSCのエントリー表を見ると16コアの持ち込みPC1台
こいつがガチかどうか >>478
nozomiは独自実装でこれまで安定して決勝には行けないがそこそこの成績残してるから今回のNNUE実装は期待できる 96スレとかになってくると、見かけのNPSはすごいけどレートの上昇はそうでもないはず
去年の水匠や今年のkoronがすごく不利かというとそこまででもないと思うわ
16スレの10億ノードと128スレの10億ノードでどのくらいレート差があるかとか気になる 増えたスレッド数はそのまま並列させるんじゃなく
技巧みたいに複数のクラスタ作って単純合議でいいのでは?
チェスを見るとKomodoとHoudiniは64コア128スレッドまでは動作保証してるんで、単一CPUではその辺が効率の限界なのかなとは思うが
ところで関係ないけど、2分プラス1秒加算だとlc0がstockfishをわずかにレートで上回ったのな
(haswell8スレvs2080無印なんでαβの方が不利そうではあるが)
MCTSの進歩もあるんだろうけど これは胡散臭い
万が一本当だったら優勝候補だが
koronプロジェクト @koronproject
新生koron誕生のお知らせ。
たった今、ゼロから学習させたkoronの計測が終わり、
R4583という、なかなかの好成績を叩き出しました。
大会、優勝できるといいなぁ〜〜〜
午後4:29 · 2019年11月22日·Twitter for iPad
https://twitter.com/koronproject/status/1197779017073487872
koronプロジェクト @koronproject
現在、pcをフル稼働させてkoron巨大定跡を掘っている。
今の定跡のサイズは約30MBとなった。
wcscで優勝のやねうら王のテラショック定跡が約25MBなので、それを上回った。
大会当日にどのくらいの定跡になるか楽しみだ。
午前6:28 · 2019年11月19日·Twitter for iPad
https://twitter.com/koronproject/status/1196540757319897088
https://twitter.com/5chan_nel (5ch newer account) 去年も誰かが検証したら大したことなくて大会もキャンセルしたからな。。 本当ならR4600はないと優勝争いには絡めないってことか >>487
いやそんなことはないだろ
仮にkoronが4583でぶっちぎりで優勝したとしても他チームが4450以下なら4450で2位になることは可能じゃん
2位も優勝争いしたことには違いない
そもそも本当に4583なのかは真偽不明だが elmoは動画でいろいろやりたいことを紹介していたから期待
数年前、圧倒的王者Ponanzaを破った衝撃は大きかった koronは去年も最強のソフトできたっていって公開してたけど、最強にはほど遠かった よくわからんけど、AobaZeroのバッチサイズってあれでいいの? koronはよく言ってフカシ、悪く言えば加療入院が必要
>>488
知らんかったこれ >>470
koronを消して代わりにKPPT枠でNineDayFeverを入れろ >koronプロジェクト @koronproject
>2019年11月25日
>そうですね、、、
>レーティングがここまでになるとwcscに大きな影響を与える事になりかねるので公開はwcsc後ですかね。
>ま、一般公開は定跡作りを手伝って頂いた方に限り配布させていただく予定です。
あーなるほど
誇大広告で評価関数の配布を餌に定跡掘り要因を集めようという寸法か
あんまり真に受けない方が良さそうだ 「大きな影響を与える事になりかねる」というのは初めて聞く言い回しだが
ググったらまずそうはならないという解釈になるようだな
論理的には正しい ということでいいのだろうか koronは極めて怪しいがNNUEを使ってる時点でNoviceやらNDFやらに十分勝てるんだよな
これが現実 floodgateのaobazero ハメ手っぽい順に弱いな
学習に問題があるのか低探索mctsの限界なのか いまだにネット掲示板が匿名で何言っても許されるよ思ってる人がここ多いけど
訴えるの今は簡単になったから誹謗中傷された人は事を起こしたほうがいいよ
この分野も加味して「たややん」さんが第一人者になればwinwin aobazeroって
learning rate = 0.0002, mini_batch = 128 (mini_batch = 128, iter_size = 1)
で今は、128。alphazeroは4096なんだよな。 学習率0.000625が適切だけど
学習率0.0002だから、早く落とし過ぎだと思う
学習率を早めに落とすと最後の性能が大幅に悪くなる
https://arxiv.org/pdf/1912.11370.pdf
fig 5
まあ遅すぎるからやってられないか
次の学習率低下は1000万局だから2年後 dlshogiは脱Intelからの脱Chainerしてから
一気にレーティングが伸びてもうApery超えたのか
1年でR1000近く上げてるじゃん凄すぎる >>503
これでAlphaZeroの追試になるの?
AobaZeroがもしR3500くらいで頭打ちになったとして何の成果があるの? 昔、山下論文によると、将棋の神様のレーティングは4600〜4700ぐらいか?みたいな話あったじゃないですか
koronも山下仮説も両方が事実なら、そろそろ将棋の結論にすら迫れるレベルにすら来てるって話になるんだが・・・ >>506
そもそも指し手をプレイアウトの分布じゃなくて
最善手しか学習してないみたいだから、追試になってない >>507
いや、それは違う
レーティングの基準が違うから
レーティングというのは、AとBのレート差、BとCのレート差、CとAのレート差をそれぞれ対局結果から計算して足したら0になるのを前提にしてる
例えばAがBよりもR100強くてBがCよりもR100強かったらCはAよりもR200弱くないといけない
当たり前だと思うかもしれないが、実は将棋の場合は相性問題が大きいのでこうはならない
満遍なく対戦してレーティングを計算した場合と、実力が近いもの同士で対戦してレーティングを計算した場合とを比べると、後者のほうがレーティングが全体的に引き伸ばされることになる
uuunuuun-QRL式のレーティングは実力よ近いソフト同士の対戦を中心にしているのでレーティングが大きく引き伸ばされていて山下論文のレーティングとは全く違う値になる 間違った
AobaZeroは分布で学習させてた
最善のみはdlshogiだった >>588
プレイアウトの分布から学習してるみたいなことが掲示板に書かれてなかったっけ? そっか、プレイアウトの分布ならノイズ多めでも正しく学習できるんだといまさら気付いた。
変だと思ってたよ >>506
playout800でR3500はAlphaZeroからのざっくりとした推定だから、そこだけは再現に成功した(かもしれない)ことになる。
google先生に強力してもらうのが一番手っ取り早くて理想だけど NNUEとやねうら王だけの決勝になって定跡をたくさん掘ってきたとこが優勝かな
DL勢には頑張ってほしいところだけど厳しいだろうね 実戦的にはDLでオールラウンダーを目指さずに、
定跡で穴をカバーしながらNNUEの軽い特化型でいったほうが勝つる説 マルチポンダーって何ですか(・∀・)?
複数のPVを更新するとか探索量的に不利なんじゃ… ponder外れて探索した分全部無駄になることが結構あるからponderのpv1つで決め打ちしない方が強いよねって話 >ponder外れて探索した分全部無駄になる
mjk、
Single Ponderで最善と判断された手がMulti Ponderでは最善手とは判断されないというのはありそうな話だが、
前者の判断より後者の判断が正確になる理由がわからん…
探索するノード数が同じなら、Single ponderのほうが探索窓がより早く狭まる分より深く読めるんじゃぜ?
Multi Ponderには、あくまでマルチコア環境限定で、Single Ponderの並列化より
探索の独立性でもって僅差で勝つぐらいの効能しか無いのでは… >>507
「完全プレイヤーのレーティングがX」というのと「レーティングがXなら完全プレイヤー」というのは
全然別の言説だから混同してはいかん
後者が真でない理由の説明はいろいろ可能で、>>509も正しい説明のひとつ
あの解析ではGPSfishやBonanza自身が悪手率ゼロとみなされていて、
初心者からアマ高段者の、悪手率と将棋倶楽部24レーティングの関係をもとに、
実際には彼らと対戦したことのないGPSfishやBonanzaの将棋倶楽部24レーティングを外挿で求めると4600〜4700と言っているに過ぎない
完全プレイヤーのレーティングは、定義できないか、
あるいは無理やり定義するとしても、非完全プレイヤーの強いソフトが出てくるたびにそれらから逃げるように上がっていくものになるはず >>496
それと同じ趣旨の内容は去年もウェブサイトの方にアップされてて消えた
賑やかしの愉快犯だよ dlshogiがR4200に達したというのに、aobazeroイマイチ伸び悪いよなあ >>518
多分あなたはポンダーが何か理解してない
ポンダーというのは相手の手番で相手が考えている間に相手の手を予想してその先を読んでおく機能
なので相手が予想と別の手を指したらポンダーで考えた内容は無価値になる
マルチポンダーはこれを避けるために相手の手として予想できる手を複数考えておくということ
そうするとポンダーが毎回当たるので持ち時間が大きく節約できて余った時間でさらに深く読むことができる >>522
dlshogiは駒の効き情報とかのドメイン知識使ったり、Lc0の知見を取り入れたりして学習効率がAobazeroと大差
だから10ブロックのネットワークでここまで強くなってる 前回やねうら王が問題提起した千日手狙いの戦略の有効性は検証されてるんかな?
あれが有効なら今後は常に相手の強さを見積もって全力で千日手狙いに来られた時の対策をする必要があると思うんだが。 それは重要でしょう
千日手狙いは立派な戦略のひとつ 後手の千日手狙いは普通だけど先手の千日手狙いは未開拓だし
セキュリティーホールの可能性もあるよね。チェスではドロー狙いは普通だからそのあたりどうなってんかな >>522
最初の論文の方のAlphazeroだったか
今のaobazeroと同じくらいで停滞してたからひとまず様子見かな。
Cuda+cudnn版も出ないし、宣言勝ちもできないし
時間制御も芝先生が実装する始末 千日手狙いの相手に対する有効打って難しそう
前回大会でクジラちゃんが千日手=負け設定にしたら
(それはクジラちゃんの長所を考えると間違いではない)
今度はponderが千日手がらみの時に無意味化して上手に打開できなかったし
あと、相手が千日手狙いと思って対策入れたら、実は千日手狙いじゃなかったときとか目も当てられないしな 後手番で先手番の千日手狙いをかわしたかったら、
評価値を後手番の初形値より少し低いくらいに設定なのかなあ
(去年の白ビールなら、負け設定でいいけど) dlshogiでaobazeroのウエイトが読めるようになったら世界が幸せになる あと学習の段階で千日手の扱いをどうするかで序盤の棋風を変えられる気がする。
例えば50手までの千日手は勝ち扱いにするだけでかなり違うよね。
今は千日手は無視しているか0.5勝扱いなんだよね 千日手に関してはプロ棋士とコンピュータ将棋でルールからして異なるからな
仮に初期局面で先手番が評価値70のプラスだとしたら、コンピュータ将棋の場合は千日手は0.5勝扱いだから、後手番は-70からスタートして千日手に持ち込めば70を挽回したということになる
しかしプロ棋士だと千日手は原則として先後入れ替えて指し直し
指し直し局は後手番は先手番になって+70でスタートするわけだから差し引き140の利得ということになる ■ このスレッドは過去ログ倉庫に格納されています