▲コンピュータ将棋スレッド141
■ このスレッドは過去ログ倉庫に格納されています
>>597
変えた数字の分だけ評価値も変わるだろうけど、変えた後に学習やった場合は、変える前の評価値に近付くように収束すると思う。
学習せずに駒割りのみのソフト作るなら、bonanzaみたいに金より成金の数字を大きくした方が良いんだろうね。
bonanzaはやねうら王と違って学習で駒割りも変動するけど、特に「と金」の価値が自動的に大きくなっている。 じゃあ評価値が全体的に大きく出すぎて困るとかそういう現象が起きたら一応調整はできるのか >>549の勝率がノード数に依存しすぎなのをみて、時々回してたものの途中報告
(この後0.5秒,1秒もやるつもりだったけどこの結果だと途中で投げ出しそう)
エンジン:>>258を落としたまま使った(=およそDolphin2のengine_optionsだが一部間違っているらしい(>>269))
評価関数:NNUEkai5(>>279)
エンジン:GodwhaleChild-5.0.5(選手権あたりからあるもの)
評価関数:QQR
・4T 0.1秒(ノード30-50万程度?)
3071局 1796勝 1275敗
勝率: 0.5848257896450667
標準誤差: 0.008893948764004796
95% 信頼区間 [0.5672419407359166, 0.602084011722566]
相対イロレーティング: 59.51845902452462
標準誤差: 6.363294768915171
95% 信頼区間 [47.00926789156493, 71.94628210105508]
4T 0.2秒(ノード60-100万程度?)
3111局 1784勝 1327敗
勝率: 0.5734490517518482
標準誤差: 0.008869264257160205
95% 信頼区間 [0.5560912889746062, 0.5908068145290903]
相対イロレーティング: 51.409570870267466
標準誤差: 6.298920784965844
95% 信頼区間 [39.14096982006567, 63.80684135857484]
感覚を裏切らず、ノードが2倍になった程度では3000局やっても勝率に差があるとまでは言えず。
しかもQQRとの差が縮まる方向だが、uuunuuunさんの4T5秒相当でR差30ちょいなんだから縮んでいいのか。 100万ノード以下の計測って統計数は取れるけど実際にそのノード数で使うことは検討などでもあまりないし
ソフトを選ぶ参考にはならないと思うが >>604
ノード数がもう少し離れてないとやる意味が薄い気が >>554
5000は時間がかかるので3000〜3500万でテスト対局してみました
対局数300 先手勝ち165(58%) 後手勝ち117(41%) 引き分け18
GW+QQR
勝ち121(42%) 先手勝ち75(51%) 後手勝ち46(33%)
dolphin+illqha1.1
勝ち161(57%) 先手勝ち90(66%) 後手勝ち71(48%)
1500万とほぼおなじです
1500万は悪くないノード数の気がします
先の300〜350万と1500万の間を少し埋めてみます >>610
需要が有ればupしても良いのですが、需要は無いのでは
今回はタイプの違うエンジンを使って、ノード数での勝率変化をテストしてみる物なので 1500万ノードは、棋譜の検討で終盤の指し手が悪手なのか最善手なのかを確定させるノード数としては足りない
よって、1500万ノードの勝率テストでは、どのソフトが検討用に一番適したソフトかまでは分からない 1500万ノードというのも中途半端
一般人ならノートPCでの1秒解析での80万ノード辺りが1番使われているだろうし
ガチ勢なら億単位のノードは必須だから橋にも棒にも掛からない >>613
勝率の安定度の問題と思います
ある程度勝率が安定するのが1500万はいると言うことでは
億単位なら異なると言うのなら、億単位で検証してみるべきですね >>614
1500万ノードで勝率が安定すると言い切れるためには
3000万ノードや1億ノードとの比較データが必要なんだが?
それにその論法で
1500万と1億ノードで勝率が仮に変わらないとして
それ。1500万ノードの根拠にしたのなら
今度は1500万ノードと100万ノードで勝率が変わらなかった場合には
計測は100万ノードから安定するからそれで十分と言ってもいいという話にも繋がる 1500万ノードで計測してわかるのは1500万ノードの棋力のみ 勝率の安定度ってひどいパワーワードなのでは?
短時間であろうとなんであろうと、一回の試行の勝率がpであればそりゃ期待される分布は二項分布だとは思わんかね?
やってる最中に次第にPCが重くなりNPSがでなくなって、
だんだん試行の条件が変わっていくというなら分からなくもないが 前にaperypaqとのキメラを50種類くらい作って100万ノードから200万ノード程度でaperypaqとの計測に数か月もかけた
ことがあるけど、それで勝率55~60%のものが8種類くらいできたが1500万ノードで計測したらaperypaqにほとんど負け
越したので100万ノード程度の計測は無意味なことが分かった まあ二点では荒い予測しか出来ないからもう何点かプロットして傾向を出したいわな >>618
50回も計測していれば
kai5のように逆側を引くこともあるだろう
100万ノードで安定してaperypaqよりも強いキメラが公開されたことはない >>614
終盤に強いタイプのソフトはあるんじゃないかな
だから終盤力だけのテストみたいなこともやれたらいいのにな
終盤のありがちな互角局面を自動で作り出すアプレの開発が先になるけど 学習させて250万ノードくらいで有意差でて喜んだら1500万ノードでほぼ互角
という経験は何度かしてる >>621
過去のソフト同士の終盤から互角局面を500くらい拾ってきて
そこからテスト対局させればノード数の違いでどう勝率が変わるか分かるだろうな
過去の棋譜から互角局面集を作ってくれるアプレがあればいいんだな 実際にR15の変化があったとしても
1500局指して有意差が出る確率は半々といったところ
学習をさせるなら想定されるレーティングの変化から
必要な対局数の逆算をしておかなきゃ 仮に小さく見積もって1手10通りだとして100手まで完全解析するのに1秒間に1京ノードで計算しても"無量大数"年以上かかる
宇宙ができてからまだ150億年足らず 注意:tanuki-2018年版はCPUを酷使するプログラムになっているため、他の4つの思考エンジンを動作させる場合に比べてCPU温度が上がりやすいです。
また、他の4つのエンジンについても、スレッド数を上限に設定した場合、CPU負荷率は100%になります。PCの冷却には十分ご注意ください。 >>626
変な手を省きまくってもっと効率的にできないかな まあ、手数よりもまずは「合法局面の完全解析」からではないのか
それをしないと末端終局図もわからないからな TCEC 13の2部リーグ4回戦総当たり28回戦が終了
3部を無敗優勝したEtherealが2部でも11勝17分と無敗で優勝
2位は10勝2敗16分のChessBrainVB、2ソフトが1部に昇格した
現在1部リーグ開幕までの場繋ぎで、1部参加8ソフトとStockfish 8の
5分+3秒でのお好み対局が開催中 完全解析など必要ない。 むしろプロ厨の罠だろw
必勝手順の発見で事足りる。
・初期配置から合法手の応酬によってできる局面のみを調べればよい
(詰将棋のような仮想局面は必要なし)
・詰み・必至を見逃した後の(膨大な)変化も一切必要ない
・将棋のルールで一手パスはできない
・必勝手順は偶然発見されることもある
詰み・必至の局面から逆算していき、
(一手パスできないので)どう指しても悪くなる局面を見つけて行く、
そのような局面のデータを蓄積していけばいいだけ。
そこから先は、一切読む必要、時間を使う必要はなくなる。
よく指される戦型からの変化を最優先で潰していけば、効率もよく、
プロ将棋に与える影響も極めて大きい。 >>634
だから末端局面を発見するには結局合法局面の総当たりが必要なわけだ
詰み必至だけじゃなく持将棋の局面も必要なんだからな
というわけで、10^68の世界へようこそ >>634
君は、総当たり、完全解析が合法手だけで成り立っている事を理解してから書き込みしよう >>634
終盤の詰みや必至からさかのぼって定跡を形成してゆく。
逆算定跡
という。 NNUEkaiの作者って弁護士の先生なんだね、Twitterで知ったけど、法律に詳しそうなのでもしかしたらと思っていたけど >>634
終盤の詰みや必至からさかのぼって定跡を形成してゆく。
逆算定跡
という。
1.候補手には最も候補手範囲が広いAI将棋を使う。
2.5000点で切り上げる。
3.候補手によっては一進一退があるがすべて調べる。
4.充分に浅くなったら2000点で切り上げる。
5.定跡形成には激指の空の定跡を使う。
6.中盤になったら500点で切り上げる。
7.中盤の1手が悪手かどうか分かる。
自動化すれば、かなりの精度の定跡が早く形成される。 >>637
それは結局実際に指された手しかたどらないのだから
単に時間をかけて1局指すのと同じでしょ
ガンジス川の砂ひと粒にもならない >>643
いや、宮田新手潰しとかには使えます。
森内俊之さんが実戦で、渡辺明さんが解説で実践していました。 >>645
ある手が悪手であることをいうには相手の応手の中に1つ好手があればいい
ある手が好手であることをいうには相手の応手のすべてが好手でない手でなくてはならない
>>637のやり方でできるのはせいぜい敗着発見器じゃないの illqha2.1とkai6は25日-27日位にリリース? めきっと@鵺日々成長中@_illqha
やや過学習ぎみな仕上がりな気がします。
遊んでみたいという要望があれば番外編として公開しようかと思っています。
きちんとしたものの公開はもう10日程かかりそうです。
NNUEkaiの人は学習をしばらく取りやめて他の環境とで差が出る原因の究明をするみたいなこと言ってたから当分きそうになさそう >>646
自動化すれば、中盤の終わりぐらいまでは解析できます。
誰かソフトで自動化アプリを作って下さい。
コツはえ?こんな手?という候補手も取り込むことです。
終盤でも再逆転がありました。 また自称「○○に強い評価関数」が量産されたyaselmo時代を繰り返すの? >>635-636
残念ながらチェスはそうではないんだよなw
あれあれ?
・初期配置から可能な局面
・詰み&必至の見逃し後の変化は不要
は都合が悪すぎてスルーですか?w 名無し名人 (ワッチョイ eab3-vl9i)
なんでこんな将棋オンチがこのスレで威張っているんだ 何かアルゴリズム思い浮かんでるなら自分で書いてみればいいんじゃないですかね suimonの本がちょっとした騒動になってるけど実際のとこどうなん? >>653
そのような制約によって所要局面数を「大幅に」減らしたとして、屁のツッパリにもならんのが最大の問題
(100分の1とか1000分の1に出来たとして10^60を越えていたのでは人間の手に負えるオーダーではない) # 勝ち数 対局数 %
01 50.5 90 56% dolphin2 illqha1.1
01 50.5 90 56% nnue-w7-ditto3 illqha2
03 50 90 55% dolphin illqha1.1
04 49 90 54% dolphin2 illqha2
05 48.5 90 53% dolphin Kai5
06 44.5 90 49% dolphin illqha2
07 42.5 90 47% nnue-w7-ditto3 Kai5
08 42 90 46% dolphin2 Kai5
09 39 90 43% nnue-w7-ditto3 Kai5
10 33.5 90 37% GodwhaleChild-5.0.5 KPPT 4.80 64SSE4.2/QQR ■感想
これを実施する前に予想していた順位とはだいぶ違ってた。
予想通りなのはベンチマークとして使ったGW5.0.5 /QQRの成績のみです。
なんとillqha1.1の方がillqha2より若干成績がよかった。
nnue-w7-ditto3はillqha2以外とは相性が良くないみたいだ。
■その他
将棋所の最新バージョンをダウンロードしてリーグ戦で2秒設定で実施したが
将棋所はUSI_Ponder(相手番でも考慮)がデフォルトでTRUEとなっているのを知らなかった。
これだったら1秒設定で実施すれば半分で済んだのにと思った。
開始:8/22 20:52
終了:8/24 23:50 NGワードで書き込めなかったので分割した書き込みになってしまった。
結局短縮ダウンロードURLが引っかかったみたいだ・・・
https://28.gigafile.nu/0901-bc7a84ab35ae64d8d25a2ef5304d9110d ■リーグ戦で戦わせてみた!
■URL
https://28.gigafile.nu/0901-bc7a84ab35ae64d8d25a2ef5304d9110d
# 勝ち数 対局数 %
01 50.5 90 56% dolphin2 illqha1.1
01 50.5 90 56% nnue-w7-ditto3 illqha2
03 50^^ 90 55% dolphin illqha1.1
04 49^^ 90 54% dolphin2 illqha2
05 48.5 90 53% dolphin Kai5
06 44.5 90 49% dolphin illqha2
07 42.5 90 47% nnue-w7-ditto3 Kai5
08 42^^ 90 46% dolphin2 Kai5
09 39^^ 90 43% nnue-w7-ditto3 Kai5
10 33.5 90 37% GodwhaleChild-5.0.5 KPPT 4.80 64SSE4.2/QQR
■感想
これを実施する前に予想していた順位とはだいぶ違ってた。
予想通りなのはベンチマークとして使ったGW5.0.5 /QQRの成績のみです。
なんとillqha1.1の方がillqha2より若干成績がよかった。
nnue-w7-ditto3はillqha2以外とは相性が良くないみたいだ。
■その他
将棋所の最新バージョンをダウンロードしてリーグ戦で2秒設定で実施したが
将棋所はUSI_Ponder(相手番でも考慮)がデフォルトでTRUEとなっているのを知らなかった。
これだったら1秒設定で実施すれば半分で済んだのにと思った。
開始:8/22 20:52
終了:8/24 23:50 7位の評価関数が間違ってました。
nnue-w7-ditto3 Kai5 ⇒ nnue-w7-ditto3 illqha1.1
# 勝ち数 対局数 %
01 50.5 90 56% dolphin2 illqha1.1
01 50.5 90 56% nnue-w7-ditto3 illqha2
03 50^^ 90 55% dolphin illqha1.1
04 49^^ 90 54% dolphin2 illqha2
05 48.5 90 53% dolphin Kai5
06 44.5 90 49% dolphin illqha2
07 42.5 90 47% nnue-w7-ditto3 illqha1.1
08 42^^ 90 46% dolphin2 Kai5
09 39^^ 90 43% nnue-w7-ditto3 Kai5
10 33.5 90 37% GodwhaleChild-5.0.5 KPPT 4.80 64SSE4.2/QQR 評価値使って探索していくんだから少しくらいは相性がないわけがないんだけどね 相性があるというより
エンジンや評価関数に明確な有意差があまりないんじゃないかな? >>653
糞ワロタ
そういうの昔からあって焼け石に水って言うんだよ
勉強になったね💌 やねがクラウドファウンディングでオセロの完全解析やりたいって言ってるしその成果次第でいいんじゃない ツイート読み返したがやりたいとは言ってなかったw
オセロ完全解析にかかる費用が分かれば
オセロと将棋のゲーム木のサイズの違いから、
将棋の完全解析にかかる費用も概算できそう >>663
>将棋所はUSI_Ponder(相手番でも考慮)がデフォルトでTRUEとなっているのを知らなかった。
>これだったら1秒設定で実施すれば半分で済んだのにと思った。
うーんw >>663
ponder onのままだとテストにならんけど
大丈夫なんか? >>670
オセロくらいだと、有力定石を絞り込んだ上で、比較的手の狭そうな枝をセレクトしてから、その変化だけを完全解析というのなら割りとできそう >>664
なぜGodwhaleChild-5.0.5がSSE4.2なのか AVX2版より
強かったのならそのデータを併記してほしい ソフトで将棋の勉強ってどうすればいいの?
ソフト動かしててこれは自分では絶対に意図して動かせないって指し方見てもあんまり意味無くないか? >>676
悪手を教えてくれるのがでかい
悪手を指したらどんな手順で悪くなるのか細かく教えてくれる
普通は対局後に棋譜解析してどう指すべきだったか検討していく感じじゃない? >>673
今さらオセロてw お前は何年前で時間が止まってるんだよwwwww
オセロなんてとっくに実質的には解析できてるようなものだよ。
Wikiでも、すでに7年前に外部リンク先の最終更新が止まったり、ページ自体消えたりしていて
↓この状態なんだから、もうオセロは問題にならないステージに達している。
> 8×8盤
>
> 8×8盤オセロのゲーム木のサイズは10^54ノードと推定されており、
> 合法的なポジションの数は10^28と推定されている。数学的には未解決であるが、
> 速い並列ハードウェア上あるいは分散コンピューティングを通じたプログラムによる
> 徹底的な計算を行うことで解を見つけることは可能かもしれない。
>
> 一部の強豪プログラムは長年自身のデータベースを拡張してきた。
> 対角、垂直、平行の23つの主要なオープニングに関しては、対角オープニングと
> 垂直オープニングは引き分けの筋へ至る傾向にあり、一方で平行オープニングは
> 黒(先手)の勝ちとなる。引き分け木は、垂直オープニングの後よりも
> 対角オープニングの後の方が大きいようである[13]。平行オープニングは
> 黒(先手)に非常に有利であり、完璧に打った場合は常に勝つことができる[14]。
> 証明されてはいないが、実質的には双方のプレーヤーが完璧に打った場合は
> 試合は常に引き分けとなる。標準的ゲームでは、オープニングブックを使用することで、
> トッププログラムの勝率は99%を超える。
549 名前:名無し名人 (ワッチョイ 7fb3-sJj3)[sage] 投稿日:2017/11/13(月) 12:45:27.37 ID:QBnyEln60
今回の電王トーナメントでの収穫は、引退する山本一成から↓の発言が出た事だな。
以前から言われていた事ではあるが、将棋も暗記ゲーの時代に本格的に突入か。
30 名前:名無し名人[sage] 投稿日:2017/11/12(日) 16:30:03.16 ID:ILaYswGe [1/5]
定跡が進みすぎると、オセロのようになるのか
オセロは定跡だけになってるらしい
山本の話は興味深いな
256 名前:名無し名人[sage] 投稿日:2017/11/12(日) 17:10:11.32 ID:qYiaoJcH [4/5]
昔
山本「定跡は弱者の戦略」
今日
山本「定跡で勝負が決まるとか将棋の終わりが近づいている」
551 名前:名無し名人 (ワッチョイ 7f1e-fv10)[sage] 投稿日:2017/11/13(月) 12:52:52.36 ID:dd1rb9En0
>>549
人間の間では暗記だけでは絶対に勝てないから影響はない
コンピュータは普通の初形からの対戦がなくなるってだけ
553 名前:名無し名人 (ワッチョイ 7fb3-sJj3)[sage] 投稿日:2017/11/13(月) 12:55:18.07 ID:QBnyEln60
>>551
ただの暗記だけではなく、
プラスでプロ棋士やアマ高段くらいの棋力があれば、影響は大アリでしょう。
554 名前:名無し名人 (ワッチョイ 7f1e-fv10)[sage] 投稿日:2017/11/13(月) 13:01:00.56 ID:dd1rb9En0
毎回相手に二つの選択肢があったとすると60手まで暗記しようとすると
10億の変化を記憶しておく必要があるんだけど
556 名前:名無し名人 (ワッチョイ 7f9d-VvNY)[] 投稿日:2017/11/13(月) 13:15:27.55 ID:vtxX7Gkw0
>>554
実際は優勢になる変化は覚えるのは途中までで良かったり、
手順前後の同一局面や
部分定跡とかも使えるから対人でも有効 将棋の完全解析とか永久機関の発明を主張してるようなもんだし誰もまともに取り合わんぞ >>675
GW5.0.5の導入方法のページで「godwhale_child-evalmerge.exe」を選択しろと
なっていたからだけです。godwhale_child-tournament.exeに変えて、
すべてPonder Offの設定しなおして1秒設定でやり直してみます。 >>683
どうせやるならuuunuuunさん基準1500万〜2000万ノードでやったらいいのに、
数百万ノード以下の計測は1500万ノードとは逆の結果が多いので参考にならない せっかく1500万ノードでの膨大な対局データがあるんだからそれと比較もできるように同じ条件でやるのがいいよね
検討用途のことを考えて長時間でやるのももちろんいい、対局数が確保出来るくらいの余裕があればだけど NNUEkaiの作者さんが1500万ノードと1億ノードの勝率の違いを検証していたので興味深い記事だと思う
詳細はTwitter見た方がいいかも
1手1億ノード500局が終了しました。
QQR/YO4.82 vs AperySDT5/YO4.82(1手1億ノード、投了値3000、引分け256手)
293-19-188(勝率60.5%、R差74.1)
uuunuuunさん(@uuunuuun1 )のレーティングサイト(1手約1500万ノード)によれば、
QQR/YO4.82=4234
AperySDT5/YO4.80=4162
AperySDT5/YO4.82=4137(ただし、対局数が322局と少なめ)
というレーティングになっており、上記1億ノード対局の結果と大差がないのではないでしょうか。
今回の結果から、現時点において、私は、ソフト間の強さを計測する際には、1手1500万ノードの計測で十分であると
考えています。また、1手何ノードが必要だと考えられるのかについては、いずれ計測しようと思います。 200万ノードぐらいの結果は意味ないので検討するだけ無駄 意味ない流れで低ノードで32時間くらい回してみたわ
こんな感じになった
R4260 dolphin2/NNUEkai5
R4230 dolphin2/illqha1.1
R4210 GW7/NNUEkai5
R4210 dolphin1/illqha1.1
(やねうら4.74/elmo27R3800、技巧2R3710の独自基準) >>686
更に調査が進んで100万ノードでも十分という結果が出たらかなり楽になるね >>689
既にロタさんやuuunさんが調べて100万ノードでは不十分という結論が出てるよ >>689
100万~200万ノードと1500万ノードでは逆の結果になることが多いので、仮にソフトAが100万~200万ノードと1500万ノード
でほぼ同じ結果になったとしても、ソフトBでは逆の結果になることもあるので、100万~200万ノードの計測でOKということには
ならないよね >>688
dolphin2が少しだがちゃんと強くなってそうなのがわかるな 100万だの1500万だの、勝手に決めた数字が一人歩きしすぎ
各ノード域で差が出たとして
・二項分布の揺らぎにすぎない
・そもそもエンジンの時間制御が不正確
・単なるノード間の相性問題
以上の点についてはどう解釈するつもりなんだ? >>692
ちなみにdolphin2/illqha2も一応計測はしたのですが… >>693
その考えだとソフトを選択する計測をどうすればいいのか基準が一切ないので次から次へと公開されるソフトを決められなくなるが
あなたがソフトを選ぶ計測方法を教えてくれないとただの批判者になるが ノード数いくらで検証すべきか問題は個人に任せればいいと思っているが、
ノード数による各ソフトのR差の変化の件と、二項分布云々による対局数不足の件は一緒にして欲しくない >>694
illqha2は微妙そうだと作者も言ってたしまあそういうことなんだろう 低ノードなら微妙やけど高ノードならillqha2も同等に強いで >>693
その考え方では細かく1000万1100万1200万・・・・1億1千万1億2千万・・・・10億1千万10億2千万って
細かく1000万単位くらいで各500局計測しろって受け取ればいいのかな?どう考えても無理じゃないの? >>684
ノートPCの人にそんなこと言いますか?
1手30秒かかるわけで・・・
1手1秒で対戦すると150手平均で2分半。
450局やるのに900+225=1125分=約20時間かかります。
これが30倍になると600時間ですよw
25日ぐらいかかってしまいます。
専用のデスクトップパソコンを持ってる方にお任せします。 ■ このスレッドは過去ログ倉庫に格納されています