▲コンピュータ将棋スレッド141
■ このスレッドは過去ログ倉庫に格納されています
TCECの同点のときの順位決定法ってSB優先じゃなかったんだな
1.クラッシュ数(少ないほうが勝ち抜け)
2.直接対決の成績上位
3.勝ち数の上位
4.後手番での勝ち数の上位
5.SBの上位
6.主催者の判断
TCEC 13の3部リーグは8エンジンによる4回戦総当たり全28回戦が終了し
Etherealが17勝0敗11分の22.5ptsで無敗優勝を飾った。
2位はArasanが9勝5敗14分、LeeraChessZeroが7勝3敗18分の16ptsで並んだが
直接対決で1勝3分と上回ったArasanが1期で2部への復帰を決めた
なお、3部リーグはずっとGPUの熱トラブルが続きLeeraChessZeroは実力を発揮
できなかったもよう。冷却と電力消費の問題を克服した20回戦から猛烈な追い上げを
開始したが、Arasanとの直接対決差に涙を飲んだ
やっぱNN勢を大会に出すってのはなかなか大変みたいね 今やってる議論とは別だけど、
高ノードだろうが、低ノードだろうが、
そもそもノードを固定して測定するってのが疑問
それが平等な条件なの? ノード数固定という意味ではなく大体どのくらいのノード数になるように秒数で固定という意味合が多いと思うのだけれど いつものテスト対局です
ノード5〜600万
対局数500 先手勝ち243(54%) 後手勝ち204(45%) 引き分け53
dolphin2+kai4
勝ち247(55%) 先手勝ち135(59%) 後手勝ち112(50%)
dolphin2+kai5
勝ち200(44%) 先手勝ち108(49%) 後手勝ち92(40%)
ノード2000〜2500万
対局数100 先手勝ち48(55%) 後手勝ち38(44%) 引き分け14
dolphin2+kai4
勝ち58(67%) 先手勝ち30(75%) 後手勝ち28(60%)
dolphin2+kai5
勝ち28(32%) 先手勝ち18(39%) 後手勝ち10(25%)
ということで、私の環境ではdolphin2+kai5はあまり良い結果は得られませんでした >>514
1500万ノードって記載があるのは全て大体1500万ー2000万ノードの範囲に収まるように秒数を固定したものでノード数固定ではない
そのため違うエンジンで対局する場合秒読みなのでノード数が違ってくるのは当然で、このスレでのノード数固定計測の話は100万ノードの人くらい
じゃないだろうか >>518
あそうなのね、勘違いしてたわ
ところで、kai5やdolphin2illqha2が自身の前バージョンよりも
強くなってるかどうか確認できないんだけど、
スレ全体的な評判としては、どうなってる感じなんでしょうか? dolphin1.1/illqha1.1とdolphin2/illqha2は僅差な気がするわ >>517
むしろdolphin2+kai4 が結構強いということ言えない?
dolphin2+illqha1.1もなかなかということだから、
「dolphin2が優秀&1つ前の評価関数と好相性」じゃないだろうか めきっと@鵺日々成長中@_illqha
illqha2、もしかしてほとんど強くなってないですかね?
あまりに微妙そうだった場合、修正版として来週末くらいにillqha2.1を出すかもしれません。(illqha2の詳細な計測等はちょっと様子見していてもらったほうがいいかもしれないです)
illqha2弱いぞという方はどんどん教えてください。
めきっと@鵺日々成長中@_illqha
返信先: @Rota_JPさん
はじめまして。いつも計測してくださってありがとうございます。
QQR+GWに対してさすがに少し勝率が低すぎますね。
過学習している感じではなかったので原因を突き止めるまで時間がかかりそうです。
おそらく修正版のillqha2.1を作成すると思いますが、その際は対QQR+GWの勝率をやや重要視してみます。 >>522
私の環境ではdolphin2とGW7を直接対決させると
GW7が勝ち越すけどねillqhaでもkaiでも GWシリーズは短時間に強いように調整してるはず
そのせいでは >>199
ど来年5月には16コアのCPUが5万円弱で買えるという予想ってのは誰の予想? ほんとAMDが頑張ってくれて良かった
Ryzen登場以前のコア数の鈍化は今思えば異常 >>525
私もGW7は優秀な気がする。
同じ結果が出た。 >>525
>>531
ちなみにノード数はどんなもん? 短距離走者と長距離走者みたいに得意な思考時間があるんだろうね 夏休みか何か知らんけど
基本的なアルゴリズム知らない中高生が増えたのかな
古い本で良いから基本的木探索勉強したら? 30すぎたオッサンだけど一週間前からAtCoder登録してみて絶望したわw
開発者はこんな奴と戦っていたのか・・・
単なるミニマックスのゲーム木探索だとビギナーコンテストのCの過去問だと今日気づいてさらに絶望した >>536
ある意味こういう競技性的なものが出来る事によって、上にいる奴はさらなる上を目指すけれども
それより中よりも下にいる奴はもうはなから諦めてそもそもプログラミング自体辞めるという事態とかもありえそう。
格ゲーの世界がまさにそんな感じだからな^^; >>532
>>525の場合 ノードはチェックしていないが i7-8700kで1手10秒 アルゴリズムと言う言葉すら知らないのが
ウヨウヨしてるからなw >>538
一手6000〜7000万ノードくらいか?すごいな
1日に50局もできないんじゃないかそれ
今勝率はどれくらい? 基本的にここの連中も
DLしてポチポチクリックするだけで出来る検証作業
これでしか盛り上がれないからね
何のスキルも持たない人間だと告白してるも同然よ まあ正直な所、電気代の無駄だよな
検証でできた棋譜を集めて更に学習させるならまだしも 検証作業とかやったことないけど全く同じの対戦させても結構勝率ばらついたりするんじゃないの
確かにあんまり意味なさそうな気がする 趣味なんて総じて無駄なもんよ
周りがごちゃごちゃ言うもんでもないと思う テスト対局です
1秒でスレッド数を変えてノードを変化させて対局させてみました
書いてるノード数はdolphinのものでGWは2〜3割増しです
1T(4〜50万)
対局数500 先手勝ち253(52%) 後手勝ち230(47%) 引き分け17
GW+QQR
勝ち295(61%) 先手勝ち155(63%) 後手勝ち140(58%)
+illqha1.1
勝ち188(38%) 先手勝ち98(41%) 後手勝ち90(36%)
2T(80〜100万)
対局数500 先手勝ち285(59%) 後手勝ち195(40%) 引き分け20
GW+QQR
勝ち264(55%) 先手勝ち155(64%) 後手勝ち109(45%)
illqha1.1+dolphin
勝ち216(45%) 先手勝ち130(54%) 後手勝ち86(35%)
4T(160〜200万)
対局数500 先手勝ち268(56%) 後手勝ち207(43%) 引き分け25
GW+QQR
勝ち257(54%) 先手勝ち147(60%) 後手勝ち110(47%)
illqha1.1+dolphin
勝ち218(45%) 先手勝ち121(52%) 後手勝ち97(39%)
6T(300〜350万)これはPCが異なります
対局数500 先手勝ち269(56%) 後手勝ち203(43%) 引き分け28
GW+QQR
勝ち225(47%) 先手勝ち130(54%) 後手勝ち95(40%)
illqha1.1+dolphin
勝ち247(52%) 先手勝ち139(59%) 後手勝ち108(45%) >>542
ここをどこだと思ってるんだ
東大と激指とAIとどれが一番強いかわかんなかった頃からすると
自分で納得してソフトを選んでる分ずっとマシになってるわけだが >>549
こんなところに投下するレベルじゃないようなすごく良いデータだな
NNUEはノード数が極端に少ないと力を発揮できないのかな
dolphinがという可能性もあるけど >>551
というか低ノードだとちょっとしたノード数の差で深度が変わるからでしょ スマホのアプリの将棋データベース2で評価値が出るのですが、
何というコンピュータ将棋を使用して
1手何分考えさせているのですか? >>552
ロタさんの計測だと1500万ノードくらいだと56%くらいになるみたいだし、5000万ノードくらいの結果でも伸びがあればいい感じのグラフが書けそうじゃない? >>549
本当にこんなに差が出るんなら実行環境への依存性はすさまじいな
他人の検証と一致させる方が難しいレベル elmo絞りのときも魔女が出てきたときもノード数で随分変わったし今に始まったことじゃないんだけどね
まあそれなりに多いノード数で強い方が有用な気はするけど どのソフトが強いか500局対戦させてテストするとなると1手1秒はやむを得ないだろうね
でも、昨日のプロの棋譜を解析するのに使うときは1棋譜に5分くらいは平気だから、欲しいのはその場合でも強いソフトなんだよな
ShogiGuiでは探索深度を固定して解析できるようになっているよね
例えば、探索深度を17手で固定して解析してみると、中盤以降は1000万単位のノードで、終盤には1億ノード以上読んだりするわけよ
そういうわけで、必要なソフトは探索深度17で最も信頼できるソフトだったりするんだよな
信頼度が同じなら解析が速いソフトのほうがいいけど、信頼度が違うなら、1棋譜の解析に1分遅くても信頼度が高いソフトを選ぶよ >>525
>>531
Ditto2添付のengine_optionsのPARENT_NODE_GAMMA2を150に修正したのを適用して以下floodgate
と同じ一手ごと加算方式で計測した、Ditto2で14秒あたり2330万ノード、自分の環境ではdolphin2の方が強みたい
dolphin2/illqha2 26-12-12 Ditto2/illqha2 対局数50 勝率64%
持ち時間7分 一手ごとの加算14秒 定跡なし 2スレ Hash1024 投了値1000 1000でもそこからの期待勝率で言えば85%くらいだしそんなに気にするほどでもないと思うけど 昨日やった0.1秒1500局と今日やった0.1秒1500局で、勝率結果が2%強違ったが
冷静に計算してみれば別に普通の事だった。 やらかしは評価がだいたい1000から2000の間で起きる
以前ほどではないが今でもときおり起きる
1000で切るとそういう情報はほとんど拾えない あくまで目的がレーティング調査ということであれば、
そういった逆転劇は統計的に無視しても問題なくて、
その分浮いた時間を、対局数の多さに費やした方が、
統計的にはより信頼性の高い結果が得られるという主張ではないのか? まーもし序盤中盤強くて終盤だけボコボコのソフトがあったとしたら、
1000で投了させた場合と最後までやった場合で結果は違うだろう。
途中で投了させて結果に影響ないことを確認する術は俺にはないので、俺は最後までやらせてる。 実際トップソフト同士だと1000からの逆転はマジでほぼない おーい。鍵かけてないでコメントしろよな。
333 名無し名人 sage 2018/08/21(火) 20:43:24.47 ID:+NcY+lso
2018.08.21
「コンピュータ発!現代将棋新定跡」についてのお詫び
将棋書籍編集部
2018年6月に発売しました「コンピュータ発!現代将棋新定跡」において、参考文献として挙げた千田翔太六段が作成した定跡(「C-book_2017」など)の手順と同一の部分がありました。
その他にも参考文献からの引用が多く、差別化が行われておらず、誠に申し訳ございませんでした。
同一部分は以下のとおりです。
「コンピュータ発!現代将棋新定跡」
第2章 角換わり▲4八金
第3節 ▲4八金・△6二金(▲2五歩型)
p.100〜p102、p.106〜p108の本手順 ハイスペPC持ちで時間もたっぷりかけられるなら投了までやるにこしたことはないと思うが中々そうもいかないからな stockfishからコードを引っ張って来て再調整(末尾のtはテスト用の名前なので中身は同じ)
https://i.imgur.com/GdFaIBD.jpg
外出先のPCでのテスト対局
他の持ち時間では弱体化している可能性もあるので注意
https://1.bitsend.jp/download/c149b30d25d1fc6fe122e277a9ba431a.html
>>498
トーナメントエディションでしかコンパイルが通らない状態になっていました
単純な修正をしたらほんのり勝率が落ちたので(有意差は取れない程度)
こちらのDitto3の方をコンパイルしてみてください nVidiaがTensorコアを載せたRTX20xxシリーズを発表したが
将棋AIの世界じゃGPUって下火なんだっけか >>569
なにこれ?
スイモンは名前だけじゃなくてチダショーの定跡からパクッて書籍化したって事か? >>573
定跡や棋譜に著作権は無いのでおk
てか角換わり最新系なら他にも本出てたと思うし suimonに興味があるならこっちに本スレがある
「suimon_feat.anti_suimon応援スレッド17」
https://mevius.5ch.net/test/read.cgi/bgame/1533862279/ >>574
著作権云々はあえて議論しないけど編集部が謝罪だしたって事は不味いんじゃないの?
スイモンに興味はないからスレ覗いてまで知りたくもないけどフラゲのPVパクッて悦に入ってる
ソフト指しがスイモンだから4ねとしか思わん suimonの話はsuimonに興味がある人以外はどうでもいい話なので本スレでやってくれ >>576
棋書書くのに棋書パクってるのもあるし
その辺の将棋界のスタンスってテキトーなのよね
渡辺明ブログ
https://blog.goo.ne.jp/kishi-akira/e/d666fafdee8261f0d73f0ce7ca68328c
2017-11-18
浅川書房から2005年に出した「四間飛車破り」が数年に1回、増刷になるので送ってもらうんですが、
あれ以来、定跡書は書いてないので執筆当時のことを思い出すと懐かしいです。
今と違って強いソフトが無い時代なので定跡書に書く検討は自力で行わないといけないので
大変で【急戦編】では藤井九段の「四間飛車の急所」がとにかく参考になりました。
あれはすごい本だと思います。 C-bookに千田さんがすべての手に解説文つけて出版してくれたら全部解決
12,000円まで出す こっちの方がこのスレ的には大ニュース
Ryoto_Sawada@Qhapaq@Qhapaq_49
レーティングサイト。後継者募集中なら引き継ぎますよ(ただし私のdjango歴は一日ですが >>579
手の数が尋常じゃないからそんなことしたら1冊10万とかになりそう
そもそも解説付け終わる前に定跡事情がそこそこ変わりそうかな、NNUE出てきたし >>580
澤田さんなら色々面白い機能つけてくれそうだし安心だ >>580
Qhapaqさんなら引き継ぐにふさわしいと思いますね
何か新しい要素も付け加えてくれるかも知れませんし >>571
おつかれさまです。試してみます。
SSE4.2版もいただけると助かります、 godwhale_child-NNUE-whale7_Ditto3 の SSE4.2版です
https://1.bitsend.jp/download/c1c174889eeec634c60a78e12d34b16a.html
engine_options.txt は入っていないので、注意してください 訳の分からん調整したエンジンありがたがるアホって何なの?
実践から(検討)かけ離れた短時間に調整したり計測範囲で優位を出したいだけ
少し前のキメラと同じでろくに検証もしない物を適当な使い方でありがたがるアホ多すぎ >>588
有り難がると言うより、作者が検証しきれない点も検証されるから、興味のある人には公開は良いんじゃないかな
興味ないなら無視すれば良いのだし
できが悪いと思うのなら自ら検証すれば良いだけ >>588
訳のわかる調整と訳のわからない調整の違いがイマイチわからないが 今のソフトからコマ割りの値を算出する方法ってある?
NNUEになってからどうなったか見てみたいんだけど
できれば局面Aの評価値と局面Bの評価値の比較みたいな感じで出せるとより嬉しい 評価値を元にコマ割りだけでパラメータ調整するとかかな
コマ割りだけでの評価関数を作るって感じで
こういうのじゃない? >>593
https://github.com/yaneurao/YaneuraOu/blob/master/source/evaluate.h
駒割りは89行目からの数値で固定だと思うんだけど
PawnValue = 90,
LanceValue = 315,
KnightValue = 405,
SilverValue = 495,
GoldValue = 540,
BishopValue = 855,
RookValue = 990,
ProPawnValue = 540,
ProLanceValue = 540,
ProKnightValue = 540,
ProSilverValue = 540,
HorseValue = 945,
DragonValue = 1395,
KingValue = 15000, >>597
これってこの数字変えると評価値もかわるの? >>597
変えた数字の分だけ評価値も変わるだろうけど、変えた後に学習やった場合は、変える前の評価値に近付くように収束すると思う。
学習せずに駒割りのみのソフト作るなら、bonanzaみたいに金より成金の数字を大きくした方が良いんだろうね。
bonanzaはやねうら王と違って学習で駒割りも変動するけど、特に「と金」の価値が自動的に大きくなっている。 じゃあ評価値が全体的に大きく出すぎて困るとかそういう現象が起きたら一応調整はできるのか >>549の勝率がノード数に依存しすぎなのをみて、時々回してたものの途中報告
(この後0.5秒,1秒もやるつもりだったけどこの結果だと途中で投げ出しそう)
エンジン:>>258を落としたまま使った(=およそDolphin2のengine_optionsだが一部間違っているらしい(>>269))
評価関数:NNUEkai5(>>279)
エンジン:GodwhaleChild-5.0.5(選手権あたりからあるもの)
評価関数:QQR
・4T 0.1秒(ノード30-50万程度?)
3071局 1796勝 1275敗
勝率: 0.5848257896450667
標準誤差: 0.008893948764004796
95% 信頼区間 [0.5672419407359166, 0.602084011722566]
相対イロレーティング: 59.51845902452462
標準誤差: 6.363294768915171
95% 信頼区間 [47.00926789156493, 71.94628210105508]
4T 0.2秒(ノード60-100万程度?)
3111局 1784勝 1327敗
勝率: 0.5734490517518482
標準誤差: 0.008869264257160205
95% 信頼区間 [0.5560912889746062, 0.5908068145290903]
相対イロレーティング: 51.409570870267466
標準誤差: 6.298920784965844
95% 信頼区間 [39.14096982006567, 63.80684135857484]
感覚を裏切らず、ノードが2倍になった程度では3000局やっても勝率に差があるとまでは言えず。
しかもQQRとの差が縮まる方向だが、uuunuuunさんの4T5秒相当でR差30ちょいなんだから縮んでいいのか。 100万ノード以下の計測って統計数は取れるけど実際にそのノード数で使うことは検討などでもあまりないし
ソフトを選ぶ参考にはならないと思うが >>604
ノード数がもう少し離れてないとやる意味が薄い気が >>554
5000は時間がかかるので3000〜3500万でテスト対局してみました
対局数300 先手勝ち165(58%) 後手勝ち117(41%) 引き分け18
GW+QQR
勝ち121(42%) 先手勝ち75(51%) 後手勝ち46(33%)
dolphin+illqha1.1
勝ち161(57%) 先手勝ち90(66%) 後手勝ち71(48%)
1500万とほぼおなじです
1500万は悪くないノード数の気がします
先の300〜350万と1500万の間を少し埋めてみます >>610
需要が有ればupしても良いのですが、需要は無いのでは
今回はタイプの違うエンジンを使って、ノード数での勝率変化をテストしてみる物なので 1500万ノードは、棋譜の検討で終盤の指し手が悪手なのか最善手なのかを確定させるノード数としては足りない
よって、1500万ノードの勝率テストでは、どのソフトが検討用に一番適したソフトかまでは分からない ■ このスレッドは過去ログ倉庫に格納されています