コンピュータ将棋スレッド142
■ このスレッドは過去ログ倉庫に格納されています
NNUEkai6がillqha1.1に勝率55%、QQRに勝率62%みたいだぞ nnuekaiさん
https://pbs.twimg.com/media/DlxcOo-U0AA40A9.jpg
この前の王位戦の封じ手局面からの指し継ぎ、同じソフトにしては勝率偏ってない?
お互い先手75局後手75局で対局させてると思うんだけど illqha1.1から随分経ったしそろそろ明確に超えるのが出てくる頃だわな >>73
こういった馬鹿は恥ずかしくないのが凄いw
アドバンテージだって?
何の証明もされてないfloodgateにも検討にも使えない低ノードで調整したのをありがたがる馬鹿
floodgateで誰も使ってねえし検討で使うもの好きは糞スペ馬鹿しかおらんのよ >>75
作者です。
はい、偏りがあることはそのとおりです。150局くらいの対局数だと稀によくある現象です。 >>80
どうも
同じソフトでもこんだけ偏ると計測大変ですね >>81
正直疑心暗鬼がすごいです。何度も計測を繰り返してると、95%信頼区間の壁なんて、すぐに超えてきます。
そろそろ、1500万ノード対局が必要なんですか、500万ノードじゃ駄目なんですか、という点に関して調査をしたいと考えています。 >>75
えっ?
これで偏りがあると感じちゃうんですか
100局ぐらいやったらプラマイ10勝(20勝幅)ぐらいの差は普通という感覚にならないと計測なんてできない 200戦やって100勝100敗だったとすると99%信用区間で82〜118勝までブレるからね
ブレと冷静に向き合わないと計測なんてできないわな floodgateでの証明という点では
NNUEkaiとGW3の組み合わせが未だに最高レートだから
長い持ち時間の対局ではそれがベストなんだろうね >>85
ネタじゃないよな?
水門のレートは対局数少ないし200くらい平気でブレる >>86
平気でブレる割には2ヶ月以上超えられないのは不自然でしょ
3位もGW3だから偶然にしてもGW3を使った時だけ連続して上にブレるとか変だし >>89
そこそこ高いレートを持ってるソフトがいくつかいるときにR4300くらいの組み合わせで潜ってみたら?
i9-7960X以上のスペックで定跡もそれなりにいいやつ使ってね
さらに30局くらいの対局の中で運良くあんまり負けない方にブレる
そしたら軽く超えると思うよ、でもそれをやる人がいないからずっと1位
つまり圧倒的に強いのかは謎 >>91
c-book最新のとNNUEkai定跡が短時間では強いぞ
長時間は分からん 横歩で嵌められて一方的に負けるとかそういう変な変化がないってことかな?
次のWCSCは定跡ゲーにならなければいいが NNUEkai定跡なんてあるの?
あとC-bookって勝利至上定跡なのか? C-book20180802でfloodgateに流してみればいいと思うんだよな。 >>94
my定跡は今年WCSC28以降のフラットゲートからR3500以上の勝ったいい評価値グラフのものだけを選りすぐり大量に集めたもの、
しかし自身作の定跡がNNUEkai定跡に負け越したのでがっかりだわ
NNUEkai定跡120手まで使用 243-27-230 my定跡120手まで使用
一手0.1秒 2スレ Hash256 投了値2000
対局数500 勝率51%
C-book_20180802定跡120手まで使用 244-25-231 NNUEkai定跡120手まで使用
一手0.1秒 2スレ Hash256 投了値2000
対局数500 勝率51% C-bookは悪い変化も入っているとニコ生で千田六段自身が言っていた気がする
そのあたりは設定次第 NNUEkai定跡ってどこにあるんですか
ググってもまふ定跡だらけでした たややんさんの仰る通り、C-bookは網羅的な定跡だと思うんだよな。 そもそも千田先生がソフト同士の対局用じゃないって言ってたしな でも>>96を見ると、結果として白黒定跡より勝ってるのは興味あるな
白黒はまふ定跡に対して完全にスナイプできてるみたいだし >>105
自分もC-bookは最新版でも対局用には向いていないと思っていたが、実際に興味本位で対局したらNNUEkai定跡に勝ち越したのが
意外だった 今のNNUEならまふ定跡は定跡オフにも負け越しそうw まふ定跡はちょうどいいサンドバッグって
WCSCでだれか言ってた フラットゲートの成績が良いようで今度のkai6のバージョンは期待できるかも
1位 NNUEkai6_dolphin2_i9_7960X R4362 31-2
2位 NNUEkai_GW3_i9_7960X R4342 25-1 解析って普通depthで指定するものかと思ってたわ 山下さんが前に棋譜解析によって棋力を推定するってのやってたけど、
BonanzaやGPSでは今のトップソフトは悪手連発、雑魚ソフトって解析されてしまい、
やっぱり自分(解析ソフト)より強い対局者の棋譜解析は正確にはできないみたいだから、
とりあえず対象の棋譜より上のソフト・環境で解析することは必須だと思う 20万ノードだと24のレートで3000を越えるみたいだから
プロの棋譜解析をしないならこの程度でも十分 >>122
とても参考になります
次はkai6との相性最強エンジン決定戦もよろしくお願いします >>124
明日からKai6を追加してやり続けます。 >>122
ditto4とditto4Sの違いって何ですか? >>122
下の方のリンク、上位陣の合計対局数間違ってない?
右端の36局プラスして148では? >>126
> >>122
> ditto4とditto4Sの違いって何ですか?
短時間特化v1.txtです。
実際はこの部分が違っているだけです。
なぜ短時間バージョンなのかはわかりません。
https://i.imgur.com/dvCczxL.png 公開ありがとうございます。おつかれさま > NNUEkai6 https://www.chess.com/computer-chess-championship
LeelaChessZeroがSF、Houdini、Komodoと引き分けて、もうトップエンジンレベル、トップ5が無敗
50手ルールをバグで全く学習してない
マルチGPUで速度出ない状況で LeelaShogiZeroはいつ頃登場しそうですか?🤔 Stockfishの上に成り立っていると言っても過言ではないコンピュータ将棋のスレで、
コンピュータチェスの話をするなとはこれ如何に
LeelaZero式分散コンピューティングがチェスでも有効ならば将棋にも十分期待できそうだ
個人のリソースで学習を回すのはもう流石に無理がある チェスの本スレはたぶんないと思うが、居場所がないからといって将棋のスレに来るのはおかしいだろ
チェスのルールも知らんし知りたいとも思わんが 日本の文化にチェスはなじまないしな
あの倒れそうな駒みたいな外観が好きじゃないわ 誰かが弄ったソフトを検証(笑)するより遥かに有意義よな illqha2.1もそろそろ....(作者が台風や地震の被害を受けていなければ) illqhaやNNUEkaiの作者の人が計測した結果よりロタ氏の計測はほぼ同じノード数なのになぜか差が
小さくなるね、スレッド数やPC環境の違いも関係があるのかな、前から気にはなっているけど >>143
チェスやシャンチーの駒の動かし方や基本戦略は知っておくべきです。 >>148
NNUEkaiの作者もResign3000だけど >1000局でも微妙な棋力の差は計測するのに十分ではない。
by やねうら王 >>138
CrazyShogiが企業案件らしいし、たぶん来年には結構な完成度になってるでしょ 囲碁のCrasy Stoneの人か。じゃあアンバランスから発売かな?
あそこの会社将棋に関しては金沢将棋止まってるからな。 kai6もillqha1.1と誤差レベルだとすると
期待出来るのは学習手法が違うillqhapaqくらいかな
あとはもう頭打ちという印象だね 別にkaiに勝てなくてもillqhaはillqhaでリリースしてほしいんだがなあ 結局nnue絞りも停滞
今後の進歩はGPLライセンスに従って公開されるQhapaqのソースコード次第
次回の選手権の予選突破条件は
自力で河童絞りをKPPTからnnueに移植出来る人になるから
ライブラリコピペ大会ではなくなりそう 誤差レベルの評価関数情報より、fishtestの結果の方がレートに影響する、ガチで 3駒の壁がR4200ならNNUEの壁がR4300なのか、R4400は相当ハードルが高いぞ 昨日までのリーグ戦結果から
https://i.imgur.com/1SmVXJ7.png
https://i.imgur.com/24wtByG.png
新参のKai6を加えて12SEEVによるリーグ戦を開始しました。
今のところは違いが分かりません。
第一ラウンドが終わったらまたお知らせする予定です。
SE01_EV04_dolphin1_Kai6
SE02_EV04_dolphin2_Kai6
SE03_EV04_nnue-w7-ditto3_Kai6
SE04_EV04_yo_nnue_w7_ditto4_Kai6
SE05_EV04_yo_nnue_w7_ditto4S_Kai6 まだ始まったばかりで何とも言えないけど今のところ
Kai5との違いは見られない・・・
https://i.imgur.com/4uas77L.png ditto4Sの場合って設定v1使ってるの?
doukonだと4と4S変わらんよね >>162
> ditto4Sの場合って設定v1使ってるの?
> doukonだと4と4S変わらんよね
doukonって何?
過去ログで短時間用の設定ファイルを公開したときのものです。
ファイル名は短時間特化v1.txtです。
exeはYaneuraOu-NNUE-whale7_Ditto4-avx2.exeを使い
ditto4_engine_options.txtの中身を少し変えたものです。
ファイル比較すると若干の違いがあります。
https://i.imgur.com/dvCczxL.png
===
12局消化した段階ではKai5の評価関数との違いはあまり
見られません・・・
このリーグ戦が終了したらノード数固定で対戦させる企画で
やってみようかと思ってます。
https://i.imgur.com/P1FxzFv.png >>163
すまん勘違いだった
引き続き検証よろしこ Kai5の成績だが悪くはないがよくなっているかどうか
微妙な感じだ・・・
次はすべてノードの深さ13指定で対戦させてみる。
https://i.imgur.com/yaHNHow.png >>165
> Kai5の成績だが悪くはないがよくなっているかどうか
> 微妙な感じだ・・・
> 次はすべてノードの深さ13指定で対戦させてみる。
>
> https://i.imgur.com/yaHNHow.png
Kai6の間違い 深さ固定は枝狩りしない方が長い時間考えられるから有利だけど
データとしては興味があるな
確かDolphin2はDepth8だか10だかに最適化されてたはず kai6とillqha1.1をdolphin2でテスト対局中ですが、ノード4~500万だと互角でノード1500~2000万だとkai6が優位に展開してます NNUE KAI6は、illqha2に対して勝率46%くらい。ちなみに1手3秒8スレッド 150戦
有意差はない ■ このスレッドは過去ログ倉庫に格納されています