▲コンピュータ将棋スレッド137
■ このスレッドは過去ログ倉庫に格納されています
TanukiColiseumは開始手数8では差が出なかったけど
開始手数24にしたらTNKが有意に強かった
https://i.imgur.com/NufUBm2.jpg
自分の環境で計測できるのはここまでだね
あとはハイスペックPC環境の人の報告待ち そろそろ評価関数の分解能(歩の100分の1)が限界なんじゃないかな
10点〜20点で刺し合いしてるときに誤差0.5が50回も積み重なると吹き飛ぶわけだし >>57
その時代のハードでできるだけ長時間で対局させようってだけの話
未来になってハードが進化してもも無理のない範囲で長時間で対局させるべきでしょう 極限的には評価値は3値でいいわけだから、違う局面で同じ評価値ってのがあっても別にいいわけで、解像度は特に問題にならなくない? 一歩=100はあくまで表示の時の話だからエンジン内部はどんな値でもいいんだよ
実際Aperyと互換性のあるやねうら王系は内部で一歩=100ではないし 内部計算は整数で行われるがオーバーフローとの兼ね合いをみつつスケールされている 分解能は1より小さい
いわゆる固定小数点計算というやつだ なんもわからず分解能云々言うの、やねうらおブログのyakitoriって奴思い出す
ttp://yaneuraou.yaneu.com/2017/08/29/eta可変絞りについて/ >>59
whale3はTNK_v1.0より強いが、whale5はwhale3より弱くなっているので、whale5の再検証が必要では
設定 16万ノード 定跡なし
TNK_NNUE_whale3 vs TNK_v1.0
対局数200 whale3側の104勝89敗 引分7 勝率53%
TNK_NNUE_whale4 vs TNK_v1.0
対局数200 whale4側の108勝88敗 引分4 勝率55%
TNK_NNUE_whale3 vs TNK_NNUE_whale4
対局数300 whale3側の151勝137敗 引分12 勝率52%
TNK_NNUE_whale3 vs TNK_NNUE_whale5
対局数200 whale3側の104勝85敗 引分11 勝率55% 3スレ1手1秒にしたけど
他ソフトへの勝率が大きく落ちる様子はなかった
現状測定されている中では一番レーティングの高い
qhapaq + やねうら王オリジナル4.82の組み合わせを相手に計測
PCが使えなくなるのでギリギリで有意差がありそうな付近で打ち切り
https://i.imgur.com/mTCjkqk.jpg
棋譜 https://1.bitsend.jp/download/6f2c1dba3ec7f2a50536f878d03f0b37.html
>>67
検証ありがとう
whale5はベンチマークの相手をelmoにしていたから相性が強く出ている可能性はあるかもしれない Qhapaq優勝か、これで心置きなくNNUEに移行できるかな NNUEのような省メモリは対局後でもパソコンがサクサク動くので理想的 >>61
1手10秒の勝率の真値を推定するには、1手10秒それ以上でも以下でもない条件での計測が必要なだけで、
0.1秒なら0.1秒の、持ち時間1時間なら1時間の真値が得られるわけでそれでいいだろ
目的によるとしか言えん >>71
普段0.1秒で検討することあるの?変わってるなあ NNUE-whale5 強いね!
エンジンだけ替えて、これだけ差が出るのはすごい事だと思う
TNK 33-6-61 TNK-NNUE-whale3
TNK 24-6-70 TNK-NNUE-whale5
TNK-NNUE-whale3 121-23-156 TNK-NNUE-whale5
クジラ 79-16-105 KPPT-NNUE-whale5
全部 1手 0.2秒
AVX2 使えないので SSE4.2版 使用 >>73
今クジラとwhale5(評価関数はqzilla9)を一手3秒(nps600万)投了値1500でやらせてるが
57局時点で27-3-27と完全に互角になってる >>74
おお、素晴らしい
結果が出るの楽しみに待ってます バージョンが多くて検証が大変そうですな
短時間ではかなり強くなってる感じなんすね。長時間でも現時点でくじらと互角ならNNUEの未来は明るいな >>61
探索の理論的技術的な話を問うているのに
いつでも長く検討させればOKみたいなバカは黙ってて。 NNUE-whale5 の SSE4.2版 アップしました
https://www.axfc.net/u/3911635 >>78
そういう話がしたいのなら
『現在の短時間対局は過去の長時間対局で現在の長時間対局は未来の短時間対局である』
この前提が既に間違いね
そしてなぜハードの進化に合わせて対局時間を短くしていかないのかよく考えてみて とりあえずNNUEとaperypaqとで持ち時間1秒で対局してるけど、NNUEが大体7勝3敗くらいのペースで勝ってくね >>72
改良の効果を見るなら0.1秒でいい
というか0.1秒1000局と10秒10局なら統計的に意味があるのは前者
大会のレギュや検討での予測として使えないというなら、そこに何らかの理論がいるし、1時間の結果に10秒の方が0.1秒より近いという保証は何もない
現状そんなスペックではとかそんな時間ではと勝手な閾値決めて主観でイチャモンつけてるだけ 1秒とかじゃなくて、ある程度長めケースでの実力が知りたかったので、
PC2台使って、3日掛けて、30秒のリーグ戦をやってみたんで、流れを読まずに書き込んでみる。
ファーマットは前スレ443のが見やすかったからパクったけど、443さんとは別人です。
https://i.imgur.com/mAKsYpn.png >>84
30秒とはこれまた極端な……有意差出るまでやろうと思ったらきつすぎる所行 一手の消費時間の長さは長くするほど
投了値の大きさは小さめでも効果は同等になりそうだけど
誰か適切な投了値と消費時間の関係を調べたことある? 同じエンジンで評価関数の優劣を比べるなら深さ固定にすればあまり時間をかける必要無いと思うんだが >>80
ありがとうございます
ダウンロードはできたんですが、動かそうとするとエラーが出るようです elmo絞りが出てきたころの話を知らぬのか
同じエンジンで評価関数を変えるだけで長時間に強い・弱いって差が出てくるのよ >>89
あら、ダメでしたか、申し訳ない
もし良ければ、お使いのCPUを教えてください elmoの勝敗を考慮に入れたアルゴリズムを他のソフトも取り入れたから
今は短時間でもおkの可能性は? >>90
それは当然知っているがそれは0.1秒で対局させたからであって、それだと探索深さが変動して安定した結果が出ないから信頼性低いのではと思った。
長時間になればなるほどだと同じエンジンなら探索深さもほぼ同じになるだろうから正確に強さが図れる
だから探索深さを固定すれば探索に影響受けずに純粋に評価関数の性能を比べられるんじゃないかと考えたわけです また羽生がソフトを上回ったね。(ソフトのノードが低い時)
https://light.dotup.org/uploda/light.dotup.org526554.jpg
このノードでは▲48玉が最善手としている
しかし10億ノードぐらい読んでようやく
同玉が最善でこの手こそが逆転する手というのに気づく
結局▲同玉 △67馬のあとの37手目の▲56香車を枝切りで見逃してたんだね。
こういうノードが低い時の見逃しは藤井や羽生のときによくおきるね
やはりこの二人は低ノードのときのソフトを上回る読みをする 10秒とか1分程度の低ノードのソフト同士の対局て
意味あるの?
読みぬけ多くて羽生や藤井以下になること多いんだが また羽生がソフトを上回ったね。(ソフトのノードが低い時)
https://light.dotup.org/uploda/light.dotup.org526554.jpg
このノードでは▲48玉が最善手としている
しかし10億ノードぐらい読んでようやく
同玉が最善でこの手こそが逆転する手というのに気づく
https://light.dotup.org/uploda/light.dotup.org526555.jpg
結局▲同玉 △67馬のあとの37手目の▲56香車を枝切りで見逃してたんだね。
こういうノードが低い時の見逃しは藤井や羽生のときによくおきるね
やはりこの二人は低ノードのときのソフトを上回る読みをする 某棋士は検討は10秒で十分とか言ってたが個人的にはあり得ない
そんな人の公開したbookは精度が低い 深さ指定は同じ評価関数の学習だけ変えたやつとかなら使えるんだろうけど
エンジンが違うとかNNUEと3コマの評価関数の比較とかには使えないから時間指定がいいよ
あと違うエンジンで短時間は時間制御のマージンとかINFOの出力の違いとかで
違いが出すぎるからあまりおススメせんな
最近はやねうら王系ばっかだからあまり問題にならないけど てかあのbookって短時間の持ち時間で連続対局で指させて作ってるみたいだけど、5960xのCPUで短時間では精度が低いのでは?
確かに膨大な量だけど一つ一つの変化は精度が低い >>96
各持ち時間5時間とかでたまにやらせるけど、それでも棋譜の内容見ると「うーん」って感じる場合が多いよ
それくらいいい将棋を作り出すのは難しい 終盤の枝仮りの強弱のパラメータはユーザーが調整できるようにならんの? やはりこの界隈に詳しくて最高峰のプレイヤーは西尾先生なんだろうなー まぁc-bookを鵜呑みにする人が増えたらそれはそれで勝ちやすくなる 人造棋士18号、当然だが一般知名度なさすぎw
人気No1将棋系ユーチューバー本日の動画
【将棋倶楽部24実況】先手:クロノ 後手:JKishi18gou
検討ソフト:elmo(去年ver)
https://www.youtube.com/watch?v=tQdoRGn_edE
「相手は最強のJKですね」(冒頭)
「J棋士18号? JKいし18号じゃないだろうから」(1分5秒〜)
まあ一般の将棋ファンにとっては
「ポナに勝った去年のelmo>天彦名人に圧勝したポナ>>>(越えられない壁)>>>最新の強豪ソフト」
ってことだなw 人工知能ブームの特集が組まれた本やテレビ番組で最先端の人みたいな扱いで山本さんがでまくっていたから仕方ない
ボナンザとポナンザが知名度は2強であとは無名なのが実態だろう
30万ダウンロードの技巧は将棋ファンには知られているだろうけどさ ポナンザが人工知能とかまさに情弱の証 田舎者よりヤバイわ ポナンザの名前がボナンザのパクリでムカつくわ
まるであの国みたいだな 千田はどれだけ読ましても枝刈りの影響で読めない局面があるからこそ一手10秒程度でもいいということでは?
個人的にソフトの読みがおかしいと思うなら自分の読み筋を入力していって検証すればいいんだからな
ある意味アドバンスド将棋で検討しているようなもの >>91
CPUはcore i5-3570になります あと総合的に見てソフトが人間の技術を上回っているのは間違いないのだから一部間違った評価を下すのを分かったうえで検討するのは問題ない 終盤力を上げてもレーティング上昇には直結しにくいから開発者は終盤に力を入れない.
だから序中盤力の伸びと比べたら昔のソフトからの終盤力の上昇度は小さい. Qzilla-Qhapaq-Roll関数が公開されたな 「人工知能の研究をしています。」
「おおっ、どのような分野ですか?」
「コンピューター将棋です」 (ドヤ!! aperypaqみたいに、しばらくは総合的なレートが高そうなのでQzilla-Qhapaq-Roll関数を使う人が多いだろう、これをキメラして強くなっても、総合的なレートは上回れないと予想する、現にキメラ勢(wakame1st)でもaperypaqと同等だし そろそろAlpha zeroに挑戦状を叩きつけるレベルの強さになってきたのでは?? 人間だって見落とすことがあるし、やたらソフトの見落としが強調されるのはどうもな。
しかし10億ノードもくじらちゃんだと1秒か。10年後くらいはこれが当たり前になってるのか? >>96
ソフト1手10秒、羽生持ち時間9時間とかで対局したら
いい勝負になるかもね
果たして勝ち越せるだろうか result : qqr = 1.00199 x qzilla9 + 0.0173011(diff ratio)
Apery→aperypaqよりは変わってるけど、やっぱり微差なんだよなあ >>122
やはり初期化エラーが出てしまうようです 一般の将棋ファンにとっては知名度・実力ともに
「ポナに勝った去年のelmo>天彦名人に圧勝したポナ>>>(越えられない壁)>>>最新の強豪ソフト」
ポナンザは対プロ戦でも圧倒的に強かっただろ?
だが他のソフトなら、今でも事前貸出で研究してハメればプロが圧勝できると思われてるよw
ポナンザ以外のソフトなら電王戦FINALでプロが勝ち越しで終わってるイメージが今でも根強く残ってるしなw
ポナなら人間では勝てないと誰もが認めたけど >>124
うーん、そうですか…
原因が分からないです、ごめんなさい
逆に「動いてる」って方いませんか? QQRは探索やねうら王なのか。
godwhaleの探索はあくまでもqzilla9に最適化されてるってことなのかな >>126
i5-2400ですが動きました
ありがとう! >>128
>>80 では動かず
>>122 で動いたって感じですか?
>>80 のは corei7 用の最適化が入っていたので、そこを修正してみたのですが https://twitter.com/k_ohga/status/995622837367914497
godwhaleはYO4.80より強くしたけど、4.82が出てあんまり差がないという印象みたい。
あとqzilla9で検証してたから他の評価関数との相性も自信はない様子 >>129
いえ、122が初体験
KPPT-NNUE-whale5_SSE42.exeのほうも問題なく動いております >>124
エラーをここに「正確に」転記したら有効なアドバイスがもらえるかもしれない >>131
そうですか
最適化の関係で >>80 のが動くなら
そちらの方がNPSがわずかに高いと思われます
(やねさんのデフォ設定なので) >>58
新しいウェブアドレスに移動したとか言われてDLできない >>124
初期化エラーってShogiGUIかな?
将棋所ではどうなのかな >>83
0.1秒のテスト対局やったせいで技巧が0.1秒だけに強くなる失敗をしたのは開発者の間では有名な話 Rota氏の計測によると、先手勝率60%か、ソフトが強くなるにつれて徐々に先手勝率が高くなっている気がする >>133
80のほうも動きました、ありがとう
>>124
鵺の評価関数いれてないとか?
KPPT-NNUE-whale5もやってみた?
そっちはelmo等普通のやつでうごく >>107
一般の将棋ファンにとっては実力・知名度ともに
「ポナに勝った去年のelmo>天彦名人に圧勝したポナ>>>(越えられない壁)>>>最新の強豪ソフト」だ
他のソフトなら、今でも事前貸出で研究してハメれば間違いなくプロが1億%圧勝できるよw
ポナンザ以外のソフトなら電王戦FINALでプロが見事に勝ち越してるしな
最新のソフトが対人でも強いと認められてれば今頃巷に溢れてるはずだろ?現実は全然違うけどw
ポナなら人間では勝てないと誰もが認めたけどな >>125
またこの荒らしか、こいつスレを荒らすのが好きだな、今時R4200越えのソフトにトッププロが勝てると思っているのは、お前くらいだアホ >>140
R4200だとかR4500だとか全然関係ないねw
ハメて大駒を捕獲すればプロの楽勝だからな
ポナには通用しないが他のソフトなら貸し出しで弱点を研究すれば簡単にハマるよw >>139
数年まえの電王戦のようなハメてなどR4200以上のソフトに通用するわけないわアホ >>141
お前の言っているのは何の根拠もない思い込みや、当時のR3000程度のソフトとはレベルが違うわアホ 羽生さんや藤井聡太君を出すまでもなく、25歳以下のプロはソフトに全勝という事実!
「角ならずw」「28角w」
ポナ以外のソフトなんて単純だからすーぐハメ手に引っかかるよw
俺だけではなく世間の多くがこう認識してる 最新のソフトが一般の将棋ファンからガン無視され、
ニコ生で評価値出してるぽんぽこがまるで信用されてない
なぜならプロより弱いと思われてるからだw >>146
お前一度 floodgateに参戦してR4300のソフトと対局してみろ人間とはレベルが違うのが分かるから、そしてそれにハメてをして一度でいいから勝ってから大口たたけや どうせなら人工無能とまでは言わんがもうちょっと気の利いたスクリプトでもつくればいいのに
いつも同じでつまらんわ ▲同玉とした直後のたぬきさんの評価
https://light.dotup.org/uploda/light.dotup.org526597.jpg
そのあと△67馬 ▲56香車 と指した後の手のひらを返すたぬきさん
https://light.dotup.org/uploda/light.dotup.org526604.jpg
こういうのみると
ルール次第ではソフトもまだまだだなと思わせる
ソフト一手10秒 人間持ち時間9時間
事前にソフト貸出あり
だと人間が勝ってもおかしくなさそう ニコ生解説のプロとは異なる予想手をソフトが示した場合の視聴者の反応
例:64歩
ポナンザの場合
「64歩かあ・・・、俺らにはよく分からんがこれが正解なんだろうな、さすがポナ」
ポナンザ以外のソフトの場合
「64歩www 弱っwww このソフトバグってんじゃね?w やっぱプロはすげー」
或いは
「こんな手はプロなら誰でも指せるし、俺だって指せるわw 評価値なんてイラネ」 Qhapaqさんは1位なりたい病ですか
公開してもらえるのはうれしいです プロ棋士側の負担も考えようや
もうソフトと戦う時代は終わった、競わなくていいそれでいいんだ 逆に言うとプロが横歩取りの終盤の研究にソフトを使うことはリスクもあるっていうことやな >>135
やはり初期化エラーが出るようです
Error! open evaluation file failed
Error! : read file error , file = eval/KK_synthesized.bin
と表示されます。
evalフォルダを見てみたら、nn.binというのしか入っていませんでした
使い方間違っていますか? ぽんぽこからTNKに乗り換えちゃえばいいのに検討用ソフト。
QQRもTNKも同玉最善手で先手にプラス評価を示せるし >>155
ぽんぽこも時間かければ同玉最善手になるよ
俺のパソコンだと5億ノードぐらいだと同玉最善先手+にならない
10億ノードぐらいかかる >>151
QQR評価関数なかなかすばらしい
クジラパークといっていいのでは
QQR関数(Qzilla-Qhapaq-Roll関数)が公開されました。
YaneuraOu4.82AVXTとの組み合わせでQzilla9+GW5.0.5に対して
勝率約55%、+34のレートを持った強力な評価関数です。
ROTAさんの対クジラのレートチェックも受けてるので
きっと4200越えは間違いないかな
検討用に使わせてもらいます(uuunuuunさんの結果楽しみ)
おーがさん Qhapaqさん ありがとう
uuunuuunさん 計測追加いただけると幸いです Qhapaqの新しいのはやねうら王じゃなくクジラちゃんで使えばいいよね ■ このスレッドは過去ログ倉庫に格納されています