▲コンピュータ将棋スレッド137
■ このスレッドは過去ログ倉庫に格納されています
バージョンが多くて検証が大変そうですな
短時間ではかなり強くなってる感じなんすね。長時間でも現時点でくじらと互角ならNNUEの未来は明るいな >>61
探索の理論的技術的な話を問うているのに
いつでも長く検討させればOKみたいなバカは黙ってて。 NNUE-whale5 の SSE4.2版 アップしました
https://www.axfc.net/u/3911635 >>78
そういう話がしたいのなら
『現在の短時間対局は過去の長時間対局で現在の長時間対局は未来の短時間対局である』
この前提が既に間違いね
そしてなぜハードの進化に合わせて対局時間を短くしていかないのかよく考えてみて とりあえずNNUEとaperypaqとで持ち時間1秒で対局してるけど、NNUEが大体7勝3敗くらいのペースで勝ってくね >>72
改良の効果を見るなら0.1秒でいい
というか0.1秒1000局と10秒10局なら統計的に意味があるのは前者
大会のレギュや検討での予測として使えないというなら、そこに何らかの理論がいるし、1時間の結果に10秒の方が0.1秒より近いという保証は何もない
現状そんなスペックではとかそんな時間ではと勝手な閾値決めて主観でイチャモンつけてるだけ 1秒とかじゃなくて、ある程度長めケースでの実力が知りたかったので、
PC2台使って、3日掛けて、30秒のリーグ戦をやってみたんで、流れを読まずに書き込んでみる。
ファーマットは前スレ443のが見やすかったからパクったけど、443さんとは別人です。
https://i.imgur.com/mAKsYpn.png >>84
30秒とはこれまた極端な……有意差出るまでやろうと思ったらきつすぎる所行 一手の消費時間の長さは長くするほど
投了値の大きさは小さめでも効果は同等になりそうだけど
誰か適切な投了値と消費時間の関係を調べたことある? 同じエンジンで評価関数の優劣を比べるなら深さ固定にすればあまり時間をかける必要無いと思うんだが >>80
ありがとうございます
ダウンロードはできたんですが、動かそうとするとエラーが出るようです elmo絞りが出てきたころの話を知らぬのか
同じエンジンで評価関数を変えるだけで長時間に強い・弱いって差が出てくるのよ >>89
あら、ダメでしたか、申し訳ない
もし良ければ、お使いのCPUを教えてください elmoの勝敗を考慮に入れたアルゴリズムを他のソフトも取り入れたから
今は短時間でもおkの可能性は? >>90
それは当然知っているがそれは0.1秒で対局させたからであって、それだと探索深さが変動して安定した結果が出ないから信頼性低いのではと思った。
長時間になればなるほどだと同じエンジンなら探索深さもほぼ同じになるだろうから正確に強さが図れる
だから探索深さを固定すれば探索に影響受けずに純粋に評価関数の性能を比べられるんじゃないかと考えたわけです また羽生がソフトを上回ったね。(ソフトのノードが低い時)
https://light.dotup.org/uploda/light.dotup.org526554.jpg
このノードでは▲48玉が最善手としている
しかし10億ノードぐらい読んでようやく
同玉が最善でこの手こそが逆転する手というのに気づく
結局▲同玉 △67馬のあとの37手目の▲56香車を枝切りで見逃してたんだね。
こういうノードが低い時の見逃しは藤井や羽生のときによくおきるね
やはりこの二人は低ノードのときのソフトを上回る読みをする 10秒とか1分程度の低ノードのソフト同士の対局て
意味あるの?
読みぬけ多くて羽生や藤井以下になること多いんだが また羽生がソフトを上回ったね。(ソフトのノードが低い時)
https://light.dotup.org/uploda/light.dotup.org526554.jpg
このノードでは▲48玉が最善手としている
しかし10億ノードぐらい読んでようやく
同玉が最善でこの手こそが逆転する手というのに気づく
https://light.dotup.org/uploda/light.dotup.org526555.jpg
結局▲同玉 △67馬のあとの37手目の▲56香車を枝切りで見逃してたんだね。
こういうノードが低い時の見逃しは藤井や羽生のときによくおきるね
やはりこの二人は低ノードのときのソフトを上回る読みをする 某棋士は検討は10秒で十分とか言ってたが個人的にはあり得ない
そんな人の公開したbookは精度が低い 深さ指定は同じ評価関数の学習だけ変えたやつとかなら使えるんだろうけど
エンジンが違うとかNNUEと3コマの評価関数の比較とかには使えないから時間指定がいいよ
あと違うエンジンで短時間は時間制御のマージンとかINFOの出力の違いとかで
違いが出すぎるからあまりおススメせんな
最近はやねうら王系ばっかだからあまり問題にならないけど てかあのbookって短時間の持ち時間で連続対局で指させて作ってるみたいだけど、5960xのCPUで短時間では精度が低いのでは?
確かに膨大な量だけど一つ一つの変化は精度が低い >>96
各持ち時間5時間とかでたまにやらせるけど、それでも棋譜の内容見ると「うーん」って感じる場合が多いよ
それくらいいい将棋を作り出すのは難しい 終盤の枝仮りの強弱のパラメータはユーザーが調整できるようにならんの? やはりこの界隈に詳しくて最高峰のプレイヤーは西尾先生なんだろうなー まぁc-bookを鵜呑みにする人が増えたらそれはそれで勝ちやすくなる 人造棋士18号、当然だが一般知名度なさすぎw
人気No1将棋系ユーチューバー本日の動画
【将棋倶楽部24実況】先手:クロノ 後手:JKishi18gou
検討ソフト:elmo(去年ver)
https://www.youtube.com/watch?v=tQdoRGn_edE
「相手は最強のJKですね」(冒頭)
「J棋士18号? JKいし18号じゃないだろうから」(1分5秒〜)
まあ一般の将棋ファンにとっては
「ポナに勝った去年のelmo>天彦名人に圧勝したポナ>>>(越えられない壁)>>>最新の強豪ソフト」
ってことだなw 人工知能ブームの特集が組まれた本やテレビ番組で最先端の人みたいな扱いで山本さんがでまくっていたから仕方ない
ボナンザとポナンザが知名度は2強であとは無名なのが実態だろう
30万ダウンロードの技巧は将棋ファンには知られているだろうけどさ ポナンザが人工知能とかまさに情弱の証 田舎者よりヤバイわ ポナンザの名前がボナンザのパクリでムカつくわ
まるであの国みたいだな 千田はどれだけ読ましても枝刈りの影響で読めない局面があるからこそ一手10秒程度でもいいということでは?
個人的にソフトの読みがおかしいと思うなら自分の読み筋を入力していって検証すればいいんだからな
ある意味アドバンスド将棋で検討しているようなもの >>91
CPUはcore i5-3570になります あと総合的に見てソフトが人間の技術を上回っているのは間違いないのだから一部間違った評価を下すのを分かったうえで検討するのは問題ない 終盤力を上げてもレーティング上昇には直結しにくいから開発者は終盤に力を入れない.
だから序中盤力の伸びと比べたら昔のソフトからの終盤力の上昇度は小さい. Qzilla-Qhapaq-Roll関数が公開されたな 「人工知能の研究をしています。」
「おおっ、どのような分野ですか?」
「コンピューター将棋です」 (ドヤ!! aperypaqみたいに、しばらくは総合的なレートが高そうなのでQzilla-Qhapaq-Roll関数を使う人が多いだろう、これをキメラして強くなっても、総合的なレートは上回れないと予想する、現にキメラ勢(wakame1st)でもaperypaqと同等だし そろそろAlpha zeroに挑戦状を叩きつけるレベルの強さになってきたのでは?? 人間だって見落とすことがあるし、やたらソフトの見落としが強調されるのはどうもな。
しかし10億ノードもくじらちゃんだと1秒か。10年後くらいはこれが当たり前になってるのか? >>96
ソフト1手10秒、羽生持ち時間9時間とかで対局したら
いい勝負になるかもね
果たして勝ち越せるだろうか result : qqr = 1.00199 x qzilla9 + 0.0173011(diff ratio)
Apery→aperypaqよりは変わってるけど、やっぱり微差なんだよなあ >>122
やはり初期化エラーが出てしまうようです 一般の将棋ファンにとっては知名度・実力ともに
「ポナに勝った去年のelmo>天彦名人に圧勝したポナ>>>(越えられない壁)>>>最新の強豪ソフト」
ポナンザは対プロ戦でも圧倒的に強かっただろ?
だが他のソフトなら、今でも事前貸出で研究してハメればプロが圧勝できると思われてるよw
ポナンザ以外のソフトなら電王戦FINALでプロが勝ち越しで終わってるイメージが今でも根強く残ってるしなw
ポナなら人間では勝てないと誰もが認めたけど >>124
うーん、そうですか…
原因が分からないです、ごめんなさい
逆に「動いてる」って方いませんか? QQRは探索やねうら王なのか。
godwhaleの探索はあくまでもqzilla9に最適化されてるってことなのかな >>126
i5-2400ですが動きました
ありがとう! >>128
>>80 では動かず
>>122 で動いたって感じですか?
>>80 のは corei7 用の最適化が入っていたので、そこを修正してみたのですが https://twitter.com/k_ohga/status/995622837367914497
godwhaleはYO4.80より強くしたけど、4.82が出てあんまり差がないという印象みたい。
あとqzilla9で検証してたから他の評価関数との相性も自信はない様子 >>129
いえ、122が初体験
KPPT-NNUE-whale5_SSE42.exeのほうも問題なく動いております >>124
エラーをここに「正確に」転記したら有効なアドバイスがもらえるかもしれない >>131
そうですか
最適化の関係で >>80 のが動くなら
そちらの方がNPSがわずかに高いと思われます
(やねさんのデフォ設定なので) >>58
新しいウェブアドレスに移動したとか言われてDLできない >>124
初期化エラーってShogiGUIかな?
将棋所ではどうなのかな >>83
0.1秒のテスト対局やったせいで技巧が0.1秒だけに強くなる失敗をしたのは開発者の間では有名な話 Rota氏の計測によると、先手勝率60%か、ソフトが強くなるにつれて徐々に先手勝率が高くなっている気がする >>133
80のほうも動きました、ありがとう
>>124
鵺の評価関数いれてないとか?
KPPT-NNUE-whale5もやってみた?
そっちはelmo等普通のやつでうごく >>107
一般の将棋ファンにとっては実力・知名度ともに
「ポナに勝った去年のelmo>天彦名人に圧勝したポナ>>>(越えられない壁)>>>最新の強豪ソフト」だ
他のソフトなら、今でも事前貸出で研究してハメれば間違いなくプロが1億%圧勝できるよw
ポナンザ以外のソフトなら電王戦FINALでプロが見事に勝ち越してるしな
最新のソフトが対人でも強いと認められてれば今頃巷に溢れてるはずだろ?現実は全然違うけどw
ポナなら人間では勝てないと誰もが認めたけどな >>125
またこの荒らしか、こいつスレを荒らすのが好きだな、今時R4200越えのソフトにトッププロが勝てると思っているのは、お前くらいだアホ >>140
R4200だとかR4500だとか全然関係ないねw
ハメて大駒を捕獲すればプロの楽勝だからな
ポナには通用しないが他のソフトなら貸し出しで弱点を研究すれば簡単にハマるよw >>139
数年まえの電王戦のようなハメてなどR4200以上のソフトに通用するわけないわアホ >>141
お前の言っているのは何の根拠もない思い込みや、当時のR3000程度のソフトとはレベルが違うわアホ 羽生さんや藤井聡太君を出すまでもなく、25歳以下のプロはソフトに全勝という事実!
「角ならずw」「28角w」
ポナ以外のソフトなんて単純だからすーぐハメ手に引っかかるよw
俺だけではなく世間の多くがこう認識してる 最新のソフトが一般の将棋ファンからガン無視され、
ニコ生で評価値出してるぽんぽこがまるで信用されてない
なぜならプロより弱いと思われてるからだw >>146
お前一度 floodgateに参戦してR4300のソフトと対局してみろ人間とはレベルが違うのが分かるから、そしてそれにハメてをして一度でいいから勝ってから大口たたけや どうせなら人工無能とまでは言わんがもうちょっと気の利いたスクリプトでもつくればいいのに
いつも同じでつまらんわ ▲同玉とした直後のたぬきさんの評価
https://light.dotup.org/uploda/light.dotup.org526597.jpg
そのあと△67馬 ▲56香車 と指した後の手のひらを返すたぬきさん
https://light.dotup.org/uploda/light.dotup.org526604.jpg
こういうのみると
ルール次第ではソフトもまだまだだなと思わせる
ソフト一手10秒 人間持ち時間9時間
事前にソフト貸出あり
だと人間が勝ってもおかしくなさそう ニコ生解説のプロとは異なる予想手をソフトが示した場合の視聴者の反応
例:64歩
ポナンザの場合
「64歩かあ・・・、俺らにはよく分からんがこれが正解なんだろうな、さすがポナ」
ポナンザ以外のソフトの場合
「64歩www 弱っwww このソフトバグってんじゃね?w やっぱプロはすげー」
或いは
「こんな手はプロなら誰でも指せるし、俺だって指せるわw 評価値なんてイラネ」 Qhapaqさんは1位なりたい病ですか
公開してもらえるのはうれしいです プロ棋士側の負担も考えようや
もうソフトと戦う時代は終わった、競わなくていいそれでいいんだ 逆に言うとプロが横歩取りの終盤の研究にソフトを使うことはリスクもあるっていうことやな >>135
やはり初期化エラーが出るようです
Error! open evaluation file failed
Error! : read file error , file = eval/KK_synthesized.bin
と表示されます。
evalフォルダを見てみたら、nn.binというのしか入っていませんでした
使い方間違っていますか? ぽんぽこからTNKに乗り換えちゃえばいいのに検討用ソフト。
QQRもTNKも同玉最善手で先手にプラス評価を示せるし >>155
ぽんぽこも時間かければ同玉最善手になるよ
俺のパソコンだと5億ノードぐらいだと同玉最善先手+にならない
10億ノードぐらいかかる >>151
QQR評価関数なかなかすばらしい
クジラパークといっていいのでは
QQR関数(Qzilla-Qhapaq-Roll関数)が公開されました。
YaneuraOu4.82AVXTとの組み合わせでQzilla9+GW5.0.5に対して
勝率約55%、+34のレートを持った強力な評価関数です。
ROTAさんの対クジラのレートチェックも受けてるので
きっと4200越えは間違いないかな
検討用に使わせてもらいます(uuunuuunさんの結果楽しみ)
おーがさん Qhapaqさん ありがとう
uuunuuunさん 計測追加いただけると幸いです Qhapaqの新しいのはやねうら王じゃなくクジラちゃんで使えばいいよね 正直
結局
一手10秒とかの結果でR4200ごえだーとかいっても
結局一手10秒じゃ
▲同玉とした直後のたぬきさんの評価
https://light.dotup.org/uploda/light.dotup.org526597.jpg
そのあと△67馬 ▲56香車 と指した後の手のひらを返すたぬきさん
https://light.dotup.org/uploda/light.dotup.org526604.jpg
こういう事が起きるから
なんかなー
R4200だ4300だといっても虚しいのはおれだけ?
結局一手10秒とかの結果じゃあなあ >>159
お前そんなにソフトが嫌ならソフトを使わんかったらええだけやろが ソフトを無償で使わせてもらっていながら、ソフトに文句を言うアホが沸いとる >>160
なんか最大の弱点はほったらかしにして
R4200だR4300だと競い合ってる様が
馬鹿みたいと言うか
いやソフトすきだからいってるわけで >>162
R4200というのはは何千局とソフト同士で対局させた結果だけど
ソフトには弱点があるから実際には強くなってないみたいなことが言いたいわけ? 勝率最大化と検討用最適化は一致しないっていう毎度の話やろ 一致はしないけどある程度の相関はあるよね。
レーティングよ上がれ上がれと開発されたソフト達だが、10年前5年前と比べれば検討も正確 ソフトを無償で使いながらそのソフトの文句を言うやつや、電王戦のポナンザR3950程度の検討レベルをいまだに崇拝するやつが定期的に沸いとる >>166
ポナは現役の名人を含み、プロとの公式戦で7戦全勝したからな
ポナ以外のソフトでプロとの公式戦で3勝以上したソフトはゼロ
で、お前の自慢のR4200とやらのソフトは「公式戦で」プロに何勝したの?w
一般の将棋ファンから訳わからんソフトが信用されないのも当然だわな
電王Tで優勝したAWAKEでもハメ手であっくんに負けた訳だしw >>167
お前はほんとアホだな、プロ棋士はボナンザ6.0程度の将棋だが、それに勝って何の価値がある ソフト換算でR2800程度のトッププロや棋士に勝つことに対してはソフトからしたら何の価値もないわ アマ6級をトッププロとして、タイトルホルダーをR4230のソフトとしたら、タイトルホルダーがアマ6級の7人に全勝したからといって、
何の価値がある、お前の言っていることはこれと同じレベルの話だわ >>168-170
悔しすぎて3連投かあ、朝っぱらから腹を抱えて笑わせてもらったわ(失礼)w
プロとの公式戦で7戦全勝したポナは、実績と一般ファンからの絶大なる信頼を得たね
まあいつかR4200超えのソフトも公式戦でトッププロに1勝でもできるといいね(無理だろうけど)
期待してるよw >>171
お前みたいな価値が分からないアホは久しぶりや この間千田先生が最新ソフト相手だったらノータイムで指してもらっても勝てないって言ってたんだよなあ
もう平手で同じ持ち時間で人間とソフトがって時代は過ぎ去った 同じ持ち時間なら勝てないのはみんなわかってる。
でもそれでソフトが凄いとは思わないよな
ソフトは人間より非効率な思考を、1億回とか10億回とか
人間じゃ無理な回数重ねて、人間に勝ったとマウントしている。
ただソフト一手10秒 人間持ち時間9時間とかなら
羽生や藤井なら勝てるかもという話 ■ このスレッドは過去ログ倉庫に格納されています