▲コンピュータ将棋スレッド137
■ このスレッドは過去ログ倉庫に格納されています
>>261
純粋に質問だけど、200局っていう数字に意味はあるのですか?
1000局指したら、400勝550敗50分とかにならないですかね。 例えば、定跡ガチャで外れを引く回数が多かったらそこでぼこぼこ負けるしな。
統計だけではなく、「どういう負け方をしてるか」は見た方が良い。
その意味で、ナイアガラパターンに着目したPALはいいとこ突いてたと思う。 >>262
200局はただの例で意味は無いよ
ちなみに有意差もないから1000局やればそうなるかもしれないね、その逆も >>263
それが大事だよね、やたら反省させられて負けてるとか色々気づくことはある 教師局面を生成する準備として、Depth8での強さを調査中
NNUE/W6 vs NNUE/YO4.82
524-52-424
https://i.imgur.com/gJRonth.png
NNUE/W6 vs NNUE/W3
446-62-492
https://i.imgur.com/2BJrQJv.png >>266
そうなんだよねうちの検証でも、wシリーズ同士を対局させると、シリーズの中ではW3が最強なんだよね
でもwシリーズ以外にはバージョンアップごとに強くはなっているんだよね
結局、どれが最強かっていわれるとW3になってしまう 探索でも三すくみがあるんだな、今まで評価関数だけかと思っていた QQR/YO4.82 vs QQR/GWasame
368-51-581
https://i.imgur.com/IzuCLyJ.png
NNUE/W3 vs QQR/GWasame
497-14-489
https://i.imgur.com/OqoKqs9.png YO.4.82が浅い読みの戦いではダメダメとは恐ろしい 深さの方を固定してるんなら、枝刈り全くしないものが最強ってことになるんじゃないか?
深さ固定で異なるエンジンを比べるのは意味無いのでは depth8くらいになるように時間設定してるんじゃなくて深さ自体固定対局なのか、そりゃYO4.82大不利 バージョンアップがはやくて、検証が追い付かない…
NNUE-whale6 の SSE4.2版 アップしました
AVX2 が使えない人はこちらをどうぞ
https://1.bitsend.jp/download/63ce501bf2f84624823e8d991bed7ad7.html >>261
ということでもう一度NNUE-whaleとやねうらを載せたQQRをもう100局やらせましたが66-3-31でやはりダブルスコアでNNUE-whaleが勝ち越しました昨日は何勝だったか忘れましたが、50局程で中断してその時もダブルスコアでしたのでやはりやねうらより優秀な感じでした
ほかの評価関数でもやねうらが勝ち越したところはまだ見てないです もはや正しい検証が行われてるような気がしないんだが multi ponder測定?
技巧の方が良さそう >>274
それはすごいな、やねさんも探索のパラメーターを大幅に見直すことになるのかなこれで >>269
これも、Depth8なんですか?
それから、GWasameもNNUE-whaleのように、くじらのパラメータでいじってるんですか? >>278
GWasameなんだから、くじらのパラメータですね。失礼しました。 >>279
GWの枝刈りを極端に緩くしたらかなり強かった的なものだったかと >>273
AVX未対応マシンで、どっちも動くことを確認したよ
あんがと NNUE-whaleの三駒版ってNNじゃないのにNNUEってネーミングなのはどうなんだろうか このスレだけで頻出し、ググっても何なのかが全くヒットしない
「NNUE-whale」とは何なのか、バージョンが3,4,5,6とあるが何が違うのか等、解説してくれる優しい方がいらっしゃいましたら嬉しいです。 >>273
ありがとうございます
早速NW5とNW6を評価関数QQRで対局させてみたいと思います >>283
前スレのここらあたりからみると流れがわかりますよ。
741 名前:名無し名人 (ワッチョイ f5a0-fFVh)[sage] 投稿日:2018/05/13(日) 05:56:26.52 ID:5Sivxjbw0
NNUEの2018-otafuku-param.hのパラメータを
全てGodWhaleの数値にした結果 depth固定なら枝刈り少ない方が強いのは自明
後は教師局面つくる費用がどれだけ増えるかの戦い
低depthなら誤差レベルでしかコスト増えない気はするけど
aperyが学習用途で強いのはそこらへんよね
学習用エンジン・定跡作成用エンジン・戦闘用エンジンの3つが要る時代になりそう このスレの名無しの作品
たくさんバージョンあるしこれからも増えそうなので暇人以外触らなくていいと思う
検証を待てばよい >>286
『学習用エンジン・定跡作成用エンジン・戦闘用エンジンの3つが要る時代になりそう』
これだよなきっと >>285
ご回答ありがとうございます。
NNUEとは評価関数の形式を示す名前だと思いますが、
NNUE-whaleとはNNUEとは全く関係なく、TNKチームが利用したやねうら王の改造版エンジンを示すという認識でよろしいでしょうか? >>290
前スレ読んでその辺わからないなら正直触らないほうが良いんでは >>290
正直ネーミングのわりにNNUE大して関係ないよなとは思う >>273
とりあえず0.1秒でHW5とHW6をQQR載せて200局させたところ、91-8-101でHW6の勝ち越しでした 名人戦の検討ソフトぽんぽこ、今日も視聴者から酷評されまくりw
羽生さんの指し手とぽんぽこ予想手が違った場合、
視聴者の羽生さんへの信用度100%、ぽんぽこへの信用度0%w この流れで合ってる?
TNKチームがリリースしたやねうら王改エンジンはAVX2利用版のバイナリしか付属されていなかった
↓
ivy-bridgeのPCを使っている人が、TNKやねうら王改のSSE4.2版使いたいがビルドするスキルが無いので誰かに用意して欲しいとねだった
↓
GodWhale5.0.5のパラメータを適用した「TNKやねうら王改」のSSE4.2版を「NNUE-whale」という意味不明の名前でアップした人が登場
↓
ネーミングセンスの無さに混乱する人が出た >>294
ぽんぽこは名前からして馬鹿にされそうだし(実際に馬鹿にされている)、elmo_wcsc27とのキメラだしな、Apery_sdt5はキメラじゃないし、
sdt5の最強評価関数なので検討にぽんぽこ止めてAperyを採用すれば、ここまで馬鹿にされずに済んだのにな、ま電王Tの優勝ソフトを採用する決まりなのでしょうがないわな >>297
一般の視聴者はキメラとか全く知らないし気にしてるわけないだろそんなこと
一番の原因は運営が低スペックPCをぽんぽこに与えたことと検討モードの設定がガバガバなことかと >>295
なんか自分が悪い流れになってるけど
元から KPPT版にも NNUE-whale って名前が使われているのでしょうがない
名前の由来は、NNUE-whale はもともと TNK版しかなかったけど
改良した部分のコードを KPPT版にも反映したからだと思う >>297
ポナ以外のソフトは全部馬鹿にされるよ
Aperyだって一般ファンからしたら電王戦で斎藤慎太郎に負けた雑魚ソフトっていうイメージが今でも根強いから >>298
結局はAperyより弱いぽんぽこを採用したこと、低スぺPcを与えたこと、検討モードの設定が悪いことから全て運営側のレベルが低いってこと Aperyって言ってるけど探索がやねじゃなければポンポコ以下なんすけど 一般ファンにとっては、ソフトの「現在の棋力」なんてどーでもいいんだよ
公式戦でプロに勝てば強いソフト、負けたら弱いソフトになる
だから公式戦7戦全勝のポナンザは偉大なんだよ >>303
お前の文章をそのまま理解すれば一般ファンはソフトの棋力を全く考えないアホだってこと
まともな人間は棋力つまりレーティングを重要視するわ 公式戦7戦全勝のポナンザはぽんぽこより大分弱いときのものなので何の価値もなく、まともな人間からしたら、お前を含めてアホとしか見ていない >>304
一般ファンはソフトの棋力もレーティングも全く考えないしどーでもいいと思ってる
Aperyの現在の棋力なんて関係ない、斎藤慎太郎に負けた事実は永久に覆らないから
つまり「目に見える結果」がすべてだ >>306
だからお前をアホだっていっているじゃないか >>305
ポナンザに勝てる人間はゼロと誰もが認識してる
だが一般ファンからは、ぽんぽこは羽生さんや藤井聡太より弱いと思われてる
これで十分だ >>308
一般ファンはそんなの無関心だから意味ないよw >>310
だからお前をアホだっていっているじゃないか もしレーティングの重要性が世間に認識されてれば、WCSCや電王トーナメントがガン無視されるわけないからな
現実は真逆だけどw 一般ファンは現在の棋力を考えることも出来ないアホだってこと >>295
NNUEのパラメータをgodwhaleと同じものに変更したものが意外と強いと有志がUP
↓
当時はAVX2版以外のビルドが失敗していた
↓
後にAVX2版以外のビルドも成功
↓
頻繁に更新されるので混乱する人が出た
NNUE-whaleの名前は「NUUE」+「GodWhaleのパラメータ」という意味だから意味不明ではない
TNKチームは関係ない >>315
KPPT版とかもNNUEネーミングなのが混乱する原因じゃない? > NNUE-whaleの名前は「NUUE」+「GodWhaleのパラメータ」という意味
NUUE?
混乱してる人は、だいたい自覚が無いわな >>294
羽生が棋士の手を予想して当てたからと言ってその手が最善の手とは限らない
その棋士の棋風から推察される手を予想しているだけかも知れない
当然のことだが将棋エンジンの予想が最善の場合がほとんどでそれが実力差に
なって表れている 候補手が棋力の遥かに劣る人間の手と一致しないのは当然の
ことだと思う >>319
世の中信用が大事なんだよ
公式戦7戦全勝という実績を残したポナ以外のソフトは信用がない
ニコ生で「ぽんぽこに変えてAperyを出せ」なんてコメントは皆無だろ?
真偽はともかく、ポナ以外のソフトは貸し出しで研究すれば今でもプロに勝ち目はあると少しでも思われてる時点でダメなんだよw NNUE-whale5が落とせないので上げなおしてくれないか バージョン管理のためにもgithub使ってみてはどうだろうか >>320
少数派のポナ信者(こいつらは棋力を考えることの出来ないアホばっかり)のお前が勝手に思い込んでいるだけだ、うざいからこのスレに来るな、
ポナンザの話題なんかどうでもいいわ、過去2大会で優勝も出来なかった非公開ソフトが 名前をつける価値があるもの以外は無理に名前をつけないほうがいいと思いまーす >>323
俺はポナ信者ではない
R4200の無名ソフトより、仮にR3500でも実際にプロに勝ったソフトの方が信用される
世間とはそういうものだw ライバルに追い抜かれぶざまに引退したポナより、はるかに強いソフトが出ているので使えもしないポナに興味ないわ >>325
だからお前をアホだっていっているじゃないか NNUE-whaleシリーズは超短時間対局に最適化されてる感じなのかな? >>328
実際に1500万ノードで本格的に検証したら、0.1秒の超短時間対局と差がでるのか興味がある
このスレの対局の報告では、ほとんどが超短時間対局の結果なので 105 名無し名人 (スッップ Sdfa-hd0g) 2018/05/19(土) 17:03:22.94 ID:zisz81ojd
髭面で煙草を銜えた問くんを想像してしまった >>329
検証ってほどじゃないけどKPPT版を16スレ1秒(500~800万ノードくらい)で使ってみてるけどあんまり強くない感じ
NNUE用だしKPPT版ではあんまり強くないってだけでNNUEなら強いのかもしれないが >>299
変に非難したような書き方になってたので気分を害されたかもしれず、すみません
元からNNUEって名前だったということですが、元って何ですか? SSE4.2版あげてくれてる>>299はNNUE-whale作ってる人とは別 >>315
NNUEは検索エンジンじゃないのでGodWhaleのパラメータは適用できません
あなたがNNUEと呼んでいるのは、TNKチームがNNUE向けに用意したやねうら王改のことじゃないんですか? >>332
元ってのは
>>58、>>256 などの NNUE-whale の作者さんのです >>331
i7 6700k 8スレ一手3秒(おおよそ一手1500万ノードから1800万ノード)でのqqrとの対局をみると最初自分のほうがいいと思ってあとで反省するパターンがかなり多い
nnue whale6が強いのは超短時間のみな気がする
検証結果が出たらまたお伝えします ロタ様あなたのハイスぺでnnue whale6とやね4.82をqqrで検証して下さいませ nnue評価関数に最適化されてるのにKPPTで検証しても意味なくね? 実際にnnue評価関数を積めばある程度の持ち時間でもqqrを6割ボコれるのかが一番重要だろ >>339
超短時間でこれだけ強いと1500万ノードにも興味があるのだが
qqr_whale6 117-5-78 qqr_Y4.82_AVX2 勝率60% 一手0.1秒 (16万ノード) 定跡なし GWasameもNNUE-whaleもYO4.82を使ってる相手に対して勝ち越すはずの評価関数で負け越す感じだわ
本来勝率53~55%くらいあるはずの条件でも勝ち越せない、QQR相手に60%とかいったら面白かったのになー 結局ある程度ノード数がある場合はwhale6-KPPTは弱いってことかな 最初にNNUE-whaleの意味について質問した者です。
皆さんの回答や、前スレの流れを読んだりで大体真相が把握できました。
皆さんご回答ありがとうございました。
混乱の原因を整理しました。
・NNUE関数を使えるように改造したやねうら王に那須氏が「NNUE-v1.0」と名付けたこと
・KPPT最強のQzilla9とNNUE関数を対決させるために「NNUE-v1.0」をGodWhaleと同じパラメータでビルドした「NNUE-whale」エンジンを5ch有志がリリースしたこと
・同有志は、NNUE-whaleは他のKPPT評価関数の強さ比較にも用いたいため、KPPT版をリリースしたこと
・NNUE-whaleは、なぜか最近の流れでは、KPPT版がQQRやApery等の対戦比較にばかり用いられていること 「非現実的な短時間でしか計測して無いこと」も追加で。 leela chessのフォーラムではfacebookがelf opengoの際にalphazeroの再現にチャレンジして失敗したのではって言われてるね。
alphazero自体もかなり疑わしい。 対局数少ないけど、一手500~800万ノード、対YO4.82+QQRの簡易測定結果
エンジンYO4.82
54-3-43(勝率約54%)
エンジンwhale6-KPPT
37-8-55(勝率約40%)
評価関数はどちらも今作成中のやつ
とりあえずKPPT版はノード数少ないときじゃないと力を発揮しないみたい 最近の書き込みで「whale」って記載されているエンジンはNNUE-whaleの略なんですよね? >>350
文脈からしてそうとしか言いようが有りませんね。
KPPT版のNNUE-whaleは、KPPT-TNKって名前を付けておけば混乱が無かったと思うんです。 最近floodgateで勝ちまくっているhavenの正体に興味がわいてきた >>348
chessのフォーラムでなぜfacebookの碁の話が? >>353
ここでも色んな話してるし
コンピュータボードゲームの話は話題に上がるでしょ >>354
つまり5chの話題レベルでしかないってことか
alphashogiならともかく囲碁でまだGoogleを疑ってるのはね >>355
AlphaZeroって囲碁だけじゃなく将棋、チェスも指すぞ >>356
いや実績が全然違うじゃん
alphazeroの自己対戦の棋譜である程度担保されてる alphazeroのshogiは棋譜がそもそも出されていない 技巧は探索ノード100のオーダーからきっちり強さが上がっていくが
YaneuraOuエンジンは10万ノード程度ではぜんぜん不足
スイートスポットはもっと高いところからはじまる >>357
もう一度最初のレスを何回か読み直してきた方がいい
誰も囲碁の実績を疑ってはいない >>359
>348ではelf opengoがalpha zeroの再現に失敗したらしいのを受けてalpha zero自体も疑わしいと言ってるんだから、囲碁のalphazeroを怪しんでるのでは? 強さを疑うわけじゃないけど棋譜出すのが難しい理由があるの? ■ このスレッドは過去ログ倉庫に格納されています