▲コンピュータ将棋スレッド137
■ このスレッドは過去ログ倉庫に格納されています
>>3-4連投してしまいました。
スレ建てしたので前スレのソフトの古いPCで動くバージョン誰かお願いしますm(_ _)m いい加減、メンテされてないような将棋ソフトはテンプレから外したら? >>k_ohga
>>本家へのnnueのPRをインターセプト
>>なんとかちゃん情報みたいな事にはならんかった。だいぶ弱いかも。
>>向うのコードがいいのか、なんか失敗したか。。
NNUE-whaleの方、ぜひ連絡を 【コミュニティの一生】
面白い人が面白いことをする
↓
面白いから凡人が集まってくる
↓
住み着いた凡人が居場所を守るために主張し始める
↓←コンピュータ将棋界隈は今、この辺りの状態だね。
面白い人が見切りをつけて居なくなる
↓
残った凡人が面白くないことをする
↓
面白くないので皆居なくなる >>15
もし、その一つ下の段階だとしたら面白い人ってのは山本一成さんだね
彼がいたころは本当に盛り上がって面白かった
技巧やukamuseでレーティングも恐ろしい速度で上昇したし >>16
もうすぐだよ。
明確な目標が失われた状態では、
人間がモチベーションを長続きさせるのは難しい。
時間、お金、その他諸々を犠牲にするに相応しいと思えるだけの目標がなければね。
現状、どこにそれを見出せるだろうか。 山本はネタの人でヒール
エンタメとしては面白いのは認めるが明らかに「主張し始める」の枠 ヒールやるのはいいんだけど
ムキになんのがイタいんだよなw
ボンクラもそうだったけど メタゲーでイキる「48」「まふ」※まふは今回何も貢献できてないw
改変でイキる「たま」「まふ」ゴミ環境でキメラだけで成果を我が物顔にする恥ずかしいw 山本さんはひょうきんなキャラだったし、高学歴&将棋高段者のイケメンだった
手法を非公開にしていたのと他との差が圧倒的だったのが悪のイメージを作っただけだと思う
正義の技巧、力を合わせたApery、同じく正義のelmoが巨大な力に挑むストーリーは映画化してもいいくらい面白かった qhapaq惜しかった
https://i.imgur.com/kQYqO7e.jpg
https://i.imgur.com/nzdorO6.jpg
https://i.imgur.com/IHp7Efj.jpg
https://i.imgur.com/rESSRxw.jpg
https://i.imgur.com/cQU0rLy.jpg
AlphaZero 90 - 2 - 8 elmo_wcsc27 YaneuraOu 2017 Early KPPT 4.73 64AVX2
>>10
それは多分本家のやねうら王が
開発版でNNUE評価関数の読み込みをサポートしたという話だと思います
GPLライセンスなので元々取り込みは自由のはずですが
一応そのあたりを明言する形にして上げなおしました
https://www.axfc.net/u/3911420
whale3以降は思いつく変更は20パターン以上試して
最後の訳の分からない改変以外は全て有意差無しだったのでもうこれ以上の調整はないです
whale3が最終版、whale4は短時間かつTNK評価関数という特殊条件で強いだけな気がするので
他の評価関数に移植してもそれなりの棋力を発揮するwhale3の方が通常利用には向いていると思います >>26
うpあり、早速試させていただきます
画像の下の段、左の名前が使用したevalかな suimonブログを早くテンプレに
868 名無し名人 2018/05/16(水) 20:42:00.74 ID:fPU12wKs
西村さん県大会V、6月全国出場…アマ竜王戦
http://www.yomiuri.co.jp/local/mie/news/20180514-OYTNT50311.html >>15
コンピューター将棋は成績が出なけりゃ声が大きいだけでは
相手されないから凡人が居座る余地ないからその図式は微妙だなあ ライブラリとそれなりのマシン用意すりゃ好成績は取れるだろ
逆に面白いことやろうとしてライブラリに手を入れるほど弱くなる 最強の評価関数はwcsc28不参加の透氏が保有しているから
上のエンジンと合体させたら大会の有意義ゼロやん そろそろテンプレで「透」をNG推奨にしてもいいかもね 透さんが嘘つく理由もないから鯨よりも強い評価関数を作ってるのは確かだとは思うが、公開されてないものをあーだこーだ言っても仕方がないかと くじらより強くは結構簡単になるけど、そこそこ差がないと公開するほどでもないから色々やってるんでしょ 透氏の評価関数は
今公開したらアルファゼロを超えるんだから絶対に早く公開した方がいいよ
鯨ベーコンされてから公開しても栄誉全部持っていかれるぞ >>32
透さんはたまに公開してくれるのでありがたいけど、いろんな評価関数との検証が不十分なまま、すぐに一つのソフトだけの100局〜200局程度の対局数で強いのが出来たと言い出すのはどうかと思う、
wakame1stも結局いろんなソフトと対局した結果aperypaqより総合的なレートは下位になっており、今回のクジラ9との対局100局程度では最強評価関数を保持していることにはなるまい >>39
wakame1stとaperypaqの差は誤差の範囲内だから、下位とはいえない キメラなどはキメラ元には強くなることが多いが、キメラ元以外には相性でキメラ元より弱くなっていることが結構ある、
結局総合的なレートはwakame1stのようにキメラ元より若干下がっている可能性が十分ある 評価関数を配合して、配合元より勝率が上回り強い結果になっても総合的なレートが上がるどころか逆に下がっている可能背が十分ある
例えばクジラ9がたぬきwcsc28に勝率52%(ロタ氏計測)だし、yaselmoがramuより弱いように 初代elmo相手に強ければいいよ
鯨ベーコンでも誰かのタヌキ絞りでもいいから
早くアルファゼロを暫定王者の座から引きずり下ろして欲しい >>26
真面目?にインターセプトしてるっぽい
https://github.com/yaneurao/YaneuraOu/network
というか、やねベースにパラメータを合わせるパターンの方が筋がいいってことなんだろうね floodgate初参戦したいけどポート開放上手くいったのに転送接続にデータを書き込めない云々とか出てキレる 結局、やねうら王のソースコードがベストなのか、、。
やねうら王、出来が良すぎて技巧みたいな新しいソフトの登場を阻んでないか? フルスクラッチでやねうら王ライブラリ勢に勝つのは至難の業だよなもはや
よっぽどの才能か資金力が必要な気がする 現状のソフトに不満があるため、モンテカルロ法のような
一見変わった方法を手当たりしたい試す、もしくは提案するだけでも注目される土壌
ならともかく、現状でも何だかんだ言っても強さ自体がほぼ絶対の評価
になっているから、敢えて新規にやるようなモチベは持ちにくいでしょ。 あんなやる気のない奴がやってんのに勝てんのか
その割にはしっかり作ってあるけどw >>46
やねうら王が新しいソフトの登場を阻んでいると言うよりは、今のソフトが探索部も評価関数もガチガチにチューンナップされて改良の余地がほとんどなくなってるってだけじゃない? とりあえず再調整をして
3スレ0.1秒の条件付きではあるけどAlphaZeroは超えられたのでバージョンアップ
https://i.imgur.com/BENpXd3.jpg
https://i.imgur.com/HVXnWwG.jpg
NNUE-whal5 471(94%) - 29(5%) elmo_wcsc27
AlphaZero 90(92%) - 2 - 8(7%) elmo_wcsc27
長時間でも超えているかは自分のスペックでは測れないから頼んだぞ
googleの計測条件は64スレ1手1分(投了値900)らしい
https://www.axfc.net/u/3911555 >>51
さすがに3スレ0.1秒は駄目だろ。
ノード数が少なすぎて測定誤差が大きそう。 >>51
元々elmoは一手0.1秒で弱かったから捨てられそうになったんだしな だからマシンスペックに余裕がある人は良かったら確かめてくれってことなのでは
qhapaqさんがqzillaの改良評価関数だしたらNNUE WHALE 3と5を戦わせてみるよ >>52
ノード数が少ないと誤差が大きくなる根拠は? 3スレ0.1秒対局の勝率という意味では誤差は大きくならんだろう。ただ、超短時間の対局での勝率と長時間の対局での勝率は、相関性が高くないといわれている この手の話が出ると思うのは
現在の短時間対局は過去の長時間対局で
現在の長時間対局は未来の短時間対局であるわけだが
本質的な差異はどこにあるんだろうか エンジン名に日本語が入っていると
TanukiColiseum.exeを使用時に落ちることが発覚したから
>>51はエンジン名を変更して上げなおし
https://www.axfc.net/u/3911567
それと言い忘れたけど>>26のTNKは設定ミスで2スレになってたかもしれない
手元でqhapaqとTanukiColiseumで対戦させているけど
有意差は出なさそうだから互角3スレ0.1秒の強さではqhapaqとは互角みたい TanukiColiseumは開始手数8では差が出なかったけど
開始手数24にしたらTNKが有意に強かった
https://i.imgur.com/NufUBm2.jpg
自分の環境で計測できるのはここまでだね
あとはハイスペックPC環境の人の報告待ち そろそろ評価関数の分解能(歩の100分の1)が限界なんじゃないかな
10点〜20点で刺し合いしてるときに誤差0.5が50回も積み重なると吹き飛ぶわけだし >>57
その時代のハードでできるだけ長時間で対局させようってだけの話
未来になってハードが進化してもも無理のない範囲で長時間で対局させるべきでしょう 極限的には評価値は3値でいいわけだから、違う局面で同じ評価値ってのがあっても別にいいわけで、解像度は特に問題にならなくない? 一歩=100はあくまで表示の時の話だからエンジン内部はどんな値でもいいんだよ
実際Aperyと互換性のあるやねうら王系は内部で一歩=100ではないし 内部計算は整数で行われるがオーバーフローとの兼ね合いをみつつスケールされている 分解能は1より小さい
いわゆる固定小数点計算というやつだ なんもわからず分解能云々言うの、やねうらおブログのyakitoriって奴思い出す
ttp://yaneuraou.yaneu.com/2017/08/29/eta可変絞りについて/ >>59
whale3はTNK_v1.0より強いが、whale5はwhale3より弱くなっているので、whale5の再検証が必要では
設定 16万ノード 定跡なし
TNK_NNUE_whale3 vs TNK_v1.0
対局数200 whale3側の104勝89敗 引分7 勝率53%
TNK_NNUE_whale4 vs TNK_v1.0
対局数200 whale4側の108勝88敗 引分4 勝率55%
TNK_NNUE_whale3 vs TNK_NNUE_whale4
対局数300 whale3側の151勝137敗 引分12 勝率52%
TNK_NNUE_whale3 vs TNK_NNUE_whale5
対局数200 whale3側の104勝85敗 引分11 勝率55% 3スレ1手1秒にしたけど
他ソフトへの勝率が大きく落ちる様子はなかった
現状測定されている中では一番レーティングの高い
qhapaq + やねうら王オリジナル4.82の組み合わせを相手に計測
PCが使えなくなるのでギリギリで有意差がありそうな付近で打ち切り
https://i.imgur.com/mTCjkqk.jpg
棋譜 https://1.bitsend.jp/download/6f2c1dba3ec7f2a50536f878d03f0b37.html
>>67
検証ありがとう
whale5はベンチマークの相手をelmoにしていたから相性が強く出ている可能性はあるかもしれない Qhapaq優勝か、これで心置きなくNNUEに移行できるかな NNUEのような省メモリは対局後でもパソコンがサクサク動くので理想的 >>61
1手10秒の勝率の真値を推定するには、1手10秒それ以上でも以下でもない条件での計測が必要なだけで、
0.1秒なら0.1秒の、持ち時間1時間なら1時間の真値が得られるわけでそれでいいだろ
目的によるとしか言えん >>71
普段0.1秒で検討することあるの?変わってるなあ NNUE-whale5 強いね!
エンジンだけ替えて、これだけ差が出るのはすごい事だと思う
TNK 33-6-61 TNK-NNUE-whale3
TNK 24-6-70 TNK-NNUE-whale5
TNK-NNUE-whale3 121-23-156 TNK-NNUE-whale5
クジラ 79-16-105 KPPT-NNUE-whale5
全部 1手 0.2秒
AVX2 使えないので SSE4.2版 使用 >>73
今クジラとwhale5(評価関数はqzilla9)を一手3秒(nps600万)投了値1500でやらせてるが
57局時点で27-3-27と完全に互角になってる >>74
おお、素晴らしい
結果が出るの楽しみに待ってます バージョンが多くて検証が大変そうですな
短時間ではかなり強くなってる感じなんすね。長時間でも現時点でくじらと互角ならNNUEの未来は明るいな >>61
探索の理論的技術的な話を問うているのに
いつでも長く検討させればOKみたいなバカは黙ってて。 NNUE-whale5 の SSE4.2版 アップしました
https://www.axfc.net/u/3911635 >>78
そういう話がしたいのなら
『現在の短時間対局は過去の長時間対局で現在の長時間対局は未来の短時間対局である』
この前提が既に間違いね
そしてなぜハードの進化に合わせて対局時間を短くしていかないのかよく考えてみて とりあえずNNUEとaperypaqとで持ち時間1秒で対局してるけど、NNUEが大体7勝3敗くらいのペースで勝ってくね >>72
改良の効果を見るなら0.1秒でいい
というか0.1秒1000局と10秒10局なら統計的に意味があるのは前者
大会のレギュや検討での予測として使えないというなら、そこに何らかの理論がいるし、1時間の結果に10秒の方が0.1秒より近いという保証は何もない
現状そんなスペックではとかそんな時間ではと勝手な閾値決めて主観でイチャモンつけてるだけ 1秒とかじゃなくて、ある程度長めケースでの実力が知りたかったので、
PC2台使って、3日掛けて、30秒のリーグ戦をやってみたんで、流れを読まずに書き込んでみる。
ファーマットは前スレ443のが見やすかったからパクったけど、443さんとは別人です。
https://i.imgur.com/mAKsYpn.png >>84
30秒とはこれまた極端な……有意差出るまでやろうと思ったらきつすぎる所行 一手の消費時間の長さは長くするほど
投了値の大きさは小さめでも効果は同等になりそうだけど
誰か適切な投了値と消費時間の関係を調べたことある? 同じエンジンで評価関数の優劣を比べるなら深さ固定にすればあまり時間をかける必要無いと思うんだが >>80
ありがとうございます
ダウンロードはできたんですが、動かそうとするとエラーが出るようです elmo絞りが出てきたころの話を知らぬのか
同じエンジンで評価関数を変えるだけで長時間に強い・弱いって差が出てくるのよ >>89
あら、ダメでしたか、申し訳ない
もし良ければ、お使いのCPUを教えてください elmoの勝敗を考慮に入れたアルゴリズムを他のソフトも取り入れたから
今は短時間でもおkの可能性は? >>90
それは当然知っているがそれは0.1秒で対局させたからであって、それだと探索深さが変動して安定した結果が出ないから信頼性低いのではと思った。
長時間になればなるほどだと同じエンジンなら探索深さもほぼ同じになるだろうから正確に強さが図れる
だから探索深さを固定すれば探索に影響受けずに純粋に評価関数の性能を比べられるんじゃないかと考えたわけです また羽生がソフトを上回ったね。(ソフトのノードが低い時)
https://light.dotup.org/uploda/light.dotup.org526554.jpg
このノードでは▲48玉が最善手としている
しかし10億ノードぐらい読んでようやく
同玉が最善でこの手こそが逆転する手というのに気づく
結局▲同玉 △67馬のあとの37手目の▲56香車を枝切りで見逃してたんだね。
こういうノードが低い時の見逃しは藤井や羽生のときによくおきるね
やはりこの二人は低ノードのときのソフトを上回る読みをする 10秒とか1分程度の低ノードのソフト同士の対局て
意味あるの?
読みぬけ多くて羽生や藤井以下になること多いんだが また羽生がソフトを上回ったね。(ソフトのノードが低い時)
https://light.dotup.org/uploda/light.dotup.org526554.jpg
このノードでは▲48玉が最善手としている
しかし10億ノードぐらい読んでようやく
同玉が最善でこの手こそが逆転する手というのに気づく
https://light.dotup.org/uploda/light.dotup.org526555.jpg
結局▲同玉 △67馬のあとの37手目の▲56香車を枝切りで見逃してたんだね。
こういうノードが低い時の見逃しは藤井や羽生のときによくおきるね
やはりこの二人は低ノードのときのソフトを上回る読みをする 某棋士は検討は10秒で十分とか言ってたが個人的にはあり得ない
そんな人の公開したbookは精度が低い 深さ指定は同じ評価関数の学習だけ変えたやつとかなら使えるんだろうけど
エンジンが違うとかNNUEと3コマの評価関数の比較とかには使えないから時間指定がいいよ
あと違うエンジンで短時間は時間制御のマージンとかINFOの出力の違いとかで
違いが出すぎるからあまりおススメせんな
最近はやねうら王系ばっかだからあまり問題にならないけど てかあのbookって短時間の持ち時間で連続対局で指させて作ってるみたいだけど、5960xのCPUで短時間では精度が低いのでは?
確かに膨大な量だけど一つ一つの変化は精度が低い ■ このスレッドは過去ログ倉庫に格納されています