▲コンピュータ将棋スレッド134
■ このスレッドは過去ログ倉庫に格納されています
Qhapaqの人評価関数強くしてるようだけど、なぜやねうら王の探索部分を強くする人はいないの?
やねうら王がいなきゃ開発出来ないってことでもあるよね 探索は現状から強くなりそうなアイディアがなかなか浮かばないから。
それに対して評価関数は、今は機械学習が流行してることもあって日々新しい手法が発表されるから、
まだ将棋に適用されてないものを試すってのでいいから。
自分でいちからアイディアを考えるってのはすごい大変だからね。 >>604
やっている人は多いがアピールするほど差異が出にくいんよね。
枝狩りの多少や高速化とかでも%レベル。
磯崎氏がやり切った感を出すほど現状が相当煮詰まってるという感じ。 評価値を参考にしながら枝狩りとかするなら結局評価関数が正確じゃないと行き詰まる気がする minmax(αβ)という基本的な枠組みに乗っている以上、何をやっても枝葉の範囲でしかないからな >>581
今回は世界選手権は4250前後のレートの優勝争いなのかな 先週の名人戦第1局を1手ノード数1億で投了図から逆行解析したら、
逆行でその読みの蓄積まで使っているのに、
候補手・読み筋通りの手が「疑問手」判定連発になるという
過去にみたことのないような結果になって驚いてる
(評価関数はwakame1st、探索はYO4.80使用)
この対局、一手何億ノードくらい読ませたら正確な評価出るんだろう。 >>610
思考部と探索部の差はそこまで大きくなくて、
定跡整備とハードウェアの差と運が勝負をつけそうな気もする
あとは、さっぱり読めないcrazyshogiよな
ダメな場合は極端にダメだろうけど、
Bonanzaみたいに「極端に強いか弱いかだと思っていたら普通の強さだった」
ってこともあるかもしれない >>612
古い話しらないけど
Bonanzaって強かったんじゃないの? ロタ(Rota_JP)@Rota_JP
探索Yaneuraou4.80AVXT vs GodWhale5.0.4 4.80AVXT
182-19-137
評価関数wakame1st
1500万局面/手(一手0.75秒(35T))
定跡オフ,Ponderオフ,投了値3000,引き分け256手
Rotaさんの計算結果毎度ありがたい >>614
このわかめは入手できないわかめか
一般公開してないバージョンのわかめですね >>241
4までいけてるんだけどタイムアウトとか初期化エラーとか出てしまう
(証明書とか)と書いてあるけど公開暗号鍵のことなのかな?
あとusiutilの中のbatファイルもいじってるけどエンジンにやはり登録できない
usiコマンドは通ってるみたいなんだけどね >>615
どう読んだらそうなるのかが分かりません。 >>614
そのクジラはR+20のバージョンじゃないってことだよね? >>613
古い話だけど、保木さんと渡辺の共著の中に書いてあるから今でも確認できる
保木さんは、既存の手法とぜんぜん違う方法で作ったから、ぶっちぎりで強いか、
全くダメかどっちかだと思ってたんだって
そしたらYSSや激指と大差なかったんで、むしろそのことに愕然としたって >>618
GodWhale5.0.4 だからR+20のでしょ
パラメータ調整だから短時間に強くなってるのかねぇ? 評価関数との相性じゃない?
本番で使う用の評価関数で強くなってるならそれでいいんだろうし >>581
これそのものと、公開されている従来の物との対戦結果の方を計測した方がいんじゃないの? >>613
強かったけど、ぶっちぎりで強かったわけじゃなくて普通の強い、だったみたいな感じ クジラちゃんの中にあるexeファイルって古いバージョンじゃなかったっけ >>608
うん。αβは、オーダリングで探索ノード数に物凄い差が出るからね。
夢物語的なifネタだけど、DLの評価関数が全局面に対する過学習レベル
の精度を持つようになったら、探索部は極端にシンプルなもので十分
という事になりかねない。
というか、評価関数以外の全ての仕組みが、不正確な評価関数をカバー
するためのものと言える。 WCSCの参加チームの一覧、更新されてるみたいなんだけど差分がわからん
全チームのアピール文書を片っ端からあたってくのも面倒くさいし >>615
>このわかめは入手できないわかめか 一般公開してないバージョンのわかめですね
wakame1stって大分前から公開されて入手出来るけど、評価関数wakame1stって明記されているのに、なぜ入手できないになるのかっておかしくない? >>620
一手100万ノードとかそんな短時間用に合わせてパラメーター調整したとは思えないけどな
R+20でこの結果ってどっちかの計測条件がおかしいんじゃないと疑ってしまうわ
+どころか大幅なマイナスになってるってどういうこっちゃ
godwhale_child-tournamentの日曜日更新版とはなにか違うんだろうか >>618
>そのクジラはR+20のバージョンじゃないってことだよね?
GodWhale5.0.4 4.80AVXTは公開されているR+20のバージョンそのものだけど、なぜR+20のバージョンじゃないってなるのか理解出来ない。 >>630
wakameは今年1月に公開された「wakame」と、今年2月に公開された「wakame1st」の2つだけだよ。 >>631
R+20にしてはやねに負け越しすぎじゃないかと思ったもんでね 4スレ10秒のノード数は分からないけどRotaさんは1500万で棋譜も公開してるしねぇ。
なんか自演失敗してるように見えるレスがチラホラあるけど気にしない。 なんとなく投了値が1000と3000だから入玉系の問題なのかしらん。 linux環境で対戦したら強くなっててwindowsバイナリだとビルドうんぬんで弱くなってたりして >>635
確かに2人の対局結果は正反対になっていて、どっちを信用していいのか分からないけど、手間かけて強くもないR+20バージョンを作ったとも思えないけど。 >>637
なるほど、そういう見方もあるんだね、この件は個人で使用している環境で自己検証するのがいいのか。 >>619
2コアのノートパソコンで初出場初優勝がぶっちぎりじゃないの?
多コアサーバ相手に全勝しなきゃならないのか。 >>639
みんな気付いてますよ
とっくにNGにしてます 全ての調査結果を信用するなら
godwhale_childはスレッド数が増えた時に弱くなるのかもしれない
4スレだとやねうら王+R20で35スレでは弱くなってしまうなら矛盾はない
同じ探索局面数だとしてもスレッド数が9倍もあったら性質は大きく変わるだろうし クラスタが売りのクジラでスレッド増えたら極端に弱くなるとかだったらさすがに悲しすぎる >>647
LazySMPだとスレッド数でノードの堀りかた大して変わらんのでは。
団子になって扉開けて奥の部屋に飛び込んでいくイメージ。 >>642
ボナンザ初登場時
二次予選7勝2敗 4位
決勝 6勝1敗 1位
負けた相手
備後将棋 TACOS YSS
たしかに強かったけど、ぶっちぎりではない。
勝ってる対局でもいくつかは歴史的大逆転みたいな展開があるし。
それに当時は多コア化が始まって歴史が浅く、サーバー相手でも今ほどの差はないし、プログラム側でも殆ど上手く使えてなかった。 あー謎が解けた
>>585だとgodwhale_childの方がNPSが高いけど
手元のWindows版だとやねうら王の方がNPSが高くなってる
試しに>>577からコードを落として
Linux用にコンパイルしてNPSを計測してみたけど
Windows版とは逆の結果になった
配布版がマージを取り込んでいないバージョンなのか
Linux版だけに有効な高速化がされているかのどちらかだね >>611
名人戦スレに250億ノードのグラフ落ちてたぞ >>642
650の説明で客観的には尽きてるんだけど、当の保木さん本人の主観として
「ぶっちぎりに強いか弱いかと思ってたら普通の強さだった」
って言ってるんだから、12年も経ったあとで外野が本人に対しておかしいとか言うの
ナンセンスじゃないか windows版のバイナリはavx2入ってなくても動くから適当な仕事してるだけでしょ >>651
一応手元でも確認してみたけど確かにそうだった くじらクライアントのwindows最新は、デフォルトが共有メモリでVSでビルド、Linuxのはclangじゃなかったかな
winはテスト仕様やね >>653
96コアを1時間0.78ドルのバーゲンで借りてた人か。
こりゃかなわんわ。
でもその人の解析でもやっぱ候補手で疑問手になるんだなあ… てことは、今年クジラちゃんの支援を本気でしたい人はLinux一択ってことね あのふざけたクジラには是非一度優勝してもらいたいもんだ >>602
うさ親さんと同じRyzen1800Xです(笑) うさぴょんの人とか自分で強いソフト作れない人って
プログラマとして何が違うんだろう? 主流に合流するかどうか
人間一人で出来ることなんてたかが知れてる うさ親さんや柿木さんが、今強いソフトを作れないからと言って
それが意味ないと思う人はいない 勘違いしてるよね。
コンピュータ将棋で自分で強いものを作ったっていえるような人は保木さんくらいしかいない。
あとは何かしらすでにコンピュータ将棋に応用されている技術をコピーしてるだけ。
コピーする割合で大会での成績が決まっているようなもの。
で、保木さんでさえ全てを一から考えたわけではない。
コピーする技術をどっから持ってくるかで難易度と印象は変わるけど、
ものすごい乱暴な言い方すれば自分ひとりで強いものを作れる人なんていない。 >>651
うちのwindowsの検証でも、くじら4.80Tより、やね4.80Tの方がノード数が高く、やや強いみたい。
windowsでは、今まで通り、やねでいいみたい。 追加で検証をしたところ
Windows版でもMSYS2でコンパイルすればやねうら王よりもNPSが出る事が判明した
NPSしか確認してないから強さは不明だけどコンパイル済のファイルね
https://1.bitsend.jp/download/328eed74e124938c1cc07a64b90ca4d1.html >>669
やねよりNPS出るのはすごいな、検証させてもらうわ >>669
公開ありがとう、自分でも念のため検証してみます。 優勝候補は不在 どこが優勝してもおかしくない。
クジラちゃんはやねうら王コピーには勝ててきちんと強くしたチームには勝てない印象 >>674
5000万NPSまで上げても今の所そこまで強くないので、
クジラちゃんについては、10億NPS以上の計算資源を常時確保できるか、
えびちゃんがクラスタ効率を上げられるか、探索と定跡をどこまでブラッシュアップ
できるかがポイントだと思う
で、意外とそれらがうまくいく可能性はあると思う
まあ、3日目の最終戦直接対決で優勝が決まることはなさそうだと思う 去年が20億だったかなたしか
エンジン開発もすすんでるし定跡も強いのは間違いないんだから入賞は固そう
怖いのはエラーだけ・・・去年もエラー吐いて反則負けあったような。 >>667
乱暴な言い方して良いなら保木さんもパクリだらけになるけど
そんな議論に意味ないね >>677
そもそも自分の力でどーとかって根本的に議論する意味ないじゃん。
意味あるなら教えてほしい。 クジラちゃんは非公開協力者のまふ定跡を使うと書いているけど、これは失格では 定跡って事前に時間かけて序盤を読んでおくってだけだし定跡は無しでガチンコでやってほしいよね そういう大会自分で開催すればいいんじゃね?
あとまふさんはどう考えても主な開発者じゃないからメンバーに名前が、なくても問題ない まふ定跡は相掛かりや横歩系の超急戦を誘う感じのを大量に入れているんだろうな。
嵌るのが嫌だったら角道を止めるか開けない定跡を入れておくとかした方が ここは専門的な話が多くてよくわからん
Linuxがトイレなのはわかるけど くじらちゃんの公開されているのは評価関数もwakameより強いのかも クジラちゃんのVersion 1.2.2.0 全部入り(更新日 2018/4/12)に同胞されている評価関数のレートが気になるのは私だけ? テストが重要かつ人集めが重要とはいえ
なんでえびちゃんは小出しに手の内を明かし続けているんだろう
あまりその辺深くは考えていない人だとは思うけど
直前に魔女を出して度肝を抜いた2年前の印象があるだけに 大会ルールだと「10%以上貢献した人」は届け出るとなっているから10%をどう判断するか >>688
恐らくその評価関数がwakameやaperypaq以上です 「参加プログラムの開発部の作成において主要な貢献」だからセーフ >>691
クジラ評価関数が上位ソフトと同等以上っていうソースはどこにあるの? >>663
ありがと。
ってことは4cってHT殺して4スレ? >>692
十一 開発部
思考部の中でライブラリ、一般に流布している定跡データ及び一般に流布している汎用ルーティン(チェス等、将棋以外のプログラムを含む。)を除いた部分。 10%以上貢献した人(例え
ば、アルゴリズム的に、又は、ソースコードの分量的に、等において)
開発メンバーが自ら自白しないかぎり貢献度はわからない。
ソースを10%以上書いてるならともかく
この辺はお金を払って参加する賞金のない大会だし参加者の良心に頼ってる部分 定跡で指した手数をカウントしておいて、大会中すべての手数で割った数値が10%を超えてたら
疑義を申し立てれば反則負けにできるかもねw 貢献っていうのは手数のことじゃなくね。
あと開発部っていうのは思考部の中から汎用ルーティンを除いた部分なんだよね。
そしてその思考部っていうのは参加プログラムにおける、指し手の生成に直接影響を与える部分。
ショットガンみたいなアプローチでもないかぎり定跡は指し手生成に直接影響を与えない >>681
事前にただ読ませただけではろくな定跡にならないんだよな(笑) >>685
雁木を流行らせたいsuimon乙(笑) まぁ、10%ルール自体がとても曖昧でどうとでも運用できる代物だから、
手数で10%以上だろうっていう明確な数値をCSAに突きつけて、どう判断するかは見てみたい。 ■ このスレッドは過去ログ倉庫に格納されています