【WCSC33】第33回世界コンピュータ将棋選手権
■ このスレッドは過去ログ倉庫に格納されています
コンピュータ将棋界の最も長い3日間、開幕
日程:2023年5月3日(火)~5日(木)
5月3日(火) 一次予選 変則スイス式8回戦 28チーム(通過10チーム)
5月4日(水) 二次予選 変則スイス式9回戦 28チーム(18チームシード)
5月5日(木) 決勝リーグ 1回戦総当たり7回戦 8チーム
大会特設サイト
http://drhoshiken.com/wcsc/33/
大会公式サイト(コンピュータ将棋協会)
http://www2.computer-shogi.org/wcsc33/
棋譜中継(評価値表示つき)
http://live4.computer-shogi.org/wcsc33/
中継ブログ
http://computer-shogi-live.cocolog-nifty.com/
ネット配信 YouTube大会公式配信
1次予選:watch?v=wteR8250h3k
2次予選:watch?v=IhcNaCls7yk 解説 千田翔太・遠山雄亮
決勝::wwatch?v=bIgFUAn6aYw 解説 西尾明・服部慎一郎 同じくらいの強さなら探索に汎用性がある方がいいかなってことでは 探索もそうだけど
ほんとにGUIはsyougiGUIで良いのかって問題も 探索の汎用性も何も皆やねうら王では?と思ったが、標準nnueはgithubが更新されるとmizarさんの力で自動でアップデート実行バイナリが配布されるのか。この辺はLíやW@nderERなど独自NNUE系は追い付けない一つのポイントか >>744
俺がblossomとタヌキ系を自前1000局比較しようと思った時、探索部を全く同じにした方が比較がよりしやすそうだと考えた。それでhaoを選択
次にhaoとLiと比較しようと考えたが、開発者自身が同じくらいと評してる2つの比較なら1000局程度じゃ明確な差が出たと言えなさそうで無期限保留(一秒指しで1000局丸48時間はかかったし)
そうなると実際に実測してないLiより、実測したhaoの方がblossomより強いと書きやすい DLエンジンのLightweight_Wcsc33は220Mバイト以上の大きなウエイトで
ponkotsu-wcsc33は20Mバイト以下の小さなウエイトだが自分が調べた結果
2つのエンジンの棋力は ほとんど差がないのでメモリ不足になりにくい
ponkotsu-wcsc33をお勧めします (ウエイト=DLエンジンの評価関数) >>741
検討用局面を用いて自分のPC環境で合格したソフトを採用するのが一番いいんじゃない
たとえば、
2016/10/11の新人王戦(☗増田康宏四段☖石田直裕四段)104手目の局面
sfen l7+L/1kg6/1sn+B1p+Pp1/ppppp4/7P1/PPPP3+r1/1SN2K3/4P4/L8 b R2GS2NL3Pbgsp 105
2017/1/8の玉将戦(☗郷田玉将後手久保九段)63手目の局面
sfen lns4nl/1kl1+R2g1/ppp1+Pp2p/3p5/5NP2/2P1pS3/PP1P1P2P/rSK6/+bNGG1G2L w Pbs2p 64
2017/7/12A級順位戦(☗久保玉将☖行方八段)92手目の局面
sfen 5gk1l/4g4/3ppps1+P/p1+R1nbpp1/7n1/PP2P1KPL/L3+BPS2/7g+p/2P6 b R2S2NL3Pgp 93
などを検討させて比較するとか
俺はこうした検討用のストックをいくつか試して検討用のソフトを決めているよ
最近のストックがないからお勧めがあれば欲しいね
次のこれなんかはソフト用試験問題として優秀じゃないかな
検討用試験問題
sfen 1G6l/k2+P3G1/l1nS+R+P2N/pp1N2P2/PP2p1r2/1LS1g4/2S+p5/L2p1S2G/bNK2+b3 b 7Pp 1
この試験問題で試すとHao>Blossom>水匠だね やはりHaoこそが最強ソフトだったか・・・
本番LiではなくHaoで挑んでいたらもっと好成績だったりしたかもね。 そういやあんまりネタにならないけど、ふかうらおうの中身って改良進んでるんだろうか? 懐かしのyaselmo+SMとHaoを戦わせたら手合違いレベルでHaoが圧勝し続けてる
こうして戦わせると将棋ソフトの進化が目に見えて面白いね HAOと水匠5をShogiGUIで対戦させると先手が勝つ。設定が悪いのかな HaoやBlossom、香落ち上手で居飛車指すのは探索のバグ?評価関数の限界?
yaselmoにすらボコボコにされてるから、それが最善ではなさそうではある >>753
両者の評価値グラフを目で追いかけてると面白いよね
負けるほうも途中まで自分のほうがいいと主張しているのがよくわかったり、急な反省がどの辺で起こりやすいかを見るのも面白い 飛車を振っているのに検討させると飛車を2筋に戻したがるソフトはすべて居飛車偏重の評価値になっているだけ 居飛車偏重が単に最善追求の結果ならそれでも構わないけど
NNUE系の香落ちの弱さを考えるとそうでもなさそうなんだよね
いくらなんでもyaselmoにボコボコにされるのは弱すぎるでしょ 局面編集で初形▲78飛から始めると高確率で初手▲28飛を選択するソフトがある
相居飛車は人間よりAIのほうが先手勝率が高いのにわざわざ後手居飛車にして戦おうとするのは愚の骨頂
如何にソフトの評価値が居飛車偏重で作られ過ぎているかということだね 一手得先手三間飛車より後手相居飛車のほうがいいという理屈はあり得ない
一手得三間飛車の利を最大限に生かすような定跡を編み出すようには評価関数が作られていないというだけだろう 78飛の初形から76歩26歩で進めてどういう挙動になるのか
実際の勝率はどうなるのかな 振り飛車の超序盤だとかなりのソフトがまだ居飛車に振り直しちゃうね
▲4八玉まで上がってても▲5八玉▲2八飛と戻してしまう 山岡さんが言うにはNNUEは過学習させた方が強いらしい。上位NNUEは平手居飛車に特化させ過ぎてるから、それ以外の局面だと若干へなちょこなのだろう。 >>765
そうかな? ちなみにtanukiの野田さんのブログを見るとAI同士の計測は対抗型も含まれるオールラウンダーな、
たややん互角局面集の24手までを使用し25手からAIに思考させて計測されているので相居飛車以外が
へなちょこっていう指摘は必ずしも的を得てないと思う。計測で平手初期局面からだと確かにある戦型に特化されて
いるという可能性は否定出来ないけどね。 >>766
その互角局面集が互角であると判断するために使っている評価関数がNNUE型なんだからダメでしょ。
しかも元記事を見たら
>「ソフト的に見て互角」なので、対抗形は必然的に含まれません
って書いてあるし。
ソフトは対抗系を正しく判断できていないという前提のもとで
互角であるかどうかを無視した対抗形の序盤局面で先後を入れ替えて計測しないと。 >>767
そうは言っても同じ探索部の振り飛車に特化された人間より圧倒的に強い最強評価関数に勝率70~75%もあれば
対抗形の検討ソフトとして使うには申し分ないでしょ あとfloodgateは角換わりと相掛かりで五割の棋譜を占めるから
互角局面集と言ってもfloodgateから抽出すると
実質的には角換わり相掛かり互角局面集。
floodgate経由での互角局面集で計測する限り
角換わりと相掛かりで強くなりさえすれば計測レートが上がるし
逆にそれ以外の戦型で強なくっても計測上のレートは上がってないように見える。 >>722 を途中でやめちゃったけど500局ちょっとやって
改造初形(大駒が鏡対象な初形)でやってblossom勝率55%くらいだった
通常の初形では>>650 などにあるようにタヌキが勝率55%くらいだったことを踏まえると「飛が向き合ってる将棋ではblossomの方がタヌキより強い」と言えるのかもしれん
※ただ時々見てると、双方が角側に囲う普通パターン、後手が地下鉄中住まいパターン、先手が初手袖飛車に振り直してしまうパターン、などが混ざってるようだった。どのパターンを好んで選ぶかでも勝率が変わる可能性もあるので、指定局面で先後入れ替え測定も欲しいところ >>767
この場合の振り飛車評価関数は定跡なしでほぼ100%振り飛車を指すYO6.03_Shinderella0825 レート4625もある
やつね。Qhapaqレーティングサイトから。 居飛車最強はレーティング4900越えで、しかも今のソフトはそれより強いのワンサカいるという
まあ普通に考えたら居飛車>振り飛車だね >>771
定跡無しで振り飛車指すような評価関数は無理やり弄ってるんだからそりゃ弱いでしょ。
バランスの良いランダム局面でも強い評価関数が、現時点の計測法では発見されにくいという話だよ。
互角局面集の戦型が偏っているから
強さが偏った評価関数が計測上のレーティングでも高くなりやすい。
もちろん初手からの計測でも、誘導されない局面での精度の上昇は計測できない。
チェスように、計測用のバランスの良い局面集が必要。 >>750
ありがと。やはり局面を指定して読ませないとだよね
先日の名人戦二日目を自前のhaoとblossomとを動かしながら、AbemaとYoutuber水匠と候補手を比較してたんだけど、
例えばこの動画でAI越え扱いされてる「感想戦での▲99香打」
ttps://youtu.be/t3QZ-efeUe0
この手はAbemaで武富礼衣女流が早々に挙げてて解説されてた手なのだけど、
水匠やblossomは第一候補手に挙げてた(blossomは僅差で第二候補手に▲68金)
一方、Abemaとhaoは▲68金を第一候補手にしてて、haoは100点以上差をつけて第二候補手に▲99香打。しかし▲99香打を入力して少し読ませてから局面戻すと反省する)
少し厄介なのは、タヌキ特有の大きめの評価値のせいか、タヌキだけを使ってたら▲68金しか掘り下げなかっただろうなと。
(blossomなら▲99香打も▲68金も僅差だったから両方掘り下げようかと思える) >>774
スマン、少々誤爆。水匠とAbemaの候補手のところなかったことにしてくれ。
(Abemaを見てて「読み筋4手目まで見せてくれよ」と思った記憶があるから、この局面の話じゃなかったかもしれん。水匠の方も読み筋に出てたのが▲68近だったかもしれん。曖昧なこと書いてスマンカッタ) やねうら王の探索部内部でも評価値を判断材料にした延長や枝刈りがあった筈で、評価値高めに出るHáoで既存の標準NNUEより強いというのが面白い
あー、それとも、だからfv_scale20で強いのか? サヴァンが最新のパソコンでタイトル独占してるから
若手が可哀想なので最新のパソコンに対抗して
若手に優先的に最新の優勝ソフトを提供してほしい。
これでは公平な試合にならない。スペック勝負だよ >>777
詰将棋選手権の優勝賞品を最新PCにしたら良いんじゃないかな?
パソコン研究が関係ない競技だから若手棋士でも優勝のチャンスがあるぞ >>770
おお
角の位置まで入れ替わってるので何とも言えないが、やっぱりtanukiが振り飛車苦手にしてる可能性が高まってきたか
あとはryfamateさんの測定を待つかな
振り飛車絡み(相振り含む)の測定やると水匠4改が今なおかなり強い
tanukiもwcsc33よりdr3の方が勝率良かったりする
sqmz-dやQPDもそれ用に仕上げてるだけあってなかなか強い HáoとBlossomのキメラはどこで入手(作成)できるの?
キメラで戦型別の強さがどう変化するのか計測したい >>779
振り飛車絡み(相振り含む)の測定なら、対抗形も含まれている、たややん互角局面集が比較的に
有名で、これでいつも計測されているtanukiは振り飛車も強い。自分もtanukiは2018年頃から公開された
評価関数を互角局面で計測していたけど、いつも対抗形はトップクラスの勝率だったよ。 ADA Channel / 都賀町えいだ チャンネル ※昨日21時半~やってました
【#開発者対談】第33回世界コンピュータ将棋選手権第11位「ponkotsu」開発者のJJ1GUJさんと対談
https://www.youtube.com/watch?v=79Ey1pygL14
バーチャルYouTuber「都賀町えいだ(つがまちえいだ)」とは
コンピュータ将棋ソフト「元気もりもりニンニクパワー」の開発者です 問答無用で5chレスorスレ立て代行依頼スレin新狼避難所84
https://jbbs.shitaraba.net/bbs/read.cgi/internet/20619/1684717050/86
86 名前:名無し募集中。。。[sage] 投稿日:2023/05/24(水) 01:56:00
レス代行をお願いします
【状況】ERROR: 余所でやってください
【板名】将棋・チェス
【スレッドタイトル】【WCSC33】第33回世界コンピュータ将棋選手権
【スレッドURL】https://mevius.5ch.net/test/read.cgi/bgame/1683065235/
【名前(省略可)】
【メール欄(省略可)】sage
【本文】
ADA Channel / 都賀町えいだ チャンネル ※昨日21時半~やってました
【#開発者対談】第33回世界コンピュータ将棋選手権第11位「ponkotsu」開発者のJJ1GUJさんと対談
https://www.youtube.com/watch?v=79Ey1pygL14
バーチャルYouTuber「都賀町えいだ(つがまちえいだ)」とは
コンピュータ将棋ソフト「元気もりもりニンニクパワー」の開発者です 山岡互角局面集から
振り飛車局面だけを抽出した互角局面集を作ったぞ
https://anonfiles.com/H0n9i7t0z1/TadaoYamaoka_zip
これで対抗形での強さを計測可能になる
軽く計測したらHaoよりLiの方が強い気がする >>729
うちの計測だとやねうらNNUE系列に全然勝てないので、設定を教えてもらえませんか
うちはたややん互角局面、3700x、rtx2070、1手3秒、ResignValue3000でやってますが、中盤ponkotsuがややリードするも終盤捲られて負けてばっかですね
ポンコツのNPSは30kほどですが、dlshogi付属のシリアライザ使ったのでbatchsize128なのと悪いのかなとは思ってます >>785
私の設定等は CPU i7-10700KF GPU RTX3070 1手8秒、ResignValue4000 です
RTX2080内蔵PCも所持していますがNNUEトップクラスに全然勝てないので2080Ti等は未確認ですが
恐らくponkotsu-wcsc33はRTX2000シリーズではNNUEトップクラスに全然勝てないのでは?
dlshogi_wcsc32(ウエイト model-dr2_exhi.onnx)とponkotsu-wcsc33は ほぼ同じ棋力なので
RTX2070内蔵PCでdlshogiがNNUEトップクラスに全然勝てないのならponkotsuも全然勝てないと思います 角換わりは先手必勝なのに互角局面集()に載ってる矛盾 tanuki-のHalfKP-1024-8-16は最近本家やねうら王にマージされたから次回リリースからは含まれるはずなのでもう独自NNとして分けて考える意味も薄い
とはいえ手元で試すと標準NNUEとの速度差がPCによってまちまちだったので、 自分のメインマシンでLiが速く動作するかどうかくらいの基準で選んでもいいかも?
>>751
むしろアピール文書の計測資料とかみるとW@nderERが出来すぎた結果に見えるし評価関数の強さ以外(定跡、指運、相性、Qhapaq戦での異常終了など)が絡んでそう? >>786
私の方ではdr2_exhiでは互角相当なんですよね、こうなるとバッチサイズを変えてserializedファイルを作り直してみるか、平手からにしてみるか位ですか… HalfKP-1024-8-16だとSIMDのビット幅で足切りマシンが発生するのかね? >>790
RTX2080内蔵PCで確認した所 dlshogi(dr2_exhi)とBLOSSOMは ほぼ互角です
ponkotsuのRTX2080機で棋力が上がらない理由を引き続きチェックします >>790
私のRTX2080機(CPU Ryzen 7 1700)でponkotsuの本来の棋力が発揮出来るようになりました
ponkotsu-wcsc33とBLOSSOM(FV24)を対戦させたらponkotsuの勝率66%くらいでした
CPUとGPUの種類によって勝率が変わります
方法はdlshogi(dr2_exhi)の model-dr2_exhi.onnx.0.128.serialized を
コピペとリネームしてponkotsu用に流用して下さい >>702
wandererのソース公開されてるね
もうみんな興味ないだろうけど >>793
dr2_exhiのシリアライズファイルをリネームしたらdr2_exhiのモデルを読み込んでしまうと思っていましたが、そういう方法もあるのですね。参考になります。 駒の書体@Ryfamate@komafontさんのTwitter見たら
振り飛車(対抗系)初期局面集を用いて、NNUE評価関数を総当たり方式で対局させた計測結果を
ツイートされているけど、tanukiは互角局面集の計測で開発されているので対抗形が強そうね
Hao (FV20) 勝率52.3% 4スレ3.2秒
BLOSSOM (FV24) 勝率51% 4スレ3.2秒
水匠5 (FV24) 勝率48.6% 4スレ3.2秒
SQMZ_Cendrillon2 (FV24) 勝率48.1% 4スレ3.2秒 Haoやwandererはどのくらいのスペック(ノード数)で使えばトップクラスの棋力出るんだろう >>796
>>770とは違う結果なのはなぜだろう。持ち時間が1秒or3.2秒? >>798
Ryfamateさんはwcscでは強豪ソフトの開発者の一人だし、tanukiは以前は
tanuki互角局面集を、今は、たややん互角局面集の計測で開発されているのも
あるのでtanukiは対抗形は強い評価関数ってことでいいんじゃないの? >>799
したら、blossomの方が対抗形強いんじゃね?問題は、ハオ強いで決着でOK? >>800
振り飛車のみの局面の総当たりで各1080局も計測してるのと
勝率でも上回っているので対抗形はHaoが最強評価関数の一つってことで
いいんじゃないの?
Hao (FV20) 勝率52.3% 4スレ3.2秒
BLOSSOM (FV24) 勝率51% 4スレ3.2秒 BlossomとHaoのキメラだけど、対Haoの強さは誤差レベルだしHaoでいいんじゃないのとは思う。
キメラ(FV20)対Hao(FV20)
477勝435敗88分
80%信頼区間でレート差0~30 >>804
水匠電竜が棋神アナリティクスの水匠のことだったら >>676 を参照してください
公開されない将棋エンジンは絵に描いた餅です >>804
flootgateの放流最終日を見ると初手から先後共に定跡なしのLiのi9-13900KF(24コア)の方が
先後共に定跡を使用しているSuisho8_TR3990X(64コア)よりレート170ほど高いので今は
最新水匠が優位になっている状況ではないけどね
tanuki-WCSC33_i9-13900KF レート4600 (放流最終日2023-05-21) 101勝10敗(0.910)
Suisho8_TR3990X レート4428 (放流最終日2023-05-27) 142勝20敗 (0.874) 対抗形の互角局面って互角の割には意外と振り飛車側の勝率が高く出る
これって序盤の段階では対抗形の形勢判断が正確にはできてないってこと? 現在 対抗形の激闘が行われている叡王戦 第4局指し直し2回目の71手目では藤井叡王が
大差でリードしているが 某棋譜中継サイトではAI3種類の形勢判断が表示されている
水匠5-1550 dishogi-1291 BONANZA-459 エンジンによって大幅に異なるのが興味深い
https://fujiisouta.xyz/2023-5-28-3sokuho.html そのボナンザは、敢えて古い「人間と同等レベル」なソフト代表として採用してるんだっけ
あと評価値はスケールがバラバラなのはあるあるだしなんとも やねうら王の実行ファイルの更新って最近あります?
Mizarさんの最後の更新が去年の6月ですがその間更新がないのですか? 佐々木大地君に優勝ソフトを無償で提供してほしい。このままだと
ブサヴァンが最新のパソコンでタイトル独占してしまう
とても公平な試合とは言えない >>810
これまではcommitの度に勝手に実行ファイルが更新されていたはずですが、そういえば最近は配布されてないですね、、、
MizarさんのTwitterアカウントに問い合わせてみたほうがいいかもですね。 >>811
棋力が違いすぎて消化できず逆に調子を崩すかも >>810
Mizarさんはコンピュータ将棋界から手を引いたってどこかで聞いたことあるよ
事実かは分からないけど。。。 @kishinanalytics
藤井聡太叡王が豪快に詰ませた叡王戦第四局の局面。
世界コンピュータ将棋選手権優勝バージョンのdlshogiでは74ノードで読み切ります。
水匠では5000万ノードでもまだ詰み手順にはたどり着きません。
dl系、NNUE系の個性が如実に現れる局面だったようです。
https://pbs.twimg.com/media/FxRjk_ZaAAAxv0s.jpg 全然使わないCPUで詰めルーチン動かせるから見つけられたわけで、dl系の直接的な個性ではないよね。
二番絞りみたいに詰みルーチンなくても読めた、とかなら凄いけど 詳しくない人が言うならまだしも
会社がこんなリリース出して恥ずかしくないの? Hao使って叡王戦の棋譜を元にブン回してるけど後手三間、かなり粘れるね100手越えてもまだまだ互角範囲
1手の緩手で読み進めると後手有利になったりするし
普通に有力戦型だろこれ >>816 >>817
生活が懸かっているから誇大広告気味になったのだろう
技巧2でも30手前後の詰みなら1秒以内に解く これノードってどういう意味なんだろ。
DLの場合は局面からの合法手の数? へーfv_scaleの設定値で評価値のスケール変えると枝刈りの条件が変わって
結果として読み筋が変化することもあるのか。 タヌキはFV_SCALEを20より上げて評価値の大袈裟加減をマイルドにした方が検討では使いやすいのかな?
blossomと対局させてた時の評価値グラフも波打ってること多かったし、20が一番勝率が良かったとはいえなんかそれじゃない感も。
検討させるときは十秒以上はかけるし、枝刈り甘めにして複数候補手をしっかり考えさせる方がいいのかな? それで手が広くなるなら、マルチFV_SCALEの合議システムみたいなので強くなる可能はあるんだろうか? Twitter担当が広報部門で全く技術的な知識が
無くて思い込みで雑に書いた上に
社内のチェックも無くツイートしたのか
素人だったら騙せるやろ(実際騙されてる)と
思ってやったのか 家庭用PCの水匠だったら棋戦の二十数手の詰みなんか1秒以内に見つけている
棋神アナリティクスの水匠が >>676 の指摘通り頼りにならない? 最新ふかうらは詰みエンジン組み込んであるってアピール文にあったような。 df-pnアルゴリズムを使った詰将棋用エンジン積んでるんやろ >>824
そもそも合議制って過去上手く行った例なくない?(詰将棋エンジンは除く)
以前ニコニコでもやってなかったけ?ソフト3つで合議制させるも、候補手上位2つ3つは重複しがち&弱いソフト2つが同じ意見で強いソフトの最善手が選ばれないこともあり、最強ソフト単独の方が強かった的な >>830
ニコ生やABEMA独自みたいなモロ興行のやつやあから2010みたいなとりあえず動かしてみる実験みたいなのは置いとくとして
一応合議の祖である文殊の時点でマシン1台よりは乱数を少し入れたソフト+同じマシン3台のほうが少し強いことは確認されててないよりはマシだった(やねさんには同じマシン3台でGPSやボンクラーズのような探索木を分割するようなクラスタ比較しないとフェアじゃないと言われてたけど)
普通に探索木分けるようなクラスタと比べると棋力の上昇幅は小さいかわりに手軽に実装できる上に耐障害性が高いという強みがあるので、全面に押し出してはいなかったものの技巧やPonanzaも選手権で採用してたことがあったはず >>831
GPSやボンクラーズの場合は「同じ性能と同じ評価値アルゴリズムを持つもの」を並列で動かしてるから、手の採択も簡単だけど、
例えば以下のようなケースの場合(ソフトでなく人力でもいいんだけど)具体的にはどう採択するの?
例
ソフト4つ用意する。
A.Hao(SV_SCALE=20)
B.Hao(SV_SCALE=24)
C.blossom(SV_SCALE=24)
D.水匠8
ある局面を評価させたらこんな結果が出た。
A-
候補1. 500点 ▲AAA
候補2. 100点 ▲BBB
B-
候補1. 300点 ▲BBB
候補2. 250点 ▲AAA
C-
候補1. 150点 ▲BBB
候補2. 140点 ▲AAA
D-
候補1. 400点 ▲CCC
候補2. 300点 ▲AAA
候補手は3通り出た
さてどれを採用しよう?
・人間的には水匠8が一番強いのを「メタで知ってる」から▲CCCを選ぶ?
・「多数決」で▲BBBを選ぶ?
・「評価値の絶対値」が一番大きい▲AAAを選ぶ?
などなど 独自定義のなんちゃって用語とかが受けつけにくいかもだが、あらきっぺさんの合議のための実験を読むと大変そうだなとは思う。
https://arakippe.com/archives/denryu-sen3-1.html >>832
まず普通は各ソフトの候補手は1しか出さない(MCTSではなくαβ系の探索を使っているソフトの場合、候補手を増やせば増やすほど探索の効率が悪くなり同一時間では弱くなるため)
文殊のアルゴリズムでは同数で意見が割れた場合はランダムに選択する
こんなシンプルな方法でも元のソフトよりは強くなったとのこと(もちろんそれぞれのソフトの棋力が近い必要はあるが)
ただし事前に棋力の高いソフトが分かっているならそれを優先させたほうが強くなることも文殊の資料で示唆されてる
他には評価値のスケールが合ってるなら楽観合議(候補手の中で評価値の高い手を選択) が有効という話もある(むしろこちらが主流?)
多数決合議だと棋風が似たソフトが入ってるとそちらに過剰に引っ張られてしまうところ 、楽観合議だとそうした影響が少ない
あとGPSやボンクラーズもそんな単純な話じゃない
同じAIに同じ局面で同じ手を同じように読ませても意味はないので何かしらの方法で担当を割り振る必要があるけど、それをどうやって割り振るのかとか、分岐が少ない局面を割り当てられたマシンが滅茶苦茶先まで読んじゃった場合に探索深さがあまりにも異なる評価値を同列に扱っていいのかとか
あと読みを分担するとどれかのコンピュータが壊れちゃうと担当分が壊滅するからこれをうまく回避する必要がある(合議だと誰かいなくても問題なく残りのメンバーで続けられる)
Ponanza ChainerのExtreme Lazy SMPならもう少しシンプルみたいだけど、直感的にはかなり安定して遅延の少ないネットワークでないと性能がでなさそうな気がする >>833
そのチャレンジは興味深かったよね
>>832
文殊の論文が2009年、その後コンピュータ将棋の合議に関する論文は、文殊が2009年、その後2011年あたりで終わってそう
https://www.jstage.jst.go.jp/article/jjsai/26/5/26_525/_pdf
https://www.ieice.org/publications/conference-FIT-DVDs/FIT2011/data/pdf/F-043.pdf
10年以上前とはソフトの棋力も格段に違うし、合議の研究自体がその後継続されてないみたいだし、現在ではコンピュータによる合議アルゴリズムは効果的でないと判断されてるんじゃないかな
(そうでなければ合議系が主流になってると思われ)
GPSやボンクラーズの「そんな簡単な話じゃない」のは理解できるよ
でもそれは「合議のアルゴリズム」の話ではないよね
(その話は「複数のマシンを統合して、まるで1台のつよつよマシンのように振る舞わせるのは簡単じゃない」って話だし) 話を「検討ソフトのより良い活用方法があるか?それは合議か?」に戻すけど
・検討で使うとき、Haoは評価値が大袈裟にでがちだけど、
(最適値とされてる)FV=20と、(評価値をマイルドにさせるための)FV=24と合議した方がいいのか?合議させるならどうすれば美味しいか?
・検討で使うとき、Haoとblossomとで合議するならどうしたら美味しいか?
・棋神アナリスティックスを使ってdlshogiと水匠の読み筋が異なるとき、どう判断すると美味しいか?
・アベマとYouTube水匠最新とで読み筋が異なる時、どう判断すると美味しいか?
(10年以上前の文殊論文に従って、ランダムに選択していいの?
スケールを合わせるって「初形で同じ数値にすればOK」とそんな簡単な話?
もし合議で強くなるなら「既にdl系とNUEE系のハイブリッドがトップになっててもおかしくない」が、現実はそうなってないということは合議は難しい?)
個人的には、良さそうな合議アルゴリズムはないんじゃないか、と思ってるのだけど俺の知らない合議のナイスアイデアがあるなら知りたいなと >>833
合議(笑)とかいうソフト指しw
^^
悲惨だなw
^^ >>835
合議は普通に2017年の選手権でも技巧が使ってるし、その前はPonanzaが長いこと使ってた
その後は下火だけどそもそも電王戦での一番注目が集まるフェーズが終わって大規模なマシンリソースを用意すること自体が下火になった感じだし
合議やるくらいだったら他の方式のクラスタのほうが将来性があるという見解が主流なのはそうだけど、耐障害性の高さや実装の楽さなど合議の強みは確実にあるわけで「上手く行った例がない」というのは明確に間違い 合議に汎用性があるならNNUEだろうがDLだろうが
使えるはずがそうはなってないので
技術として確立したとはいえないのだろう
αβ探索のクラスタも最近は下火ぽいけど… >>839
俺もそう思うなぁ
>>838
2017年はelmoが優勝した年か
これは話題になったけど、
ttps://yaneuraou.yaneu.com/2017/05/23/ooparts-brought-by-elmo/
合議制が優秀という話は聞かなかったなぁ
>大規模なマシンリソースを用意すること自体が下火になった
それは探査部の枝刈り技術だったかに技術革新が起きて、それまでの力業探索から路線変更が起きたからじゃなかったっけ?
>耐障害性の高さや実装の楽さなど合議の強みは確実にある
そういうのは大元の >>823-824 の回答になってないんよ
合議制にも色々メリットがあるのは知ってるけど、
お前さんが詳しいのは十分わかったから、
合議のアルゴリズムの観点から 大元の>>823-824 (や >>868)に回答してくれよ 各エンジンのパラメータや出力をそのまま合議専用NNにぶち込んで、そこから1手をひねり出させればいいんではなかろうか。
もう人間がなにかを決めるのはやめよう。 >>842
計算コスト大きくなって、結局単一モデルを大きくしたほうが強いとかありそう ぶっちゃけ普通のNNUEなんてトップとその他で僅かな差しか無さそうだし、長時間検討させるなら探索部の影響の方が大きいので、気になる局面を検討させてみて、好みの結果を返すNNUEとセッティングを選べばいいんじゃないかな。 ADA Channel / 都賀町えいだ チャンネル 昨日21時半〜23時までライブやってたね
【#開発者対談】タブレットで第33回世界コンピュータ将棋選手権第23位「ねね将棋」開発者のselect766さんと対談
https://www.youtube.com/watch?v=BnzZc9uXmV8 ■ このスレッドは過去ログ倉庫に格納されています