X



トップページ将棋・チェス
1002コメント334KB

【WCSC33】第33回世界コンピュータ将棋選手権

■ このスレッドは過去ログ倉庫に格納されています
0001顔文字は隔離スレへ
垢版 |
2023/05/03(水) 07:07:15.44ID:EkHj/0OK
コンピュータ将棋界の最も長い3日間、開幕

日程:2023年5月3日(火)~5日(木)
5月3日(火) 一次予選 変則スイス式8回戦 28チーム(通過10チーム)
5月4日(水) 二次予選 変則スイス式9回戦 28チーム(18チームシード)
5月5日(木) 決勝リーグ 1回戦総当たり7回戦 8チーム

大会特設サイト
http://drhoshiken.com/wcsc/33/
大会公式サイト(コンピュータ将棋協会)
http://www2.computer-shogi.org/wcsc33/
棋譜中継(評価値表示つき)
http://live4.computer-shogi.org/wcsc33/
中継ブログ
http://computer-shogi-live.cocolog-nifty.com/
ネット配信 YouTube大会公式配信
 1次予選:watch?v=wteR8250h3k
 2次予選:watch?v=IhcNaCls7yk 解説 千田翔太・遠山雄亮
 決勝::wwatch?v=bIgFUAn6aYw 解説 西尾明・服部慎一郎
0745名無し名人
垢版 |
2023/05/22(月) 23:21:41.80ID:V4Ni6R5u
同じくらいの強さなら探索に汎用性がある方がいいかなってことでは
0746名無し名人
垢版 |
2023/05/22(月) 23:50:18.73ID:gr+GwCfc
探索もそうだけど
ほんとにGUIはsyougiGUIで良いのかって問題も
0747名無し名人
垢版 |
2023/05/22(月) 23:59:26.16ID:5dCpa52E
探索の汎用性も何も皆やねうら王では?と思ったが、標準nnueはgithubが更新されるとmizarさんの力で自動でアップデート実行バイナリが配布されるのか。この辺はLíやW@nderERなど独自NNUE系は追い付けない一つのポイントか
0748名無し名人
垢版 |
2023/05/23(火) 06:18:03.13ID:NuqHPBsS
>>744
俺がblossomとタヌキ系を自前1000局比較しようと思った時、探索部を全く同じにした方が比較がよりしやすそうだと考えた。それでhaoを選択
次にhaoとLiと比較しようと考えたが、開発者自身が同じくらいと評してる2つの比較なら1000局程度じゃ明確な差が出たと言えなさそうで無期限保留(一秒指しで1000局丸48時間はかかったし)
そうなると実際に実測してないLiより、実測したhaoの方がblossomより強いと書きやすい
0749名無し名人
垢版 |
2023/05/23(火) 11:00:57.52ID:yUTLHIxP
DLエンジンのLightweight_Wcsc33は220Mバイト以上の大きなウエイトで
ponkotsu-wcsc33は20Mバイト以下の小さなウエイトだが自分が調べた結果
2つのエンジンの棋力は ほとんど差がないのでメモリ不足になりにくい
ponkotsu-wcsc33をお勧めします (ウエイト=DLエンジンの評価関数)
0750名無し名人
垢版 |
2023/05/23(火) 15:18:35.79ID:azBmZBRE
>>741
検討用局面を用いて自分のPC環境で合格したソフトを採用するのが一番いいんじゃない
たとえば、

2016/10/11の新人王戦(☗増田康宏四段☖石田直裕四段)104手目の局面
sfen l7+L/1kg6/1sn+B1p+Pp1/ppppp4/7P1/PPPP3+r1/1SN2K3/4P4/L8 b R2GS2NL3Pbgsp 105

2017/1/8の玉将戦(☗郷田玉将後手久保九段)63手目の局面
sfen lns4nl/1kl1+R2g1/ppp1+Pp2p/3p5/5NP2/2P1pS3/PP1P1P2P/rSK6/+bNGG1G2L w Pbs2p 64

2017/7/12A級順位戦(☗久保玉将☖行方八段)92手目の局面
sfen 5gk1l/4g4/3ppps1+P/p1+R1nbpp1/7n1/PP2P1KPL/L3+BPS2/7g+p/2P6 b R2S2NL3Pgp 93

などを検討させて比較するとか
俺はこうした検討用のストックをいくつか試して検討用のソフトを決めているよ
最近のストックがないからお勧めがあれば欲しいね

次のこれなんかはソフト用試験問題として優秀じゃないかな
検討用試験問題
sfen 1G6l/k2+P3G1/l1nS+R+P2N/pp1N2P2/PP2p1r2/1LS1g4/2S+p5/L2p1S2G/bNK2+b3 b 7Pp 1
この試験問題で試すとHao>Blossom>水匠だね
0751名無し名人
垢版 |
2023/05/23(火) 17:03:06.53ID:Nn/9NzwX
やはりHaoこそが最強ソフトだったか・・・
本番LiではなくHaoで挑んでいたらもっと好成績だったりしたかもね。
0752名無し名人
垢版 |
2023/05/23(火) 17:45:10.16ID:0zI5rs11
そういやあんまりネタにならないけど、ふかうらおうの中身って改良進んでるんだろうか?
0753名無し名人
垢版 |
2023/05/23(火) 18:02:18.29ID:Nn/9NzwX
懐かしのyaselmo+SMとHaoを戦わせたら手合違いレベルでHaoが圧勝し続けてる
こうして戦わせると将棋ソフトの進化が目に見えて面白いね
0754名無し名人
垢版 |
2023/05/23(火) 18:12:37.89ID:IXjo7En2
HAOと水匠5をShogiGUIで対戦させると先手が勝つ。設定が悪いのかな
0755名無し名人
垢版 |
2023/05/23(火) 18:16:53.09ID:Nn/9NzwX
HaoやBlossom、香落ち上手で居飛車指すのは探索のバグ?評価関数の限界?
yaselmoにすらボコボコにされてるから、それが最善ではなさそうではある
0756名無し名人
垢版 |
2023/05/23(火) 18:38:01.39ID:azBmZBRE
>>753
両者の評価値グラフを目で追いかけてると面白いよね
負けるほうも途中まで自分のほうがいいと主張しているのがよくわかったり、急な反省がどの辺で起こりやすいかを見るのも面白い
0757名無し名人
垢版 |
2023/05/23(火) 18:40:14.62ID:azBmZBRE
飛車を振っているのに検討させると飛車を2筋に戻したがるソフトはすべて居飛車偏重の評価値になっているだけ
0758名無し名人
垢版 |
2023/05/23(火) 18:46:13.46ID:Nn/9NzwX
居飛車偏重が単に最善追求の結果ならそれでも構わないけど
NNUE系の香落ちの弱さを考えるとそうでもなさそうなんだよね
いくらなんでもyaselmoにボコボコにされるのは弱すぎるでしょ
0759名無し名人
垢版 |
2023/05/23(火) 18:48:29.76ID:azBmZBRE
局面編集で初形▲78飛から始めると高確率で初手▲28飛を選択するソフトがある
相居飛車は人間よりAIのほうが先手勝率が高いのにわざわざ後手居飛車にして戦おうとするのは愚の骨頂
如何にソフトの評価値が居飛車偏重で作られ過ぎているかということだね
0760名無し名人
垢版 |
2023/05/23(火) 18:51:53.93ID:SieybT/b
横方向を周期境界にすれば
0761名無し名人
垢版 |
2023/05/23(火) 18:55:16.59ID:azBmZBRE
一手得先手三間飛車より後手相居飛車のほうがいいという理屈はあり得ない
一手得三間飛車の利を最大限に生かすような定跡を編み出すようには評価関数が作られていないというだけだろう
0762名無し名人
垢版 |
2023/05/23(火) 19:36:13.50ID:gRf08+f0
78飛の初形から76歩26歩で進めてどういう挙動になるのか
実際の勝率はどうなるのかな
0763名無し名人
垢版 |
2023/05/23(火) 19:49:25.59ID:rRvcVmRs
振り飛車の超序盤だとかなりのソフトがまだ居飛車に振り直しちゃうね
▲4八玉まで上がってても▲5八玉▲2八飛と戻してしまう
0765名無し名人
垢版 |
2023/05/24(水) 00:35:58.13ID:ldyQHckZ
山岡さんが言うにはNNUEは過学習させた方が強いらしい。上位NNUEは平手居飛車に特化させ過ぎてるから、それ以外の局面だと若干へなちょこなのだろう。
0766名無し名人
垢版 |
2023/05/24(水) 00:49:44.31ID:xn+HmWTV
>>765
そうかな? ちなみにtanukiの野田さんのブログを見るとAI同士の計測は対抗型も含まれるオールラウンダーな、
たややん互角局面集の24手までを使用し25手からAIに思考させて計測されているので相居飛車以外が
へなちょこっていう指摘は必ずしも的を得てないと思う。計測で平手初期局面からだと確かにある戦型に特化されて
いるという可能性は否定出来ないけどね。
0767名無し名人
垢版 |
2023/05/24(水) 00:57:30.55ID:+cUNsPSc
>>766
その互角局面集が互角であると判断するために使っている評価関数がNNUE型なんだからダメでしょ。
しかも元記事を見たら

>「ソフト的に見て互角」なので、対抗形は必然的に含まれません

って書いてあるし。

ソフトは対抗系を正しく判断できていないという前提のもとで
互角であるかどうかを無視した対抗形の序盤局面で先後を入れ替えて計測しないと。
0768名無し名人
垢版 |
2023/05/24(水) 01:11:42.17ID:xn+HmWTV
>>767
そうは言っても同じ探索部の振り飛車に特化された人間より圧倒的に強い最強評価関数に勝率70~75%もあれば
対抗形の検討ソフトとして使うには申し分ないでしょ
0769名無し名人
垢版 |
2023/05/24(水) 01:11:49.17ID:+cUNsPSc
あとfloodgateは角換わりと相掛かりで五割の棋譜を占めるから
互角局面集と言ってもfloodgateから抽出すると
実質的には角換わり相掛かり互角局面集。

floodgate経由での互角局面集で計測する限り
角換わりと相掛かりで強くなりさえすれば計測レートが上がるし
逆にそれ以外の戦型で強なくっても計測上のレートは上がってないように見える。
0770名無し名人
垢版 |
2023/05/24(水) 01:16:00.91ID:YeFk/1zl
>>722 を途中でやめちゃったけど500局ちょっとやって
改造初形(大駒が鏡対象な初形)でやってblossom勝率55%くらいだった
通常の初形では>>650 などにあるようにタヌキが勝率55%くらいだったことを踏まえると「飛が向き合ってる将棋ではblossomの方がタヌキより強い」と言えるのかもしれん

※ただ時々見てると、双方が角側に囲う普通パターン、後手が地下鉄中住まいパターン、先手が初手袖飛車に振り直してしまうパターン、などが混ざってるようだった。どのパターンを好んで選ぶかでも勝率が変わる可能性もあるので、指定局面で先後入れ替え測定も欲しいところ
0771名無し名人
垢版 |
2023/05/24(水) 01:16:27.58ID:xn+HmWTV
>>767
この場合の振り飛車評価関数は定跡なしでほぼ100%振り飛車を指すYO6.03_Shinderella0825 レート4625もある
やつね。Qhapaqレーティングサイトから。
0772名無し名人
垢版 |
2023/05/24(水) 01:20:17.64ID:htGw/O7r
居飛車最強はレーティング4900越えで、しかも今のソフトはそれより強いのワンサカいるという
まあ普通に考えたら居飛車>振り飛車だね
0773名無し名人
垢版 |
2023/05/24(水) 01:38:10.96ID:+cUNsPSc
>>771
定跡無しで振り飛車指すような評価関数は無理やり弄ってるんだからそりゃ弱いでしょ。
バランスの良いランダム局面でも強い評価関数が、現時点の計測法では発見されにくいという話だよ。

互角局面集の戦型が偏っているから
強さが偏った評価関数が計測上のレーティングでも高くなりやすい。
もちろん初手からの計測でも、誘導されない局面での精度の上昇は計測できない。
チェスように、計測用のバランスの良い局面集が必要。
0774名無し名人
垢版 |
2023/05/24(水) 01:41:29.20ID:YeFk/1zl
>>750
ありがと。やはり局面を指定して読ませないとだよね


先日の名人戦二日目を自前のhaoとblossomとを動かしながら、AbemaとYoutuber水匠と候補手を比較してたんだけど、
例えばこの動画でAI越え扱いされてる「感想戦での▲99香打」
ttps://youtu.be/t3QZ-efeUe0

この手はAbemaで武富礼衣女流が早々に挙げてて解説されてた手なのだけど、
水匠やblossomは第一候補手に挙げてた(blossomは僅差で第二候補手に▲68金)
一方、Abemaとhaoは▲68金を第一候補手にしてて、haoは100点以上差をつけて第二候補手に▲99香打。しかし▲99香打を入力して少し読ませてから局面戻すと反省する)

少し厄介なのは、タヌキ特有の大きめの評価値のせいか、タヌキだけを使ってたら▲68金しか掘り下げなかっただろうなと。
(blossomなら▲99香打も▲68金も僅差だったから両方掘り下げようかと思える)
0775名無し名人
垢版 |
2023/05/24(水) 01:57:33.92ID:YeFk/1zl
>>774
スマン、少々誤爆。水匠とAbemaの候補手のところなかったことにしてくれ。
(Abemaを見てて「読み筋4手目まで見せてくれよ」と思った記憶があるから、この局面の話じゃなかったかもしれん。水匠の方も読み筋に出てたのが▲68近だったかもしれん。曖昧なこと書いてスマンカッタ)
0776名無し名人
垢版 |
2023/05/24(水) 02:07:04.48ID:MaXFj0nX
やねうら王の探索部内部でも評価値を判断材料にした延長や枝刈りがあった筈で、評価値高めに出るHáoで既存の標準NNUEより強いというのが面白い
あー、それとも、だからfv_scale20で強いのか?
0777名無し名人
垢版 |
2023/05/24(水) 03:01:52.17ID:HwkOHf7T
サヴァンが最新のパソコンでタイトル独占してるから
若手が可哀想なので最新のパソコンに対抗して
若手に優先的に最新の優勝ソフトを提供してほしい。
これでは公平な試合にならない。スペック勝負だよ
0778名無し名人
垢版 |
2023/05/24(水) 03:10:59.54ID:czk/ukmF
>>777
詰将棋選手権の優勝賞品を最新PCにしたら良いんじゃないかな?
パソコン研究が関係ない競技だから若手棋士でも優勝のチャンスがあるぞ
0779名無し名人
垢版 |
2023/05/24(水) 03:47:48.88ID:50nIms8+
>>770
おお
角の位置まで入れ替わってるので何とも言えないが、やっぱりtanukiが振り飛車苦手にしてる可能性が高まってきたか
あとはryfamateさんの測定を待つかな

振り飛車絡み(相振り含む)の測定やると水匠4改が今なおかなり強い
tanukiもwcsc33よりdr3の方が勝率良かったりする
sqmz-dやQPDもそれ用に仕上げてるだけあってなかなか強い
0780名無し名人
垢版 |
2023/05/24(水) 04:02:05.32ID:StWt9jnI
HáoとBlossomのキメラはどこで入手(作成)できるの?
キメラで戦型別の強さがどう変化するのか計測したい
0781名無し名人
垢版 |
2023/05/24(水) 05:46:23.05ID:xn+HmWTV
>>779
振り飛車絡み(相振り含む)の測定なら、対抗形も含まれている、たややん互角局面集が比較的に
有名で、これでいつも計測されているtanukiは振り飛車も強い。自分もtanukiは2018年頃から公開された
評価関数を互角局面で計測していたけど、いつも対抗形はトップクラスの勝率だったよ。
0782名無し名人
垢版 |
2023/05/24(水) 06:02:34.41ID:mgr9IKvc
ADA Channel / 都賀町えいだ チャンネル ※昨日21時半~やってました
【#開発者対談】第33回世界コンピュータ将棋選手権第11位「ponkotsu」開発者のJJ1GUJさんと対談
https://www.youtube.com/watch?v=79Ey1pygL14
バーチャルYouTuber「都賀町えいだ(つがまちえいだ)」とは
コンピュータ将棋ソフト「元気もりもりニンニクパワー」の開発者です
0783名無し名人
垢版 |
2023/05/24(水) 06:44:20.76ID:gElzu/gJ
問答無用で5chレスorスレ立て代行依頼スレin新狼避難所84
https://jbbs.shitaraba.net/bbs/read.cgi/internet/20619/1684717050/86

86 名前:名無し募集中。。。[sage] 投稿日:2023/05/24(水) 01:56:00
レス代行をお願いします
【状況】ERROR: 余所でやってください
【板名】将棋・チェス
【スレッドタイトル】【WCSC33】第33回世界コンピュータ将棋選手権
【スレッドURL】https://mevius.5ch.net/test/read.cgi/bgame/1683065235/
【名前(省略可)】
【メール欄(省略可)】sage
【本文】
ADA Channel / 都賀町えいだ チャンネル ※昨日21時半~やってました
【#開発者対談】第33回世界コンピュータ将棋選手権第11位「ponkotsu」開発者のJJ1GUJさんと対談
https://www.youtube.com/watch?v=79Ey1pygL14
バーチャルYouTuber「都賀町えいだ(つがまちえいだ)」とは
コンピュータ将棋ソフト「元気もりもりニンニクパワー」の開発者です
0785名無し名人
垢版 |
2023/05/24(水) 09:50:40.23ID:PQwI7T4Z
>>729
うちの計測だとやねうらNNUE系列に全然勝てないので、設定を教えてもらえませんか
うちはたややん互角局面、3700x、rtx2070、1手3秒、ResignValue3000でやってますが、中盤ponkotsuがややリードするも終盤捲られて負けてばっかですね
ポンコツのNPSは30kほどですが、dlshogi付属のシリアライザ使ったのでbatchsize128なのと悪いのかなとは思ってます
0786名無し名人
垢版 |
2023/05/24(水) 10:43:41.32ID:vS5YQx3j
>>785
私の設定等は CPU i7-10700KF GPU RTX3070 1手8秒、ResignValue4000 です
RTX2080内蔵PCも所持していますがNNUEトップクラスに全然勝てないので2080Ti等は未確認ですが
恐らくponkotsu-wcsc33はRTX2000シリーズではNNUEトップクラスに全然勝てないのでは?
dlshogi_wcsc32(ウエイト model-dr2_exhi.onnx)とponkotsu-wcsc33は ほぼ同じ棋力なので
RTX2070内蔵PCでdlshogiがNNUEトップクラスに全然勝てないのならponkotsuも全然勝てないと思います
0787名無し名人
垢版 |
2023/05/24(水) 11:02:50.67ID:zJ2WDX5R
角換わりは先手必勝なのに互角局面集()に載ってる矛盾
0788名無し名人
垢版 |
2023/05/24(水) 12:31:04.70ID:pzIPtk1T
tanuki-のHalfKP-1024-8-16は最近本家やねうら王にマージされたから次回リリースからは含まれるはずなのでもう独自NNとして分けて考える意味も薄い
とはいえ手元で試すと標準NNUEとの速度差がPCによってまちまちだったので、 自分のメインマシンでLiが速く動作するかどうかくらいの基準で選んでもいいかも?

>>751
むしろアピール文書の計測資料とかみるとW@nderERが出来すぎた結果に見えるし評価関数の強さ以外(定跡、指運、相性、Qhapaq戦での異常終了など)が絡んでそう?
0789名無し名人
垢版 |
2023/05/24(水) 16:02:04.19ID:9vyX2SB1
やはり作者以外の開発者が計測してくれると助かる
0790名無し名人
垢版 |
2023/05/24(水) 17:11:55.19ID:UT6Nq3y+
>>786
私の方ではdr2_exhiでは互角相当なんですよね、こうなるとバッチサイズを変えてserializedファイルを作り直してみるか、平手からにしてみるか位ですか…
0791名無し名人
垢版 |
2023/05/24(水) 17:51:01.62ID:Rd91YnjR
HalfKP-1024-8-16だとSIMDのビット幅で足切りマシンが発生するのかね?
0792名無し名人
垢版 |
2023/05/25(木) 08:53:07.20ID:0sUgq/f4
>>790
RTX2080内蔵PCで確認した所 dlshogi(dr2_exhi)とBLOSSOMは ほぼ互角です
ponkotsuのRTX2080機で棋力が上がらない理由を引き続きチェックします
0793名無し名人
垢版 |
2023/05/26(金) 09:29:14.60ID:tslMMKrX
>>790
私のRTX2080機(CPU Ryzen 7 1700)でponkotsuの本来の棋力が発揮出来るようになりました
ponkotsu-wcsc33とBLOSSOM(FV24)を対戦させたらponkotsuの勝率66%くらいでした
CPUとGPUの種類によって勝率が変わります

方法はdlshogi(dr2_exhi)の model-dr2_exhi.onnx.0.128.serialized を
コピペとリネームしてponkotsu用に流用して下さい
0794名無し名人
垢版 |
2023/05/26(金) 17:28:41.09ID:gUTX3eGD
>>702
wandererのソース公開されてるね
もうみんな興味ないだろうけど
0795名無し名人
垢版 |
2023/05/26(金) 19:26:38.90ID:gMV8h+cX
>>793
dr2_exhiのシリアライズファイルをリネームしたらdr2_exhiのモデルを読み込んでしまうと思っていましたが、そういう方法もあるのですね。参考になります。
0796名無し名人
垢版 |
2023/05/26(金) 22:41:15.06ID:Dr3QAm4/
駒の書体@Ryfamate@komafontさんのTwitter見たら
振り飛車(対抗系)初期局面集を用いて、NNUE評価関数を総当たり方式で対局させた計測結果を
ツイートされているけど、tanukiは互角局面集の計測で開発されているので対抗形が強そうね

Hao (FV20) 勝率52.3% 4スレ3.2秒
BLOSSOM (FV24) 勝率51% 4スレ3.2秒
水匠5 (FV24) 勝率48.6% 4スレ3.2秒
SQMZ_Cendrillon2 (FV24) 勝率48.1% 4スレ3.2秒
0797名無し名人
垢版 |
2023/05/26(金) 23:05:19.47ID:Gke8km+3
Haoやwandererはどのくらいのスペック(ノード数)で使えばトップクラスの棋力出るんだろう
0798名無し名人
垢版 |
2023/05/27(土) 00:35:48.15ID:6yjgg4F8
>>796
>>770とは違う結果なのはなぜだろう。持ち時間が1秒or3.2秒?
0799名無し名人
垢版 |
2023/05/27(土) 00:44:10.88ID:rHgr6n8e
>>798
Ryfamateさんはwcscでは強豪ソフトの開発者の一人だし、tanukiは以前は
tanuki互角局面集を、今は、たややん互角局面集の計測で開発されているのも
あるのでtanukiは対抗形は強い評価関数ってことでいいんじゃないの?
0800名無し名人
垢版 |
2023/05/27(土) 00:48:37.50ID:6yjgg4F8
>>799
したら、blossomの方が対抗形強いんじゃね?問題は、ハオ強いで決着でOK?
0801名無し名人
垢版 |
2023/05/27(土) 00:54:11.31ID:rHgr6n8e
>>800
振り飛車のみの局面の総当たりで各1080局も計測してるのと
勝率でも上回っているので対抗形はHaoが最強評価関数の一つってことで
いいんじゃないの?

Hao (FV20) 勝率52.3% 4スレ3.2秒
BLOSSOM (FV24) 勝率51% 4スレ3.2秒
0802名無し名人
垢版 |
2023/05/27(土) 17:20:45.99ID:2jOUE13o
BlossomとHaoのキメラだけど、対Haoの強さは誤差レベルだしHaoでいいんじゃないのとは思う。
キメラ(FV20)対Hao(FV20)
477勝435敗88分
80%信頼区間でレート差0~30
0803名無し名人
垢版 |
2023/05/27(土) 19:43:47.78ID:vA/XyPA/
微妙に強くなっていそうだな
キメラ配布してほしい
0804名無し名人
垢版 |
2023/05/27(土) 19:51:29.94ID:6jANM8Hp
Haoより水匠電竜のほうが強いんでしょ?
0805名無し名人
垢版 |
2023/05/27(土) 20:42:50.03ID:yD+radIC
>>804
水匠電竜が棋神アナリティクスの水匠のことだったら >>676 を参照してください
公開されない将棋エンジンは絵に描いた餅です
0806名無し名人
垢版 |
2023/05/27(土) 21:13:19.02ID:p8lF7D1g
>>804
flootgateの放流最終日を見ると初手から先後共に定跡なしのLiのi9-13900KF(24コア)の方が
先後共に定跡を使用しているSuisho8_TR3990X(64コア)よりレート170ほど高いので今は
最新水匠が優位になっている状況ではないけどね

tanuki-WCSC33_i9-13900KF レート4600 (放流最終日2023-05-21) 101勝10敗(0.910)
Suisho8_TR3990X レート4428 (放流最終日2023-05-27) 142勝20敗 (0.874)
0807名無し名人
垢版 |
2023/05/28(日) 15:13:37.71ID:PeoRPply
対抗形の互角局面って互角の割には意外と振り飛車側の勝率が高く出る
これって序盤の段階では対抗形の形勢判断が正確にはできてないってこと?
0808名無し名人
垢版 |
2023/05/28(日) 20:58:49.63ID:dVgAknEH
現在 対抗形の激闘が行われている叡王戦 第4局指し直し2回目の71手目では藤井叡王が
大差でリードしているが 某棋譜中継サイトではAI3種類の形勢判断が表示されている
水匠5-1550 dishogi-1291 BONANZA-459  エンジンによって大幅に異なるのが興味深い
https://fujiisouta.xyz/2023-5-28-3sokuho.html
0809名無し名人
垢版 |
2023/05/28(日) 21:05:56.75ID:Fd/xLWEu
そのボナンザは、敢えて古い「人間と同等レベル」なソフト代表として採用してるんだっけ
あと評価値はスケールがバラバラなのはあるあるだしなんとも
0810名無し名人
垢版 |
2023/05/28(日) 22:36:20.90ID:lydJnosu
やねうら王の実行ファイルの更新って最近あります?
Mizarさんの最後の更新が去年の6月ですがその間更新がないのですか?
0811名無し名人
垢版 |
2023/05/29(月) 00:18:40.93ID:4wY7KyI6
佐々木大地君に優勝ソフトを無償で提供してほしい。このままだと
ブサヴァンが最新のパソコンでタイトル独占してしまう
とても公平な試合とは言えない
0812名無し名人
垢版 |
2023/05/29(月) 01:52:22.42ID:ZZBs3Vzn
>>810
これまではcommitの度に勝手に実行ファイルが更新されていたはずですが、そういえば最近は配布されてないですね、、、
MizarさんのTwitterアカウントに問い合わせてみたほうがいいかもですね。
0813名無し名人
垢版 |
2023/05/29(月) 07:49:29.09ID:GqpRqLFr
>>811
棋力が違いすぎて消化できず逆に調子を崩すかも
0814名無し名人
垢版 |
2023/05/29(月) 08:22:39.48ID:EpLtr+mI
>>810
Mizarさんはコンピュータ将棋界から手を引いたってどこかで聞いたことあるよ
事実かは分からないけど。。。
0815名無し名人
垢版 |
2023/05/29(月) 15:14:34.39ID:ytI581TC
@kishinanalytics
藤井聡太叡王が豪快に詰ませた叡王戦第四局の局面。
世界コンピュータ将棋選手権優勝バージョンのdlshogiでは74ノードで読み切ります。
水匠では5000万ノードでもまだ詰み手順にはたどり着きません。
dl系、NNUE系の個性が如実に現れる局面だったようです。

https://pbs.twimg.com/media/FxRjk_ZaAAAxv0s.jpg
0816名無し名人
垢版 |
2023/05/29(月) 15:21:07.81ID:yvBlLAyu
全然使わないCPUで詰めルーチン動かせるから見つけられたわけで、dl系の直接的な個性ではないよね。
二番絞りみたいに詰みルーチンなくても読めた、とかなら凄いけど
0817名無し名人
垢版 |
2023/05/29(月) 16:13:53.50ID:C9C5dc7d
詳しくない人が言うならまだしも
会社がこんなリリース出して恥ずかしくないの?
0818名無し名人
垢版 |
2023/05/29(月) 16:26:19.74ID:GND8JLxr
Hao使って叡王戦の棋譜を元にブン回してるけど後手三間、かなり粘れるね100手越えてもまだまだ互角範囲
1手の緩手で読み進めると後手有利になったりするし
普通に有力戦型だろこれ
0819名無し名人
垢版 |
2023/05/29(月) 16:52:55.83ID:ZauTSyeK
マジで後手振りが結論になるのか……?
0820名無し名人
垢版 |
2023/05/29(月) 16:53:27.89ID:GqpRqLFr
>>816 >>817
生活が懸かっているから誇大広告気味になったのだろう
技巧2でも30手前後の詰みなら1秒以内に解く
0821名無し名人
垢版 |
2023/05/29(月) 16:56:09.35ID:2JJFfE/I
これノードってどういう意味なんだろ。
DLの場合は局面からの合法手の数?
0822名無し名人
垢版 |
2023/05/30(火) 02:08:17.58ID:dsLR7BQ6
へーfv_scaleの設定値で評価値のスケール変えると枝刈りの条件が変わって
結果として読み筋が変化することもあるのか。
0823名無し名人
垢版 |
2023/05/30(火) 05:53:26.07ID:lo1/P9mf
タヌキはFV_SCALEを20より上げて評価値の大袈裟加減をマイルドにした方が検討では使いやすいのかな?
blossomと対局させてた時の評価値グラフも波打ってること多かったし、20が一番勝率が良かったとはいえなんかそれじゃない感も。

検討させるときは十秒以上はかけるし、枝刈り甘めにして複数候補手をしっかり考えさせる方がいいのかな?
0824名無し名人
垢版 |
2023/05/30(火) 12:41:18.66ID:Tbx9Mqno
それで手が広くなるなら、マルチFV_SCALEの合議システムみたいなので強くなる可能はあるんだろうか?
0825名無し名人
垢版 |
2023/05/30(火) 19:03:20.81ID:2/rJjFQ0
関係者からツッコミやネタの素材にされまくり、公式も一応訂正したようだ
最初の引用RTを見ると騙されてる人が割と多くて草
https://twitter.com/abT00_chida/status/1663001028726497280
https://twitter.com/tayayan_ts/status/1663032773727367168
https://twitter.com/ymg_aq/status/1663197980239998976
https://twitter.com/bleu48/status/1663380681311899649

https://twitter.com/kishinanalytics/status/1663416555210969090
https://twitter.com/twinforest/status/1663421342568398848
https://twitter.com/5chan_nel (5ch newer account)
0826名無し名人
垢版 |
2023/05/30(火) 20:41:17.15ID:WKxEf3Yq
Twitter担当が広報部門で全く技術的な知識が
無くて思い込みで雑に書いた上に
社内のチェックも無くツイートしたのか
素人だったら騙せるやろ(実際騙されてる)と
思ってやったのか
0827名無し名人
垢版 |
2023/05/30(火) 21:49:46.60ID:CXpS1IU4
家庭用PCの水匠だったら棋戦の二十数手の詰みなんか1秒以内に見つけている
棋神アナリティクスの水匠が >>676 の指摘通り頼りにならない?
0828名無し名人
垢版 |
2023/05/31(水) 00:32:53.72ID:NH7Ex6Sw
最新ふかうらは詰みエンジン組み込んであるってアピール文にあったような。
0829名無し名人
垢版 |
2023/05/31(水) 02:07:58.97ID:1YzZmZ0n
df-pnアルゴリズムを使った詰将棋用エンジン積んでるんやろ
0830名無し名人
垢版 |
2023/05/31(水) 02:10:19.36ID:r9JU1clD
>>824
そもそも合議制って過去上手く行った例なくない?(詰将棋エンジンは除く)
以前ニコニコでもやってなかったけ?ソフト3つで合議制させるも、候補手上位2つ3つは重複しがち&弱いソフト2つが同じ意見で強いソフトの最善手が選ばれないこともあり、最強ソフト単独の方が強かった的な
0831名無し名人
垢版 |
2023/06/01(木) 12:01:26.40ID:OilxUXCz
>>830
ニコ生やABEMA独自みたいなモロ興行のやつやあから2010みたいなとりあえず動かしてみる実験みたいなのは置いとくとして
一応合議の祖である文殊の時点でマシン1台よりは乱数を少し入れたソフト+同じマシン3台のほうが少し強いことは確認されててないよりはマシだった(やねさんには同じマシン3台でGPSやボンクラーズのような探索木を分割するようなクラスタ比較しないとフェアじゃないと言われてたけど)
普通に探索木分けるようなクラスタと比べると棋力の上昇幅は小さいかわりに手軽に実装できる上に耐障害性が高いという強みがあるので、全面に押し出してはいなかったものの技巧やPonanzaも選手権で採用してたことがあったはず
0832名無し名人
垢版 |
2023/06/01(木) 12:24:25.75ID:J4iSkEof
>>831
GPSやボンクラーズの場合は「同じ性能と同じ評価値アルゴリズムを持つもの」を並列で動かしてるから、手の採択も簡単だけど、
例えば以下のようなケースの場合(ソフトでなく人力でもいいんだけど)具体的にはどう採択するの?


ソフト4つ用意する。
A.Hao(SV_SCALE=20)
B.Hao(SV_SCALE=24)
C.blossom(SV_SCALE=24)
D.水匠8

ある局面を評価させたらこんな結果が出た。
A-
候補1. 500点 ▲AAA
候補2. 100点 ▲BBB
B-
候補1. 300点 ▲BBB
候補2. 250点 ▲AAA
C-
候補1. 150点 ▲BBB
候補2. 140点 ▲AAA
D-
候補1. 400点 ▲CCC
候補2. 300点 ▲AAA

候補手は3通り出た
さてどれを採用しよう?
・人間的には水匠8が一番強いのを「メタで知ってる」から▲CCCを選ぶ?
・「多数決」で▲BBBを選ぶ?
・「評価値の絶対値」が一番大きい▲AAAを選ぶ?
などなど
0834名無し名人
垢版 |
2023/06/01(木) 17:22:07.11ID:OilxUXCz
>>832
まず普通は各ソフトの候補手は1しか出さない(MCTSではなくαβ系の探索を使っているソフトの場合、候補手を増やせば増やすほど探索の効率が悪くなり同一時間では弱くなるため)

文殊のアルゴリズムでは同数で意見が割れた場合はランダムに選択する
こんなシンプルな方法でも元のソフトよりは強くなったとのこと(もちろんそれぞれのソフトの棋力が近い必要はあるが)
ただし事前に棋力の高いソフトが分かっているならそれを優先させたほうが強くなることも文殊の資料で示唆されてる

他には評価値のスケールが合ってるなら楽観合議(候補手の中で評価値の高い手を選択) が有効という話もある(むしろこちらが主流?)
多数決合議だと棋風が似たソフトが入ってるとそちらに過剰に引っ張られてしまうところ 、楽観合議だとそうした影響が少ない

あとGPSやボンクラーズもそんな単純な話じゃない
同じAIに同じ局面で同じ手を同じように読ませても意味はないので何かしらの方法で担当を割り振る必要があるけど、それをどうやって割り振るのかとか、分岐が少ない局面を割り当てられたマシンが滅茶苦茶先まで読んじゃった場合に探索深さがあまりにも異なる評価値を同列に扱っていいのかとか
あと読みを分担するとどれかのコンピュータが壊れちゃうと担当分が壊滅するからこれをうまく回避する必要がある(合議だと誰かいなくても問題なく残りのメンバーで続けられる)

Ponanza ChainerのExtreme Lazy SMPならもう少しシンプルみたいだけど、直感的にはかなり安定して遅延の少ないネットワークでないと性能がでなさそうな気がする
0835名無し名人
垢版 |
2023/06/01(木) 18:15:04.92ID:J4iSkEof
>>833
そのチャレンジは興味深かったよね

>>832
文殊の論文が2009年、その後コンピュータ将棋の合議に関する論文は、文殊が2009年、その後2011年あたりで終わってそう
https://www.jstage.jst.go.jp/article/jjsai/26/5/26_525/_pdf
https://www.ieice.org/publications/conference-FIT-DVDs/FIT2011/data/pdf/F-043.pdf

10年以上前とはソフトの棋力も格段に違うし、合議の研究自体がその後継続されてないみたいだし、現在ではコンピュータによる合議アルゴリズムは効果的でないと判断されてるんじゃないかな
(そうでなければ合議系が主流になってると思われ)

GPSやボンクラーズの「そんな簡単な話じゃない」のは理解できるよ
でもそれは「合議のアルゴリズム」の話ではないよね
(その話は「複数のマシンを統合して、まるで1台のつよつよマシンのように振る舞わせるのは簡単じゃない」って話だし)
0836名無し名人
垢版 |
2023/06/01(木) 18:16:14.11ID:J4iSkEof
話を「検討ソフトのより良い活用方法があるか?それは合議か?」に戻すけど

・検討で使うとき、Haoは評価値が大袈裟にでがちだけど、
(最適値とされてる)FV=20と、(評価値をマイルドにさせるための)FV=24と合議した方がいいのか?合議させるならどうすれば美味しいか?

・検討で使うとき、Haoとblossomとで合議するならどうしたら美味しいか?

・棋神アナリスティックスを使ってdlshogiと水匠の読み筋が異なるとき、どう判断すると美味しいか?

・アベマとYouTube水匠最新とで読み筋が異なる時、どう判断すると美味しいか?

(10年以上前の文殊論文に従って、ランダムに選択していいの?
 スケールを合わせるって「初形で同じ数値にすればOK」とそんな簡単な話?
 もし合議で強くなるなら「既にdl系とNUEE系のハイブリッドがトップになっててもおかしくない」が、現実はそうなってないということは合議は難しい?)

個人的には、良さそうな合議アルゴリズムはないんじゃないか、と思ってるのだけど俺の知らない合議のナイスアイデアがあるなら知りたいなと
0837名無し名人
垢版 |
2023/06/01(木) 21:23:17.27ID:gLzo9gn9
>>833
合議(笑)とかいうソフト指しw
^^

悲惨だなw
^^
0838名無し名人
垢版 |
2023/06/01(木) 21:58:17.06ID:OilxUXCz
>>835
合議は普通に2017年の選手権でも技巧が使ってるし、その前はPonanzaが長いこと使ってた
その後は下火だけどそもそも電王戦での一番注目が集まるフェーズが終わって大規模なマシンリソースを用意すること自体が下火になった感じだし

合議やるくらいだったら他の方式のクラスタのほうが将来性があるという見解が主流なのはそうだけど、耐障害性の高さや実装の楽さなど合議の強みは確実にあるわけで「上手く行った例がない」というのは明確に間違い
0839名無し名人
垢版 |
2023/06/01(木) 22:17:26.79ID:w9fYrEvr
合議に汎用性があるならNNUEだろうがDLだろうが
使えるはずがそうはなってないので
技術として確立したとはいえないのだろう

αβ探索のクラスタも最近は下火ぽいけど…
0840名無し名人
垢版 |
2023/06/01(木) 23:13:58.91ID:J4iSkEof
>>839
俺もそう思うなぁ


>>838
2017年はelmoが優勝した年か
これは話題になったけど、
ttps://yaneuraou.yaneu.com/2017/05/23/ooparts-brought-by-elmo/
合議制が優秀という話は聞かなかったなぁ

>大規模なマシンリソースを用意すること自体が下火になった
それは探査部の枝刈り技術だったかに技術革新が起きて、それまでの力業探索から路線変更が起きたからじゃなかったっけ?

>耐障害性の高さや実装の楽さなど合議の強みは確実にある
そういうのは大元の >>823-824 の回答になってないんよ

合議制にも色々メリットがあるのは知ってるけど、
お前さんが詳しいのは十分わかったから、
合議のアルゴリズムの観点から 大元の>>823-824 (や >>868)に回答してくれよ
0841名無し名人
垢版 |
2023/06/02(金) 15:48:41.54ID:+qvvwXrV
まふ定跡ってあったよね?
その人何してんだろ
0842名無し名人
垢版 |
2023/06/02(金) 17:59:11.53ID:F3kghiRB
各エンジンのパラメータや出力をそのまま合議専用NNにぶち込んで、そこから1手をひねり出させればいいんではなかろうか。
もう人間がなにかを決めるのはやめよう。
0843名無し名人
垢版 |
2023/06/02(金) 23:35:55.94ID:q+PUSPec
>>842
計算コスト大きくなって、結局単一モデルを大きくしたほうが強いとかありそう
0844名無し名人
垢版 |
2023/06/03(土) 01:40:09.83ID:Q1qEWvor
ぶっちゃけ普通のNNUEなんてトップとその他で僅かな差しか無さそうだし、長時間検討させるなら探索部の影響の方が大きいので、気になる局面を検討させてみて、好みの結果を返すNNUEとセッティングを選べばいいんじゃないかな。
0845名無し名人
垢版 |
2023/06/03(土) 11:17:41.95ID:IAQmY4Ic
ADA Channel / 都賀町えいだ チャンネル 昨日21時半〜23時までライブやってたね
【#開発者対談】タブレットで第33回世界コンピュータ将棋選手権第23位「ねね将棋」開発者のselect766さんと対談
https://www.youtube.com/watch?v=BnzZc9uXmV8
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況