X



10年前のボンクラーズ、GPS将棋に藤井竜王は勝てるか
■ このスレッドは過去ログ倉庫に格納されています
0001名無し名人
垢版 |
2022/01/19(水) 01:07:32.68ID:UXxHL9N2
米長永世棋聖vsボンクラーズから早十年、
当時のトップソフトとトップ棋士はソフトのほうが分が良かったと思うが、
最新AIで鍛えた藤井竜王が当時のトップソフトと戦ったら勝てるのかな
0067名無し名人
垢版 |
2022/01/30(日) 10:26:04.54ID:4B+Blr7u
コンピュータの駒落ちも去年一部で盛り上がってたな
六枚落ちなんてどうやっても有段者が負ける手合じゃないと思ってたら開発者の山下宏(東北大将棋部OB会元会長のアマ四段)が1勝2敗だったとか言い出して
その時は5chでも「流石に盛りすぎ」みたいな空気だったのに、駒落ちbotとしてlishogiに投入されたら実際有段者をボコりまくってみんな手の平を返した
奨励会三段の古田が二枚落ちで勝ってたけど、ソフトが多面指しでフルパワーじゃないモードのときだったからフルパワーだとどうなるのかは気になる
0068名無し名人
垢版 |
2022/01/30(日) 15:22:36.83ID:FAAE5Mlc
所詮見世物だからねぇ
海外プロいないわけだし、日本人で上がりになればソフトと比較したらどうなの?と思うのは自然なことかと
藤井で将棋見始めたひとは報道の影響で藤井はソフトより上とか本気で思っているのもいそうだけど
0069名無し名人
垢版 |
2022/01/30(日) 20:51:57.15ID:Tm7ngbag
GpsFishクラスタなんぞ
今のプロ棋士が戦ったら
序盤から今のコンピュータ将棋が示す
評価値500は差を付けられるだろう
そっから並の棋士は知らんが
SOTAなら逆転を許すことはないだろう
0070名無し名人
垢版 |
2022/01/31(月) 12:17:09.67ID:gelU055z
>>60
GPSの開発者がクラスタによる棋力の向上はR400くらいって言ってるんで、普通に2014頃のマシン一台のPonaのほうが強い
本番と同一スペックのマシン貸出ありという条件があるから三浦戦よりは条件緩いかもしれないけど
(余談だけど一応第二回電王戦も習甦、ツツカナ、Puellaαは開発者による自主的な貸出あり、GPSは公開済みだったので本番とスペック違うものの結果から見るとPona以外全部貸出ありだった)
0071名無し名人
垢版 |
2022/01/31(月) 14:42:41.18ID:x9Dy/78g
平手&貸し出し無しでソフトに土をつけたのは渡辺明だけという事実
0072名無し名人
垢版 |
2022/01/31(月) 15:17:06.53ID:Z88rUBkC
>>71
橋本「……」

ナベは公開版Bonanzaでがっつり対策手順組み上げての対局だったけど、自宅PC+公開版とのスペック差を元に貸出なしに分類するならコールも含めてもよさげ
Bona-ナベは本来は中盤での暴発狙いだったけど、それが不発だったときには相穴熊にした効果で終盤でBonanzaが間違いやすいことまで折り込み済みで研究勝ちといっていい内容
あとナベの対局はBonanzaが非三駒関係評価関数だった最後のタイミングだから、もし対局が半年〜一年くらい遅れてたら評価関数が再設計されて前バージョンと指し手の傾向がガッツリ変わって前バージョンでの研究が活きなさそうだからタイミングもよかった
0073名無し名人
垢版 |
2022/01/31(月) 15:59:25.56ID:x9Dy/78g
>>72
すまん完全に忘れてた
去る人は日々に疎しだ
0074名無し名人
垢版 |
2022/02/01(火) 15:50:03.16ID:O5YdIPSK
>>38
合議を発案した文殊チームが調査では
・弱くならない程度に乱数を入れたBonanzaを3台のマシンで動かすとオリジナルより強くなる
・強さが同程度の別種ソフト同士の組み合わせでもそれを構成するソフト単体よりも強い
しかし、翌年文殊チームが合流したBonanza本家が優勝を逃してBonanzaを独自手法でクラスタリングしたボンクラーズが優勝したことなどからもわかるとおり、マシン台数あたりの効率は他の手法よりよくないとされている

GPS式、Puellaα式、ExtremeLazySMP(Ponanza式)と比べたとき合議のメリットは以下の通り
・実装がシンプル
・マシン間をつなぐネットワーク速度が遅くても大丈夫
・マシンが一台落ちても簡単に切り離せる
逆にデメリットは前述の通り効率がそんなによくないこと

技巧2は選手権のときに複数のGPS式クラスタを用意してそれらを合議させることで性能と耐障害性を両立させた

ちなみにあから2010のときはテストを十分にする余裕がなかったためにYSSクラスタ,Bonanzaクラスタ,激指クラスタの重みは0.1に設定されてほぼ合議に反映されない状態になってて、本来バックアップだったはずのPC一台の各ソフト合計4台が殆どの決定権をもっていたという見掛け倒しの構成だったりする
0075名無し名人
垢版 |
2022/02/01(火) 17:23:30.26ID:O5YdIPSK
Puella α-塚田戦って美談みたいに語られてるけど、そもそも泥試合になったのが塚田九段の準備不足の結果だからな

「コンピュータは入玉を知らないと思っていた」とかで一方的に入玉を決めて勝つプランだったらしいけど、選手権でPuella αが入玉してる棋譜はいくつもあるから相入玉を想定しなかったのはちょっと
貸し出しを受けたあとも本番まで一度も入玉への対応を確認しなかったとも後日語ってるし
大一番で相手の直近の棋譜すら確認してないのはプロとしてどうかと思うし、事前に相入玉が想定できてたら点数勝ち狙えた可能性もあるんじゃねえの
0076 【中国電 - %】 ◆fveg1grntk
垢版 |
2022/02/01(火) 20:31:54.59ID:3zyT2Fdf
まぁ結果的にドラマチックになったのでOK
0078名無し名人
垢版 |
2022/02/02(水) 01:11:07.20ID:pbKTq1o3
正直10年前のソフトには序盤戦術だけでも圧倒してほしい
0079名無し名人
垢版 |
2022/02/02(水) 03:23:33.39ID:NewivZ5D
>>78
左美濃急戦登場直後のプロ棋戦でのワンサイドゲームの数々を見る限り、強化学習由来の戦法が存在していない当時のソフト相手なら相当有利取れるでしょ
0080名無し名人
垢版 |
2022/02/02(水) 22:01:16.30ID:h/GRdOgp
棋譜解析結果から2者間の期待勝率を推定するElqにかけてみた
開発者はPFNの研究者でコンピュータ将棋開発者だからそこまでトンデモではないと思うけど、精度がどれくらいでるのかはよく知らない&解析に使うソフトによってもばらつくのであくまで話の種程度に
藤井聡太-GPS将棋(2012) 期待勝率72%
羽生善治(1995-1996)-GPS将棋(2012) 期待勝率69%
あれがGPSの会心譜だっただけで普通に三浦が一発入れても不思議じゃなかったのかも
0081名無し名人
垢版 |
2022/02/03(木) 00:47:23.80ID:wju1zWSS
そんなもんなんか
GPSvs三浦戦とか三浦のどこが悪いのか誰にもわからず、
将棋界終わったみたいな雰囲気だったな 番勝負だと三浦も1勝ぐらい勝てたのかな?
まぁ無理な話だけど、三浦vsGPSクラスタのリベンジ企画やってほしいな
序盤研究で三浦が圧倒したら熱い
0082名無し名人
垢版 |
2022/02/03(木) 11:09:46.98ID:Gqc2J/JS
神のように見えたGPS将棋の新手はその後厳密には成立してなさそうという話が出てたし
マシンパワー、マンパワーともに化物だったPonanzaが全てを終わらせるかと思ったらelmoが圧倒的リソース差をひっくり返して勝ったし
そのelmoに9割勝つ上に先手勝率が異常に高いAlphaZeroが出てきて将棋の結論は近い、もう終わりかと思われたけど結局既存ソフトの延長であっさり超えられて今の所将棋の結論は出なさそうだし

異常に強いソフトの登場→もう終わりだ→そんなことなかったを繰り返してる気がする
0083名無し名人
垢版 |
2022/02/03(木) 12:12:02.84ID:q6bQK6Lo
評価関数の設計でアマ強豪も関わってたGPS将棋が利き、作者が将棋弱いBonanzaが駒の配置を重視して結局後者の方針が覇権とったの今思うと不思議
0084名無し名人
垢版 |
2022/02/03(木) 12:25:48.41ID:nTQ3fZlL
ボンクラーズには間違いなく完勝
三浦GPSも恐らく4勝1敗あたりで勝ち越す
問題はここからだが、2015だっけ?のPonanzaは屋敷もかなり善戦したし5戦すれば1勝はできるかも知れない
山崎天彦あたりからは人類が滅びるまで永久に無理
0085名無し名人
垢版 |
2022/02/03(木) 13:30:09.97ID:mMLzShhS
>>84
屋敷戦が行われたのは2014年で、使われたのは2013年版のponanza
で、このpona2013は商品化されてて(将棋新世紀ponaX)、Apery_WCSC25とほぼ互角なことがわかってる
千田が電王戦モデルでAperyと100局対局した勝敗を公表してて、それを元にすればApery_WCSC25はプロレート1950相当
これはGPS将棋のクラスタ(開発者によればクラスタ化でおよそR400程度強化、ベースのソフトはBonanza6よりほんのり強い程度=クラスタ版でR2000強程度)と大差ない
ponanzaが三浦戦GPSクラスタを単一PCで超えられるようになったのは2014(2015村山戦版)から
実際ponanza山本のGPSクラスタ超え宣言もこのタイミング

つまり村山戦Pona>藤井聡太≒三浦戦GPS>屋敷戦Pona
当時の定跡に積極的に有利を取りに行く指し方が出来るならもうちょい勝算はあるかも

ちなみにGPSは当時の一般的なBonanza系よりは入玉がうまかったので、簡単に入玉してボコるとかはできない
あと稲庭で400手くらい待機すると無理攻めで暴発する現象が見つかってたけど、ソフトは基本的に読みが深くなると稲庭を打開できるのでクラスタかつ長時間でこの条件を満たすのがまず無理ゲー
0086名無し名人
垢版 |
2022/02/03(木) 16:29:32.81ID:VCgYJP/C
10年前のソフトの手って今のソフトだと評価値低いの?
0087名無し名人
垢版 |
2022/02/03(木) 16:44:38.79ID:4MUdYdFb
>>86
プロ棋士の棋譜を解析したときと同じで普通にガタガタのグラフになることが多い
0088名無し名人
垢版 |
2022/02/03(木) 18:14:02.00ID:gtbKotnf
ソフトの入玉で印象的なのはコールが電王トーナメントの解説中Ponanzaの意味不明な指し手をみて「入玉含みだからバグったんじゃないですか?」とかいって笑ってたらその時点でPonanzaが点数勝ちを読み切ってたやつだな
入玉で人間を超えたのはいつ頃なんだろ
山崎戦の前には電王戦関連の特番で千田が「今のコンピュータは入玉も上手い」と発言してたのは覚えてるけど
0089名無し名人
垢版 |
2022/02/03(木) 18:24:40.74ID:OT58wXfn
GPS新手懐かしい
わかった気になって大会で真似して指して全然上手くいかなくて??wwってなったのもいい思い出
0090 【中国電 - %】 ◆fveg1grntk
垢版 |
2022/02/03(木) 19:05:10.44ID:7Edv+c98
電王戦の直後にGPS新手が公式戦で出たんよな
屋敷が三浦相手に指して
ちょっと形が違ったみたいだけど、屋敷なりの工夫をして

三浦相手に指すのもすごいが、屋敷もまた翌年電王戦に三浦と同じ立場で出場するという
0091 【中国電 - %】 ◆fveg1grntk
垢版 |
2022/02/03(木) 19:05:57.34ID:7Edv+c98
入玉形みたいな複雑な形ほど、コンピュータの有利性が際立ちそう
あまり人間の経験の活きない形だし
0092名無し名人
垢版 |
2022/02/03(木) 19:54:32.55ID:zx4s4GR8
渡邊 vs ボナンザが全てですよ。
その後の色々は残飯。
0093名無し名人
垢版 |
2022/02/03(木) 21:01:04.22ID:aMCQVcpF
>>91
10年前はそうでもなかったんよ
GPSは将棋が強い開発者たちによって緻密に設計された評価関数のおかげでかなりマシだったけど、主流になったのはそうではなく単純な設計の巨大なテーブルを作って大規模なデータで学習させてそれらしい値をつける方法だった

ボンクラーズのベースになってるBonanzaはプロ棋士やアマチュア有段者の棋譜から巨大な評価関数を学習してて、それには何万もの棋譜が必要だった
人間が高段者になるまでに並べる棋譜なんて数百くらいだろうし、それと比べると圧倒的に多い
要は1つあたりの棋譜から学べることが人間より遥かに少ない、類例の少ない局面への対応力が極端に低かった
Puella αは入玉対策を手作業で組み込んでるけど、入玉したあとは結局上手くさせずに塚田九段と引き分けるという結末になった

要は人間は少ない経験を他の場面に応用する能力が高い

NineDayFever(コンピュータ将棋選手権には出ていたが電王トーナメントには不参加だったので電王戦には出ていないソフト。千田がソフトにハマったきっかけはこのソフトの棋譜をみたことらしい)がこれを打開する手段を2つ発明して公表したことで、ソフト全体の棋力が大きく上昇した
電王戦には直接は出てないけど、多分このソフトさえなければ、或いはこのソフトが秘密主義だったなら電王戦はもっと人間が勝っててもおかしくない

1つは学習の次元下げといって、棋譜に登場する特徴を細かく分解していわば汎用的な知識として学習する方法
やねうら王の実験ではこの方法を突き詰めると、わずか16件の棋譜から学習した評価関数でBonanza 6.0に一発入れられるまでになったとのこと
もう1つが棋譜からの学習後に自分の深い読み筋と浅い読み筋を比較して矛盾を補正する方法
これが現代の強化学習の原点で、ソフトが自分で教師を作れるようになったために実戦でめったにでない局面が問題にならなくなった
角替わり4八金型や対矢倉左美濃急戦などそれまであまり見られなかった優秀な構想がコンピュータから誕生しはじめたのもこの時期

更にここに自己対戦における勝率による補正を組み込んだのがelmo式で、とうとう初期値として人間の棋譜すら一切なしに効率的な学習ができるようになった
0094 【中国電 - %】 ◆fveg1grntk
垢版 |
2022/02/03(木) 23:09:55.98ID:7Edv+c98
今後の升田幸三賞はずっとソフト絡みが受賞しそうだな
0095名無し名人
垢版 |
2022/02/03(木) 23:35:08.93ID:J6SA1WJX
2008年に羽生はソフトに敗北し永世7冠獲得失敗している
0096名無し名人
垢版 |
2022/02/03(木) 23:55:19.60ID:aMCQVcpF
Puella αは前年のボンクラーズよりも入玉対策を強化してあれらしいから、ボンクラーズ相手は入玉狙いでいけば藤井だけといわずプロ上位なら勝てそう
0097名無し名人
垢版 |
2022/02/04(金) 00:02:54.84ID:6oefZUtu
じっさいサトシンが馬引いて入玉狙えばポナ相手にすら勝ててたよ
0098名無し名人
垢版 |
2022/02/04(金) 00:14:06.07ID:6SUGw3Bo
>>97
すらっていうかあの時期のponanzaは別にずば抜けて強いわけではなかったしそりゃそうでしょ
コンピュータ将棋の大会優勝回数ゼロの頃だぞ
山本本人が将棋強いから何かしら手作業で入玉対策入れてるかもしれないけど、当時そこまで有効な策はなかったろうし
0099名無し名人
垢版 |
2022/02/04(金) 01:04:03.63ID:6oefZUtu
そりゃそうだ入玉周りが弱点だからバレないように貸し出ししなかったわけだからな
0100名無し名人
垢版 |
2022/02/04(金) 01:53:19.74ID:u1wm+cHA
当時の選手権の棋譜見返してみたけどPonanzaは激指相手に入玉決めて勝ったりPuella αの無理気味の入玉を上手く咎めたりしてるから多分当時のボナンザチルドレンの中では相当入玉マシな部類と思われ
これだとギタシンが入玉狙ってうまくいくかはわからん
0101名無し名人
垢版 |
2022/02/04(金) 02:10:19.19ID:9fMB1EEq
>>84
山崎や天彦とやったソフトも森下ルールなら上位棋士なら戦える気がする
0102名無し名人
垢版 |
2022/02/04(金) 02:28:50.93ID:u1wm+cHA
>>101
森下ルールは本番たまたまうまく行ったものの練習では想定よりかなり厳しかったというようなことを森下がいってたし、当時のトップ棋士の康光や羽生は継盤でそこまで読みの精度が上がるのか疑問視するような発言してたから脳内将棋盤はっきりしてる層には効果薄そうだしでそこまで有効じゃないでしょ
というかあのへんの時代のソフト事前構築の定跡オフのリアルタイム思考で左美濃急戦とかいう人間の長年の定跡を破壊するようなの編み出せるのに多少人間の読みの精度が上がったところで勝てる相手か?
0103名無し名人
垢版 |
2022/02/04(金) 02:36:48.99ID:R7RF6H5Q
電王戦は永瀬の勝ち方が一番カッコいいと思う
文字通り一局で二回負かせてるんだから
0104名無し名人
垢版 |
2022/02/04(金) 13:11:05.34ID:+Supnug/
floodgateの過去ログと菅井や千田の対局練習の勝率から簡単に試算してみたけど、ボンクラには勝てそうでGPSとはほぼ互角っぽい
FinalのAWAKE,Ponanzaではじめて藤井より強くなったっぽいけど、このときは二者が突出してたので他3ソフトはGPS〜やや劣るレベル
電王戦ルールはそのままで対局者を全員藤井に変えた場合の期待勝数はこんな感じ(貸出研究があることを考えればスペック制限後はもうちょい勝ち目ありそう。特にAWAKEは2八角があるし)

あから2010…0.98/1
第一回電王戦…0.93/1
第二回電王戦…4.11/5 (大将戦の期待勝率:0.57)
―スペック制限導入―
第三回電王戦…4.25/5 (大将戦の期待勝率:0.64)
電王戦Final…2.99/5 (大将戦の期待勝率:0.36)
第一期電王戦…0.06/2
第二期電王戦…0.01/2
0105名無し名人
垢版 |
2022/02/04(金) 13:20:46.38ID:+Supnug/
>>104
一応条件について補足
・GPSの大規模クラスタは思考開始に少し時間がかかる都合上短い時間の切れ負けに弱く、当時のfloodgateは短時間の切れ負けだったため、GPS当時の単一PCのGPS+400(開発者コメント)で試算
・当時のコンピュータは早指しだけやたら強いというのが定説だったため、24ではなくプロの練習対局の勝率を換算に使っている
0106名無し名人
垢版 |
2022/02/04(金) 13:24:19.78ID:+Supnug/
>>80のGPS相手の期待勝率との乖離は、たぶん当時のGPSの入手可能な棋譜はほとんどが短時間切れ負けの棋譜だから解析結果が弱く出がちなんだと思う
選手権も短時間切れ負けだった実際切れ負けしたり最後の最後で手が荒れて逆転したりが目立つ
0107 【中国電 - %】 ◆fveg1grntk
垢版 |
2022/02/11(金) 17:25:36.50ID:kww4v2Bn
選手権でGPSが勝勢からバグって勝ちを逃して、ボナンザが逆転優勝した年があったな
あれは劇的だった
0108名無し名人
垢版 |
2022/02/12(土) 13:15:57.92ID:7F+xkEWH
Bonanzaって優勝した2回とも相手のレアなバグ引いての優勝だから、名前の意味の通り僥倖なんだよな
0109名無し名人
垢版 |
2022/03/04(金) 23:58:33.28ID:4IBgBm9V
棚瀬将棋は逆に優勝逃した2回ともレアなバグ、本番環境の設定漏れで必勝の将棋を落としての準優勝だから不運だった
実力は最強格だったはずだし、詰将棋探索も作意手順に拘らない実戦の詰みチェック用としては柿木やなのは、背尾詰すら上回って販売終了した今でも上位クラスなのにもったいない
0110名無し名人
垢版 |
2022/03/25(金) 08:18:21.58ID:TJbuu0AD
余裕で勝てそう
0111名無し名人
垢版 |
2022/03/25(金) 23:17:31.63ID:iILLz4Qy
せめてこれくらいはやって欲しいよな
藤井はAIから逃げ回って一度も公開対局してないし
0112名無し名人
垢版 |
2022/03/26(土) 19:04:41.96ID:ZunbvQbC
>>111
って言われるから藤井は先手を取って「Ponanzaに0-3」「(ソフトと練習対局するときは)流石に設定を落としてる」と牽制してるのに メディアがAI超えを連呼して、周りの棋士もキャッチーだから「今までの将棋の常識を覆した」とか「人間では指せない手を指した」とか持ち上げるもんだからマジでワンチャンあるんじゃないかとか考える観る将が出てきてる
0113名無し名人
垢版 |
2022/03/26(土) 20:20:35.98ID:Wgk26h2l
>逃げ回って
糖質か?
0114名無し名人
垢版 |
2022/03/27(日) 00:50:58.19ID:ROgcjQYD
>>11
それ面白そうだな
0115名無し名人
垢版 |
2022/03/27(日) 14:31:41.05ID:d0fztAnR
当時既に棋力が下り坂だった塚田九段が入玉狙いなしの対ボンクラーズ練習対局で勝率約13%というデータがあるので、ボンクラーズ相手は普通に藤井なら勝ち越せそう

GPSは670台クラスタの長時間対局がなさすぎてなんとも言えん(GPSクラスタは短時間が弱点なのでfloodgateの早指しや選手権の戦績があてにならない/長時間におけるクラスタでマシン1台よりR400上昇もGPS将棋の公式Wikiで「田中(開発メンバー)の個人的な推測値」と補足されてて完全に未知/ >>4の計算は粗結合環境なのに枝刈りが理想的に働く前提で計算してるし三浦戦から1年以上後のGPSfishを基準にしてるしでいろいろ論外)
ただ、GPS将棋の定跡データは割と質が低くて不利な変化も入っていて、対人でも普段と同じ定跡選択ルーチンだったらしいので、(まずないとは思うけど)GPS将棋本体が現代の将棋ソフトに肉薄する棋力だったと仮定しても一定確率で勝てるのはほぼ間違いない
0117名無し名人
垢版 |
2022/04/05(火) 09:29:19.08ID:hArbZUdE
ボンクラーズなら勝ち越しの可能性ありそう
天彦が負けたポナンザあたりは1割も勝てなそう
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況