AlphaZeroの将棋棋譜がついに公開!
■ このスレッドは過去ログ倉庫に格納されています
論文 A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play http://science.sciencemag.org/content/362/6419/1140 棋譜(100棋譜) https://deepmind.com/research/alphago/alphazero-resources/ 羽生善治竜王のセレクション10棋譜付き! レート的にはNNUEkai7とあまり変わらなさそうなのだ 序中版から王様が中段に浮く棋譜はfloodgateのR4000超えの棋譜にも見かけたな 中段玉その2(長いので最後は省略) 開始日時: 先手:AlphaZero 後手:elmo 手合割:平手 ▲7八金 △3四歩 ▲7六歩 △8四歩 ▲2六歩 △3二金 ▲2五歩 △8五歩 ▲2四歩 △同 歩 ▲同 飛 △8六歩 ▲同 歩 △同 飛 ▲3四飛 △3三角 ▲5八玉 △5二玉 ▲3六歩 △7六飛 ▲7七角 △2六歩 ▲2八歩 △2七歩成 ▲同 歩 △7七角成 ▲同 金 △7四飛 ▲同 飛 △同 歩 ▲2八角 △7三角 ▲8三飛 △7二銀 ▲8八飛成 △2八角成 ▲同 銀 △7三角 ▲4六角 △8七歩 ▲同 金 △4六角 ▲同 歩 △5五角 ▲7七金 △4六角 ▲3九金 △2六歩 ▲同 歩 △2七歩 ▲3七銀 △同角成 ▲同 桂 △2八歩成 ▲同 金 △3九飛 ▲1八香 △1九飛成 ▲4七玉 △4九龍 ▲5六玉 △7三桂 ▲6六歩 △5八銀 ▲3八角 △3九龍 ▲2九金 △4八龍 ▲7六角 △5九銀 ▲4八龍 △同 銀 ▲4七玉 △6九飛 ▲4八玉 △7九飛成 ▲4四歩 △同 歩 ▲8三歩 △8九龍 ▲8二歩成 △同 龍 ▲1六角 △3四歩 ▲8六歩 △5四歩 ▲3四角 △4三銀 ▲1六角 △3四歩 ▲4五歩 △1四歩 ▲4四歩 △同 銀 ▲3四角 △4三歩 ▲3八金 △8四龍 ▲6七角左 △7五龍 ▲7六金 △5五龍 ▲4七歩 △3三銀 ▲2三角成 △同 金 ▲同角成 △3四角 ▲同 馬 △同 銀 ▲6七角 △1三角 ▲5八銀 △4五桂 ▲同 桂 △同 銀 ▲2五桂 △2二角 ▲2三飛 △6二玉 ▲4三飛成 △3六銀 ▲3七歩 △4二歩 ▲2三龍 △4五銀 ▲4一金 △3四桂 ▲2七金 △2六桂 ▲同 金 △4四角 ▲2七歩 △2二歩 ▲2四龍 △3二銀 ▲3五金 △同 角 ▲同 龍 △4一銀 ▲4五角 △4四金 ▲3一龍 △4五龍 まで203手で先手の勝ち 中段玉その3(81.csa) 開始日時: 先手:elmo 後手:AlphaZero 手合割:平手 ▲7六歩 △8四歩 ▲7七角 △3四歩 ▲7八銀 △9四歩 ▲3六歩 △8五歩 ▲6八玉 △3二金 ▲3八銀 △3三角 ▲同角成 △同 金 ▲7七銀 △9五歩 ▲2六歩 △5二金 ▲2五歩 △2二銀 ▲3七銀 △6四歩 ▲4六銀 △6二銀 ▲3七桂 △4四歩 ▲3八金 △6三銀 ▲5五銀 △6二玉 ▲4六角 △6五歩 ▲6四銀 △同 銀 ▲同 角 △5四角 ▲2六飛 △6三金 ▲4六角 △4五歩 ▲5五角 △6四銀 ▲5六銀 △5五銀 ▲同 銀 △3二角 ▲4五桂 △4三金 ▲3五歩 △8四飛 ▲7五銀 △9四飛 ▲9六歩 △同 歩 ▲9五歩 △9二飛 ▲9六香 △5二玉 ▲6四銀左 △同 金 ▲同 銀 △6二飛 ▲6三金 △同 飛 ▲同 銀 △同 玉 ▲2四歩 △同 歩 ▲3四歩 △4四角 ▲2四飛 △2三銀 ▲2九飛 △2八歩 ▲同 飛 △8六歩 ▲3三歩成 △同 桂 ▲同桂成 △同 金 ▲3四歩 △同 銀 ▲2二飛成 △8七歩成 ▲6一飛 △6二銀 ▲8一飛成 △7七と ▲同 桂 △6六歩 ▲3二龍 △同 金 ▲4一角 △5二桂 ▲7五桂 △6四玉 ▲8四龍 △7四歩 ▲7九桂 △4二金 ▲5二角成 △同 金 ▲5六桂 △5五玉 ▲8三桂 △9八飛 ▲8八歩 △6三金 ▲9一桂成 △9七角 ▲8七龍 △9九飛成 ▲8五龍 △7五歩 ▲4四桂 △8六銀 ▲5八玉 △8八龍 ▲6八香 △7七龍 ▲9九角 △8八歩 ▲3二桂成 △3六桂 ▲3七歩 △2八金 ▲同 金 △同桂成 ▲5六歩 △同 玉 ▲5七金 △4五玉 ▲3三成桂 △3八成桂 ▲4六歩 △5五玉 ▲5六歩 △4四玉 ▲3四成桂 △同 玉 ▲8四龍 △5四桂 ▲4九銀 △3七成桂 ▲3八歩 △4八歩 ▲同 銀 △4七歩 ▲3七銀 △3六歩 ▲4七玉 △3七歩成 ▲同 玉 △3六歩 ▲4七玉 △2九銀 ▲4九桂 △2七銀 ▲5八玉 △4七歩 ▲同 金 △6七歩成 ▲同 香 △7八金 ▲5九金 △4八歩 ▲同金引 △7九金 ▲6八金 △4七歩 ▲同 金 △8七龍 ▲4八金 △7八金 ▲6九歩 △6八金 まで176手で後手の勝ち 八葉吉春「信じられないほど理事会の支配下にありますね」 ttps://www.youtube.com/watch?v=6JLrKyHik7k 100番勝負の98局目あたりの棋譜並べらしい 歩不成とか角不成とか他にもナメプ指しが酷かった alphazeroは人間の心理まで学習してんの?w ユーチューバーのアユムさん100局全部解説してほしいわ >>6 いまだに不利飛車爺は現実を見ていないのか 人間同士ならアヤがあるから好きな戦法を使うでいいだろ 不利飛車にソフトの評価を求めるな 240 番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 896e-zFoP) sage 2018/12/07(金) 17:45:57.89 ID:6rTS2AaV0 >>237 でも機械の方が固いから反動がキツそう 藤井の頭をフルスイングする方が手が痺れなくて楽そう やっぱ機械の方が強いんじゃ アルファゼロの指し筋、王将が盤面の中央に向かうような動きは将棋のセオリーに背くもので、人間的な視点で見れば、アルファゼロは危険な状態に見えます。 しかし信じがたいことに、アルファゼロは盤面をコントロールしています。そのユニークなプレースタイルは、私達にこのゲームの新たな可能性を示しています。 羽生善治九段、七大タイトルの全てを獲得した歴史上唯一の棋士 >>91 ブーハー、これで堂々と講演ネタに出来るなw 八葉吉春「あ…はい。キングをボードの中心に動かすなどの動きのいくつかは、将棋理論に反するものだと思います。えぇ、えぇ」 人間の読みじゃ変化の分岐をつぶしきれず頓死するだろうな 羽生はチェスの王者にチェスだと王も戦力の一部として使うが、その部分が唯一足りないようなことを言われていたが 将棋でも突き詰めればそうなのかも。 >>95 理屈じゃ当然そうなるけど 王も戦場に居させると言う事はちょっと読み抜けあるとすぐ詰まされる状態でもあるからね チェスより複雑な将棋で人間がどれだけ抜けなく正確に読めるかだね 飛車を1手かけてわざわざ相手の万全なところまで持っていくのが不利にならないはずがない いや1手じゃ済まないな 角上げたりなんだかんだ手数がかかりすぎる 高度な戦いだとわざわざ大劣勢のスタートをするはずがない いやー驚きの棋譜だね、人間の概念がふっとぶ 第一人者が「まだ何もわかっていない」というのはほんとだったんだね >>97 あまり早すぎると、やることがなくなって かといって自分からは仕掛けにくいってパターンもあるかも。 その間に出遅れた側がいい形になったり 将棋では評価値が10手続けて-4500を超えたら投了らしい Resignation was enabled for all players (-650 centipawns for 4 consecutive moves for Stock- fish, -4,500 centipawns for 10 consecutive moves for Elmo, or a value of -0.9 for AlphaZero and AlphaGo Lee). そういや、ブーハーが永世七冠達成した頃にalphazero将棋が発表されなかったんじゃなかった? 今回の棋譜公開も100冠絡み関係あるんかね? >>87 MCTSを使うと囲碁だけでなく将棋まで緩むんだと笑えたわ >>102 関係ないだろ 3日に新しい分野の実用AIを記者発表 そこに合わせてこの技術論文の掲載 羽生ヲタに取ってた羽生は神なのかもしれんが 一般的にはちょっと有名なボードゲーマーってだけだよ Figure2の1/100timeの意味は Elmoが3時間+15秒、AlphaZeroが108秒+0.15秒で互角という意味か(フィッシャールール) 消費電力どころの差ではないな >>106 elmoのハッシュは120億ノードでは全然不足して衝突しているので持ち時間3時間いうても時間に応じた棋力は出ていない せめてソフトのオペレーションは開発者からレクチャー受けてほしかった なおハッシュ衝突とか言い訳できないCSA time control 10min 10s でもボコボコにやられてる模様 >>109 時間が短くても電力が3倍以上の差があるから話にならん TPUの安くなり方からいって、もしかするとクラウドで借りるならコスパ的にはAlphaZeroの方が上になったりして 特にハッシュ衝突避けるためにメモリガン積みするなら どうでもいいけど「七大タイトルの全てを同時に獲得した棋士」じゃなくて「七大タイトルの全てを獲得した棋士」なら羽生以外にもいるのかな https://www.youtube.com/watch?v=U69pGyv2cV0 評価値900で止めるとか言ってたけど、最後までやるんだね 一回つみがでたのに、攻めきれないなんて、笑う >>112 谷川浩司 名人 竜王 王位 王座 棋王 王将 棋聖 05 04 06 01 03 04 04 >>110 電力三倍のが時間ハンデよりでかいとする根拠は? >>112 中原誠 名人 十段 王位 王座 棋王 王将 棋聖 15 11 08 06 01 07 16 >>112 あと惜しかったのが米長邦雄 あと王座を1期でも獲っていればグランドスラム達成だった エルモに圧勝したって聞いたから 異次元の構想が散りばめられた棋譜かと思ったら 青野流とかウォーズのbotが良くやってる駒組に加え 入玉模様に難のあるゴミ棋譜だな 一年待って期待してた分すごいがっかりだわ 目新しい序盤戦術を期待してたんだがよくある形ばかりで残念 青野流が優秀な作戦ってのは良く分かったけど 世界最強ソフトでも新しい序盤戦術は生み出せないな やっぱりプロ凄いわ というか将棋は大駒の枚数と配置的に序盤戦術はチェスと比べても相当制限あるんじゃないか? 中盤以降の局面の多さが売りのゲームだろう 評価値-900で投了はおかしいとか言ってたら 評価値-4500にしたか レーティング計測者が特大ブーメランくらってワロタ -4500以下で計測した棋譜全部ゴミじゃんw uuunuuunの棋譜、全部やり直しw AlphaZeroは囲碁やチェスでも候補手の剪定はかなり極端にしているみたいだから、 有志が作るZeroタイプならもっと他の候補手も指すようになるかもしれない 終盤異次元でも人間はまったく参考にならないからね特にアマは 目新しい序盤戦術なかったっぽいね 数年前は角換わり48金29飛・雁木・pona流早繰り銀・36歩取らせ・銀冠穴熊などなど ソフト発の戦法がいろいろでてきたのにここ最近はめっきりだな アルファゼロの棋譜を一通り見たが人間が取り入れたい目新しい定跡など見受けられないので所詮使い道がないゴミ同様の棋譜だわ 強いことは間違いないの? 今回は入玉無しとかのザルルールじゃないんだよね? 全部居飛車か〜、まぁそりゃそうだよな・・・ 対抗型になった時の指し方とか見たかったなぁ 囲碁はalphagoから取り入れようとしてるのに将棋はゴミ扱いか アマが真似できないってだけでプロは当然何か学び取ろうとするだろ チェスだってポジショナルピースサック大魔神AlphaZeroから学んでる最中や Youtubeに動画溢れすぎw 人間ではありえないような棋譜でワロタ 将棋は無限に近い可能性があるね アルファ碁ゼロは布石から衝撃的だったから期待して来てみたが… 将棋はよく分からんがスレ見るに無難な棋譜だったみたいだな どれくらい不利な状況からでも、プロ棋士に逆転できるのか実験してほしい(´・ω・`) というかアルファゼロの問題というより将棋のゲーム性の問題では 有力な序盤戦術がもう発掘され尽くしてるという AlphaZeroはelmoより電力三倍以上であの勝率ならソフト性能単体では最新ソフトの方がやや強い ソフトは1年あたりレートが200ほど上がってきているから来年のWCSC29では今の最新ソフトに勝率60% 以上のものも出てくるだろう 電力とレートの関係も説明せずに電力三倍とか力説されても困る >>146 電力三倍以上でやっている時点で話にならんwww 24番はひどい 勝勢になってから100手ほどだらだらと 評価値が3000から1800を行ったり来たり 入玉絡みでも中段玉でもない。寄せを決めにいかないしいけない。しかも自陣全く怖くないのに自陣に金打 これ 学習中の将棋かもしれないな この将棋に限り弱い 勝ったけど 12時間以上学習させたらどうなるんだろ、1週間やらせたらまた全然違う物になるのか頭打ちなのか 囲碁は謙虚に受け入れて研究しようとしてたのに 本当に将棋やってる奴らは文句ばかり言うなw こんなわけわからん棋譜打つソフトに、トッププロでも誰一人勝てないのか 囲碁は単純に定跡が進歩してないから 真新しい打ち筋があるのだろう 将棋の定跡の進歩は囲碁とは比べ物にならないくらい 目覚ましいからな >>9 ずるくない まさか世の中全てが平等だとでも? 棋譜みたけど異次元すぎて理解不能だった プロの先生は飛車落ちくらいなら勝てるのかな? >>150 モンテカルロ法の影響の可能性も 最終的に勝てばいいってことだけを学習して、最短で勝つってことを学習させてない 囲碁でも勝勢のときは緩めて負けない程度の悪手を打ちまくるって話があった ルール以外は何も教えないっていうのがAlphazeroの売りだから あらゆるランダムな手を全部ためして学習しているから大駒の不成とか歩の不成でも 勝敗に影響しない手はちらほら残っている >>154 囲碁の低レベルさとゲームとしての浅さが暴露され、将棋の深さと棋士の質の高さが証明されたね。 個人ではとても注ぎ込めないようなGoogleの莫大な計算資源をぶっ込んだ結果なんだから「実計算時間」である「2時間」という数字には大した意味は無いぞ。 >>146 マス大山 剣道三倍段 ヤス大山 電力三倍段 >>163 AlphaZeroは序盤が強くて、30手では既に決着がついているんだと思うわ AlphaGoの例から鑑みて 危険な筋を全部読み切るなんて人間にはできそうにない >>168 第6局で「やってみたかった病」が出るのか 日本の最新ソフトより弱いってコンピュータ将棋スレで言ってた NNUEkai7の方が強い そうか 成っても先に影響与えない場合は不成選ぶ場合があるのか たぶんもうそういう次元じゃないんだと思うよ そいつの棋力も数時間で越されると思う AlphaZeroはNNUEkai7より弱いという事実 無料公開されているフリーソフトより弱いソフトの棋譜なんてありがたみがねーな >>169 楽しみなような 竜王戦はやめてと言いたいような AlphaZeroはヘンテコな勝ち方の棋譜ばかりで参考にならないな 横歩取り青野流 角換わり腰掛け銀 相掛かり が中心で序盤にも特に目新しさがない はっきり言ってガッカリしたわ >>175 そんなに強いならWCSCに出ればいいじゃん IDコロコロ荒らしさん ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる