AlphaZeroの将棋棋譜がついに公開!
■ このスレッドは過去ログ倉庫に格納されています
論文 A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play http://science.sciencemag.org/content/362/6419/1140 棋譜(100棋譜) https://deepmind.com/research/alphago/alphazero-resources/ 羽生善治竜王のセレクション10棋譜付き! 定跡無しで自己学習だからね。 序盤に関しては一体何じゃこりゃっていうアルファ碁並の衝撃は期待してた人は多かったんじゃないかな。 今の将棋ソフトの流れとは違うものがないか期待したんだろうが 近い結論になったのが気に入らないんだろう ただ人間的には薄い玉で殴り合うのは限界があるだろうが >>597 バグってないよ 終盤緩むのはMCTSアルゴリズムの特徴で、囲碁でも同様の現象が確認されてる >>584 anti_何ちゃらって人が角換わりは打開できる打開できるってツイートしてたから、角換わりが打開できないなら、結果的にAlphaZeroがanti_何ちゃらさんを潰したことになるね。 将棋の浅さが囲碁と比較して露呈したのが気に入らないんだろう >>601 suimonとアンチの戦いはコンピュータ代理戦争と言えよう 悪手を一手も指さないいわば「将棋の神」とアルファゼロとの棋力の差はどのくらいあるんだろうね。 https://imgur.com/a/ElCuC1u AlphaZeroがelmo(2017年5月版)に負けた将棋 AlphaZeroの駒組みが無策すぎてワロタ AlphaZeroの序盤は参考にならないな まあ将棋を深くしようと思えば、マスと駒の種類を増やせばいいわけで、 別に浅くても気にする必要はないだろ。 長年セルフじょうせきになってた5手目9六歩がこれから流行りそうで嫌や >>602 将棋より囲碁の方が単純に手のパターンが上だからね ただ将棋の恐ろしさは一手のミスで簡単に逆転が起きるところ 人間がやるところに魅力がある >>600 なるほどね! でも、平岡さんはツイッターでAlphaZeroの入玉判定にバグがあることを指摘している バグってるというか汎用学習ルーチンだから入玉宣言法なんて知らないんじゃないのか? >>609 終盤の話してたはずなのに入玉の話だったのか? >>605 これって仕掛け決まってんの? 22銀24歩同歩同飛44歩でわからん。 まさか22飛車なりから31角で決まってんの AlphaZeroは、最初の頃、初手▲7六歩で角道を開けてたが 何度もやっているうちに開けなくなったという報告があるな 千日手になりやすい角換わりを避けるために 相掛かりを志向し始めたのか知らんが それで相掛かりを拒否されて角換わりになって負けてる棋譜がある もう1周くらいしたら角換わりを拒否できる先手矢倉を志向し始めるんだろうか >>613 31角なら32金53角成同金同桂成52歩かな?さすがに切れてんじゃね? 学習過程に興味ある人は>>78 の論文見てみるといい AlphaZeroの自己対局で頻繁に現れた6手目までの局面が training stepの数別に載ってる 700000で既に相掛かり模様になってる アルファ碁の人間に負けたのはもう勝ち確定のところから人側が投了しなかった時に 級位者レベルの寄せができずに負けだからな あれではまだ最後の詰めが本当に分かってるのかどうかはっきりしてない 入玉も甚だ怪しい まだ話半分だな 大会に出ないと技術の証明にならないよ >>577 逆に考えたほうがいいかもしれませんね 横歩を取られると負けるので角道を開かないで相掛りを指している といった仕組みになっているのではないかとか思います αさんが96歩に拘るのはそういった所に理由があるのではないかと思います >>610 ルールを教えた上で自己対戦させて学習させるので もとのルールセットに宣言法があったのか問題だよね >>619 自分もそちらじゃないかなと思っている 負けない確率を潰していく過程で残ったのが相掛かりなんじゃないかと 相手の必勝戦法を避けて残ったのが先手後手の優劣が出にくい戦法でそれがAlphaZeroにとっては相掛かりだったのじゃないかなって >>614 ,620-621 自己対戦学習で初手76歩より26歩の先手勝率が良かったという結論 先手矢倉がダメとか角換わりがダメとかいう結論とは違う どれでも先手勝率が50%以上だった可能性がある 中でももっとも勝率が良かったのが相掛かりだったから初手26歩なんだよ 一方、後手の横歩取りは完全否定されて初手84歩が必然との結論を出している つまり、先後の初手は藤井聡太と同じだね 最後緩んでギリギリの形勢にするが勝ちはするというのは重要な欠陥だ ギリギリにするだけでなく負けたこともあるから本当に逆転まではさせないのかも信用ならない 勝ちになったところから最短で詰ませるような改善は必要だろう 他のどの分野に応用するにしても重要だよ 難しい手術を完璧に進めて後は誰がやっても大丈夫と安心してたらそこから大惨事にとならないために >>614 先手矢倉は当然ダメで、 先手角換わりもイマイチっぽいから相掛かりにしてるんじゃないのか >>623 大惨事が起きる確率を減らせという注文と最短を目指せという注文は矛盾してるぞ? >>613 >>615 AlphaZeroが負けたという現実から目をそらすな >>624 当然っていうからにはちゃんと調べたんだろうな? いずれにしても横歩は完全にダメそうやな 青野流が優秀すぎて 青野流には明日斗流を主張していたさくらは謝罪しろよ 序盤に技術革新が起きていそうなのだけど、誰もAlphaZeroを使えないので、検討できない感じ? AlphaGoみたいに人間とネット対戦をそのうちやってくれることを期待しよう! 藤井聡七段 大橋四段 千田六段 elmo囲い採用 さくらウォーズ初段 elmo囲いは疑問 >595 DMがalphazeroとか作ったのは技術アピールだし 元々研究者にとっては囲碁将棋は情報学を発展させるためのサンプルに過ぎない。 他所の研究所などが時間とお金を掛ければalphazeroより強いソフトができる可能性はあるけど 作ったとしても他所の成果の後追いといわれるだけだから。 研究者として受ける功績が薄そうなのは研究者本人やその所属団体自体が嫌がる。 お金以外に時間の無駄だから、研究リソースを別のテーマに移すのは普通の選択 >>615 AlphaZeroの棋譜をXeon採点してるのは何monだよw そろそろ誰かWikipediaに、elmo囲いの項目の記事書いてよ(´・ω・`) >>637 頭に血がカーッと上ってるのは何monなんだよ?w 書き込みをビタビタ当てられて動揺しているなw 悲惨だなw David Howell @DavidHowellGM Back in April I was part of a team that played a match against AlphaZero. Check out my column in today's @thesundaytimes for exclusive coverage of the games! Dominic Lawson has also written a great piece on our experience of the match. 羽生さんもすでに対局しているのかもしれない・・・ ひっそりってこともないだろうから AlphaZero vs Habu があるならどこかへ出るだろう NHKあたり有力? >>636 相掛かり得意っていう若手はぱっと思いつかないな。 この戦型は、ベテランの方が序中盤うまく指せそう。 羽生が負けたら将棋界がお通夜みたいになりそうで嫌だな >>647 むしろ正常化だよw 今のままではガラパゴスなカルト宗教だ 囲碁界がスマホ規制 超人AIの設計図公開で反対論一転 https://www.asahi.com/articles/ASL9R7JQFL9RUCVL00B.html 画像:対局後にスマホでAIの分析を見る中国のトップ棋士、柯潔九段(右)。 “AI信仰”は急速に広がっている=8月21日、東京都渋谷区 https://www.asahicom.jp/articles/images/AS20180925002361_comm.jpg 画像:日本棋院が用意したスマホロッカー。対局前に棋士自身がここに預ける=東京・市ケ谷の日本棋院 https://www.asahicom.jp/articles/images/AS20180925002370_comm.jpg 超人囲碁AIをわが先生に 棋士ら、こぞってインストール https://www.asahi.com/articles/DA3S13677523.html 敗れた井山は「AIをどれだけ細部まで研究し、どれだけ知っているかが 結果に表れるようになった」と言う。「知らないと負けとは言わないまでも、 トップ棋士が相手だと厳しい。単なるまねは抵抗があるが、 一理あると思う手はどんどん採り入れる姿勢でいかなきゃいけない」 今夏発足した棋士有志のAI研究会「プロジェクトAI」は、理解しがたいAIの手について 知恵を出し合い、意図を探る。AIによって一手の評価が正反対になることもあり、 何が最善手なのかは容易に結論を出せないのが実情だ。 「正直、何を信じていいのかわからない」と一力遼八段(21)。 「でも、打つと負けるんですよね」。座長の大橋拓文(ひろふみ)六段(34)は 「AIとどう付き合えばいいのか、手探りの状態です。 人間が使いこなせる道筋を見つけるのも、研究会の目的の一つ」と言う。 >>647 もう誰一人として勝てると思ってないだろw 興行にすらならない 1手につき考慮時間1時間とかなら勝負になるかもしれない 何日かかるか知らんけど 羽生は前期の竜王戦初戦が三浦の復帰戦で 注目はされたが複雑な心境でスタートしたと感じた 冷え冷えだったところに藤井聡太が火を起こしてにわかを招集して 満を持したかのように永世七冠を達成して従来のファンも盛り上げた それだけでもすげぇと思うわ そういうハンデ付きなら有りかもね。 ソフトの持ち時間1時間羽生持ち時間10時間とか >>654 そう、だから現状はもはやカルト宗教 最新の将棋ソフトだとノートパソコンでも九段が即指しな件 http://yaneuraou.yaneu.com/2018/08/07/ この段位は、将棋倶楽部24換算になっているので、 町道場の段位よりかなりシビアな段位です。九段=R3200(R3100?R3300)、 八段=R3000、…、初段=R1600、1級=R1500、2級=R1400、…。 この九段は平均的なプロと同じぐらい(それ以上?)の棋力ではないかと思います。 いまどきの将棋ソフトで、九段にするには、NodesLimit = 315,754。 ちなみに初段は、NodesLimit = 3,450だということがわかりました。 (わりと少ない数字なので驚いています。) いまどき、3万円のノートパソコンでも1秒間に50万局面は読めるわけで、 九段に設定してもノートパソコンですら即指し(1手、1秒未満)という結果になりました。 普通の(10万円ぐらいの)デスクトップ機なら、九段に設定していても0.1秒未満で指してきます。 また、「初段」の棋力でよければ、人間側が1手1秒で指すとしても 3万円のノートパソコンで100面指し出来てしまうということですね。いやはや。 QQRとillqhaで棋譜解析してみた とりあえず1.csa〜6.csaまで終えた いずれも先手がAlphaZeroの相掛かりの棋譜だが、AlphaZeroが有利になったのは中盤の指し手でelmoに疑問手があったのが原因だった QQRもillqhaも間違えないところでelmoだけが勝手に間違えている これが敗着といってよい したがって、これらだけを見ると戦形の優劣でelmoが負けたわけではないし、AlphaZeroが強すぎたわけで負けたわけでもない 単にelmoがQQRやillqhaより弱いソフトだったのが敗因となっている 敗着となったelmoの手と評価 1.58手目25桂の敗着で先手Alpha有利 2.78手目44歩の敗着で先手Alpha有利 3.56手目33銀の敗着で先手Alpha有利 4.88手目76歩の敗着で先手Alpha有利 5.66手目38銀の敗着で先手Alpha有利 6.90手目71金の敗着で先手Alpha有利 千田が自分のPCじゃ互角くらいになるがその後進めたらどうやっても劣勢になって どれだけ深く読んでいたのかって驚くとこあるけど AWSマンが評価値を貼るときよくある現象だよね それはマシンパワーをたくさん使ってる分深く読めるってだけのことでしかないし グーグルはAWSですら(笑)になるレベルのマシンパワー使ってるってだけだ エルモと称したプレステシンプルシリーズの将棋ソフトに勝って世界最強のAIだもんな ゼロの配布がされてないから検証も出来ないのに 妄信的なカルト信者はゼロを賞賛 ゴミ棋譜から相掛が最善の戦法だとか騒ぎやがる 根拠のない妄想から結論を出して断言とか話にならんやろ >>656 QQRとかillqhaですら正しく評価できるか分からなくなってきてるってのが AlphaZeroの出現で分かった いずれQQRもillqhaも間違えてしまうはず >>659 いずれも何もAWS使うだけで正しい評価なんて変わるだろ バカじゃないのか? 角換わりダメ横歩もダメなら初手96歩マンが出てきてもいい AlphaZero以外の話してるスレ違いの奴がいるな 他のところに行けよ >>663 AlphaZeroが大して話題にならなくてカリカリしてるのは何monなんだよ?w AlphaZero が示した事は簡単。 どんな初歩的な戦術でも(AlphaZeroの場合は駒得) 相手より深く読めば、勝てる方法がある。 ただ人間ならアホらしいし誰もやってみないだけ 今日、タニーが相掛かりで山ちゃんを凹ってた。 おっさんの復権あるで。 >>555 ケチくせえな。語尾につける挨拶か。まさかいきなり文句書くヤツはいないだろうからな。お前にならって使うわ。 ググるよガイジ。それから分かりやすく書かないと同意してくれねえぞガイジ。 量子コンピュータで激指13動かせばそいつらみんな雑魚だろ 角道ってどうせ開けることになるのになんで初手だと駄目なの >>658 さすがに世界的な論文誌でそんなことやるのはハルコ・オボカタくらいだろ それでも信じられないならAlphaZeroクローンのCrazyShogiが来年のコンピュータ将棋選手権に参戦表明してるからそれまで待て >>674 アルゴリズム的にはレミクーロンがオリジナルなんだから どっちがクローンなんだかww >>658 君より千田の方が1億倍信用できるからな >>670 ワロタに草つけるくらいやから、よっぽどうけたんだろうな。 DMのやってることと棋理の追求は別物だからねえ。 DMはAIは短時間でこんなこと、最高レベルの将棋ソフトと互角の戦いが出来る、まで出来るんだよ。 そのAIが指す将棋が棋理にかなってるかは別問題。 ただ、飛車先はつくけど、角道はあけない、ってのは、駒の配置考えると真理なのかもって気はするね。 人間の戦いやすさとは別次元で。 最近の青野流の勢いをみると勇気流とはなんだったのか アルファゼロに振り飛車のみ指させれば新戦法も出るんだろうけど、開発チームに居飛車と振り飛車の違いから教えないと始まらないな 囲碁やチェスなら分かるけど、なんでgoogleは将棋なんてマイナーなゲームをわざわざ選んだんだろうか? 普通無視するだろ >>676 俺もお前やディープマインドより千田の方が1億万倍信用できるけどな 横歩取りが終わったと言うならタイトルの一つをとってから言って貰いたいわ アルファゼロは将棋ソフトではないんだから 色々根本的に違うんだろうな 時間できたら論文読もう >>683 AI関連で世界配信された事件があったような? >>683 安心しろ。 もちろん、あくまでチェスや碁をやった『ついで』だからなw 相掛かりは力戦待ったなしの戦型だから 大局観で戦うベテランの勝率が上がるかもしれない >>551 elmoに強い指し回しが他のソフトにも強いかどうかが焦点になるな >>683 ボードゲームの中でグーグル以外が作ったソフトがあるからだろ elmoと戦っただけで別にelmoに勝つ学習したわけじゃないし >>688 序盤がアバウトなのは何_crowだよw 将棋は厳しいね AIの得意分野だからな 小説とか、音楽はAIには無理でしょ パッヘルベルのカノンを超える曲を10曲ほど作ってみろよ? 自己対戦だけで無限に強くなってくから相手は関係ない ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる