AlphaZeroの将棋棋譜がついに公開!
■ このスレッドは過去ログ倉庫に格納されています
論文 A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play http://science.sciencemag.org/content/362/6419/1140 棋譜(100棋譜) https://deepmind.com/research/alphago/alphazero-resources/ 羽生善治竜王のセレクション10棋譜付き! >>556 もちろん成長は限界あるだろうけど elmoとドルフィンや狸の差ぐらいなら 1ヶ月もあれば越えないかな >>559 後手で頑張れるのが角換わりぐらいで、先手はわざわざ角換わりにする必要がないと判断してるから先手で角道は開けない。 >>559 角換りは 後手に完全防御されたら 先攻できない ⇒ 先手のメリットを生かせない戦法 人間のプロ将棋も、もうじき角換り離れが始まると思う 全員同じ序盤戦術とるようになったら将棋中継は最初の1時間いらんな >>561 ん?先手76歩、後手84歩は僅かに残ってるけど、後手34歩は学習後ほぼ付かない 先手76歩も学習進めるほどつかないて話じゃなかったか? だから後手で角換わりなんて戦型指さないのでは? 既に、オセロは、wzebraに勝てる物は無いでしょ。 オセロR907でAlphaZeroについて語ってるのは何monだよw 先手から角換わりしない相掛かりや雁木はソフト同士でも後手不満なしと思ったが 横歩を取られるのが嫌なんだな。 やはり俺の感覚は正しかったんだ!上級者は横歩とられるのが通っぽい感じだけど俺は横歩を取られるとすげえ腹立つw 千田じゃなくて40代以上でAやB1にいる棋士の見解聞いてみたい その年代で上に残ってる人って柔軟な発想持ってそう 将棋で一番難解な戦型と言われてる相がかりが結論か 角換わりから相がかりに人間も移行するんだろうな チェスだとポーン得できても同じ駒を序盤に何回も動かすのは良くない言われてるけど将棋は持駒を使える分、手得より駒得のほうがアド高いのかな? あいがかりってなかなか定石化しないしやっぱり奥が深いんだろうな。 かくがわりとか横歩ってすぐハメられちゃうし 「筋がいい」というのは誉め言葉でなく、 「弱い」の言い換えになっちゃう。 千田が紹介してたオルカの最新版 横歩の先手勝率の高さ。 角換わりは局数は多いけど先手勝率は0.167しかない。 コンピュータ将棋的に横歩は先手有利、角換わりは後手有利。 アルファは相掛かりを好み、角道は絶対開けないマンになるて事かな。 https://twitter.com/Rota_JP/status/1071568731191468033?s=09 https://twitter.com/5chan_nel (5ch newer account) みんな妄想ばかり書き込んでるからこのスレめちゃくちゃでワロタ かくがわりが後手遥かに有利ってのが興味深い。 後手が完璧に組めば先手の攻めが成立しないってことかな。 そうなると手詰まりになるから千日手が最善。 >>577 定跡オフの角換わりはあてにならないよ。 それから、角換わり腰掛け銀26歩型、角換わり腰掛け銀25歩型、角換わり早繰り銀、その他で分類するべきだよ。 角換わりで全てひとまとめにするのは暴論だね。 >>577 プロでも25歩突いての角換わりは後手の方が勝率高いよね 25歩が邪魔になって手待ち作戦に対して明快な攻めがない 26歩型は先手有利だが今度は角道閉じて雁木にされるとこれも後手がややいい 相掛かりは自由度が高すぎて先後関係なく棋力差が一番反映されやすい感じかな 「Pythonで書かれたAlphaZeroを動かして三目並べを学習させてみる」とか 「三目並べをAlphaZeroで学習させる」とかのページがあるんで 誰が一番初めにAlphaZero将棋を動かしてみるかだね。 やっぱりポナンザの人が一番最初かな >>581 本当に雁木がいいのか?w 雁木が悪いだろw ▲2六歩、▲2五歩の後は、▲9六歩らしいよ、AlphaZero的には >>583 既にコンピュータ囲碁で有名(将棋でいうBonanza保木さんクラス)なフランスのRemiさんが動かしてて、来年の選手権への参戦を表明してる(今年の選手権にも参戦したものの、学習時間不足により敗退) 相掛かりは、やっぱり人間のレベルでは先手の優位を維持するのが難しそう。 プロの先手後手の勝率の差が縮まるんじゃないか。 このYouTubeチャンネルで解説されるのを待っているのだけれど、いつになったら投稿するかどうか suimonの将棋チャンネル https://www.youtube.com/user/BGVN1127 >>578 妄想の話が捗るのは仕方ないだろ 裏を返せばゼロの棋譜が期待はずれって事 >>544 一応補足しとくと、ソフトも一本道で深く読むこともやってる もちろん人間より精度は落ちると思うけど >>589 先手雁木は不利だし 25歩まで突かれると後手も雁木できないからね 雁木は角換わり拒否の2の矢でしかない グーグルのマシンじゃなく、現在世界一の米国のスパーコンピュータサミットで動くアルファーゼロ作れば良いのに作らないのは、単にお金の問題なのか? そのクラスのコンピュータ選手権開催すれば良いのに zeroが期待外れって言ってる人は、どんなものを期待していたのかね。 斬新な序盤戦術? 玉で攻めるとか、序盤で大駒を捨てるとか? AlphaZeroの終盤が変なのは、AlphaZeroがバグっているからか、まだ伸びしろが残っているかだと思う たぶんバグってはいる 定跡無しで自己学習だからね。 序盤に関しては一体何じゃこりゃっていうアルファ碁並の衝撃は期待してた人は多かったんじゃないかな。 今の将棋ソフトの流れとは違うものがないか期待したんだろうが 近い結論になったのが気に入らないんだろう ただ人間的には薄い玉で殴り合うのは限界があるだろうが >>597 バグってないよ 終盤緩むのはMCTSアルゴリズムの特徴で、囲碁でも同様の現象が確認されてる >>584 anti_何ちゃらって人が角換わりは打開できる打開できるってツイートしてたから、角換わりが打開できないなら、結果的にAlphaZeroがanti_何ちゃらさんを潰したことになるね。 将棋の浅さが囲碁と比較して露呈したのが気に入らないんだろう >>601 suimonとアンチの戦いはコンピュータ代理戦争と言えよう 悪手を一手も指さないいわば「将棋の神」とアルファゼロとの棋力の差はどのくらいあるんだろうね。 https://imgur.com/a/ElCuC1u AlphaZeroがelmo(2017年5月版)に負けた将棋 AlphaZeroの駒組みが無策すぎてワロタ AlphaZeroの序盤は参考にならないな まあ将棋を深くしようと思えば、マスと駒の種類を増やせばいいわけで、 別に浅くても気にする必要はないだろ。 長年セルフじょうせきになってた5手目9六歩がこれから流行りそうで嫌や >>602 将棋より囲碁の方が単純に手のパターンが上だからね ただ将棋の恐ろしさは一手のミスで簡単に逆転が起きるところ 人間がやるところに魅力がある >>600 なるほどね! でも、平岡さんはツイッターでAlphaZeroの入玉判定にバグがあることを指摘している バグってるというか汎用学習ルーチンだから入玉宣言法なんて知らないんじゃないのか? >>609 終盤の話してたはずなのに入玉の話だったのか? >>605 これって仕掛け決まってんの? 22銀24歩同歩同飛44歩でわからん。 まさか22飛車なりから31角で決まってんの AlphaZeroは、最初の頃、初手▲7六歩で角道を開けてたが 何度もやっているうちに開けなくなったという報告があるな 千日手になりやすい角換わりを避けるために 相掛かりを志向し始めたのか知らんが それで相掛かりを拒否されて角換わりになって負けてる棋譜がある もう1周くらいしたら角換わりを拒否できる先手矢倉を志向し始めるんだろうか >>613 31角なら32金53角成同金同桂成52歩かな?さすがに切れてんじゃね? 学習過程に興味ある人は>>78 の論文見てみるといい AlphaZeroの自己対局で頻繁に現れた6手目までの局面が training stepの数別に載ってる 700000で既に相掛かり模様になってる アルファ碁の人間に負けたのはもう勝ち確定のところから人側が投了しなかった時に 級位者レベルの寄せができずに負けだからな あれではまだ最後の詰めが本当に分かってるのかどうかはっきりしてない 入玉も甚だ怪しい まだ話半分だな 大会に出ないと技術の証明にならないよ >>577 逆に考えたほうがいいかもしれませんね 横歩を取られると負けるので角道を開かないで相掛りを指している といった仕組みになっているのではないかとか思います αさんが96歩に拘るのはそういった所に理由があるのではないかと思います >>610 ルールを教えた上で自己対戦させて学習させるので もとのルールセットに宣言法があったのか問題だよね >>619 自分もそちらじゃないかなと思っている 負けない確率を潰していく過程で残ったのが相掛かりなんじゃないかと 相手の必勝戦法を避けて残ったのが先手後手の優劣が出にくい戦法でそれがAlphaZeroにとっては相掛かりだったのじゃないかなって >>614 ,620-621 自己対戦学習で初手76歩より26歩の先手勝率が良かったという結論 先手矢倉がダメとか角換わりがダメとかいう結論とは違う どれでも先手勝率が50%以上だった可能性がある 中でももっとも勝率が良かったのが相掛かりだったから初手26歩なんだよ 一方、後手の横歩取りは完全否定されて初手84歩が必然との結論を出している つまり、先後の初手は藤井聡太と同じだね 最後緩んでギリギリの形勢にするが勝ちはするというのは重要な欠陥だ ギリギリにするだけでなく負けたこともあるから本当に逆転まではさせないのかも信用ならない 勝ちになったところから最短で詰ませるような改善は必要だろう 他のどの分野に応用するにしても重要だよ 難しい手術を完璧に進めて後は誰がやっても大丈夫と安心してたらそこから大惨事にとならないために >>614 先手矢倉は当然ダメで、 先手角換わりもイマイチっぽいから相掛かりにしてるんじゃないのか >>623 大惨事が起きる確率を減らせという注文と最短を目指せという注文は矛盾してるぞ? >>613 >>615 AlphaZeroが負けたという現実から目をそらすな >>624 当然っていうからにはちゃんと調べたんだろうな? いずれにしても横歩は完全にダメそうやな 青野流が優秀すぎて 青野流には明日斗流を主張していたさくらは謝罪しろよ 序盤に技術革新が起きていそうなのだけど、誰もAlphaZeroを使えないので、検討できない感じ? AlphaGoみたいに人間とネット対戦をそのうちやってくれることを期待しよう! 藤井聡七段 大橋四段 千田六段 elmo囲い採用 さくらウォーズ初段 elmo囲いは疑問 >595 DMがalphazeroとか作ったのは技術アピールだし 元々研究者にとっては囲碁将棋は情報学を発展させるためのサンプルに過ぎない。 他所の研究所などが時間とお金を掛ければalphazeroより強いソフトができる可能性はあるけど 作ったとしても他所の成果の後追いといわれるだけだから。 研究者として受ける功績が薄そうなのは研究者本人やその所属団体自体が嫌がる。 お金以外に時間の無駄だから、研究リソースを別のテーマに移すのは普通の選択 >>615 AlphaZeroの棋譜をXeon採点してるのは何monだよw そろそろ誰かWikipediaに、elmo囲いの項目の記事書いてよ(´・ω・`) >>637 頭に血がカーッと上ってるのは何monなんだよ?w 書き込みをビタビタ当てられて動揺しているなw 悲惨だなw David Howell @DavidHowellGM Back in April I was part of a team that played a match against AlphaZero. Check out my column in today's @thesundaytimes for exclusive coverage of the games! Dominic Lawson has also written a great piece on our experience of the match. 羽生さんもすでに対局しているのかもしれない・・・ ひっそりってこともないだろうから AlphaZero vs Habu があるならどこかへ出るだろう NHKあたり有力? >>636 相掛かり得意っていう若手はぱっと思いつかないな。 この戦型は、ベテランの方が序中盤うまく指せそう。 羽生が負けたら将棋界がお通夜みたいになりそうで嫌だな >>647 むしろ正常化だよw 今のままではガラパゴスなカルト宗教だ 囲碁界がスマホ規制 超人AIの設計図公開で反対論一転 https://www.asahi.com/articles/ASL9R7JQFL9RUCVL00B.html 画像:対局後にスマホでAIの分析を見る中国のトップ棋士、柯潔九段(右)。 “AI信仰”は急速に広がっている=8月21日、東京都渋谷区 https://www.asahicom.jp/articles/images/AS20180925002361_comm.jpg 画像:日本棋院が用意したスマホロッカー。対局前に棋士自身がここに預ける=東京・市ケ谷の日本棋院 https://www.asahicom.jp/articles/images/AS20180925002370_comm.jpg 超人囲碁AIをわが先生に 棋士ら、こぞってインストール https://www.asahi.com/articles/DA3S13677523.html 敗れた井山は「AIをどれだけ細部まで研究し、どれだけ知っているかが 結果に表れるようになった」と言う。「知らないと負けとは言わないまでも、 トップ棋士が相手だと厳しい。単なるまねは抵抗があるが、 一理あると思う手はどんどん採り入れる姿勢でいかなきゃいけない」 今夏発足した棋士有志のAI研究会「プロジェクトAI」は、理解しがたいAIの手について 知恵を出し合い、意図を探る。AIによって一手の評価が正反対になることもあり、 何が最善手なのかは容易に結論を出せないのが実情だ。 「正直、何を信じていいのかわからない」と一力遼八段(21)。 「でも、打つと負けるんですよね」。座長の大橋拓文(ひろふみ)六段(34)は 「AIとどう付き合えばいいのか、手探りの状態です。 人間が使いこなせる道筋を見つけるのも、研究会の目的の一つ」と言う。 >>647 もう誰一人として勝てると思ってないだろw 興行にすらならない 1手につき考慮時間1時間とかなら勝負になるかもしれない 何日かかるか知らんけど 羽生は前期の竜王戦初戦が三浦の復帰戦で 注目はされたが複雑な心境でスタートしたと感じた 冷え冷えだったところに藤井聡太が火を起こしてにわかを招集して 満を持したかのように永世七冠を達成して従来のファンも盛り上げた それだけでもすげぇと思うわ そういうハンデ付きなら有りかもね。 ソフトの持ち時間1時間羽生持ち時間10時間とか >>654 そう、だから現状はもはやカルト宗教 最新の将棋ソフトだとノートパソコンでも九段が即指しな件 http://yaneuraou.yaneu.com/2018/08/07/ この段位は、将棋倶楽部24換算になっているので、 町道場の段位よりかなりシビアな段位です。九段=R3200(R3100?R3300)、 八段=R3000、…、初段=R1600、1級=R1500、2級=R1400、…。 この九段は平均的なプロと同じぐらい(それ以上?)の棋力ではないかと思います。 いまどきの将棋ソフトで、九段にするには、NodesLimit = 315,754。 ちなみに初段は、NodesLimit = 3,450だということがわかりました。 (わりと少ない数字なので驚いています。) いまどき、3万円のノートパソコンでも1秒間に50万局面は読めるわけで、 九段に設定してもノートパソコンですら即指し(1手、1秒未満)という結果になりました。 普通の(10万円ぐらいの)デスクトップ機なら、九段に設定していても0.1秒未満で指してきます。 また、「初段」の棋力でよければ、人間側が1手1秒で指すとしても 3万円のノートパソコンで100面指し出来てしまうということですね。いやはや。 ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる