AlphaZeroの将棋棋譜がついに公開!
■ このスレッドは過去ログ倉庫に格納されています
論文
A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play
http://science.sciencemag.org/content/362/6419/1140
棋譜(100棋譜)
https://deepmind.com/research/alphago/alphazero-resources/
羽生善治竜王のセレクション10棋譜付き! >>781>>782
だから渡辺は勝っても何の伝説にもなってないって話でしょ
羽生も同様にボンクラーズに勝とうがGPSに勝とうが別に伝説になんてならない
勝ったら勝てるもんなんだってなるだけ
当時のBonanzaだってプロより強いからね
渡辺が勝ったせいで大したことないと思われてるだけで
「いつ」ソフトが人間を越えたか って言うならBonanzaだよ AlphaZeroの将棋みてると、ディープラーニングのダサさが
垣間見えるな。理屈とか物の道理に基づいて指し手を選んで
るわけじゃなくて、自己対戦の経験で指してるから、成らずで
勝ったことが多かったみたいで、成らずがしょっちゅう出てくるし、
終盤、無駄な捨駒をしたり、詰みがあっても詰まさない。
勝ちの結果だけ出せればそれで良し!棋譜の美意識を持てよwww >>551
開発者の心が折れるとするなら、圧倒的なマシンパワーの差だろう。 >>721
競ってるときが一番楽しいけど、そこは過ぎてしまったのでどうだろ。 >>769
ちょっと考えが足りないかな、と感じる。 >>747
いやそういうことじゃなくて今後ソフトで育った子供がーってことだよ
別にソフトの棋譜並べたからソフトの計算力が身に付くわけでもないし >>678
なんや詰めても離れるばっかり。相手して損した。塩や。 >>764
最初の敵は情報処理学会、次の敵は東大の670台クラスタだったろ
プエラ伊藤の話によれば富士通もコンピュータ将棋プロジェクト立ち上げてたわけで
将棋連盟が全員追い払って個人プログラマだけを残した流れ 当時のナベはボナンザを奨励会初段レベルと言ってた
あの頃のナベは輝いていたな
期待されていたのに実績を残せなかった 将棋連盟ってか興行してたドワンゴがだな
チェスはIBMの囲碁はGoogleは自社パフォーマンスの為にしてるからな
将棋は興行の為にした違いだろ GPS将棋の時点でこれ制限しなきゃ興行的に成り立たんってドワンゴ判断だろ
どんどんスペック落ちてってもうやめたじゃんw 興行だからいい勝負してもらわないといけないしさ でもアルファゼロ程度ならまだプロが頑張れば勝てると思うけどな >>757
AlphaZeroの指し手の基準は評価値でなく勝率だよ
シミュレーション結果、入玉になりやすい指し手が勝率が高かったからその手を選んでいるだけだよ
終盤はMCTSはあまり役に立たないはずだからどうやっているのか不思議
長手数でも詰みがあるならその枝は勝率100%になるから何となくMCTSの優位性は理解できるんだが コンピュータに勝ち越すなんて不可能だけど、羽生藤井なら番勝負で一発入れることはできるだろう
一発入れたら人間の勝ちにすれば良い勝負になりそう AIに将棋の美学を理解させるのはまだ先のことだろう。
その美学と将棋の強さは無関係なんだろうな。 むしろアルファゼロの中段玉に美学を感じたけど。
感覚が古いか固定観念が出来上がってるんじゃないの。 深層学習汎用ルーチンに美学を見出すとか素晴らしい痴性だ、素晴らしい アルファゼロとトッププロで十番勝負が見たい
事前研究アリなら5-5ぐらいだと思う 美学の追求は簡単だろ、評価値が1000開いたらponanza系のソフトにバトンタッチする
みたいなハイブリッドにすれば良いだけ。
キレのある終盤を見せてくれるだろう。
ただ目指してるのがそんなことじゃないってだけ。 入玉の点数計算ができないみたいだから、目指す方向はわかるだろ だから終盤は最短の方がいいということを学習条件の一つに入れてやればいい >>785
いや千田の公表してる対局結果みる限り大樹の枝でだいたいトッププロと互角
それを本にレートをみると、当時のBonanzaはナベの評価通りぴったり奨励会初段前後 >>2 94手目に83歩と受けると入玉ルートがふさがるから打てなかったのかなぁ
こんな逼迫した局面で14歩は変な手に思える >>801
若手のトップを入れればプロ側が勝ち越しも十分あり得る >>807
残念ながら無いと思う。
AlphaZeroは序中盤が鬼のように強い。
AlphaGoが人間の理解を超えた打ちまわしで圧倒しているように
Masterのときと同じように100回やって誰も勝てやしない まあ勝てないだろうけど人間のトップが集まって相談して時間無制限で対局に挑むのは見てみたい
Abemaとかと組んでこういう企画やって欲しい 後手の持駒:歩二
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香v桂 ・v金v玉 ・v銀v桂v香|一
| ・ ・v銀 ・ ・ ・v金v角 ・|二
| ・ ・v歩v歩v歩v歩 ・ ・v歩|三
|v歩 ・ ・ ・ ・ ・v歩 飛 ・|四
| ・v飛 ・ ・ ・ ・ ・ ・ ・|五
| 歩 ・ ・ ・ ・ ・ 歩 ・ ・|六
| ・ ・ 歩 歩 歩 歩 ・ ・ 歩|七
| ・ 角 金 玉 ・ ・ 銀 ・ ・|八
| 香 桂 銀 ・ ・ 金 ・ 桂 香|九
+---------------------------+
先手の持駒:歩二
千田解説によるとこの将棋は次の▲7六歩で決まったらしい
この手は非常に深い読みが入っていないと指せない なんか棋士がソフトに絶対勝てないって決めつけてる奴いるよな
プロに対する嫉妬か >>812 こういうのがプロ棋士カルト信者、通称プロ厨と呼ばれる生き物です
いまだに居るんですね
時代は>>648 >>655 だというのに 流石にネタだよな
プロとソフトがどうとか今更すぎてあらしのタネにもならん プロ棋士と最新のソフトとの適切な手合は?
http://yaneuraou.yaneu.com/2017/07/19/%E3%83%97%E3%83%AD%E6%A3%8B%E5%A3%AB%E3%81%A8%E6%9C%80%E6%96%B0%E3%81%AE%E3%82%BD%E3%83%95%E3%83%88%E3%81%A8%E3%81%AE%E9%81%A9%E5%88%87%E3%81%AA%E6%89%8B%E5%90%88%E3%81%AF%EF%BC%9F/
> 投稿日時: 2017年7月19日
> これからすると、平均的なプロ棋士だと角落ちでは
> 最新のPC+最新のソフトに勝ち越すのは(対策なしなら)非常に厳しいという
> 結論になりそうだ。飛車落ちの手合が妥当なのかどうかはこの後の検証が待たれる。
平均的なプロ棋士 << (R138差) << ★斎藤慎太郎★六段(2015年当時)
<< 家庭用PC(4コア)Apery(2014) << (R200差)
<< 家庭用PC(4コア)大樹の枝 ← 角落ち → 家庭用PC(4コア) elmo
<< (R100差) << 家庭用PC(4コア)relmo8 << (R200?400ぐらいの差) << 最新のPC(48コア) relmo8 14歳・藤井聡太四段 対コンピューター戦と“年度内タイトル”への思い
http://bunshun.jp/articles/-/2105
週刊文春 2017年4月20日号
> ──ソフトとの勝敗は?
>
> 「(ソフトの能力は)パソコンのスペックによって変わりますので。
> 私はそんなに凄いスペックのパソコンを使ってないので、
> 勝ち越すくらい……まではいかないです(笑)」
史上最年少棋士・藤井聡太四段、14歳の覚悟と日常
http://www.hochi.co.jp/topics/20170610-OHT1T50094.html
2017年6月10日14時25分 スポーツ報知
> 5月、電王戦で佐藤天彦名人が最強ソフト「ポナンザ」に連敗。
> コンピューターと棋士が戦う時代は終わり、共存期に移行し始めている。
>
> 「実は自分もポナンザとネットで3、4局指したんですけど、全部負けてしまいました。
> もちろん負けたくないと思いましたけど、将棋の長い歴史の中で
> コンピューターと棋士が戦った一瞬に居合わせられたことは良かったと思います」 勝ち越しは言い過ぎにしてもプロだって全く勝てないわけないだろ トッププロに100局やって99勝するソフトに100局やって99勝するelmoに100局やって90勝するAlphaZeroにプロがどうやって勝つのかよくわからんな 永瀬はセレネとの勝率が1割は行かないくらいと言っていた
100局やって7〜8局は勝てたってことだろうけど
セレネは当時も最強ソフトではないしあれから時が経っていることを考えると
今の最強ソフトに1発入れるのは厳しい alphaゼロには勝ちやすいとおもうけどね
alphaゼロはモンテカルロだからその強さは経験に裏打ちされてる
恐らくエルモは同じ戦法を永遠と指し続けたんだろうね
振り飛車なんて戦法見たことも聞いたこともないんじゃないかな?
角換わりと雁木には滅法強いだろうが 羽生がもし5年前くらいにソフト(初期Aperyとか)と対戦して勝ってたら
羽生の伝説には何も加わらないどころか今のソフトともやってみましょうよと圧力かけられて逃げられず対戦するハメになりボコボコにされ羽生の権威が低下するだろ
良い悪いはともかく羽生ファン的には嫌でしょそういうの プロは対局する機会があるなら逃げずに戦うべきだよ
特に振り飛車が得意な人がね
たぶんalphaゼロは居飛車しか知らないから振り飛車に対する勝率の高い手を選びにくいと思う プロはエルモに対する勝率は低いだろうが
alphaゼロに対する勝率は高いと思う >>821
あの時からソフトが強くなってると思うのは壮大な勘違いの可能性がある
前から言われてることだけど人間に対する勝率は変わってないんじゃないかってね
alphaゼロに対してエルモの勝率が10%しかなかったが
現代の最新ソフトでも10%ぐらいじゃないかって言われてる
つまりソフトは強くなっているようで実はまったく強くなってないということ
最悪2013年からまったく強くなってない可能性すらある 手取り早い実験としては
プロ棋士に2013年のソフトと2018年のソフトと対局してもらい勝率を計ること
たぶんどっちも変わらないんじゃないかってこと
屋根裏王の開発者もそんなようなこと言ってたし
alphaゼロの論文のせいでそう考えるやつが増えた 手っ取り早いのは人工知能に精通した棋界最高位羽生竜王が2013〜現在までの最強ソフトと戦う事 AlphaZeroのロジックは非常にシンプルらしいけど、それでいて
ボードゲーム最強になれたのは、DeepMindがすごいんじゃなくて、
TPUを開発したGoogleがすごいだけなんじゃないの?
初心者が将棋ソフトに持つイメージ”全部調べている”をある意味
やっただけでしょ。なんかアホらしくも感じる。
AlphaZeroにもし勝ちたければ100x100の超大盤将棋にすればいい。
そうすれば学習曲線がゆるやかになって最初は楽勝だろうw 初音ミクの誕生で音楽業界に衝撃を与え
社会現象になったように
アルファゼロの誕生で将棋界に刺激を与えて
社会現象になるのも時間の問題だな
マジレスすると 僕は羽生さんはもうAlphaZeroと対戦していると思うよ
羽生さんはDeepMindを訪れていてハサビスと面識もあるし。
ハサビスが羽生さんを招待しないはずもないし、羽生さんもプライベートなら断る理由もない
だから羽生さんのコメントが掲載されている >>812
こいつは例の単発の荒らしだろ
何度論破しても同じことを繰り返し書いている
相手にしないほうがいい プロ棋士が皆で相談して1手に3日かけても勝てなさそう >>827
千田のデータみると
・Apery_WCSC25よりも大樹の方が対千田勝率が高い(ほぼレート通り)
・千田は浮かむ瀬相手に角落ちでも怪しい
後今回の論文だけみても
・elmoとR170弱の差しかないAperypaqがAlphaZeroに対してelmoよりは善戦してる
これらの情報を元にすると、ソフトが強くなってない説は無理筋 バカで無知なゴミにスレ潰されたか
常識も知らない池沼丸出しのレスは無視すればいいのに aperyもドルフィンもelmoに勝率9割ぐらいだろ >>837
将棋棋士側だと電王戦Finalで佐藤名人が破れて人間を超えたということにしてるんだな
(ソフト専門家でこの立場の人はいない) ソフト専門家ってなに?
リーマンがやってるんじゃなかったの >>833
気に入らない書き込みがあったらとりあえず単発、単発と連呼してるのは何monなんだよw プロ厨半端ないって!
あいつら半端ないって!
ponanzaに名人が負けてから時間が経って、さらにソフトは強くなってるのに、今だにプロが勝つって言うもん!
そんなん出来ひんやん普通! 青野流は神
まとめブログ2ch名人のサイト名の由来は青野
つまり将棋板は神
よって、名無し名人の俺たち>AlphaZero >>845
プロ厨って言葉を使ってる時点で論外だわ
棋士を不当に見下したいって思考がバレバレ プロ厨カイリューヤドランピジョンコダックコラッタズバットギャロップサンダースメノクラゲ プロ厨半端ないって!
あいつら半端ないって!
ponanzaに名人が負けてから時間が経って、さらにソフトは強くなってるのに、今だにプロが勝つって言うもん!
そんなん出来ひんやん普通! >>848
羽生のコメントついた方が価値あがるだろ?
最新の最強ソフトに勝つよりよっぽど効果的 相掛かりは主流になりません!!!!
羽生善治竜王が矢倉でタイトル通算100期に王手だ!!!! プロ棋士に嫉妬してるのはいったい何monなんだよ?w >>838
伊勢界へのバーケードを突破して常識を打ち破れ ???mon「やはり天彦よりponanzaか」Xeon検討打ち切り >>857
そいつは酷いな
一体全体何monなんだい? >>837
elmoに人間が及ぶわけはない って、遠山さん正直だな
全体的に良記事だと思った 自分の棋風を入力して専門コーチになってもらう
たまにはわざと負けてもらう
先後交代もたまに指示してもらう
今後のAIの利用法はこうしたものだろう >>862
コーチだなんだと語って鵜呑みを推奨してるのはいったい何monなんだよ?w 棋譜を見るとやっぱり常識外れだな
ソフトはもう人間の棋譜を参考にする時代じゃないわけか 相掛かりは主流になりません!!!!
羽生善治竜王が矢倉でタイトル通算100期に王手だ!!!! AlphaZeroが間違っているのか
なんだかんだでelmoに負けているわけだし アマチュアプログラマーが趣味で作ったプログラムで
大会優勝してしまうような牧歌的な時代は終わってしまったのかな 古いソフトに9割って言われてもな
100%勝ってるわけじゃないし、部分的に古いソフトより劣っているということか ソフトにも穴はあるんだから、複数の評価関数を用いて検討しなさい。
R1位のソフトだけを鵜呑みにしないこと。 というかむしろAlphaZeroの方がelmoより劣ってる可能性はある 不成のほうが勝率が上がるからじゃない
取られたら同じだが、取らない手も有力で取らないと勝率が上がるなら不成りのほうがいいという選択だね
手数がかかっても勝率が上がるならいいという思考なんで馬鹿げた手も多いね 相掛かりは主流になりません!!!!
羽生善治竜王が矢倉でタイトル通算100期に王手だ!!!! 青野流は神
まとめブログ2ch名人のサイト名の由来は青野
つまり将棋板は神
よって、名無し名人の俺たち>AlphaZero >>871
made in China?
HUAWEI端末を推奨していたのはいったい何monなんだよ? >>874
金澤岳。
千葉ロッテマリーンズ 金澤岳 登場曲(引退試合)
https://youtu.be/U9-gco2FcSk @YouTubeより スレの流れをざっと見てみたが
なんだ、AlphaZeroって最新ソフトより弱いのか 2時間でこの強さなら時間かければ最強無敗のソフトにもなりそうだよな
グーグルが興味ないだろうけど https://1.bp.blogspot.com/-a3riPKt2c6g/Vz1-wT_uo5I/AAAAAAAA-7o/-2h_PEzflFIn4Jln2U-JewUmf7T5tEtKACLcB/s1600/hinotori2772a.gif
手塚治虫愛のコスモゾーン冒頭を見ると実感できるのだが、人工知能は人間の教育に力を発揮するべきだろう。
囲碁を知らない子供が二人
二つのAIが半年教育する
子供が対戦し
勝った子供の教師AIが勝者
デバイスが大事になる
羽生永世七冠もAIの教育面での使用を予想している ■ このスレッドは過去ログ倉庫に格納されています