AlphaZeroの将棋棋譜がついに公開!
■ このスレッドは過去ログ倉庫に格納されています
論文
A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play
http://science.sciencemag.org/content/362/6419/1140
棋譜(100棋譜)
https://deepmind.com/research/alphago/alphazero-resources/
羽生善治竜王のセレクション10棋譜付き! ニコ生の棋譜解説を見てると康光よりも大山の将棋に近い気がするな
玉の安全度に対する感覚が凄すぎるわ >>482
500円払ってプレミア会員になる
開始30分以上前なら予約しておけば一般会員でもみれたけどね 玉「王様が動かないと部下がついてこないだろう…?」 人間には理解不能な棋譜だと思ってたけど解説あると違うね
やっぱプロ棋士ってすげーわ アルファゼロは何を考えてこんな手をさすのか?ってのが解説きいてて気になったね タイムリーな企画だった
羽生の10局 予習しててよかった アロマには到底真似出来ない放送だった(´・ω・`) 千田の解説でこのスレでもっともらしく書かれてることが否定された >>442
なんていうか神業すぎて参考にならないわな
強いて言うなら歴代の棋士の長所(強化版)を全て詰め込んだような将棋 >>488
優勢になってからの終盤が酷いよなw
まあ、それでも勝つんだけど >>454
だからといって仮に当時ibmが本気で将棋ソフト作ったとしても羽生より強いの作るのは厳しくね? 半殺しにしておいたネズミをいたぶる猫のような終盤。 グーグル様に取り上げてもらえるだけありがたいじゃん
バックギャモンや中国将棋の競技人口は将棋よりも多いはずなのにグーグルは相手にしていない
囲碁チェス将棋だけだろ だれか全棋譜編集してくれんかな 終盤だらだら長すぎ 120手くらいにスパっと それも超高度ないたぶりなのがまたね
攻めあるじゃん!と思ったらそれはこれで(激ムズ手順)受かりますよって 竜王戦が終わったら羽生がなにかの番組でアルファゼロの棋譜解説をするんじゃねえか
後回しにした講演とかあるから順位戦で残留するくらいが精一杯だろうな 凄く強いのは分かるんだけど、一手違いのギリギリの攻防とか踏み込みとかが無いから終盤はあんまり面白くないね。
中盤の捻りあいは面白い >>501
受け将棋だからそう見えるだけで充分スレッスレの攻防だよ
勝勢なってからの終盤がクソなのは同意 人間にとっては悲報だがアルファゼロに勝てる人間は羽生か藤井が10局さして一勝できるかだろうなあ
並みのプロではどうにもならんよ ツッコミ待ちみたいなとこにわざわざいくのもしゃくだが
1000局やってもゼロだろ >>504
李世ドルがアルファ碁に1つ勝ったみたいに終盤抜けがあるから1000局やれば勝てると思うよ >>503
もうそんな次元じゃねぇよ
100局指しても全敗だろうよ サブツリーのアベレージで勝率だしてるから
2手目の候補手ですら終わりになるような
一本道の局面に誘導できるんだろうな
77角不成りも
相手が角取らなかったら必勝だから
相手が角取らない確率を0.01%でも上げるためだし こいつに嬲られてるelmoにだって人間全敗だろ
人間vsAIの興行が成立したのは
ほんの僅かな期間だけだった もう人間とAIが対局する時代は終わっただろ
これからはAIがどこまで将棋の真理に近づけるかの時代だ 開発者には失礼だけど、今までの同人レベルのソフトですら余裕で名人に勝ち越してたんだからGoogle子会社が本気出したらそりゃ強いわ。
しかもたった二時間の学習でw
藤井ですら10,000局で一発入りゃいいほうじゃね そんなことより千田TS見てるけどまじ12回講座でもいいな 人間側は待ったやり放題にして初めて1発入るかどうかの世界だろ
ソフトは間違えねーんだし読んでる手数が桁違いなんだから AIの将棋が将棋の真理になるとは思えんけど、人間の力になってくれることは間違いないから、本当ありがたい。
強くなるのにPC1台ですむのだから、プロはうかうかしてられない。 100棋譜全部をプロ棋士に解説してほしいわ
それやってくれるなら2000円くらいなら全然金出すね 俺はレベルの高い棋譜を見たいってだけだから
人間の参考になる云々はどうでもいいんだけど
(まあ人間の参考になるということは人間の棋譜のレベルも高くなるわけでありがたいんだけど)
そんなに人間の参考にしたいなら絶対飛車を振るようにプログラミングされた
準最強ソフトでもつくってもらったらどうだろうね?
初手76歩に後手が34歩と応じてきたら絶対角替わりするソフトとか 千手番を持ったとき
▲7六歩△3四歩▲2二角成△同銀▲4五角
これを定跡としてこの局面では必ず筋違い角を指すソフトとか
つくってくれたらおもしろいかもなぁ ゼロの棋風が相手をなぶるような意地悪流と知って急に親近感が湧いた >>515
まあ二面指しにすればどんなに強い相手にも指し分けにはできるという人間の知恵は偉大だと思う 棋理に反する戦法の棋譜が欲しいなら
自分で金出してソフトが生きる環境を整えて
自分で指定局面まで動かして稼働させてみればいい これ本当にelmo?
Dolphin先生に言わせれば悪手連発なんだが
誰かelmo持ってる人棋譜解析してみてよ >>526
elmoもってても論文の条件の44スレッド120億ノードのelmoなんて再現できる人はおらんやろ でもこれ論文?だったら検証はなんにせよしてみたいよなあ
同条件は無理でもエルモ用意してほんとにこうなるのかとか、他のソフトならどうなるのかとか 自分がAlphaZeroの棋譜再現しようと思ってんだったら
elmoは乱数つかってるから棋譜通りの局面に進むとは限らんでw
まあ何百回かやったら同じ棋譜を再現できるかもしれんがなww >>528
自己学習を続けて頭打ちになるまでの期間が
チェス9時間
将棋12時間
囲碁13日間だからな
それだけゲーム性が奥深すぎて人間は囲碁を理解できてなかったってことだろ >>532
逆に将棋は持ち駒が使える割に、チェスと大して差は無かったということ。
理由は、持ち駒が使えるゆえに詰みやすい、引き分けにならないからだと思われる。 でもこれだけソフトが強くなっても完全解析にはまだほど遠いんだろうな
完全解析を山の山頂だとするとAlphaZeroは2合目か3合目あたりだろうか これみたら将棋でもleelaプロジェクトを始める奴出てくるんじゃね?
leela chess zeroのコードがもうあるんだから、本質的には、あとは将棋のルールに変更するだけっしょ
最大の問題は将棋民がどれだけ協力するかだがw プロが採用しないような奇襲戦法を検討させてみたい
凄い発見があるかもしれん >>535
山にも登ってないよ。アプローチが全く違う。 なにこれ?
AlphaZeroっていうユーザー名はどこの国の人?
棋譜見たけどソフト使ってそうな怪しい指し方 >>539
いや虱潰しに探索しまくるのと自己対戦による学習でアプローチが全く違うのは分かってるつもりなんだが
仮に完全解析したときの強さを100としたら今は20〜30くらいなのかなって >>480
例えは分かりやすくないとな。お前の言うガイジってなんだ? 枝刈り評価値上位3つぐらいで探索したとして50手先の最強の手を予想する
場合は以下の局面数を評価しないといけないことになる。
3^50 = 717,897,987,691,853,000,000,000.0000
= 717,897,987,691,853 x 1兆局面だぞ!
これはどんな最強マシンでも不可能に思える。
だから単純な評価値のminmax法だけではすぐに完全な読みには限界がくる。
具体的には20手ぐらいの評価値探索で打ち切る方法でどれぐらい節約できか
にかかっているかと思う。
そこまでの数学力がないので調べることがないが現時点での
探索みると深さ37開始時に18,339,449,975(約183億)
探索みると深さ38開始時に27,868,971,435(約270億)
掛かってる。
枝刈りによる局面数増加を抑える仕組みがあるとしてこのまま100億ノードで
深さが1づつ増えるのなら希望も持てるが果たしてどうなのだろうか? >>543
つまり長手数を読める人間は一時的にソフトを上回る手を指してもおかしくない? 昨日の千田の解説みてると学習途中の棋譜見たそうだったな
角道開けなくなるってのは確かに謎だわ 月刊チダンザみたいな番組作って定期的にやって欲しい 100局のNNUEKai7+将棋所の連続棋譜解析が終了。ふう AlphaZeroが強いのはわかるがelmoのほうはプロ棋士より弱いね
一致率の平均が60%とか、平均悪手が60とか
何か設定を間違えたんではないかな
棋譜解析してみた感想です >>548
ソフト同士の対局で負けた方の一致率ってもっと高いものなの? 1日でelmo越えるなら
それなりの時間学習したら
将棋ソフトで勝てるのいなくなりそう >>556
もちろん成長は限界あるだろうけど
elmoとドルフィンや狸の差ぐらいなら
1ヶ月もあれば越えないかな >>559
後手で頑張れるのが角換わりぐらいで、先手はわざわざ角換わりにする必要がないと判断してるから先手で角道は開けない。 >>559
角換りは 後手に完全防御されたら 先攻できない
⇒ 先手のメリットを生かせない戦法
人間のプロ将棋も、もうじき角換り離れが始まると思う 全員同じ序盤戦術とるようになったら将棋中継は最初の1時間いらんな >>561
ん?先手76歩、後手84歩は僅かに残ってるけど、後手34歩は学習後ほぼ付かない
先手76歩も学習進めるほどつかないて話じゃなかったか?
だから後手で角換わりなんて戦型指さないのでは? 既に、オセロは、wzebraに勝てる物は無いでしょ。 オセロR907でAlphaZeroについて語ってるのは何monだよw 先手から角換わりしない相掛かりや雁木はソフト同士でも後手不満なしと思ったが 横歩を取られるのが嫌なんだな。
やはり俺の感覚は正しかったんだ!上級者は横歩とられるのが通っぽい感じだけど俺は横歩を取られるとすげえ腹立つw 千田じゃなくて40代以上でAやB1にいる棋士の見解聞いてみたい
その年代で上に残ってる人って柔軟な発想持ってそう 将棋で一番難解な戦型と言われてる相がかりが結論か
角換わりから相がかりに人間も移行するんだろうな チェスだとポーン得できても同じ駒を序盤に何回も動かすのは良くない言われてるけど将棋は持駒を使える分、手得より駒得のほうがアド高いのかな? あいがかりってなかなか定石化しないしやっぱり奥が深いんだろうな。
かくがわりとか横歩ってすぐハメられちゃうし 「筋がいい」というのは誉め言葉でなく、
「弱い」の言い換えになっちゃう。 千田が紹介してたオルカの最新版
横歩の先手勝率の高さ。
角換わりは局数は多いけど先手勝率は0.167しかない。
コンピュータ将棋的に横歩は先手有利、角換わりは後手有利。
アルファは相掛かりを好み、角道は絶対開けないマンになるて事かな。
https://twitter.com/Rota_JP/status/1071568731191468033?s=09
https://twitter.com/5chan_nel (5ch newer account) みんな妄想ばかり書き込んでるからこのスレめちゃくちゃでワロタ かくがわりが後手遥かに有利ってのが興味深い。
後手が完璧に組めば先手の攻めが成立しないってことかな。
そうなると手詰まりになるから千日手が最善。 >>577
定跡オフの角換わりはあてにならないよ。
それから、角換わり腰掛け銀26歩型、角換わり腰掛け銀25歩型、角換わり早繰り銀、その他で分類するべきだよ。
角換わりで全てひとまとめにするのは暴論だね。 ■ このスレッドは過去ログ倉庫に格納されています