AlphaZeroの将棋棋譜がついに公開!
■ このスレッドは過去ログ倉庫に格納されています
論文
A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play
http://science.sciencemag.org/content/362/6419/1140
棋譜(100棋譜)
https://deepmind.com/research/alphago/alphazero-resources/
羽生善治竜王のセレクション10棋譜付き! AIの将棋が将棋の真理になるとは思えんけど、人間の力になってくれることは間違いないから、本当ありがたい。
強くなるのにPC1台ですむのだから、プロはうかうかしてられない。 100棋譜全部をプロ棋士に解説してほしいわ
それやってくれるなら2000円くらいなら全然金出すね 俺はレベルの高い棋譜を見たいってだけだから
人間の参考になる云々はどうでもいいんだけど
(まあ人間の参考になるということは人間の棋譜のレベルも高くなるわけでありがたいんだけど)
そんなに人間の参考にしたいなら絶対飛車を振るようにプログラミングされた
準最強ソフトでもつくってもらったらどうだろうね?
初手76歩に後手が34歩と応じてきたら絶対角替わりするソフトとか 千手番を持ったとき
▲7六歩△3四歩▲2二角成△同銀▲4五角
これを定跡としてこの局面では必ず筋違い角を指すソフトとか
つくってくれたらおもしろいかもなぁ ゼロの棋風が相手をなぶるような意地悪流と知って急に親近感が湧いた >>515
まあ二面指しにすればどんなに強い相手にも指し分けにはできるという人間の知恵は偉大だと思う 棋理に反する戦法の棋譜が欲しいなら
自分で金出してソフトが生きる環境を整えて
自分で指定局面まで動かして稼働させてみればいい これ本当にelmo?
Dolphin先生に言わせれば悪手連発なんだが
誰かelmo持ってる人棋譜解析してみてよ >>526
elmoもってても論文の条件の44スレッド120億ノードのelmoなんて再現できる人はおらんやろ でもこれ論文?だったら検証はなんにせよしてみたいよなあ
同条件は無理でもエルモ用意してほんとにこうなるのかとか、他のソフトならどうなるのかとか 自分がAlphaZeroの棋譜再現しようと思ってんだったら
elmoは乱数つかってるから棋譜通りの局面に進むとは限らんでw
まあ何百回かやったら同じ棋譜を再現できるかもしれんがなww >>528
自己学習を続けて頭打ちになるまでの期間が
チェス9時間
将棋12時間
囲碁13日間だからな
それだけゲーム性が奥深すぎて人間は囲碁を理解できてなかったってことだろ >>532
逆に将棋は持ち駒が使える割に、チェスと大して差は無かったということ。
理由は、持ち駒が使えるゆえに詰みやすい、引き分けにならないからだと思われる。 でもこれだけソフトが強くなっても完全解析にはまだほど遠いんだろうな
完全解析を山の山頂だとするとAlphaZeroは2合目か3合目あたりだろうか これみたら将棋でもleelaプロジェクトを始める奴出てくるんじゃね?
leela chess zeroのコードがもうあるんだから、本質的には、あとは将棋のルールに変更するだけっしょ
最大の問題は将棋民がどれだけ協力するかだがw プロが採用しないような奇襲戦法を検討させてみたい
凄い発見があるかもしれん >>535
山にも登ってないよ。アプローチが全く違う。 なにこれ?
AlphaZeroっていうユーザー名はどこの国の人?
棋譜見たけどソフト使ってそうな怪しい指し方 >>539
いや虱潰しに探索しまくるのと自己対戦による学習でアプローチが全く違うのは分かってるつもりなんだが
仮に完全解析したときの強さを100としたら今は20〜30くらいなのかなって >>480
例えは分かりやすくないとな。お前の言うガイジってなんだ? 枝刈り評価値上位3つぐらいで探索したとして50手先の最強の手を予想する
場合は以下の局面数を評価しないといけないことになる。
3^50 = 717,897,987,691,853,000,000,000.0000
= 717,897,987,691,853 x 1兆局面だぞ!
これはどんな最強マシンでも不可能に思える。
だから単純な評価値のminmax法だけではすぐに完全な読みには限界がくる。
具体的には20手ぐらいの評価値探索で打ち切る方法でどれぐらい節約できか
にかかっているかと思う。
そこまでの数学力がないので調べることがないが現時点での
探索みると深さ37開始時に18,339,449,975(約183億)
探索みると深さ38開始時に27,868,971,435(約270億)
掛かってる。
枝刈りによる局面数増加を抑える仕組みがあるとしてこのまま100億ノードで
深さが1づつ増えるのなら希望も持てるが果たしてどうなのだろうか? >>543
つまり長手数を読める人間は一時的にソフトを上回る手を指してもおかしくない? 昨日の千田の解説みてると学習途中の棋譜見たそうだったな
角道開けなくなるってのは確かに謎だわ 月刊チダンザみたいな番組作って定期的にやって欲しい 100局のNNUEKai7+将棋所の連続棋譜解析が終了。ふう AlphaZeroが強いのはわかるがelmoのほうはプロ棋士より弱いね
一致率の平均が60%とか、平均悪手が60とか
何か設定を間違えたんではないかな
棋譜解析してみた感想です >>548
ソフト同士の対局で負けた方の一致率ってもっと高いものなの? 1日でelmo越えるなら
それなりの時間学習したら
将棋ソフトで勝てるのいなくなりそう >>556
もちろん成長は限界あるだろうけど
elmoとドルフィンや狸の差ぐらいなら
1ヶ月もあれば越えないかな >>559
後手で頑張れるのが角換わりぐらいで、先手はわざわざ角換わりにする必要がないと判断してるから先手で角道は開けない。 >>559
角換りは 後手に完全防御されたら 先攻できない
⇒ 先手のメリットを生かせない戦法
人間のプロ将棋も、もうじき角換り離れが始まると思う 全員同じ序盤戦術とるようになったら将棋中継は最初の1時間いらんな >>561
ん?先手76歩、後手84歩は僅かに残ってるけど、後手34歩は学習後ほぼ付かない
先手76歩も学習進めるほどつかないて話じゃなかったか?
だから後手で角換わりなんて戦型指さないのでは? 既に、オセロは、wzebraに勝てる物は無いでしょ。 オセロR907でAlphaZeroについて語ってるのは何monだよw 先手から角換わりしない相掛かりや雁木はソフト同士でも後手不満なしと思ったが 横歩を取られるのが嫌なんだな。
やはり俺の感覚は正しかったんだ!上級者は横歩とられるのが通っぽい感じだけど俺は横歩を取られるとすげえ腹立つw 千田じゃなくて40代以上でAやB1にいる棋士の見解聞いてみたい
その年代で上に残ってる人って柔軟な発想持ってそう 将棋で一番難解な戦型と言われてる相がかりが結論か
角換わりから相がかりに人間も移行するんだろうな チェスだとポーン得できても同じ駒を序盤に何回も動かすのは良くない言われてるけど将棋は持駒を使える分、手得より駒得のほうがアド高いのかな? あいがかりってなかなか定石化しないしやっぱり奥が深いんだろうな。
かくがわりとか横歩ってすぐハメられちゃうし 「筋がいい」というのは誉め言葉でなく、
「弱い」の言い換えになっちゃう。 千田が紹介してたオルカの最新版
横歩の先手勝率の高さ。
角換わりは局数は多いけど先手勝率は0.167しかない。
コンピュータ将棋的に横歩は先手有利、角換わりは後手有利。
アルファは相掛かりを好み、角道は絶対開けないマンになるて事かな。
https://twitter.com/Rota_JP/status/1071568731191468033?s=09
https://twitter.com/5chan_nel (5ch newer account) みんな妄想ばかり書き込んでるからこのスレめちゃくちゃでワロタ かくがわりが後手遥かに有利ってのが興味深い。
後手が完璧に組めば先手の攻めが成立しないってことかな。
そうなると手詰まりになるから千日手が最善。 >>577
定跡オフの角換わりはあてにならないよ。
それから、角換わり腰掛け銀26歩型、角換わり腰掛け銀25歩型、角換わり早繰り銀、その他で分類するべきだよ。
角換わりで全てひとまとめにするのは暴論だね。 >>577
プロでも25歩突いての角換わりは後手の方が勝率高いよね
25歩が邪魔になって手待ち作戦に対して明快な攻めがない
26歩型は先手有利だが今度は角道閉じて雁木にされるとこれも後手がややいい
相掛かりは自由度が高すぎて先後関係なく棋力差が一番反映されやすい感じかな 「Pythonで書かれたAlphaZeroを動かして三目並べを学習させてみる」とか
「三目並べをAlphaZeroで学習させる」とかのページがあるんで
誰が一番初めにAlphaZero将棋を動かしてみるかだね。
やっぱりポナンザの人が一番最初かな >>581
本当に雁木がいいのか?w
雁木が悪いだろw ▲2六歩、▲2五歩の後は、▲9六歩らしいよ、AlphaZero的には >>583
既にコンピュータ囲碁で有名(将棋でいうBonanza保木さんクラス)なフランスのRemiさんが動かしてて、来年の選手権への参戦を表明してる(今年の選手権にも参戦したものの、学習時間不足により敗退) 相掛かりは、やっぱり人間のレベルでは先手の優位を維持するのが難しそう。
プロの先手後手の勝率の差が縮まるんじゃないか。 このYouTubeチャンネルで解説されるのを待っているのだけれど、いつになったら投稿するかどうか
suimonの将棋チャンネル
https://www.youtube.com/user/BGVN1127 >>578
妄想の話が捗るのは仕方ないだろ
裏を返せばゼロの棋譜が期待はずれって事 >>544
一応補足しとくと、ソフトも一本道で深く読むこともやってる
もちろん人間より精度は落ちると思うけど >>589
先手雁木は不利だし
25歩まで突かれると後手も雁木できないからね
雁木は角換わり拒否の2の矢でしかない グーグルのマシンじゃなく、現在世界一の米国のスパーコンピュータサミットで動くアルファーゼロ作れば良いのに作らないのは、単にお金の問題なのか?
そのクラスのコンピュータ選手権開催すれば良いのに zeroが期待外れって言ってる人は、どんなものを期待していたのかね。
斬新な序盤戦術? 玉で攻めるとか、序盤で大駒を捨てるとか? AlphaZeroの終盤が変なのは、AlphaZeroがバグっているからか、まだ伸びしろが残っているかだと思う
たぶんバグってはいる 定跡無しで自己学習だからね。
序盤に関しては一体何じゃこりゃっていうアルファ碁並の衝撃は期待してた人は多かったんじゃないかな。 今の将棋ソフトの流れとは違うものがないか期待したんだろうが
近い結論になったのが気に入らないんだろう
ただ人間的には薄い玉で殴り合うのは限界があるだろうが >>597
バグってないよ
終盤緩むのはMCTSアルゴリズムの特徴で、囲碁でも同様の現象が確認されてる >>584
anti_何ちゃらって人が角換わりは打開できる打開できるってツイートしてたから、角換わりが打開できないなら、結果的にAlphaZeroがanti_何ちゃらさんを潰したことになるね。 将棋の浅さが囲碁と比較して露呈したのが気に入らないんだろう >>601
suimonとアンチの戦いはコンピュータ代理戦争と言えよう 悪手を一手も指さないいわば「将棋の神」とアルファゼロとの棋力の差はどのくらいあるんだろうね。 https://imgur.com/a/ElCuC1u
AlphaZeroがelmo(2017年5月版)に負けた将棋
AlphaZeroの駒組みが無策すぎてワロタ
AlphaZeroの序盤は参考にならないな まあ将棋を深くしようと思えば、マスと駒の種類を増やせばいいわけで、
別に浅くても気にする必要はないだろ。 長年セルフじょうせきになってた5手目9六歩がこれから流行りそうで嫌や >>602
将棋より囲碁の方が単純に手のパターンが上だからね
ただ将棋の恐ろしさは一手のミスで簡単に逆転が起きるところ
人間がやるところに魅力がある >>600
なるほどね!
でも、平岡さんはツイッターでAlphaZeroの入玉判定にバグがあることを指摘している バグってるというか汎用学習ルーチンだから入玉宣言法なんて知らないんじゃないのか? >>609
終盤の話してたはずなのに入玉の話だったのか? >>605
これって仕掛け決まってんの?
22銀24歩同歩同飛44歩でわからん。
まさか22飛車なりから31角で決まってんの AlphaZeroは、最初の頃、初手▲7六歩で角道を開けてたが
何度もやっているうちに開けなくなったという報告があるな
千日手になりやすい角換わりを避けるために
相掛かりを志向し始めたのか知らんが
それで相掛かりを拒否されて角換わりになって負けてる棋譜がある
もう1周くらいしたら角換わりを拒否できる先手矢倉を志向し始めるんだろうか >>613
31角なら32金53角成同金同桂成52歩かな?さすがに切れてんじゃね? ■ このスレッドは過去ログ倉庫に格納されています