AlphaZeroの将棋棋譜がついに公開!
■ このスレッドは過去ログ倉庫に格納されています
論文
A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play
http://science.sciencemag.org/content/362/6419/1140
棋譜(100棋譜)
https://deepmind.com/research/alphago/alphazero-resources/
羽生善治竜王のセレクション10棋譜付き! >>440
将棋は持ち駒があるからチェスよりずっと複雑で機械は人間に勝てない
将棋のプロが数十年間言ってたことだけど、弟は頭が悪いから東大に行ったの類の彼らのポジショントークだから間に受けるのは間違い
将棋ソフトがプロになかなか勝てなかったのはIBMやGoogleのような超天才集団が本気出してこなかっただけ
彼らがガラパゴス競技に金出す意味もないし、今回のalphazeroも汎用ボードゲームAIを開発したついでに将棋ソフトもボコボコにしたってだけの話
トーナメントに出てこいって息巻いてる奴多いけど彼らからしたらほんのついでに将棋ソフトをボコボコにしただけなので出てくる意味が何もない >>450
ponanza chainerのメンバーとかPFNとさくらの面々が加わってまごうことなき天才集団だったがelmoに負けたし、囲碁のFacebookも既存ソフトに勝てなかったからなあ
DeepMindが規格外すぎるだけで、チェスとの比較は違うように思える >>449
AlphaZeroはソース公開されてないでしょ
FacebookがAlphaZeroのアルゴリズムを使ったElfのソースを公開してるのと、LeelaZero、Leela Chess ZeroというAlphaZeroベースのオープンソースソフトがあるだけで
将棋だとたぶん来年CrazyShogiというAlphaZeroチルドレンがアンバランスから商用化されると思うからそれまで待つしかない >>451
PFNが天才つったってね
半年一年そこらしかやってないじゃん
IBMのDeepBlueだって5年以上かけたプロジェクトだし、莫大な予算かけて専用ハードウェアから設計してるぞ
将棋はガラパゴスだからそういう大企業の本気が来なかったって話なんだが、何が納得いかないんだ いや、結局78金してるか。
横歩後手番と振り飛車はやっぱダメなのかね。 >>89
振り飛車が死んだといわれた時代のponanzaよりも近代の振り飛車党のソフトの方が強いから、今後なにが起こってもおかしくはないけどね 横歩と振り飛車は終わってる可能性が極めて高い
横歩は後手番がダメってことは戦法自体が不成立 >>102
発表当初対局条件に問題があって、将棋、チェス共に開発者や強豪プレイヤーからかなりの数の指摘があった
今回公開されたのはそれらを是正して対局し直したもの AlpaZeroが商用化される時には
それより強いソフトが市場を埋め尽くして
AlpaZeroが入り込む余地なんて全く無いねw >>286
AlphaZeroが対局したのは2017年版のelmoと2017年版のAperypaqで2018年のソフトとは戦ってないぞ >>4
玉が盤の中央に向かうような順は、人間の目からすれば棋理に反しており、
AlphaZeroは自ら危険に飛び込んでいるように思ってしまう。
ところが驚くべきことに、それでもAlphaZeroは盤上での主導権を握っていて、
その独特な指し方は、将棋に新しい可能性があることを我々に教えてくれる。 >>462
八葉吉春、プロの9人、史上最多の7つの将棋タイトルを持つ唯一の選手
が抜けてる >>462
人間に指しこなすのは難しそうだな。
ちょっと間違えたら急転直下とか。 レベルが違いすぎるが、KINGPonanzaを思い出すなあ >>465
大樹に対して同時期のponanzaが勝率97%とかだったからなあ
全盛期の傑出率でいったらAlphaZero以上かも
傑出率だけでいえば選手権四連覇の金沢将棋とかもヤバいけど 人間の相掛かり先手勝率が悪いのは、人間は序盤が非常にヘタクソってことなのか。 傑出率でなくて棋風の話
ウォーズにkingPonaっていう王様をガンガン前線に出すように設定されたPonanzaがいる
昔は顔真っ赤にして対局したもんだ 汎用ソフトに対して専用ソフト開発者が消費電力では負けてないって
自虐で言ってるのかと思ったら結構まじで言ってるんだなw
そのうち、ソースコードサイズの小ささでは負けてないとか言い出しそう
もう既に主張してるんだったらすまんこ これか
http://live2.nicovideo.jp/watch/lv316751884
> さらに今回は通常コーナー終了後、20時すぎから
> 先日DeepMind社が公開した人工知能「AlphaZero」の棋譜を
> 千田翔太六段に解説していただく二部構成です。 12番目の棋譜が腰掛け玉でワロタ
しかも勝ってるし >>475
千田が今ニコ生で解説してるから
コメで聞いて来い >>443
よく分からないからとりあえずドラえもんに例えるガイジw ニコ生の棋譜解説を見てると康光よりも大山の将棋に近い気がするな
玉の安全度に対する感覚が凄すぎるわ >>482
500円払ってプレミア会員になる
開始30分以上前なら予約しておけば一般会員でもみれたけどね 玉「王様が動かないと部下がついてこないだろう…?」 人間には理解不能な棋譜だと思ってたけど解説あると違うね
やっぱプロ棋士ってすげーわ アルファゼロは何を考えてこんな手をさすのか?ってのが解説きいてて気になったね タイムリーな企画だった
羽生の10局 予習しててよかった アロマには到底真似出来ない放送だった(´・ω・`) 千田の解説でこのスレでもっともらしく書かれてることが否定された >>442
なんていうか神業すぎて参考にならないわな
強いて言うなら歴代の棋士の長所(強化版)を全て詰め込んだような将棋 >>488
優勢になってからの終盤が酷いよなw
まあ、それでも勝つんだけど >>454
だからといって仮に当時ibmが本気で将棋ソフト作ったとしても羽生より強いの作るのは厳しくね? 半殺しにしておいたネズミをいたぶる猫のような終盤。 グーグル様に取り上げてもらえるだけありがたいじゃん
バックギャモンや中国将棋の競技人口は将棋よりも多いはずなのにグーグルは相手にしていない
囲碁チェス将棋だけだろ だれか全棋譜編集してくれんかな 終盤だらだら長すぎ 120手くらいにスパっと それも超高度ないたぶりなのがまたね
攻めあるじゃん!と思ったらそれはこれで(激ムズ手順)受かりますよって 竜王戦が終わったら羽生がなにかの番組でアルファゼロの棋譜解説をするんじゃねえか
後回しにした講演とかあるから順位戦で残留するくらいが精一杯だろうな 凄く強いのは分かるんだけど、一手違いのギリギリの攻防とか踏み込みとかが無いから終盤はあんまり面白くないね。
中盤の捻りあいは面白い >>501
受け将棋だからそう見えるだけで充分スレッスレの攻防だよ
勝勢なってからの終盤がクソなのは同意 人間にとっては悲報だがアルファゼロに勝てる人間は羽生か藤井が10局さして一勝できるかだろうなあ
並みのプロではどうにもならんよ ツッコミ待ちみたいなとこにわざわざいくのもしゃくだが
1000局やってもゼロだろ >>504
李世ドルがアルファ碁に1つ勝ったみたいに終盤抜けがあるから1000局やれば勝てると思うよ >>503
もうそんな次元じゃねぇよ
100局指しても全敗だろうよ サブツリーのアベレージで勝率だしてるから
2手目の候補手ですら終わりになるような
一本道の局面に誘導できるんだろうな
77角不成りも
相手が角取らなかったら必勝だから
相手が角取らない確率を0.01%でも上げるためだし こいつに嬲られてるelmoにだって人間全敗だろ
人間vsAIの興行が成立したのは
ほんの僅かな期間だけだった もう人間とAIが対局する時代は終わっただろ
これからはAIがどこまで将棋の真理に近づけるかの時代だ 開発者には失礼だけど、今までの同人レベルのソフトですら余裕で名人に勝ち越してたんだからGoogle子会社が本気出したらそりゃ強いわ。
しかもたった二時間の学習でw
藤井ですら10,000局で一発入りゃいいほうじゃね そんなことより千田TS見てるけどまじ12回講座でもいいな 人間側は待ったやり放題にして初めて1発入るかどうかの世界だろ
ソフトは間違えねーんだし読んでる手数が桁違いなんだから AIの将棋が将棋の真理になるとは思えんけど、人間の力になってくれることは間違いないから、本当ありがたい。
強くなるのにPC1台ですむのだから、プロはうかうかしてられない。 100棋譜全部をプロ棋士に解説してほしいわ
それやってくれるなら2000円くらいなら全然金出すね 俺はレベルの高い棋譜を見たいってだけだから
人間の参考になる云々はどうでもいいんだけど
(まあ人間の参考になるということは人間の棋譜のレベルも高くなるわけでありがたいんだけど)
そんなに人間の参考にしたいなら絶対飛車を振るようにプログラミングされた
準最強ソフトでもつくってもらったらどうだろうね?
初手76歩に後手が34歩と応じてきたら絶対角替わりするソフトとか 千手番を持ったとき
▲7六歩△3四歩▲2二角成△同銀▲4五角
これを定跡としてこの局面では必ず筋違い角を指すソフトとか
つくってくれたらおもしろいかもなぁ ゼロの棋風が相手をなぶるような意地悪流と知って急に親近感が湧いた >>515
まあ二面指しにすればどんなに強い相手にも指し分けにはできるという人間の知恵は偉大だと思う 棋理に反する戦法の棋譜が欲しいなら
自分で金出してソフトが生きる環境を整えて
自分で指定局面まで動かして稼働させてみればいい これ本当にelmo?
Dolphin先生に言わせれば悪手連発なんだが
誰かelmo持ってる人棋譜解析してみてよ >>526
elmoもってても論文の条件の44スレッド120億ノードのelmoなんて再現できる人はおらんやろ でもこれ論文?だったら検証はなんにせよしてみたいよなあ
同条件は無理でもエルモ用意してほんとにこうなるのかとか、他のソフトならどうなるのかとか 自分がAlphaZeroの棋譜再現しようと思ってんだったら
elmoは乱数つかってるから棋譜通りの局面に進むとは限らんでw
まあ何百回かやったら同じ棋譜を再現できるかもしれんがなww >>528
自己学習を続けて頭打ちになるまでの期間が
チェス9時間
将棋12時間
囲碁13日間だからな
それだけゲーム性が奥深すぎて人間は囲碁を理解できてなかったってことだろ >>532
逆に将棋は持ち駒が使える割に、チェスと大して差は無かったということ。
理由は、持ち駒が使えるゆえに詰みやすい、引き分けにならないからだと思われる。 でもこれだけソフトが強くなっても完全解析にはまだほど遠いんだろうな
完全解析を山の山頂だとするとAlphaZeroは2合目か3合目あたりだろうか これみたら将棋でもleelaプロジェクトを始める奴出てくるんじゃね?
leela chess zeroのコードがもうあるんだから、本質的には、あとは将棋のルールに変更するだけっしょ
最大の問題は将棋民がどれだけ協力するかだがw プロが採用しないような奇襲戦法を検討させてみたい
凄い発見があるかもしれん >>535
山にも登ってないよ。アプローチが全く違う。 なにこれ?
AlphaZeroっていうユーザー名はどこの国の人?
棋譜見たけどソフト使ってそうな怪しい指し方 >>539
いや虱潰しに探索しまくるのと自己対戦による学習でアプローチが全く違うのは分かってるつもりなんだが
仮に完全解析したときの強さを100としたら今は20〜30くらいなのかなって >>480
例えは分かりやすくないとな。お前の言うガイジってなんだ? 枝刈り評価値上位3つぐらいで探索したとして50手先の最強の手を予想する
場合は以下の局面数を評価しないといけないことになる。
3^50 = 717,897,987,691,853,000,000,000.0000
= 717,897,987,691,853 x 1兆局面だぞ!
これはどんな最強マシンでも不可能に思える。
だから単純な評価値のminmax法だけではすぐに完全な読みには限界がくる。
具体的には20手ぐらいの評価値探索で打ち切る方法でどれぐらい節約できか
にかかっているかと思う。
そこまでの数学力がないので調べることがないが現時点での
探索みると深さ37開始時に18,339,449,975(約183億)
探索みると深さ38開始時に27,868,971,435(約270億)
掛かってる。
枝刈りによる局面数増加を抑える仕組みがあるとしてこのまま100億ノードで
深さが1づつ増えるのなら希望も持てるが果たしてどうなのだろうか? >>543
つまり長手数を読める人間は一時的にソフトを上回る手を指してもおかしくない? 昨日の千田の解説みてると学習途中の棋譜見たそうだったな
角道開けなくなるってのは確かに謎だわ 月刊チダンザみたいな番組作って定期的にやって欲しい 100局のNNUEKai7+将棋所の連続棋譜解析が終了。ふう AlphaZeroが強いのはわかるがelmoのほうはプロ棋士より弱いね
一致率の平均が60%とか、平均悪手が60とか
何か設定を間違えたんではないかな
棋譜解析してみた感想です ■ このスレッドは過去ログ倉庫に格納されています