AlphaZeroの将棋棋譜がついに公開!
■ このスレッドは過去ログ倉庫に格納されています
論文
A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play
http://science.sciencemag.org/content/362/6419/1140
棋譜(100棋譜)
https://deepmind.com/research/alphago/alphazero-resources/
羽生善治竜王のセレクション10棋譜付き! 24番はひどい
勝勢になってから100手ほどだらだらと 評価値が3000から1800を行ったり来たり
入玉絡みでも中段玉でもない。寄せを決めにいかないしいけない。しかも自陣全く怖くないのに自陣に金打
これ 学習中の将棋かもしれないな この将棋に限り弱い 勝ったけど 12時間以上学習させたらどうなるんだろ、1週間やらせたらまた全然違う物になるのか頭打ちなのか 囲碁は謙虚に受け入れて研究しようとしてたのに
本当に将棋やってる奴らは文句ばかり言うなw こんなわけわからん棋譜打つソフトに、トッププロでも誰一人勝てないのか 囲碁は単純に定跡が進歩してないから
真新しい打ち筋があるのだろう
将棋の定跡の進歩は囲碁とは比べ物にならないくらい
目覚ましいからな >>9
ずるくない
まさか世の中全てが平等だとでも? 棋譜みたけど異次元すぎて理解不能だった
プロの先生は飛車落ちくらいなら勝てるのかな? >>150
モンテカルロ法の影響の可能性も
最終的に勝てばいいってことだけを学習して、最短で勝つってことを学習させてない
囲碁でも勝勢のときは緩めて負けない程度の悪手を打ちまくるって話があった ルール以外は何も教えないっていうのがAlphazeroの売りだから
あらゆるランダムな手を全部ためして学習しているから大駒の不成とか歩の不成でも
勝敗に影響しない手はちらほら残っている >>154
囲碁の低レベルさとゲームとしての浅さが暴露され、将棋の深さと棋士の質の高さが証明されたね。 個人ではとても注ぎ込めないようなGoogleの莫大な計算資源をぶっ込んだ結果なんだから「実計算時間」である「2時間」という数字には大した意味は無いぞ。 >>146
マス大山 剣道三倍段
ヤス大山 電力三倍段 >>163
AlphaZeroは序盤が強くて、30手では既に決着がついているんだと思うわ
AlphaGoの例から鑑みて 危険な筋を全部読み切るなんて人間にはできそうにない >>168
第6局で「やってみたかった病」が出るのか 日本の最新ソフトより弱いってコンピュータ将棋スレで言ってた
NNUEkai7の方が強い そうか
成っても先に影響与えない場合は不成選ぶ場合があるのか たぶんもうそういう次元じゃないんだと思うよ
そいつの棋力も数時間で越されると思う AlphaZeroはNNUEkai7より弱いという事実
無料公開されているフリーソフトより弱いソフトの棋譜なんてありがたみがねーな >>169
楽しみなような
竜王戦はやめてと言いたいような AlphaZeroはヘンテコな勝ち方の棋譜ばかりで参考にならないな
横歩取り青野流
角換わり腰掛け銀
相掛かり
が中心で序盤にも特に目新しさがない
はっきり言ってガッカリしたわ >>175
そんなに強いならWCSCに出ればいいじゃん
IDコロコロ荒らしさん 実用AIのリリースに合わせて論文が公開になったんだから
学習で短時間にここまで成長しますというのが主旨じゃないのか AlphaZero「電力3倍だ!!!!」
2017年5月版elmo「うわああああああああああ」
NNUEkaiF「ワイが最強の振り飛車党ソフトや」
orqha「ワイの方が強いで」
NNUEkai7「最新最強のワイ」 羽生一人だけアルファゼロの棋譜見てたとか
広義のカンニングじゃん >>120
>>178
世間をガッカリさせたAlphaZero
ハッタリソフト >>120
>>178
>>180
なんか、みんなAlphaZeroの棋譜にガッカリしたみたいだね。
つまらないな。 >>58
山本なんてメッキが剥げて、とっくにオワコンw 2017年のelmoって最新ソフトや最新ソフトより弱いAlphaZeroにフルボッコにされてるんだな
2017年の世界コンピュータ将棋選手権でelmoに連敗したponanzaって弱いんだな
ponanzaの棋譜をいまだにツイートしているsuimonやこいなぎは参考にならないな つかエルモの45桂は無理筋の攻めで
激指14ですら指さない悪手を指してる
アルファゼロと対局させたのは
エルモに擬装した名も知れない弱小ソフトか何かだろ 45桂ポンで攻め潰されてる棋譜もあるから成立するかしないかは紙一重 >測定誤差の範囲かもしれませんが、KPPT同士の対局で強くなってもAlphaZeroに対する勝率があまり上がらないことが示唆されています。
河童氏がこう言っているからelmoに9割勝ったからといってAlphaZeroに並んだとは言えないだろう >>194
KPPT同士がどうした?
時代はNNUEや お得意の捏造がまた始まったのかw
ウォーズのponanzaは定跡積んでるとかむちゃくちゃな嘘を前にも言ってたよなw AlphaZero「電力3倍だ!!!!」
2017年5月版elmo「うわああああああああああ」
NNUEkaiF「ワイが最強の振り飛車党ソフトや」
orqha「ワイの方が強いで」
NNUEkai7「最新最強のワイ」 アルファゼロは一応やねうらの人に賞賛されているからプログラム的な何かが凄いのかね
棋譜はもう食傷気味だから触れないけど
やねうらの人に賞賛されるのは凄いわ suimon
@floodgate_fan
・角換わり▲4五桂速攻の成立の可否の見極め
・角換わり腰掛け銀新型同型はやはり重要課題
・角換わり早繰り銀も有力
・相掛かりは飛車先をすぐに交換して、▲3七桂型にするのが趣向。プロ棋戦でも追随する人が出てきそう
・相雁木は先手の打開に苦労する。後手は待機策が有力
などが得られた知見。
午前8:49 · 2018年12月8日 · Twitter for iPad AlphaZeroの棋譜からツイートする局面を探すのに必死なんだろう >>202
コンピュータ将棋の第一人者だもんな(笑) ・suimonはオワコン
・ponanzaはオワコン
・AlphaZeroは最強ではない
・NNUEkai7は最新最強
・相雁木は手詰まり、先手から雁木を選択するべきではない
などが得られた知見。 ・飛車先を伸ばして▲76歩ではなく
▲96歩が戦術として成り立っている可能性があるみたいですね
・人間将棋よりも手数が多いけれども中段玉や入玉含みなのが理由であるかもしれない
・人間から見て手の意味が薄い指し手があるので指すほうも見るほうも辛い部分がある
この辺りでしょうか。少し見た感想としては
読み抜けが無いので短期的には丁寧なのですが、所々のっぺりとした将棋に見えました 後手は横歩を受けたら負けるゲームだと言ってるので横歩も無くなるな 将棋の可能性は細く狭く絞り込まれてドンドン限定的になっていくな。 中終盤は感覚的にほとんど無限
序盤は思いの外狭いかもな 小汚い棋譜ワロタwww
AlphaZeroの将棋は小汚い棋風www これ優秀な人間連合vsCPUならまだ人間の方が格段に強いと思うわw >>214
まだそんな夢見てるやついるのか
人間は遥かに弱いよ そう言った人間の夢につけ込むのがソフト指しのこいなぎ、mztn7、cruel、藍色まなか まあまだこれは人間の序盤の定跡、トップ棋士がやってるのを学習させればもっと違う将棋になってく気がする AlphaZero「電力3倍だ!!!!」
2017年5月版elmo「うわああああああああああ」
NNUEkaiF「ワイが最強の振り飛車党ソフトや」
orqha「ワイの方が強いで」
NNUEkai7「最新最強のワイ」 >>164
ほんコレ
京みたいなのを1000システムくらい使ってるのだろう >>219
人間の棋譜なんて学習対象になるわけないだろ。。 強化学習で自分を鍛えるAlphaZeroは、試行錯誤のプロセスを通じて成長します。ニューラルネットワークが必要とするトレーニング時間はゲームによって変わり、チェスでは約9時間、将棋では約12時間、囲碁では13日間必要だとのこと。 >>223
いや違うよ、今現在まで学習してある程度評価能力持ってる状態で
さらに生の将棋の序盤を(正しい間違い関係なく)まるで観戦者が学習するように学習させれば違ってくる
人間が間違いなのさほど問題ない、間違いは間違いと認識できるので
この棋譜見てわかるのはあくまで最後まで読めない状態で学習させていること、つまりまだまだおかしいところがある
最後まで読めないのを少しでも最後の方につなげる手がかりがこれまで人間全体が学習してきた序盤定跡だから
まだこの棋譜は学習途中、これが答えでなく変わっていく可能性を大きく残してる AlphaZeroはelmoより電力三倍以上で話にならん >>227
ID複数使うほど自信ないんだね、ブーメラン乙
知能が低いとこの話はわからないよ
この序盤がまだ学習段階で正しいわけでないというのがね、まああんたはこの段階を答えと信じてればいい
>>229
今はまだ完全解析はできない >>170
開発者がTwitterで投了宣言してんぞみてこい まーたたらればガイジかw
どうせシボレーすらやったことないんだろ?w >>226
それなら千田がもってる定跡ファイル読ませりゃ終了。人間の一局の棋譜とか無駄すぎる AlphaZeroはelmoより電力三倍以上であの勝率ならソフト性能単体では最新ソフトの方がやや強い 囲碁の13日ってすごいな。やっぱ人間には無理なゲーム。 >>235
それも人間由来のものだから話は同じだよ
とにかくyこの序盤はまだ学習の成果には程遠い
あとこれエルモ側のスペックはどうだったのかも気になるな、片側だけ圧倒的な読みの終盤だったら当然そちらが勝つし >>239
おじいちゃん、ご飯食べたら寝てくださいね AlphaZero「電力3倍だ!!!!」
2017年5月版elmo「うわああああああああああ」
NNUEkaiF「ワイが最強の振り飛車党ソフトや」
orqha「ワイの方が強いで」
NNUEkai7「最新最強のワイ」 >>240
>序盤はまだ学習の成果には程遠い
私の言ってるのはこれ、これに反対してるのね
序盤学習の成果はこれで十分、今後変わらない←この立場をあんた今後変えないのね
まあそのうちわかるよ そもそもの知識すら足りてないやつが多すぎて バカ晒して恥ずかしいな ■ このスレッドは過去ログ倉庫に格納されています