AlphaZeroの将棋棋譜がついに公開!
■ このスレッドは過去ログ倉庫に格納されています
論文
A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play
http://science.sciencemag.org/content/362/6419/1140
棋譜(100棋譜)
https://deepmind.com/research/alphago/alphazero-resources/
羽生善治竜王のセレクション10棋譜付き! >測定誤差の範囲かもしれませんが、KPPT同士の対局で強くなってもAlphaZeroに対する勝率があまり上がらないことが示唆されています。
河童氏がこう言っているからelmoに9割勝ったからといってAlphaZeroに並んだとは言えないだろう >>194
KPPT同士がどうした?
時代はNNUEや お得意の捏造がまた始まったのかw
ウォーズのponanzaは定跡積んでるとかむちゃくちゃな嘘を前にも言ってたよなw AlphaZero「電力3倍だ!!!!」
2017年5月版elmo「うわああああああああああ」
NNUEkaiF「ワイが最強の振り飛車党ソフトや」
orqha「ワイの方が強いで」
NNUEkai7「最新最強のワイ」 アルファゼロは一応やねうらの人に賞賛されているからプログラム的な何かが凄いのかね
棋譜はもう食傷気味だから触れないけど
やねうらの人に賞賛されるのは凄いわ suimon
@floodgate_fan
・角換わり▲4五桂速攻の成立の可否の見極め
・角換わり腰掛け銀新型同型はやはり重要課題
・角換わり早繰り銀も有力
・相掛かりは飛車先をすぐに交換して、▲3七桂型にするのが趣向。プロ棋戦でも追随する人が出てきそう
・相雁木は先手の打開に苦労する。後手は待機策が有力
などが得られた知見。
午前8:49 · 2018年12月8日 · Twitter for iPad AlphaZeroの棋譜からツイートする局面を探すのに必死なんだろう >>202
コンピュータ将棋の第一人者だもんな(笑) ・suimonはオワコン
・ponanzaはオワコン
・AlphaZeroは最強ではない
・NNUEkai7は最新最強
・相雁木は手詰まり、先手から雁木を選択するべきではない
などが得られた知見。 ・飛車先を伸ばして▲76歩ではなく
▲96歩が戦術として成り立っている可能性があるみたいですね
・人間将棋よりも手数が多いけれども中段玉や入玉含みなのが理由であるかもしれない
・人間から見て手の意味が薄い指し手があるので指すほうも見るほうも辛い部分がある
この辺りでしょうか。少し見た感想としては
読み抜けが無いので短期的には丁寧なのですが、所々のっぺりとした将棋に見えました 後手は横歩を受けたら負けるゲームだと言ってるので横歩も無くなるな 将棋の可能性は細く狭く絞り込まれてドンドン限定的になっていくな。 中終盤は感覚的にほとんど無限
序盤は思いの外狭いかもな 小汚い棋譜ワロタwww
AlphaZeroの将棋は小汚い棋風www これ優秀な人間連合vsCPUならまだ人間の方が格段に強いと思うわw >>214
まだそんな夢見てるやついるのか
人間は遥かに弱いよ そう言った人間の夢につけ込むのがソフト指しのこいなぎ、mztn7、cruel、藍色まなか まあまだこれは人間の序盤の定跡、トップ棋士がやってるのを学習させればもっと違う将棋になってく気がする AlphaZero「電力3倍だ!!!!」
2017年5月版elmo「うわああああああああああ」
NNUEkaiF「ワイが最強の振り飛車党ソフトや」
orqha「ワイの方が強いで」
NNUEkai7「最新最強のワイ」 >>164
ほんコレ
京みたいなのを1000システムくらい使ってるのだろう >>219
人間の棋譜なんて学習対象になるわけないだろ。。 強化学習で自分を鍛えるAlphaZeroは、試行錯誤のプロセスを通じて成長します。ニューラルネットワークが必要とするトレーニング時間はゲームによって変わり、チェスでは約9時間、将棋では約12時間、囲碁では13日間必要だとのこと。 >>223
いや違うよ、今現在まで学習してある程度評価能力持ってる状態で
さらに生の将棋の序盤を(正しい間違い関係なく)まるで観戦者が学習するように学習させれば違ってくる
人間が間違いなのさほど問題ない、間違いは間違いと認識できるので
この棋譜見てわかるのはあくまで最後まで読めない状態で学習させていること、つまりまだまだおかしいところがある
最後まで読めないのを少しでも最後の方につなげる手がかりがこれまで人間全体が学習してきた序盤定跡だから
まだこの棋譜は学習途中、これが答えでなく変わっていく可能性を大きく残してる AlphaZeroはelmoより電力三倍以上で話にならん >>227
ID複数使うほど自信ないんだね、ブーメラン乙
知能が低いとこの話はわからないよ
この序盤がまだ学習段階で正しいわけでないというのがね、まああんたはこの段階を答えと信じてればいい
>>229
今はまだ完全解析はできない >>170
開発者がTwitterで投了宣言してんぞみてこい まーたたらればガイジかw
どうせシボレーすらやったことないんだろ?w >>226
それなら千田がもってる定跡ファイル読ませりゃ終了。人間の一局の棋譜とか無駄すぎる AlphaZeroはelmoより電力三倍以上であの勝率ならソフト性能単体では最新ソフトの方がやや強い 囲碁の13日ってすごいな。やっぱ人間には無理なゲーム。 >>235
それも人間由来のものだから話は同じだよ
とにかくyこの序盤はまだ学習の成果には程遠い
あとこれエルモ側のスペックはどうだったのかも気になるな、片側だけ圧倒的な読みの終盤だったら当然そちらが勝つし >>239
おじいちゃん、ご飯食べたら寝てくださいね AlphaZero「電力3倍だ!!!!」
2017年5月版elmo「うわああああああああああ」
NNUEkaiF「ワイが最強の振り飛車党ソフトや」
orqha「ワイの方が強いで」
NNUEkai7「最新最強のワイ」 >>240
>序盤はまだ学習の成果には程遠い
私の言ってるのはこれ、これに反対してるのね
序盤学習の成果はこれで十分、今後変わらない←この立場をあんた今後変えないのね
まあそのうちわかるよ そもそもの知識すら足りてないやつが多すぎて バカ晒して恥ずかしいな AlphaZero「電力3倍だ!!!!」
2017年5月版elmo「うわああああああああああ」
NNUEkaiF「ワイが最強の振り飛車党ソフトや」
orqha「ワイの方が強いで」
NNUEkai7「最新最強のワイ」 ほんとこれ駒の飛び交いがサーカスみたいだな
羽生さんのアンチがよくこの言葉で揶揄してたけど、羽生さんの方向性は正しかったのだな
不思議なところで駒が飛び交って、攻められてるようでいつのまにか勝っている
王のききが大きく働きを見せてるのもチェスぽい 庶民はもうしばらくNNUE系で満足するわ。まだのびしろありそうだし。
AlphaZero路線は金持ちや大企業にまかせる たちばな塩業の社員たちが進駐軍から釈放されたで
心温まるええ話や
夕焼ーけ小焼けーの
赤とんぼー
日本バンザーイ!!
NNUEバンザーイ!! NNUE最高や!!!!
AlphaZeroなんか最初からいらんかったんや!!!! >>231
見てきたわ
投了宣言しないといけないかもしれないというタイトルで投了宣言してなかったわw >>179
そんなに強いならWCSC出てくればええやんAlphaZero(笑)
去年の12月に論文出した割に、今年のWCSC出てこなかったよなぁ(笑)
都合のいい相手選んで電力3倍の仮のレーティングでイキってるだけだろ?(笑) AlphaZero「電力3倍だ!!!!」
2017年5月版elmo「うわああああああああああ」
NNUEkaiF「ワイが最強の振り飛車党ソフトや」
orqha「ワイの方が強いで」
NNUEkai7「最新最強のワイ」 囲碁の学習は2週間
しかも電力は一日一億かけて学習
将棋は一日の学習
しかも電力はエルモの3倍でOK
将棋コスパよすぎ(笑) T-岡田選手 応援歌
T! HOMERUN KING T! T! T.rex 遠く 遠く 派手に飛ばせ ナニワの轟砲
2015/4/4 オリックス T-岡田 応援歌 京セラドーム
https://youtu.be/CBxR5tzUWUs @YouTubeより >>194
stockfish開発版も殆ど強くなってない、それどころか後手番だとsf8より弱くなってる
sf10でも対AlphaZeroは大して強くなってないだろうな
sfもaperypaqも1年前のAGZ論文で言及されてた
unrealistically high due to self-play biasのレートで喜んでただけという現実
技巧2とかともっとやればいいのに
レーティングの辻褄が合うように都合のいい対局ばっかやるからあんなレートになる AlphaZero「電力3倍だ!!!!」
2017年5月版elmo「うわああああああああああ」
NNUEkaiF「ワイが最強の振り飛車党ソフトや」
orqha「ワイの方が強いで」
NNUEkai7「最新最強のワイ」 コンピュータ選手権に電王戦の演出加えてアルファが出場し
解説にトップ棋士で行こうやないか
逃げはる君も大企業の名前が出て来るなら話は別と仕事受けるんだろ >>269
アルファくん(笑)は今年の世界コンピュータ将棋選手権をスルーして涙目敗走したんだよなw 駒落ちをAlphaZeroにやらせたら新定跡がんがん出てきそう 地味ーにやってる中でもあの大会は結構面白いことが多かった
その陣容なら良いコンテンツだぞ 盛大に盛り上げろ >>271
平手で目新しい序盤の将棋がなかったんだよなw
駒落ちとかどうでもいいわw AlphaZero「電力3倍だ!!!!」
2017年5月版elmo「うわああああああああああ」
NNUEkaiF「ワイが最強の振り飛車党ソフトや」
orqha「ワイの方が強いで」
NNUEkai7「最新最強のワイ」 まずは出場表明しなさいな
早いほうが良い 他の出場者の準備も変わってくる
一方的な勝ち宣言で終わりではまだ話半分だよ 煽り合いになったら一方的に勝利宣言すること。
これは電力3倍の一方的な条件も気にしないDeepMindから学んだ。 スタッフ1、2名とUSBメモリ持ち込むだけのことで出場に支障はないよな
関係者その方向で調整を
何故今年出なかったのかが不思議だ >>277
出ようと思えば出れたはず
つまり逃げたということ AlphaGOZeroは二連星しか打たないんだか
AlphaShougiZeroは序盤決め打ちみたいなのあるの? チェスだけど序盤からポーンを捨てまくって勝ったことに衝撃を受けてる様子
AlphaZero vs Stockfish 8
https://www.youtube.com/watch?v=pFtY7gNRVRI なんかalphaZeroの目的を勘違いしてる馬鹿いるな DeepMindのホームページ見てたら、おもしろすぎでしょ
トレーニングの量は、ゲームのスタイルと複雑さによって異なります。
チェスの場合は約9時間、将棋の場合は12時間、Goの場合は13日間です
チェスでは4時間のトレーニングでほぼ王者のレベル。将棋では2時間、そして囲碁は30時間です。
将棋のプロは2時間(笑)
チェスより深いのゲームなのにチェス王者の半分の時間で追いつかれてるやんけw エルモに比べたら最近のソフトはレートが1000以上上昇してるんでしょ?
にもかかわらずAlphaZeroに対してはエルモ並の勝率しか無い訳だろ?
これが事実ならソフトは2015年から2018年にかけてまったく強くなってないってことにならないか?
本当に強くなってんの? >>284
2時間で、だろ?
それ以上やってもアルファ側にメリットがないからやらないんだろ >>285
違う 俺が言いたいのはそうじゃない
例えば2017年のエルモもAlphaZeroにボコられてる訳だろ?
確か2018年?バージョンのエイプリー?もボコられてた
だとしたら2015年から2018年にかけて日本の将棋ソフトは強くなってないだろってことが言いたい
これが事実なら2015年のソフトも2018年のソフトも人間との勝率は変わらないってことになる たぶんだけどkai7でもAlphaZeroに対しては勝率10%ぐらいでエルモと変わらないんじゃないかってことなのよ >>283
持ち駒ペタペタできる分、勝ちやすいんだろうね ■ このスレッドは過去ログ倉庫に格納されています