AlphaZeroの将棋棋譜がついに公開!
■ このスレッドは過去ログ倉庫に格納されています
論文 A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play http://science.sciencemag.org/content/362/6419/1140 棋譜(100棋譜) https://deepmind.com/research/alphago/alphazero-resources/ 羽生善治竜王のセレクション10棋譜付き! >>610 ルールを教えた上で自己対戦させて学習させるので もとのルールセットに宣言法があったのか問題だよね >>619 自分もそちらじゃないかなと思っている 負けない確率を潰していく過程で残ったのが相掛かりなんじゃないかと 相手の必勝戦法を避けて残ったのが先手後手の優劣が出にくい戦法でそれがAlphaZeroにとっては相掛かりだったのじゃないかなって >>614 ,620-621 自己対戦学習で初手76歩より26歩の先手勝率が良かったという結論 先手矢倉がダメとか角換わりがダメとかいう結論とは違う どれでも先手勝率が50%以上だった可能性がある 中でももっとも勝率が良かったのが相掛かりだったから初手26歩なんだよ 一方、後手の横歩取りは完全否定されて初手84歩が必然との結論を出している つまり、先後の初手は藤井聡太と同じだね 最後緩んでギリギリの形勢にするが勝ちはするというのは重要な欠陥だ ギリギリにするだけでなく負けたこともあるから本当に逆転まではさせないのかも信用ならない 勝ちになったところから最短で詰ませるような改善は必要だろう 他のどの分野に応用するにしても重要だよ 難しい手術を完璧に進めて後は誰がやっても大丈夫と安心してたらそこから大惨事にとならないために >>614 先手矢倉は当然ダメで、 先手角換わりもイマイチっぽいから相掛かりにしてるんじゃないのか >>623 大惨事が起きる確率を減らせという注文と最短を目指せという注文は矛盾してるぞ? >>613 >>615 AlphaZeroが負けたという現実から目をそらすな >>624 当然っていうからにはちゃんと調べたんだろうな? いずれにしても横歩は完全にダメそうやな 青野流が優秀すぎて 青野流には明日斗流を主張していたさくらは謝罪しろよ 序盤に技術革新が起きていそうなのだけど、誰もAlphaZeroを使えないので、検討できない感じ? AlphaGoみたいに人間とネット対戦をそのうちやってくれることを期待しよう! 藤井聡七段 大橋四段 千田六段 elmo囲い採用 さくらウォーズ初段 elmo囲いは疑問 >595 DMがalphazeroとか作ったのは技術アピールだし 元々研究者にとっては囲碁将棋は情報学を発展させるためのサンプルに過ぎない。 他所の研究所などが時間とお金を掛ければalphazeroより強いソフトができる可能性はあるけど 作ったとしても他所の成果の後追いといわれるだけだから。 研究者として受ける功績が薄そうなのは研究者本人やその所属団体自体が嫌がる。 お金以外に時間の無駄だから、研究リソースを別のテーマに移すのは普通の選択 >>615 AlphaZeroの棋譜をXeon採点してるのは何monだよw そろそろ誰かWikipediaに、elmo囲いの項目の記事書いてよ(´・ω・`) >>637 頭に血がカーッと上ってるのは何monなんだよ?w 書き込みをビタビタ当てられて動揺しているなw 悲惨だなw David Howell @DavidHowellGM Back in April I was part of a team that played a match against AlphaZero. Check out my column in today's @thesundaytimes for exclusive coverage of the games! Dominic Lawson has also written a great piece on our experience of the match. 羽生さんもすでに対局しているのかもしれない・・・ ひっそりってこともないだろうから AlphaZero vs Habu があるならどこかへ出るだろう NHKあたり有力? >>636 相掛かり得意っていう若手はぱっと思いつかないな。 この戦型は、ベテランの方が序中盤うまく指せそう。 羽生が負けたら将棋界がお通夜みたいになりそうで嫌だな >>647 むしろ正常化だよw 今のままではガラパゴスなカルト宗教だ 囲碁界がスマホ規制 超人AIの設計図公開で反対論一転 https://www.asahi.com/articles/ASL9R7JQFL9RUCVL00B.html 画像:対局後にスマホでAIの分析を見る中国のトップ棋士、柯潔九段(右)。 “AI信仰”は急速に広がっている=8月21日、東京都渋谷区 https://www.asahicom.jp/articles/images/AS20180925002361_comm.jpg 画像:日本棋院が用意したスマホロッカー。対局前に棋士自身がここに預ける=東京・市ケ谷の日本棋院 https://www.asahicom.jp/articles/images/AS20180925002370_comm.jpg 超人囲碁AIをわが先生に 棋士ら、こぞってインストール https://www.asahi.com/articles/DA3S13677523.html 敗れた井山は「AIをどれだけ細部まで研究し、どれだけ知っているかが 結果に表れるようになった」と言う。「知らないと負けとは言わないまでも、 トップ棋士が相手だと厳しい。単なるまねは抵抗があるが、 一理あると思う手はどんどん採り入れる姿勢でいかなきゃいけない」 今夏発足した棋士有志のAI研究会「プロジェクトAI」は、理解しがたいAIの手について 知恵を出し合い、意図を探る。AIによって一手の評価が正反対になることもあり、 何が最善手なのかは容易に結論を出せないのが実情だ。 「正直、何を信じていいのかわからない」と一力遼八段(21)。 「でも、打つと負けるんですよね」。座長の大橋拓文(ひろふみ)六段(34)は 「AIとどう付き合えばいいのか、手探りの状態です。 人間が使いこなせる道筋を見つけるのも、研究会の目的の一つ」と言う。 >>647 もう誰一人として勝てると思ってないだろw 興行にすらならない 1手につき考慮時間1時間とかなら勝負になるかもしれない 何日かかるか知らんけど 羽生は前期の竜王戦初戦が三浦の復帰戦で 注目はされたが複雑な心境でスタートしたと感じた 冷え冷えだったところに藤井聡太が火を起こしてにわかを招集して 満を持したかのように永世七冠を達成して従来のファンも盛り上げた それだけでもすげぇと思うわ そういうハンデ付きなら有りかもね。 ソフトの持ち時間1時間羽生持ち時間10時間とか >>654 そう、だから現状はもはやカルト宗教 最新の将棋ソフトだとノートパソコンでも九段が即指しな件 http://yaneuraou.yaneu.com/2018/08/07/ この段位は、将棋倶楽部24換算になっているので、 町道場の段位よりかなりシビアな段位です。九段=R3200(R3100?R3300)、 八段=R3000、…、初段=R1600、1級=R1500、2級=R1400、…。 この九段は平均的なプロと同じぐらい(それ以上?)の棋力ではないかと思います。 いまどきの将棋ソフトで、九段にするには、NodesLimit = 315,754。 ちなみに初段は、NodesLimit = 3,450だということがわかりました。 (わりと少ない数字なので驚いています。) いまどき、3万円のノートパソコンでも1秒間に50万局面は読めるわけで、 九段に設定してもノートパソコンですら即指し(1手、1秒未満)という結果になりました。 普通の(10万円ぐらいの)デスクトップ機なら、九段に設定していても0.1秒未満で指してきます。 また、「初段」の棋力でよければ、人間側が1手1秒で指すとしても 3万円のノートパソコンで100面指し出来てしまうということですね。いやはや。 QQRとillqhaで棋譜解析してみた とりあえず1.csa〜6.csaまで終えた いずれも先手がAlphaZeroの相掛かりの棋譜だが、AlphaZeroが有利になったのは中盤の指し手でelmoに疑問手があったのが原因だった QQRもillqhaも間違えないところでelmoだけが勝手に間違えている これが敗着といってよい したがって、これらだけを見ると戦形の優劣でelmoが負けたわけではないし、AlphaZeroが強すぎたわけで負けたわけでもない 単にelmoがQQRやillqhaより弱いソフトだったのが敗因となっている 敗着となったelmoの手と評価 1.58手目25桂の敗着で先手Alpha有利 2.78手目44歩の敗着で先手Alpha有利 3.56手目33銀の敗着で先手Alpha有利 4.88手目76歩の敗着で先手Alpha有利 5.66手目38銀の敗着で先手Alpha有利 6.90手目71金の敗着で先手Alpha有利 千田が自分のPCじゃ互角くらいになるがその後進めたらどうやっても劣勢になって どれだけ深く読んでいたのかって驚くとこあるけど AWSマンが評価値を貼るときよくある現象だよね それはマシンパワーをたくさん使ってる分深く読めるってだけのことでしかないし グーグルはAWSですら(笑)になるレベルのマシンパワー使ってるってだけだ エルモと称したプレステシンプルシリーズの将棋ソフトに勝って世界最強のAIだもんな ゼロの配布がされてないから検証も出来ないのに 妄信的なカルト信者はゼロを賞賛 ゴミ棋譜から相掛が最善の戦法だとか騒ぎやがる 根拠のない妄想から結論を出して断言とか話にならんやろ >>656 QQRとかillqhaですら正しく評価できるか分からなくなってきてるってのが AlphaZeroの出現で分かった いずれQQRもillqhaも間違えてしまうはず >>659 いずれも何もAWS使うだけで正しい評価なんて変わるだろ バカじゃないのか? 角換わりダメ横歩もダメなら初手96歩マンが出てきてもいい AlphaZero以外の話してるスレ違いの奴がいるな 他のところに行けよ >>663 AlphaZeroが大して話題にならなくてカリカリしてるのは何monなんだよ?w AlphaZero が示した事は簡単。 どんな初歩的な戦術でも(AlphaZeroの場合は駒得) 相手より深く読めば、勝てる方法がある。 ただ人間ならアホらしいし誰もやってみないだけ 今日、タニーが相掛かりで山ちゃんを凹ってた。 おっさんの復権あるで。 >>555 ケチくせえな。語尾につける挨拶か。まさかいきなり文句書くヤツはいないだろうからな。お前にならって使うわ。 ググるよガイジ。それから分かりやすく書かないと同意してくれねえぞガイジ。 量子コンピュータで激指13動かせばそいつらみんな雑魚だろ 角道ってどうせ開けることになるのになんで初手だと駄目なの >>658 さすがに世界的な論文誌でそんなことやるのはハルコ・オボカタくらいだろ それでも信じられないならAlphaZeroクローンのCrazyShogiが来年のコンピュータ将棋選手権に参戦表明してるからそれまで待て >>674 アルゴリズム的にはレミクーロンがオリジナルなんだから どっちがクローンなんだかww >>658 君より千田の方が1億倍信用できるからな >>670 ワロタに草つけるくらいやから、よっぽどうけたんだろうな。 DMのやってることと棋理の追求は別物だからねえ。 DMはAIは短時間でこんなこと、最高レベルの将棋ソフトと互角の戦いが出来る、まで出来るんだよ。 そのAIが指す将棋が棋理にかなってるかは別問題。 ただ、飛車先はつくけど、角道はあけない、ってのは、駒の配置考えると真理なのかもって気はするね。 人間の戦いやすさとは別次元で。 最近の青野流の勢いをみると勇気流とはなんだったのか アルファゼロに振り飛車のみ指させれば新戦法も出るんだろうけど、開発チームに居飛車と振り飛車の違いから教えないと始まらないな 囲碁やチェスなら分かるけど、なんでgoogleは将棋なんてマイナーなゲームをわざわざ選んだんだろうか? 普通無視するだろ >>676 俺もお前やディープマインドより千田の方が1億万倍信用できるけどな 横歩取りが終わったと言うならタイトルの一つをとってから言って貰いたいわ アルファゼロは将棋ソフトではないんだから 色々根本的に違うんだろうな 時間できたら論文読もう >>683 AI関連で世界配信された事件があったような? >>683 安心しろ。 もちろん、あくまでチェスや碁をやった『ついで』だからなw 相掛かりは力戦待ったなしの戦型だから 大局観で戦うベテランの勝率が上がるかもしれない >>551 elmoに強い指し回しが他のソフトにも強いかどうかが焦点になるな >>683 ボードゲームの中でグーグル以外が作ったソフトがあるからだろ elmoと戦っただけで別にelmoに勝つ学習したわけじゃないし >>688 序盤がアバウトなのは何_crowだよw 将棋は厳しいね AIの得意分野だからな 小説とか、音楽はAIには無理でしょ パッヘルベルのカノンを超える曲を10曲ほど作ってみろよ? 自己対戦だけで無限に強くなってくから相手は関係ない >>683 比較対象になる既存のソフトが比較的作り込まれてるジャンルだからでは? もはや人間を超えすぎて理解できない ただ、エルモ公開後の秋の電王トーナメントのときに 平岡さんがエイプリーはエルモに8割だか8割5分勝てる関数って言っていたから そこまで差はないのかもなんて思ったりもする >>701 Aperypaqはそもそも既存ソフト同士ののレーティングでもelmoと167差だから対elmo期待勝率72% CM曲とかの売れる音楽はAI作曲に置き換わると予想されている。 バッハ風の曲の作曲コンテストでは人間よりAIの方が評価が高かったこともある。 一般にはどのような曲が名曲かの明確な基準がないので、AIにそれを学習させるのは難しいだろうな。 >>683 なぜシャンチーでなく将棋だったのかというのは興味深い (英語論文数ではシャンチーのほうが多いし、シャンチーも対人デモなどはやってる) おそらくだが、客観的な指標(世界選手権等)で最強といえるソフトがオープンソースだというのが きいてきたんじゃないかな WCSCがほそぼそとはいえ英語で情報発信してきた成果といえるかも >>683 なぜシャンチーでなく将棋だったのかというのは興味深い (英語論文数ではシャンチーのほうが多いし、シャンチーも対人デモなどはやってる) おそらくだが、客観的な指標(世界選手権等)で最強といえるソフトがオープンソースだというのが きいてきたんじゃないかな WCSCがほそぼそとはいえ英語で情報発信してきた成果といえるかも >>701 平岡さんの当時のツイート検索したらelmo(WCSC27)に75%って書いてあるぞ それはお前さんの記憶違いだ >>707 いや75%と85%ってツイート両方あるな たぶんどっちかはtypo プロ棋士が我先にと感想を言ってくれるかと思ったけど全然だな。 三浦の時に谷川以下この世の終わりみたいな表情だったからなあ 羽生がアルファゼロと電王戦を戦って全敗でもしたらモテは自決でもするんじゃないか 羽生を出すのはリスキーすぎる 天彦にでもしておけ 棋士はとっくに心折れてるよ ソフトと戦おうという気概の有るものはおらず、ソフトの強さを真似ようとしてばかり プロは新手一勝だからな アルファゼロの棋譜の中から一勝できるネタを必死に探していると思われ 天彦広瀬豊島あたりなら全滅してもダメージにならんが羽生なら一矢報いると誰もが期待するからねえ 羽生はやめておいた方が良いね 藤井も同じ 将棋ブームが終わってしまうかもしれん >>716 新手一生だとカッコいいのに 新手一勝となるととたんにセコくなるなw アルファは穴がありそうだから羽生や天彦でも勝てる確率はある ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる