【悲報】グーグルが将棋最強ソフトを2時間で作成★2
■ このスレッドは過去ログ倉庫に格納されています
AI「アルファ碁」を改良、将棋・チェスでも最強
グーグル、独学で鍛える
https://www.nikkei.com/article/DGXMZO24325500W7A201C1FF1000/
米グーグルの持ち株会社アルファベット傘下の英ディープマインドは、世界トップ棋士より強い最強の囲碁用の人工知能(AI)「アルファ碁ゼロ」を改良し、
将棋やチェスにも応用したAI「アルファゼロ」を開発した。白紙の状態から独学で試行錯誤を繰り返し、数時間で現状の世界最強ソフトを超える強さを獲得。
将棋・チェス・囲碁のいずれも最強という3冠を達成した。
2017年の世界コンピュータ将棋選手権で優勝したソフト「エルモ」と、16年のチェス世界大会で優勝した「ストックフィッシュ」、囲碁の「アルファ碁」と強さを比較した。
強さを示す指標「レーティング」をみると、アルファゼロが将棋では2時間弱、チェスでは4時間、囲碁では8時間学習した時点で各ソフトを上回る実力を手に入れた。
前スレ
【悲報】グーグルが将棋最強ソフトを2時間で作成
https://mevius.5ch.net/test/read.cgi/bgame/1512552413/ どう見てもこっちのニュースの方が重要なのにニュースがみんな羽生7冠やってて笑うしかない。十年前ならわかるがこんなので日本はいいのか。 本当にやばいニュースには言及できないからコメントもできないプロ棋士な
今まで、俺らの棋譜がなきゃ開発できなかったとかいろいろ言ってたけど
もう無理じゃんそれすら
だってグーグル定跡入れずに作っちゃったし 論文だけならなんとでも言える
棋譜もって来い
em Google様の支援受けた棋士が無双する日も近いな
圧倒的に強いソフト手に入れれば
研究精度が段違いで上がる 将棋の神様に感想戦見て貰えるんだから
グーグル味方にすれば
めっちゃ強くなるだろ
あらゆる敗因が即時にわかる 卑怯者羽生が一人だけソフトを入手しようとコンタクトを必死で取りそう。 これってalphagoみたいなでかいリソース使ってるわけじゃないって聞いたけど
どういうPCで計算したかのソースを下さい! アルファ碁も公開されてないし無理だろうな
ただ科学は検証可能でなければならないのでいくら論文で吠えても他の人が検証できないと意味がない
絶対セルゲームやるはず 研究とかもはやソフトの指した手を覚えることになりそうだな >>12
アマだったらその辺のフリーソフトでそれが出来るぞ これは将棋ソフトではなくて凄いAIに将棋やらせたらこうなったって話だから
プロ棋士は特に影響ないだろうけど将棋ソフト作ってた人らは大変だろうね 一体、この10数年の将棋プログラムは何だったんだ。何の役にも立たなかった。
黒船が外国からやってきて、木っ端みじんにされた。 定石がなくても一日もかからず無敵だよ。ハブだっけか、駒を増やせば人間の天下だとか言ったのは。
そんな事しても、永久に一回も勝てないわ。 所詮人間より強いAIより強いAIが出来ただけだろ?
騒いでるのはキモヲタだけ? ってか、elmoと同じくらいの実力になったところで成長が止まったっていうのも不思議な話じゃない?それとも単純に世界最強に勝てればそれで終わりなの? >>25
汎用性の実証が終わったからあまり関わらないでしょ。
本丸は汎用の人工知能とかだろうから、これ以上やってもお金と時間と無駄だわ。ドワンゴとか連盟がたんまり金出せば話は違うだろうけど。 >>25
ボードゲームは試し打ちしただけだぞ
AIの作るAIが人間の作るAIを短時間で超えるってのが本筋
シンギュラリティ起こすための第一歩ってところ >>25
将棋というゲームの極める余地がそれだけ少なかったのかと
そもそもエルモに勝率9割で同じくらいの実力とは思えないが >>29
そう言えば、伊藤氏は、またなんかくさしてる?
アルファ碁の時もGoogleはインチキだ、嘘吐きだとか騒いでたよね。 Googleが買い取ったこの連中は異次元過ぎるだろ 大会で圧勝して証明したわけでもなく、ソフト公開もせず、棋譜すら出さず、
勝敗の数だけ一方的に言ってるだけだから真偽も分からないのは事実。 チェスソフトをベースにコツコツ改変するという日本人らしい細かい作業を大雑把なアメリカ人が斬新な発想でぶち抜いてしまう、よくある日米の構図だった
人的資源と金の投資が桁違いということかね >>9
論文は誰でも再現可能だから論文として通るんだぞ
金さえあれば誰でも2時間でプロ棋士を凌駕出来る 羽生に勝ってからにしろとか日本棋院ばりにからむやついないのかよw
やつらは、イセドルが負けた後にやらかしたよ
井山の壁を越えてから最強を名乗れってな!
井山よりランク高いのに勝ってるからガン無視されたけど 羽生の方が強い
羽生先生はいつでも対局受けて立つのに逃げ回ってる
ソフトの野郎を頭金でピッシイと懲らしめる所を
見たいもんですな 金があれば俺にもできる!って金を集める能力のない人間の負け惜しみだよな…
コンピュータやソフトウェアの分野でももうアメリカ様に歯が立たない気がしてきたわ(笑)
良くも悪くも資本主義社会か ちょっと長くなったな。すまん。
前スレの内容だが、
・将棋は終盤が大切なゲームであり且つDLはそこが弱いといわれていたのにもかかわらず、測定方法は中盤の終わりを示す評価値−900が10手連続で出たら投了という、非常に微妙な条件で測定を行っている
・将棋は世界選手権のチャンピオンがフリーソフト化していたためにチェスや囲碁という競技者が非常に多いものと同列に扱われることができたと推測
・日本に現存する最強の将棋専門ソフトは実は検証時のelmo相手に8割強勝てるという意見がある
・測定に使ったelmoは入玉という将棋の第二ルールのほうをより得意としている将棋ソフト
・GoogleのDLではより深く探索せず(手を読まず)、非常に正確な大局観を持っているものと推測される
・Googleの計算資源からすれば学習時間の強弱には特別な意味はない
・Googleの計算資源を使えば既存の将棋ソフトの学習のほうがより効率的であり、より上位の存在になれると予測
・将棋はチェスと違い既存のプログラムがよりゲームの天井に届いていないという現状で(まだ発展途上)また囲碁は他でもないGoogleのalphaZeroを対戦相手としているのであり、
既存のプログラムを超えた時間だけではゲーム難易度・ゲーム性・各ゲームにおけるDLの効果の程度は計測できない
・将棋プログラム及びチェスプログラムの稼働環境が不十分であったという疑惑がある >>44
>>36はなんだかもっともらしい一般論に落とし込んで悦に浸かってるだけで、全然的を得ていないぞ
deep learningという強力な道具を手にしたからチェス将棋を蹴散らしてやるか→楽勝
世間が好む日本人論など関係なく、ただこれだけの事だ ここから論文が読める。https://arxiv.org/abs/1712.01815
(但し、文章はすべて下記の前文と同じく英語)
Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm
David Silver, Thomas Hubert, Julian Schrittwieser, Ioannis Antonoglou, Matthew Lai, Arthur Guez,
Marc Lanctot, Laurent Sifre, Dharshan Kumaran, Thore Graepel, Timothy Lillicrap, Karen Simonyan, Demis Hassabis
(Submitted on 5 Dec 2017)
The game of chess is the most widely-studied domain in the history of artificial intelligence.
The strongest programs are based on a combination of sophisticated search techniques,
domain-specific adaptations, and handcrafted evaluation functions that have been refined by human experts over several decades.
In contrast, the AlphaGo Zero program recently achieved superhuman performance in the game of Go,
by tabula rasa reinforcement learning from games of self-play.
In this paper, we generalise this approach into a single AlphaZero algorithm that can achieve, tabula rasa,
superhuman performance in many challenging domains. Starting from random play,
and given no domain knowledge except the game rules,
AlphaZero achieved within 24 hours a superhuman level of play in the games of chess and shogi (Japanese chess) as well as Go,
and convincingly defeated a world-champion program in each case. 一つ疑問なのが将棋よりもチェスのほうが時間かかってるってとこだな将棋の方が時間かかりそうなもんだが
まぁエルモが大したこと無かったってことかも知らんが >>47
そのdeep learning て、ぽな山本がなんか頑張って実用化しようとしたんだけど、うまくいかずにエルモび負けたんじゃん。でもGoogleの子会社は、deep leaningでエルモに圧勝したんじゃろ?
36はこの辺りの事情をうまく評しているように思えたんだ。 アルファが日本の電王戦に出場する可能性ありますか?
だったら見たいかも 来年の世界大会に出させろ。
それを聞き俄然燃えて出場を決める山本。
そして山本完膚なきまでに叩きのめされ号泣。 短時間かどうかは知らないけどAIが作ったAIがヒトが作ったものより優秀って記事をつい3日前くらいに見たよ >>51
既存のソフトのドローにする能力が高いチェス
持ち駒の効果で思いのほか打開出来る将棋
根本的なルールの差が出たかもしれないな 今チェスの頂上対決でhoudiniとkomodoがやってるじゃん、なんか馬鹿らしいな 「山本はイイタイミングで逃げたな」
ってレスあったけどそうでもなくね?
奴は日本のソフト開発の連中にさえも勝ち逃げ出来たわけでもないし、メイジンに勝った!ってのは他のソフトでも可能である
だから結局ムダなことに時間かけて一時の優越感だけ味わっただけで結構惨めな去り方じゃね?
これからレーティングのランキングにもポナンザのポの字も乗らないんだぜ Googleが神がかり的にすごいのは分かったが、それによって羽生を含めた棋士達及び将棋プログラマーを批評するのはお門違い。
一番重要なのは、これは*シンギュラリティ(技術的特異点)を予想よりも30年程度早めに引き起こし、
産業革命レベルの歴史的事件が勃発する可能性すらあり得るようになったということ。
*シンギュラリティ(技術的特異点):技術的特異点(ぎじゅつてきとくいてん、英語:Technological Singularity)、またはシンギュラリティ(Singularity)とは、
人工知能(人工超知能、汎用人工知能、AGI)の発明が急激な技術の成長を引き起こし、人間文明に計り知れない変化をもたらすという仮説である。
人類が人工知能と融合し、生物学的な思考速度の限界を超越することで、現在の人類からして、人類の進化速度が無限大に到達したように見える瞬間に到達すること。
実際に人類の進化速度が無限大になることはないが、進化速度が極めて速く、数学的な特異点と同様に見えるため、このように名付けられた。
2010年代以降、一躍有名になったレイ・カーツワイルの予言の影響により、一般層を中心に2045年問題とも呼ばれている。
−wikipedeiaより一部抜粋 「Googleの計算資源を使えば俺ならもっと強いのができる」
はみっともない アルファゼロと羽生との対戦を見たい
5戦して1回でも羽生が勝てば羽生の勝ちというルールなら乗ってきそう >>5
コンピュータが強くなったなんて10年前ならニュースになるが今ならニュースになんてならないだろw
自己対戦して強くなるなんても目新しい話じゃないし何言ってるんだか? その「ちんぐらりてぃちんぐらりてぃ」ってみっともないからやめなよ
「ぼくちん今何が起きてるのかさっぱりわかりません」と言ってるに等しい プロ囲碁打ちは強いAIの出現を歓迎したのに
プロ将棋打ちは、無視?だんまり?
また対局禁止令やかん口令が出てるの? 不思議なのは90勝ったが8敗してるんだよな。
かなり汎化した DL 使ってもすくい取れない勝敗の行方があるってことだ。
レーティングの成長曲線?みてもチェスがほぼフラットにサチュレーションしてるのに対して
将棋は不規則なギザギザが最後まで取れてない。
将棋はチェスと違って、特定の戦型になるとカオス的な挙動を示すことがあるかもしれんね。
どういう戦型で不規則性がでてくるのか棋譜の公開が待たれるね。 >>63
1000回やって1000回負けるレベルなのに絶対出てこんわ。 羽生善治は棋界の偉人であり、alphaZeroは複数人で構成されている研究チームで作った一般史上まで名を遺す圧倒的な存在。
さて果たして、お前らとはどのぐらいは離れているのでしょうかね。シン・ゴジラ見た人ならなんとなくその比例対象がわかると思いますけど。 あ、でも相手が巨大資本のグーグルとなれば
恰好が付くと思って出て来やがるかもしれんな。 >>68
イ・セドルは一発入れている
竜王戦でもソフトよりも羽生のほうが読みが深い場面はいくらでもあった
5戦あれば1発は入れられるだろ >>71
いくらでもって相手より多くなきゃ勝てないよ >>71
ポナに勝率0.5%と予想されてるよ。
ポナがすでに天と地だ。 >>53
日本のソフトを開発してきたのは天才プログラマーでも巨大企業でもなく、将棋に興味があるごく普通の個人プログラマー
googleが出してきたアルファゼロは、巨大資本を手にした天才プログラマーが中心となって開発したもの
「日本人がコツコツ〜」「アメリカ人が斬新な手法で〜」
だなどという不愉快な国民性で語るのは全く適切ではないんだが 技術的特異点から言うと人類最後の発明だから人間が勝てたらそれはそれでやばい >>71
古すぎる話をしてもダメですよ
AI、一日会わざれば刮目して見よ 勝てる可能性のあるボードゲームってあるのか?
このスレの人たちなら色々と詳しそうだが何かあるかな? もうコンピュータ将棋とかどうでもいいよ
人間がコンピュータに暗算負けるのと同じだって… >>78
ボードゲームどころかあらゆるジャンルで人間が勝てなくなるAIだぞ 難解なボードゲームTOP3は囲碁将棋チェスでFAなの? 麻雀あたりならランダム要素で一発入れれるんだろうけど東南戦で人間がどの程度逃げ切れるのか興味がある 前スレからちょくちょく見かけるが、このニュースでシンギュラリティ技術的特異点が来たとかもうすぐだ
って感じのコメントしてるやつは言葉を誤解してる
カーツワイルなんかの本は読んでさえないんだろうと思えるほどの理解度の低さ alphazeroに勝てるというならそれより弱い既存ソフトに勝ってから言えよw 羽生アンチうざいな
何も5戦して勝ち越せるなんて誰も言っていない
一発入れられるくらいの差だろうということ
竜王戦で羽生はソフトより深く読んでいた
アンチは何の根拠もなくアルファゼロを持ち上げるんだよね
羽生憎しが前提だから論理的に考えられないんだろう >>59
本人がいい時期に関われたって言ってるからなぁ 0.5%は適当な見積もりだが、200回に1回勝てるかもねという数だぞ。
5分の1は20%だ。絶対に無理。かすりもしませんよ。 >>75
アメリカにはリスクテイカーに莫大な資本を投下する仕組みがある。翻って日本みてみ。銀行やら投資家やらの投資行動の保守っぷりよ。。。
国民性の話じゃなくて、ビジネス、特に研究開発の仕組みの話。 >>86
イセドルが1発入れれたとかいう程度の認識なら黙ってたほうがいいよ
アンチとかじゃなくて客観的な数字から無理だと言われてる >>46
論文さらっと読んだけど、「-900で投了だから終盤弱い」というのはデマだね
-900センチポーンが10手連続したら投了するのはhead-to-headの対局だけであって、レーティング測定用1秒対局では(おそらく)最後まで指している
Figure 1を見る限り、こちらもelmo+400程度のレーティングに収まっているので終盤も問題ないことが分かる
Elo ratings were computed from evaluation
games between different players when given one second per move
1手1分だから強いとかも嘘だね
棋譜生成は
Unless otherwise specified, the training and search algorithm and parameters are identical to AlphaGo Zero
AlphaGo Zeroと全く同じ学習法使っていて
measure false positives, we disable resignation in 10% of self-play games and play until termination.
だから10%の対局は確実に終局までやってる >>89
いや、それは確かに一応少しは今回の件に関係あるとも言える
>>36のお馬鹿な国民性の話とは全然違うぞ コンピューター将棋という分野が終了
AIの砂場になりましたw >>92
36
>人的資源と金の投資が桁違いということかね >>36
著者名全部調べてないけど米国人いるの?
D. Silver と D. Hassabis は少なくとも英国人だろ
なおハサビスは 1/4 中国系(祖父が華人系シンガポール人) 専門家の方にはシンギュラリティについて詳しく説明できる方がいるはずですけど、シンギュラリティは産業革命の類の存在では無いのですか?詳しく教えてくれますよね? シンギュラリティは1000ドルのコンピュータ1台で全人類の知能を超えたとき >>95米国は才能ある人間を普通に海外から連れてくるから居なくても不思議じゃない >>98
なんで米国なの?
DeepMind はロンドン郊外に本社があるイギリスの会社なんだが ■ このスレッドは過去ログ倉庫に格納されています