【悲報】グーグルが将棋最強ソフトを2時間で作成★2
■ このスレッドは過去ログ倉庫に格納されています
AI「アルファ碁」を改良、将棋・チェスでも最強
グーグル、独学で鍛える
https://www.nikkei.com/article/DGXMZO24325500W7A201C1FF1000/
米グーグルの持ち株会社アルファベット傘下の英ディープマインドは、世界トップ棋士より強い最強の囲碁用の人工知能(AI)「アルファ碁ゼロ」を改良し、
将棋やチェスにも応用したAI「アルファゼロ」を開発した。白紙の状態から独学で試行錯誤を繰り返し、数時間で現状の世界最強ソフトを超える強さを獲得。
将棋・チェス・囲碁のいずれも最強という3冠を達成した。
2017年の世界コンピュータ将棋選手権で優勝したソフト「エルモ」と、16年のチェス世界大会で優勝した「ストックフィッシュ」、囲碁の「アルファ碁」と強さを比較した。
強さを示す指標「レーティング」をみると、アルファゼロが将棋では2時間弱、チェスでは4時間、囲碁では8時間学習した時点で各ソフトを上回る実力を手に入れた。
前スレ
【悲報】グーグルが将棋最強ソフトを2時間で作成
https://mevius.5ch.net/test/read.cgi/bgame/1512552413/ シンギュラリティは1000ドルのコンピュータ1台で全人類の知能を超えたとき >>95米国は才能ある人間を普通に海外から連れてくるから居なくても不思議じゃない >>98
なんで米国なの?
DeepMind はロンドン郊外に本社があるイギリスの会社なんだが まあ、将棋に特化したソフトと汎用性あるソフトという違いがあるから
仮に既存のソフトより弱かったとしてもスゲーと思ってしまう。 >>96
違います
今まではソフトの改良は人間が行っていました
しかし、シンギュラリティ後はソフトの改良もソフトが行います
つまり、今後のイノベーション(発明、発見)はすべてソフトが行うことになり、人間は存在価値が無くなります >>99
>>36を読んでアメリカの会社だと思った ソースをろくに調べないフェイクが多すぎる
・DeepMindはアメリカ人
・Googleのハードは1080Tiの110年分
・入玉なしの変則ルール
これらは全部ウソ
5chは本当にひどくなったな まぁスレタイもGoogleがーって言っちゃってるしみんなGoogleとDeepMindの区別なんかついてない >>106ちゃんと読んで無かったわ···恥ずかしい αから見たら案外チェスなんかよりもオセロの方が難しいんじゃないかと思ってる
途中でルールが変わるのが苦手だからな >>103
それって、今まで安定的に存在していた職が奪われるということであってますよね?それならば私の想像していた「産業革命の類」と合致しています。
産業化革命:肉体労働において身体的限界(時間的限界・空間的限界の意味を含む)のある人類からその仕事を効率の面でとってかわる存在が出てきたことによる文明の進歩→第三次産業の比重の工場及び娯楽の発展
シンギュラリティ:頭脳を使った仕事において身体的限界のある人類からその仕事を効率の面でとって代わる存在が出てきたことによる文明の進歩→(推測)人類の悟りの促進及び永続安定した娯楽的・健康的な生活の発生
こんな感じで合ってます? 訂正:産業化革命→産業革命 比重の工業→比重の増加
すみません。打ち間違いました。ネット自体は初心者なもんで。 >>112
個人の視点で考えているのならだいたいあっています。
しかし、人類全体で考えれば違います。
産業革命は単に人類が凄い発明をして生活様式が変わったという現象です。
18世紀にイギリスで起きたことが代表的ですが、細かくみると何度も起きていることです。
しかし、シンギュラリティは人類より機械が発明の面でも上に来たという一度しか起こらないことです。 >>112
個人の視点で考えているのならだいたいあっています。
しかし、人類全体で考えれば違います。
産業革命は単に人類が凄い発明をして生活様式が変わったという現象です。
18世紀にイギリスで起きたことが代表的ですが、細かくみると何度も起きていることです。
しかし、シンギュラリティは人類より機械が発明の面でも上に来たという一度しか起こらないことです。 「シンギュラリティ」の本来の意味は人類の進化曲線が、
無限大になるポイントを指す言葉で「技術的特異点」と訳されます。
だそうです これまでとは全く違う定石を見せて欲しい。初手86歩とか 序盤がウルトラ強いんだろうから異次元な指し回しなんだろう すでにスマホに負けるんだから、今さらアルファ出てきてもたいした影響ないよね 負けを認められない将棋プログラマーの隠しきれない痛さキモさが伝わってくるのが悲しいわ これ将棋レスの話じゃなくてもっと盛り上がっていいよ
AIの進化 怖すぎる deepmindがガチだったのはmasterまででAlphaGo Zero以降は縛りプレイで楽しんでるだけ
R500ぐらい上がる既存手法あっても、あえて使わない >>128
むしろこれから社会をつくる若い人のほうが怖がってるんじゃないかな
将棋で言えばになるけど10歳からプロまで1日8時間10年
電卓叩いちゃったけど人間3万時間の脳労力を2時間でマスターって あまりにも衝撃が強すぎてプロ棋士が沈黙してしまったな。 これは桂馬を下に飛ばしても1時間もあれば対応してくるかもわからんね。
発言者は予想をはるかにこえていたな >>131
その考え方が古い
これから社会作るのは若い人じゃなくてAIだよ >>134
なるほど、でもそれ冷めすぎだよ
小学生が「先生こんな授業AIなら0.01秒で学べると思うとどうなんでしょう」
こんな社会 嫌だよ しかし0から2時間でということは名人と知識ゼロで持ち時間4時間ぐらいでやった場合、
学習しながら勝ってしまいかねないということだな。恐ろしいな。 学校教育は、奴隷作るためにやってるだけだから
別に勉強覚えることが最終目標じゃないし あとはせめて序盤が人間の感覚の原型をとどめていてほしいということだな。
日本の最強ソフト群との公開7番勝負がみたい。 ここまで来るとAiが意識に目覚めるのも時間の問題に思えてきた。 >>75
PFNは日本屈指の天才集団の筈なんだがなぁ 名無し名人 2017/12/07 (木) 06:26:47
入玉なしルールはただの嘘、または誤読。
論文では、コンピュータ将棋の共通プロトコルであるusiプロトコルのオプションで、NoEnterKingを選択したと書いてある。
usi プロトコルに関する仕様は将棋所の作者がまとめているが、その中で入玉関連の記述は宣言法に関するものだけ。
つまり、usiプロトコルのオプションでいじれる入玉周りは宣言法を採用するか否かというところだけだ。
そういうことを知らない馬鹿が、NoEnteKingの文字列だけ見て「入玉なしの勝手な将棋を作った!」って馬鹿騒ぎしてるだけ。
これマジ?本当ならすごい恥ずかしいんだが・・・? 68 名前:名無し名人[sage] 投稿日:2017/12/07(木) 17:09:07.11 ID:rLdbVWQi [2/3]
論文さらっと読んだけど、「-900で投了だから終盤弱い」というのはデマだね
-900センチポーンが10手連続したら投了するのはhead-to-headの対局だけであって、レーティング測定用1秒対局では(おそらく)最後まで指している
Figure 1を見る限り、こちらもelmo+400程度のレーティングに収まっているので終盤も問題ないことが分かる
71 名前:名無し名人[sage] 投稿日:2017/12/07(木) 18:03:00.91 ID:jc5TEGQL [1/2]
Elo ratings were computed from evaluation
games between different players when given one second per move
1手1分だから強いとかも嘘だね
棋譜生成は
Unless otherwise specified, the training and search algorithm and parameters are identical to AlphaGo Zero
AlphaGo Zeroと全く同じ学習法使っていて
measure false positives, we disable resignation in 10% of self-play games and play until termination.
だから10%の対局は確実に終局までやってる 論文のハイライトは1ページ使って永遠と従来技術を説明したあと、最後に
None of the techniques described in this section are used by AlphaZero. ボナンザベースでそこそこやれるから
そこからいじりあいしてた連中と
零からやっちゃうグーグルの差が出たね 「えっ?」どういうこと?
ポナンザに1000連勝出来るの? 伊藤アルファ碁のとき思いっきり恥かいたのにまた突っかかっててワロタ
あいつグーグルに何の恨みがあるんだ >>145
アルファ碁あってのものでしょ
まぁソフト開発者はぶっ飛ばされたなー 日本のプログラマー達がプロ棋士を抜くまで約40年
ようやく勝ってドヤってたらハサビスとグーグルが24時間で抜いて行っちゃったか
なんというか諸行無常やね >>149
開発史と学習時間比べるのはいくらなんでも頓珍漢すぎる 開発者のやる気がマシマシでこれは良いことだ
使えないソフトより使えるソフトだ お前らさ、誰も真実を目撃していないのにぐーぐるの一方的な発信だけで信じちゃうの?
バカだろ 昔 プロ厨 ソフトは入玉に対応できない
今 ソフ厨 AlphaZeroは入玉に対応できない シンギュラリティは2045年くらいと聞いた
まだまだでしょ >>157
いやたぶん10年以内の可能性が高い
リンクは忘れちゃったけどこのdeepmindの論文漁ってると何かとんでもないことやってるよ
そもそもこのハサビスさん脳神経外学とかの方で博士とってる方で脳の思考のメカニズムの解明とか自然言語を理解するaiとか開発してるらしい
そもそも親会社のグーグルが人の作るAIよりも高い性能のAIをAI自身に作らせることに成功してる 親AIが生み出す自身より優秀な子AI
子AIが生み出す自身より優秀な孫AI
孫AIが生み出す自身より優秀な曾孫AI
曾孫AIが生み出す自身より優秀な玄孫AI
玄孫AIが生み出す自身より優秀な来孫AI
来孫AIが生み出す自身より優秀な昆孫AI
昆孫AIが生み出す自身より優秀な仍孫AI仍孫AIが生み出す自身より優秀な雲孫AI
………
雲孫AIは初手で投了した AI「こんなゲームのために全力で考えるのはやめた」 >将棋やチェスにも応用したAI「アルファゼロ」を開発した。
人工知能という言葉がウケがいいのは解るけど、精度の高い将棋電卓が出来ただけで本来こんなものは人工知能でもなんでもないただのbotなんだけどなあ。 将棋のルールだけ教えとけば勝手に学習していくという部分が重要なんで、
それで学習したAIが既存の人間が作ったAI棋士より強かったってこと
将棋なんかより、証券取引なんかのプログラム売買で大儲けできる可能性が高いという、とんでもない技術だよ
>>163
まったく見当ハズレ すでにelmoに99%勝つソフトがあるというのに
9割勝ちますと言われてドヤ顔されても困るだろ >>165
まあ定義の問題だけ将棋ソフトを人工知能というプログラマーはいないよ。
言語がパイソンってだけでそれ以上でもそれ以下でもない。
君の言う証券取引用人工知能という計算ソフトも人工知能だと思ってるプログラマーもいない。
人間より遥かに計算処理が速いから人工知能と勘違いしやすいと思うけどね。
>将棋のルールだけ教えとけば勝手に学習していく
まあどこかで聞きかじったんだろうけどそんな魔法はなくて人間が手作業でアルゴリズムを変更していかないと過学習になるよ。
キーボードに人間が入力する作業も人工知能だというなら人工知能なんだろうけど。 >>25
ルール考えるとおそらく、将棋は時間の制約がないと極めると勝敗がつかないゲームなのかと。
持ち駒打てる点で囲碁やチェスと違う。 これって論文誌じゃないの?
投稿されてすぐ掲載されてるし査読無しで載るやつ?前のはnatureなのになんでだ? >>166
専用と汎用で比べてて悲しくならないか?
コイツ囲碁もできるぞ
しかもプロ60人に全勝するmasterに圧勝するAlphago zeroを上回るレベルで
化け物だよ >>171
そりゃarXivだからプレプリントで査読なしだよ
今回の論文は碁でできたことだからチェスや将棋でも当然知識ゼロからできたよ
って程度の内容で技術改良そのものとしてはインパクトが大きくないからじゃない? ポーカーもバックギャモンもAIが勝つから
最終的にはじゃんけんですらAIに勝てなくなる >>174
じゃんけんは人間が勝てるわけない。
機械の反応速度で後出しされたら確実に負ける。 >>167
本当に分かってないのね
これはスクリプトじゃなくてディープラーニングによる自動学習AIだよ
あらゆるデータからロジックを自分(計算機)で構築していくの
決まったロジックをなぞるただのアプリケーション『プログラム』じゃない
AIの基礎も分かってないのな
AI同士で対戦して、評価関数のパラメータを精査して精度を上げていくんじゃなく
将棋のルールを元に評価関数に当たる部分(メソッド)を自分で考えて構築していく
この違いが分からんのじゃお話にならない 羽生さんってディープマインドの人とテレビで対談してなかった? >>166
そのまふ定跡?ってのを使った勝率は、一方だけが有利な定跡で優位を築いた上での勝率なんじゃないの?
それって棋力を測る数値にはならなくない? グーグル「日本の頭の悪いプログラマーさんたち、無駄な努力ご苦労様。
αβ法?プププ」 1手10秒でも、1分で6手、20分で120手(1局)なんだから、
24時間では72局しか指せないわけで、そんなサンプル数では
絶 対 に イチから学習して強くすることなどできないのは明らか
十分なサンプルを収集するために膨大な対局を同時並行で行っているのは
間違いないわけで、長い時間をかけるか莫大な予算で膨大な数をそろえて
やるかの違いだけで、やってることは「力業」でしかないよ 2時間エルモと対局?2時間自己対局したあとにエルモと対局?
自己対局でぶん回してたらいくらでも強くなりそう アルファ碁の時は72時間でたしか480万局の自己対局だったかな >>173
なんか行き掛けの駄賃に面白半分に蹴り殺された感が半端ないな シンギュラリティなんてきてもゴミはゴミのままなんだよなぁ…… 全盛期の羽生=世界一と言われたころの亀仙人
elmo=ピッコロ大魔王
アルファ将棋=ラディッツ これは他の開発者泣くな
企業が本気出したらゴミのようだ >>188
ゴミはゴミなのは全然構わない
問題なのは沢山の価値あったものが等しくゴミになる
この件で言えばソフト開発者、ソフト研究者
自分のことだから身にしみる >>191
知ったような口ぶりでシンギュラリティだの騒いでる奴が気になるのか?
そういう奴らは今の自分がろくでもなくて成功者とかが羨ましいんやで。君らみたいなやつが羨ましいんやで。だから価値がないなんて言って貶める。自分と同じとこまで引きずり下ろしたいという願望なんやで。北のミサイルで日本終わんねぇかなみたいなんと同じや。 グーグルなんか、しょせん成功してるサービスは
ほとんどあとから買収したもので、結局のところは
巨大資本を集積し投資するということに強みがあるだけ
あれだけエリートをかき集めても、だめなんだな、不思議
天才のアイデアは外部に現れてそれを買収することの繰り返し 今の将棋ソフトなんて全部ボナンザ亜種みたいなもんだからな
評価値も似通っててソフト同士がゴミ棋譜しかできないのはそれが原因 羽生vsグーグルが実現するとしてドワンゴ主催じゃだめだろ ■ このスレッドは過去ログ倉庫に格納されています