0172名無しさん@そうだ選挙に行こう! Go to vote! (ワッチョイ 555d-0GSP)2017/10/22(日) 10:22:47.54ID:SUsvIwrb0 神「引き分けにしかならないゲームで何熱くなってんの」 0173名無しさん@そうだ選挙に行こう! Go to vote! (ワッチョイ 7abd-GnHq)2017/10/22(日) 10:27:33.37ID:a0aSdsOY0 最善手が引き分けになるのはそれ以外よりはるかにハードルが高い ゲーム木を考えたらワカル 0174名無しさん@そうだ選挙に行こう! Go to vote! (ワッチョイ f9d2-2TS2)2017/10/22(日) 10:35:40.12ID:3Iw9dTp40 >161 機械学習なんて将棋じゃ実用化される前の話じゃろ AI将棋や激指が全盛期の頃、手作業で一生懸命将棋の知識をプログラミング してた前提で 0175名無しさん@そうだ選挙に行こう! Go to vote! (ワッチョイ cdee-jbpI)2017/10/22(日) 10:55:01.22ID:A9DzEqCb0 コンピューター将棋のスレなのに何言ってんだろ。 アルファ碁より先に自己学習でルールの変更に対応できる仕組みで開発者達は開発してるじゃん。 今のソフトがプロの棋譜学習してるとか何を根拠に言ってんだ? 0176名無しさん@そうだ選挙に行こう! Go to vote! (ワッチョイ a523-2TS2)2017/10/22(日) 12:17:23.18ID:mwD/dHVE0>>171 このスレに居るのになんで知らんのか分からんけど数ヶ月前にやねが自己対戦以外の棋譜なしでelmoの棋力にするのに成功してるからその手法使えばすでに出来るぞ 0177名無しさん@そうだ選挙に行こう! Go to vote! (オッペケ Sr85-o9zC)2017/10/22(日) 12:32:12.35ID:cM0ei77qr わかりきった、終わった議論を今更… 0178名無しさん@そうだ選挙に行こう! Go to vote! (ワッチョイ 3d2c-KJ5N)2017/10/22(日) 12:48:04.28ID:z2R0xkpW0 グーグル信者は囲碁も将棋もろくに知らないでただ絶賛してスレ荒らしたいだけなんだからスルーしろよ 0179名無しさん@そうだ選挙に行こう! Go to vote! (ワッチョイ 7abd-GnHq)2017/10/22(日) 13:07:43.19ID:a0aSdsOY0 勝てないのでは知っているうちに入らないのでは… 0180名無しさん@そうだ選挙に行こう! Go to vote! (ワッチョイ e5b3-0GSP)2017/10/22(日) 13:44:58.59ID:qRPtoAzx0 4月7日 AlphaGo Zeroの初稿 natureへ投稿 5月23日 AlphaGO vs カケツ戦 (AlphaGoが人間の棋譜を使わず強くなったという噂) 6月12日 やねうら王ホームページで「人間の棋譜を用いずに評価関数の学習に成功」報告 10月18日 AlphaGo Zeroの論文 出版
なので、時系列的にやねうら王よりもAlphaGo Zeroの方が先んじているというのが本当 0181名無しさん@そうだ選挙に行こう! Go to vote! (ワッチョイ 5acd-VxFi)2017/10/22(日) 14:15:42.95ID:38Va+BSp0 いや、やねうら王の方法は重要な特徴量である駒割りをスタート時点から使っていて その駒割りは人間の棋譜を元に得られたものだから 残念ながら「人間の棋譜を用いずに評価関数の学習に成功」とは厳密には言えない AlphaGo Zeroとは別物 駒割り0の状態から学習スタートしてAlphaGO Zeroより早く公開していたなら 文句無しで凄い成果だった 0182名無しさん@そうだ選挙に行こう! Go to vote! (スプッッ Sd7a-PPE6)2017/10/22(日) 14:26:23.02ID:uvfumT+rd 全盛期羽生=今の井山だとすると 井山が一度も勝たせてもらえない相手がカケツ。 そのカケツがAlphaGo Zeroに4子(将棋だと飛車落ち?)でフルボッコ喰らうレベル。 0183名無しさん@そうだ選挙に行こう! Go to vote! (ワッチョイ 8e58-OFe0)2017/10/22(日) 15:25:11.72ID:o0Xy+mfH0>>181 駒割りは人間の棋譜なしにそれらしい値に収束させるのは先行研究で示されてたからそこは重要ではない あとあの駒割りは棋譜から得られたものではなくApery平岡さん(アマ三段前後の棋力)による手入力のものが元になっているはず(手入力だとしても人間の知識をベースに作られてることは間違いないが) 0184名無しさん@そうだ選挙に行こう! Go to vote! (ワッチョイ a17e-wYkv)2017/10/22(日) 15:34:22.92ID:aaItEy7C0 bonanza1=奨励会レベルの強さから学習させてるのすら分からずに やねうら王が前からやってたとか言うのは痛すぎる 0185名無しさん@そうだ選挙に行こう! Go to vote! (ワッチョイ 7a23-bcII)2017/10/22(日) 18:10:12.72ID:ZlyDlPKp0>>181 やねうら王の学習ルーチンが公開された直後の 有志の評価関数育成実験報告の中に 駒割りすらもゼロから学習させて成功したというのがあったな 0186名無しさん@そうだ選挙に行こう! Go to vote! (ワッチョイ a17e-wYkv)2017/10/22(日) 18:49:40.57ID:aaItEy7C0 駒割りゼロは嘘 駒割り100からの学習 ゼロならランダムに近いけど100なら駒を取ると得なのは理解してる
まあ学習は1日以下の差だろうけど ランダム評価関数を実際に試した感じだと 0187名無しさん@そうだ選挙に行こう! Go to vote! (ササクッテロリ Sp85-NTwv)2017/10/22(日) 18:50:50.55ID:dsHkgZ9vp 人間の棋譜を一切使わずに数日で人間最強をはるかに上回るソフトを作ることが出来たとしたら 今まで人類が築き上げてきた将棋文化の完全否定となる 将棋のルールができて、人類が何十年、何百年もかけて作ってきたものを数日で超えてしまう 0188名無しさん@そうだ選挙に行こう! Go to vote! (ワッチョイ 9d9f-hanu)2017/10/22(日) 18:57:33.98ID:lfEYZ+lG0 その将棋というゲームのルールを作ったのは人間じゃないの? 0189名無しさん@そうだ選挙に行こう! Go to vote! (ワッチョイ a17e-wYkv)2017/10/22(日) 19:00:47.37ID:aaItEy7C0 数か月前やったランダム評価関数の実験は やねうら王だとうまく行かなかったから elmo_for_learn使った 0190名無しさん@そうだ選挙に行こう! Go to vote! (アウアウウー Sa89-3dVe)2017/10/22(日) 19:17:38.98ID:E8t9snvda そもそも探索部に駒取りは先に読むとか、色々な将棋的な決め打ちがあるけどそれは良いのか? 0191名無しさん@そうだ選挙に行こう! Go to vote! (ワッチョイ fa7c-iA1h)2017/10/22(日) 19:44:10.54ID:3u7sKryA0 まあそれよりはponanza chainerの二歩を教えなくても勝手に学習したの方がインパクトあるな 0192名無しさん@そうだ選挙に行こう! Go to vote! (ワッチョイ a17e-wYkv)2017/10/22(日) 19:45:12.93ID:aaItEy7C0 @issei_y 6月2日 結局探索部分を人間が書いていることこそが 強さのボトルネックなんだろうな。
Zero "we chose to use the simplest possible search algorithm" the MCTS is not augmented by any other heuristics or domain-specific rules.