▲コンピュータ将棋スレッド128
■ このスレッドは過去ログ倉庫に格納されています
第2世代TPUを64個使ったとあるから180TFLOPS*64=11.5PFLOPS
NVIDIAのVoltaが1個で120TFLOPSだからその96倍
つまり1個のGPUでも数百時間でできる
110年は大ウソ
今後ゲームの知識を入れると大幅に時間も短縮できるだろう >>639
探索はやねうらおう4,73だから実際選手権版とも違うはず >>632
その視点だとponanza(山本×下山×さくら×PFN)対elmo(個人)の時点でもかなりインパクトはあったからな これを受けて開発やめる人はさすがにいないか
棋譜が公開されたり対局環境ができればまた変わってくるかな
正直今はただの机上の空論でしかないし 90TOPSのTPU 5000個 2時間でelmo超えてるから
V100を50個7日(200時間)使えばelmo超えられる
AWSスポットで100万ぐらいだな どんな棋譜なんだろうな
初手はなんなのか
人間のどんな定跡を使うのか、使わないのか
どんなふうに囲うのか、または囲わないのか
単純に知りたいものだ 第一世代TPU5000台で24時間学習とかいくつか設定が違うのがあるのは別々に学習してるのか? >>647
これは案外、今のソフトと大差ないと予想している >>651
矢倉がないってことは5手目77銀矢倉が不成立って言うんだろ。流石に無理じゃないかなー。 18号の作者の言う通り、やねうら王探索は序中盤枝狩りがキツすぎるのと
先手は攻め急ぎすぎ、後手は受けすぎな傾向あるからDLだと、もっとバランス良く指すのかな。 4TPU対64CPUとかだと、まだいい勝負してるけど
Figure 2がそのまま伸びるとして
MCTSはクラスタでも普通にスケールするから
クラスタではもっと差が出るな TPUだなんだって大掛かりなことしてる割に大したことないよな。
汎用性とかどうでもいいから跳び抜けて強いの作って欲しい。 F時間による延びについてはelmo+Yaneuraou側はもうちょっとまともにTT確保すれば改善されたりしないんだろうか 今の状態でプロと指させるのが、
勝ち逃げできる可能性がある妙手じゃね? ようわからんけどAlphaZeroまだ伸びしろがあるとみていいの? でも、そういえば、今のPonanzaはディープラーニング使っているから、
AlphaZeroはPonanzaと同程度という見方もできるわけ? 強さを測る相手が強くないとレートを測れないから分からんね
将棋特化させれば効率は良くなるだろうけど >>660
論文中のグラフみる限りむしろ延びしろは少なそうに思う アルファの伸びしろがないのか将棋というゲームの天井が近いのか >>664
やねが4600言ってたけど
今でも引き分けになるのが遠いから1万超えることもあり得るで アルファ碁マシンパワーでゴリ押しだだけで、sdt仕様だとエルモマイナス200程度という情報もあるがどうなのだろうか? elmoと互角まで2時間、elmoに9割まで12時間
SF8と互角まで4時間、SF8に9割(引き分け除き)まで9時間
棋譜生成 5000 TPU
学習 64 TPUv2 今までコンピューターソフトがヒールの立場だったけど、グーグルの登場でベビーフェイスになりそうだな、グーグルはヒールで もしwscsでponanzaが勝ってたらこんなふうにgoogleが取り上げることもなかったのかなあ
別にponanzaは何も悪くないけど、そんなことも思ってしまう 4600の根拠がなんだかわからんけどもしそれが本当なら
アルファは将棋の天井に手を伸ばせば触れられるとこまで来てることになる 将棋にこれだけ金かけてくれたGoogleには感謝だな
日本の会社でもGoogle程じゃなくても投資してくれる会社があればなぁ あ、表の見方の間違えてた
対SF8は28勝0敗72分だ
チェスの方がやばいな カドカワが数年間のニコニコ独占使用と引き換えに金だせばいいのに チェスは引き分けが多いけど
将棋の場合どうなるか
AlphaZero vs AlphaZero見てみたいね
それと
AlphaZero vs Aperypaqどうなるか気になる >>670
"優勝ソフト(≒最強)が公開されてる"っていうのも大きかったかもしれないね 一成さんが反応してるけど、googleが将棋を扱ってくれたのは、オープンソースだからっていうのも皮肉だね elmoじゃなくてHeiseiShogiGassenPonpokoだったら面白かったのに
YaneuraOuでも笑えただけに残念 良く分からんけど
赤ちゃん状態から1日程度学習してponaレベル
みたいな話? World computer shogi championship
という名前が有能だったw >>674
でもグラフ見るとstockfishのレートと張り付いてるんだよね
あの対局結果なんか間違ってるような気がする 結果を出したのは凄いけど
COM将棋のようなR換算ができるもので
ponaは正直運が良かった部分が大きいと思うよ
今のオープンソース化作った平岡さん他
やねうら王の凄さを証明した滝沢さん(elmo)の
elmo絞りの革命と今でもキメラでの優秀性は
pona以上だと思うけどね なんつーか論文の査読ってやっぱ大事だな
疑問点が多すぎるわ 900点は低過ぎる。
入玉は余裕であり得る評価でしょこれ。 よく言われるけど
「これが凄いだろ」と
「この部分の駄目な部分も立証してます」的な
反証がなければ認めてもらえないからね 論文は基本都合が悪いデータ隠すからな
評価値900で打ち切りとかまず間違いなく終盤が全然強くなれなかったと思って良い ただ投了値900点という設定だとたいていの場合入玉模様になるとどっちかに振れるから打ち切られてしまうと思うんだよね チェスなら入玉とかあり得ないからそれで良いんだが。
入玉という状態を開発者が理解してないのかも? >>633
何年もしこしこ将棋のプログラム改良してたら、
googleの開発した碁とチェスと将棋全部学習できる汎用プログラムに一瞬で追い抜かれたとか
お釈迦様の手のひらの上で踊らされてた孫悟空みたいだね no opening book, no endgame database, no heuristics, no nothing! full paper coming soon,
will have things like early games.
https://twitter.com/demishassabis/status/938347604462542849 >>684
引き分けは0.5勝だから64勝36敗換算になって、100 elo程度の差になっちゃう
グラフでもそれぐらいの差 既存のソフトが強いから色々とチェス勢の突っ込みも激しいな
日本人も頑張れ 入玉とか投了値よりもなにより棋譜出さないのはおかしいって誰か突っ込んで欲しいよな 電王トーナメント基準だとelmoにR-200くらいみたいね。 推定で
やはりマシンスペックは正義 >>693
チェスと違って終盤データベースが使えない将棋
これでelmoに勝ったと言われても困るなあ AlphaGoの公開対局は良かったよな
データだけじゃ認めない奴が出てくるし、あのやり方は素晴らしかった
将棋もタイトルホルダーと公開対局すれば良いのでは なんで駒が消えるチェスより将棋の方が早く追い付かれるん? >>701
対戦相手がelmo & 評価値900打ち切り >>701
難しいゲームのほうが既存のソフトが未熟なのよ >>633
盤面とかルール部分は作りこまなきゃならないけど、ツリーサーチ部と
評価関数は共通で使える。
オーダリングとか絞り込みをポリシーネットに委ねているから汎用性が
高くなるんだよね。
とはいえ、詰み処理をどうしているのかは知りたい。
そこだけ別マシンでmin-Maxを動かしているのではないかと。 Masterとの60番勝負の将棋版をやってほしいなあ
単純に見たいだけだけど >>705
将棋プロは逃げまくって勝負しないから無理 平岡さんの最新エンジン+クジラちゃんクラスタ+ショットガン監修の定跡VS alphagozero 増田千田とかあの辺りはalphazeroとネット対戦できたら好んでやりそうだが
井山みたいに羽生が挑むのは想像つかんなってかないだろうな uuunuuun氏のレート表見る限り手を伸ばせば届きそう このスレでもいる何より何%勝ったより棋譜が大事なのがよくわかる 詳細な論文いつ出るんやろ
速報なんか出してんじゃねえよ全部書いてから出せって感じだわ待ちきれん DeepMind社に上手くアポ取れる人材が連盟にいれば、囲碁のMasterがやっていたみたいなことが将棋倶楽部24で実現する可能性もあるけど、
果たしてそういう人材が連盟にいるかどうか…… googleが将棋ソフト作ればレーティング5000は余裕かと思ってたよ。
夢のない結果だ。 有効手数が減らないゲーム、将棋、完全解析までまだ先なのか…遥か遠き最善手(オールコンプリート) >>698
ただ1080ti一台だと囲碁でさえ人間トップに勝てるかどうか怪しいんだよな
それくらいDLは計算資源大喰らい
>>699
この内容はむしろチェスでよくstockfish相手にやれてるって感じでは?
エンドゲームDB使ってないんだから 900差の棋譜ではまだどっちが勝つかわからない局面だね
将棋は終盤に逆転が起きるゲームだから終盤術にも長けていることがわからないと信用できないな 900差って何%ぐらいの勝率なんだったっけ?
AlphaZeroの論文では5%って書いてあるけど 入玉なしってのはelmoが入玉しだしたらalphazero側が不利であっても「はい無勝負」って打ち切るんだよな?
elmoは結構入玉好きだからそういう無勝負がどれくらいあったのかってのも知りたいわ 2割って書いてあるのをツイッターで見た
本当かどうかは知らない >>720
だとするとチェスでは900センチポーン離れていたら95%で勝てるけど、将棋では80%ぐらいだということだね twitter.com/issei_y/status/589642166818877440 5000TPUを12時間と
GTX1080Ti、110年くらい
って本当?ymg_aqさん以外指摘してないけど(山本さんに至っては続けていれば何とかなって手みたいな書き方だし)
如何にいっても差がありすぎないか?
ここまで差があると、山本さんにしても続けていたからといっても意味が無くない? >>719
そんな単純な動作で打ち切れるのかなあ
優勢の局面で中段玉なったから打ち切ってしまうとかありそう
USIオプションで宣言勝ちしない程度じゃないかな でも今のPonanzaってディープラーニングだから、同じ手法で同程度の強さまですでにたどり着いているという見方もできない? elmoやAperyなんかもそうだけど最近のfloodgateの棋譜を見ると入玉率が異常に高いんだよな.
入玉の上手さ下手さがレーティングに結構な割合で影響するレベルじゃないのかって想像してるんだけど 侵略者グーグルに立ち向かうのは将棋星人羽生さんしか居ない 同程度は盛りすぎかな?でも、圧倒的な差ではないよね
WCSC27のPonanzaはelmoに7割ぐらい勝つんだったっけ? まぁチェスのついででしかないから設定とかもガバガバなんだろうね。
結果として将棋じゃなくて将棋に似た何か >>730
やってみるしかないが。
根拠はないものの、結果は圧倒的な差になる気がする。 >>732
たぶんポナは強化に使えた時間とお金が足りてないからあの程度だった プログラミング技術はPFNの方が圧倒的だよ。
金と時間の問題でああいう結果になったけど floodgateに来れば明確だけどCGOSも来ないからだめだろうな チェスは100戦やって無敗だから満足だろうけど、将棋は8敗したから満足してないと思う
将棋の専門家がdeepmindにいればな 意外とGoogleもしょぼい、というかdlが将棋に向かないというだけか。
透。の持ってる最強関数をXeonで回して多分互角以上だろうね。 >>723
それはponanza の仮定だが、elmoも同じ仮定で学習してるので同じやね。 ■ このスレッドは過去ログ倉庫に格納されています