▲コンピュータ将棋スレッド128
■ このスレッドは過去ログ倉庫に格納されています
ついに山本も反応したな
まだコンピュータ将棋に未練はありそう 下山さんは無反応。というか反応したら逆に驚くタイプだな akiさんはそもそもTwitter見てない可能性大 山本はこれからもこんな感じで引退したけどコンピュータ将棋の新しい話題には反応するタイプになるのかな
ボンクラの伊藤氏みたいに >>597
オセロは20年前の評価関数サイズ数十MBとかで止まってるから
従来手法のパターン数を増やすだけでも強くなる余地が十分残ってる
けどやってもしょうがないから誰もやってない >>580
答えは単純で、
大局観で詰め将棋は解けないから。 AlphaZero君の好きな戦型はなんなのかな?気になるね とりあえず次の将棋ソフトの目標ラインは
elmoに勝率91%だね
それ未満だと優勝ソフトだとしても煽られる悲しさ グーグルはケチだから公開はないだろ
AlphaGoも非公開だし 上位勢はレートの検証方法に疑問はあるようだけれど、概ねalphazeroに好意的だね
ずっと目標にしていたponanzaが引退して張り合いがなくなりかけていたから嬉しいだろうな
そして、もしWCSC28に出てくるならそれはもう大騒ぎになるだろう
空前前後の盛り上がりだろうな 連合組んで計算資源を確保して天下のgoogleをボコボコにして欲しいわ >>607
アンチまふ定跡戦略を学んだだけだったりして。 特に平岡さんのやる気が凄いね
彼女にフラれたのか知らんがこっちとしては開発に力を入れてくれた方がいいわ >>613
あ、elmoとの対戦棋譜は学習してないからそれはないか。 >>591
そうなのかも。
せめて2000点を閾値にして欲しかった。 とりあえずニコニコの佐藤映像に煽りPV作って貰おうか 将棋はなかなか国際色が出せなかったからグーグルを引きずり出せ 取り敢えず圧倒的成長を遂げていく可能性のあるGoogleをあまり本気にさせない方針で勝利の称号だけ手に入れましょうか。 ルールの整備もちゃんと出来てないような将棋世界選手権なぞに
Googleが出場しませんよ 将棋は駒が漢字だからさ、今更アジア圏以外には広く受け入れられないんじゃないかな… floodgateには来そうじゃない?
平岡さんがTwitterでURL載せて誘っている >>623
終局まで指したら弱いことがバレるから来ないだろ いやー来ないんじゃないか?
aperypaqがelmoに8割だし、これで全然勝ち越せなかったら赤っ恥晒すことになるし ただまあ、上に行くようになったらつまらなくなるのがチェスであり、さらに面白くなるのが将棋であり、そもそも前提の達成が難しいのが囲碁…
この中じゃあ、実は一番指してる時の幸福度が高かったりするのかもな グーグルが将棋に人的リソースを使う理由はないんだよ
評価値(+2000とか)だけで勝敗を決定するとか特殊ルールなら
のってくる可能性がないことはないけど 外国人向けのネット将棋なら王がKでもいいんだがな
ネットでしか指さない人がほとんどだろうし でもこのまま何もしないで「三部門で世界最強になりました」とか言われても微妙じゃない?
それこそガチ勢から不平不満が出るのは必然 >>618
しかも両者FMでその取材の時対局して1勝1敗 逆に個人的な開発でAlphaZeroに迫っているソフトすげーとか
計算資源的に学習効率たけーとかにはならんだろうか >>632
今回は応用効くのがポイントだから
チェスと将棋と囲碁を同時攻略出来るソフトバンクなんて前代未聞でしょ AlphaGo Zeroは2.5万トレーニングステップごとに1個前のネットと400局やって勝率55%のネットを棋譜生成に採用していたけど
それすらやめた、学習してるネットを直で棋譜作成に使ってる
Self-play games are generated by using the latest parameters for this neural network 2.5万トレーニングステップじゃなくて1000ステップだった あくまでも選手権版elmoより強くなったというのでしょう?
今のaperyとやらせてみないと 第2世代TPUを64個使ったとあるから180TFLOPS*64=11.5PFLOPS
NVIDIAのVoltaが1個で120TFLOPSだからその96倍
つまり1個のGPUでも数百時間でできる
110年は大ウソ
今後ゲームの知識を入れると大幅に時間も短縮できるだろう >>639
探索はやねうらおう4,73だから実際選手権版とも違うはず >>632
その視点だとponanza(山本×下山×さくら×PFN)対elmo(個人)の時点でもかなりインパクトはあったからな これを受けて開発やめる人はさすがにいないか
棋譜が公開されたり対局環境ができればまた変わってくるかな
正直今はただの机上の空論でしかないし 90TOPSのTPU 5000個 2時間でelmo超えてるから
V100を50個7日(200時間)使えばelmo超えられる
AWSスポットで100万ぐらいだな どんな棋譜なんだろうな
初手はなんなのか
人間のどんな定跡を使うのか、使わないのか
どんなふうに囲うのか、または囲わないのか
単純に知りたいものだ 第一世代TPU5000台で24時間学習とかいくつか設定が違うのがあるのは別々に学習してるのか? >>647
これは案外、今のソフトと大差ないと予想している >>651
矢倉がないってことは5手目77銀矢倉が不成立って言うんだろ。流石に無理じゃないかなー。 18号の作者の言う通り、やねうら王探索は序中盤枝狩りがキツすぎるのと
先手は攻め急ぎすぎ、後手は受けすぎな傾向あるからDLだと、もっとバランス良く指すのかな。 4TPU対64CPUとかだと、まだいい勝負してるけど
Figure 2がそのまま伸びるとして
MCTSはクラスタでも普通にスケールするから
クラスタではもっと差が出るな TPUだなんだって大掛かりなことしてる割に大したことないよな。
汎用性とかどうでもいいから跳び抜けて強いの作って欲しい。 F時間による延びについてはelmo+Yaneuraou側はもうちょっとまともにTT確保すれば改善されたりしないんだろうか 今の状態でプロと指させるのが、
勝ち逃げできる可能性がある妙手じゃね? ようわからんけどAlphaZeroまだ伸びしろがあるとみていいの? でも、そういえば、今のPonanzaはディープラーニング使っているから、
AlphaZeroはPonanzaと同程度という見方もできるわけ? 強さを測る相手が強くないとレートを測れないから分からんね
将棋特化させれば効率は良くなるだろうけど >>660
論文中のグラフみる限りむしろ延びしろは少なそうに思う アルファの伸びしろがないのか将棋というゲームの天井が近いのか >>664
やねが4600言ってたけど
今でも引き分けになるのが遠いから1万超えることもあり得るで アルファ碁マシンパワーでゴリ押しだだけで、sdt仕様だとエルモマイナス200程度という情報もあるがどうなのだろうか? elmoと互角まで2時間、elmoに9割まで12時間
SF8と互角まで4時間、SF8に9割(引き分け除き)まで9時間
棋譜生成 5000 TPU
学習 64 TPUv2 今までコンピューターソフトがヒールの立場だったけど、グーグルの登場でベビーフェイスになりそうだな、グーグルはヒールで もしwscsでponanzaが勝ってたらこんなふうにgoogleが取り上げることもなかったのかなあ
別にponanzaは何も悪くないけど、そんなことも思ってしまう 4600の根拠がなんだかわからんけどもしそれが本当なら
アルファは将棋の天井に手を伸ばせば触れられるとこまで来てることになる 将棋にこれだけ金かけてくれたGoogleには感謝だな
日本の会社でもGoogle程じゃなくても投資してくれる会社があればなぁ あ、表の見方の間違えてた
対SF8は28勝0敗72分だ
チェスの方がやばいな カドカワが数年間のニコニコ独占使用と引き換えに金だせばいいのに チェスは引き分けが多いけど
将棋の場合どうなるか
AlphaZero vs AlphaZero見てみたいね
それと
AlphaZero vs Aperypaqどうなるか気になる >>670
"優勝ソフト(≒最強)が公開されてる"っていうのも大きかったかもしれないね 一成さんが反応してるけど、googleが将棋を扱ってくれたのは、オープンソースだからっていうのも皮肉だね elmoじゃなくてHeiseiShogiGassenPonpokoだったら面白かったのに
YaneuraOuでも笑えただけに残念 良く分からんけど
赤ちゃん状態から1日程度学習してponaレベル
みたいな話? World computer shogi championship
という名前が有能だったw >>674
でもグラフ見るとstockfishのレートと張り付いてるんだよね
あの対局結果なんか間違ってるような気がする 結果を出したのは凄いけど
COM将棋のようなR換算ができるもので
ponaは正直運が良かった部分が大きいと思うよ
今のオープンソース化作った平岡さん他
やねうら王の凄さを証明した滝沢さん(elmo)の
elmo絞りの革命と今でもキメラでの優秀性は
pona以上だと思うけどね なんつーか論文の査読ってやっぱ大事だな
疑問点が多すぎるわ 900点は低過ぎる。
入玉は余裕であり得る評価でしょこれ。 よく言われるけど
「これが凄いだろ」と
「この部分の駄目な部分も立証してます」的な
反証がなければ認めてもらえないからね 論文は基本都合が悪いデータ隠すからな
評価値900で打ち切りとかまず間違いなく終盤が全然強くなれなかったと思って良い ただ投了値900点という設定だとたいていの場合入玉模様になるとどっちかに振れるから打ち切られてしまうと思うんだよね チェスなら入玉とかあり得ないからそれで良いんだが。
入玉という状態を開発者が理解してないのかも? >>633
何年もしこしこ将棋のプログラム改良してたら、
googleの開発した碁とチェスと将棋全部学習できる汎用プログラムに一瞬で追い抜かれたとか
お釈迦様の手のひらの上で踊らされてた孫悟空みたいだね no opening book, no endgame database, no heuristics, no nothing! full paper coming soon,
will have things like early games.
https://twitter.com/demishassabis/status/938347604462542849 ■ このスレッドは過去ログ倉庫に格納されています