▲コンピュータ将棋スレッド128
■ このスレッドは過去ログ倉庫に格納されています
ランダムから強くなること示すために無駄に時間かけてるけど
elmoとかから作った棋譜使えば遥かに早くこのレベルの強さになる 強い将棋ソフトを作るのが目的じゃなくて
アルファのエンジンは簡単にいろんなもんに転用できるという宣伝だから
これ以上煮詰めないんじゃなかろうか 1080Tiを110年分使って学習させて序盤から中盤にかけてならelmoに勝率9割は
まあそうですか。って印象だわな。
詰みまでさして入玉ありだと勝率落ちるだろうし まあすごさはわかった、でも普段使いできないしそもそも将棋に興味無さそうだしでなんだかなあ やねさんに早くアップデートしてもらって最新やねうら王+aperypaqで対局してほしい >>561
宣言勝ちをなしにして評価値と手数(と千日手)で終局させているという意味だろう
だれだよ入玉なしの別のゲームと騒いでいるやつは google先生なら3駒関係の限界を極められそう。
3駒関係はともかく、なんだかんだ言って囲碁にはけっこう関わってくれてるから、
将棋やチェスでももうすこし貢献してくれるんじゃなかろうかとちょっと期待 >>569
どちらも単位はposition/sec
AlphaZeroは評価スピードが遅い
評価スピード遅いから終盤の信頼度ってどうなのよって話 >>564
勝率9割ってのがまた微妙で、
電王戦Finalのselene vs 永瀬ぐらいの差でしかないからなぁ そもそもなんで極東のゲーム
天下のGoogle様がやってるわけ? googleが言いたい事を一言で表すと
「stockfish雑っ魚w」「elmo雑っ魚w」という事だな
将棋やチェス云々というより
チェス系はディープラーニング向かないもか言ってた
一部の開発者を結果でぶん殴った形 >>567
すまん、自分で書いててこれ変かもと思った
よりスマートで一般人にわかりやすい表現ないかね
あと、DeepLearningを使って強くしたAlphaZeroではあるが、
当然のように「終盤弱い(だから-900でresign設定にしている)」を真であるかのように喋ってる人たちはなんなのだろう
支えられている根拠があまりにも薄くないかい? レートの上がり具合見ると碁とかと比べて相対的にDL向かないってのも事実じゃないかな 今やってるコンピュータチェスの世界一決定戦のTCECの雰囲気がどうなってることやら。。 googleとかDLとか三駒とか関係なく結局のとこ計算資源次第、結局金なんだよな 自分たちのalphago zeroの宣伝のための論文なんだし
徐々に投了値を下げていって-900でelmoに投了させるのが一番勝率が高くなったと考えるのが自然。 >>578
自分たちのアルゴリズムの汎用性を証明するため。将棋に興味あるわけではない >>571
そこらへんはalphago zeroも1台のPCだと学習に1200年かかるししょうがないかと dlshogi触ったことあるなら分けるけど
詰み探索オフに設定すると全駒しに行く、AlphaZeroも多分そうなる
詰み探索入れればいいだけだが 評価関数の精度は恐らく最強なので既存の探索と組み合わせるためにもなんとか公開してほしいもんだ
人類のためにもとか誰か説得してくれw 既存の探索と組み合わせるのは無理。
無理やり組み合わせても悲惨なものができる。 既存のものと組み合わせて強くなったSDT5のポナ方式の方が現実的 −900っていうのはチェスのトーナメントのresign条件に将棋も合わせただけでしょ
チェスが900だから将棋もそれでいいかってぐらいの
だいたい900の将棋の局面見てもそれが終盤なのか中盤なのかちんぷんかんなんだから とりあえず、棋譜を見てみないことには何もわからないな たぶんAlphaZeroのソースにはやねうら王がごっそり入っているのだろう
こういうところにも貢献しているな ついに山本も反応したな
まだコンピュータ将棋に未練はありそう 下山さんは無反応。というか反応したら逆に驚くタイプだな akiさんはそもそもTwitter見てない可能性大 山本はこれからもこんな感じで引退したけどコンピュータ将棋の新しい話題には反応するタイプになるのかな
ボンクラの伊藤氏みたいに >>597
オセロは20年前の評価関数サイズ数十MBとかで止まってるから
従来手法のパターン数を増やすだけでも強くなる余地が十分残ってる
けどやってもしょうがないから誰もやってない >>580
答えは単純で、
大局観で詰め将棋は解けないから。 AlphaZero君の好きな戦型はなんなのかな?気になるね とりあえず次の将棋ソフトの目標ラインは
elmoに勝率91%だね
それ未満だと優勝ソフトだとしても煽られる悲しさ グーグルはケチだから公開はないだろ
AlphaGoも非公開だし 上位勢はレートの検証方法に疑問はあるようだけれど、概ねalphazeroに好意的だね
ずっと目標にしていたponanzaが引退して張り合いがなくなりかけていたから嬉しいだろうな
そして、もしWCSC28に出てくるならそれはもう大騒ぎになるだろう
空前前後の盛り上がりだろうな 連合組んで計算資源を確保して天下のgoogleをボコボコにして欲しいわ >>607
アンチまふ定跡戦略を学んだだけだったりして。 特に平岡さんのやる気が凄いね
彼女にフラれたのか知らんがこっちとしては開発に力を入れてくれた方がいいわ >>613
あ、elmoとの対戦棋譜は学習してないからそれはないか。 >>591
そうなのかも。
せめて2000点を閾値にして欲しかった。 とりあえずニコニコの佐藤映像に煽りPV作って貰おうか 将棋はなかなか国際色が出せなかったからグーグルを引きずり出せ 取り敢えず圧倒的成長を遂げていく可能性のあるGoogleをあまり本気にさせない方針で勝利の称号だけ手に入れましょうか。 ルールの整備もちゃんと出来てないような将棋世界選手権なぞに
Googleが出場しませんよ 将棋は駒が漢字だからさ、今更アジア圏以外には広く受け入れられないんじゃないかな… floodgateには来そうじゃない?
平岡さんがTwitterでURL載せて誘っている >>623
終局まで指したら弱いことがバレるから来ないだろ いやー来ないんじゃないか?
aperypaqがelmoに8割だし、これで全然勝ち越せなかったら赤っ恥晒すことになるし ただまあ、上に行くようになったらつまらなくなるのがチェスであり、さらに面白くなるのが将棋であり、そもそも前提の達成が難しいのが囲碁…
この中じゃあ、実は一番指してる時の幸福度が高かったりするのかもな グーグルが将棋に人的リソースを使う理由はないんだよ
評価値(+2000とか)だけで勝敗を決定するとか特殊ルールなら
のってくる可能性がないことはないけど 外国人向けのネット将棋なら王がKでもいいんだがな
ネットでしか指さない人がほとんどだろうし でもこのまま何もしないで「三部門で世界最強になりました」とか言われても微妙じゃない?
それこそガチ勢から不平不満が出るのは必然 >>618
しかも両者FMでその取材の時対局して1勝1敗 逆に個人的な開発でAlphaZeroに迫っているソフトすげーとか
計算資源的に学習効率たけーとかにはならんだろうか >>632
今回は応用効くのがポイントだから
チェスと将棋と囲碁を同時攻略出来るソフトバンクなんて前代未聞でしょ AlphaGo Zeroは2.5万トレーニングステップごとに1個前のネットと400局やって勝率55%のネットを棋譜生成に採用していたけど
それすらやめた、学習してるネットを直で棋譜作成に使ってる
Self-play games are generated by using the latest parameters for this neural network 2.5万トレーニングステップじゃなくて1000ステップだった あくまでも選手権版elmoより強くなったというのでしょう?
今のaperyとやらせてみないと 第2世代TPUを64個使ったとあるから180TFLOPS*64=11.5PFLOPS
NVIDIAのVoltaが1個で120TFLOPSだからその96倍
つまり1個のGPUでも数百時間でできる
110年は大ウソ
今後ゲームの知識を入れると大幅に時間も短縮できるだろう >>639
探索はやねうらおう4,73だから実際選手権版とも違うはず >>632
その視点だとponanza(山本×下山×さくら×PFN)対elmo(個人)の時点でもかなりインパクトはあったからな これを受けて開発やめる人はさすがにいないか
棋譜が公開されたり対局環境ができればまた変わってくるかな
正直今はただの机上の空論でしかないし 90TOPSのTPU 5000個 2時間でelmo超えてるから
V100を50個7日(200時間)使えばelmo超えられる
AWSスポットで100万ぐらいだな どんな棋譜なんだろうな
初手はなんなのか
人間のどんな定跡を使うのか、使わないのか
どんなふうに囲うのか、または囲わないのか
単純に知りたいものだ 第一世代TPU5000台で24時間学習とかいくつか設定が違うのがあるのは別々に学習してるのか? >>647
これは案外、今のソフトと大差ないと予想している >>651
矢倉がないってことは5手目77銀矢倉が不成立って言うんだろ。流石に無理じゃないかなー。 18号の作者の言う通り、やねうら王探索は序中盤枝狩りがキツすぎるのと
先手は攻め急ぎすぎ、後手は受けすぎな傾向あるからDLだと、もっとバランス良く指すのかな。 4TPU対64CPUとかだと、まだいい勝負してるけど
Figure 2がそのまま伸びるとして
MCTSはクラスタでも普通にスケールするから
クラスタではもっと差が出るな TPUだなんだって大掛かりなことしてる割に大したことないよな。
汎用性とかどうでもいいから跳び抜けて強いの作って欲しい。 F時間による延びについてはelmo+Yaneuraou側はもうちょっとまともにTT確保すれば改善されたりしないんだろうか 今の状態でプロと指させるのが、
勝ち逃げできる可能性がある妙手じゃね? ようわからんけどAlphaZeroまだ伸びしろがあるとみていいの? でも、そういえば、今のPonanzaはディープラーニング使っているから、
AlphaZeroはPonanzaと同程度という見方もできるわけ? 強さを測る相手が強くないとレートを測れないから分からんね
将棋特化させれば効率は良くなるだろうけど >>660
論文中のグラフみる限りむしろ延びしろは少なそうに思う アルファの伸びしろがないのか将棋というゲームの天井が近いのか >>664
やねが4600言ってたけど
今でも引き分けになるのが遠いから1万超えることもあり得るで アルファ碁マシンパワーでゴリ押しだだけで、sdt仕様だとエルモマイナス200程度という情報もあるがどうなのだろうか? ■ このスレッドは過去ログ倉庫に格納されています