▲コンピュータ将棋スレッド128
■ このスレッドは過去ログ倉庫に格納されています
まあGoogleが256手ルールが正式な将棋のルールだと思っていたら入玉なんて無視できるわけだが そういや今回はaperypaqに勝率6割超えのキメラできたとか言うやつ中々現れないな >>550
気になる人は棋譜下さいって聞いてみよう 入玉将棋だなんだってのが昔のプロvsソフトみたいになってて笑う alphazeroがやりたいのは囲碁だけじゃなくてチェストか将棋みたいな囲碁とは違う構造を持ったゲームに対しても使えるもっと一般性のある手法の提案でしょ
将棋だけに特化してとにかく強くしたい訳じゃないんだから入玉とかどうでもいいだろ 論文読むとわかるけど
1手60秒で対局してる
入玉とかやってられねぇわな という一方で多分入玉将棋も含めて正式なルールやってみたけど結果が良くなかったんだろうな
論文はネガティブデータ見せない傾向があるから 終盤抜きでいいなら森下5冠、藤井7冠とかある世界やな >>558
一番結果が良かったのが900で切った場合として見るのがいいやろね >>543
>with the usi option of EnteringKingRule set to NoEnteringKing.
って書いてあるから、usiのオプションを使ったってことで、
これ、宣言勝ちオプションを切ったって意味じゃないの?
usi絡みで入玉って、それしか思いつかないんだけど。 チェスはオープニングと勝率みたいなのが載ってて、将棋にも戦型別にこういうのがほしいと思う。
でも向こう将棋にくわしい人いなさそうだし、時間かかりそう 別にfloodgateの棋譜を「棋譜の管理」にぶち込めば出るし 今来
a. 驚異的な計算資源を使って、極々短期間に将棋ソフトに現存するどのソフトよりも強いソフトを作り上げた
b. 対局条件は-900でresignの設定、探索数はelmoの約1000分の1(スマホとXeon Goldで対戦させるより差が大きい)、それでいて、戦績は90勝8敗2分と圧倒
こんな理解でいいのかい?
それでいて、将棋村の人達の反応がこんな感じ
・ -900resign設定は不当!時間短縮をまっとうな理由に置きつつ、実際は将棋のルールを歪めたオレオレルールで戦績はまったく参考にならない!
・ DeepMindは将棋をわかってない
・ (探索数や学習局面の差に目をつむりながら)elmoに9割?俺の作ったソフトで8割超えるんだけど?Deepmindたいしたことねぇな!来年こんなのあっさり超えてるわ!
・ お偉い人「むしろこの結果はDeepLearningの限界を示しただけ。DeepMindでもこの程度でがっかり」 今回の論文の主旨はルールを教えただけでどれくらいの時間でどの程度強くなるかを示すことであり
ゲーム固有の知識をいれたらもっとパフォーマンスが上がるだろうがそれは将来の課題とする
と書いてあるから続編が出るかも
パフォーマンスが強さの意味だったら空恐ろしい >>562
羽生さんが出向いて1局ずつ分析するか
将棋が選ばれたってことは他のチャトランガ系のソフトはあまり熱心に開発されてないのか? >>564
スマホとXeon Gold←この表現はちょっと微妙じゃないか? ランダムから強くなること示すために無駄に時間かけてるけど
elmoとかから作った棋譜使えば遥かに早くこのレベルの強さになる 強い将棋ソフトを作るのが目的じゃなくて
アルファのエンジンは簡単にいろんなもんに転用できるという宣伝だから
これ以上煮詰めないんじゃなかろうか 1080Tiを110年分使って学習させて序盤から中盤にかけてならelmoに勝率9割は
まあそうですか。って印象だわな。
詰みまでさして入玉ありだと勝率落ちるだろうし まあすごさはわかった、でも普段使いできないしそもそも将棋に興味無さそうだしでなんだかなあ やねさんに早くアップデートしてもらって最新やねうら王+aperypaqで対局してほしい >>561
宣言勝ちをなしにして評価値と手数(と千日手)で終局させているという意味だろう
だれだよ入玉なしの別のゲームと騒いでいるやつは google先生なら3駒関係の限界を極められそう。
3駒関係はともかく、なんだかんだ言って囲碁にはけっこう関わってくれてるから、
将棋やチェスでももうすこし貢献してくれるんじゃなかろうかとちょっと期待 >>569
どちらも単位はposition/sec
AlphaZeroは評価スピードが遅い
評価スピード遅いから終盤の信頼度ってどうなのよって話 >>564
勝率9割ってのがまた微妙で、
電王戦Finalのselene vs 永瀬ぐらいの差でしかないからなぁ そもそもなんで極東のゲーム
天下のGoogle様がやってるわけ? googleが言いたい事を一言で表すと
「stockfish雑っ魚w」「elmo雑っ魚w」という事だな
将棋やチェス云々というより
チェス系はディープラーニング向かないもか言ってた
一部の開発者を結果でぶん殴った形 >>567
すまん、自分で書いててこれ変かもと思った
よりスマートで一般人にわかりやすい表現ないかね
あと、DeepLearningを使って強くしたAlphaZeroではあるが、
当然のように「終盤弱い(だから-900でresign設定にしている)」を真であるかのように喋ってる人たちはなんなのだろう
支えられている根拠があまりにも薄くないかい? レートの上がり具合見ると碁とかと比べて相対的にDL向かないってのも事実じゃないかな 今やってるコンピュータチェスの世界一決定戦のTCECの雰囲気がどうなってることやら。。 googleとかDLとか三駒とか関係なく結局のとこ計算資源次第、結局金なんだよな 自分たちのalphago zeroの宣伝のための論文なんだし
徐々に投了値を下げていって-900でelmoに投了させるのが一番勝率が高くなったと考えるのが自然。 >>578
自分たちのアルゴリズムの汎用性を証明するため。将棋に興味あるわけではない >>571
そこらへんはalphago zeroも1台のPCだと学習に1200年かかるししょうがないかと dlshogi触ったことあるなら分けるけど
詰み探索オフに設定すると全駒しに行く、AlphaZeroも多分そうなる
詰み探索入れればいいだけだが 評価関数の精度は恐らく最強なので既存の探索と組み合わせるためにもなんとか公開してほしいもんだ
人類のためにもとか誰か説得してくれw 既存の探索と組み合わせるのは無理。
無理やり組み合わせても悲惨なものができる。 既存のものと組み合わせて強くなったSDT5のポナ方式の方が現実的 −900っていうのはチェスのトーナメントのresign条件に将棋も合わせただけでしょ
チェスが900だから将棋もそれでいいかってぐらいの
だいたい900の将棋の局面見てもそれが終盤なのか中盤なのかちんぷんかんなんだから とりあえず、棋譜を見てみないことには何もわからないな たぶんAlphaZeroのソースにはやねうら王がごっそり入っているのだろう
こういうところにも貢献しているな ついに山本も反応したな
まだコンピュータ将棋に未練はありそう 下山さんは無反応。というか反応したら逆に驚くタイプだな akiさんはそもそもTwitter見てない可能性大 山本はこれからもこんな感じで引退したけどコンピュータ将棋の新しい話題には反応するタイプになるのかな
ボンクラの伊藤氏みたいに >>597
オセロは20年前の評価関数サイズ数十MBとかで止まってるから
従来手法のパターン数を増やすだけでも強くなる余地が十分残ってる
けどやってもしょうがないから誰もやってない >>580
答えは単純で、
大局観で詰め将棋は解けないから。 AlphaZero君の好きな戦型はなんなのかな?気になるね とりあえず次の将棋ソフトの目標ラインは
elmoに勝率91%だね
それ未満だと優勝ソフトだとしても煽られる悲しさ グーグルはケチだから公開はないだろ
AlphaGoも非公開だし 上位勢はレートの検証方法に疑問はあるようだけれど、概ねalphazeroに好意的だね
ずっと目標にしていたponanzaが引退して張り合いがなくなりかけていたから嬉しいだろうな
そして、もしWCSC28に出てくるならそれはもう大騒ぎになるだろう
空前前後の盛り上がりだろうな 連合組んで計算資源を確保して天下のgoogleをボコボコにして欲しいわ >>607
アンチまふ定跡戦略を学んだだけだったりして。 特に平岡さんのやる気が凄いね
彼女にフラれたのか知らんがこっちとしては開発に力を入れてくれた方がいいわ >>613
あ、elmoとの対戦棋譜は学習してないからそれはないか。 >>591
そうなのかも。
せめて2000点を閾値にして欲しかった。 とりあえずニコニコの佐藤映像に煽りPV作って貰おうか 将棋はなかなか国際色が出せなかったからグーグルを引きずり出せ 取り敢えず圧倒的成長を遂げていく可能性のあるGoogleをあまり本気にさせない方針で勝利の称号だけ手に入れましょうか。 ルールの整備もちゃんと出来てないような将棋世界選手権なぞに
Googleが出場しませんよ 将棋は駒が漢字だからさ、今更アジア圏以外には広く受け入れられないんじゃないかな… floodgateには来そうじゃない?
平岡さんがTwitterでURL載せて誘っている >>623
終局まで指したら弱いことがバレるから来ないだろ いやー来ないんじゃないか?
aperypaqがelmoに8割だし、これで全然勝ち越せなかったら赤っ恥晒すことになるし ただまあ、上に行くようになったらつまらなくなるのがチェスであり、さらに面白くなるのが将棋であり、そもそも前提の達成が難しいのが囲碁…
この中じゃあ、実は一番指してる時の幸福度が高かったりするのかもな グーグルが将棋に人的リソースを使う理由はないんだよ
評価値(+2000とか)だけで勝敗を決定するとか特殊ルールなら
のってくる可能性がないことはないけど 外国人向けのネット将棋なら王がKでもいいんだがな
ネットでしか指さない人がほとんどだろうし でもこのまま何もしないで「三部門で世界最強になりました」とか言われても微妙じゃない?
それこそガチ勢から不平不満が出るのは必然 >>618
しかも両者FMでその取材の時対局して1勝1敗 逆に個人的な開発でAlphaZeroに迫っているソフトすげーとか
計算資源的に学習効率たけーとかにはならんだろうか >>632
今回は応用効くのがポイントだから
チェスと将棋と囲碁を同時攻略出来るソフトバンクなんて前代未聞でしょ AlphaGo Zeroは2.5万トレーニングステップごとに1個前のネットと400局やって勝率55%のネットを棋譜生成に採用していたけど
それすらやめた、学習してるネットを直で棋譜作成に使ってる
Self-play games are generated by using the latest parameters for this neural network 2.5万トレーニングステップじゃなくて1000ステップだった あくまでも選手権版elmoより強くなったというのでしょう?
今のaperyとやらせてみないと 第2世代TPUを64個使ったとあるから180TFLOPS*64=11.5PFLOPS
NVIDIAのVoltaが1個で120TFLOPSだからその96倍
つまり1個のGPUでも数百時間でできる
110年は大ウソ
今後ゲームの知識を入れると大幅に時間も短縮できるだろう >>639
探索はやねうらおう4,73だから実際選手権版とも違うはず >>632
その視点だとponanza(山本×下山×さくら×PFN)対elmo(個人)の時点でもかなりインパクトはあったからな これを受けて開発やめる人はさすがにいないか
棋譜が公開されたり対局環境ができればまた変わってくるかな
正直今はただの机上の空論でしかないし 90TOPSのTPU 5000個 2時間でelmo超えてるから
V100を50個7日(200時間)使えばelmo超えられる
AWSスポットで100万ぐらいだな どんな棋譜なんだろうな
初手はなんなのか
人間のどんな定跡を使うのか、使わないのか
どんなふうに囲うのか、または囲わないのか
単純に知りたいものだ 第一世代TPU5000台で24時間学習とかいくつか設定が違うのがあるのは別々に学習してるのか? >>647
これは案外、今のソフトと大差ないと予想している ■ このスレッドは過去ログ倉庫に格納されています