▲コンピュータ将棋スレッド128
■ このスレッドは過去ログ倉庫に格納されています
チェス 25勝3敗72分
将棋 90勝8敗2分
時間短縮のためかチェスと将棋は20ブロックのresnetでやったのね
40ブロックだとあと1000 eloぐらい強くなるけど あとまふさんのツイートはなんだかなあと思う
完全DLでmctsだと三駒+sf探索には及ばないと思われてたんだから
層を更に深くしたら伸びるかもしれないし、汎用学習型であるalphazeroの限界なだ毛かもしれない 学習2400万局だから、トータルで30億局面ぐらいしか学習させてないな
100億局面を5回も回したaperyとは何だったのか 入玉なしのなんちゃって将棋のルールで900点で投了だし
なんだ対したことないなって思われても仕方ない。 まふって勘違いの痛い奴だってのが本性出してよく分かったじゃん 手数が伸びがちなコンピュータ将棋で入玉禁止はちょっと卑怯だな
aperyは相入玉型になったら点数計算して入玉勝ち出来るのに これまでの歴史で今まで入玉云々で苦労してその兼ね合いでやってるのに
勝手に入玉なしルールに決めてんじゃねーよ馬鹿もんが!
グーグルはただ単に過剰にアピールしたいだけの糞企業にすぎない ゼロベースで既存の最強ソフトを超えられたのが凄いよね
リゼロも追い付くのが精一杯でゼロベースのメリットは誰も示せていなかったしさ googleの論文は将棋じゃないですよ。将棋に似た何か 終局まで対局できるものを用意してから出直してほしいって気持ちが強すぎるわ Googleの人たちは将棋を指したことがないんだよ
だからチェスと同じ条件でいいだろう、むしろ同じにするべきだと思っているんだろう
Googleの執筆者に将棋が分かる人がいたらresignの条件も変わっただろう 入玉なしってのがどういう意味かがよくわからないんだよね
現象自体は起きるんだからどう扱ってるんだろうという疑問が
無効対局にするのか引き分け扱いなのかも ところで、チェスはエンドゲームが全然違う思考法なんだと思うのだけど、そこらへんはどうなっているのだろうか 入玉なしルールってのがよく分からんけど
実際のとこどういうルールでやったんだろ
まさか玉は敵陣の3段目以上に入れないようになってるってことはなかろうし、
相入玉したら引き分けにする、ってぐらいなら
勝率計算上もレアケースだろうから理解できないでもないかなぁ まあ27点法とか24点法とかトライルールとかたくさん書かれてもどれを選べばいいのか頭がいたくなるってのは分かる 日本の開発者の人らは入玉で苦労してたもんな
なんだつまらんグーグルルールでやったのかよ
それじゃ将棋の亜種、グーグル将棋じゃんw だいたいコンピュータなら
切れ負けにしておけば、持将棋なしでも成立するよな?
人間向けのルールでしょアレは 入玉なしルールだったら
第2期電王戦のプエラαvs塚田はプエラαの圧勝だったなw Chess and shogi games exceeding a maximum number of steps (determined by typical
game length) were terminated and assigned a drawn outcome
具体的に何手で打ち切ってるのかよくわからん まあGoogleが256手ルールが正式な将棋のルールだと思っていたら入玉なんて無視できるわけだが そういや今回はaperypaqに勝率6割超えのキメラできたとか言うやつ中々現れないな >>550
気になる人は棋譜下さいって聞いてみよう 入玉将棋だなんだってのが昔のプロvsソフトみたいになってて笑う alphazeroがやりたいのは囲碁だけじゃなくてチェストか将棋みたいな囲碁とは違う構造を持ったゲームに対しても使えるもっと一般性のある手法の提案でしょ
将棋だけに特化してとにかく強くしたい訳じゃないんだから入玉とかどうでもいいだろ 論文読むとわかるけど
1手60秒で対局してる
入玉とかやってられねぇわな という一方で多分入玉将棋も含めて正式なルールやってみたけど結果が良くなかったんだろうな
論文はネガティブデータ見せない傾向があるから 終盤抜きでいいなら森下5冠、藤井7冠とかある世界やな >>558
一番結果が良かったのが900で切った場合として見るのがいいやろね >>543
>with the usi option of EnteringKingRule set to NoEnteringKing.
って書いてあるから、usiのオプションを使ったってことで、
これ、宣言勝ちオプションを切ったって意味じゃないの?
usi絡みで入玉って、それしか思いつかないんだけど。 チェスはオープニングと勝率みたいなのが載ってて、将棋にも戦型別にこういうのがほしいと思う。
でも向こう将棋にくわしい人いなさそうだし、時間かかりそう 別にfloodgateの棋譜を「棋譜の管理」にぶち込めば出るし 今来
a. 驚異的な計算資源を使って、極々短期間に将棋ソフトに現存するどのソフトよりも強いソフトを作り上げた
b. 対局条件は-900でresignの設定、探索数はelmoの約1000分の1(スマホとXeon Goldで対戦させるより差が大きい)、それでいて、戦績は90勝8敗2分と圧倒
こんな理解でいいのかい?
それでいて、将棋村の人達の反応がこんな感じ
・ -900resign設定は不当!時間短縮をまっとうな理由に置きつつ、実際は将棋のルールを歪めたオレオレルールで戦績はまったく参考にならない!
・ DeepMindは将棋をわかってない
・ (探索数や学習局面の差に目をつむりながら)elmoに9割?俺の作ったソフトで8割超えるんだけど?Deepmindたいしたことねぇな!来年こんなのあっさり超えてるわ!
・ お偉い人「むしろこの結果はDeepLearningの限界を示しただけ。DeepMindでもこの程度でがっかり」 今回の論文の主旨はルールを教えただけでどれくらいの時間でどの程度強くなるかを示すことであり
ゲーム固有の知識をいれたらもっとパフォーマンスが上がるだろうがそれは将来の課題とする
と書いてあるから続編が出るかも
パフォーマンスが強さの意味だったら空恐ろしい >>562
羽生さんが出向いて1局ずつ分析するか
将棋が選ばれたってことは他のチャトランガ系のソフトはあまり熱心に開発されてないのか? >>564
スマホとXeon Gold←この表現はちょっと微妙じゃないか? ランダムから強くなること示すために無駄に時間かけてるけど
elmoとかから作った棋譜使えば遥かに早くこのレベルの強さになる 強い将棋ソフトを作るのが目的じゃなくて
アルファのエンジンは簡単にいろんなもんに転用できるという宣伝だから
これ以上煮詰めないんじゃなかろうか 1080Tiを110年分使って学習させて序盤から中盤にかけてならelmoに勝率9割は
まあそうですか。って印象だわな。
詰みまでさして入玉ありだと勝率落ちるだろうし まあすごさはわかった、でも普段使いできないしそもそも将棋に興味無さそうだしでなんだかなあ やねさんに早くアップデートしてもらって最新やねうら王+aperypaqで対局してほしい >>561
宣言勝ちをなしにして評価値と手数(と千日手)で終局させているという意味だろう
だれだよ入玉なしの別のゲームと騒いでいるやつは google先生なら3駒関係の限界を極められそう。
3駒関係はともかく、なんだかんだ言って囲碁にはけっこう関わってくれてるから、
将棋やチェスでももうすこし貢献してくれるんじゃなかろうかとちょっと期待 >>569
どちらも単位はposition/sec
AlphaZeroは評価スピードが遅い
評価スピード遅いから終盤の信頼度ってどうなのよって話 >>564
勝率9割ってのがまた微妙で、
電王戦Finalのselene vs 永瀬ぐらいの差でしかないからなぁ そもそもなんで極東のゲーム
天下のGoogle様がやってるわけ? googleが言いたい事を一言で表すと
「stockfish雑っ魚w」「elmo雑っ魚w」という事だな
将棋やチェス云々というより
チェス系はディープラーニング向かないもか言ってた
一部の開発者を結果でぶん殴った形 >>567
すまん、自分で書いててこれ変かもと思った
よりスマートで一般人にわかりやすい表現ないかね
あと、DeepLearningを使って強くしたAlphaZeroではあるが、
当然のように「終盤弱い(だから-900でresign設定にしている)」を真であるかのように喋ってる人たちはなんなのだろう
支えられている根拠があまりにも薄くないかい? レートの上がり具合見ると碁とかと比べて相対的にDL向かないってのも事実じゃないかな 今やってるコンピュータチェスの世界一決定戦のTCECの雰囲気がどうなってることやら。。 googleとかDLとか三駒とか関係なく結局のとこ計算資源次第、結局金なんだよな 自分たちのalphago zeroの宣伝のための論文なんだし
徐々に投了値を下げていって-900でelmoに投了させるのが一番勝率が高くなったと考えるのが自然。 >>578
自分たちのアルゴリズムの汎用性を証明するため。将棋に興味あるわけではない >>571
そこらへんはalphago zeroも1台のPCだと学習に1200年かかるししょうがないかと dlshogi触ったことあるなら分けるけど
詰み探索オフに設定すると全駒しに行く、AlphaZeroも多分そうなる
詰み探索入れればいいだけだが 評価関数の精度は恐らく最強なので既存の探索と組み合わせるためにもなんとか公開してほしいもんだ
人類のためにもとか誰か説得してくれw 既存の探索と組み合わせるのは無理。
無理やり組み合わせても悲惨なものができる。 既存のものと組み合わせて強くなったSDT5のポナ方式の方が現実的 −900っていうのはチェスのトーナメントのresign条件に将棋も合わせただけでしょ
チェスが900だから将棋もそれでいいかってぐらいの
だいたい900の将棋の局面見てもそれが終盤なのか中盤なのかちんぷんかんなんだから とりあえず、棋譜を見てみないことには何もわからないな たぶんAlphaZeroのソースにはやねうら王がごっそり入っているのだろう
こういうところにも貢献しているな ついに山本も反応したな
まだコンピュータ将棋に未練はありそう 下山さんは無反応。というか反応したら逆に驚くタイプだな akiさんはそもそもTwitter見てない可能性大 山本はこれからもこんな感じで引退したけどコンピュータ将棋の新しい話題には反応するタイプになるのかな
ボンクラの伊藤氏みたいに >>597
オセロは20年前の評価関数サイズ数十MBとかで止まってるから
従来手法のパターン数を増やすだけでも強くなる余地が十分残ってる
けどやってもしょうがないから誰もやってない >>580
答えは単純で、
大局観で詰め将棋は解けないから。 AlphaZero君の好きな戦型はなんなのかな?気になるね とりあえず次の将棋ソフトの目標ラインは
elmoに勝率91%だね
それ未満だと優勝ソフトだとしても煽られる悲しさ グーグルはケチだから公開はないだろ
AlphaGoも非公開だし 上位勢はレートの検証方法に疑問はあるようだけれど、概ねalphazeroに好意的だね
ずっと目標にしていたponanzaが引退して張り合いがなくなりかけていたから嬉しいだろうな
そして、もしWCSC28に出てくるならそれはもう大騒ぎになるだろう
空前前後の盛り上がりだろうな 連合組んで計算資源を確保して天下のgoogleをボコボコにして欲しいわ >>607
アンチまふ定跡戦略を学んだだけだったりして。 特に平岡さんのやる気が凄いね
彼女にフラれたのか知らんがこっちとしては開発に力を入れてくれた方がいいわ >>613
あ、elmoとの対戦棋譜は学習してないからそれはないか。 >>591
そうなのかも。
せめて2000点を閾値にして欲しかった。 とりあえずニコニコの佐藤映像に煽りPV作って貰おうか 将棋はなかなか国際色が出せなかったからグーグルを引きずり出せ 取り敢えず圧倒的成長を遂げていく可能性のあるGoogleをあまり本気にさせない方針で勝利の称号だけ手に入れましょうか。 ルールの整備もちゃんと出来てないような将棋世界選手権なぞに
Googleが出場しませんよ 将棋は駒が漢字だからさ、今更アジア圏以外には広く受け入れられないんじゃないかな… floodgateには来そうじゃない?
平岡さんがTwitterでURL載せて誘っている >>623
終局まで指したら弱いことがバレるから来ないだろ いやー来ないんじゃないか?
aperypaqがelmoに8割だし、これで全然勝ち越せなかったら赤っ恥晒すことになるし ただまあ、上に行くようになったらつまらなくなるのがチェスであり、さらに面白くなるのが将棋であり、そもそも前提の達成が難しいのが囲碁…
この中じゃあ、実は一番指してる時の幸福度が高かったりするのかもな グーグルが将棋に人的リソースを使う理由はないんだよ
評価値(+2000とか)だけで勝敗を決定するとか特殊ルールなら
のってくる可能性がないことはないけど 外国人向けのネット将棋なら王がKでもいいんだがな
ネットでしか指さない人がほとんどだろうし ■ このスレッドは過去ログ倉庫に格納されています