▲コンピュータ将棋スレッド128
■ このスレッドは過去ログ倉庫に格納されています
お前らって素人がそこそこ強いの作ったら相性じゃんけんだの試行回数少なすぎだの文句言いまくりなのに Google様が同じことしたら崇拝するのなw >>467 語弊ありそうなので訂正 対elmo比較でaperypaqに+150 序盤から中盤にかけてR4500くらいなんだろうなとアバウトに思っておけばいいんじゃないかな googleも将棋に似た何かで強くなったって言ってるだけだからDL単体はコスパ悪いな。 SDTのポナみたいにKPPTを補う形が理想かな DLが将棋やチェスと相性が悪いのは変わらないということでおk? >>468 崇拝はせんが、学術論文という体裁が重要 >>468 お前さ…社会って信用で成り立ってるの知らないの? 信用偏差値80越えのGoogle様の一声で平均ちょい上が騒ぐのは当たり前じゃないか? (やねうらで60程度として測定しといたので詳しい値ではないので悪しからず。) NVIDIAのVoltaにはTPUに似た機能があるから Voltaがあればそんなに天文学的な時間はかからないと思うけど >>473 プレプリントだからねえ ピアレビューだしたらいくつか上がってる疑問はつけられそう >>472 囲碁に比べてもレートの伸びの頭打ちが速い その点ではまふさんの言ってることが結構端的 まふ@まふ定跡開発者? @mafu_op_theory 今回の件で誰が一番被害デカかったと言えば、 DeepMind社の専門家が膨大な計算資源を使って、 コンピューター将棋をディープラーニングしても こんな程度までしか出来ないって分かってしまった、 ディープラーニング勢の未来。 https://twitter.com/mafu_op_theory/status/938281668363812865 一方mEssiahの人は意気盛ん 将棋ソフト「mEssiah」公式? @messiah_ai グーグルDeepMind社がコンピュータ将棋を作成したという論文が発表されたようですね。 mEssiah Stage2の開発は順調で、学習アルゴリズム的にはAlpha Zeroを上回っていると考えています。 現在mEssiah開発者は一緒にグーグルDeepMindを倒しに行く企業様を募集しております。 将棋の神の卵はすでに手の中にあります。神を育ててDeepMindを倒したい企業様、お待ちしています。 >>478 取り敢えず詰みまで指せるようにして持ってこいって言いたい まふ@まふ定跡開発者 今回の件で誰が一番被害デカかったと言えば、 DeepMind社の専門家が膨大な計算資源を使って、 コンピューター将棋をディープラーニングしても こんな程度までしか出来ないって分かってしまった、 ディープラーニング勢の未来。 正直なところこれはちょっと思った まぁGoogleがどうこうはさておき、ノード数が少なすぎるのに強いのは凄い 今までは数の暴力で強かったわけだけど、人間と同じノード数だとしてもトッププロレベルかそれ以上まで行きそう 単純にノード数が少なくて済むほうが優れているという認識でいいのか? 人間のノードなんてどうやって測るんだ 1億と3手か Googleが本気になればポナ本ごとき瞬殺ってのは正しかったようだな deep blueのときに、カスパロフで2〜3npsとか議論してたような記憶がある >>483 羽生さん曰く30分から1時間で1000局面くらいか? こ、これは… 【if】将棋でDL頭打ち ↓ 実は囲碁は論理的には簡単なゲーム ↓ 世界で一番難しいゲームは将棋 ↓ 時たま将棋ソフトを凌駕する寄せを見せた永世七冠王はやはりすごいものである なるほど………Googleの粋な計らいなのか。高度過ぎだろ… >>485 羽生「1000手読むのに30分から1時間」 DeepZero「16000手に1分」 >>488 コンピューターのノード数とは一致しないニュアンスかな… 羽生善治永世七冠王の全力で30分間で1000手くらいらしいからな、もちろん繰り返し読むからってのはあるが >>456 クジラちゃんクラスタでPC100万台ぐらい繋ごう (なお低スペPCだとかえって足を引っ張る模様) >>485 詰将棋で考えると人は5〜7NPSよめれぬのが十分なんじゃないか? 一瞬で見えた手や軽く流した手も含めるかでかなり変わるな 精査した手になると数NPSだろうなあ 計算資源のためにクラスタに協力してくれってなったらどのくらい集まるかな 日本のコンピュータ将棋界隈ではalphazeroそこまで大したことねぇなという空気になりつつあるのを むこうの人たちにそれとなく伝えて欲しいわ てかさ汎用性示すのにチェスと将棋やったんだと思うんだけどさ 汎用性って意味ならやっぱり 終盤の詰む詰まないのスピード勝負や ゲーム性の大きく変わる入玉も含めた形でやるべきだな >>496 くじらちゃん2017は565台だったらしい まさかくじらちゃんの大物コラボ相手が本当はGoogleだったとは >>497 まあこの結果をgoogle以外が公表してたら、入玉なしやリザインバリューの件でボロクソ言われだろうな。 評価値−900を投了条件としても、elmo相手に勝率9割は果たして大したことがないの領域なのか?伸びしろも含めるとヤバそうなんですが、それは… 正直、思ったよりなんとかなりそうなレベルなんだなという印象だよね 新しいAlphaGoのときみたいな衝撃はないな >>503 それが論文に出てるグラフを見ればわかるようになっているんだが、 Googleの有り余る計算資源で強化を繰り返してもこれ以上の伸びが弱いのよ (チェスについては完全にプラトーに見える。囲碁はじりじり伸びてる) 大したことないことはないにしてもwcsc27相手に勝率9割なら手が届きそうって感じだし、 イ・セドルバージョンのAlphaGoに100戦100勝にくらべたらやっぱり印象負けする レート5000!とかじゃないとな。旧masterに全勝と比べたらelmoまだ勝てるんだって感じ それまでの棋譜とか使わない学習ならソフトでも対応できない見たこともないハメ手を使いそうやな というかDL無くてもでwcsc27のelmo相手に8割以上勝てるからなー やっぱ終盤の深い読みが関わってくる局面でも適切に対応できるのかが気になる DLで先読みなしのポナがFGにあったと思うけど、 Googleのを先読みなしにしてもそれよりは強いよな?多分 >>507 ポナが絶対王者だと思ってたら 2015のぞみちゃんがいいところにいって 技巧がでてきて、elmoやぽんぽこも続いてっていうのを見てきたからこそだよね >>513 そうなんだ、ありがとう。 あんまり詳しくないんだけどちょっとビックリしてスレに来てみたんだ googleにしてみれば、将棋の序盤というわからないものをわかることが大事なんであって、終盤などのパズル的な部分はわからなくても良いという考え方なのでは >>515 DLっていろんなことできるんだぜ! ってアピールだな結局 >>515 と言っても定跡入れるし やねの探索は序盤枝刈りは激しすぎるし >>514 ブレードたくさん積んだトレーラー引っ張ってきそう ハサビスがカスパロフとの対談で、強化学習で既存ソフトを上回ったら驚きますかとか聞いてたからやると思ってたよ そしてpretty sureとか言ったときはもう実験に成功してる we never actually found the limits of how good this version AlphaGo could get. maybe we'll go back one day and finish off that experiment but we needed to use the computers for something else. so, we had to put stop there. something elseはチェスと将棋の事だったかw elmoに8,9割の作戦勝ちできる棋譜ってだけでも価値あるんやから公開してくれ プロ棋士+ぽんぽこのアドバンスド vs AlphaZeroとかやったらアドバンスド側勝てるかな もうプロ棋士いても脚を引っ張るだけかしら -900打ち切りなら終盤までそれぐらいで行ければプロならひっくり返しそうだな それではAlphaZeroの開発者をご紹介致しましょう。Google傘下のDeepMindさんです! 「うわあああああああああ、すげええええええええ」 「グーグルがちょっと本気だしたら将棋ソフトの歴史40年があっさり否定されてワロタ」 「やねうら王オワタ」 「elmoに完勝してるな」 それではAlphaZeroの開発者をご紹介致しましょう。山本一成さんです! 「入玉オフとかゴミやん」 「-900で投了?マレーシア行くの?」 「こんなにガチっても4500で頭打ちか所詮ポナ山だな」 AIって人間みたいに自分で意志決定できるの? 例えばハサビスがAI先生ちょっくら将棋のソフトでも作っていただけませんか?とお願いしたらちょっと間を置いて「いやです」みたいな感じで フィルタの数とか書いてないからなあ alphagozero40フィルタよりはなんか軽そう 24時間しかまわしてないのに回数多いし 巧遅の4万局面なのか、同じ計算量(て言えばいいの?)で4万局なのか チェス 25勝3敗72分 将棋 90勝8敗2分 時間短縮のためかチェスと将棋は20ブロックのresnetでやったのね 40ブロックだとあと1000 eloぐらい強くなるけど あとまふさんのツイートはなんだかなあと思う 完全DLでmctsだと三駒+sf探索には及ばないと思われてたんだから 層を更に深くしたら伸びるかもしれないし、汎用学習型であるalphazeroの限界なだ毛かもしれない 学習2400万局だから、トータルで30億局面ぐらいしか学習させてないな 100億局面を5回も回したaperyとは何だったのか 入玉なしのなんちゃって将棋のルールで900点で投了だし なんだ対したことないなって思われても仕方ない。 まふって勘違いの痛い奴だってのが本性出してよく分かったじゃん 手数が伸びがちなコンピュータ将棋で入玉禁止はちょっと卑怯だな aperyは相入玉型になったら点数計算して入玉勝ち出来るのに これまでの歴史で今まで入玉云々で苦労してその兼ね合いでやってるのに 勝手に入玉なしルールに決めてんじゃねーよ馬鹿もんが! グーグルはただ単に過剰にアピールしたいだけの糞企業にすぎない ゼロベースで既存の最強ソフトを超えられたのが凄いよね リゼロも追い付くのが精一杯でゼロベースのメリットは誰も示せていなかったしさ googleの論文は将棋じゃないですよ。将棋に似た何か 終局まで対局できるものを用意してから出直してほしいって気持ちが強すぎるわ Googleの人たちは将棋を指したことがないんだよ だからチェスと同じ条件でいいだろう、むしろ同じにするべきだと思っているんだろう Googleの執筆者に将棋が分かる人がいたらresignの条件も変わっただろう 入玉なしってのがどういう意味かがよくわからないんだよね 現象自体は起きるんだからどう扱ってるんだろうという疑問が 無効対局にするのか引き分け扱いなのかも ところで、チェスはエンドゲームが全然違う思考法なんだと思うのだけど、そこらへんはどうなっているのだろうか 入玉なしルールってのがよく分からんけど 実際のとこどういうルールでやったんだろ まさか玉は敵陣の3段目以上に入れないようになってるってことはなかろうし、 相入玉したら引き分けにする、ってぐらいなら 勝率計算上もレアケースだろうから理解できないでもないかなぁ まあ27点法とか24点法とかトライルールとかたくさん書かれてもどれを選べばいいのか頭がいたくなるってのは分かる 日本の開発者の人らは入玉で苦労してたもんな なんだつまらんグーグルルールでやったのかよ それじゃ将棋の亜種、グーグル将棋じゃんw だいたいコンピュータなら 切れ負けにしておけば、持将棋なしでも成立するよな? 人間向けのルールでしょアレは 入玉なしルールだったら 第2期電王戦のプエラαvs塚田はプエラαの圧勝だったなw Chess and shogi games exceeding a maximum number of steps (determined by typical game length) were terminated and assigned a drawn outcome 具体的に何手で打ち切ってるのかよくわからん まあGoogleが256手ルールが正式な将棋のルールだと思っていたら入玉なんて無視できるわけだが そういや今回はaperypaqに勝率6割超えのキメラできたとか言うやつ中々現れないな >>550 気になる人は棋譜下さいって聞いてみよう 入玉将棋だなんだってのが昔のプロvsソフトみたいになってて笑う alphazeroがやりたいのは囲碁だけじゃなくてチェストか将棋みたいな囲碁とは違う構造を持ったゲームに対しても使えるもっと一般性のある手法の提案でしょ 将棋だけに特化してとにかく強くしたい訳じゃないんだから入玉とかどうでもいいだろ 論文読むとわかるけど 1手60秒で対局してる 入玉とかやってられねぇわな という一方で多分入玉将棋も含めて正式なルールやってみたけど結果が良くなかったんだろうな 論文はネガティブデータ見せない傾向があるから 終盤抜きでいいなら森下5冠、藤井7冠とかある世界やな >>558 一番結果が良かったのが900で切った場合として見るのがいいやろね >>543 >with the usi option of EnteringKingRule set to NoEnteringKing. って書いてあるから、usiのオプションを使ったってことで、 これ、宣言勝ちオプションを切ったって意味じゃないの? usi絡みで入玉って、それしか思いつかないんだけど。 チェスはオープニングと勝率みたいなのが載ってて、将棋にも戦型別にこういうのがほしいと思う。 でも向こう将棋にくわしい人いなさそうだし、時間かかりそう 別にfloodgateの棋譜を「棋譜の管理」にぶち込めば出るし 今来 a. 驚異的な計算資源を使って、極々短期間に将棋ソフトに現存するどのソフトよりも強いソフトを作り上げた b. 対局条件は-900でresignの設定、探索数はelmoの約1000分の1(スマホとXeon Goldで対戦させるより差が大きい)、それでいて、戦績は90勝8敗2分と圧倒 こんな理解でいいのかい? それでいて、将棋村の人達の反応がこんな感じ ・ -900resign設定は不当!時間短縮をまっとうな理由に置きつつ、実際は将棋のルールを歪めたオレオレルールで戦績はまったく参考にならない! ・ DeepMindは将棋をわかってない ・ (探索数や学習局面の差に目をつむりながら)elmoに9割?俺の作ったソフトで8割超えるんだけど?Deepmindたいしたことねぇな!来年こんなのあっさり超えてるわ! ・ お偉い人「むしろこの結果はDeepLearningの限界を示しただけ。DeepMindでもこの程度でがっかり」 今回の論文の主旨はルールを教えただけでどれくらいの時間でどの程度強くなるかを示すことであり ゲーム固有の知識をいれたらもっとパフォーマンスが上がるだろうがそれは将来の課題とする と書いてあるから続編が出るかも パフォーマンスが強さの意味だったら空恐ろしい >>562 羽生さんが出向いて1局ずつ分析するか 将棋が選ばれたってことは他のチャトランガ系のソフトはあまり熱心に開発されてないのか? >>564 スマホとXeon Gold←この表現はちょっと微妙じゃないか? ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる