▲コンピュータ将棋スレッド128
■ このスレッドは過去ログ倉庫に格納されています
まぁチェスのついででしかないから設定とかもガバガバなんだろうね。 結果として将棋じゃなくて将棋に似た何か >>730 やってみるしかないが。 根拠はないものの、結果は圧倒的な差になる気がする。 >>732 たぶんポナは強化に使えた時間とお金が足りてないからあの程度だった プログラミング技術はPFNの方が圧倒的だよ。 金と時間の問題でああいう結果になったけど floodgateに来れば明確だけどCGOSも来ないからだめだろうな チェスは100戦やって無敗だから満足だろうけど、将棋は8敗したから満足してないと思う 将棋の専門家がdeepmindにいればな 意外とGoogleもしょぼい、というかdlが将棋に向かないというだけか。 透。の持ってる最強関数をXeonで回して多分互角以上だろうね。 >>723 それはponanza の仮定だが、elmoも同じ仮定で学習してるので同じやね。 人間トップからのレーティング差から見れば囲碁と同じくらいの差なんだけどな チェスと将棋は既存のソフトが十分強いから 来年の選手権に是非出てもらわないと そこで白黒はっきりすればいい 評価関数がウンコだったら意味ない 棋譜公開 千田率の出番 AWSが本気を出せば一般庶民も大規模学習に手を出せるんだが だからもっと値下げして♪ >>714 elmo相手にしかやってないから仮にR6000でも分からん 400以上差があると精度のあるレーティングは無理 ハサビス羽生さんに直電であっさり口説き落とす可能性大。 To evaluate performance in shogi, we used Elmo version WCSC27 in combination with YaneuraOu 2017 Early KPPT 4.73 64AVX2 これ、将棋ソフト知らない人が見たら意味わからんだろうな 優勝したバージョンのパッケージを公式に置いといた方が良いと前から思ってた ぽんぽこもエンジン付きで置いといた方が良い >>738 かなりのスペック差で対戦を行いそのうえ900で投了・入玉勝ちをオフにして9割って言われてもって感じだよね。 twitterだとelmo側のやねうら王エンジンのhash値も小さい値らしいし あえてDeepMindに批判するなら、将棋はチェスとは違うから、チェスの条件をそのまま当てはめるな 将棋の900センチポーンでの勝率は80%程度でしかない。低すぎる チェスとは違って、引き分けが少ないから、最後まで指せ ということかな 案外、最後まで指させたら、違う結果になるかも >>744 R6000もあったら、さすがにelmoに90勝8敗なんてことはないだろうさ 序中盤DLで終盤は従来のハイブリッドが来年の選手権には増えるのかな? >>749 1手詰め入ってないから互角のままいったときに頓死でワンパン入ってるんじゃね? >>752 ならんとは言えん やねうらエンジンならR4600の評価関数でも似たような結果になるんじゃね 35Mn?でhash1GBって少ないかなあ? スペック差に関してはそもそもCPUとGPUで発展の差があるからまあしょうがないとは思う 1080ti一基だと実力が発揮できない一人だけノートPC使ってるような感じになるし GPSの金子先生 Tomoyuki Kaneko? @tkaneko いくつか気になるので、(ジャーナルなどに投稿されているなら)査読者頑張って欲しい https://twitter.com/tkaneko/status/938282976902868993 elmoをCPU256コア 消費電力1500wにしても 4 TPU 300w +CPU200wに勝てない 低スぺなら勝てる 一発勝負な運ゲー要素ある選手権よりもやはりfloodgate出てきてそれこそ1日中色んなソフトと対局してほしい daigo? @daigog [Shogi-server/Floodgateのお知らせ] 停電のため、12月9日〜11日夜にかけて、停止予定です。 http://wdoor.c.u-tokyo.ac.jp/shogi/ とりあえず序盤は死ぬほど上手いのは間違いないだろうから序盤戦術を見たい 羽生とも指してほしいけど、全盛期の藤井との対局見てみたい 一歩竜王の頃の藤井なら期待できると思ってる やね氏のウェブサイトがぜんぜん違うページになってるんだけど、 ドメインの更新忘れかな http://yaneuraou.yaneu.com/ 囲碁のように画期的な序盤をやるのかどうかってのはホント知りたい ponanzaもelmoを上回っていたことを忘れていた >>735 一敗しなきゃ上位と当たらない欠陥サイトで動かされても・・・ 延々とGPS将棋と当たるgoogle製ソフトとか見たいか? >>764 elmoに無敗ならまだしも、勝率9割(しかも序盤重視の特殊条件)くらいだったらそんな革命的なのはないでしょ YaneuraOu rezero epoch19もかなり人間的な序盤だったわけで 人間の序盤をなめてはいけない 新手は山のように有るだろうけどそれは今も変わらんしな 凄さをアウトプットさせるのは難しい >>770 例えば横歩になったとき先手Alphazeroなら常に勝率100%とかならこれは何かあるぞってならんか? 後手は横歩に付き合ったらほぼ確実に悪くなりますみたいなのがあるかもしれん 普通ではない状況に対応するやり方は多分なんじゃこりゃ的なものはあるんじゃね 根幹はさほど変わらないが、なぜそうすべきなのかの理由付けがまったく変わるという意味で 序盤概念が変わる可能性はあると思う なんかスペック差がどうこう言われてるみたいだけど、elmoよりAlphaZeroのほうがスケールするだろうから、むしろ4TPUしか使ってないAlphaZeroのほうが不利なんじゃ あとαβ法は疎結合並列探索の効率がうんこだから、クラスタ化するとさらに差がひらきそう 全然話変わるんだが、AdaGradで学習するときのetaってどんな感じで変化させるのがベストだと思う? 例えばミニバッチサイズ100000で100億局面学習だったらどんなもんかな? そういえばやねうら王ってHashの設定が特殊(USI_Hashを無視する)けど、日本語わからないチームだとそのあたり大丈夫なんだろうか… お前らがやってたことって Googleが本気出したら2時間で超えられることだったとか 虚しくならないの?wwwwwwwwwwww ポナの上位版って感じしかしないが ソース公開されてるものを後から出してもな 実際に2日で強くなる過程を公開するなら価値があるが >>775 クラスタもそうだし elmo 18コア 165W i9-7980XE Zero 4コア 65W+75W i7-7700 + 1TPU これでもAlphaZeroが勝つと思う DLは計算力の物量を使いこなす技術 ぐぐる先生レベルの物量を持たない人間には縁のない世界だからしかたがないね Katsuki Ohto? @cute_na_piglets AlphaZeroの件、「強いゲームAIを作るためにやるべきことは、ゲームAIのコードを書くことでは無く、 勉強して論文を大きな会議に通してDeepMindに入ること」だということが再確認されたと思う。 自分のやってきたことに悔いはないが、これから何かやろうという人には逃げずに正しい努力をしてほしいな。 ここにソフト導入のやりかたをしつこく聞いてきた人はGoogleの人だったかもしれないなw 毎回そうだけど都合の良いことしか公開しないから本当にそうなのか?って検証が誰にもできない 発表時は後からあれだすよ。これだすよ。と言うが後からではその時点で出来てたのか分からず結果が正しいのか判断もできない 出すと言ってるものはいつになっても出さないし検証されたくない雰囲気がぷんぷん >>783 まず日本語にすら興味ないだろ あっちはオックスフォード卒で英語で博士号とってんだから 棋譜が公開されてないのが残念だが、多分矢倉とか穴熊じゃなくて角道空けて 居飛車の急戦模様、という今のソフトが好きな戦型しかできないと思う チェスは駒得あんまり気にしないらしい。そういうソフトはたぶん珍しいんじゃないのかな? もうちょっとチェス強い人のコメントを聞きたいな 棚瀬 寧 TANASE Yasushi? @tanaseY AlphaZeroのチェスは駒得よりも効率重視か。人間が手で値を付けると駒の価値がどうしても大きくなりますからねえ。 ここら辺の情報からか Chess.com?認証済みアカウント @chesscom >MASTERPIECE! >AlphaZero plays creative positional chess https://twitter.com/chesscom/status/938390544216154112 今までBonanza革命だの、合議制だの、GPSのモンスターマシンだの、 技巧だの、やねうらライブラリだの、絞りだの、ブレンドだの、キメラだの、定跡だの 何十年も必死こいてやってきたのに、Googleの手にかかるとゼロから二時間で余裕でブチ抜かれた 虚しすぎるわ >>777 さすがにパフォーマンスモニタでメモリ使用量くらい見るだろ。 たぶん。 何十年も必至こいたのはニューラルネットワーク関連も一緒でしょ 突然ぽっと出で現れて涼しい顔で結果を出してきたわけじゃない >>789 googleに挑む相手と認められる積み上げがあったことを誇っても良いだろう。 一発で蹴り飛ばされたとしても。 ただ、alphazeroが900点有利から、将棋の複雑な探索勝負の終盤を切り抜けてelmoやトップ将棋ソフトを完封できるのかはまだ疑ってるけど。 終盤戦でNPS900倍差が付いてると、逆王手で手番取られて頓死喰らいまくりのような。 コンピュータ将棋の流行りの薄くて広い玉は読みぬけが怖い。 まさかdeepzeroが穴熊採用ってことはなかろうし。 Jon Ludvig Hammer? @gmjlh ←チェスのGMらしい AlphaZero has a massive winrate against formerly unbeatable Stockfish. It plays insane attacking chess and couples it with profound positional play. If anything chess is looking more exciting! For now. We already knew computers were tactical beasts - it's the positional wins that strike my fancy. Games 7-9 are superb. ChessVibes? @ChessVibes Not only was AlphaZero better than Stockfish after four hours of self tutoring. It also discovered centuries of opening theory all by itself. うる? @urutom chessの#alphazero は相当強いらしい。そしてゲーム内容も美しいとのこと。ポーンを失ってもポジショニング重視で、エンドゲームも正確。 粘りに粘るストックフィッシュを確実に追い詰める。すごい衝撃をみんな受けてることがビデオからもコメ欄からも分かる alphazero shogiの棋譜も見てみたいもんだなあ 二時間って言うけどお化けスペックの二時間だからあんまりそこアピールされてもなって感じ 圧倒的な計算資源あれば素人がやねうら王かApery使うだけでも1週間あればアホみたいに強いのできるだろうし >>789 同じ計算資源があればelmoはさらに強くなってるだろうがな 三駒でもelmoに9割以上はまだ作れるだろうね 全駒関係を見るNNはもっと強くなる可能性を秘めているが 河童絞りってどんな感じなのかは公開されてないんだっけ? そういやDemis Hassabis氏はチェスだけでなく将棋も指せるんだったよな。 棚瀬さんがやってるトライボーディアンみたいなマインドスポーツ大会でずっと優勝していたくらいの ボードゲームマニアらしい http://www.msoworld.com/pentamind/ https://en.wikipedia.org/wiki/Demis_Hassabis#cite_note-Pentamind-63 >>795 サチるから無理だよ ひと工夫しないと頭打ちだからみんな苦労してる >>800 depthあげて教師の質を上げつつ数を増やして過学習避ければまだまだいけると思うんだが AlphaZeloにレーティング推移を見ると 途中で落ちたりもしつつ右肩上がりになってるから 一瞬レーティングが停滞しようがなんだろうが 学習ブン回し続けたら3駒でもまだまだ上がるかもね エルモ、いい時に輝いたな グーグルに相手してもらえて、おいしいポジション 評価値900程度だと、入玉したらドローって可能性も普通にある。 そもそも入玉に対応しているのだろうか。 ガバガバ計測だったが、目標を失った開発者に目標が出来た 今回将棋を扱ってくれたのは良いこと これで平岡さんもヤル気が出たっぽいし >>719 >>561 読めって。 入玉なしなんてあるわけないだろ。 >>785 Zenの加藤さんが、Deepmindのalphagoチームには日本語堪能な人がいるって 言ってるぞ。 >>793 エンドゲームデータベース使わないでチェスでそこまで終盤正確なら、 将棋の終盤もそこまで酷いことにはならなさそうだな (チェスの終盤はあれはあれで相当大変なので) deep neural network, rather than the linear function approximation used in typical chess programs. This provides a much more powerful representation, but may also introduce spurious approximation errors. MCTS averages over these approximation errors, which therefore tend to cancel out when evaluating a large subtree. In contrast, alpha-beta search computes an explicit minimax, which propagates the biggest approximation errors to the root of the subtree. alphago zeroとaperypaqで対局がみたい。 CSAルールで投了までのきちんとした対局を uuunuuunさんがブログで物申してるな、これは面白い AlphaGoの盛り上がりを横目で見てるだけだったのが Google側から将棋に殴り込みかけて来てくれたんだから これはモチベーション上がるやろ ブログよく読むと微妙に的外れなこと書いてある気がしないでもないな、対局にHash10GBも使わんだろさすがに >>795 お化けスペックと言うけど本当に? その話をしてる人が一人しかいないしどうにもよく分からない >>815 今回の時間は、庶民にはとても高価な1080Tiを搭載したPC1台で頑張ると約110年かかるらしいよ いずれにせよ、評価値900は切る値としては低過ぎるよ。 ソフトは強くなればなるほど、早い段階で高い評価が出る傾向が強まるから、 これ終盤に入る前に打ち切られてんじゃね? つまり、DLが苦手とする土俵を避けてる可能性がある。 R4200の評価関数使って、終局まで指せばそこそこいい勝負なんじゃないかな >>816 そこも気になるところだな。 110年かけてそれなら、従来型+DLの方が効率は良いのでは、っていうね。 >>819 別に強い将棋ソフト作りたい訳じゃなくて、DLで色々できるよってアピールだからさ HASHはまぁ4096あたりでもいいような。 >>816 AWSのスポットで100万かければ近いところまで行けるみたいだぞ まぁSDT基準の1080Tiだと既存ソフト+DLの組み合わせの方が強いけど 評価値900程度で、とあるけど そもそもAlphaZeroの900の定義は他の将棋ソフトの5000相当とかってオチはないの? >>821 むしろ、もし金が有り余ってたらAWS使って既存ソフトでdepth16の500億局面とか試してみたいもんだ >>822 評価値-900が10手継続で投了はelmoの方 AlphaZeroは期待勝率が5%未満になったところで投了。 alphazeroはusiプロトコル使ってないっぽく、センチポーン単位の評価値出せないから 囲碁と同じで期待勝率による評価値。 で、将棋の-900が期待勝率5%未満と言えるかどうかだけど、 多分自己対局だけしてたら900ついたら逆転率5%未満じゃないかなあ、 という感じはするんだけど、どうだろね。 >>822 alphagoは5%だよ。投了の設定は。 実際強いんだろうけど定跡の記述もないし、将棋の対局設定の雑さにガッカリ どうせチェスの片手間なんだろうな。 I hope that you may test these programs before declaring AlphaZero beats currently available shogi programs. uuunuuunさん完全に煽ってるよなこれ >>825 あ、そうだったのか… 論文全く見ずお恥ずかしい Anatomy of a Computer Chess Program でいろんな既存手法を説明した後 このセクションで説明されている技術のどれもAlphaZeroで使用されていません。 これらの技術のいくつかは、さらにAlphaZeroのパフォーマンスを向上させることができると思われます。 しかし、私たちは、純粋な自己対局強化学習アプローチに焦点を当て、将来の研究のためにこれらの拡張を残しています。 AlphaGo Zeroでrolloutを使わないのも同じ理由 ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.4 2024/05/19 Walang Kapalit ★ | Donguri System Team 5ちゃんねる