▲コンピュータ将棋スレッド128
■ このスレッドは過去ログ倉庫に格納されています
そういえばやねうら王ってHashの設定が特殊(USI_Hashを無視する)けど、日本語わからないチームだとそのあたり大丈夫なんだろうか… お前らがやってたことって Googleが本気出したら2時間で超えられることだったとか 虚しくならないの?wwwwwwwwwwww ポナの上位版って感じしかしないが ソース公開されてるものを後から出してもな 実際に2日で強くなる過程を公開するなら価値があるが >>775 クラスタもそうだし elmo 18コア 165W i9-7980XE Zero 4コア 65W+75W i7-7700 + 1TPU これでもAlphaZeroが勝つと思う DLは計算力の物量を使いこなす技術 ぐぐる先生レベルの物量を持たない人間には縁のない世界だからしかたがないね Katsuki Ohto? @cute_na_piglets AlphaZeroの件、「強いゲームAIを作るためにやるべきことは、ゲームAIのコードを書くことでは無く、 勉強して論文を大きな会議に通してDeepMindに入ること」だということが再確認されたと思う。 自分のやってきたことに悔いはないが、これから何かやろうという人には逃げずに正しい努力をしてほしいな。 ここにソフト導入のやりかたをしつこく聞いてきた人はGoogleの人だったかもしれないなw 毎回そうだけど都合の良いことしか公開しないから本当にそうなのか?って検証が誰にもできない 発表時は後からあれだすよ。これだすよ。と言うが後からではその時点で出来てたのか分からず結果が正しいのか判断もできない 出すと言ってるものはいつになっても出さないし検証されたくない雰囲気がぷんぷん >>783 まず日本語にすら興味ないだろ あっちはオックスフォード卒で英語で博士号とってんだから 棋譜が公開されてないのが残念だが、多分矢倉とか穴熊じゃなくて角道空けて 居飛車の急戦模様、という今のソフトが好きな戦型しかできないと思う チェスは駒得あんまり気にしないらしい。そういうソフトはたぶん珍しいんじゃないのかな? もうちょっとチェス強い人のコメントを聞きたいな 棚瀬 寧 TANASE Yasushi? @tanaseY AlphaZeroのチェスは駒得よりも効率重視か。人間が手で値を付けると駒の価値がどうしても大きくなりますからねえ。 ここら辺の情報からか Chess.com?認証済みアカウント @chesscom >MASTERPIECE! >AlphaZero plays creative positional chess https://twitter.com/chesscom/status/938390544216154112 今までBonanza革命だの、合議制だの、GPSのモンスターマシンだの、 技巧だの、やねうらライブラリだの、絞りだの、ブレンドだの、キメラだの、定跡だの 何十年も必死こいてやってきたのに、Googleの手にかかるとゼロから二時間で余裕でブチ抜かれた 虚しすぎるわ >>777 さすがにパフォーマンスモニタでメモリ使用量くらい見るだろ。 たぶん。 何十年も必至こいたのはニューラルネットワーク関連も一緒でしょ 突然ぽっと出で現れて涼しい顔で結果を出してきたわけじゃない >>789 googleに挑む相手と認められる積み上げがあったことを誇っても良いだろう。 一発で蹴り飛ばされたとしても。 ただ、alphazeroが900点有利から、将棋の複雑な探索勝負の終盤を切り抜けてelmoやトップ将棋ソフトを完封できるのかはまだ疑ってるけど。 終盤戦でNPS900倍差が付いてると、逆王手で手番取られて頓死喰らいまくりのような。 コンピュータ将棋の流行りの薄くて広い玉は読みぬけが怖い。 まさかdeepzeroが穴熊採用ってことはなかろうし。 Jon Ludvig Hammer? @gmjlh ←チェスのGMらしい AlphaZero has a massive winrate against formerly unbeatable Stockfish. It plays insane attacking chess and couples it with profound positional play. If anything chess is looking more exciting! For now. We already knew computers were tactical beasts - it's the positional wins that strike my fancy. Games 7-9 are superb. ChessVibes? @ChessVibes Not only was AlphaZero better than Stockfish after four hours of self tutoring. It also discovered centuries of opening theory all by itself. うる? @urutom chessの#alphazero は相当強いらしい。そしてゲーム内容も美しいとのこと。ポーンを失ってもポジショニング重視で、エンドゲームも正確。 粘りに粘るストックフィッシュを確実に追い詰める。すごい衝撃をみんな受けてることがビデオからもコメ欄からも分かる alphazero shogiの棋譜も見てみたいもんだなあ 二時間って言うけどお化けスペックの二時間だからあんまりそこアピールされてもなって感じ 圧倒的な計算資源あれば素人がやねうら王かApery使うだけでも1週間あればアホみたいに強いのできるだろうし >>789 同じ計算資源があればelmoはさらに強くなってるだろうがな 三駒でもelmoに9割以上はまだ作れるだろうね 全駒関係を見るNNはもっと強くなる可能性を秘めているが 河童絞りってどんな感じなのかは公開されてないんだっけ? そういやDemis Hassabis氏はチェスだけでなく将棋も指せるんだったよな。 棚瀬さんがやってるトライボーディアンみたいなマインドスポーツ大会でずっと優勝していたくらいの ボードゲームマニアらしい http://www.msoworld.com/pentamind/ https://en.wikipedia.org/wiki/Demis_Hassabis#cite_note-Pentamind-63 >>795 サチるから無理だよ ひと工夫しないと頭打ちだからみんな苦労してる >>800 depthあげて教師の質を上げつつ数を増やして過学習避ければまだまだいけると思うんだが AlphaZeloにレーティング推移を見ると 途中で落ちたりもしつつ右肩上がりになってるから 一瞬レーティングが停滞しようがなんだろうが 学習ブン回し続けたら3駒でもまだまだ上がるかもね エルモ、いい時に輝いたな グーグルに相手してもらえて、おいしいポジション 評価値900程度だと、入玉したらドローって可能性も普通にある。 そもそも入玉に対応しているのだろうか。 ガバガバ計測だったが、目標を失った開発者に目標が出来た 今回将棋を扱ってくれたのは良いこと これで平岡さんもヤル気が出たっぽいし >>719 >>561 読めって。 入玉なしなんてあるわけないだろ。 >>785 Zenの加藤さんが、Deepmindのalphagoチームには日本語堪能な人がいるって 言ってるぞ。 >>793 エンドゲームデータベース使わないでチェスでそこまで終盤正確なら、 将棋の終盤もそこまで酷いことにはならなさそうだな (チェスの終盤はあれはあれで相当大変なので) deep neural network, rather than the linear function approximation used in typical chess programs. This provides a much more powerful representation, but may also introduce spurious approximation errors. MCTS averages over these approximation errors, which therefore tend to cancel out when evaluating a large subtree. In contrast, alpha-beta search computes an explicit minimax, which propagates the biggest approximation errors to the root of the subtree. alphago zeroとaperypaqで対局がみたい。 CSAルールで投了までのきちんとした対局を uuunuuunさんがブログで物申してるな、これは面白い AlphaGoの盛り上がりを横目で見てるだけだったのが Google側から将棋に殴り込みかけて来てくれたんだから これはモチベーション上がるやろ ブログよく読むと微妙に的外れなこと書いてある気がしないでもないな、対局にHash10GBも使わんだろさすがに >>795 お化けスペックと言うけど本当に? その話をしてる人が一人しかいないしどうにもよく分からない >>815 今回の時間は、庶民にはとても高価な1080Tiを搭載したPC1台で頑張ると約110年かかるらしいよ いずれにせよ、評価値900は切る値としては低過ぎるよ。 ソフトは強くなればなるほど、早い段階で高い評価が出る傾向が強まるから、 これ終盤に入る前に打ち切られてんじゃね? つまり、DLが苦手とする土俵を避けてる可能性がある。 R4200の評価関数使って、終局まで指せばそこそこいい勝負なんじゃないかな >>816 そこも気になるところだな。 110年かけてそれなら、従来型+DLの方が効率は良いのでは、っていうね。 >>819 別に強い将棋ソフト作りたい訳じゃなくて、DLで色々できるよってアピールだからさ HASHはまぁ4096あたりでもいいような。 >>816 AWSのスポットで100万かければ近いところまで行けるみたいだぞ まぁSDT基準の1080Tiだと既存ソフト+DLの組み合わせの方が強いけど 評価値900程度で、とあるけど そもそもAlphaZeroの900の定義は他の将棋ソフトの5000相当とかってオチはないの? >>821 むしろ、もし金が有り余ってたらAWS使って既存ソフトでdepth16の500億局面とか試してみたいもんだ >>822 評価値-900が10手継続で投了はelmoの方 AlphaZeroは期待勝率が5%未満になったところで投了。 alphazeroはusiプロトコル使ってないっぽく、センチポーン単位の評価値出せないから 囲碁と同じで期待勝率による評価値。 で、将棋の-900が期待勝率5%未満と言えるかどうかだけど、 多分自己対局だけしてたら900ついたら逆転率5%未満じゃないかなあ、 という感じはするんだけど、どうだろね。 >>822 alphagoは5%だよ。投了の設定は。 実際強いんだろうけど定跡の記述もないし、将棋の対局設定の雑さにガッカリ どうせチェスの片手間なんだろうな。 I hope that you may test these programs before declaring AlphaZero beats currently available shogi programs. uuunuuunさん完全に煽ってるよなこれ >>825 あ、そうだったのか… 論文全く見ずお恥ずかしい Anatomy of a Computer Chess Program でいろんな既存手法を説明した後 このセクションで説明されている技術のどれもAlphaZeroで使用されていません。 これらの技術のいくつかは、さらにAlphaZeroのパフォーマンスを向上させることができると思われます。 しかし、私たちは、純粋な自己対局強化学習アプローチに焦点を当て、将来の研究のためにこれらの拡張を残しています。 AlphaGo Zeroでrolloutを使わないのも同じ理由 英語が苦手で、結果として煽るニュアンスになってたらワロス まふさんが検証してるけど、公開の投了値の設定ならaperypaqでも今回くらいの結果は出せるみたい。 elmoに勝ったとか言ってるけどさぁ、もっと強いソフトあるし、そもそも設定ちゃんとしてそいつら倒してから出直してくれない? って言ってるよなこれw A transposition table facilitates the reuse of values and move orders when the same position is reached by multiple paths. と説明しちゃってるから、ハッシュも使ってないんだ AlphaGo Zeroでは使ってたのに ハッシュ使っただけでも少しは強くなるだろうな >>830 つまりドラゴンボールで例えると AlphaZeroはフリーザ第一形態って訳だな Anatomy of a Computer Chess Programで opening book、endgame tablebaseも説明してるから使ってない ハサビスのツイート見なくても論文読めばわかることだったか やっぱり英語力がないと怖いな。間違ったニュアンスで伝わってしまう AlphaGoZeroの時には40日回したのに 12時間しか回してない時点で察して欲しいよね。 相手にならないから途中で論文書き始めただけ。 googleの事だから 裏ではまだ学習回しているだろうし 次回の論文ではブッチギリに強い結果を出してきて黙らせに来るよ。 >>837 これ見た感じだと時間さえあれば天井知らずで強くなる、ってわけでもなさそう ttp://www.itmedia.co.jp/news/articles/1712/06/news138.html ttp://image.itmedia.co.jp/l/im/news/articles/1712/06/l_ki1609376_alphazero01.jpg アピールなんだから短時間でこれだけ強くできるって出さなきゃ見向きもされないだろう 実際にどれだけの時間がかかるかは分からないから鵜呑みには出来ないが あとルール以外教えてないよってのがどこまで本当かってのも重要だろう これで汎用性をアピールしてるんだし 入玉ありで最後までやらせたら40勝10敗50引き分けとかになりそう グーグルに嫉妬してもしかたないだろ。素直にほめてやれよ。 アルファシリーズを有料販売してくれないかな。有料と言っても格安でね。 AlphaGo Zeroは1万2000くらいだっけ 囲碁の方だと6月くらいにツールを出しますと言って半年経っても出せてないしある程度のクオリティ(論文で発表してる強さ)になるまで出さないと思うが >>873 汎用性のアピールに将棋とチェスが選ばれただけだから、既にDEEPMINDは違うことやってるで たぶん 世の中金ってことがよくわかってしまってほんと悲しい >>837 だった。 設定に関して突っ込みどころ満載だったから仕方ないね。 将棋に関しては半年後くらいに達成できそうな強さだけど チェスはかなり未来に行った強さに感じるね。 AlphaZeroに1発も入らなかったStockfish先輩マジ可哀想 伸びることは伸びるだろうな、R5000には届かないかもだが >>776 そういう苦労をしないためのAdaGradなんじゃね? NGCでアクセスできるAIやHPC用ソフトウェアも増加:NVIDIA TITANユーザーがAI開発に「NVIDIA GPU Cloud(NGC)」を利用可能に - @IT http://www.atmarkit.co.jp/ait/articles/1712/06/news061.html >>848 コンピューター将棋開発者って趣味で開発してるわけだし学習、対局に数百万は出せんわな。 その計算資源を他の学習方法にまわせばもっと強いのができるっていうけど、将棋ソフト未経験者がノウハウなしに作ったことに価値があるんだろう 3つ星レストランの味をご家庭で味わえますって感じで いや、箱根に歩いていこうとしていたら新幹線で追い抜かれたって感じだわ deepmindに物申すのはいいけど自分が何者かでどういう実績があるのか説明しないと、俺らがここで煽ってるのと同じ扱いされるような Googleの将棋ソフトがelmo超えたのニュースの反応見ても 日本人は嫉妬深いですね 屁理屈こねて否定ばかしの開発者 見苦しさは渡辺明のようですね >>862 大丈夫ここ便所の落書きと違って、ほとんど開発者は論文を読んだ上で冷静に分析してるよ。 査読中みたいだし保木さんや金子さんは引用されているから物言う資格はあるだろう 対局条件をもっと将棋に合わせて再実験してほしいね 評価値3000とか手数300とかに 妬むと言うんだろうか 科学の論文で根拠を出さない方が変だと思うが 同じ位の既存が無いなら凄いって話で終わるけど WCSCまでにR4500くらいの評価関数を用意してalphazeroを招待したいもんだ 論文発表は、NatureかScienceとかだろうね >>865 いや〜それがdeepmindに伝わっているかどうかが問題で 送っただけじゃたくさんあるクレームの一つで終わっちゃうのではと WCSCルールならaperypaqの方が強いだろ 新バージョンのalphazero作ってくれるなら見てみたいけど チャンピオンベルトを持ってないから仕方ないね。 本番での強さがこういう場面で大きく響いてくる。 Qhapaqが廃課金して臨んでいたら 論文に載っていたのはelmoではなくQhapaqだったかもしれないけど後の祭り。 これさ。将棋AI開発者が挑戦状たたきつけたら、公開対局してくれるんじゃね? alphazero倒すためにAWS使って超強い評価関数作るためのクラウドファンディングやって 見返りは完成した評価関数とかだったらある程度金集まるかな? ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる