▲コンピュータ将棋スレッド128
■ このスレッドは過去ログ倉庫に格納されています
序中盤DLで終盤は従来のハイブリッドが来年の選手権には増えるのかな? >>749 1手詰め入ってないから互角のままいったときに頓死でワンパン入ってるんじゃね? >>752 ならんとは言えん やねうらエンジンならR4600の評価関数でも似たような結果になるんじゃね 35Mn?でhash1GBって少ないかなあ? スペック差に関してはそもそもCPUとGPUで発展の差があるからまあしょうがないとは思う 1080ti一基だと実力が発揮できない一人だけノートPC使ってるような感じになるし GPSの金子先生 Tomoyuki Kaneko? @tkaneko いくつか気になるので、(ジャーナルなどに投稿されているなら)査読者頑張って欲しい https://twitter.com/tkaneko/status/938282976902868993 elmoをCPU256コア 消費電力1500wにしても 4 TPU 300w +CPU200wに勝てない 低スぺなら勝てる 一発勝負な運ゲー要素ある選手権よりもやはりfloodgate出てきてそれこそ1日中色んなソフトと対局してほしい daigo? @daigog [Shogi-server/Floodgateのお知らせ] 停電のため、12月9日〜11日夜にかけて、停止予定です。 http://wdoor.c.u-tokyo.ac.jp/shogi/ とりあえず序盤は死ぬほど上手いのは間違いないだろうから序盤戦術を見たい 羽生とも指してほしいけど、全盛期の藤井との対局見てみたい 一歩竜王の頃の藤井なら期待できると思ってる やね氏のウェブサイトがぜんぜん違うページになってるんだけど、 ドメインの更新忘れかな http://yaneuraou.yaneu.com/ 囲碁のように画期的な序盤をやるのかどうかってのはホント知りたい ponanzaもelmoを上回っていたことを忘れていた >>735 一敗しなきゃ上位と当たらない欠陥サイトで動かされても・・・ 延々とGPS将棋と当たるgoogle製ソフトとか見たいか? >>764 elmoに無敗ならまだしも、勝率9割(しかも序盤重視の特殊条件)くらいだったらそんな革命的なのはないでしょ YaneuraOu rezero epoch19もかなり人間的な序盤だったわけで 人間の序盤をなめてはいけない 新手は山のように有るだろうけどそれは今も変わらんしな 凄さをアウトプットさせるのは難しい >>770 例えば横歩になったとき先手Alphazeroなら常に勝率100%とかならこれは何かあるぞってならんか? 後手は横歩に付き合ったらほぼ確実に悪くなりますみたいなのがあるかもしれん 普通ではない状況に対応するやり方は多分なんじゃこりゃ的なものはあるんじゃね 根幹はさほど変わらないが、なぜそうすべきなのかの理由付けがまったく変わるという意味で 序盤概念が変わる可能性はあると思う なんかスペック差がどうこう言われてるみたいだけど、elmoよりAlphaZeroのほうがスケールするだろうから、むしろ4TPUしか使ってないAlphaZeroのほうが不利なんじゃ あとαβ法は疎結合並列探索の効率がうんこだから、クラスタ化するとさらに差がひらきそう 全然話変わるんだが、AdaGradで学習するときのetaってどんな感じで変化させるのがベストだと思う? 例えばミニバッチサイズ100000で100億局面学習だったらどんなもんかな? そういえばやねうら王ってHashの設定が特殊(USI_Hashを無視する)けど、日本語わからないチームだとそのあたり大丈夫なんだろうか… お前らがやってたことって Googleが本気出したら2時間で超えられることだったとか 虚しくならないの?wwwwwwwwwwww ポナの上位版って感じしかしないが ソース公開されてるものを後から出してもな 実際に2日で強くなる過程を公開するなら価値があるが >>775 クラスタもそうだし elmo 18コア 165W i9-7980XE Zero 4コア 65W+75W i7-7700 + 1TPU これでもAlphaZeroが勝つと思う DLは計算力の物量を使いこなす技術 ぐぐる先生レベルの物量を持たない人間には縁のない世界だからしかたがないね Katsuki Ohto? @cute_na_piglets AlphaZeroの件、「強いゲームAIを作るためにやるべきことは、ゲームAIのコードを書くことでは無く、 勉強して論文を大きな会議に通してDeepMindに入ること」だということが再確認されたと思う。 自分のやってきたことに悔いはないが、これから何かやろうという人には逃げずに正しい努力をしてほしいな。 ここにソフト導入のやりかたをしつこく聞いてきた人はGoogleの人だったかもしれないなw 毎回そうだけど都合の良いことしか公開しないから本当にそうなのか?って検証が誰にもできない 発表時は後からあれだすよ。これだすよ。と言うが後からではその時点で出来てたのか分からず結果が正しいのか判断もできない 出すと言ってるものはいつになっても出さないし検証されたくない雰囲気がぷんぷん >>783 まず日本語にすら興味ないだろ あっちはオックスフォード卒で英語で博士号とってんだから 棋譜が公開されてないのが残念だが、多分矢倉とか穴熊じゃなくて角道空けて 居飛車の急戦模様、という今のソフトが好きな戦型しかできないと思う チェスは駒得あんまり気にしないらしい。そういうソフトはたぶん珍しいんじゃないのかな? もうちょっとチェス強い人のコメントを聞きたいな 棚瀬 寧 TANASE Yasushi? @tanaseY AlphaZeroのチェスは駒得よりも効率重視か。人間が手で値を付けると駒の価値がどうしても大きくなりますからねえ。 ここら辺の情報からか Chess.com?認証済みアカウント @chesscom >MASTERPIECE! >AlphaZero plays creative positional chess https://twitter.com/chesscom/status/938390544216154112 今までBonanza革命だの、合議制だの、GPSのモンスターマシンだの、 技巧だの、やねうらライブラリだの、絞りだの、ブレンドだの、キメラだの、定跡だの 何十年も必死こいてやってきたのに、Googleの手にかかるとゼロから二時間で余裕でブチ抜かれた 虚しすぎるわ >>777 さすがにパフォーマンスモニタでメモリ使用量くらい見るだろ。 たぶん。 何十年も必至こいたのはニューラルネットワーク関連も一緒でしょ 突然ぽっと出で現れて涼しい顔で結果を出してきたわけじゃない >>789 googleに挑む相手と認められる積み上げがあったことを誇っても良いだろう。 一発で蹴り飛ばされたとしても。 ただ、alphazeroが900点有利から、将棋の複雑な探索勝負の終盤を切り抜けてelmoやトップ将棋ソフトを完封できるのかはまだ疑ってるけど。 終盤戦でNPS900倍差が付いてると、逆王手で手番取られて頓死喰らいまくりのような。 コンピュータ将棋の流行りの薄くて広い玉は読みぬけが怖い。 まさかdeepzeroが穴熊採用ってことはなかろうし。 Jon Ludvig Hammer? @gmjlh ←チェスのGMらしい AlphaZero has a massive winrate against formerly unbeatable Stockfish. It plays insane attacking chess and couples it with profound positional play. If anything chess is looking more exciting! For now. We already knew computers were tactical beasts - it's the positional wins that strike my fancy. Games 7-9 are superb. ChessVibes? @ChessVibes Not only was AlphaZero better than Stockfish after four hours of self tutoring. It also discovered centuries of opening theory all by itself. うる? @urutom chessの#alphazero は相当強いらしい。そしてゲーム内容も美しいとのこと。ポーンを失ってもポジショニング重視で、エンドゲームも正確。 粘りに粘るストックフィッシュを確実に追い詰める。すごい衝撃をみんな受けてることがビデオからもコメ欄からも分かる alphazero shogiの棋譜も見てみたいもんだなあ 二時間って言うけどお化けスペックの二時間だからあんまりそこアピールされてもなって感じ 圧倒的な計算資源あれば素人がやねうら王かApery使うだけでも1週間あればアホみたいに強いのできるだろうし >>789 同じ計算資源があればelmoはさらに強くなってるだろうがな 三駒でもelmoに9割以上はまだ作れるだろうね 全駒関係を見るNNはもっと強くなる可能性を秘めているが 河童絞りってどんな感じなのかは公開されてないんだっけ? そういやDemis Hassabis氏はチェスだけでなく将棋も指せるんだったよな。 棚瀬さんがやってるトライボーディアンみたいなマインドスポーツ大会でずっと優勝していたくらいの ボードゲームマニアらしい http://www.msoworld.com/pentamind/ https://en.wikipedia.org/wiki/Demis_Hassabis#cite_note-Pentamind-63 >>795 サチるから無理だよ ひと工夫しないと頭打ちだからみんな苦労してる >>800 depthあげて教師の質を上げつつ数を増やして過学習避ければまだまだいけると思うんだが AlphaZeloにレーティング推移を見ると 途中で落ちたりもしつつ右肩上がりになってるから 一瞬レーティングが停滞しようがなんだろうが 学習ブン回し続けたら3駒でもまだまだ上がるかもね エルモ、いい時に輝いたな グーグルに相手してもらえて、おいしいポジション 評価値900程度だと、入玉したらドローって可能性も普通にある。 そもそも入玉に対応しているのだろうか。 ガバガバ計測だったが、目標を失った開発者に目標が出来た 今回将棋を扱ってくれたのは良いこと これで平岡さんもヤル気が出たっぽいし >>719 >>561 読めって。 入玉なしなんてあるわけないだろ。 >>785 Zenの加藤さんが、Deepmindのalphagoチームには日本語堪能な人がいるって 言ってるぞ。 >>793 エンドゲームデータベース使わないでチェスでそこまで終盤正確なら、 将棋の終盤もそこまで酷いことにはならなさそうだな (チェスの終盤はあれはあれで相当大変なので) deep neural network, rather than the linear function approximation used in typical chess programs. This provides a much more powerful representation, but may also introduce spurious approximation errors. MCTS averages over these approximation errors, which therefore tend to cancel out when evaluating a large subtree. In contrast, alpha-beta search computes an explicit minimax, which propagates the biggest approximation errors to the root of the subtree. alphago zeroとaperypaqで対局がみたい。 CSAルールで投了までのきちんとした対局を uuunuuunさんがブログで物申してるな、これは面白い AlphaGoの盛り上がりを横目で見てるだけだったのが Google側から将棋に殴り込みかけて来てくれたんだから これはモチベーション上がるやろ ブログよく読むと微妙に的外れなこと書いてある気がしないでもないな、対局にHash10GBも使わんだろさすがに >>795 お化けスペックと言うけど本当に? その話をしてる人が一人しかいないしどうにもよく分からない >>815 今回の時間は、庶民にはとても高価な1080Tiを搭載したPC1台で頑張ると約110年かかるらしいよ いずれにせよ、評価値900は切る値としては低過ぎるよ。 ソフトは強くなればなるほど、早い段階で高い評価が出る傾向が強まるから、 これ終盤に入る前に打ち切られてんじゃね? つまり、DLが苦手とする土俵を避けてる可能性がある。 R4200の評価関数使って、終局まで指せばそこそこいい勝負なんじゃないかな >>816 そこも気になるところだな。 110年かけてそれなら、従来型+DLの方が効率は良いのでは、っていうね。 >>819 別に強い将棋ソフト作りたい訳じゃなくて、DLで色々できるよってアピールだからさ HASHはまぁ4096あたりでもいいような。 >>816 AWSのスポットで100万かければ近いところまで行けるみたいだぞ まぁSDT基準の1080Tiだと既存ソフト+DLの組み合わせの方が強いけど 評価値900程度で、とあるけど そもそもAlphaZeroの900の定義は他の将棋ソフトの5000相当とかってオチはないの? >>821 むしろ、もし金が有り余ってたらAWS使って既存ソフトでdepth16の500億局面とか試してみたいもんだ >>822 評価値-900が10手継続で投了はelmoの方 AlphaZeroは期待勝率が5%未満になったところで投了。 alphazeroはusiプロトコル使ってないっぽく、センチポーン単位の評価値出せないから 囲碁と同じで期待勝率による評価値。 で、将棋の-900が期待勝率5%未満と言えるかどうかだけど、 多分自己対局だけしてたら900ついたら逆転率5%未満じゃないかなあ、 という感じはするんだけど、どうだろね。 >>822 alphagoは5%だよ。投了の設定は。 実際強いんだろうけど定跡の記述もないし、将棋の対局設定の雑さにガッカリ どうせチェスの片手間なんだろうな。 I hope that you may test these programs before declaring AlphaZero beats currently available shogi programs. uuunuuunさん完全に煽ってるよなこれ >>825 あ、そうだったのか… 論文全く見ずお恥ずかしい Anatomy of a Computer Chess Program でいろんな既存手法を説明した後 このセクションで説明されている技術のどれもAlphaZeroで使用されていません。 これらの技術のいくつかは、さらにAlphaZeroのパフォーマンスを向上させることができると思われます。 しかし、私たちは、純粋な自己対局強化学習アプローチに焦点を当て、将来の研究のためにこれらの拡張を残しています。 AlphaGo Zeroでrolloutを使わないのも同じ理由 英語が苦手で、結果として煽るニュアンスになってたらワロス まふさんが検証してるけど、公開の投了値の設定ならaperypaqでも今回くらいの結果は出せるみたい。 elmoに勝ったとか言ってるけどさぁ、もっと強いソフトあるし、そもそも設定ちゃんとしてそいつら倒してから出直してくれない? って言ってるよなこれw A transposition table facilitates the reuse of values and move orders when the same position is reached by multiple paths. と説明しちゃってるから、ハッシュも使ってないんだ AlphaGo Zeroでは使ってたのに ハッシュ使っただけでも少しは強くなるだろうな >>830 つまりドラゴンボールで例えると AlphaZeroはフリーザ第一形態って訳だな Anatomy of a Computer Chess Programで opening book、endgame tablebaseも説明してるから使ってない ハサビスのツイート見なくても論文読めばわかることだったか やっぱり英語力がないと怖いな。間違ったニュアンスで伝わってしまう AlphaGoZeroの時には40日回したのに 12時間しか回してない時点で察して欲しいよね。 相手にならないから途中で論文書き始めただけ。 googleの事だから 裏ではまだ学習回しているだろうし 次回の論文ではブッチギリに強い結果を出してきて黙らせに来るよ。 >>837 これ見た感じだと時間さえあれば天井知らずで強くなる、ってわけでもなさそう ttp://www.itmedia.co.jp/news/articles/1712/06/news138.html ttp://image.itmedia.co.jp/l/im/news/articles/1712/06/l_ki1609376_alphazero01.jpg アピールなんだから短時間でこれだけ強くできるって出さなきゃ見向きもされないだろう 実際にどれだけの時間がかかるかは分からないから鵜呑みには出来ないが あとルール以外教えてないよってのがどこまで本当かってのも重要だろう これで汎用性をアピールしてるんだし 入玉ありで最後までやらせたら40勝10敗50引き分けとかになりそう グーグルに嫉妬してもしかたないだろ。素直にほめてやれよ。 アルファシリーズを有料販売してくれないかな。有料と言っても格安でね。 AlphaGo Zeroは1万2000くらいだっけ 囲碁の方だと6月くらいにツールを出しますと言って半年経っても出せてないしある程度のクオリティ(論文で発表してる強さ)になるまで出さないと思うが >>873 汎用性のアピールに将棋とチェスが選ばれただけだから、既にDEEPMINDは違うことやってるで たぶん 世の中金ってことがよくわかってしまってほんと悲しい >>837 だった。 設定に関して突っ込みどころ満載だったから仕方ないね。 将棋に関しては半年後くらいに達成できそうな強さだけど チェスはかなり未来に行った強さに感じるね。 ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.5 2024/06/08 Walang Kapalit ★ | Donguri System Team 5ちゃんねる