▲コンピュータ将棋スレッド128
■ このスレッドは過去ログ倉庫に格納されています
通過枠は放棄の分は増やしてたぞ。 場違いに強い奴と当たって負けると不満に思うのはわかるが。 しかしライブラリがあれだけ強い以上 シード放棄を禁じても初出場で一次予選から上位の実力者は出てくるとも思う 通信の遅延などの質は会場まで行かないと分からないからな ぶっつけで二次予選初戦落とすよりかは一次で落とす方がマシ >>286 シード権放棄の分は通過枠は増えない。 通過枠が増えるのは「シード権保持者の4月1日以降の参加キャンセル」だけ。 >>283 >>288 シード権放棄の分は通過枠は増えないんだったら、実質通過枠減らないじゃん >>289 いや、通過するかどうかギリギリのソフトが繰り上がりでシード権得て 通過するのが確実のソフトが上から降りてくるんだから、どう考えても 実質通過枠減ってるよね。 >>290 だから、シード権放棄の分は通過枠は増えないんだってば 「通過するかどうかギリギリのソフトが繰り上が」らないってば なるほど上位がシード放棄すると、 前年に17位よりもっと下だったソフトが順に一次免除になってくルールだったんすねー 確かにこれだと一次予選の難易度が上がっちまいますね。 シード放棄が問題というよりその分のシード権が下位に回るのが問題のように感じる。 ライブラリのルール含めルール直すところはたくさんあるのにシード権だけ >>293 >>294 もうCSAの方も割とルールが滅茶苦茶なんだよな。 今の時代に即してない >>293 シード権獲得者が次の大会に出ないのはこの大会では日常茶飯事だから 欠場者の分のシード権繰り上げは当然よな。 で、シード権繰り上げがある以上は、シード権放棄に伴う繰り上げもある、 というのは当然ではないにせよ不自然ではなかったわけだ。 もちろん、シード権放棄を認めない、も放棄された分枠を増やす、もあり。 ただ、基本的にはこの大会3日間東京でやる、ということを考えると、 地方在住者の宿泊費負担を考えれば、2日目からの参加者をできるだけ増やしたほうが いいという判断もあるわけで、1次の枠増やす代わりに繰り上げ禁止、はないかなと。 そうするとシード権放棄を認めないのが一番落ち着きはいいよな。 >>294-295 そうか? 理想を言えばきりがないだけの話で、今のルールは割りとよくできてると思うぞ。 WCSCは賞金もかかってないし、ハード制限ないから実質競技というよりはお祭りだから あまりルールでがちがちに縛るのは違うんじゃないかと思ったりするけどね。 apery「四駒のためにいじってたら学習部改善されてなんかしらんけど評価関数めっちゃ強くなったわ」 yorkie「四駒のためにいじってたら探索部改善されてなんかしらんけどノードめっちゃ出るようになったわ」 時代は四駒だな >>278 正当性担保のためにwscsのための提出分としてはだらだら書かずに25ページ以内にまとめてこいってことだろ。 伝わる人にしか伝わらない例えをするならばmmd杯の本線動画時間を5分以内に収めよという趣旨と同じ より詳しく知りたい人向けに別にリンクを貼って読んでもらう事はOK んで結局肝心の256手ルールやライブラリについてはどーなるんですかーと ライブラリはどんなルールが良いか開発者でも意見が分かれるからな 自作しか認めるなって人からなんでも使ってOKにすべきって人までいる なんか来たぞ Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm David Silver, Thomas Hubert, Julian Schrittwieser, Ioannis Antonoglou, Matthew Lai, Arthur Guez, Marc Lanctot, Laurent Sifre, Dharshan Kumaran, Thore Graepel, Timothy Lillicrap, Karen Simonyan, Demis Hassabis (Submitted on 5 Dec 2017) The game of chess is the most widely-studied domain in the history of artificial intelligence. The strongest programs are based on a combination of sophisticated search techniques, domain-specific adaptations, and handcrafted evaluation functions that have been refined by human experts over several decades. In contrast, the AlphaGo Zero program recently achieved superhuman performance in the game of Go, by tabula rasa reinforcement learning from games of self-play. In this paper, we generalise this approach into a single AlphaZero algorithm that can achieve, tabula rasa, superhuman performance in many challenging domains. Starting from random play, and given no domain knowledge except the game rules, AlphaZero achieved within 24 hours a superhuman level of play in the games of chess and shogi (Japanese chess) as well as Go, and convincingly defeated a world-champion program in each case. https://arxiv.org/abs/1712.01815 げげーーーーーーーー!!! convincingly defeated a world-champion program in each case. ????すげーーーー AlphaZeroが最強将棋ソフトに勝ったということですか 500以上の差は測れないだけじゃないかな 結局やりましたー勝ちましたって言われても状態ではある エルモ相手に+500くらい チェスの方は微差っぽい Elmoに対して 先手Alpha 43勝5敗2分け 後手Alpha 47勝3敗 トータル 90勝8敗2分け >>316 drawが多いからレート的には微差だけど 先手で50%ぐらい勝ち越してる >>317 将棋における黒盤は先手でいいんだよな チェスだけ逆だからその辺間違ってたりしないよなw チェスは棋譜載ってるのに 将棋は棋譜載ってない・・・ KI2形式で乗っけてくれw CSAは次のWCSCにAlphaShogiを招待するべき evaluation speedはノード数で良いのかな? エルモ35000kに対して アルファゼロは40kか 囲碁、将棋、チェスの順で評価関数(大局観)の方が読みの深さより重要になってくるからそれだけ 深層学習では伸び率が大きいって感じなんかな? 相性問題でelmoにだけ勝ち越してるってことはない?yaselmoに9割勝ってるのにr4200無かったとかあるし やっぱり日曜プログラマーだらけのとこに、deep mind様かやってきたら一瞬で駆逐されちゃうよね floodgateに来てほしいな またはsdt5の上位プログラム全部Googleに送り付けよう 入玉ルールは無しでやってるけど 入玉将棋にはならなかったのかな 入玉自体を制限するのは無理だろうし点数関係なく相入玉したら引き分け扱いとか? グーグルがちょっと本気だしたら将棋ソフトの歴史40年があっさり否定されてワロタ >>336 千日手になるまでやったとか? 終局までの手数もわからないし256手ルール入れた場合引き分け数はもっと多いかも? とりあえず誰か棋譜チョーダイしてきてw それより、チェスのvsストックフィッシュの 先手Alpha 25勝0敗25分け 後手Alpha 3勝0敗47分け の方がびっくりしたよ こんなゲームなの?チェスって アルファ将棋とブーハー竜王のワンマッチやって山本さんを涙目にさせよう ワロタ https://twitter.com/ymg_aq/status/938255270144237568 5000TPUを12時間投入してelmo+400。 GTX1080Tiなら110年くらい学習すれば実現できますね。 グーグルを超えるアイデアあっても計算に100年ではどうにもならん 正直今の三駒の学習でも、depth32で有意な5000億局面が用意できればR4400くらいなら行くと思うんだ 滝澤「elmoじゃなくてElmoって書いてあるから書き直しな」 まあその計算資源をディープラーニングじゃなくて既存の評価関数の学習法でやればもっと強くなるんじゃないかとは思うよな 現時点でもR4200くらいまできてるし、意外とそんなに騒ぐほどでも無さそうな気がしてきた Googleとしては汎用性のアピールをしたいからチャンピオンクラスに有意に勝てるならそれでよしということではないかな >>352 結局そういうことなんだよね でも将棋で負けっぱなしは嫌だから、誰か開発者の人にスパコン貸してあげて > AlphaZero achieved within 24 hours a superhuman level of play in the games of chess and shogi (Japanese chess) as well as Go, ここだろ最注目は >>351 右の方の実レートがどれだけあるのかっていう怖さはあるけどね 引き分け率少ないからひたすら伸びていってる可能性もあるし 4400ぐらいで止まってる可能性もある 1080Ti使って110年とかワロス elmoとだとレート差離れすぎててわからんな aperypaqもelmoに8割だし >>356 計算資源さえまともに確保できれば、三駒でもR4500以上は堅いと思ってる あっちがこのままR5000とかまで行くならちょっとどうしようもないかもだが >>339 今やってるTCEC見ても、そんなもん。 決勝100回戦の89回戦終了時点でHoudiniの14勝9敗66分だけど、 後手番でHoudini1勝、Komodo2勝。これでも今年は後手の勝利が多いくらい。 膨大な計算資源・非公開とか数年前のポナですね分かります。 >>360 論文出してるだけponaよりはるかに上 resignValue -900だってよ これは終盤弱いDLの弱点をごまかしてるな。 aperypaqとどっこいどっこいじゃね ポナンザがゴミだとすると、Googleは天界の神だ やっば…日曜AI連合に火付いたぞ、これ。 終わりかけのお通夜ムードが一転して、ワンチャン王道展開まであるぞ… このレベルのDLなら単体のほうが3駒ハイブリッドより強いのかな しかし、deepmindの連中、将棋所どうやって使ったんだろうな。 英語スキンも自分たちで開発したのか? あと、AlphaZeroをusi対応したのか、対局どうやってやったのかも気になる。 ゼロレベルから学習して1日で将棋の名人を超えるらしい・・・ dasapon? @dasapon17 resignValue -900ってちょい早くないかなぁ? これもあるし、MCTS based だと終盤弱い、みたいなことが起こってる可能性もあるので 平岡 拓也??\(´・_・` )/??? @HiraokaTakuya ほんとだ(´・_・`)将棋は終盤がクソむずいから3000点くらいまは少なくとも見て欲しい気もする(´・_・`) そうそう!(´・_・`)そこ気になるんですよね?(´・_・`) なお1080Ti一枚だと数十年近くかかる模様。 平岡さんいわく3駒でもこの程度ならマシンリソースさえあれば越えられるみたいね。 それに-900で打ちきりにしてるから盛り気味のレート おまえら、もし日本に米の将棋プログラムが攻めてきて、向こうの大将と日本代表が将棋一番勝負で対決し、負けたら植民地にされる という事態になったら、日本代表はどうするの? 将棋でも少なくとも序中盤は深層学習で強くなる余地あるってことかな 俺はあまり関わりたくないが、この結末だけは見届けてやろうと思う Google VS やねうら関数・aperyキメラ連合 オッズは?ちなみに俺は現時点ではGoogleね AlphaZeroは藤井猛だった? 投了値900で判定勝ちなら藤井は永世7冠取ってただろうし ていうか、千田はこれ終わったパターンあるぞwあいつ間違った評価身に着けてやんのw早とちりめw 研究用途では序盤が重要だから googleの計測方法の方が実用的なソフトを抽出出来るよね Google出てきたけどやねうら王は開発続けるのかな? >>373 そうは言うけどさ >-900 centipawns for 10 consecutive moves for Stockfish and Elmo, 5% winrate for AlphaZero だから、10手連続で-900以下だったら投了で、この場合は勝率5%以下だっていうから、 そこまで大きな影響は出てないだろ。統計的には処理できるレベルで。 日曜将棋AI連合がクラウドファンディングとかやらないかな ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.5 2024/06/08 Walang Kapalit ★ | Donguri System Team 5ちゃんねる