▲コンピュータ将棋スレッド128
■ このスレッドは過去ログ倉庫に格納されています
>>226 >>227 言いたかったのは、ほぼそういうことです。 信頼って言葉つかったから誤解を招いた。 1000局とかやった方が信頼できるに決まっている。 人は7番勝負で勝敗決める大会もある・・・それと比べたら100局でも多い。 ソフトだから1000局〜2000局って発想が自分にはないなあ。 今のところ、aaa対paqは秒読み1秒と長時間でも同じ位の勝率になっているけど、apery _sdt5とQhapaq_sdt5の合成のときは、明らかに短時間では超強くて、長時間では超弱 かった。 TCEC10のsuperfinal77回戦、Houdiniも後手番で1勝。お互いに後手番ブレイク1つずつ。 まだまだ後手で勝てるもんなんだねえ。 最近は二項分布のうんちくとか、有意に強いといえる対局数一覧とか貼られないから統計数への意識が低いな みんな自分で少し計算してみたらどうだ? 数学的な信頼性とは数字で表せるものよ 統計的には不十分でも例えばyaselmoに1勝9敗しているソフトがあったとして そのソフトが超強いかもしれないから何百局と対局させてみようって気持ちにはなりづらいっていう 人間の印象の問題とかは少なからずあると思うけどな、レート測定にもやる気がいるし 強そう弱そうとか個人の感想言うぶんには別になんでもいいと思うけどね、信頼するかは情報を受け取る側が決めるってだけで 測定する人が納得するならどんな計測でもいいのではないか。 vs単一ソフトと1000局やっても、他のソフトとの相性でレート通りいかない場合も多々ある。 それなら4ソフトと250局ずつ計1000局対局したほうが信頼するデータがでるような。 毎回1000局できたら数学統計的には理想だろうけど。楽しさがゼロ〜マイナスになりそう。 test evalmerge aperypaq epoch8 AperyPaqZero 95 ノード500万100局以上でaperypaqに6割勝つ ぽんぽこ達と相性があるみたい。やや勝ち越す? 95以外は弱くなるふしぎ キメラはキメラ元との対局では相性が出まくるから、キメラ元意外の評価関数との対局をメインにしたほうがいい キメラ元意外にはむしろ元よりやや弱くなることもしばしばあるからね あとせっかく対局させるならuuunuuunさんのとこのレート表を参考にできるように1500万ノードくらいでやるといいと思う >>235 1500万だと丸一日かかるからねえ 誰か興味持って追試してくれることを願う 自分で色々対局させてみてもaperypaqはApery+30~50くらいのR差かなという印象 elmoだけとの差だけで見るとelmoから+250か 次のWCSCはelmoに勝率9割の世界 まさに天下一武道会 透さんの評価関数も蟲毒で検証してほしい。 >>235 そうだね、キメラはキメラ元には、ほぼ強くなるけど、その反面、他の今まで勝率が良 かったものには勝率が落ちることが結構あるからね。あと実際にyaselmoはramuと対局 させてみると負け越すので相性問題があるという、いい見本だと思う。 しかしそうなると対局相手系のキメラ評価関数用意してのメタゲームが捗るな しかし対コンピュータにレートが100あがっただのなんだのみみっちい争いして何になるんだ これが人類にとっての将棋譜の進化になんか意味あるんか?コムがコムメタ対策しだすとか馬鹿の極み だからお前らは市場価値がないアマチュアなんだよw こいつらストックフィッシュとbonanzaがなければ 永久に手打ち時代から脱却できなかったような3流以下の雑魚だから こういう書き込み見ると今日も平和だなーとほほえましくなるね 4200 VS apery-qhapaq 互角局面集8手 150局 82勝 68敗 勝率: 0.5466666666666666 標準誤差: 0.04085139548755903 95% 信頼区間 [0.4666666666666667, 0.62] 相対イロレーティング: 32.52197587099214 標準誤差: 28.635907594090487 95% 信頼区間 [-23.196778791074703, 85.04323715257749] apery-qhapaq R4180+30=R4200超え だってさ まだ強いの持ってるみたいだし 次はR4250が優勝ラインなんかな 確かに強そうだけど、他との対局結果も早くでないかな >>230 初期配置から対戦している訳ではないからあまり意味はないよ 単なる開始局面の欠陥と区別はつかない ゴミみたいな対局結果多すぎだろ 誰が有意差の一覧表貼ってやれよ 長時間なら対局数が少なくていいみたいな 頭悪過ぎる理論振りかざしてる奴もいるし スレのレベルが落ち過ぎ >>246 はあ?俺は京大からMITに行き、情報系の博士号とってからGoogleに入社して 10年くらいだったか働いたあとに親のコネでとあるソシャゲ会社の役員やってんだけど? 君ら何かとは次元が違うし、ゴミ技術者もどきの君らはまるで社会の役に立たないクズだよ まるで市場価値のないアマチュア。恥を知るべきだね ただの顔真っ赤系かと思ったら二行目後半で草 中々いいセンスだと思うよ、荒らし以外に生かしてほしいもんだ >>256 ID無し ワッチョイ無し この時点でお察っしください > ID無し ワッチョイ無し 職業:プロ2chネラー 長時間でもやっぱり対局数は多くこなさないとダメなんですね… >>259 ▲9六歩つくのが定石とは知らなかった。 普通に香車取られても▲78銀と桂馬守って、馬の働きの差で先手が指せるかと。 この形は何度検証しても振り飛車が良くならなかったはず。 身バレしたくない人が選手権に出場しても大丈夫なのか? >今回私は「クジラちゃん」のところにお世話になる予定です。 まじかよ よしショットガンの芝先生もクジラちゃんチームに参加しよう。 >>271 これでえびちゃんも心置きなく結婚できるな >>272 >「クジラちゃん」は今回、過去「世界コンピュータ将棋選手権」に優勝したこともある人と > コラボ企画が進行中だそうです。 > それによっては、私はお払い箱になるかもしれません! だってよ。 どう考えても「定跡に頼るようじゃ終わり」のあの人しかいないだろ、まふさんお払い箱なら。 >>270 まふさんが「主たる開発者」ならえびちゃんは堂々と1次予選から参加できるわけで。 アピール文章、いくら25ページに限定したところで続きはwebでってやられたらいくらでも続き書けるやん シード権の放棄禁止令って、なんのために発せられたの? 意味わかんない CSA幹部の頭の中は激指・YSSに時代のままだからな 入玉はもっと改善の余地はあるから256手ルールの方を変えるのが最善かどうかはわからんぞ。 >>279 それはCSA例会で一次予選参加者から出た要望。 強いやつがシード権放棄して降りてきたら実質通過枠減るじゃんって主張には 理があるでしょ。 個人的には放棄した分だけ枠を増やせば良いのではとも思うが、スイス式である以上は 強いやつに当たってソルコフ稼げるからいいだろ、という脳天気な話でもないわけで。 シード権放棄するのって、戦略的に有利なくじらちゃんくらいなもんでしょ? >>284 今年はタヌキも放棄した(多分去年の2次予選の調整不足を防ぎたかったのだろう 名人コブラの放棄はライブラリ勢としてのこだわりのようなものだろう あと、GA将とか、上位のシード権者の放棄で譲られたシード権を放棄する、 みたいな感じの動きをしたこともあったはず。 通過枠は放棄の分は増やしてたぞ。 場違いに強い奴と当たって負けると不満に思うのはわかるが。 しかしライブラリがあれだけ強い以上 シード放棄を禁じても初出場で一次予選から上位の実力者は出てくるとも思う 通信の遅延などの質は会場まで行かないと分からないからな ぶっつけで二次予選初戦落とすよりかは一次で落とす方がマシ >>286 シード権放棄の分は通過枠は増えない。 通過枠が増えるのは「シード権保持者の4月1日以降の参加キャンセル」だけ。 >>283 >>288 シード権放棄の分は通過枠は増えないんだったら、実質通過枠減らないじゃん >>289 いや、通過するかどうかギリギリのソフトが繰り上がりでシード権得て 通過するのが確実のソフトが上から降りてくるんだから、どう考えても 実質通過枠減ってるよね。 >>290 だから、シード権放棄の分は通過枠は増えないんだってば 「通過するかどうかギリギリのソフトが繰り上が」らないってば なるほど上位がシード放棄すると、 前年に17位よりもっと下だったソフトが順に一次免除になってくルールだったんすねー 確かにこれだと一次予選の難易度が上がっちまいますね。 シード放棄が問題というよりその分のシード権が下位に回るのが問題のように感じる。 ライブラリのルール含めルール直すところはたくさんあるのにシード権だけ >>293 >>294 もうCSAの方も割とルールが滅茶苦茶なんだよな。 今の時代に即してない >>293 シード権獲得者が次の大会に出ないのはこの大会では日常茶飯事だから 欠場者の分のシード権繰り上げは当然よな。 で、シード権繰り上げがある以上は、シード権放棄に伴う繰り上げもある、 というのは当然ではないにせよ不自然ではなかったわけだ。 もちろん、シード権放棄を認めない、も放棄された分枠を増やす、もあり。 ただ、基本的にはこの大会3日間東京でやる、ということを考えると、 地方在住者の宿泊費負担を考えれば、2日目からの参加者をできるだけ増やしたほうが いいという判断もあるわけで、1次の枠増やす代わりに繰り上げ禁止、はないかなと。 そうするとシード権放棄を認めないのが一番落ち着きはいいよな。 >>294-295 そうか? 理想を言えばきりがないだけの話で、今のルールは割りとよくできてると思うぞ。 WCSCは賞金もかかってないし、ハード制限ないから実質競技というよりはお祭りだから あまりルールでがちがちに縛るのは違うんじゃないかと思ったりするけどね。 apery「四駒のためにいじってたら学習部改善されてなんかしらんけど評価関数めっちゃ強くなったわ」 yorkie「四駒のためにいじってたら探索部改善されてなんかしらんけどノードめっちゃ出るようになったわ」 時代は四駒だな >>278 正当性担保のためにwscsのための提出分としてはだらだら書かずに25ページ以内にまとめてこいってことだろ。 伝わる人にしか伝わらない例えをするならばmmd杯の本線動画時間を5分以内に収めよという趣旨と同じ より詳しく知りたい人向けに別にリンクを貼って読んでもらう事はOK んで結局肝心の256手ルールやライブラリについてはどーなるんですかーと ライブラリはどんなルールが良いか開発者でも意見が分かれるからな 自作しか認めるなって人からなんでも使ってOKにすべきって人までいる なんか来たぞ Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm David Silver, Thomas Hubert, Julian Schrittwieser, Ioannis Antonoglou, Matthew Lai, Arthur Guez, Marc Lanctot, Laurent Sifre, Dharshan Kumaran, Thore Graepel, Timothy Lillicrap, Karen Simonyan, Demis Hassabis (Submitted on 5 Dec 2017) The game of chess is the most widely-studied domain in the history of artificial intelligence. The strongest programs are based on a combination of sophisticated search techniques, domain-specific adaptations, and handcrafted evaluation functions that have been refined by human experts over several decades. In contrast, the AlphaGo Zero program recently achieved superhuman performance in the game of Go, by tabula rasa reinforcement learning from games of self-play. In this paper, we generalise this approach into a single AlphaZero algorithm that can achieve, tabula rasa, superhuman performance in many challenging domains. Starting from random play, and given no domain knowledge except the game rules, AlphaZero achieved within 24 hours a superhuman level of play in the games of chess and shogi (Japanese chess) as well as Go, and convincingly defeated a world-champion program in each case. https://arxiv.org/abs/1712.01815 げげーーーーーーーー!!! convincingly defeated a world-champion program in each case. ????すげーーーー AlphaZeroが最強将棋ソフトに勝ったということですか 500以上の差は測れないだけじゃないかな 結局やりましたー勝ちましたって言われても状態ではある エルモ相手に+500くらい チェスの方は微差っぽい Elmoに対して 先手Alpha 43勝5敗2分け 後手Alpha 47勝3敗 トータル 90勝8敗2分け >>316 drawが多いからレート的には微差だけど 先手で50%ぐらい勝ち越してる >>317 将棋における黒盤は先手でいいんだよな チェスだけ逆だからその辺間違ってたりしないよなw チェスは棋譜載ってるのに 将棋は棋譜載ってない・・・ KI2形式で乗っけてくれw CSAは次のWCSCにAlphaShogiを招待するべき evaluation speedはノード数で良いのかな? エルモ35000kに対して アルファゼロは40kか 囲碁、将棋、チェスの順で評価関数(大局観)の方が読みの深さより重要になってくるからそれだけ 深層学習では伸び率が大きいって感じなんかな? ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる