▲コンピュータ将棋スレッド128
■ このスレッドは過去ログ倉庫に格納されています
>>206 マシンパワーには全く頼っていないわけだが (教師局面の自動生成のことまで言うとマシンパワーの問題だが それを問題にする人はいないよな) >>206 名人は低スペックに負けたんだけど。 囲碁と真逆のルール設定。 最高峰の戦いであのスペックはいかがなものか。 ドワンゴ&連盟らしいルール設定。 電王戦対局用PC OS:Windows 10 Home 64bit(Linuxに換装することも可) CPU:Core i7-6700 *(実買四万円程度) メモリ:32GB DDR4 *(実買二万円程度) え?事前の強化学習はマシンパワーじゃなかったら何なんだ? 評価関数アルゴリズムの最適化などをして論文になるレベルのことでもしたんか(笑)w >>208 事前に何千時間も強化学習しておいて、定跡的に指し手を登録するなり評価関数を強化してたわけで それって結局はマシンパワーゴリ押しな手法であると認定されても何も言えないじゃんw >>197 なので定跡勝負になっていいんじゃね?と思う 個人の知識やノウハウではなく 体系的に有用な定跡を作る方法が確立されていないのであれば それを元により強力な定跡を作っていく中で効率的に定跡が作られたほうが良い 山本も定跡勝負がくだらないと思うなら持ち前の物量で定跡作ってデファクトスタンダード築けばいいのにな ちなみにチェスの定跡ってどうなってるんやろね 名人に勝ったのは一言で言えば、 ソフト側の事前カンニング行為があったからということですな 定跡はむしろ ライブラリ勢が一番独自性を発揮出来る部分でしょ。 そういう意味では評価関数よりも重要。 なるほど。ソフトが勝ったとか言う話も専門的に見れば胡散臭い部分が満載なんですね ID ワッチョイ 無しの奴にかまうなよw 誰だかすぐ分かるのに yaselmoがなんでこんなに強くなったかはまだ分かってないんだっけ? >>217 それ、途中からelmoの仕組みの考察だけになってて、 問題提起の長時間での逆転現象の説明がどこなのかわかりにくいな。 elmoは遠い局面の勝率と評価値を、現局面の教師にしている、という辺りか。 >>218 そもそも野生の読み太って何だったのかまとまってなくね? >>219 そう、確かに途中から話が変わっているような気がして分かりづらいw 単純に考えれば、勝敗項は終局まで探索したとみなしてるから、時間をかけて深く読めば読むほど真の評価に近づくのかと 一方普通の雑巾絞りは6手程度の浅い読みの結果しか使っていないので、超短時間の対局でも特に問題なかったのかなあと感じる >>203 とりあえず、今は8スレ10秒(40000k〜50000kノード)でやってます。長時間だと先手番の勝率も増えた気がします。 >>222 >>202 スッップ Sd0a-SfGS コイツのレスを見てみよう https://imgur.com/a/cDu3F ご覧の通りに貶す場合と取り入られたい場合の 二面性のレスの仕方をする典型的な ※双極性障害 ※統合失調症 ※演技性パーソナリティ障害 などである さして強くもないのに優位性の証拠も提示できずに他者には押し付ける バグッたRで勘違いをしているのに我慢できずに自己主張したくなる 病気の持ち主=Yapata系の自称キメラ屋(笑) >>222 たぶん皆、お強いソフトを計測したいわけで、 自己満足状態にならないために2パターンの時間、対3〜5ソフト 理想は200局以上だけど。ノード高ければ100局でもある程度の信頼性あると思われる。 自分は時間が長い場合は50局x2セットとかにしてPC負荷かけすぎないようにしてる。 実際は連続100局くらいで壊れるわかないが、気分的に休ませてやりたい(笑) ノード高いと100局でもある程度信頼できるって言うのははじめて聞いたぞ。 m5.24xlargeあたりで4スレ5秒相当を2千局くらいやるのがオススメ。 linuxだbニ値段そんなに麹bュないよ どれくらいのR差を検出したいのかによって対局数は変わって来るんでは. 厳密なレート差はわからなくてもどっちかが強いかどうか知りたいだけなら少なくてすむ なんとなくやや強そうかもとか、アバウトな予想を立てるくらいなら別に対局数少なめでもかまわないと思う >>226 >>227 言いたかったのは、ほぼそういうことです。 信頼って言葉つかったから誤解を招いた。 1000局とかやった方が信頼できるに決まっている。 人は7番勝負で勝敗決める大会もある・・・それと比べたら100局でも多い。 ソフトだから1000局〜2000局って発想が自分にはないなあ。 今のところ、aaa対paqは秒読み1秒と長時間でも同じ位の勝率になっているけど、apery _sdt5とQhapaq_sdt5の合成のときは、明らかに短時間では超強くて、長時間では超弱 かった。 TCEC10のsuperfinal77回戦、Houdiniも後手番で1勝。お互いに後手番ブレイク1つずつ。 まだまだ後手で勝てるもんなんだねえ。 最近は二項分布のうんちくとか、有意に強いといえる対局数一覧とか貼られないから統計数への意識が低いな みんな自分で少し計算してみたらどうだ? 数学的な信頼性とは数字で表せるものよ 統計的には不十分でも例えばyaselmoに1勝9敗しているソフトがあったとして そのソフトが超強いかもしれないから何百局と対局させてみようって気持ちにはなりづらいっていう 人間の印象の問題とかは少なからずあると思うけどな、レート測定にもやる気がいるし 強そう弱そうとか個人の感想言うぶんには別になんでもいいと思うけどね、信頼するかは情報を受け取る側が決めるってだけで 測定する人が納得するならどんな計測でもいいのではないか。 vs単一ソフトと1000局やっても、他のソフトとの相性でレート通りいかない場合も多々ある。 それなら4ソフトと250局ずつ計1000局対局したほうが信頼するデータがでるような。 毎回1000局できたら数学統計的には理想だろうけど。楽しさがゼロ〜マイナスになりそう。 test evalmerge aperypaq epoch8 AperyPaqZero 95 ノード500万100局以上でaperypaqに6割勝つ ぽんぽこ達と相性があるみたい。やや勝ち越す? 95以外は弱くなるふしぎ キメラはキメラ元との対局では相性が出まくるから、キメラ元意外の評価関数との対局をメインにしたほうがいい キメラ元意外にはむしろ元よりやや弱くなることもしばしばあるからね あとせっかく対局させるならuuunuuunさんのとこのレート表を参考にできるように1500万ノードくらいでやるといいと思う >>235 1500万だと丸一日かかるからねえ 誰か興味持って追試してくれることを願う 自分で色々対局させてみてもaperypaqはApery+30~50くらいのR差かなという印象 elmoだけとの差だけで見るとelmoから+250か 次のWCSCはelmoに勝率9割の世界 まさに天下一武道会 透さんの評価関数も蟲毒で検証してほしい。 >>235 そうだね、キメラはキメラ元には、ほぼ強くなるけど、その反面、他の今まで勝率が良 かったものには勝率が落ちることが結構あるからね。あと実際にyaselmoはramuと対局 させてみると負け越すので相性問題があるという、いい見本だと思う。 しかしそうなると対局相手系のキメラ評価関数用意してのメタゲームが捗るな しかし対コンピュータにレートが100あがっただのなんだのみみっちい争いして何になるんだ これが人類にとっての将棋譜の進化になんか意味あるんか?コムがコムメタ対策しだすとか馬鹿の極み だからお前らは市場価値がないアマチュアなんだよw こいつらストックフィッシュとbonanzaがなければ 永久に手打ち時代から脱却できなかったような3流以下の雑魚だから こういう書き込み見ると今日も平和だなーとほほえましくなるね 4200 VS apery-qhapaq 互角局面集8手 150局 82勝 68敗 勝率: 0.5466666666666666 標準誤差: 0.04085139548755903 95% 信頼区間 [0.4666666666666667, 0.62] 相対イロレーティング: 32.52197587099214 標準誤差: 28.635907594090487 95% 信頼区間 [-23.196778791074703, 85.04323715257749] apery-qhapaq R4180+30=R4200超え だってさ まだ強いの持ってるみたいだし 次はR4250が優勝ラインなんかな 確かに強そうだけど、他との対局結果も早くでないかな >>230 初期配置から対戦している訳ではないからあまり意味はないよ 単なる開始局面の欠陥と区別はつかない ゴミみたいな対局結果多すぎだろ 誰が有意差の一覧表貼ってやれよ 長時間なら対局数が少なくていいみたいな 頭悪過ぎる理論振りかざしてる奴もいるし スレのレベルが落ち過ぎ >>246 はあ?俺は京大からMITに行き、情報系の博士号とってからGoogleに入社して 10年くらいだったか働いたあとに親のコネでとあるソシャゲ会社の役員やってんだけど? 君ら何かとは次元が違うし、ゴミ技術者もどきの君らはまるで社会の役に立たないクズだよ まるで市場価値のないアマチュア。恥を知るべきだね ただの顔真っ赤系かと思ったら二行目後半で草 中々いいセンスだと思うよ、荒らし以外に生かしてほしいもんだ >>256 ID無し ワッチョイ無し この時点でお察っしください > ID無し ワッチョイ無し 職業:プロ2chネラー 長時間でもやっぱり対局数は多くこなさないとダメなんですね… >>259 ▲9六歩つくのが定石とは知らなかった。 普通に香車取られても▲78銀と桂馬守って、馬の働きの差で先手が指せるかと。 この形は何度検証しても振り飛車が良くならなかったはず。 身バレしたくない人が選手権に出場しても大丈夫なのか? >今回私は「クジラちゃん」のところにお世話になる予定です。 まじかよ よしショットガンの芝先生もクジラちゃんチームに参加しよう。 >>271 これでえびちゃんも心置きなく結婚できるな >>272 >「クジラちゃん」は今回、過去「世界コンピュータ将棋選手権」に優勝したこともある人と > コラボ企画が進行中だそうです。 > それによっては、私はお払い箱になるかもしれません! だってよ。 どう考えても「定跡に頼るようじゃ終わり」のあの人しかいないだろ、まふさんお払い箱なら。 >>270 まふさんが「主たる開発者」ならえびちゃんは堂々と1次予選から参加できるわけで。 アピール文章、いくら25ページに限定したところで続きはwebでってやられたらいくらでも続き書けるやん シード権の放棄禁止令って、なんのために発せられたの? 意味わかんない CSA幹部の頭の中は激指・YSSに時代のままだからな 入玉はもっと改善の余地はあるから256手ルールの方を変えるのが最善かどうかはわからんぞ。 >>279 それはCSA例会で一次予選参加者から出た要望。 強いやつがシード権放棄して降りてきたら実質通過枠減るじゃんって主張には 理があるでしょ。 個人的には放棄した分だけ枠を増やせば良いのではとも思うが、スイス式である以上は 強いやつに当たってソルコフ稼げるからいいだろ、という脳天気な話でもないわけで。 シード権放棄するのって、戦略的に有利なくじらちゃんくらいなもんでしょ? >>284 今年はタヌキも放棄した(多分去年の2次予選の調整不足を防ぎたかったのだろう 名人コブラの放棄はライブラリ勢としてのこだわりのようなものだろう あと、GA将とか、上位のシード権者の放棄で譲られたシード権を放棄する、 みたいな感じの動きをしたこともあったはず。 通過枠は放棄の分は増やしてたぞ。 場違いに強い奴と当たって負けると不満に思うのはわかるが。 しかしライブラリがあれだけ強い以上 シード放棄を禁じても初出場で一次予選から上位の実力者は出てくるとも思う 通信の遅延などの質は会場まで行かないと分からないからな ぶっつけで二次予選初戦落とすよりかは一次で落とす方がマシ >>286 シード権放棄の分は通過枠は増えない。 通過枠が増えるのは「シード権保持者の4月1日以降の参加キャンセル」だけ。 >>283 >>288 シード権放棄の分は通過枠は増えないんだったら、実質通過枠減らないじゃん >>289 いや、通過するかどうかギリギリのソフトが繰り上がりでシード権得て 通過するのが確実のソフトが上から降りてくるんだから、どう考えても 実質通過枠減ってるよね。 >>290 だから、シード権放棄の分は通過枠は増えないんだってば 「通過するかどうかギリギリのソフトが繰り上が」らないってば なるほど上位がシード放棄すると、 前年に17位よりもっと下だったソフトが順に一次免除になってくルールだったんすねー 確かにこれだと一次予選の難易度が上がっちまいますね。 シード放棄が問題というよりその分のシード権が下位に回るのが問題のように感じる。 ライブラリのルール含めルール直すところはたくさんあるのにシード権だけ >>293 >>294 もうCSAの方も割とルールが滅茶苦茶なんだよな。 今の時代に即してない >>293 シード権獲得者が次の大会に出ないのはこの大会では日常茶飯事だから 欠場者の分のシード権繰り上げは当然よな。 で、シード権繰り上げがある以上は、シード権放棄に伴う繰り上げもある、 というのは当然ではないにせよ不自然ではなかったわけだ。 もちろん、シード権放棄を認めない、も放棄された分枠を増やす、もあり。 ただ、基本的にはこの大会3日間東京でやる、ということを考えると、 地方在住者の宿泊費負担を考えれば、2日目からの参加者をできるだけ増やしたほうが いいという判断もあるわけで、1次の枠増やす代わりに繰り上げ禁止、はないかなと。 そうするとシード権放棄を認めないのが一番落ち着きはいいよな。 >>294-295 そうか? 理想を言えばきりがないだけの話で、今のルールは割りとよくできてると思うぞ。 WCSCは賞金もかかってないし、ハード制限ないから実質競技というよりはお祭りだから あまりルールでがちがちに縛るのは違うんじゃないかと思ったりするけどね。 apery「四駒のためにいじってたら学習部改善されてなんかしらんけど評価関数めっちゃ強くなったわ」 yorkie「四駒のためにいじってたら探索部改善されてなんかしらんけどノードめっちゃ出るようになったわ」 時代は四駒だな >>278 正当性担保のためにwscsのための提出分としてはだらだら書かずに25ページ以内にまとめてこいってことだろ。 伝わる人にしか伝わらない例えをするならばmmd杯の本線動画時間を5分以内に収めよという趣旨と同じ より詳しく知りたい人向けに別にリンクを貼って読んでもらう事はOK んで結局肝心の256手ルールやライブラリについてはどーなるんですかーと ライブラリはどんなルールが良いか開発者でも意見が分かれるからな 自作しか認めるなって人からなんでも使ってOKにすべきって人までいる なんか来たぞ Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm David Silver, Thomas Hubert, Julian Schrittwieser, Ioannis Antonoglou, Matthew Lai, Arthur Guez, Marc Lanctot, Laurent Sifre, Dharshan Kumaran, Thore Graepel, Timothy Lillicrap, Karen Simonyan, Demis Hassabis (Submitted on 5 Dec 2017) The game of chess is the most widely-studied domain in the history of artificial intelligence. The strongest programs are based on a combination of sophisticated search techniques, domain-specific adaptations, and handcrafted evaluation functions that have been refined by human experts over several decades. In contrast, the AlphaGo Zero program recently achieved superhuman performance in the game of Go, by tabula rasa reinforcement learning from games of self-play. In this paper, we generalise this approach into a single AlphaZero algorithm that can achieve, tabula rasa, superhuman performance in many challenging domains. Starting from random play, and given no domain knowledge except the game rules, AlphaZero achieved within 24 hours a superhuman level of play in the games of chess and shogi (Japanese chess) as well as Go, and convincingly defeated a world-champion program in each case. https://arxiv.org/abs/1712.01815 ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる