▲コンピュータ将棋スレッド121 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
やねうら王のソース読んでたら、evalmergeコマンドには隠しオプションがあるんだな。
比率でなく評価値の絶対値が大きいほうを採用したり、小さいほうを採用したりできるようだ。 それ登場して即使ってみたけど
弱くなるだけだからあんまり意味なかった >>130
あぁ、絶対値で大きいほうを採用=それ以上大きい評価値は生成されないってことか…。 >>128
ですね。elmoのアウトブリードでelmoより強いんで、配合素材として優秀で重宝してます。 >>133
ありゃりゃ、そういうことじゃないんですね。
ダメだな。算数ニガテだ。 評価関数ブレンドも1回限定の
評価値補完の手法にすぎないということなのかな、結局大本の評価関数は大量の局面を用意して学習させなきゃだめと 高品質の教師局面を効率的に大量に用意するゲーム
ブレンドもその一環 elmoの手法が標準的になるってことは独自路線だった古豪ソフトもトップクラスに復活するってことなのかな? 4スレ0.1秒
mafu + rezero8
勝ち124(62%) 先手勝ち72(72%) 後手勝ち52(53%)
relmo8
勝ち74(37%) 先手勝ち46(46%) 後手勝ち28(28%) >>137
できがいいけど金と時間がなくて学習が甘いソフトが強くなるな >>138
それじゃなくて
mafu+rezeroとmafu+relmoの対戦を試さないと
その結果は当然かと 3駒以上の新しい評価項目の発掘が今後の課題やな
NNから評価項目抽出できたらええんやけど >>142
R4000超えてるからねぇ。まず勝てない。 >>142
試しにrelmo8と去年の技巧を飛車落ちでやったらrelmo8が勝ったわ 短時間なら浮かむ瀬相手に飛車落ちで勝つことはあるけど、きちんと時間持たせたらどうだろうねえ 駒落ちについてはあんまり語らん方がいいと思うけどね
駒落ちでもたまたま動いてくれたし、たまたまかなり強かっただけで、平手の強さと駒落ちの強さの関係はそのソフト次第でしょ
駒落ちでの挙動や強さにはなんの保証もないし ちょうどrelmo8 + まふ評価関数の対戦してたけど
テンプレ埋めるのだるいから貼るのやめます(´・ω:;.:... 情弱丸出しなこと聞くけどまふ評価関数ってmafu.7zって方?
それとも_.depth.x.7zって方?
ブレンドに使いたいんだけどどっちか分からん >>150
>現在「mafu」(まふ評価関数)のブレンド相手の情報募集しています。
とあるから、mafu.7zの方だと思ってるけど 磯崎はまふとrelmo対戦させたりしてないから分かってないのかな?
定跡なしでもrelmo超えとるし そういえば、むかーしPonanzaとかいう非公開ソフトがあったような気がするが記憶にないわ mafu.7z + epoch8 が現状最強ということか
なんだか日替わりで最強が入れ替わってないか? >>155
千田がまふ評価関数を部分的に歪んでいると言っているのも念頭にあるのでは スマホと言えど技巧はやっぱり強いな
勝勢になったのに100手以上粘られた FRCが一番わかりやすい例
Fischer Random Chess
この変則チェスは、1996年6月19日にラプラタで発表された。フィッシャーの目的は、
序盤定跡の記憶や準備に頼らず、創造力と才能で勝負が決まるようなチェスの変種を作ることであり、
そのためにチェスの初期配置をある一定の条件の下にランダム化した。
CCRLにもあるし
フィッシャー有能 やねうら王のソースを眺めていたら
// 精度の良い評価関数ならばこの幅を小さくすると探索効率が上がる
// やねうら王のKPPT(Apery WCSC26)ではStockfishのまま(18付近)がベスト。
という項目が2017-early-search.cppにあったから
今の評価関数(まふ+rezero8)なら幅を小さくすると強そうと思って15から3刻みで色々と試したけど
6まで下げても0.1秒200局で互角だしあまり変化はなかった
流石に探索部には素人が手軽に強く出来る部分は残っていないのね・・・ >>165
depth 5以上でないと利いてこないパラメーターを0.1秒対局で計測できるわけねーじゃん 3スレ2秒で計測し直す
とりあえずパラメータ6でスタート まふは歪んでいるの?
それなら人の棋譜解析にはrelmo8使っておくか。 まふは歪んでても強いという棋風を味わえる。
電王戦トーナメントで優勝するソフトはelmoから+300〜+400上げないとならないのかもしれない。 relmoに勝ち越せるブレンドはできたんだけど、今度は技巧2にやや負け越すようになってしまった
負け方が大反省ばかりなので、技巧に見えてこっちに見えてない筋がけっこうあるみたい
技巧の血が欲しい(吸血鬼かw) なんだかんだ将棋ダビスタはrezeroとelmo系の第一世代のイブリードしか上手くいかないことがほとんど。 >>177
まぁ実際はそれだろうな
自分で320勝250敗とか労力&時間を費やしてたら、「勝ち越せる」なんて軽いフレーズで流さないからね
驚くほど少ない対局数だろうことが容易に推測できる 最新のリゼロとelmoを混ぜるとelmo+R300ぐらいになっているんだろうか・・ 計測が追い付かん。
relmoの他にも、技巧2との勝率も出した方がいいんだろうが そういやここで統計を書くと必ず「そんな糞スペックでは意味ねーわ」というレスが付くので、スペックを書きたくなくなるのは分かる
実際問題NPSだけが大事なんだから、糞スペックのヤツはこうやって見栄を張るといい
NPS平均1000kのPCで3秒対局
ここに貼り付ける時は「NPS3000kのマシンで1秒対局してみたんだが・・・」
嘘だけど、実際無問題だし、見栄も張れるしこれでOK 「もうやめて、Ponanzaのライフはゼロよ」
状態だな
まふ神降臨
第5回 電王トーナメントどうなるんだこれ >>182
同じNPSでもスレッド数少ない方が強いんでしょ?それじゃ過小評価でしょ
そもそも低ノードでは〜って言い訳にはなってないよな
短時間で弱いっていう事実が残るだけで >>183
電王トーナメントはやねさんの言う通り大規模じゃんけん大会になるだろう じゃんけんでお金もらえても誰も損はしないけどなw
まあ頑張ってた人は気の毒ではあるが まあ山本もいずれはponanzaもそうなるって言ってたし
こんなにも早いとはおそらく誰も思わなかったろうけど じゃんけんってのは実力拮抗して運次第って意味?
そうはならないよね。最近数週間、数日の進歩をみてると R4200が基準としてなんだかんだ言って、やねさんや平岡さんなど強豪ソフト開発者はR4300クラスのソフトをぶつけて来るんじゃない? 平岡や磯崎も焦ってると思うよ
まふさんの評価関数は最強! プログラミングする人とチューニングする人それぞれがタッグを組むのがやはり最強か。オープンソース化した効果で凄まじい勢いだ。
いよいよポナンザの山下兎ペアもアドバンテージがなくなってきたか? floodgate復活したら4000超えで安定する世界になってそう?? 例年通りだと10月くらい?
まだあと3ヶ月もあると更に足切りライン上がりそうだが。 時間を掛けた計測の最中に
その評価関数が時代遅れになっているの悲しすぎ
まふ+rezero8評価関数 NPS1300kN/s 秒読み2秒 115局時点で
53勝 delta = Value(18);
56勝 delta = Value(30);
30に増やしても特に弱くなる様子はないみたいだ
(delta = Value(6);や(9)はあからさまに弱かったから増やす方向で計測した)
対局数116 先手勝ち57(52%) 後手勝ち52(47%) 引き分け7
mafuzero8 delta = Value(18);
勝ち53(48%) 先手勝ち28(50%) 後手勝ち25(46%)
mafuzero8 delta = Value(30);
勝ち56(51%) 先手勝ち29(53%) 後手勝ち27(49%)
誤差レベルだから1000局指しても有意な差は出ないかもしれない
まふが更新されたから何の意味もないデータになってしまった😇やる気ゲージは既にゼロ >>194
レートは相対的なものだからみんな同じくらいの強さだったらレート低くなるんじゃね? まふ10が強くなりすぎて既存のリゼロやレルモなどと混ぜてもかえって弱くなる >>200
まふ10は序盤だけじゃなくて終盤も強いの? 適当すぎて笑うわ
実際のところ強くなりすぎてどころか強くなってないけどな
野生の読み太とずっと4スレ5秒(1手1200万ノード程度)で対戦させてるが(まふの推奨どおりgithubにある定跡ありで)、
野生の読み太に比べて有意に強いとはとても言えない成績(それどころか今のところmafu10は負け越している)
まぁまふのgithubにも書いてあるが、mafu10はひとつ前の評価関数よりもレーティング的には低いくらいだよ
R4200も確実にない コロコロ言うこと変わるのは相変わらずだな。まぁ実験を繰り返すのは悪くない
超短時間のレート計測らしいから2秒とかでどうだか >>203
その持ち時間じゃ有意にも何も100局も指してないでしょ
具体的に何局指して何勝何敗なのよ? そのうち「elmoとハム将棋を配合すると面白い配合になって強くなる」
とかいう事例が出てきそう mafu10について
もの凄い反響ありがとうございます。すでに短時間対局で2800局程度の情報を頂きました。
それによりますと前回の「mafu」よりR30程度弱くR4100程度であるという計測結果です。
今回の評価関数は「教師局面生成用評価関数」という位置付けで作成しています。
具体的な違いは?と言われれば「mafu」+「mafu10」の配合でもレートが少し上がります。
これは出来るだけ正確な教師局面生成が出来るように評価パラメタの配分にこだわった効果で、次に学習した局面の特徴を捉えやすくするためです。ですから10人が「mafu10」から評価関数を作っても特定の評価パラメタにハマリにくいので、いろいろな評価関数が出来ることが期待されます。
さらに通常、学習で特徴を特化(過学習)してしまった評価パラメタを慣らすには、前に学習した教師局面と混ぜて再学習等行うことが必要ですが、この「mafu10」では評価パラメタが抑えられている(まふ評価関数は何故強いのですか?で私が書き込んだようなrezero系配合のような例外はあるが)ので突出した新しい評価関数と上手く配合するだけで慣らしが出来ます。(再学習を何時間もやるより超高速) 奴の型は有限なれどその組み合わせは甚大
無限に等しい数に及ぼう
キメラ化した世界についていけない >>207
win10pro
CPU_i7-6700K, MEM16G,
thread=4, own_book=on(mafu10はプロジェクト3学習用定跡、野生の読み太はオリジナルの定跡使用), hash=4096, byoyomi margin等はすべて0, 当然ponderもOFF
1手5秒
野生の読み太 44勝(64%) mafu10 24勝(35%)
局数が少ないから200局指せばここから互角近くまで戻す可能性はあるが、少なくともここまで離れてしまったら、現時点でも野生の読み太に比べてmafu10が有意に強いとはいえない、くらいは言えるでしょ
ちなみにrelmo,yaselmo,rezero8,mafu_project2等でも対戦結果を計測しているが、このPCで他所の結果とほぼ整合性が取れている
1手5秒計測で、50局以上計測した上でここまで離れた成績が数百局後に反転するなんてまず無い レート計測に異なる定跡をつかっちゃダメでしょ。
互角局面集、もしくは定跡を揃えるか定跡なしで計測するべき それで、どの流れを読むと教師局面生成用の定跡でソフトの強さが測れるか
説明していただけますか? 214 215 ですけど 211 への書きこみです。すみません 2800局のデータを集めたまふさん vs 100局にも満たないイキリオタク まふさんgithubにまともな対局の結果がでています ソフト界発展のためには、進歩早いほうがいいですし
一般の人に協力してもらうのもいいと思います
定跡はオフで対戦すれば評価関数の強さをたしかめられますね 進歩が早すぎるというほど早くはないだろ
せいぜいレーティングがelmoから50程度上がったくらい
アルファ碁の成長から見たらクソみたいなもん しかし圧倒的な棋譜不足から自己対戦での強化方法が確立したのに、また質の高い棋譜が必要とされるとは皮肉だな もうまふ定跡載せてキメラ化した状態が一番最強だと思えてきた。
フラゲ復活はよ ■ このスレッドは過去ログ倉庫に格納されています