▲コンピュータ将棋スレッド121 [無断転載禁止]©2ch.net
レス数が1000を超えています。これ以上書き込みはできません。
【エンジン】技巧2、やねうら王4.64(yasema10評価関数)
【勝敗】4-6
【持ち時間】1手10秒
【CPU】Intel(R) Core(TM) i7-6700K CPU @ 4.00GHz
【OS】Windows10 64bit
【メモリー】16GB
【思考条件】Threads=8、NarrowBook=OFF、USI_Hash=8192,USI_Ponder=OFF
【特記事項】10回しかやってないけどあんまり差つかなかった テンプレなんて別に>>1-5の便利リンクの紹介だけでも良いんじゃないの?
スレ立てした時に面倒が増えるだけだし
テンプレ守れみたいな書き込みでスレが荒れる原因にもなってる いやなんだかんだ調査報告テンプレは欲しい
>>968
リーグ戦の報告の人のためにエンジン名と勝敗を下に持っていきたいのかもしれないが
記入例見ても何のソフトが戦ったのかすぐにはわからんぞ。
エンジン名と勝敗が最初に来るからこれまでのテンプレのほうがわかりやすいように感じる
OSの情報は要るのか疑問だが OSもCPUもメモリも要らねぇだろ正直
対局ソフト、対局結果、スレッド数、持ち時間、(設定)の4〜5項目あれば良い
やねうら王ブログの検証がこの4項目だけど
文句言われてるの見たことないぞ まふさんの悪口を書く人いるけど、まふさん気にしないで下さい。実際にまふさん
が公開した評価関数は、一番強いremutama40で、4スレで軽く4100以上のレーティング
を確認しています。何も悪口言われる筋合いはありません。 まふさんは4100前後の評価関数を7個くらい作ったんか? CPUかNPSは総ノード数出すのに要ると思う。
あとメモリの記載があると例えば>>969を見て、
Hashが8192では、2ソフト分で8192×2+評価関数等があるので
メモリ16GBに対して高すぎませんか?とか突っ込みができる ●自己対局の設定
Threads(スレッド数):両方同じ数にする。使用PCの論理コア数に合わせる
Hash(置換表サイズ):両方同じ数にする。使用PCのRAMの1/4にする
USI_Hash:↑と同じ
USI_Ponder:必ず両方Falseにする。ここを間違える人が圧倒的に多い
Byoyomi_Margin:0にする
NetworkDelay(通信の平均遅延時間):0にする
Network Delay2(通信の最大遅延時間):0にする
MultiPV:1にする
Minimum_Thinking_Time:両方同じ数にする
EvalShare:Falseにする
OwnBook(定跡):出来るだけ同じ定跡を使う。定跡OFFは同じ展開ばかりになるのでオススメしない(並列探索すればマシにはなるが)。様々な互角局面から、1局面につき先後入れ替えで対局させるとさらに良い
●有意に強いといえる勝数
50局中 34勝以上(99%)
100局中 62勝以上(99%)
500局中 279勝以上(99%)
1000局中 541勝以上(99%) 531勝以上(95%)
2000局中 1057勝以上(99%) 1044勝以上(95%)
3000局中 1570勝以上(99%) 1554勝以上(95%)
・信頼区間にかかわらず最低500局ぐらいは対局したほうがいいと思う
・有意差ではなく勝率推定したい場合は最低3000局以上くらいないと測定誤差大きいと思う
・定跡が微妙な場合はp<0.01でも信頼性低いと思う
・総当り戦は素直にBayeselo使うのがいいと思う。LOSも簡単に出してくれるし もう、ここまで厳密だと逆に誰も自己対戦報告しなくなるだけじゃね? 厳密になるぶんには誰も困らんとは思う。ただこんな個人が勝手勝手にやる匿名掲示板で、例え手法に問題がなくてもまともな検証なんかできると思えん。ディスるわけじゃなくてね。微々たる?差を必要としている人は自前でやるだろうし >>972
やねは所有マシンのスペックを事前に公開してるだろ
匿名掲示板とは条件が全く違う 99%だとか言ってる奴は荒らしだろ
計測ブームなんて既に下火になりかけてるんだから
テンプレは従来のままでいい
変に改変しても荒れるだけだしな 将棋DB2のfloodgateは野良なのか?
接続しても大丈夫? >>976
BayesEloとやらのほうが素直なのか?
>>847と>>903が同じ人が出したBayesEloとElostatなわけだよね
>>909みてるとElostatの結果の方が素直にみえるが ルール厨の書き込みなんて放っておけって
こういう意見が衝突してる時には
テンプレは現状維持が定跡
どの意見を採用しても
採用されなかった意見の発案者が荒らしに変貌するからね どちらにせよ勝率6割程度では例え1000対局しても価値はない
せいぜいやや強いぐらいのことがわかるだけなので
この乱立環境ではせめて100対局で勝率7割ぐらいの
圧倒的に強いといえるものがほしい
それ以外は計測の練習にしかならんよ そもそもブリードブームの前は、人が多くなる選手権後のソフト大量公開時期ですら今の対局結果テンプレ守ってる人が多かった訳で、「テンプレが冗長」とか理解力がない奴の言い訳でしょ
追加でリーグ戦用のテンプレ作るとかはありかもしれないけど、現行の対局結果テンプレを変える必要はない テンプレ改変の議論なんか950超えてからするもんじゃない
現行のまま立てて次スレでのんびり議論すればいい話
勝手に改変する前振りに利用する雰囲気も出ているから
立てられる人は荒れる前に早めに現行テンプレで立てて欲しいね どんな精度で満足するのかはやる人の勝手だろうよ
99%の精度が必要なら自分でやりゃいいわな テンプレのどこかに、まふさんのGITHUBも含めよう 今検証募集してるremutama40と混ぜたりした検証も 現在の配合組み合わせじゃelmoに勝率70%が限度のようだ このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。
life time: 34日 23時間 10分 15秒 レス数が1000を超えています。これ以上書き込みはできません。