▲コンピュータ将棋スレッド121 [無断転載禁止]©2ch.net
レス数が1000を超えています。これ以上書き込みはできません。
配合繰り返すだけでレートが10ずつでも上がり続ければ楽なんですけどね >>955
有意検定を知ってて書いた感じではなさそうだしuuunuuunさんとその仲間たちがレート表をより充実させてくれるんじゃない? 河童さんのREMUのおかげで、どうブレンドするとどれがスポイルされるのかとかがわかるようになって、すごく助かってます
河童さん、ありがとう!
いろいろ混ぜると、完全に殺されちゃう血統が出るというのは驚きでした
あと、短距離血統のブレンドを始めましたが、まふ評価関数は短距離からクラシックディスタンス(笑)まで満遍なく強いです
短距離ならelmoや野生の読み太のほうがイケるかなと踏んでいたのですが、敵いませんでした
浅い読みでも細かな穴をバシバシ突いて逆転するので、棋譜を見ていても楽しいです
対局条件は4スレ1秒、Ponder、定跡、ネットワークディレイ関係、eval share全てOFFです
勝敗はあえて載せませんw 絞り方教えてくれー。そして探索部ってなんなんだよおー。絞ったら若干弱くなってる気がするょおー。バッチサイズ、バラバラで教師局面作ったからラーンするときエラー出まくりなんじゃー >>960
ソフト数が2や3ならともかく10ぐらいになってきたので
99.9%は欲しい
なので片方が強いと言えるにはこのぐらいの対局数で希望したい
片側0.1%
12240-11760(51%)
3146-2904(52%)
1425-1292(53%)
853-727(54%)
539-441(55%)
381-299(56%)
293-221(57%)
226-164(58%)
180-125(59%)
150-100(60%)
128-82(61%)
108-66(62%)
97-57(63%)
84-47(64%)
76-41(65%)
66-34(66%)
59-29(67%)
56-26(68%)
49-22(69%)
43-18(70%) >>931-932
ノード数固定も完璧じゃないんだよ
基本的には並列度があがるにつれ無駄読みが増える(同じノード数でも読みが浅くなる)訳で
例えば8スレッド1000万ノードと128スレッド1000万ノードなら基本的には前者の方が強いはず
やるとしたらノード数+スレッド数固定なんだけど、どのあたりを落としどころにするかだよね
時間とスレッド数とbenchコマンドの結果を併記してもらってあとは受け手がどう扱うかに任せるくらいが現実的では >>963
だれもやる奴いなくなる気がしないでもないな
あと実験して結果を見てから恣意的に棄却域を設定するのはどうかね? 90%と95%でそれぞれ早見表作るのが良さそう
基本は95%、長時間なら90%で妥協してと良いとかで使い分けられる
それ以上の精度で計測するのは現実的に難しいでしょう 今話題の無料の観る将棋アプリ将棋DB2?
@backflip1801
foodgateの運用開始しました。
http://floodgate.shogidb2.com で4081番ポートで接続できます。とりあえず、floodgate-900-0とfloodgate-3600-0の2種類のゲームで運用しています。参加お待ちしております。 とりあえず現行のテンプレだとリーグ戦とかのまとまった結果を書き込んでくれる人には使い勝手が悪そうだけど、新しいテンプレ案誰も作らなさそうだから荒削りだけど作ったの張っとく
【対局条件】
持ち時間:
スレッド数:
おおよそのNPS:
開始局面:
[benchコマンドの結果(任意):]
[ハッシュサイズ(任意):]
[その他(任意):]
【対局結果(全体)】
ソフト名,勝数,敗数,引分数[,勝率(任意)]
【対局結果(詳細)】
ソフト名1,ソフト名2,ソフト1勝数,ソフト2勝数,引分数[,勝率(任意)]
記入例:
【対局条件】
持ち時間:1手5秒
スレッド数:8
開始局面:平手
おおよそのNPS:やねうら王4.55 3000000-4000000,技巧2 2500000-3000000
その他:KPPT型のエンジンはすべてやねうら王4.55を使用/定跡について記載のない場合には標準の定跡を使用
【対局結果(全体)】
ソフト名,勝数,敗数,引分数
elmo-qhapaq(河童全力定跡),55,40,5
技巧2,40,55,5
【対局結果(詳細)】
ソフト名1,ソフト名2,ソフト1勝数,ソフト2勝数,引分数
elmo-qhapaq(河童全力定跡),技巧2,55,40,5 【エンジン】技巧2、やねうら王4.64(yasema10評価関数)
【勝敗】4-6
【持ち時間】1手10秒
【CPU】Intel(R) Core(TM) i7-6700K CPU @ 4.00GHz
【OS】Windows10 64bit
【メモリー】16GB
【思考条件】Threads=8、NarrowBook=OFF、USI_Hash=8192,USI_Ponder=OFF
【特記事項】10回しかやってないけどあんまり差つかなかった テンプレなんて別に>>1-5の便利リンクの紹介だけでも良いんじゃないの?
スレ立てした時に面倒が増えるだけだし
テンプレ守れみたいな書き込みでスレが荒れる原因にもなってる いやなんだかんだ調査報告テンプレは欲しい
>>968
リーグ戦の報告の人のためにエンジン名と勝敗を下に持っていきたいのかもしれないが
記入例見ても何のソフトが戦ったのかすぐにはわからんぞ。
エンジン名と勝敗が最初に来るからこれまでのテンプレのほうがわかりやすいように感じる
OSの情報は要るのか疑問だが OSもCPUもメモリも要らねぇだろ正直
対局ソフト、対局結果、スレッド数、持ち時間、(設定)の4〜5項目あれば良い
やねうら王ブログの検証がこの4項目だけど
文句言われてるの見たことないぞ まふさんの悪口を書く人いるけど、まふさん気にしないで下さい。実際にまふさん
が公開した評価関数は、一番強いremutama40で、4スレで軽く4100以上のレーティング
を確認しています。何も悪口言われる筋合いはありません。 まふさんは4100前後の評価関数を7個くらい作ったんか? CPUかNPSは総ノード数出すのに要ると思う。
あとメモリの記載があると例えば>>969を見て、
Hashが8192では、2ソフト分で8192×2+評価関数等があるので
メモリ16GBに対して高すぎませんか?とか突っ込みができる ●自己対局の設定
Threads(スレッド数):両方同じ数にする。使用PCの論理コア数に合わせる
Hash(置換表サイズ):両方同じ数にする。使用PCのRAMの1/4にする
USI_Hash:↑と同じ
USI_Ponder:必ず両方Falseにする。ここを間違える人が圧倒的に多い
Byoyomi_Margin:0にする
NetworkDelay(通信の平均遅延時間):0にする
Network Delay2(通信の最大遅延時間):0にする
MultiPV:1にする
Minimum_Thinking_Time:両方同じ数にする
EvalShare:Falseにする
OwnBook(定跡):出来るだけ同じ定跡を使う。定跡OFFは同じ展開ばかりになるのでオススメしない(並列探索すればマシにはなるが)。様々な互角局面から、1局面につき先後入れ替えで対局させるとさらに良い
●有意に強いといえる勝数
50局中 34勝以上(99%)
100局中 62勝以上(99%)
500局中 279勝以上(99%)
1000局中 541勝以上(99%) 531勝以上(95%)
2000局中 1057勝以上(99%) 1044勝以上(95%)
3000局中 1570勝以上(99%) 1554勝以上(95%)
・信頼区間にかかわらず最低500局ぐらいは対局したほうがいいと思う
・有意差ではなく勝率推定したい場合は最低3000局以上くらいないと測定誤差大きいと思う
・定跡が微妙な場合はp<0.01でも信頼性低いと思う
・総当り戦は素直にBayeselo使うのがいいと思う。LOSも簡単に出してくれるし もう、ここまで厳密だと逆に誰も自己対戦報告しなくなるだけじゃね? 厳密になるぶんには誰も困らんとは思う。ただこんな個人が勝手勝手にやる匿名掲示板で、例え手法に問題がなくてもまともな検証なんかできると思えん。ディスるわけじゃなくてね。微々たる?差を必要としている人は自前でやるだろうし >>972
やねは所有マシンのスペックを事前に公開してるだろ
匿名掲示板とは条件が全く違う 99%だとか言ってる奴は荒らしだろ
計測ブームなんて既に下火になりかけてるんだから
テンプレは従来のままでいい
変に改変しても荒れるだけだしな 将棋DB2のfloodgateは野良なのか?
接続しても大丈夫? >>976
BayesEloとやらのほうが素直なのか?
>>847と>>903が同じ人が出したBayesEloとElostatなわけだよね
>>909みてるとElostatの結果の方が素直にみえるが ルール厨の書き込みなんて放っておけって
こういう意見が衝突してる時には
テンプレは現状維持が定跡
どの意見を採用しても
採用されなかった意見の発案者が荒らしに変貌するからね どちらにせよ勝率6割程度では例え1000対局しても価値はない
せいぜいやや強いぐらいのことがわかるだけなので
この乱立環境ではせめて100対局で勝率7割ぐらいの
圧倒的に強いといえるものがほしい
それ以外は計測の練習にしかならんよ そもそもブリードブームの前は、人が多くなる選手権後のソフト大量公開時期ですら今の対局結果テンプレ守ってる人が多かった訳で、「テンプレが冗長」とか理解力がない奴の言い訳でしょ
追加でリーグ戦用のテンプレ作るとかはありかもしれないけど、現行の対局結果テンプレを変える必要はない テンプレ改変の議論なんか950超えてからするもんじゃない
現行のまま立てて次スレでのんびり議論すればいい話
勝手に改変する前振りに利用する雰囲気も出ているから
立てられる人は荒れる前に早めに現行テンプレで立てて欲しいね どんな精度で満足するのかはやる人の勝手だろうよ
99%の精度が必要なら自分でやりゃいいわな テンプレのどこかに、まふさんのGITHUBも含めよう 今検証募集してるremutama40と混ぜたりした検証も 現在の配合組み合わせじゃelmoに勝率70%が限度のようだ このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。
life time: 34日 23時間 10分 15秒 レス数が1000を超えています。これ以上書き込みはできません。