▲コンピュータ将棋スレッド121 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
>>691
https://github.com/yaneurao/YaneuraOu/blob/master/docs/%E8%A7%A3%E8%AA%AC.txt
>共有する条件は、YaneuraOu + やねうら王のバージョンナンバー + EvalDir名 が合致したときです。
評価関数フォルダ名を変えればEvalShareがオンになっていても大丈夫だと思うんだが 昨日改正版をあげた者ですが、全てonになっていました
よって、私のデータは何の意味もありません
大変申し訳ありません
お詫びとして、改正版の評価関数に
rezero8、relmo8、yasetamafu70+を加えた計13
評価関数の総当たりをやります
いつ終わるかはわかりませんが、今回の件は大変申し訳ありません
万が一、結果が同じになった時はお許し下さい どんまい。
雲のアイコンの人は上の方のレート差には興味がなさそうなのに数字には誠実だな >>696
基本どの評価関数もelmoに勝ち越すので
elmoが最下位にならないと結果として変と思って下さい >>698
関数じゃんけんになってるとしたら、その限りではないでしょ >>686
まふさんがいってるように序盤はメインで食わせた定跡を使わないとダメなんじゃないか?
学習局面が極端に中終盤以降なのでは お前たちは何故engineの配下にevalフォルダを作るんだよw
んなことしたら、同じ評価関数でエンジン切り替えたりするの面倒じゃん これ後手が勝勢の局面なんだけど、先手が41金と51金を繰り返すと千日手にできるんだけど、
ソフトはなぜか千日手を選ばないんだけど、なぜなんだろう?
後手の持駒:金 銀 桂二 香 歩二
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・ ・ ・ 金 ・ ・ ・v香|一
| ・ ・ ・ ・ ・v玉 ・ ・ ・|二
|v歩 ・ ・v歩v金v歩v桂v歩v歩|三
| ・ ・ ・ 角v歩 ・v歩 ・ ・|四
| ・ ・v歩 ・ ・v銀 ・ 歩 ・|五
| 馬 歩 ・ ・ ・ ・ ・ ・ ・|六
| 歩 ・ ・ 金 ・ 歩 ・ ・ 歩|七
| ・ ・ ・ ・ 銀 ・ ・ ・ ・|八
| 銀 桂 玉 歩 ・ ・v飛v飛 香|九
+---------------------------+
先手の持駒:歩二 >>692
個別ではそれぞれelmoを上回っていても蠱毒の壺で潰しあった結果
トータルでelmoを下回ることはありうると思うが >>696
どんまい
むしろそのデータ貴重なんで待ってるで >>696
onになってても有意差の出たカードはあるわけで、そのへんが興味深い 有意差出てないって
800局勝率50%で信頼区間95%で46.5%〜53.5%の範囲 >共有する条件は、YaneuraOu + やねうら王のバージョンナンバー + EvalDir名 が合致したときです。
例えば
C:\elmo\やねうら王実行ファイル
C:\elmo\eval\評価関数ファイル
C:\mafu10\やねうら王実行ファイル
C:\mafu10\eval\評価関数ファイル
こういうフォルダ構成でやねうら王の同バージョンで対局させた場合にどっちかに評価関数が共有されちゃうってこと?
こりゃだいぶ多くの検証勢が逝ってそうね これ例えテンプレ使ってたとしてもEvalShareに触れてる人いなかっただろうから
謎の信用できそうなデータ()が出来上がってたんだろうな… 初期設定でなぜチェック入ってるのだろうね
対戦のとき必要ないのに 異種評価関数との自己対局のときにこの設定で引っかかるバカが後を絶たないのでデフォルトでオフになっています。 >>703
この局面で将棋所でもshogiGUIでも
▲4一金 △5二玉 ▲5一金 △4二玉
▲4一金 △5二玉 ▲5一金 △4二玉
▲4一金 △5二玉 ▲5一金 △4二玉
▲4一金 △5二玉 ▲5一金 △4二玉
▲4一金
にて先手反則負け
もしくは▲4一金が入力できないが正しいのにそうならないのはバグですか? https://github.com/mafu-opening-theory/Shogi_opening_theory/blob/master/まふ定跡(Apery形式)エンジン設定等/エンジン設定(参考)%20やねうら王early.txt
>EvalShare 評価関数を共有メモリに展開する・・・True
これまふさんのとこも設定直した方がいいわ まふさん、オフにせずずっと検証してたの?
人に検証頼んだりしたのは平気だろうけど・・・ >>714
千日手が実装されているKif for Windowsで試してみたけど、12手目の42玉で千日手になるね
後手の持駒:金 銀 桂二 香 歩二
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・ ・ ・ 金 ・ ・ ・v香|一
| ・ ・ ・ ・ ・v玉 ・ ・ ・|二
|v歩 ・ ・v歩v金v歩v桂v歩v歩|三
| ・ ・ ・ 角v歩 ・v歩 ・ ・|四
| ・ ・v歩 ・ ・v銀 ・ 歩 ・|五
| 馬 歩 ・ ・ ・ ・ ・ ・ ・|六
| 歩 ・ ・ 金 ・ 歩 ・ ・ 歩|七
| ・ ・ ・ ・ 銀 ・ ・ ・ ・|八
| 銀 桂 玉 歩 ・ ・v飛v飛 香|九
+---------------------------+
先手の持駒:歩二
▲4一金 △5二玉 ▲5一金 △4二玉
▲4一金 △5二玉 ▲5一金 △4二玉
▲4一金 △5二玉 ▲5一金 △4二玉
▲4一金 △5二玉 ▲5一金 △4二玉
▲4一金 >>718
このケースだと連続王手の千日手だからルール上は先手負けにならないといけないので
どっちにしろダメですね >>719
なるほど、連続王手の千日手は禁止だったね、すっかり忘れていたよ
ありがとう、スッキリした ShogiGUIで試したら連続王手の千日手で後手勝ちになった
Kifu for windowsで試すと最後の41金を入力する前に千日手が成立 >>721
なるほど、ShogiGuiの場合、検討モードだといくら繰り返しても千日手にならないけど
対局モードだと千日手(後手の反則勝ち)になるんだ >>707
個別のカードの話だよ。
>>656
>yasetamafu70 mafuta2 62-35-3
これR99差な訳で。
こういうのが個別のカードで出てるのに全体では収束してるのが面白かったのよ。 >>723
だからその個別対局のデータも、そんなサンプル数では有意差はないんだよ 100局、200局、300局、400局、500局で
それぞれの信頼区間90%での誤差一覧表が欲しいね
テンプレに入れよう 俺が知りたいとかではなく
一覧化して書き込んで誰でも分かるようにするべきという話よ
自前で調査したデータを書き込みたい人用ね なるほど
同じソフトを対戦させても62-35-3という結果は1%弱くらいの確率で生じてしまうわけだな。
>>656の総当たりは100戦を45回くらいやっているわけだから
62-35-3があっても確率的に変というほどではないな
よく95%信頼区間で有意差とか言われているが、むしろ5%で裏切られると思った方がいいかも 0,1乱数発生器で100回50セットやるとこんなん
52 54 48 49 51 58 51 45 54 50
49 53 47 54 46 46 51 55 43 58
48 53 55 57 58 52 42 49 46 55
45 50 36 53 49 47 51 58 51 51
53 49 44 53 49 47 60 50 55 46
最大 60
最小 36 >>727
221 名無し名人 sage 2017/07/15(土) 15:35:11.44 ID:8IiilvNw
アマチュア大会で入賞という棋歴が光っているね
これが他のニワカコンピュータ将棋研究家には真似できない部分
この方はsuimonさんだぞ。
頭が高いぞお前たち。 やせたまふ70+あげてくれたのかー。 ありがたい。
今手持ちの適当に組み合わせたキメラ合成関数がエルモに80%くらい勝てるから
やせたまふ70+との対戦が楽しみ >>732
継続対戦中18戦15-3
でも やせたまふ70+ ほうが強いと予想してる >>733
suimonさんはまとめサイトと違って2chでネタを仕入れても自分の言霊で執筆しているからただのまとめ人ではないんだよな。
そこがアクティブなsuimonさんのすごいところ。 >>685は、やせたまふ70+じゃないね 弱すぎるし 評価値むちゃくちゃだったw >>674は yasetamafu70より ずっと弱いし そもそも壊れてる やはりここから先はブレンドしてただけじゃ強くならないなと思い、うちのエースをシボレーで絞ってみている。
やねさんのおかげで実行は簡単になったものの、実行にかかる時間だけはしょうがないね…。 >>124
100局でも差が大きければ有意差になるに決まってるじゃん。
統計の勉強したことあるの?
> 対局数がn=100n=100の場合、(中略)
> r>0.5822427
> であれば有意に強いと言える。
http://tadaoyamaoka.hatenablog.com/entry/2017/06/14/203529 >>728
いや、検定というのはそういうもので、5%で偶然が起こっても
むしろ95%の必然と理解しようねという話だから。 674の「yasetamafu70に6割勝てる奴」はyasetamafu70+じゃありません
yasetamafu70+は誰にもお渡ししておりませんので・・・ 透。 信頼区間95%は20回中19回は当たるという意味
100局45回で測りたいなら信頼区間99%で37.5〜62.5の範囲に100回中99回収まる
有意差なし mafuta2と野生の読み太2を5:5で配合するだけで、私が試した配合では、
最強なので試してみて下さい。だだ、4スレ一手5秒だけの検証で、これ以外では、
分かりません。ちなみにelmoと4スレ一手5秒、定跡切りでは、100局での勝率は、
yasema10と有意差はないです。elmo以外には、4スレ一手5秒で皆勝ち越しています。 まふさん
EvalShareの設定
OKです設定ミスはないということですね suimon先生がエアリプを送ってくださったとしか考えられない。
変なのについて言及されているので。
suimon @floodgate_fan
ネットに上がっているブレンド評価関数、中には変なのも混じっているようだ。
◯◯に7割勝つとかだけでなく、自分でその評価関数の出す、評価値や読み筋に違和感がないかをよく確認しなければならないと思う。
午後4:59 · 2017年7月15日 多分EvalShareで実質同じ評価関数同士になっていて
そこで100局で6割みたいな偶然が起こったんだろうな >>739
一つのソフトの組み合わせのみについて、考えるなら99もレート差あればどちらが強いかという意味においてはかなり確度は高いよ(レート差99が妥当とは言っていない)
そこのみについて考えるなら、普通に信頼区間の考えを用いるだけで良い
ただし、セット回数が増えれば、真の勝率からの信頼区間から外れた結果を得る確率も上がるので、それを抜き取って有意差があるとするのはおかしいという話 データ取り直す人は
定跡のオフとかも確認しないとね
同じ数値同じ設定にしないと 勝率 ・・・ 95%有意と言える対局数
51% 6764局
53% 752局
54% 423局
55% 271局
56% 188局
57% 139局
58% 106局
59% 84局
60% 68局
とりあえず早見表作ってみた
計算間違えていたら訂正頼んだぞ 喜べ
99.9%で当たるくじを45回引いたときに全部当たる確率は95%だ
計算しやすいぞ 734 名前:名無し名人 (オッペケ Srea-bXhv)[sage] 投稿日:2017/07/14(金) 23:13:26.47 ID:7eVa3cumr
三浦の▲54角にponanzaが一瞬-1000を出したのはやっぱり間違いっぽいな
△97香成から必至かけるも後手玉詰む筋を示してた
91飛とかわすか、86飛87歩に82飛と引いておけばいい勝負だったみたい
741 名前:名無し名人 (ワッチョイ c3af-dQC/)[sage] 投稿日:2017/07/15(土) 11:16:06.38 ID:pLXdmp7g0
54角いい手だな
一瞬で慶太から時間を奪い去って後は間違えるだけにしてしまった
仮にポナンザが正しかったとして、ポナンザレベルの対応をされても-300程度ならローリスクもいいとこ
744 名前:名無し名人 (ワッチョイ 4eb6-z+eH)[sage] 投稿日:2017/07/15(土) 19:32:05.29 ID:OBJyiHLg0
>>736
自分もやってみた
111手目指した後に数十秒経って、急に後手優勢から先手勝ちに表示が変わって驚いたわ
この場面では、三浦 >>> エルモだな
http://www.eiou.jp/kifu_player/20170714-1.html なんか、「配合してちょびっと強くなった!」とか馬鹿のやることに見えるのは俺だけ?
根本が強くなってなくね? evalshare off 定跡off 2秒6スレッドでやってみた。
elmo mafuta3 40 3 57
elmo yasema10 33 5 62
relmo yasema10 44 7 49 ディープラーニング頑張ってるPona山の方がよっぽど将来性あるんじゃないか
結局、今までPonaが強かったのって開発者のそういう頭の良さが関係あると思う 汎用的な方法だとパラメータ数でもう上限に近そうだし、やはり進行度を上手く取り入れるしかないんじゃないかねぇ。
多分、中盤までは今の延長で良いと思うから、終盤判定と、終盤用のロジックが新しく欲しい。 詰めまで何手
手抜けるかとか足りない駒数とかを上手く表現できると良いんだけどなぁ。 >>757
勝率別 ・・・ 有意に強いと言える対局数
51% 6764局
52% 1691局
53% 752局
54% 423局
55% 271局
56% 188局
57% 139局
58% 106局
59% 84局
60% 68局
elmo mafuta3 40 3 57 → 勝率58%、有意に強いと言うには後6局は欲しい
elmo yasema10 33 5 62 → 勝率65%、有意にelmoより強い◎
relmo yasema10 44 7 49 → 勝率52%、有意に強いと言うには後1500局は欲しい
elmo yasema10以外はデータ不足だね Qhapaq @Qhapaq_49
評価関数分解機、多分完成。これからwindows用にビルドしてやねうら王にプルリクしてアピールと使用法をブログに書いたらミッション完了ですか。うーん、ここからが長い。
新しいおもちゃが来るぞ suimonさんは有意検定にも詳しいんですね。
さすがコンピューター将棋の第一人者。勉強になります。 744で、mafuta2と野生の読み太2を5:5で配合が強いと書いたものですが、後でmafuta2との
対局をしていないことに気づきました。そして、早速対局の結果、mafuta2の方が、より
強いことが分かりました。間違った情報を伝え申し訳ありませんでした。この場を借りて
お詫び致します。<(_ _)> なんでtwitterから持ってきてyasema10最強という結論なんだ?
uuunuuun? @uuunuuun1 4時間前
ブリード種はたくさんあるしあとには残らないと思うのでレート表には載せないつもり。yasema10が一番強いと言っているものでもない。 検定はなぁ…
とにかくデータ数増やせば小さい差であっても有意と言えるようになるが、
そんな小さな差が現実的に意味のある差なのかという問題がある shogidroidで、一番弱いのはgpsだと思うけど、次は最初の技巧?
ある程度勝てるソフトと指したいw >>772
デュアルXeonだとかなり早いのですね。
suimon率で他のニワカコンピュータ将棋研究家のぼくのかんがえるさいきょうのとうけいがくを論破。
さすが! いつまでsuimon率以外で消耗してるの?
次のブログタイトルはこれだ! >>760
言いたいことは分かるが、コンピュータ将棋関係者であり将棋を指す方で県大会上位を争う研究をしているのはsuimonさんただ一人。
開発の委託とかしないと開発者にとってメリットや面白みがない。
今後の大きな課題だろうね。 よっちゃんとかいう何の実績もないゴミの報告はいらんぞ
まぁただの売名だろうけど よっちゃんって、あのFC2動画主のナマポ野郎が作ったやつだろうが(笑)
あんなの使ってる奴はあほ(笑) よっちゃんは有意差のあるレベルで
yasema10より強くなったら来てくれ レート4200やレート4300などと実際はレート4000程度の評価関数を、
誇大に公開したり(取り下げたり)するものではない。 まふさん質問の答えになってないよ。
なぜまふさん作成の評価関数は横歩取りを指さないの?って質問に対して。 てか本当にR4300もあったらぶっちぎりで優勝だろうがww XEON持ってる人羨ましいな。
一晩学習回していろいろ遊べるし、振り飛車の評価関数作ってみたり出来るだろうし
何より自己対戦も早い ■ このスレッドは過去ログ倉庫に格納されています