▲コンピュータ将棋スレッド121 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
>>622
読みの浅い段階では▲3四飛を読んでいるけど、深くなってくると途端に「これあかんヤツや」ってなる
そんなに悪い手なのかね?w 学習時の定跡で棋風が変わるなら、リゼロ方式でも学習初期のランダムムーブの手数、割合で棋風が変わるんだろうか >>608
mafuta3 406-383-11 .514
yasema10 405-387-8 .511
yasetamafu70 402-388-10 .508
mafu10 398-391-11 .504
よっちゃん9 395-398-7 .498
mafu 394-401-5 .495
mafuta2 392-402-6 .493
mafuta1 391-403-6 .492
よっちゃん10 382-412-6 .481
よく途中で嫌になって止めなかったなw >>626
丸1日半かかったw
好奇心だけで頑張ったが結果が平凡すぎて
こんなもんかと脱力したわw >>621
20週で10万やろ
4年で100万や
どのスペックでどの程度回し続けるのか考えたら損益分岐点は出るやろ 引き分けはノーカウントにしたけど
勝率51.4%でも約800局信頼区間95%で誤差±3.5%だから、有意差無しだな これじゃあまり強くなってないと言われても仕方ない。これ以上の棋力の向上にはブレンド前の強化学習 でもっと強くするしかないのかな 大会で勝ちたければここに出ているような話を一つ突き抜けた
発想をひねり出さなきゃ無理か。当たり前だが。 自分はちょっと違う実験してるんだけど、完成した評価関数にrezeroのepoch0混ぜてどれだけ棋力が維持できるのか調べてる
mafu10に半分epoch0混ぜても大樹の枝には勝てたりするんだよ、これはどういう風に考えたらいいか?
あと伸びない評価関数にepoch0極少量混ぜたら伸び代が出来ないかなと期待している >>608
これぐらいじゃ誤差の範囲だよな
たぶんもう一回同じ対戦させたら
全く順位が変わると思うわ
あとelmoは基準だから絶対入れてほしいね 初期状態を相入玉のランダムな状態にして学習させたら入玉うまいのができるんかな? 入玉は詰ますのと点数勝負を別々に学習させたら面白そう こんな け゛ーむに まし゛に
なっちゃって と゛うするの >>632
epoch0って評価値0のファイルじゃなかったっけ?
だとしたら、50%でブレンドすると単純に元の評価値が半分になるだけな気がする
ということは、自分の中では全部半分の評価値の中からいいもんを選ぶだけだから、指し手は変わらんのでは? >>608
よく頑張ったな。
ここからさらに強くするには大規模な学習が必要かな >>641
そうか。ポナンザの駒割りも表に出てたから、ポナンザ駒割りでも強いのが出来るんだね。 >>631
次回の電王トナメは同じくらいのレーティングの団子レースになるから
正直勝ち抜けに一番必要なものは当日の運やで まあとにかく一発勝ちゃ勝ちだからな
稲庭みたいな変なのでいってみてもいいのかも >>648
玉以外100とか適等に割り振ってもいいぐらいコマ割りはどうでもよい yasema10対elmoで2秒6スレで300対局の結果
yasema10から見て128-28-144と何故か負け越し。
一方でmafu10ではなくmafuとの混合だとelmoに99-16-85と勝ち越し。
まふ氏のところで上がってる勝率66%のデータは5秒4スレだけどここまで変わるものかな?
それとも互角局面開始(24手?)だとmaf10が定跡強化しているからそちらのほうが効いているのか? 駒割りは意外と重要だけど大きく違わなければ差は出てこないと思う
ponanzaはaperyと違って飛車より馬の価値が高いから、そういうのは影響でそう >>652
評価関数で間接的にコマ割りが表現されてるから気にしなくてええんやで コンピュータ将棋とプロ棋界の歩み
http://qiita.com/tibigame/items/c3566aca81ada69d2c71
elmo以降に何が起こったのか
・Qhapaqがelmo絞りを行いエロ河童となりelmoと互角の力を得た。
・やねうら王がelmo絞りによる評価関数学習用のルーチンを洗練させて野良評価関数が多数育成される。
・ゼロベクトルからの学習をループさせることでelmoと同等以上になることが示される。
・ゼロベクトルから定跡を食わせて学習させることで少ない局面で浮かむ瀬級にできることが示される。
・複数の評価関数を合成させる技術:キメラ合成が解禁されelmoより+100となる合成法が発見される。
・洗練された定跡を用いて遥かに少ない局面でelmo+200以上の領域に到達できることが示される。(この間選手権からわずか2ヶ月) 激指定跡道場4クッソ強いな
yasema10に87-13で勝ち越しだわ 改正版(勝率順)
yasema10 463-429-8
mafuta3 461-428-11
elmo 459-438-3
yasetamafu70 450-438-12
mafu10 449-440-11
よっちゃん9 450-443-7
mafu 438-457-5
mafuta2 435-459-6
mafuta1 434-459-7
よっちゃん10 425-469-6
elmoに勝ち越した評価関数
yasema10 elmo 58-42
mafuta3 elmo 55-45
よっちゃん9 elmo 55-45
最も勝敗差が大きかった対戦
yasetamafu70 mafuta2 62-35-3
以上です。 >>656
どうもです
elmoより強くなったって間違いだったのか?
そして
よっちゃん9>よっちゃん10なの? けっきょくelmoに勝っててレートも高いのはyasema10 mafuta3の2つだけかな。
自己対戦ベースで強くなってても他と戦わせるとそうでもないって言うのはあるあるらしいからね。 ちゃんと初手から指させたら
yasema10とrelmoのどっちが強いんだろう 前にnodchip互角局面を使って6スレ2秒で戦わせたけどもう少し差が出たよ。
それだとelmoのレートが下がると思う。たぶん4スレ1秒だとどの評価関数も精度が高くて差がでない。 >>653
ゼロフィルのepoch0評価関数にランダム値の評価関数から作った棋譜を学習させると
値が付けばつくほど弱くなる、値の付いてない局面は駒割りだけで評価してて、そっちの方が強いから
駒割りが無効化されるほど評価関数の学習が進むまでは駒割りは効いてくる 持ち時間10分一手10秒加算でやったら結局elmoが最強だったり >>660
あくまで参考程度にして下さいw
ただ、個人的に互角局面から指させるのは反対です SDTを占うなら結局大会仕様機で検証せにゃならんだろ
というステマ まふ関数が思ったより定跡チックに指さない
と言っても交配が進むともっと歪な序盤になるけどね
今更ながらポナって最序盤は変な手だけど、銀冠穴熊組んだり銀矢倉狙ったり構想は手堅くて人間好みな気がする やねうら王以外、GitHub更新がないみたいだけど、オープンソースにも色々あるんだね >>653を解説
例えば、歩の駒割りを;-1して、「KK歩」を全て+1、「KKv歩」を全て-1すれば評価値は変らない。
同様に、歩の駒割りを;-1して、「K歩PT」を全て+1/37、「Kv歩PT」を全て-1/37すれば評価値は変らない。
取り合いの評価で駒割りだけを使うようなロジックが入っている場合は挙動が違ってくるけどおおまかな
所は上のように、学習していけば駒割りの値は評価値に組込まれるので大丈夫ってこと。
逆に、KKPやKPPTのうち駒割り成分を、例えば最大最小が同じになるようなルールで取り出せば、
その評価関数における駒割りがどのように評価されているかの傾向もわかるね。 それなら駒割りって元々いらなくない?
計算資源の無駄な気もするけど何かメリットあるの? 複数使え
むしろ評価関数だけじゃなくて技巧みたいな探索から別の物も使え
詰み探索はさらに別に詰み専用の物を使え 駒割りが関係ないならepoch0を半分混ぜても意味ないよね まじで? 透さんって方公開してくれたのか。
ありがたや すごいね、めっちゃ嬉しい
これに勝てるのを ブリード出来たら報告やね >>673
>>667を100回読み直してからおいで >>677
となると駒割りが関係なくはないのでは
epoch0を半分混ぜても意味がなくなるように駒割りを設定すべきでは
たぶんそれが真の駒割り >>678
だからSEEって書かれてるじゃん
なんでお前はそんなに国語力と理解力がないんだよ >>656
勝率を表記
yasema10 463-429-8 .5191
mafuta3 461-428-11 .5186
elmo 459-438-3 .512
yasetamafu70 450-438-12 .507
mafu10 449-440-11 .505
よっちゃん9 450-443-7 .504
mafu 438-457-5 .489
mafuta2 435-459-6 .487
mafuta1 434-459-7 .486
よっちゃん10 425-469-6 .475
最上位と最下位のレート差 30.6 >>657
この結果だけではそうとはいえない。
少なくともよっちゃん10がよっちゃん9より強いとも弱いとも言えない、しか
わからない。 >>679
KPPは12年前のBonanza1ではなく9年前のBonanza4以降
KPPTはNDF >>599
生物の進化と同じで無駄ではないと思う
いろんな物が試されて少しずつ変化してきて駄目なものが淘汰されて生き残ってきたのが今の形式なので
長く続けているからこそ、まれにbonanzaやNDFやelmoみたいな突然変異が現れて一気に加速することもある >>674
うちのエースと戦わせてみてる
これ、評価値おかしいぞ
200%とかを繰り返しただけだろ?
常に自分がちょ〜優勢と言っている
ラリっててハイになってるだけっぽい >>685
明らかに何か間違えてるよねこれ
初手でいきなり評価値-100くらいの48玉指したり、初手78金に300点くらいつけたり挙動がおかしい >>656
uuunさんからツッコミ入ったで
uuunuuun @uuunuuun1
やねうら王はデフォールトでEvalShare = onになっていて、
これをoffに切り替えないと別の評価関数を指定しても
同じ評価関数で対局するというトラップがあります。
>yasetamafu70 mafuta2 62-35-3 でR100近く離れてるしここは大丈夫だと思うけど
面倒だけど全部のカードの対戦書き出してくれると嬉しい uuunuuun? @uuunuuun1 39分39分前
その他
評価関数がどれも同じだという某所のデータ、ちょっとおかしいような気がしてきました。私が測ったyasetama10 vs elmoは200局程度でR100以上離れていたし、eloqhappaに対しても150局でR120位離してます。 uuunuuun? @uuunuuun1 36分36分前
その他
やねうら王はデフォールトでEvalShare = onになっていて、これをoffに切り替えないと別の評価関数を指定しても同じ評価関数で対局するというトラップがあります。@BigHopeClasic そもそもelmoが上位に来るのがおかしい
どの配合もエルモを超えているのに >>691
https://github.com/yaneurao/YaneuraOu/blob/master/docs/%E8%A7%A3%E8%AA%AC.txt
>共有する条件は、YaneuraOu + やねうら王のバージョンナンバー + EvalDir名 が合致したときです。
評価関数フォルダ名を変えればEvalShareがオンになっていても大丈夫だと思うんだが 昨日改正版をあげた者ですが、全てonになっていました
よって、私のデータは何の意味もありません
大変申し訳ありません
お詫びとして、改正版の評価関数に
rezero8、relmo8、yasetamafu70+を加えた計13
評価関数の総当たりをやります
いつ終わるかはわかりませんが、今回の件は大変申し訳ありません
万が一、結果が同じになった時はお許し下さい どんまい。
雲のアイコンの人は上の方のレート差には興味がなさそうなのに数字には誠実だな >>696
基本どの評価関数もelmoに勝ち越すので
elmoが最下位にならないと結果として変と思って下さい >>698
関数じゃんけんになってるとしたら、その限りではないでしょ >>686
まふさんがいってるように序盤はメインで食わせた定跡を使わないとダメなんじゃないか?
学習局面が極端に中終盤以降なのでは お前たちは何故engineの配下にevalフォルダを作るんだよw
んなことしたら、同じ評価関数でエンジン切り替えたりするの面倒じゃん これ後手が勝勢の局面なんだけど、先手が41金と51金を繰り返すと千日手にできるんだけど、
ソフトはなぜか千日手を選ばないんだけど、なぜなんだろう?
後手の持駒:金 銀 桂二 香 歩二
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・ ・ ・ 金 ・ ・ ・v香|一
| ・ ・ ・ ・ ・v玉 ・ ・ ・|二
|v歩 ・ ・v歩v金v歩v桂v歩v歩|三
| ・ ・ ・ 角v歩 ・v歩 ・ ・|四
| ・ ・v歩 ・ ・v銀 ・ 歩 ・|五
| 馬 歩 ・ ・ ・ ・ ・ ・ ・|六
| 歩 ・ ・ 金 ・ 歩 ・ ・ 歩|七
| ・ ・ ・ ・ 銀 ・ ・ ・ ・|八
| 銀 桂 玉 歩 ・ ・v飛v飛 香|九
+---------------------------+
先手の持駒:歩二 >>692
個別ではそれぞれelmoを上回っていても蠱毒の壺で潰しあった結果
トータルでelmoを下回ることはありうると思うが >>696
どんまい
むしろそのデータ貴重なんで待ってるで >>696
onになってても有意差の出たカードはあるわけで、そのへんが興味深い 有意差出てないって
800局勝率50%で信頼区間95%で46.5%〜53.5%の範囲 >共有する条件は、YaneuraOu + やねうら王のバージョンナンバー + EvalDir名 が合致したときです。
例えば
C:\elmo\やねうら王実行ファイル
C:\elmo\eval\評価関数ファイル
C:\mafu10\やねうら王実行ファイル
C:\mafu10\eval\評価関数ファイル
こういうフォルダ構成でやねうら王の同バージョンで対局させた場合にどっちかに評価関数が共有されちゃうってこと?
こりゃだいぶ多くの検証勢が逝ってそうね これ例えテンプレ使ってたとしてもEvalShareに触れてる人いなかっただろうから
謎の信用できそうなデータ()が出来上がってたんだろうな… 初期設定でなぜチェック入ってるのだろうね
対戦のとき必要ないのに 異種評価関数との自己対局のときにこの設定で引っかかるバカが後を絶たないのでデフォルトでオフになっています。 >>703
この局面で将棋所でもshogiGUIでも
▲4一金 △5二玉 ▲5一金 △4二玉
▲4一金 △5二玉 ▲5一金 △4二玉
▲4一金 △5二玉 ▲5一金 △4二玉
▲4一金 △5二玉 ▲5一金 △4二玉
▲4一金
にて先手反則負け
もしくは▲4一金が入力できないが正しいのにそうならないのはバグですか? https://github.com/mafu-opening-theory/Shogi_opening_theory/blob/master/まふ定跡(Apery形式)エンジン設定等/エンジン設定(参考)%20やねうら王early.txt
>EvalShare 評価関数を共有メモリに展開する・・・True
これまふさんのとこも設定直した方がいいわ まふさん、オフにせずずっと検証してたの?
人に検証頼んだりしたのは平気だろうけど・・・ >>714
千日手が実装されているKif for Windowsで試してみたけど、12手目の42玉で千日手になるね
後手の持駒:金 銀 桂二 香 歩二
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・ ・ ・ 金 ・ ・ ・v香|一
| ・ ・ ・ ・ ・v玉 ・ ・ ・|二
|v歩 ・ ・v歩v金v歩v桂v歩v歩|三
| ・ ・ ・ 角v歩 ・v歩 ・ ・|四
| ・ ・v歩 ・ ・v銀 ・ 歩 ・|五
| 馬 歩 ・ ・ ・ ・ ・ ・ ・|六
| 歩 ・ ・ 金 ・ 歩 ・ ・ 歩|七
| ・ ・ ・ ・ 銀 ・ ・ ・ ・|八
| 銀 桂 玉 歩 ・ ・v飛v飛 香|九
+---------------------------+
先手の持駒:歩二
▲4一金 △5二玉 ▲5一金 △4二玉
▲4一金 △5二玉 ▲5一金 △4二玉
▲4一金 △5二玉 ▲5一金 △4二玉
▲4一金 △5二玉 ▲5一金 △4二玉
▲4一金 >>718
このケースだと連続王手の千日手だからルール上は先手負けにならないといけないので
どっちにしろダメですね >>719
なるほど、連続王手の千日手は禁止だったね、すっかり忘れていたよ
ありがとう、スッキリした ShogiGUIで試したら連続王手の千日手で後手勝ちになった
Kifu for windowsで試すと最後の41金を入力する前に千日手が成立 ■ このスレッドは過去ログ倉庫に格納されています