▲コンピュータ将棋スレッド125
■ このスレッドは過去ログ倉庫に格納されています
おちつけおちつけ
雑談を議論と勘違いしてるやつしかいないんだから きふわらべさんさKPPTに変わる新しい評価関数を作ってください 残念ながら4.79は4.77に比べてNodes/secondが、AVX2は-0.474%、AVX2-tournamentが
-1.188%下がっています。若干4.77より弱い可能性があります。
yane4.79AVX2 bench 1024 1 19(1回目先に計測)Nodes/second 746963
yane4.79AVX2 bench 1024 1 19(2回目後に計測)Nodes/second 749448
yane4.79AVX2 bench 1024 1 19(3回目先に計測)Nodes/second 755180
yane4.79AVX2 bench 1024 1 19(4回目後に計測)Nodes/second 759042
yane4.79AVX2 平均752658(4.77より-3588, -0.474%)
yane4.77AVX2 bench 1024 1 19(1回目後に計測)Nodes/second 752502
yane4.77AVX2 bench 1024 1 19(2回目先に計測)Nodes/second 757242
yane4.77AVX2 bench 1024 1 19(3回目後に計測)Nodes/second 761134
yane4.77AVX2 bench 1024 1 19(4回目先に計測)Nodes/second 754108
yane4.77AVX2 平均756246
yane4.79AVX2-tournament bench 1024 1 19(1回目先に計測)Nodes/second 745794
yane4.79AVX2-tournament bench 1024 1 19(2回目後に計測)Nodes/second 758463
yane4.79AVX2-tournament bench 1024 1 19(3回目先に計測)Nodes/second 754705
yane4.79AVX2-tournament bench 1024 1 19(4回目後に計測)Nodes/second 758298
yane4.79AVX2-tournament 平均754315(4.77より-9069, -1.188%)
yane4.77AVX2-tournament bench 1024 1 19(1回目後に計測)Nodes/second 767241
yane4.77AVX2-tournament bench 1024 1 19(2回目先に計測)Nodes/second 766751
yane4.77AVX2-tournament bench 1024 1 19(3回目後に計測)Nodes/second 760884
yane4.77AVX2-tournament bench 1024 1 19(4回目先に計測)Nodes/second 758662
yane4.77AVX2-tournament 平均763384 やねうらおってなかなか凄い人だな。
認めて差し上げよう。 三駒関係や、ディープラーニングには 人間には見つけられない癖があるはずで、
盲点が無いプログラムが既に登場しているとは 考えづらく、
また、探索部に ストックフィッシュを使っているということは
手を細く絞って深く読んでいると思うので、
そんなソフトで作られた評価関数は
野球のスイングで言うと 全打席ホームラン狙いをしてるんじゃないかとも思うんで、
ストックフィッシュと 自作ソフトの合議制にして、
自分の手番でストックフィッシュが選んだ手は 選ばないようにして
相手が読んでいる本筋を外し続けるとか、
やってみたいことは いろいろあると思うんだぜ。 ニューラルネットワーク(NN)ははもともと
各クラスのベクトルの単純平均をプロトタイプとする最近隣法(NN法)にすぎない
(それの境地に向けて学習が進むだけ
からベイズ分類器に劣るベイズさいこー
しかし逆に対象の事前確率も共分散行列もわからない状況のときは
単純平均というのは案外頑健な統計量というほかなく、
そんなNNをうまいぐあいに凡化性能マックスで収束させるDNは脅威
これは学習対象の事前確率と共分散行列を具体的に知らねば出し抜き続けることは至難 全打席ホームラン狙いの例えが意味わからんが、それも結構じゃないか
小技とかクソ喰らえ、クラッチ?んなもんねぇよが最新野球科学だし
実際真理ではないんだろうが、実益上問題なければそれでいい 最新、難易度ランキング
100:チェス世界チャンピオン
98:世界棋士レーティング(囲碁)1位
97:世界囲碁マスター・世界棋王・世界囲碁選手権者のいずれかを獲得
95:囲碁七冠達成、将棋七冠達成
90:囲碁名人位、将棋名人位
87:チェスグランドマスター
85:東大医学部教授
80:最高裁裁判官、事務次官
79:医師(東大医学部、理科三類経由)
74:弁護士(東大法学部→旧司法試験)、囲碁プロ試験合格、将棋プロ試験合格4段
70:医師(国立) 裁判官(地方、東大法京大法)、囲碁アマ8段、将棋奨励会3段
69:検察官 弁護士(私立法学部→旧司法試験)、囲碁アマ7段、将棋奨励会初段
67:公認会計士(東大京大) 検察官弁護士(東大京大法学部→新司法試験)
65:英検1級、医師(私立) 国家総合職(国立)新司法試験(私立法学部)、院生試験、奨励会試験、囲碁アマ6段
64:公認会計士(国立)弁理士(理系国立)
63:公認会計士(私立)電験1種 技術士(上位) 司法書士(国立)、囲碁アマ5段、将棋アマ5段
62:弁理士(私立)税理士(5科目) 弁理士(国立文系)
61:日商簿記1級、司法書士(私立)、囲碁アマ4段、将棋アマ4段
60:英検準1級、漢検1級 ストックフィッシュ系は 軽い局面評価関数である三駒関係を利用した 膨大かつ高速な探索ノード数がウリで、
その探索の長所を活かすために 評価関数を軽くしているところもあるので、
四駒関係が それを上回るとすると、 三駒関係の読みを外して勝っているはずなんだぜ。
読みの広さ、深さが 局面評価の貢献を上回るなら 二駒関係や駒割りのみに戻るはずなんだが、こっちの道も十分ありうる。 tamoreとyaselmo混ぜても強くなんないの >>535
探索の長所を活かすために 評価関数を軽くしているところもあるので ←??? 単純に混ぜただけじゃ強くならない、というか弱くなる tamoreはKPPTの極限まで強くしています、その為、確かにtamoreを混ぜてある特定の評価
関数より強くできますが、その代わり、ほぼ互角だったtamore_G,Kより弱くなったり、yaselmo
との勝率が落ちたり、また、tamore_G,Kを混ぜても、tamoreに弱くなったりと、相性が顕著に
出ます。従って、混ぜても、ある特定の評価関数に強いだけで、レーティングそのものは逆に
下がるようです。ちなみに私は透さんではありません。 tamoreは野生の読み太と混ぜると強くなる(tamore以上に)
野生の読み太は2つほど出てますが
配合具合は試してみて下さい >>541
それも1%単位で試し、確かにtamoreより明らかに強いのが出来ましたが、tamore_G,Kより弱く
なりました。逆にtamore_G,Kにも同じようにした結果、tamoreより弱くなりました。 結局、ブレンドに使った、そのものに強いだけで、素材性質に違うものには弱くなります。 また、yaselmoにはtamore+野生の読み太や、tamor_G.K+野生の読み太より、tamoreが、ずば抜け
て一番強いです。 自分の環境ではyaselmoとtamoreは200局やって互角だったんだがな 従って、tamoreとtamore_G,Kに限っては、混ぜるとレーティングが下がります。 なんだかんだ言って、yaselmoより有意差があるほど強いのがない件。 単なる相性だろう
直対だけで言えばrelmoだってyaselmoと互角だし relmoとyaselmoが互角はない。
5秒6スレ300戦やってyaselmoが勝率65% 相性ってのは互角局面集を使っても出るの?
もし相性があるとしたらどこらへんが原因で出るの? 16コア/ 16T 1手10秒/ hash4096 /no_book /ノード 6000万〜9000万 /投了値 3000
Y04.77T使用 /平手初期局面
自ソフト2 vs tamore
50局 26-3-21 .553
あと2ソフトほどと対戦してみます tamore GKもtamoreもyaselmoも6スレ5秒で対relmoの勝率7割越えなかったから
定跡なしでrelmoとやってみるといい >>553
70%ってことはレート150くらいの差。
流石にrelmoにそこまで勝てない気がする
。手元のR表だと自ソフト2とrelmoの現R差159だけど、
直接対局だけではないので。
良くて対relmoは65%かな(予測)
時間ある時やってみます。 信頼区間をつけないと相性とか7割とか言っても全く信用できない 今月の数学セミナー、コンピュータ将棋・囲碁特集で、
Ponanzaの開発経緯とか数学的背景、千田の記事とか載ってるよ やっぱりそんなに甘くないよな
手軽な遊びだから、一時期夢中になってブリードしまくってたけど、
yaselmoより有意に強くなってるで!って思ったら、
技巧2に全然勝率上がらないとかよくある >>557
特定のソフトとの多対局-対戦成績からのレート計測がほぼ無意味と思ってる。
(開発者の方の強さ測定には必要だろうけど)
勿論それなりに正確なこともあるが
必ず557さんのようなことになる。
信頼区間?単なる趣味にそこまでしないよ
信用しなくてけっこうよ、公開はしないんだから ご自由に発言して。
ここおもしろいね すぐ「信用できない」 (笑) 連続対局回してて7割位勝ってる!と喜んで床について、
朝起きたら100局で五分五分だった、というのが今日もあった・・ 100局でもどっちが強いかわからないし
長時間対局なら更にわからないな >>559
ちゃんと観測していないからだろ;
自己対戦中もOSがバックグラウンドでやるI/O処理やら
推奨振動子のジッタやらでソフトはPC外部からの量子論的干渉を受け続けているんじゃ >>559
1手の秒数に限らず100局はやらないとダメかもですね。
本当に強いソフトに関しては最低100局までやってみようかな。
けど、それ以上はソフトを公開する方ならともかく必要ないかと。
自分のソフト1も2もそこそこ強いのに少なからずバグあるので・・・
こうやって測定して遊ぶ 悪趣味。
やねさんが最強で間違いない。 >>560
>>561
>>562
100局やると大体の誤差は5%前後以内くらいにはなるかなーと
95%信頼区間は前後10%だけど
80%信頼区間は前後5%くらい
5%以上は強くないとあんまり強くなった気がしないし、
100局で五分五分なら強くないと判断できる
5%未満を追い求めるなら別だし、グラフ見てイケそうと思うんなら追試も可能だし >>558
「信用できない」は、お前さんが嘘を言ってるという意味じゃないよ。
ランダムの偏りにあまりに無防備な報告者が多いからね。
ランダムの定義からすると逆説的だが、偏らないことが保証されてるのはランダムではない。
サイコロは6回ごとに必ず6がでたりはしない。 >>558
信用できないはまさに565が言った通りで、嘘をついてるとかじゃなくて
単なる偶然や勘違いとの区別がつかないって意味な あれれ 人間のtopプロがタイトル戦七番(先に4勝)で決着つけて信頼区間の話にはならないよね。
対 tamore 勝っても負けても載せるつもりだったけど、今のところ勝ってしまってるだけ。
なんでソフトだと結果に厳しく言われんのかな?別に公開(今後更に強いのできても)もしないし、
こっちが強いとは一言もいってない。今 tamoreに勝ち越せるソフトってどのくらいあるのかな。 ここに対局結果掲載したのが馬鹿だったんでとりあえずやめます。
対局の結果は偶然や大勘違いでした。 お騒がせしました。 ご自慢のソフト(キメラしただけ)を公開しないって言ってるなら
ここで結果を言っても誰も何も思わないのにw
せめて棋譜でも貼ればいいのに承認欲求の塊で草 まぁ、大人げなかった気もしないでもないな。
さらっと承認欲求を満たしてあげても別に何も困らないからそうしてあげてもよかったなw どうせSDTまでの余興だし。
大っぴらに言わないだけで強豪チームはyaselmoより強くしてるでしょ >>574
じゃあDB2こいよ
俺のi7ボコッてくれよ
ご自慢のソフトでw まぁ、キメラで承認欲求満たしたい人って少なからずいると思うんだよね。
uuuuuunさんあたりがキメラ大会開けばいいんでないかなぁと思ったりはする。 馬鹿が馬鹿を呼んで馬鹿だらけになるので、
ここで馬鹿の承認欲求を満たす必要はない >>577
それは残念ながら否定できないな。
考えを改めよう。 GKに、100戦して8割勝つソフト出来た
公開しないけど 俺の評価関数は勝率1億パーセントだから
おまえ等まだまだだな うかむせに横歩定跡で狩られてたcurryはもういないのか
成長したな またソフトtamoreは羽生に負けてたぞ
49竜を悪手認定したのに
手を進めたら互角後手寄りになりやがった
これってソフトの欠陥なのかね? 「最善手」はその局面の完全解析なんだから議論する意味はない 手を進めて評価が反転するところまで、49竜の局面で読ませたらどうなるの?
まぁ、枝狩りの関係でその深さまで読んだじゃ〜んってとこで評価値反転することはないことはないんだけど。
いっぺん限界まで深く読ませてみればよろし。 5手進めてで10手読みで評価値の反転を検出したら、現局面からだと15手以上読みで評価値の反転が検出できてるか?ってことね。 tamore評価値
https://i.imgur.com/3Org1JP.png
今日の竜王戦の80手目の羽生さんの49竜なんだけど
指されたときは候補の下の方で評価値が一気に800ぐらい下がって
竜王戦スレでも羽生さんの悪手とかファンタの大合唱だったんだが
今改めて40憶ノードぐらい読ませたら49竜が最善手になった
羽生さん凄すぎないか? そんなごくまれなケースを持ち出されてもな
羽生だけじゃなく、探せばそんなのたくさん見つかるだろ
そもそも評価値は絶対じゃないし
人間の感覚よりは大体強いってだけだ
一局指せばほぼコンピュータが勝つだろうが >>592
40億ノードと同等の読みが短時間で出来る人間すげーってならないか? そもそも人間とコンピュータとでは「読み」の意味が少し違うから一概にどっちが優れてるとはいいづらい。
コンピュータはとにかく物量と数学、統計的理論で読むわけだけど、
人間は物量はコンピュータに劣るけど数学、統計的理論よりも優れた方法で効率的に読まなくてもいい局面を判断できるわけだ。
なので時と場合によって優劣が入れ替わるのは特に不思議じゃない。
ただ、コンピュータの物量が圧倒的なのと、最近評価関数の精度がどんどん上がってる、
つまり局面評価自体が人間よりもだいぶ優れてきてるから人間は勝ちにくくなってる。 136手目、なぜ頼れるモは3三銀なんて自爆手を指したのだろう・・・ >>589
これ65桂と49龍の比較できてるのか?
誤差範囲じゃね >>602
まあ65桂でもよかったかも知れない
それに感想戦では65桂も読んでたみたい
重要なのは、ソフトは49竜を非常に低い評価値にしてたこと
65桂は最初から最善に出てたのに対して
49竜に関してはちゃんと読めてなかったこと >>603
他に良い手があるんなら騒ぐほどじゃねえじゃん・・・
何かを上げるために下げる事でしか評価出来ないなら
一生踊らされるぞ ちなみに、今回の49竜みたいに深く読まないと間違う局面を効率よくたくさん(億単位)集める
方法があれば、それをつかってさらにソフトを強くできる可能性があるよ。 >>604
他に手があってもそれを評価できなければ
相手が間違える可能性が高くなるでしょ?
勝負では有利になるはず >>604
49龍だと先手玉にわかりづらい頓死筋が生じる
渡辺は49龍指されて長考を余儀なくさせた
実戦的にも(長時間読ませた)ソフト的にも最善手
>>606
去年の増田新人王の対局も後手玉が即詰みなのに長時間読ませないと先手敗勢だったからそういう局面結構ありそう 自分が読めてないのにソフト最善とかって・・・
65桂が悪手ならまだしも
ならyaselmoやmafuta2なら49龍が最善にすぐなるのか?
なんつうか踊らされてる奴はずかしいな >>589
まだこんなこと言ってる馬鹿がいるのかよw 救えない情弱、低脳。
もう羽生は、飛車落ちでも強豪ソフトに勝てないのにw >>610
なんで短時間読ませた時の最善のほうを重視するの?
長時間読ませた上での最善のほうが優位じゃないか? >>612
重視って・・・
その65桂と49龍の比較ちゃんとしたんか? 一部分だけ切り取って騒ぎ立てるフェイクニュース信じて踊らされてる奴みたいだな >>611
誰もソフトより羽生が優れてるなんて言ってないと思うが、文脈読めてるか?
>>589は長く読ませたソフトと羽生の手が一致して喜んでるただの羽生ファンボーイだろ
>>613
比較っていうのは実戦的にか、ソフトてきにかどっちの意味?
実戦的の意味なら>>608で書いたように渡辺に長考余儀なくさせたことが優れてる
ソフト的の意味なら長時間読ませた結果最善が49龍なんだから、"現時点でのソフト"では最善だろう というか40億ノードも読ませるより、
実際に4九竜指した局面を読ませた方が圧倒的に効率的だよなあ。 >>606
floodgateの頓死局面集や大逆転集を使った定跡で評価関数作ったりしたけどどうもいらない手まで読んで中盤までに差を付けられることが多いからそんなに単純な話じゃない >>606
詰め将棋ではしっこに玉方の桂馬が邪魔してるかどうかで
詰むか詰まないかが分かれるのがある。
そんな詰め将棋はなんぼでも作れる。
それを静的評価関数でもNNパターン認識でも検出するのは無理。
読まなきゃわからない問題は読まなきゃわからない。 >>568
マジレスすると、人間の場合は再現実験で検証できんからな。
真の強さがどうあれ、タイトル戦で勝った方を、結果から強いと認定する。
まあ対局者同士には読み筋の交換等でどっちが強いか感覚でわかる場合が
大部分だろうが。 >>617
どういうやり方でやったかはわからんけど、
そういう局面集が億単位で手に入ったとして、それを使って学習するなら
そうじゃない普通の局面も同じくらい用意してやらないときっと失敗するんじゃないかなぁっていう予想はなんとなく。
過学習しちゃうからね。
>>618
そういう考え方もあるだろうけど、そうじゃないかもしれない。
やってみなきゃわからんから可能性。 >>620
既に三駒関係では情報を収めきれないから微妙な違いを学習する前に上書きされてしまうのでは?
もっとリッチな評価関数じゃないと ■ このスレッドは過去ログ倉庫に格納されています