コンピュータ将棋スレッド 148
レス数が1000を超えています。これ以上書き込みはできません。
使いたいのは実際に登場しやすい局面に強いソフトだからなー
100手目以降の互角局面とかから対局開始して強くてもあんまりピンとこない 1つの測り方として互角局面じゃない僅かな差の状況で先後入れ替えて局数重ねてくのじゃだめなの?
よくわかんないけど その僅かな差ってのはどうやって測るのか?って話なんだよ、いきつくところは
僅かな差ってやつが確かに測れるならちゃんとした互角局面が作れるってことになるんだな >>920
そんなんでもいいと思うよ
第三者が作った互角局面集とかを信奉するのが危険なだけで
仮に探索して+300ぐらいの差があるとしても、そこから指し進めると実は後手が勝ちやすい、
なんて局面はざらにあるはず。もちろん先手がそのまま勝つケースも多いと思うけど >>921
そんな厳密にやらなくても形勢決まってたり、逆転起こらないもの以外だったら先手後手入れ替えて数重ねて対局していけば調べられるじゃんてことだと
正確に互角である必要がない 測定するのに「信奉」などという要素がはいっていたらお話にならんだろう
ある競技者にとっての課題局面の集合が他の競技者に適切かどうか
ましてや人間の対局の検討用に向いている保証などどこにもない >>923
厳密でなくていいならわざわざ今互角局面と呼ばれているものをはずしてやらなくてもいいんじゃないか?
それこそ今互角局面と呼ばれているものでの対局で事足りると思うんだけど 互角局面集の利点は多少変な局面が入っていても問題ないっていうロバスト性にあると思う 互角局面集の使用、開発者からは誰からも反対の声がないのは計測の妥当さを物語っているな
反対してるのは仮説検定の考えすら理解できないこのスレの知恵遅れだけだからな 振り飛車をあまり学習させていないソフトは定跡なしでは強くても振り飛車がある程度入っている
互角局面では勝率が低いことが多い、互角局面は偏った戦型のソフトの弱点がある程度
分かるので検討用ソフトの計測に適している >>925
だから互角か互角じゃなくてもレート計測する手段の1個になりうるよねみたいなニュアンスじゃないの
"互角"はなんかいろいろややこしそうだしさ ぶっちゃけ、「現状のどんなソフトでもその局面からの確定勝敗がわからない」局面であればなんでもいいんだけどね
そういう局面が十分な数あってなおかつ先後入れ替えるっていう条件なら2つのソフトの強さの差はだいたい測れるはず 同一局面で先後入れ替えるのは戦型のバリエーションが
減るだけでその戦型の得意な側が二勝しやすくなる
負の効果しかない
前スレ嫁 十分な数ってのがポイントだよ
先後入れ替えでバリエーションが減って困るなら数を増やせばいいのさ 結局その難癖つける奴は複数方式の利害得失を勘案出来ずに一つのデメリットを只々叫ぶだけの無理解君だったという話だったな >>932
>なおかつ先後入れ替えるっていう条件なら
1.これって連続対局で同一局面ではなく1局ごとにただ先後入れ替えるだけっていうこと?
つまり定跡なしでの連続対局と同じ要領のこと
2.あるいは同一局面を1回やったら先後入れ替えてもう1回やるってことかな?つまりAの局面をaのソフトが先手
bのソフトも先手で合計2局のこと
>>933の人は2.の方だと思っているんじゃないかなあ 互角局面の計測は1.でやるとランダムな互角局面を先後入れ替えることで300局もやれば公平に
バラけるのでいいと思うがさすがに2.は良くないと思う
1.これって連続対局で同一局面ではなく1局ごとにただ先後入れ替えるだけっていうこと?
つまり定跡なしでの連続対局と同じ要領のこと
2.あるいは同一局面を1回やったら先後入れ替えてもう1回やるってことかな?つまりAの局面をaのソフトが先手
bのソフトも先手で合計2局のこと 俺が言ってるのは当然2.の意味だよ
1.の意味で言ってる奴はなんなの?毎回片側のソフトに先手だけ持たせるってことだよな?頭おかしい わかりにくい書き方してすまない
2.の方法は無駄だし負の効果しかないというのが俺の主張
1.の方法で互角局面を使うというなら、それは問題ない >>938
頭おかしいのは君だろ、1.は一局ごとに先後が入れ替わるんだが誰も片方が先手だけとか一言も書いてないだろう
1.の意味は300局連続対局で1局目のAの局面をaが先手、次は2局目のBの局面をbが先手、
続いて3局目のCの局面をaが先手、続いて4局目のDの局面をbが先手ってことだぞ >>939
馬鹿な!
互角局面集の各局面の
真の互角性は不可知なのだから、
2で先後入れ替えるしかないじゃん。
やねさんもそうしてるって前かいてなかったっけ? 片方が先手だけというような頭のおかしい設定で対局させるはずもなく、1.の意味でなら「先後入れ替えて」とあえて書くまでもない、そんな奴いねーわ、という話をしている(この点、俺の書き方が悪く、わかりにくくなった、すまない)
しかし前スレでも2.の意味で使ってる奴がかなりいたんだ
前スレ見てくれ ほれ見ろ
また2.の方法が好ましいと思っている奴が現れた
何度この話題蒸し返すんだよ
やねさんあたり、記事にまとめてくれねぇかな >>941
やねさんはそんなことはいってないはず、あればソースを見せてよ
互角局面っていうのは普通定跡なしの時と同じ要領で連続対局でみんなやっているはず
いちいち同一局面を先後入れ替えて2回やる人はあまりいないだろう 互角局面集と呼ばれているものの中に明らかに互角ではない局面がある程度含まれていた場合
2つのソフトのどちらが強いかを検定するのに、同一局面を先後いれかえて対局したほうが
計測にかかる対局数はランダムに比べて結果的には少なくて済む。
でも現状はそんなことを自動でやってくれるソフトはないし、
そんなに偏った局面もないだろうってことで、ランダム対局で計測してるにすぎない。
また実際の対局で現れないような局面で測定しても意味がないという考えも一理あるが
C-bookを使った場合、より互角ではない局面が多く含まれている思われるので
強さを比較するのにより多くの対局が必要となるし、
レート差まで計測するとなると互角ではない局面の割合によりレート差が小さく出てしまうので
ま、互角局面集で強そうな評価関数はillqha3と
深い探索では強そうなyaneuraOuの組み合わせが
検討には良さげだねってくらいな話で
もっといい局面集や計測方法をがあるのなら
それを作って欲しいものだなとは思う >>923
レート差50を検出するための互換局面なのにか 1万種類ぐらいのエンジンを用意して、同じもの同士を先後で当てたときの勝率が5割なら互換局面だと言って良いと思う 訂正orz;
誤:互換 → 正:互角
>>932の主張のは互角局面の批判としては極めて外している
将棋が零和ゲームである以上、エンジンAが先手のとき勝率x%なら
先後のみ入れ替えた場合勝率(100-x)%になるのが普通の振る舞いであるはずで、
にもかかわらずAが先手でも後手でも圧勝したならAが他方より明らかに強いのであって、
互角局面を使うまでもない状況について>>932は一生懸命述べているのである
(そういうのは普通のランダム選局で強弱判定がつく 互換局面の考え方に問題があるとするなら、先後入れ替えていずれも勝率5割だったとする、
これを前提とする議論でなければならない
エンジンA、Bを先後入れ替えていずれも勝率5割だったということは、いかなる意味を持つのか?
これは実は罠があって、エンジンA、Bが戦形を認識した上で勝率5割になったのか、AもBも全然戦形を認識できなかった
(安易に千日手を選んだ)から勝率5割になったのかは不可知である・・・(1)
これは将棋の神様を連れてくるか、エンジンのN数を増やすしかない
しかし開発者のツールとしては(1)の特性があっても別段困らない。なぜなら、開発者がレート差50を計測したいという動機は、
エンジンAを改善したつもりであるエンジンA'が本当に強くなったのか確認を取りたいということなので、
AとA'の相対評価が感度よく成立すれば十分なんである
(ただもちろん互角局面で強くなったからといって、実戦で強くなった保証にならないのはもちろんである 互角局面では強いけど、実戦では負けるのは
ゴミ局面に最適化されたゴミの塊 >>949
GMA0BN君、自分のブログに書いてなよ
君に文章は的外れな上に読みにくくて敵わん 互角局面は互角に近そうな局面のことで互角な局面のことではないと何度言えば しかしアホばっかりだなw将棋は初手から指すゲームであって、互角局面から始めるゲームではないw
互角局面から強くたって無意味。よって最強ソフトを作るのが目的なら互角局面は使う必要ない。 >>957
まさか自分がアホじゃないと思ってる!? >>957
互角局面だったり指定局面からの成績で特徴長所短所わかるし作るうえでも無意味じゃないんだよなぁ shogiguiに連続対戦(定跡や互角局面)時に先後入れ替え機能つけてもらえないの? >>949
わかってくれる人がいてよかったよ。
その通りだし、俺は別に互角局面を否定してない
開発者にとっては互角局面が互角でなくてもそれほど困らない、ということが言いたかっただけ 互角局面使用は実戦で強くなってこそ意味がある
互角局面でしか強くないのはtrain lossだけ下がったゴミのようなもの ようやくやねうら王12段に2枚落ちで勝った。
それにしても今のソフトは強すぎ。
あと10年もしたらプロでも2枚落ちで負けるんじゃないか。 まあ、ちょい悪局面集なんてのもあっていいかもね。
・局面複雑化する手
・相手の玉を露出させる手
を重視するとか。 開発者が互角局面集を使うのはバラけた局面が欲しいからであって
互角の局面を使いたいからではないぞ
Qhapaqなんて局面集の途中の局面(互角でも何でもない)を使っているし >現時点で「100テラショック定跡」なるものは41702局面分あります。
>そのうち我々が対戦用に用いている定跡局面と重複しているものは9998局面しかありませんでした。
>ちなみに私の定跡で管理している局面数は582724局面です。
https://bleu48.hatenablog.com/entry/2019/04/17/163546 >>917
プロを権威にするなよw
アマはいまだに原始棒銀をやっていてそれで勝っている者もいる、
ってくらいの意見だな
レート差がどれだけあると思ってるんだか >>957
互角局面は検討用ソフトを決めるためにも必要だろう
定跡なしで強いだけではオールラウンダーであるか全く分からないし検討用ソフトはオールラウンダー型で
最も強いのが最適だろう、序盤で角換わりや横歩取りだけ勝率稼いで強くても他の戦型で弱ければ検討用ソフト
には適していない、人間の棋譜検討では振り飛車も普通に出てくるので振り飛車の勝率が低いソフトは対局用
に使えばいい 定跡なしで強いソフトは対局用に、互角局面で強いソフトは検討用で使えばいいだけ
互角局面で強いソフトは多様な戦型の局面をより正確に評価するのが優れているので検討用に向いている テラbookの評価値を学習部にぶち込むとどうなるんだ?
とりあえずインターフェースが無いのはわかるけど 今回? 勝ち越し?
WCSC29でKPPT採用のチームがNNUE採用チームより順位が上の結果になるかもと言いたい? >>977
kpptはすでに終了していると思うが…
nnue相手に定跡でごまかせるかどうかが
見どころ >>979
apery,palあたりは期待できそう NNUEの時代と言われてる中KPPTを投入してくるわけだしそれなりに勝算があるんじゃない?
実は選手権レベルの高ノード対局になるとKPPTも強いとか(検証困難なのでそうあって欲しくはないが) むしろたぬきがあれだけ結果残したんだからNNUEはノード数多い方が得意な可能性すらある 前にNNUEka7-dolphin1とelmo-Y4.79をたややんさんが一手260億ノードくらいで対局させて終局が
288手くらいかかったのを見るとKPPT+やねうら王エンジンはWCSCのような高ノードでは相当強いはず
1500万ノード計測のNNUEとKPPTのレート差はWCSCでは大分差が縮まる可能性はある dolphinはご家庭PC用の探索パラメーターだからなんとも >一手260億ノードくらいで対局させて
いつの間にそんなものが @Remi_Coulom
I optimized my code a bit, and Crazy Shogi can now keep four #V100 hot and busy! They generated 250k self-play games today.
だそうだが、AlphaZeroの再現は間に合わなさそうだな。256×40というのがちょっと気になるが >>985
まだNNUEkai7がレートトップにいた時期でたややんさんがアルファゼロと比較するために
大分前に一局だけ計測されてツイートしていたのを思い出してレスした >>961
>開発者にとっては互角局面が互角でなくてもそれほど困らない
その理解はイミフすぐる…
エンジンAを改善したつもりであるエンジンA'がレート50でも強くなったのか確認するには(←>>950の話題
とうぜんエンジンの優劣以外の原因でレート差50を上回るような勝率差がもたらされては計測にならないから
開発者にとっては改善の検証用局面が互角局面であることは死活的に重要
漏れが書いたことのリトマス紙としては藻前よりも>>952の方が有能かもしれん… >>987
>>977の日本語がガバガバすぎたから主語とか足して確認しただけかと
自分の予想ではPALは強いと思うがな >>989
たとえば横歩取り局面では先手の勝率が高いが、そのなかでも青野流の勝率がとりわけ高い。
→青野流を横歩取りの答として見出しているソフトはより先手勝率が高くなる。
→実際に青野流が横歩取りの最善の答えであればそのソフトは優れている
というのを考えてみたけど、実際には本当に最善の答かどうかなんてほぼわかりようがないし、かえって過学習を招いて本来の目的とは逆の結果になってしまうかなと思った 誰とは言わんが、エアリプで嫌味を言ってる時点で頭にブーメランが刺さっていることに気付かないのかどうかw >>989
多少優劣はあってもアタリを引くかハズレを引くかがランダムなら期待値としては五分だよ
そして多数回やればその誤差は小さくなるので検定も可能かと >>995
最初からそれでは検証結果が出るまでに多くの対局数を要し効率が悪いからというのが互角局面が使われる理由
実戦に近い条件での検証は、互角局面での検証をパスしてからでも遅くは無い 効率が悪いといっても真の評価値が400を超える局面が1割含まれている程度ではほぼ影響がないんだな
評価値600超えの局面が3割とかでようやく効率が問題になる感覚だよ ま、ミュートにしてるからTLに流れてこないんだけどw このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 24日 20時間 9分 49秒 レス数が1000を超えています。これ以上書き込みはできません。