▲コンピュータ将棋スレッド137
■ このスレッドは過去ログ倉庫に格納されています
先手: 俺氏(24三段) / 後手: QQR
手合割:平手
▲7六歩△3四歩▲2六歩△8四歩▲2五歩△8五歩▲7八金△3二金▲2四歩
△同 歩▲同 飛△8六歩▲同 歩△同 飛▲9六歩△7六飛▲7七角△5二玉
▲5八玉△7四歩▲3四飛△3三角▲8四歩△8二歩▲3八金△4二銀▲2八銀
△7三桂▲3五飛△3四歩▲2五飛△2四歩▲4五飛△7七角成▲同 金
△3三桂▲1五飛△1四歩▲7六金△1五歩▲2一飛△5一金▲2三歩△4九角
▲同 玉△6九飛▲4八玉△7九飛成▲2二歩成△6八龍▲3九玉△6九龍
▲4九角△5八銀▲4八金△4九銀成▲同 金△5八角▲5九銀△4九角成
▲同 玉△5八金▲3八玉△2二金▲同飛成△5九龍▲3九金△4八銀
角2枚ゲットしたところまでは優勢で勝ったと思ったら普通に負けた
後で形勢見たら終始ずっと俺が不利でワロタ 裸玉なら、相手の指し手無視して以下の手順で動かせば良いだけ。
△1六歩△1五歩△1四歩△1三歩成
△1二と△1一と△1八飛
△1六飛△9六歩△8六歩△7六歩△6六歩△5六歩△4六歩△3六歩△2六歩
△1五飛△9五歩△8五歩△7五歩△6五歩△5五歩△4五歩△3五歩△2五歩
△1四飛△9四歩△8四歩△7四歩△6四歩△5四歩△4四歩△3四歩△2四歩
△1二飛成△8三歩成△8二と△4三と△5二竜△3二竜 裸王の最短手詰みを見つけられるくらいにはコンピュータ将棋って進化してんの? >>626
マカーなんです…orz
仮想環境で動かしても行けるかな?
とりあえず、Amazonのほしい物リストに入れておきます。 >>627
横歩だとCOMはミスらないから勝てる気がしないけど、
逆に一発入れるには水平線とか長い詰みがある横歩が有力なのかなぁ? https://www.ai-gakkai.or.jp/jsai2018/jsai-cup_report
JSAI Cup 2018: 2018年度人工知能学会データ解析コンペティション
3位:下山 晃 氏(株式会社日立ソリューションズ・クリエイト)
これってBlunder, Ponanza の下山さんだよね ソフトの後手番の有力定跡はどの戦型であっても千日手率が高い戦型を選ぶべきだと思う。
極論を言えば序盤で千日手になった棋譜を全部ぶっこむのが一番マシになる。 作戦としてはありだな
後手番はなるべく千日手や引き分けを目指すソフトが増えてくるかもね コンピューター将棋は先手ゲーになりつつあるらしいから
千日手に出来れば結果オーライなのかな 選手権の先後の勝率を計算した人はまだいない?
印象だけだと後手の勝率も悪くなかった気がするが
エラーやバグがたくさんあったから修正必要だろうが 角道開けて、3間に飛車振って馬と竜が最短手順のばす 最近のソフトって強化学習によって評価関数が最適化されるようにプログラムされてますか?
それとも探索部と評価関数はそれぞれ独立で、いくら学習しても最初に人が入力したデフォのままなのでしょうか? 事前に50億局面を学習して最適化済みなので
対局によって新たにパラメータが調整される事はありませんよ 評価関数を強化学習するね
探索部と評価関数は独立だけど、探索して教師作るから無関係ではないね >>642
>>643
即答ありがとうございます
理想評価関数に限りなく近い50億局面分の極限評価関数が存在するということですね
その評価関数はインタネット上に公開されてますか?
門外漢なもんで詳しくありません >>635
千日手を成立させるためには、先手が「打開したら千日手の設定評価値を下回る」と
判断しなくちゃいけない。
やねうら王のデフォルト設定のまま千日手=-1にしてくれていたら後手はウマーかもしれないが
先手が千日手絶対拒否の-30000とかに設定してたら、後手番が損しそうだぞ
MaltiPV=1で千日手以外の手を読んでいないのなら、先手番の得を上回るのは大変だ 何に使うの?
理想や極限の定義は知らんが
強いソフトが使いたいならやねうら王+QQR使えばいいよ おそらくR4200くらいの強さであろうソフトがマイナビから発売されるからそれを買うとか 50億局面分の評価関数といっても、表形式で50億局面分あるのではなくて、関数近似されている。
なので、50億局面の中に入ってない局面もある程度ちゃんと評価できる。 KPP(T)で約2億(+手番ボーナス)、これだけの表現力があってもそれを未だに使いこなせてない感あるからな
線型の時代は終わってこれからはNNの時代になっていくのかなやっぱ むしろKPPTに正しい値を付けることができるAIを作ろう プロ公式戦で千日手が成立しやすいのは、手番を変えての指し直しが発生するからで、
かつ、人間にはセンチポーン単位での局面評価はできないから、
「先手番での指し直しが欲しい後手番」と「打開したらどのくらい得か判定できない先手番」の
意思が合致しやすい
他方、電王トーナメントのノックアウトステージを除いて、千日手指し直しのない
コンピュータ将棋のコンペティションでは、千日手の合意が極めて取りにくい
千日手の設定評価値を何点に設定するかにもよるけど、通常は評価値プラスの値に
千日手を設定することはないと思われるので、双方ともに自分が不利と判断している
場合にのみ千日手が生じうる
しかも、人間と違ってセンチポーン単位での評価値を(実際に合っているかは別として)
正確に把握しているので、「よくわかんないから千日手にしよう」ということもない
叡王戦の金井のように「打開すれば優位なのはわかってるけど具体的な手順に自信がない」
ということもない
明らかに自分より強いだろうと思われる相手に後手番引いた時に、千日手の評価値を
自分の+128くらいに設定しておけば、価値のある0.5点を取れる可能性が高まるかも知れないけど
そうでない限り、成立しない千日手を読むのはただの時間の浪費かと 千日手の評価値は対戦相手のみならず対局中にもダイナミックに変化するもので
固定値が無理なのかも uuun氏のレーティング表ではYO4.82/QQRが首位になっているけど、うちの計測では
TNK-NNUE-whale6がYO4.82T/QQRに勝率75%で圧勝なんだが、評価関数より探索の相性が顕著にあるからだろう
残念ながらYO4.82はwhale6に弱すぎる結果になった、TNKでKPPTではないので念のため うちの過去の計測では800万〜1000万と1500万での勝率の差はあまり変わらない結果になっている やねうらおのシェア版が特に特徴ないとするとGUIを買うようなもんか
うーん うちの計測だと一手500~800万くらいでwhale6の勝率40%くらいだった
100局の結果だから99%信頼区間で考えても勝率55%は超えない計算になるんけど1%を引いたのか? >>658
そちらの結果とは逆だけど、結果が結果だからどうしようもない >>659
まあ環境も違うしなんともいえんが
ちなみに何局くらいやった? >>658
TNKじゃなくKPPTだと、それ位の勝率になるはずだが、TNKで間違いないの? >>661
KPPT版(qhwcsc28に対して勝率62%程度の評価関数使用)、NNUE両方試したけどどちらも40%程度だったわ 60局だと上振れしてたとしても勝率60%超えかなんでだろうなあ >>658,662
あり得ない結果
全く別のソフトを対戦しているとしか言えないね
直接確率計算2×2]
観測値1 観測値2
-----------------------------------------
群1 40 60
群2 45 15
-----------------------------------------
両側検定 : p=0.0000 ** (p<.01)
片側検定 : p=0.0000 ** (p<.01) >>665
あり得なくはないけどほぼあり得ないよね、宝くじ当たるようなもんだし
勝率75%ってレート差200近いし何か設定ミスなんじゃないかと思うんだけど ノード数ではなくコア数の違いとか?
LazySMPの働き方に差があるならノード数が同じで結果が大きく変わっても矛盾はしないし 自分もやったけど6スレッド1手2秒200局で勝率はTNK NNUE WHALE6対QQRでwhale6側の勝率40%位だった 確かにLazySMPは確かに多少考慮しないといけないと思うけどそもそもが同ノードじゃないしなあ
あとNNUEって軽くていいってイメージがあるけどPCに結構負荷かからない?
KPPT使ってるときより一割くらい電力もってかれてる気がするし、RAMもCPUも熱くなるような >>646
いやーどんなプログラミングなんだろうって >>648
ああやっぱり
個人的にはソフトの序盤の評価は不正確だと思ってます
いくら学習させても終盤に比べフィードバックがあまりにも少ないんで ソフトのダウンロード場所聞くレベルなのに
学習させても〜とか意味わからんけど具体的な内容教えてよ
学習や評価や探索の内容知りたいならならやねうら王のドキュメントやソース見るのが一番いいよ 商用版やねうら王2018、レガシーな環境に配慮する割に収録エンジン多くてストレージ食いそう
インストーラで最小構成インストールとか用意するのかな KPPTじゃなくてNNUE評価関数だからそこまでファイルサイズ大きくならないんじゃね? chokudai(高橋 直大)認証済みアカウント@chokudai
将棋界で「レーティング」って言葉がちょっと先行し過ぎている気がするんだけど、
実力指標を考える上で、どういうレーティング計算式を適用するべきかって議論の余地があるし、
現状のレーティングサイトが採用しているレーティングが十分優れているかの検証はもうちょっとしたほうが良いと思う。
囲碁のレーティングなんかだと、レーティングサイトがパっとググっただけでも2つ出てきて、
その2つのランキングにそこそこの差があったりする。計算式によってこれだけ変わってくるので、精度最大化みたいな話はもうちょいあっても良いよね。
http://sports.geocities.jp/mamumamu0413/total.html …
https://www.goratings.org/ja/ >>675
MyShogiのREADME.mdによるとTNK,ぽんぽこ(STD5),Qhapaq,読み太,やねうら王(KPP_KKPT)が搭載されるらしい NUEEの学習してみようと思ったらtargetdirとかetaとかlearnの後に来るもろもろのコマンドを受け付けてくれないんだけどなんでだろう
見た感じやねうら王と同じ感じでコマンド打てばいいのかと思ったけどそういうわけじゃないのかな
わかる方いたら教えてください 学習機能を削除したビルドだからじゃないの
Makefileを書き換えてarmのlinux環境で試したがNNUEもかわりなく動いたぞ >>679
普通にただのヒューマンエラーだったわ、ありがとう >>645
>「打開したら千日手の設定評価値を下回る」
この文を定式化するのは難しいんだよね
それと
MaltiPV=1で先手が千日手絶対拒否の-30000とかに設定してたら、後手番が損するのではなく、先手番が千日手筋を失って一方的に負けると思うけど
-29999で千日手筋が存在するのはまず想定できないし読めていないMateが存在してもおかしくない
だから現実的に「千日手以外の手を読んでいない」ということはありえないんじゃないかな、-29999となると後手が千日手にしてくれないからね
先手にとっては負けるよりは千日手になる方がマシなので千日手の設定評価値の最適化も必要なんだよ NNUEのお試し学習してみてるけど全然CPUリソース使い切らないわ、メモリがボトルネックなのかな? 先手後手がそれぞれどういう前提で設定されてるかにもよるしね
@ContemptFromBlackがfalseでContemptが正の値になってるとどちらから見ても悪いと判断して回避しやすい
AContemptFromBlackをtrueにしたらContemptが正の値だと後手が積極的に千日手にするけど先手が回避する
先手から見て悪い
後手から見て良い
この場合Contemptの値が同じだとしても@の場合の方が千日手を回避する圧力は高くAの方が千日手になりやすい
とはいえ現実に即しているように感じるのはAの方である
私見で言えばAのContemptは感覚の2倍ぐらいの値にするとちょうどいい動作になる
初期局面が70点先手有利だと考えるのであれば倍の140ぐらいに設定するとちょうどいい
先手後手の千日手の評価値を個別に設定するようにしてみるのも面白いかもね(改造自体は超簡単なはず) >>684
なんで素直にそのまま70点にしたらダメなの? それだと初期局面での先手後手の評価値差の近似値を出すモデルが必要だから大変だな
70点くらいと人間が決めると限界が来るから正確な数値を出す必要があるわけで 技巧2とQQRで対局したが、技巧が勝ったほとんどが技巧の振り飛車
技巧が振り飛車得意なのか、QQRが振り飛車苦手なのか QQRが振り飛車をやや低く評価しすぎてるところはあるんだろうね QQR自体も振り飛車にするんだが、勝率が良くない
ただ、5秒のような短い時間だと弱いが、30秒だと勝率上がるね
もしかして、振り飛車の教師局面が少ないんかね QQRが振り飛車に弱いと思われる
定跡オンのハニーワッフルに対して殆ど五分五分
かぱっくはハニーワッフルを圧倒してる elmo以降のソフトは振り飛車に対して変な囲いや攻め方するからそれが原因だと思われる
普通に穴熊やればいいのにな
そうすりゃ勝率10割でしょ つまりは九段の方の藤井氏なら、QQR勝てる可能性が…!? なんつーか
もう定跡勝負だなこれ
選択定跡によって全然勝率変わる
いや、究極言うとR4200を超えた今は、定跡なんかいらないのかもしれない 事前にかなり深く探索して定跡を搭載しておくのは結構効果大きいと思うけどな
短い時間の対局では定跡を上回る読みを繰り出すのは至難の業でしょ
ただし定跡におかしな手が搭載されていないことが重要かな >>694
まぁ同じ手順に陥らない為に深く考えさせて複数候補手を定跡で登録するのはありだね
今自分も一手目からQQRやTNKに考えさせて自動登録してる(対戦相手は適当にやってQQRやTNKの指し手のみ棋譜から登録)
まあ今後出るソフトも考え10手〜15手までしか登録してないがね >>694
そう思うよな
だけど定跡オンオフのQQRを1手0.1秒で100局戦わせたら定跡オフが勝ち越したよ
他のソフトでやっても大体定跡オフが勝ち越した
まふ定跡、やねうら定跡で試したけど定跡オフが普通に強かった印象 >>696
その定跡のいずれもあまり良くない変化が登録されているからそこがよくないわな >>697
かぱっくが出したくそこら定跡角換わりverだっけ?
あれで試しても定跡オンが負け越した気がするよ >>698
定跡の末端のほうは結構微妙な手が含まれていて定跡を抜けた時点で有利ではなかったりするからね
まあそれでも100局で有意差がでるほど負け越しているならちょっとびっくりだけど 後手番なら必勝筋が見つからない限り千日手を狙う手が最善になるんだが殆どの人がそのことに気づいてないね
今のソフトはそのアルゴリズムが抜けている >>692
レベルが違う 角落ちでも勝てないのに戦型がどうとかという以前の問題 定跡って言わば事前計算結果だから、きっちり整備すれば
定跡オンが定跡オフより不利になる事は理屈の上ではあり得ないはずなんだけどな
まぁ、きっちり定跡を整備するのが難しいというのはわかる チェスの後を追うことになるのかな、後手番は引き分けをめざす 負け戦だからこそ勝ちに行くのが歌舞伎者だってばっちゃが言ってた >>700
もしそれが真実だとしても、現行の稲庭排除ルールでいちゃもんつけられる可能性があるから作れない。 >>706
序盤旧藤井が指して終盤は新藤井が指すのが最強だぞ >>703
そうなんだろうけど、実際定跡オフだと同じような手順ばっかになるんだよなあ
欲言うと、三間や四間飛車穴熊なんかも見たいもんだが、振り飛車弱すぎるからな >>709
もしかして最初から最後まで新藤井が指したら強いんじゃね? >>710
Rが上がるほど勝率の低い戦型は淘汰されていくもんな
振り飛車はNNUEの表現力に結構期待してるわ、適切な教師から学習すれば振り飛車指しこなしてくれるんじゃないかと 特定の戦型での勝率が見たければ指定局面からやらせればいいわけで >>708
稲庭が禁止されてるのはSDTだけで選手権はOKなはずだし
そもそも稲庭は選手権が切れ負けルールの時に切れ勝ちを狙ったソフトであって引き分けは副産物
てかいまのソフトに稲庭効かないし >>713
その結果戦型が淘汰されていっている
澤田さん曰くゴキ中なんて勝率2割くらいらしい
後手番が選択できる戦型がイマイチわからなくなっていてきている状況 QQRの定跡8手くらいで切ったら技巧2相手に10-0だった
なんだかなあ 少し前まで、後手でもまだ指せるのが横歩で、
角換わりの後手番は全然ダメだったんだから、また変わるんじゃない? 将棋はお互いが最善を尽くせば千日手になる
少なくともどちらか一方が間違えると決着が着く しかしやねうら王のandroid対応エントリーに出ているNexus 6Pのベンチの数値低いな
スペック上から想定される値の半分くらいだ AVX2とかでうまく高速化してるのができないから思ったより低いのかな サーマルスロットリングですがな>Nexus6P
nnueを800MHzに制限したCotex-A53がuuunベンチ条件でメインスレッドが約24K
ARM系はだいたい熱のせいでまともなベンチ結果がでないようだが 結局スマホは限界まで使うと廃熱がどうしようもないか >>503、NPS低すぎない?
公式にあるAperyの30%ほどしか出ない
その分評価関数の精度がいいってこと? >>725
NNUEは低NPSで強いことに定評がある
高NPS代表のaperyとNNUEを比べてどうするんだ ■ このスレッドは過去ログ倉庫に格納されています