▲コンピュータ将棋スレッド137
■ このスレッドは過去ログ倉庫に格納されています
>>566
将棋ソフトに少しでも興味が有れば、WCSCやuuunuuunさんのサイトにアクセスして「現在の最強ソフト」を調べるはずです。
興味が無ければ「知らない」と答えるはず。
あなたの「世間」とはあなたの脳内箱庭に過ぎません。 >>596
こんばんは
来年中には盤面認識機能があるスマホアプリが登場する可能性が高いと考えています
需要がなければ開発されないので微妙なところですが 初歩的な質問で申し訳ないんだけど
将棋GUIとぐじらってのは入れて動くんだけどやねうら王ってやつを入れても初期化エラーが出て動かないんだけどなんか設定しなきゃいけないものとかあるの? >>579
レートが無限大まで行ったら裸玉でもソフトが勝つ
は命題としては正しいぞ
神様のレートは有限なので 勝敗が正規分布するという仮定が成り立っていないと思われる。 >>593
uuunuuun @uuunuuun1
今の所QQR(飛車落上手) 9-49 技巧2(下手) 上手勝率15% 一応100局くらいやらせる予定。
-----------------------------
レート差にするとおよそ300(だけど1つ勝つだけで勝率が大きく変わるのでまだなんとも)
ただそれでも推定レート3500±だからなあ、yaselmoから280アップしてる
いくらなんでも急に強くなりすぎてるので、技巧2が駒落ち下手で弱い説を推奨 将棋ソフトにおいては駒落ちとレート差正しくないだろ
ほぼ全てのソフトは教師局面を平手で学習させてんだろうし GCEある程度使ったら無料クレジット残ってても割り当て増加の申請通るね
n1-highcpu-96
Y4.82 QQR
bench 4096 96 19
37083010,38099567,40147234,37763888,38282997,35837319,37742756,36516032,35978130,37860989
bench 128
559124,755735,751427,737757
このスレの詰将棋もどきは大体一瞬で終わる 時間かかっても1分ぐらい 【富士通】”量子コンピューターに匹敵” 新型国産コンピューター実用化へ
https://asahi.5ch.net/test/read.cgi/newsplus/1526951991/
組み合わせ最適化問題に特化と書いてあるが、こういうの使ったら
DL使わんともめっちゃ強いAIが作れるんじゃね? >>606
AWSのm5.24xlargeとは1コアあたりの処理能力が7割ぐらいでちょいと遅いね
n1-ultramem-160(vCPU x 160、メモリ 3,844 GB)
だとnps一緒ぐらいになる
むしろメモリ3.8Tあることにびっくりするが 3.8Tあっても使い方わからんな、半分以上RAMディスクにしそう hefeweizen600台クラスタと二枚落ちで互角なら奨励会初段以上はある? NNUEの学習に使う検証データって出来ることなら多い方がいいけど学習にかかる時間とトレードオフって感じ? ソフト信者は、神様なら裸玉でも人間に勝てるという主張か。将棋は奥深いなあ 駒落ちになると、例えどんなに強い存在であっても、
一定以上のRには達することができないであろう。
その限界値は、昔の想定よりは遥かに高いが、限界があることには変わりない。 >>615
松村になら、羽生さん以外でも裸玉で勝ちそうだけどな。
(レーティングにして、どこまでなら裸玉で負けるのかな。) >>616
例えば飛車を後押しに歩を全てと金にして、スクラム組んで一歩ずつ進んで行けば自然に詰むな
狭義の完全解析とは程遠いが >>616
最短手数は解析するの大変だろうけど、必勝手順なら簡単だから考えてみ 定跡だけ搭載して、探索も評価もせずにQQRにかてるプログラムは簡単に書ける? 藤波辰爾対タナトラ先生の裸玉対決を最近テレビでやったらしい。
もちろん、タナトラ先生の勝ち。
初心者の自分は、指導対局してくれるソフトが欲しい。
(現時点ではぴよ将棋のヒント機能でも十分だけど) >>625
激指の指導対局やレーティング対局オススメ 先手: 俺氏(24三段) / 後手: QQR
手合割:平手
▲7六歩△3四歩▲2六歩△8四歩▲2五歩△8五歩▲7八金△3二金▲2四歩
△同 歩▲同 飛△8六歩▲同 歩△同 飛▲9六歩△7六飛▲7七角△5二玉
▲5八玉△7四歩▲3四飛△3三角▲8四歩△8二歩▲3八金△4二銀▲2八銀
△7三桂▲3五飛△3四歩▲2五飛△2四歩▲4五飛△7七角成▲同 金
△3三桂▲1五飛△1四歩▲7六金△1五歩▲2一飛△5一金▲2三歩△4九角
▲同 玉△6九飛▲4八玉△7九飛成▲2二歩成△6八龍▲3九玉△6九龍
▲4九角△5八銀▲4八金△4九銀成▲同 金△5八角▲5九銀△4九角成
▲同 玉△5八金▲3八玉△2二金▲同飛成△5九龍▲3九金△4八銀
角2枚ゲットしたところまでは優勢で勝ったと思ったら普通に負けた
後で形勢見たら終始ずっと俺が不利でワロタ 裸玉なら、相手の指し手無視して以下の手順で動かせば良いだけ。
△1六歩△1五歩△1四歩△1三歩成
△1二と△1一と△1八飛
△1六飛△9六歩△8六歩△7六歩△6六歩△5六歩△4六歩△3六歩△2六歩
△1五飛△9五歩△8五歩△7五歩△6五歩△5五歩△4五歩△3五歩△2五歩
△1四飛△9四歩△8四歩△7四歩△6四歩△5四歩△4四歩△3四歩△2四歩
△1二飛成△8三歩成△8二と△4三と△5二竜△3二竜 裸王の最短手詰みを見つけられるくらいにはコンピュータ将棋って進化してんの? >>626
マカーなんです…orz
仮想環境で動かしても行けるかな?
とりあえず、Amazonのほしい物リストに入れておきます。 >>627
横歩だとCOMはミスらないから勝てる気がしないけど、
逆に一発入れるには水平線とか長い詰みがある横歩が有力なのかなぁ? https://www.ai-gakkai.or.jp/jsai2018/jsai-cup_report
JSAI Cup 2018: 2018年度人工知能学会データ解析コンペティション
3位:下山 晃 氏(株式会社日立ソリューションズ・クリエイト)
これってBlunder, Ponanza の下山さんだよね ソフトの後手番の有力定跡はどの戦型であっても千日手率が高い戦型を選ぶべきだと思う。
極論を言えば序盤で千日手になった棋譜を全部ぶっこむのが一番マシになる。 作戦としてはありだな
後手番はなるべく千日手や引き分けを目指すソフトが増えてくるかもね コンピューター将棋は先手ゲーになりつつあるらしいから
千日手に出来れば結果オーライなのかな 選手権の先後の勝率を計算した人はまだいない?
印象だけだと後手の勝率も悪くなかった気がするが
エラーやバグがたくさんあったから修正必要だろうが 角道開けて、3間に飛車振って馬と竜が最短手順のばす 最近のソフトって強化学習によって評価関数が最適化されるようにプログラムされてますか?
それとも探索部と評価関数はそれぞれ独立で、いくら学習しても最初に人が入力したデフォのままなのでしょうか? 事前に50億局面を学習して最適化済みなので
対局によって新たにパラメータが調整される事はありませんよ 評価関数を強化学習するね
探索部と評価関数は独立だけど、探索して教師作るから無関係ではないね >>642
>>643
即答ありがとうございます
理想評価関数に限りなく近い50億局面分の極限評価関数が存在するということですね
その評価関数はインタネット上に公開されてますか?
門外漢なもんで詳しくありません >>635
千日手を成立させるためには、先手が「打開したら千日手の設定評価値を下回る」と
判断しなくちゃいけない。
やねうら王のデフォルト設定のまま千日手=-1にしてくれていたら後手はウマーかもしれないが
先手が千日手絶対拒否の-30000とかに設定してたら、後手番が損しそうだぞ
MaltiPV=1で千日手以外の手を読んでいないのなら、先手番の得を上回るのは大変だ 何に使うの?
理想や極限の定義は知らんが
強いソフトが使いたいならやねうら王+QQR使えばいいよ おそらくR4200くらいの強さであろうソフトがマイナビから発売されるからそれを買うとか 50億局面分の評価関数といっても、表形式で50億局面分あるのではなくて、関数近似されている。
なので、50億局面の中に入ってない局面もある程度ちゃんと評価できる。 KPP(T)で約2億(+手番ボーナス)、これだけの表現力があってもそれを未だに使いこなせてない感あるからな
線型の時代は終わってこれからはNNの時代になっていくのかなやっぱ むしろKPPTに正しい値を付けることができるAIを作ろう プロ公式戦で千日手が成立しやすいのは、手番を変えての指し直しが発生するからで、
かつ、人間にはセンチポーン単位での局面評価はできないから、
「先手番での指し直しが欲しい後手番」と「打開したらどのくらい得か判定できない先手番」の
意思が合致しやすい
他方、電王トーナメントのノックアウトステージを除いて、千日手指し直しのない
コンピュータ将棋のコンペティションでは、千日手の合意が極めて取りにくい
千日手の設定評価値を何点に設定するかにもよるけど、通常は評価値プラスの値に
千日手を設定することはないと思われるので、双方ともに自分が不利と判断している
場合にのみ千日手が生じうる
しかも、人間と違ってセンチポーン単位での評価値を(実際に合っているかは別として)
正確に把握しているので、「よくわかんないから千日手にしよう」ということもない
叡王戦の金井のように「打開すれば優位なのはわかってるけど具体的な手順に自信がない」
ということもない
明らかに自分より強いだろうと思われる相手に後手番引いた時に、千日手の評価値を
自分の+128くらいに設定しておけば、価値のある0.5点を取れる可能性が高まるかも知れないけど
そうでない限り、成立しない千日手を読むのはただの時間の浪費かと 千日手の評価値は対戦相手のみならず対局中にもダイナミックに変化するもので
固定値が無理なのかも uuun氏のレーティング表ではYO4.82/QQRが首位になっているけど、うちの計測では
TNK-NNUE-whale6がYO4.82T/QQRに勝率75%で圧勝なんだが、評価関数より探索の相性が顕著にあるからだろう
残念ながらYO4.82はwhale6に弱すぎる結果になった、TNKでKPPTではないので念のため うちの過去の計測では800万〜1000万と1500万での勝率の差はあまり変わらない結果になっている やねうらおのシェア版が特に特徴ないとするとGUIを買うようなもんか
うーん うちの計測だと一手500~800万くらいでwhale6の勝率40%くらいだった
100局の結果だから99%信頼区間で考えても勝率55%は超えない計算になるんけど1%を引いたのか? >>658
そちらの結果とは逆だけど、結果が結果だからどうしようもない >>659
まあ環境も違うしなんともいえんが
ちなみに何局くらいやった? >>658
TNKじゃなくKPPTだと、それ位の勝率になるはずだが、TNKで間違いないの? >>661
KPPT版(qhwcsc28に対して勝率62%程度の評価関数使用)、NNUE両方試したけどどちらも40%程度だったわ 60局だと上振れしてたとしても勝率60%超えかなんでだろうなあ >>658,662
あり得ない結果
全く別のソフトを対戦しているとしか言えないね
直接確率計算2×2]
観測値1 観測値2
-----------------------------------------
群1 40 60
群2 45 15
-----------------------------------------
両側検定 : p=0.0000 ** (p<.01)
片側検定 : p=0.0000 ** (p<.01) >>665
あり得なくはないけどほぼあり得ないよね、宝くじ当たるようなもんだし
勝率75%ってレート差200近いし何か設定ミスなんじゃないかと思うんだけど ノード数ではなくコア数の違いとか?
LazySMPの働き方に差があるならノード数が同じで結果が大きく変わっても矛盾はしないし 自分もやったけど6スレッド1手2秒200局で勝率はTNK NNUE WHALE6対QQRでwhale6側の勝率40%位だった 確かにLazySMPは確かに多少考慮しないといけないと思うけどそもそもが同ノードじゃないしなあ
あとNNUEって軽くていいってイメージがあるけどPCに結構負荷かからない?
KPPT使ってるときより一割くらい電力もってかれてる気がするし、RAMもCPUも熱くなるような >>646
いやーどんなプログラミングなんだろうって >>648
ああやっぱり
個人的にはソフトの序盤の評価は不正確だと思ってます
いくら学習させても終盤に比べフィードバックがあまりにも少ないんで ソフトのダウンロード場所聞くレベルなのに
学習させても〜とか意味わからんけど具体的な内容教えてよ
学習や評価や探索の内容知りたいならならやねうら王のドキュメントやソース見るのが一番いいよ 商用版やねうら王2018、レガシーな環境に配慮する割に収録エンジン多くてストレージ食いそう
インストーラで最小構成インストールとか用意するのかな KPPTじゃなくてNNUE評価関数だからそこまでファイルサイズ大きくならないんじゃね? chokudai(高橋 直大)認証済みアカウント@chokudai
将棋界で「レーティング」って言葉がちょっと先行し過ぎている気がするんだけど、
実力指標を考える上で、どういうレーティング計算式を適用するべきかって議論の余地があるし、
現状のレーティングサイトが採用しているレーティングが十分優れているかの検証はもうちょっとしたほうが良いと思う。
囲碁のレーティングなんかだと、レーティングサイトがパっとググっただけでも2つ出てきて、
その2つのランキングにそこそこの差があったりする。計算式によってこれだけ変わってくるので、精度最大化みたいな話はもうちょいあっても良いよね。
http://sports.geocities.jp/mamumamu0413/total.html …
https://www.goratings.org/ja/ >>675
MyShogiのREADME.mdによるとTNK,ぽんぽこ(STD5),Qhapaq,読み太,やねうら王(KPP_KKPT)が搭載されるらしい NUEEの学習してみようと思ったらtargetdirとかetaとかlearnの後に来るもろもろのコマンドを受け付けてくれないんだけどなんでだろう
見た感じやねうら王と同じ感じでコマンド打てばいいのかと思ったけどそういうわけじゃないのかな
わかる方いたら教えてください 学習機能を削除したビルドだからじゃないの
Makefileを書き換えてarmのlinux環境で試したがNNUEもかわりなく動いたぞ >>679
普通にただのヒューマンエラーだったわ、ありがとう >>645
>「打開したら千日手の設定評価値を下回る」
この文を定式化するのは難しいんだよね
それと
MaltiPV=1で先手が千日手絶対拒否の-30000とかに設定してたら、後手番が損するのではなく、先手番が千日手筋を失って一方的に負けると思うけど
-29999で千日手筋が存在するのはまず想定できないし読めていないMateが存在してもおかしくない
だから現実的に「千日手以外の手を読んでいない」ということはありえないんじゃないかな、-29999となると後手が千日手にしてくれないからね
先手にとっては負けるよりは千日手になる方がマシなので千日手の設定評価値の最適化も必要なんだよ NNUEのお試し学習してみてるけど全然CPUリソース使い切らないわ、メモリがボトルネックなのかな? 先手後手がそれぞれどういう前提で設定されてるかにもよるしね
@ContemptFromBlackがfalseでContemptが正の値になってるとどちらから見ても悪いと判断して回避しやすい
AContemptFromBlackをtrueにしたらContemptが正の値だと後手が積極的に千日手にするけど先手が回避する
先手から見て悪い
後手から見て良い
この場合Contemptの値が同じだとしても@の場合の方が千日手を回避する圧力は高くAの方が千日手になりやすい
とはいえ現実に即しているように感じるのはAの方である
私見で言えばAのContemptは感覚の2倍ぐらいの値にするとちょうどいい動作になる
初期局面が70点先手有利だと考えるのであれば倍の140ぐらいに設定するとちょうどいい
先手後手の千日手の評価値を個別に設定するようにしてみるのも面白いかもね(改造自体は超簡単なはず) >>684
なんで素直にそのまま70点にしたらダメなの? それだと初期局面での先手後手の評価値差の近似値を出すモデルが必要だから大変だな
70点くらいと人間が決めると限界が来るから正確な数値を出す必要があるわけで 技巧2とQQRで対局したが、技巧が勝ったほとんどが技巧の振り飛車
技巧が振り飛車得意なのか、QQRが振り飛車苦手なのか QQRが振り飛車をやや低く評価しすぎてるところはあるんだろうね QQR自体も振り飛車にするんだが、勝率が良くない
ただ、5秒のような短い時間だと弱いが、30秒だと勝率上がるね
もしかして、振り飛車の教師局面が少ないんかね QQRが振り飛車に弱いと思われる
定跡オンのハニーワッフルに対して殆ど五分五分
かぱっくはハニーワッフルを圧倒してる elmo以降のソフトは振り飛車に対して変な囲いや攻め方するからそれが原因だと思われる
普通に穴熊やればいいのにな
そうすりゃ勝率10割でしょ つまりは九段の方の藤井氏なら、QQR勝てる可能性が…!? なんつーか
もう定跡勝負だなこれ
選択定跡によって全然勝率変わる
いや、究極言うとR4200を超えた今は、定跡なんかいらないのかもしれない 事前にかなり深く探索して定跡を搭載しておくのは結構効果大きいと思うけどな
短い時間の対局では定跡を上回る読みを繰り出すのは至難の業でしょ
ただし定跡におかしな手が搭載されていないことが重要かな >>694
まぁ同じ手順に陥らない為に深く考えさせて複数候補手を定跡で登録するのはありだね
今自分も一手目からQQRやTNKに考えさせて自動登録してる(対戦相手は適当にやってQQRやTNKの指し手のみ棋譜から登録)
まあ今後出るソフトも考え10手〜15手までしか登録してないがね >>694
そう思うよな
だけど定跡オンオフのQQRを1手0.1秒で100局戦わせたら定跡オフが勝ち越したよ
他のソフトでやっても大体定跡オフが勝ち越した
まふ定跡、やねうら定跡で試したけど定跡オフが普通に強かった印象 ■ このスレッドは過去ログ倉庫に格納されています