▲コンピュータ将棋スレッド136
■ このスレッドは過去ログ倉庫に格納されています
このBest human playが正しいなら、
本当にチェスよりも将棋の方がソフトとプロの実力差は大きそうだね。 有力ソフトでまだ公開されそうなのって、河童とelmoくらい? ゲームとして難解なほどコンピューターと差が広がるのが早い チェスは引き分けを0.5勝換算でレーティング出してるからというだけの話
1発は入らないけど0.5発は入るというゲーム性の問題 qzilla9とaperypaqのブレンド作ってみたけど、qzilla9とほとんど勝率変わらなかったから
ブレンドで勝率上げるのは打ち止めっぽいしなー >>730
色々工夫したら200局やってみて勝率59%のやつ出来たよ
かなり強そうだから澤田さんのやつとかちょっと様子見て公開するかも 河童搾りした評価関数てキメラしても伸びない性質なかった? 書き忘れたけど>>731はqzilla9に対して勝率59%ね やねチルの人は全員作成ソフトのソース&バイナリを公開して欲しい >>733
自分もqzilla9に対して勝率60%程度のが出来て、大体の評価関数に強いけど、
wakame1stには思ったほど勝率が上がらないので、wakame1stとやってみたら 詳しい方、お願いします。
現在特に強いとされ、検討でよく用いられている以下4つの評価関数について、それぞれの長所を教えてください。
・qzilla9
・aperypaq
・初代wakame
・T.N.K あー、横歩に強いとか、相掛かりになりやすいとか、そこまで踏み込んだ感想ならぜひ知りたいな 将棋所で分岐入ってからもとに戻るにはどうすればいいでしょうか?
開発者側の人がほとんどのスレで申し訳ない NNUEの2018-otafuku-param.hのパラメータを
全てGodWhaleの数値にした結果
NNUE-v1.0 64AVX2 TOURNAMENT (based on YaneuraOu 2018 Otafuku 4.82)
勝ち11(20%) 先手勝ち7(25%) 後手勝ち4(14%)
NNUE-whale
勝ち44(80%) 先手勝ち23(85%) 後手勝ち21(75%)
GodwhaleChild-5.0.5 KPPT 4.80 64AVX2 TOURNAMENT
勝ち44(45%) 先手勝ち28(58%) 後手勝ち16(33%)
NNUE-whale
勝ち52(54%) 先手勝ち32(66%) 後手勝ち20(41%)
設定ミスかと思って一端止めて再確認したわ
俺の低スぺ&パソコン壊せない環境では短時間の仮計測しかできないから
追加検証は任せたぞ(丸投げ)
https://1.bitsend.jp/download/593567037ab3cd605f8a28391e1277ae.html クジラのパラメータってstockfishの最新にあわせてあるんだっけ? >>741
4.82もくじらのパラメータでリビルドしたら強くなるってことか。 PALの作者はNPSが上がればいいというわけではないって話してた。 >>746
それは他ソフトとの対戦の話であって、同一評価関数での自己対戦ではNPSが高いほうが強いんじゃないの? NPS高くても枝刈りも変わってれば必ずしも良くなるわけではないんでは?
そもそもparameter.h入れ替えただけでNPS上がるのか 千田先生がキメラに挑戦して撃沈してて草
そういうのは暇な人間にまかせて研究したほうが絶対有意義だと思います アマ竜王戦に激指が出ただの公開されたボナンザが強くて盛り上がっただのチワワが荒らしてただのリアルタイムで知ってるの極わずかどろ >>750
そういうレスしてるときの誤字は痛すぎるぞ 現在、>>566の探索をi9-7960Xでfloodgateに流しているが(評価関数と定跡は自前)、広めの探索が功を奏し、下位に対する取りこぼしがなく強い
>>741もそうだが、探索部にもまだまだ未踏部分が存在するのかもしれない 探索部を弄った成果が
序盤に特化したり評価関数に特化したりと
計測のややこしい部分だらけなのが厄介だな Qhapaq公開されたけどaperypaqに57%勝ってくじらに負け越すとはやっぱり相性大事なんだな 相性の存在ってのはまだ最適化されていないと見るべきなのか
異種のソフト間ではレーティングって考えの前提が厳密には成立してないのかどっちやろ 何がアウトだったか教えてくれないのかAmazonって 鵺が強くなった報告全然見かけないけど学習にすごく時間かかったりするの? Qhapaq公開は微妙に強くなった程度を公開
なので大会の時の評価関数はクジラちゃん以下だったと
有意差ないと予測 千田は強いソフトが欲しい一心ならクラウドで動かせるようにしたらいいんじゃないかな・・・
それだけでR200上がるでしょ
まあ評価関数作るの楽しいからいいけど 早速QzillaとQhapaqのキメラ作ってみた。
まだテストさせてるところだから分からんが、クジラよりちょっと強くなってるかもしれん。 コンピュータらしく全局面探索。
↓
コンピュータ性能による深さをの限界。
↓
人間っぽくヒューリスティックに探索幅を狭めて深く読む事で改善。
↓
読み抜けの限界。
ずっとこの繰り返しでしょ。
今は読み抜け問題が顕在化しているだけで。
どこまで行っても、10^220の局面のうち、比較的出てくる可能性が高い
ごく少数の局面に対して、それっぽい近似をするのが評価関数。
将棋の神様は評価関数なんて持たずに、深さ無限大の全幅探索できると
言う想定なわけで。まだまだギャップはでかい。 局面xの最善手を計算する式f(x)を持っていれば探索は必要無い(神様) >>765
探索の際に手の選択の判断基準となるのが評価関数ではないのですか?
探索さえできれば、評価不要のような文章なのが気になります >>766
探索というのはルックアップテーブルを即時生成しては近似式と比較するイメージなんでしょうか? Qhapaq前回verとやらせてるんだが、少しだけ負け越してる
本当に強くなったんだろうか? クジラ最強、いやカパック最強
なおクジラ&カパックで
PAL、Hefeweizenに0勝7敗 その時点での最強評価関数をターゲットに数割勝ち越すようにしても、相性問題で別の関数には負け越すことが頻発…。
これまでの将棋ソフトの歴史でこんな事態はそんなに有りませんでしたよね?
こういう時代だからこそ白ビールのようなマルチポンダー・定跡嵌めのような戦い方が有利になるのでしょうか? >>772
勝率90%超えてから公開すれば、事態は起きません >>767
常に終局まで探索するなら、評価関数は不要だよ。
終局まで探索できないから、評価関数を使用して終局状態を予想する事で、
一定の深さで探索を打ち切るの。
超簡単なゲーム(例えば3×3の○×ゲーム)なら、評価関数は不要。
まあ、累乗問題で終局を論ずる事もかなりな極論だけどね。 >>774
それほんとならR4350くらいのダントツトップってことになるけど カパックみたけどアマゾンは申請した住所や連絡先と使っているアカウントの情報が違うとはじかれる
引っ越して住所が変わっていた場合なんかは注意
これでカパック通ってくれることを祈る 〇×ゲーム自分で組んでみたらいいんだよ。
普通の全幅探索で絶対に負けないものが作れるから。 〇×ゲームくらいのゲームツリーなら余裕で全探索できるよ。
やってみればわかる。 最近は平均手数が伸びたって話がよく言われるけど
どうぶつしょうぎ(4x3 駒8枚)の必勝手数が78手ってことを
考えたら本将棋はとんでもなく長くなりそうな気がするわな 将棋の神同士が対局したらどちらかの入玉宣言勝ちになるんじゃないか、という説もあるくらいだしね。 >>767
>>775を補足すると、末端まで読める前提なら、評価関数が不要というか、評価関数の返す値が1/0/-1の3値だけで良くなる。つまり勝ち引き分け負け。
あるいは真の末端まで展開しなくても、何らかの方法で結論が出るだけでもいいが。 >>783
初手7六歩か2六歩を選ぶのに、1/0/-1の3値でどう決めるのでしょうか? >>784
76歩で先手必勝なら1
26歩でも先手必勝なら1 >>776
ないね、評価関数には相性問題があるから >>766
神様関数の内部はifネストだらけだったりしませんかねぇ。。? 公開されたQhapaq評価関数強くなってないですね >>785
二つの手は共に同格の最善手ということでしょうか?
最善手とは、常に複数有るものだということでしょうか? >>789
手数で優劣つけるなら別
複数、最善手あるかどうかは局面次第
頭金でも頭銀でも詰む状況ならこそに差はないでしょ >>789
最善の定義による。
勝ちなら何でもよい場合、余詰でも必至で自玉が安全でも何でもいいわけ。詰め将棋じゃないんで
最短手数が最善とか決めたら一意に定まるかもしらないけどね。 wcsc28の棋譜ってどこかからダウンロードできる? Qhapaqはクジラちゃんに勝ち越せないですね
elmoもおそらく・・・・ TNKをスマホに入れてみたけど、メモリ消費少なくていいね
多少弱くなっても構わないって人おすすめ elmoのreadmeを見ると評価関数の出来に結構自信がありそう k_ohgaさんまふさんチームだと優勝もありえたね。
探索もやねうら王より強いのはさすがだわ やねうら王v4.8.2でm5.24xlarge(96vcpu)を動作させると何npsが出るのでしょうか? クジラちゃんとelmoクジラちゃん圧倒的に勝ち越す >>799
定跡の強さは未知数だから公開してほしいけどね 5000万nps出るよ
初期局面だと8000万近く >>796
入れ方教えてください
RAM512MBでも行けたりしますか? WhaleWatcherってbatファイル食えないんですが
コネクタタイプのブリッジが必要? この将棋の途中で何回も香車を打ち合ってるの面白いな。
打開の権利がある優勢な方は自分だけ考慮時間を稼いでいるようにさえ見える。
囲碁の劫でたまに見かけるような気がするけど将棋では何回も出てくるのは珍しい
二次予選 1回戦 HoneyWaffle - 名人コブラ
http://live4.computer-shogi.org/wcsc28/kifu/WCSC28_U1_HNW_MCB.html elmoとAperyはめちゃくちゃ似た評価関数になってるけど、Qhapaqとはそこまで似てない気がする
理由はわからないが、Aperyはキメラに適さないから、おそらく今回のelmoもキメラには適さないんじゃないかなあ >>801
自分で40戦ほど1秒で指させたら、
クジラ:elmo= 26:13 (1分け)
となりました。
明らかにクジラが強い >>804
ありがとうございます。
uuunuuunさんのところで
GCEの160vcpuが5000万だというのでほぼ同じ程度ってことですかね。 YSS山下さんの論文を元に棋力測定ツールを作ってほしい もう3駒はqzilla9安定かな
他の評価関数が微差で抜いても
NNUEの絞りに成功した評価関数が出たらそっちに乗り換える事は確定しているし くじら入玉戦に難があるって説見かけたけど
入玉好きそうなApery_sdt5相手だと多少相性が悪かったりする? >>798
発熱量やバッテリー消費量はkppt版と変わらず >>805
スマホ用にビルドすればいいよ
とはいえそのメモリ量じゃちょっと厳しいかと >>814
そなの?
フリーソフトでそんなのがあったら嬉しいわ >>818
ビルドは素人にはできないです汗
技巧は辛うじて昔の512MBのスマホでも動いたんですが、それ以降これで動かせるソフトはないですね >>812
クジラにとってelmo は相性いいのかも。
大会ではelmo が唯一バグ以外の理由で負けたのがクジラだし。 古い世代でcortex-a7だったりするならさすがにきついと思う>TNK
64bitでも下のA53だとそのままだと愕然とするレベルにnpsが出ない
いろいろ手を入れてやっと五割をちょっと越える程度までなったわ ■ このスレッドは過去ログ倉庫に格納されています