▲コンピュータ将棋スレッド136
■ このスレッドは過去ログ倉庫に格納されています
局面xの最善手を計算する式f(x)を持っていれば探索は必要無い(神様) >>765
探索の際に手の選択の判断基準となるのが評価関数ではないのですか?
探索さえできれば、評価不要のような文章なのが気になります >>766
探索というのはルックアップテーブルを即時生成しては近似式と比較するイメージなんでしょうか? Qhapaq前回verとやらせてるんだが、少しだけ負け越してる
本当に強くなったんだろうか? クジラ最強、いやカパック最強
なおクジラ&カパックで
PAL、Hefeweizenに0勝7敗 その時点での最強評価関数をターゲットに数割勝ち越すようにしても、相性問題で別の関数には負け越すことが頻発…。
これまでの将棋ソフトの歴史でこんな事態はそんなに有りませんでしたよね?
こういう時代だからこそ白ビールのようなマルチポンダー・定跡嵌めのような戦い方が有利になるのでしょうか? >>772
勝率90%超えてから公開すれば、事態は起きません >>767
常に終局まで探索するなら、評価関数は不要だよ。
終局まで探索できないから、評価関数を使用して終局状態を予想する事で、
一定の深さで探索を打ち切るの。
超簡単なゲーム(例えば3×3の○×ゲーム)なら、評価関数は不要。
まあ、累乗問題で終局を論ずる事もかなりな極論だけどね。 >>774
それほんとならR4350くらいのダントツトップってことになるけど カパックみたけどアマゾンは申請した住所や連絡先と使っているアカウントの情報が違うとはじかれる
引っ越して住所が変わっていた場合なんかは注意
これでカパック通ってくれることを祈る 〇×ゲーム自分で組んでみたらいいんだよ。
普通の全幅探索で絶対に負けないものが作れるから。 〇×ゲームくらいのゲームツリーなら余裕で全探索できるよ。
やってみればわかる。 最近は平均手数が伸びたって話がよく言われるけど
どうぶつしょうぎ(4x3 駒8枚)の必勝手数が78手ってことを
考えたら本将棋はとんでもなく長くなりそうな気がするわな 将棋の神同士が対局したらどちらかの入玉宣言勝ちになるんじゃないか、という説もあるくらいだしね。 >>767
>>775を補足すると、末端まで読める前提なら、評価関数が不要というか、評価関数の返す値が1/0/-1の3値だけで良くなる。つまり勝ち引き分け負け。
あるいは真の末端まで展開しなくても、何らかの方法で結論が出るだけでもいいが。 >>783
初手7六歩か2六歩を選ぶのに、1/0/-1の3値でどう決めるのでしょうか? >>784
76歩で先手必勝なら1
26歩でも先手必勝なら1 >>776
ないね、評価関数には相性問題があるから >>766
神様関数の内部はifネストだらけだったりしませんかねぇ。。? 公開されたQhapaq評価関数強くなってないですね >>785
二つの手は共に同格の最善手ということでしょうか?
最善手とは、常に複数有るものだということでしょうか? >>789
手数で優劣つけるなら別
複数、最善手あるかどうかは局面次第
頭金でも頭銀でも詰む状況ならこそに差はないでしょ >>789
最善の定義による。
勝ちなら何でもよい場合、余詰でも必至で自玉が安全でも何でもいいわけ。詰め将棋じゃないんで
最短手数が最善とか決めたら一意に定まるかもしらないけどね。 wcsc28の棋譜ってどこかからダウンロードできる? Qhapaqはクジラちゃんに勝ち越せないですね
elmoもおそらく・・・・ TNKをスマホに入れてみたけど、メモリ消費少なくていいね
多少弱くなっても構わないって人おすすめ elmoのreadmeを見ると評価関数の出来に結構自信がありそう k_ohgaさんまふさんチームだと優勝もありえたね。
探索もやねうら王より強いのはさすがだわ やねうら王v4.8.2でm5.24xlarge(96vcpu)を動作させると何npsが出るのでしょうか? クジラちゃんとelmoクジラちゃん圧倒的に勝ち越す >>799
定跡の強さは未知数だから公開してほしいけどね 5000万nps出るよ
初期局面だと8000万近く >>796
入れ方教えてください
RAM512MBでも行けたりしますか? WhaleWatcherってbatファイル食えないんですが
コネクタタイプのブリッジが必要? この将棋の途中で何回も香車を打ち合ってるの面白いな。
打開の権利がある優勢な方は自分だけ考慮時間を稼いでいるようにさえ見える。
囲碁の劫でたまに見かけるような気がするけど将棋では何回も出てくるのは珍しい
二次予選 1回戦 HoneyWaffle - 名人コブラ
http://live4.computer-shogi.org/wcsc28/kifu/WCSC28_U1_HNW_MCB.html elmoとAperyはめちゃくちゃ似た評価関数になってるけど、Qhapaqとはそこまで似てない気がする
理由はわからないが、Aperyはキメラに適さないから、おそらく今回のelmoもキメラには適さないんじゃないかなあ >>801
自分で40戦ほど1秒で指させたら、
クジラ:elmo= 26:13 (1分け)
となりました。
明らかにクジラが強い >>804
ありがとうございます。
uuunuuunさんのところで
GCEの160vcpuが5000万だというのでほぼ同じ程度ってことですかね。 YSS山下さんの論文を元に棋力測定ツールを作ってほしい もう3駒はqzilla9安定かな
他の評価関数が微差で抜いても
NNUEの絞りに成功した評価関数が出たらそっちに乗り換える事は確定しているし くじら入玉戦に難があるって説見かけたけど
入玉好きそうなApery_sdt5相手だと多少相性が悪かったりする? >>798
発熱量やバッテリー消費量はkppt版と変わらず >>805
スマホ用にビルドすればいいよ
とはいえそのメモリ量じゃちょっと厳しいかと >>814
そなの?
フリーソフトでそんなのがあったら嬉しいわ >>818
ビルドは素人にはできないです汗
技巧は辛うじて昔の512MBのスマホでも動いたんですが、それ以降これで動かせるソフトはないですね >>812
クジラにとってelmo は相性いいのかも。
大会ではelmo が唯一バグ以外の理由で負けたのがクジラだし。 古い世代でcortex-a7だったりするならさすがにきついと思う>TNK
64bitでも下のA53だとそのままだと愕然とするレベルにnpsが出ない
いろいろ手を入れてやっと五割をちょっと越える程度までなったわ 次々と出てくる最新ソフトをちぎっては投げちぎっては投げるクジラちゃん
さすが選手権優勝候補だったことはあるな 瀧澤 誠@elmo
@mktakizawa
くじらちゃんとはイーブンかやや劣るくらいかなと思ってます。
今回更新するパラメータを大きく絞っているので、
まだまだKPPの最適化は出来そう(やるべきかどうかは置いておいて)と感じてます(誰かやってくんないかなと)。
1秒計測だとクジラちゃん勝ち越しますね elmoは時間が伸びると強くなるタイプだったと記憶しているけれど
elmoには1手1秒だと短すぎるとか? 16スレッド1手1秒だとaperypaqにTNKが勝率55%
ノード数で強さが変わって来るのかな。 将棋ソフトの強さを比較する場は現在
・WCSC
・SDT
・uuuunuuunサイト
・floodgate
の4つだと思いますが、floodgateを除く三つは閉鎖を宣言しています。
皆無くなってしまったら開発者のモチベーションは潰えるため、将棋ソフトは最早発展することは有りませんね。
何とかならないものですか? >>833
おまえが第二のuuuuunさんになればいい。 1手1分だと一番強い評価関数はどれなんだろう?
8スレッドのショボいCPUだから、大した深さにはならないんだが ショボいPCなら一手2分で検証して一手1分換算だと考えればいいだけじゃん
2コア2スレッドノートPCとかだと流石に他人に頼みたくなると思うけど
それくらいなら全然自力で検証できるだろ >>833
uuunuuunさん閉鎖宣言してるの?
確かにレーティングそろそろやめたいみたいなことはTwitterで見かけたけど 一手一分以上の検証を自力で、って常人にはきつすぎだろ
120手で終わっても1局2時間かかって、qhapaqのqzillaとの検証でも400局で有意差出てないくらいの差
単純計算して2つを比較するだけでも1カ月では終わらない スクショとれなかったから申し訳ないんだが
クジラと昨年のelmo(やねうら4.7.9)で対局して
クジラの6勝4敗だった。
もちろん対局数が少ないからアレだけど、10局でももっと差がつくかと思っただけに
残念
cpu core i7 6700K
持ち時間 1手5秒 くじら同士戦わせて300差でリザインして定跡作ってるんだけど
本当にこいつら横歩取り大好きだな >>837
強さを求め続けるのって漠然としているから一度飽きはじめたら一気に興味が無くなるよ。
以前流行った円周率ベンチと同じ。
プログラマが腕試しや新しい機械学習の方法とか試したりするのは
興味持ち続けられるけど ソフト研究で古作さんが55歳にして棋力を向上させてるとか、
suimonがアマ竜王戦で県代表になれたとか、
そういう話があるとまだまだソフト開発のモチベーションもあるだろう 古作さんのケースって割と貴重で、元奨三段で50代って
普通なら雑巾絞りの余地もうなさそうなのに、
やりようによってはまだまだ絞れるってのを人間の立場から実証してるのがなあ >>841
定跡OFFでの強さを測ってるのってあそこくらいだからレーティング無くなって欲しくないなー
計測の時期はそこそこ人数集まって計測作業分担するとかなら続ける気になってくれるだろうか >>741
nnue-whale-sse42動きます?
「動作が停止しました」が出て動かない
windows10-1709 IvyBridge >>847
残念ながらsse42もエラーが出て動かないようです >>847
早速ありがとうございます
試したところ、sse42、sse41、sse2だめでした もうやめましょうよ、誤差の範囲内程度の勝率の評価関数は >>853
誤差と言われたくないがために有意確率まで貼ったのだけどなあ 優位確率貼ったんなら何故"気がする"なんて書くんだw NNUE-whale3 自分でビルドしたら SSE4.2 環境でも動いたよ >>852
それ、1000局以上やると有意差なくなるパターンかもw 公開する場合はね、どの評価関数にも勝率90%超えてから
勝率60%程度じゃ同じような強さでしかないのです >>858
>>859
言いたいことは分かる、確かに勝率60%範囲内だと、10局やったら互角か、どっちが勝ち越すか分からないレベルだね
勝率80%あれば10局やったら必ず有意差が出るレベルだね >>847
NNUEだけが探索調整して強くなる感じですか?
NNUEは環境や計測方法によって対局結果がことなるよね。 気持ちはわかるが例えば200回対局して勝率56%でもちゃんと有意差はあるとできる
もちろん2000局に増やしたときに勝率52%とかかもしれないし60%とかかもしれない、でも差はあるだろうという予測 >>859
もしsdt5以前からそんなことを言っていたらApery_sdt5に勝率60%未満のaperypaqの
公開の場が無くなっていた 90%とかレーティング差だと382
そんなものがお手軽ポンとできたら苦労はない
出したい奴は出せばいい 要らないと思えば無視すればいい sse4.2向けは誰かに任せた
ライセンス的にソースコードを同梱しておけば改変や再配布は自由
もちろんsse4.2で動かしても強い保証はないけど ■ このスレッドは過去ログ倉庫に格納されています