▲コンピュータ将棋スレッド136
■ このスレッドは過去ログ倉庫に格納されています
やねうら王v4.8.2でm5.24xlarge(96vcpu)を動作させると何npsが出るのでしょうか? クジラちゃんとelmoクジラちゃん圧倒的に勝ち越す >>799
定跡の強さは未知数だから公開してほしいけどね 5000万nps出るよ
初期局面だと8000万近く >>796
入れ方教えてください
RAM512MBでも行けたりしますか? WhaleWatcherってbatファイル食えないんですが
コネクタタイプのブリッジが必要? この将棋の途中で何回も香車を打ち合ってるの面白いな。
打開の権利がある優勢な方は自分だけ考慮時間を稼いでいるようにさえ見える。
囲碁の劫でたまに見かけるような気がするけど将棋では何回も出てくるのは珍しい
二次予選 1回戦 HoneyWaffle - 名人コブラ
http://live4.computer-shogi.org/wcsc28/kifu/WCSC28_U1_HNW_MCB.html elmoとAperyはめちゃくちゃ似た評価関数になってるけど、Qhapaqとはそこまで似てない気がする
理由はわからないが、Aperyはキメラに適さないから、おそらく今回のelmoもキメラには適さないんじゃないかなあ >>801
自分で40戦ほど1秒で指させたら、
クジラ:elmo= 26:13 (1分け)
となりました。
明らかにクジラが強い >>804
ありがとうございます。
uuunuuunさんのところで
GCEの160vcpuが5000万だというのでほぼ同じ程度ってことですかね。 YSS山下さんの論文を元に棋力測定ツールを作ってほしい もう3駒はqzilla9安定かな
他の評価関数が微差で抜いても
NNUEの絞りに成功した評価関数が出たらそっちに乗り換える事は確定しているし くじら入玉戦に難があるって説見かけたけど
入玉好きそうなApery_sdt5相手だと多少相性が悪かったりする? >>798
発熱量やバッテリー消費量はkppt版と変わらず >>805
スマホ用にビルドすればいいよ
とはいえそのメモリ量じゃちょっと厳しいかと >>814
そなの?
フリーソフトでそんなのがあったら嬉しいわ >>818
ビルドは素人にはできないです汗
技巧は辛うじて昔の512MBのスマホでも動いたんですが、それ以降これで動かせるソフトはないですね >>812
クジラにとってelmo は相性いいのかも。
大会ではelmo が唯一バグ以外の理由で負けたのがクジラだし。 古い世代でcortex-a7だったりするならさすがにきついと思う>TNK
64bitでも下のA53だとそのままだと愕然とするレベルにnpsが出ない
いろいろ手を入れてやっと五割をちょっと越える程度までなったわ 次々と出てくる最新ソフトをちぎっては投げちぎっては投げるクジラちゃん
さすが選手権優勝候補だったことはあるな 瀧澤 誠@elmo
@mktakizawa
くじらちゃんとはイーブンかやや劣るくらいかなと思ってます。
今回更新するパラメータを大きく絞っているので、
まだまだKPPの最適化は出来そう(やるべきかどうかは置いておいて)と感じてます(誰かやってくんないかなと)。
1秒計測だとクジラちゃん勝ち越しますね elmoは時間が伸びると強くなるタイプだったと記憶しているけれど
elmoには1手1秒だと短すぎるとか? 16スレッド1手1秒だとaperypaqにTNKが勝率55%
ノード数で強さが変わって来るのかな。 将棋ソフトの強さを比較する場は現在
・WCSC
・SDT
・uuuunuuunサイト
・floodgate
の4つだと思いますが、floodgateを除く三つは閉鎖を宣言しています。
皆無くなってしまったら開発者のモチベーションは潰えるため、将棋ソフトは最早発展することは有りませんね。
何とかならないものですか? >>833
おまえが第二のuuuuunさんになればいい。 1手1分だと一番強い評価関数はどれなんだろう?
8スレッドのショボいCPUだから、大した深さにはならないんだが ショボいPCなら一手2分で検証して一手1分換算だと考えればいいだけじゃん
2コア2スレッドノートPCとかだと流石に他人に頼みたくなると思うけど
それくらいなら全然自力で検証できるだろ >>833
uuunuuunさん閉鎖宣言してるの?
確かにレーティングそろそろやめたいみたいなことはTwitterで見かけたけど 一手一分以上の検証を自力で、って常人にはきつすぎだろ
120手で終わっても1局2時間かかって、qhapaqのqzillaとの検証でも400局で有意差出てないくらいの差
単純計算して2つを比較するだけでも1カ月では終わらない スクショとれなかったから申し訳ないんだが
クジラと昨年のelmo(やねうら4.7.9)で対局して
クジラの6勝4敗だった。
もちろん対局数が少ないからアレだけど、10局でももっと差がつくかと思っただけに
残念
cpu core i7 6700K
持ち時間 1手5秒 くじら同士戦わせて300差でリザインして定跡作ってるんだけど
本当にこいつら横歩取り大好きだな >>837
強さを求め続けるのって漠然としているから一度飽きはじめたら一気に興味が無くなるよ。
以前流行った円周率ベンチと同じ。
プログラマが腕試しや新しい機械学習の方法とか試したりするのは
興味持ち続けられるけど ソフト研究で古作さんが55歳にして棋力を向上させてるとか、
suimonがアマ竜王戦で県代表になれたとか、
そういう話があるとまだまだソフト開発のモチベーションもあるだろう 古作さんのケースって割と貴重で、元奨三段で50代って
普通なら雑巾絞りの余地もうなさそうなのに、
やりようによってはまだまだ絞れるってのを人間の立場から実証してるのがなあ >>841
定跡OFFでの強さを測ってるのってあそこくらいだからレーティング無くなって欲しくないなー
計測の時期はそこそこ人数集まって計測作業分担するとかなら続ける気になってくれるだろうか >>741
nnue-whale-sse42動きます?
「動作が停止しました」が出て動かない
windows10-1709 IvyBridge >>847
残念ながらsse42もエラーが出て動かないようです >>847
早速ありがとうございます
試したところ、sse42、sse41、sse2だめでした もうやめましょうよ、誤差の範囲内程度の勝率の評価関数は >>853
誤差と言われたくないがために有意確率まで貼ったのだけどなあ 優位確率貼ったんなら何故"気がする"なんて書くんだw NNUE-whale3 自分でビルドしたら SSE4.2 環境でも動いたよ >>852
それ、1000局以上やると有意差なくなるパターンかもw 公開する場合はね、どの評価関数にも勝率90%超えてから
勝率60%程度じゃ同じような強さでしかないのです >>858
>>859
言いたいことは分かる、確かに勝率60%範囲内だと、10局やったら互角か、どっちが勝ち越すか分からないレベルだね
勝率80%あれば10局やったら必ず有意差が出るレベルだね >>847
NNUEだけが探索調整して強くなる感じですか?
NNUEは環境や計測方法によって対局結果がことなるよね。 気持ちはわかるが例えば200回対局して勝率56%でもちゃんと有意差はあるとできる
もちろん2000局に増やしたときに勝率52%とかかもしれないし60%とかかもしれない、でも差はあるだろうという予測 >>859
もしsdt5以前からそんなことを言っていたらApery_sdt5に勝率60%未満のaperypaqの
公開の場が無くなっていた 90%とかレーティング差だと382
そんなものがお手軽ポンとできたら苦労はない
出したい奴は出せばいい 要らないと思えば無視すればいい sse4.2向けは誰かに任せた
ライセンス的にソースコードを同梱しておけば改変や再配布は自由
もちろんsse4.2で動かしても強い保証はないけど おもっきり素人やが、
やっと566のsse42やっとコンパイルでけたきがする
https://i.imgur.com/jxjNc1E.jpg sse4.2向けは誰かに任せた
ライセンス的にソースコードを同梱しておけば改変や再配布は自由
もちろんsse4.2で動かしても強い保証はないけど 澤田さんは最期に河童絞りを公開してNUEEに完全移行っぽい感じなのかな 互角局面からqhapaqを相手に再計測をしてみたけど勝率のブレがないことを確認した
https://i.imgur.com/Gah0FHP.jpg
短時間計測では3強(elmo,qzilla9,qhapaq)を相手に探索部弄りの効果確認も含めて1000局以上指しているけど
whale3以降は200局単位で勝率54%を一度も割っていない
これでハイスペックPC環境の人の計測では弱体化してましたとかなら
流石に調整はギブアップw >>870
3スレ0.1秒でしか計測してないから10万ノード程度
100局程度の段階で有意差出る見込みがなかったら早々に打ち切って
別の部分の調整をしてまた3スレ0.1秒で100局
有意差が出そうだったらそのまま200局まで様子見をして勝率が高ければ採用の繰り返しだよ
とはいえ200局で有意差を出せそうな調整箇所はもう残っていなさそうだから
長時間で強くなっていたとしても既に限界、NNUE-whale3がもう最終版 >>872
1000万ノードでtanukiの元のとあなたのを対局したらあなたの方が勝率80%以上で圧勝だった、恐ろしく強い >>872
探索でそんなに一気に強くなるって最近なかっただけにすごいな
NNは低ノードだと三駒に比べて強くなりやすそうな気はするとはいえ
本格的にNNUEで遊びたくなったら使わせてもらいます >>874
もし本当にそんなに強いのであれば、WCSCでのたぬきの強さが他のソフトと大差ない強さだったというのは、本当に偶然だったんだね。
ボナンザもそうだけど、コンピュータ将棋において新技術が生まれた時は、なぜ従前の技術と大差ない強さなのか、この偶然ってすごいね たぬきとクジラって動物的にまさにキメラだな。キメラじゃないけど。 十分勝負できるとなった時点で大会に出るから。
現に鵺は電王トーナメント時にはまだ十分でないとして出場しなかった。 >>874
ごめん1000万ノードじゃなくて200万ノードだった、対局数は30局ほど たぬきの子を孕ませられるクジラちゃん…
ぐっとくるな >>880
感動のところ悪いが透がもう公開版クジラに64%のキメラ?作ったっぽい uuunuuunのレート表にelmoとQhapaq載らないが計らないのかな 64%と嘘くせえと思ってもみたが何人か6割勝つって人いたから簡単にできるのか? くじらのカッパ搾り版でそれ以上の評価関数が出てくるのを期待 >>723
この表面白いな
実際のところ将棋でも、第2回第3回電王戦の頃で、結果こそああなったけど
明確に羽生渡辺を抜いてたコンピュータ将棋ってまだなかったんだと思うな
チェスでも結局明確に人間トップを抜いたのはLybkaの登場を待たなきゃいけないのか CSA例会の議事録を遅ればせながら目を通した
・読み太は二次予選の前半は不調があったらしく、修正した後半から強くなったそうだ
・金子先生からの提言
最大手数を伸ばすことが将棋の内容を良くするのか?
引き分けを両者負けや負け2つ分にしてコンピューターに必死に勝たせるようにするのはどうか?
長手数化だけが課題なら、投了0.02勝、詰まされて負け0.01勝、256手到達両者0勝などと
扱うことにすると、早期投了機能を実装する動機になる
(長手数の将棋を批判する意図はない/思考実験であって、コミットした意見ではない)
↑はfloodgateの仕様変更の話題に関連したもの、変更コストはゼロではないので、
様々な選択肢を検討済みなのかどうか、全員一致なのかどうか確認してはという提案 フィッシャークロックにしておいて手数を伸ばすのを否定するのはなんか納得しかねるものがあるな
対局時間は限界があるのだから選択できる手段を最大限にする従来の25分切れ負けのほうが
はるかにマシだと思うわ 今度は勝勢だったのに切れ負け確定とか言う局面が出てくるからなあ 将棋の質では切れ負けだと一秒差しでくだらんトラブルも
あって下がるだろうなあ 時間がきびしいアマチュア大会なら切れ負けは厳格
将棋内容と勝敗結果は別物なのだよ
そもそも試行回数が絶対的に少ないWCSCの優勝は別に最強を意味しない コンピュータチェスみたいに手数ごとに制限時間を入れるのを応用して
200手を超えたらそこから両者1分切れ負けにする
入玉宣言はもっと伸びシロがあるのにモチベーションがなくなる可能性の高い変更はアレだが >>886
将棋は伊藤氏がレーティング計算して電王戦の頃には抜いてるはずだと主張してる 色々なの出てるみたいで戦ってるが、どれも初期のelmo_yaneura4.79と大差ないんだが
(最大でも60%程度の差)
まさか相性の問題じゃないよな >>893
24条件ならな、それは誰も否定していない
そして24条件やウォーズの10切れが人間のベストだと言ってる意見も聞いたことはない >>894
どのelmoとかにもよるが去年の電王Tのelmoならだいたいその辺じゃないか K-Shogi 3.6.0ってレーティング2466もあるのか
いつの間にかアマ高段レベルまで強くなってたんだな 256手で優劣がつかないような状況にはなってないんだから
15分切れたら1手1秒で50分で引き分けとかで十分決着つくのでは? >>895
24持ち時間より長くなったらの件も考慮した話もいろいろ出てるのに
今更そんな話でドヤ顔されても… ■ このスレッドは過去ログ倉庫に格納されています