▲コンピュータ将棋スレッド141
■ このスレッドは過去ログ倉庫に格納されています
「100万ノードだとA>Bだけど1000万ノードならA<Bである。
よって長時間ならBが強い」なんて結論出すのは相当頭悪い話だけどな。 >>494
ということで一手1500万ノードに決めたのがuuunuuunさんのレーティングサイトってことかな >>492
そもそもレーティング測るなら
測定環境、条件は揃えるべき >>323
258 配布のソースですが、MSYS2のビルドもエラーで上手くいきませんでした。
search.cppの3313行で、YaneuraOu2017GOKUが呼ばれてるのが原因っぽいです。 >>493
そう
なので今までは1500万ということになっているけど、それ以下に減らすと統計的にどうなのかな、という
>>495
どのソフトでも、ノード数が増えればその分勝率が高くなるが、勝率の伸び方が違うかもしれない
1000万や1500万が長時間と言えないかもしれないが、それ以下では長時間で強いとは更に言えない
実利用は検討用途が多い事も考えないといけない
>>497
そう
完全に同じ条件というのは難しいので、できるだけ揃えたほうが良くね?と思って 結局1500万ノードでは肝心の対局数が全然足りないから測定誤差での議論になる
対局数が足りないことが理解できない人ほど1500万ノード信者になるから議論の質も低い 信者だとか厨とかいってるレスよりは十分質が高いと思うけどね ノード数増加による棋力向上の変化は理論は何も手がかりは無いし
経験則と言えるほどのデータも集まってない。
1500万ノードで調査した結果からは1500万ノードの棋力がわかるだけで特に一般則は無い。 100万ノードではA>B、1500万ノードではA<Bの結果なら一手10億ノードで強いのはBの可能性が高いと思う
だから検討用に使うなら1500万ノードで割り切ってもいいのでは、理想は一手5000万、1億、2億とノード数を
変えて計測するのが理想だが有効な統計数を取るには個人では時間的に無理なので、この手の話をしても意味がない >>499
>>500
>>503
そもそも同一ハードでソフトによってNPS違うのにノード数で縛る意味とは? >>503
単調変化だと確信が無いのに二点測って結論出そうとする
頭の悪いことをここで言い出す人が現れるとは思わなかったわ >>500
そもそも2ちゃんねるの書き込みの信頼性が見積もれないと思うんだけど
対局条件がきちんとしているならば、それだけでは価値のない10局の結果は
価値のある1000局の一部になれる可能性がある
>>504
違うハードで条件を揃えやすい
レーティングの相性問題に目をつぶれるならば、ノード数の違う自己対戦の結果を
つかってレーティングを補正できる >>505
頭が悪いのはお前だろうが、計測はどこかで妥協しないとキリがないだろうが、強いのか弱いのか分からない一つのソフトの計測にお前のような理想ばっかり
述べても時間を取られるだけで実用性がないからな 何にもしねぇ、声だけデカイ馬鹿はどこにもいるからな
妄想カタカタしてる暇あったら、お前の好きな方法で計測してこい
誰にも必要とされてねえよ 理想とかじゃなく、◯◯ノードはダメだけど△△ノードは価値があるって判断そのものが
現状ナンセンスなんだって気づけよ >>507
単調変化すると仮定するなら1万ノードと10万ノードでの比較でもいい事になるんだけど理解してる? というかノード数変えてどこから統計的に有意とか、恥ずかしい発言だと思わんのか。
このスレで有意って単語見たからって知らん言葉使っとるんか
ある実験条件(ノード数なり思考時間なり)で無限に対局を重ねれば、ある勝率に収束する
その確からしさが欲しいならそれぞれ対局数を重ねるしかない。
短時間対局で対局数を重ねれば、短時間対局でのあるべき結果に収束する
実験条件を変えた時に異なる勝率に収束するかは別の問題
それは統計の問題ではない illqhaの作者は学習時にLAMBDAを0.05にしているようだけど、それ自体は悪いことじゃないだけども、
それだとせっかくdepth12で作った教師の評価値があまり意味がなくなっていると思う。
LAMBDA混合絞りで序盤の評価値のLAMBDAは大きくした方が深い探索が生きると思う TCECの同点のときの順位決定法ってSB優先じゃなかったんだな
1.クラッシュ数(少ないほうが勝ち抜け)
2.直接対決の成績上位
3.勝ち数の上位
4.後手番での勝ち数の上位
5.SBの上位
6.主催者の判断
TCEC 13の3部リーグは8エンジンによる4回戦総当たり全28回戦が終了し
Etherealが17勝0敗11分の22.5ptsで無敗優勝を飾った。
2位はArasanが9勝5敗14分、LeeraChessZeroが7勝3敗18分の16ptsで並んだが
直接対決で1勝3分と上回ったArasanが1期で2部への復帰を決めた
なお、3部リーグはずっとGPUの熱トラブルが続きLeeraChessZeroは実力を発揮
できなかったもよう。冷却と電力消費の問題を克服した20回戦から猛烈な追い上げを
開始したが、Arasanとの直接対決差に涙を飲んだ
やっぱNN勢を大会に出すってのはなかなか大変みたいね 今やってる議論とは別だけど、
高ノードだろうが、低ノードだろうが、
そもそもノードを固定して測定するってのが疑問
それが平等な条件なの? ノード数固定という意味ではなく大体どのくらいのノード数になるように秒数で固定という意味合が多いと思うのだけれど いつものテスト対局です
ノード5〜600万
対局数500 先手勝ち243(54%) 後手勝ち204(45%) 引き分け53
dolphin2+kai4
勝ち247(55%) 先手勝ち135(59%) 後手勝ち112(50%)
dolphin2+kai5
勝ち200(44%) 先手勝ち108(49%) 後手勝ち92(40%)
ノード2000〜2500万
対局数100 先手勝ち48(55%) 後手勝ち38(44%) 引き分け14
dolphin2+kai4
勝ち58(67%) 先手勝ち30(75%) 後手勝ち28(60%)
dolphin2+kai5
勝ち28(32%) 先手勝ち18(39%) 後手勝ち10(25%)
ということで、私の環境ではdolphin2+kai5はあまり良い結果は得られませんでした >>514
1500万ノードって記載があるのは全て大体1500万ー2000万ノードの範囲に収まるように秒数を固定したものでノード数固定ではない
そのため違うエンジンで対局する場合秒読みなのでノード数が違ってくるのは当然で、このスレでのノード数固定計測の話は100万ノードの人くらい
じゃないだろうか >>518
あそうなのね、勘違いしてたわ
ところで、kai5やdolphin2illqha2が自身の前バージョンよりも
強くなってるかどうか確認できないんだけど、
スレ全体的な評判としては、どうなってる感じなんでしょうか? dolphin1.1/illqha1.1とdolphin2/illqha2は僅差な気がするわ >>517
むしろdolphin2+kai4 が結構強いということ言えない?
dolphin2+illqha1.1もなかなかということだから、
「dolphin2が優秀&1つ前の評価関数と好相性」じゃないだろうか めきっと@鵺日々成長中@_illqha
illqha2、もしかしてほとんど強くなってないですかね?
あまりに微妙そうだった場合、修正版として来週末くらいにillqha2.1を出すかもしれません。(illqha2の詳細な計測等はちょっと様子見していてもらったほうがいいかもしれないです)
illqha2弱いぞという方はどんどん教えてください。
めきっと@鵺日々成長中@_illqha
返信先: @Rota_JPさん
はじめまして。いつも計測してくださってありがとうございます。
QQR+GWに対してさすがに少し勝率が低すぎますね。
過学習している感じではなかったので原因を突き止めるまで時間がかかりそうです。
おそらく修正版のillqha2.1を作成すると思いますが、その際は対QQR+GWの勝率をやや重要視してみます。 >>522
私の環境ではdolphin2とGW7を直接対決させると
GW7が勝ち越すけどねillqhaでもkaiでも GWシリーズは短時間に強いように調整してるはず
そのせいでは >>199
ど来年5月には16コアのCPUが5万円弱で買えるという予想ってのは誰の予想? ほんとAMDが頑張ってくれて良かった
Ryzen登場以前のコア数の鈍化は今思えば異常 >>525
私もGW7は優秀な気がする。
同じ結果が出た。 >>525
>>531
ちなみにノード数はどんなもん? 短距離走者と長距離走者みたいに得意な思考時間があるんだろうね 夏休みか何か知らんけど
基本的なアルゴリズム知らない中高生が増えたのかな
古い本で良いから基本的木探索勉強したら? 30すぎたオッサンだけど一週間前からAtCoder登録してみて絶望したわw
開発者はこんな奴と戦っていたのか・・・
単なるミニマックスのゲーム木探索だとビギナーコンテストのCの過去問だと今日気づいてさらに絶望した >>536
ある意味こういう競技性的なものが出来る事によって、上にいる奴はさらなる上を目指すけれども
それより中よりも下にいる奴はもうはなから諦めてそもそもプログラミング自体辞めるという事態とかもありえそう。
格ゲーの世界がまさにそんな感じだからな^^; >>532
>>525の場合 ノードはチェックしていないが i7-8700kで1手10秒 アルゴリズムと言う言葉すら知らないのが
ウヨウヨしてるからなw >>538
一手6000〜7000万ノードくらいか?すごいな
1日に50局もできないんじゃないかそれ
今勝率はどれくらい? 基本的にここの連中も
DLしてポチポチクリックするだけで出来る検証作業
これでしか盛り上がれないからね
何のスキルも持たない人間だと告白してるも同然よ まあ正直な所、電気代の無駄だよな
検証でできた棋譜を集めて更に学習させるならまだしも 検証作業とかやったことないけど全く同じの対戦させても結構勝率ばらついたりするんじゃないの
確かにあんまり意味なさそうな気がする 趣味なんて総じて無駄なもんよ
周りがごちゃごちゃ言うもんでもないと思う テスト対局です
1秒でスレッド数を変えてノードを変化させて対局させてみました
書いてるノード数はdolphinのものでGWは2〜3割増しです
1T(4〜50万)
対局数500 先手勝ち253(52%) 後手勝ち230(47%) 引き分け17
GW+QQR
勝ち295(61%) 先手勝ち155(63%) 後手勝ち140(58%)
+illqha1.1
勝ち188(38%) 先手勝ち98(41%) 後手勝ち90(36%)
2T(80〜100万)
対局数500 先手勝ち285(59%) 後手勝ち195(40%) 引き分け20
GW+QQR
勝ち264(55%) 先手勝ち155(64%) 後手勝ち109(45%)
illqha1.1+dolphin
勝ち216(45%) 先手勝ち130(54%) 後手勝ち86(35%)
4T(160〜200万)
対局数500 先手勝ち268(56%) 後手勝ち207(43%) 引き分け25
GW+QQR
勝ち257(54%) 先手勝ち147(60%) 後手勝ち110(47%)
illqha1.1+dolphin
勝ち218(45%) 先手勝ち121(52%) 後手勝ち97(39%)
6T(300〜350万)これはPCが異なります
対局数500 先手勝ち269(56%) 後手勝ち203(43%) 引き分け28
GW+QQR
勝ち225(47%) 先手勝ち130(54%) 後手勝ち95(40%)
illqha1.1+dolphin
勝ち247(52%) 先手勝ち139(59%) 後手勝ち108(45%) >>542
ここをどこだと思ってるんだ
東大と激指とAIとどれが一番強いかわかんなかった頃からすると
自分で納得してソフトを選んでる分ずっとマシになってるわけだが >>549
こんなところに投下するレベルじゃないようなすごく良いデータだな
NNUEはノード数が極端に少ないと力を発揮できないのかな
dolphinがという可能性もあるけど >>551
というか低ノードだとちょっとしたノード数の差で深度が変わるからでしょ スマホのアプリの将棋データベース2で評価値が出るのですが、
何というコンピュータ将棋を使用して
1手何分考えさせているのですか? >>552
ロタさんの計測だと1500万ノードくらいだと56%くらいになるみたいだし、5000万ノードくらいの結果でも伸びがあればいい感じのグラフが書けそうじゃない? >>549
本当にこんなに差が出るんなら実行環境への依存性はすさまじいな
他人の検証と一致させる方が難しいレベル elmo絞りのときも魔女が出てきたときもノード数で随分変わったし今に始まったことじゃないんだけどね
まあそれなりに多いノード数で強い方が有用な気はするけど どのソフトが強いか500局対戦させてテストするとなると1手1秒はやむを得ないだろうね
でも、昨日のプロの棋譜を解析するのに使うときは1棋譜に5分くらいは平気だから、欲しいのはその場合でも強いソフトなんだよな
ShogiGuiでは探索深度を固定して解析できるようになっているよね
例えば、探索深度を17手で固定して解析してみると、中盤以降は1000万単位のノードで、終盤には1億ノード以上読んだりするわけよ
そういうわけで、必要なソフトは探索深度17で最も信頼できるソフトだったりするんだよな
信頼度が同じなら解析が速いソフトのほうがいいけど、信頼度が違うなら、1棋譜の解析に1分遅くても信頼度が高いソフトを選ぶよ >>525
>>531
Ditto2添付のengine_optionsのPARENT_NODE_GAMMA2を150に修正したのを適用して以下floodgate
と同じ一手ごと加算方式で計測した、Ditto2で14秒あたり2330万ノード、自分の環境ではdolphin2の方が強みたい
dolphin2/illqha2 26-12-12 Ditto2/illqha2 対局数50 勝率64%
持ち時間7分 一手ごとの加算14秒 定跡なし 2スレ Hash1024 投了値1000 1000でもそこからの期待勝率で言えば85%くらいだしそんなに気にするほどでもないと思うけど 昨日やった0.1秒1500局と今日やった0.1秒1500局で、勝率結果が2%強違ったが
冷静に計算してみれば別に普通の事だった。 やらかしは評価がだいたい1000から2000の間で起きる
以前ほどではないが今でもときおり起きる
1000で切るとそういう情報はほとんど拾えない あくまで目的がレーティング調査ということであれば、
そういった逆転劇は統計的に無視しても問題なくて、
その分浮いた時間を、対局数の多さに費やした方が、
統計的にはより信頼性の高い結果が得られるという主張ではないのか? まーもし序盤中盤強くて終盤だけボコボコのソフトがあったとしたら、
1000で投了させた場合と最後までやった場合で結果は違うだろう。
途中で投了させて結果に影響ないことを確認する術は俺にはないので、俺は最後までやらせてる。 実際トップソフト同士だと1000からの逆転はマジでほぼない おーい。鍵かけてないでコメントしろよな。
333 名無し名人 sage 2018/08/21(火) 20:43:24.47 ID:+NcY+lso
2018.08.21
「コンピュータ発!現代将棋新定跡」についてのお詫び
将棋書籍編集部
2018年6月に発売しました「コンピュータ発!現代将棋新定跡」において、参考文献として挙げた千田翔太六段が作成した定跡(「C-book_2017」など)の手順と同一の部分がありました。
その他にも参考文献からの引用が多く、差別化が行われておらず、誠に申し訳ございませんでした。
同一部分は以下のとおりです。
「コンピュータ発!現代将棋新定跡」
第2章 角換わり▲4八金
第3節 ▲4八金・△6二金(▲2五歩型)
p.100〜p102、p.106〜p108の本手順 ハイスペPC持ちで時間もたっぷりかけられるなら投了までやるにこしたことはないと思うが中々そうもいかないからな stockfishからコードを引っ張って来て再調整(末尾のtはテスト用の名前なので中身は同じ)
https://i.imgur.com/GdFaIBD.jpg
外出先のPCでのテスト対局
他の持ち時間では弱体化している可能性もあるので注意
https://1.bitsend.jp/download/c149b30d25d1fc6fe122e277a9ba431a.html
>>498
トーナメントエディションでしかコンパイルが通らない状態になっていました
単純な修正をしたらほんのり勝率が落ちたので(有意差は取れない程度)
こちらのDitto3の方をコンパイルしてみてください nVidiaがTensorコアを載せたRTX20xxシリーズを発表したが
将棋AIの世界じゃGPUって下火なんだっけか >>569
なにこれ?
スイモンは名前だけじゃなくてチダショーの定跡からパクッて書籍化したって事か? >>573
定跡や棋譜に著作権は無いのでおk
てか角換わり最新系なら他にも本出てたと思うし suimonに興味があるならこっちに本スレがある
「suimon_feat.anti_suimon応援スレッド17」
https://mevius.5ch.net/test/read.cgi/bgame/1533862279/ >>574
著作権云々はあえて議論しないけど編集部が謝罪だしたって事は不味いんじゃないの?
スイモンに興味はないからスレ覗いてまで知りたくもないけどフラゲのPVパクッて悦に入ってる
ソフト指しがスイモンだから4ねとしか思わん suimonの話はsuimonに興味がある人以外はどうでもいい話なので本スレでやってくれ >>576
棋書書くのに棋書パクってるのもあるし
その辺の将棋界のスタンスってテキトーなのよね
渡辺明ブログ
https://blog.goo.ne.jp/kishi-akira/e/d666fafdee8261f0d73f0ce7ca68328c
2017-11-18
浅川書房から2005年に出した「四間飛車破り」が数年に1回、増刷になるので送ってもらうんですが、
あれ以来、定跡書は書いてないので執筆当時のことを思い出すと懐かしいです。
今と違って強いソフトが無い時代なので定跡書に書く検討は自力で行わないといけないので
大変で【急戦編】では藤井九段の「四間飛車の急所」がとにかく参考になりました。
あれはすごい本だと思います。 C-bookに千田さんがすべての手に解説文つけて出版してくれたら全部解決
12,000円まで出す こっちの方がこのスレ的には大ニュース
Ryoto_Sawada@Qhapaq@Qhapaq_49
レーティングサイト。後継者募集中なら引き継ぎますよ(ただし私のdjango歴は一日ですが >>579
手の数が尋常じゃないからそんなことしたら1冊10万とかになりそう
そもそも解説付け終わる前に定跡事情がそこそこ変わりそうかな、NNUE出てきたし >>580
澤田さんなら色々面白い機能つけてくれそうだし安心だ >>580
Qhapaqさんなら引き継ぐにふさわしいと思いますね
何か新しい要素も付け加えてくれるかも知れませんし >>571
おつかれさまです。試してみます。
SSE4.2版もいただけると助かります、 godwhale_child-NNUE-whale7_Ditto3 の SSE4.2版です
https://1.bitsend.jp/download/c1c174889eeec634c60a78e12d34b16a.html
engine_options.txt は入っていないので、注意してください 訳の分からん調整したエンジンありがたがるアホって何なの?
実践から(検討)かけ離れた短時間に調整したり計測範囲で優位を出したいだけ
少し前のキメラと同じでろくに検証もしない物を適当な使い方でありがたがるアホ多すぎ >>588
有り難がると言うより、作者が検証しきれない点も検証されるから、興味のある人には公開は良いんじゃないかな
興味ないなら無視すれば良いのだし
できが悪いと思うのなら自ら検証すれば良いだけ >>588
訳のわかる調整と訳のわからない調整の違いがイマイチわからないが 今のソフトからコマ割りの値を算出する方法ってある?
NNUEになってからどうなったか見てみたいんだけど
できれば局面Aの評価値と局面Bの評価値の比較みたいな感じで出せるとより嬉しい 評価値を元にコマ割りだけでパラメータ調整するとかかな
コマ割りだけでの評価関数を作るって感じで
こういうのじゃない? ■ このスレッドは過去ログ倉庫に格納されています