▲コンピュータ将棋スレッド141
レス数が1000を超えています。これ以上書き込みはできません。
948 名前:名無し名人 (ワッチョイ cf9f-10BI)[sage] 投稿日:2018/08/06(月) 23:43:43.82 ID:6HN23Pbb0
NNUEkai4をアップロードします
https://www.axfc.net/u/3927181
今回は、前回の反省を踏まえ、対illqha1.1に対して、1500万ノード、投了値3000、引き分け256手の設定で1500局対局しました
https://i.imgur.com/MlE6VFf.jpg
https://i.imgur.com/CkaNqbL.jpg
勝率は53.5%とほとんど強くなっておらず、透。さんなどと比べると残念な結果ですが、
有意確率0.2なので流石に有意差はあるのではないかと思ってます
上記評価関数には500局分の棋譜も添付しました
お暇な方はまた遊んでください >>2
私の1050回の対戦結果では対illqha1.1に対して負けてしまいました。
https://i.imgur.com/I5SXcwZ.png
1028局 545勝 483敗
勝率: 0.5301556420233463
標準誤差: 0.015577552550149339
95% 信頼区間 [0.5, 0.5603112840466926]
相対イロレーティング: 20.97974861005213
標準誤差: 10.863909119450144
95% 信頼区間 [0, 42.11361944473197]
対局は双方1秒設定
https://i.imgur.com/rAsCwGo.png
エンジン設定はillqhaの作者が作成したdolphin版です。
https://i.imgur.com/5BC2RQs.png
illqhaはGW3に設定しています。
https://i.imgur.com/CWp2a8v.png
https://i.imgur.com/DTXjeFp.png >>4
細かいことを言うようだが、kai4が公開されたのが月曜日の23:30で、あなたの結果公開が水曜日の7:00なので、公開から113400秒しか経過してないことになる
113400/1050=108となり、平均108手で決着が付いていることになるが、最近のコンピュータ将棋でそんなに早い決着は稀だと思うのだけど… >>5
ノード数が超少なければ決着もそれなりに早くなる いやいや、そもそも公開と同時にダウンロードなんてありえん
捏造の可能性あるで >>4 の人みたいに一手ノード数3万とNNUEkaiの人の1500万ノードじゃ逆の結果になっても別に不思議ではない
ノード数が300万違うと勝率は大分変動する 人はなぜNetworkDelayやMinumumThinkingTimeをそのままで1秒設定するのだろうか 開発者向けのビルドは全部0秒デフォルトにすればいいのにね kai4とillqhaを500局程テスト対局させて見ました
一手1秒なのでノード数が多少低いですが参考まで
kai4+dolphinとillqha1.1+dolphin
202-73-225(ノード5〜600万)
kai4+やね4.82とillqha1.1+dolphin
187-58-255 (ノード4〜500万) 初手のノード数が1500万からのロタ氏計測ではillqha1.1-dolphinはQQR-GW5.0.5に勝率52%と
あまり勝てないが、初手のノード数が1800万からの自分や他の人(前スレ他で3人いた)の計測によると
勝率65%程度だったので、数万ノードと1500万ノードの計測だと逆の結果になっても全然ふしぎではないよ uuunさんや透。さんも言ってるけど、NNUEはノード数でころころ勝率かわるみたいね uuunuuunさんが前にツイートしてたけどスレッド数でも結構変わるっぽいよね mtmt
@mtmtlife
やねうら王1秒指しにボコボコにされる。 >>18
NNUEどうしの対戦なのでillqha1.1も同様に強くなる
その上kai4はi7-8700Kで5分持ち秒読み1手10秒で
GW5.0.5-QQR相手に5割位だがillqha1.1はQQRに6割
以上の戦績を残している 持ち時間12時間対決、時間かかりすぎ!
結果も、統計的に何も言えん!
10試合まであと3試合くらいかな、
面白棋譜ができて楽しんでくれると良いな。
お酒飲んでるからテンション高いんです〜〜〜〜〜
じゃあ、10試合終わったらまたよろしくね。 >>4は最たるもんだが、新参の諸君
NetworkDelayの1と2は間違いなく0にするのだ
特にNetworkDelay2のデフォルトは1120で1秒以上となっているので
1秒設定で対局をさせようとしても究極の早指しになってしまうだけだぞ! ライブラリ非使用者の優遇を検討されててライブラリ非使用者を少しでも救済したいっていう意図は分かるのだけど、
ライブラリ使用/非使用の判断って結局本人による申告で判断する事になるのだろうか?
それって結局開発者の性善説に基づいてるからそれはそれで賛否両論ありそうな。
そしてどこまでがライブラリ使用/非使用の境界となるのか。
ソース流用はライブラリ使用になりそうだけど、文献参照とかソースコードを見て真似たとかは
ライブラリ使用の範囲になるのか否か。
結局そういうのって明確な線引き自体が難しいように思えてならないな MyShogiビルドしてみた。当然リソースもエンジンも無いので触りだけ
起動すると画面いっぱいに真っ黒な画面、赤いバツ印。ああ…リソースがないんだなと。少し寂しい気持ちになる。
しかしめげずに通常対局を選んでみる。対局条件を設定していざ対局!…またもや災難、『例外が発生しました』の文字。
なんてことだ…だが俺は負けない。次は検討モード…GUIソフトなら必ずチェックしたい所。『例外が発生しました…』
そうか。MyShogiがしっかりしてると将棋神やねうら王が売れないんだ。俺はようやくやねさんの意図に気付く。
8月31日の発売日まであと22日、スレは大いに盛り上がるだろう、更に発売後のアップデートも用意している筈。
その売上をしっかり確保するためには後2ヶ月ぐらいは必要ということ。つまりそれまでずっと黒い画面のままなのだろう。 MyShogiの素材だけでも先にアップしてくれと
やねさんにお願いしてみては? 探索深さやノート数を固定する場合、
メモリの多少は強さに影響しますか? ロタ氏がノード数を変えて計測されていたが(以下がその計測結果)、このスレでも200万ノード以下で計測した結果の
書き込みをよく見かけるけど、結果を見ると低ノード数の計測はあてにならないのが分かる
以下 illqha1.1_dolphin vs QQR GW5.0.5による計測
一手0.1秒(18T) 150-200万ノード 総試合数500 245-17-238, 勝率50.70%, R+4.86
一手2秒(18T) 3000-4000万ノード 総試合数312 179- 7 -126, 勝率58.49%, R+59.60 30億から40億ノードでやったらまた変わるかもしれないじゃないか
きりがないけど NNUEkai4を試していただいている方、ありがとうございます
現在はkai5に向けて試行中です
評価関数はおそらく徐々に強くなっており、対QQRにR+100も夢ではないかもしれません
https://i.imgur.com/rWuaLkM.jpg
1手1秒(1500万ノード〜2000万ノード)、256手引き分け、投了値3000で対局しています
https://www.axfc.net/u/3927830
↑棋譜ファイルです >>36
じゃあ200万ノード以下で計測したらいいじゃん、その代わり計測結果をこのスレに書き込んでも誰もあてにしないけど
それから一手40億ノードとかキリがない話をしても意味ないんじゃないの、3000-4000万ノードだと普段使うことも多いので
そっちの話よりよっぽど現実的な話じゃん >>38
当てにならないとかいうから
じゃあ1000万のオーダーなら当てになるのかという反論やろ
お分かり? 測定時のノード数は難しい 物ですが測定サイトの1500万は一般的なPCの能力を考えると現時点ではよい感じと思いますね
で、先にも書き込ましたが1手約5〜600マンノードで対局させたkai4とillqha1.1を約2500〜3000万ノードで対局させています
途中経過はkai4から見て
43(47%)-14‐47(52%)
です。先の対局は
202(47%)-73-225(52%)
で対GW-QQRも少しやってみたのですが、kai4から見て
204(66%)-22-104(33%) ノード数5〜600万
246(51%)-26-228(48%) ノード数2〜300万
すべて定跡はオフです
対GW-QQRあたりの結果を見るとノード数の影響はある感じはします MyShogiのメニュー一覧
サルでも使えるほどシンプルではない
https://i.imgur.com/piBavNn.png >>37
期待して待ってます
でもillqha1.1も環境によってはQQR相手に勝率65%近く出るみたい
illqhaの人も今週中に新しいの投下するらしい
楽しみぃ〜 >>30
ちげーよ。次のコンピュータ将棋選手権に向けての話だ >>23
>おまけに、今回の『将棋神やねうら王』では、GUIすらもオープンソース化しています。
やねうら王のソースコードってApery、技巧、読み太その他多数の強豪ソフトと違って
トップ部分にstockfish系列のGPL宣言からstockfish不使用だと思っていたんだけど、
商用化するためにはGUIのソースコードも公開しなければいけないのかな >>45
なるほど、さすがやねさんだ
どうもありがとう >>41
てんこ盛りになって面倒なパターンだな
シンプルモードとマニアモードみたいにメニューバー切り替えさせないと情弱は飽きてしまいそう ところでsuimonさんが質問を投稿したこの方も開発者の方ですか?
2年間粘着がどうとか
suimon@floodgate_fan
https://youtu.be/Kcy3ziIZH7s ローソンあきこはponaやな
調整してあるらしいが基本的に勝たせる気ない 最新ソフトが0.1秒で九段相当というやねうら氏の発言が正しいかどうか調べてみた。
NNUE kai4- whale6をノード315000に固定し、相手は技巧2depth13
結果
NNUE kai4の65勝32敗3分
ちなみにの技巧2depth13の24推定レートは3479らしいのでレーティングでは九段相当はありそう。 そりゃ今年の電王トーナメントの開催も危ぶまれるわけだ^^; 日本将棋連盟は棋士の先生方が将棋ソフトを利用して棋力向上に役立って恩恵を受けているはすなので、
恐らく資金問題で開催が危ぶまれるドワンゴがSDT開催できるように資金をもっと援助してあげてほしい TCEC 13は4部リーグ全28回戦が終了して、優勝が14勝2敗12分のLeelaChessZero、
2位が13勝4敗11分のDeusXで、NN勢2エンジンが3部昇格
ただ、3位のWaspも11勝3敗14分で2位とは0.5点差と、そこまで差はなかった。 >>54
激指14と対戦させたが普通に激指が負けた
24の5段レベルじゃないわ 持ち時間12時間対決を
10試合行ったよ。
面白い棋譜かどうかも良く分からないし、多分もうやんないと思う。
興味があったらダウンロードしてみてね。
https://www.axfc.net/u/3928210 >>60
腐っても鯛というからaperypaqぐらいの強さはあるだろう >>58
藤井七段他多くの棋士がソフトで対局して棋力向上に役立てている
棋士より強いソフトの登場で、棋士の出番がなくなったのも事実
将棋連盟の棋士先生に聞くよりも、ポケットに入っているスマホに聞いたほうが優れた答えが出るようになったw
連盟の棋士先生がやるとしたら解説になる
解説をして貫禄があることを示す >>56
スマホを使用して棋士とエンジンが組んでペア対局を
実施してネット中継したら視聴者が増えると思う
棋士が好みのエンジンを選択できるようにしたら
フリーの強豪エンジンが注目されるかも
プロ棋士は自尊心が高いからどれだけエンジンの
推奨する手を採用するか興味深い *2016-10-11_新人王戦決勝第2局 増田康宏_四段_vs_石田直裕_四段
*例の「ソフトの詰め課題局面」をillqha2でテスト
後手の持駒:角 金 銀 歩
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・ ・ ・ ・ ・ ・ ・ 杏|一
| ・v玉v金 ・ ・ ・ ・ ・ ・|二
| ・v銀v桂 馬 ・v歩 とv歩 ・|三
|v歩v歩v歩v歩v歩 ・ ・ ・ ・|四
| ・ ・ ・ ・ ・ ・ ・ 歩 ・|五
| 歩 歩 歩 歩 ・ ・ ・v龍 ・|六
| ・ 銀 桂 ・ ・ 玉 ・ ・ ・|七
| ・ ・ ・ ・ 歩 ・ ・ ・ ・|八
| 香 ・ ・ ・ ・ ・ ・ ・ ・|九
+---------------------------+
先手の持駒:飛 金二 銀 桂二 香 歩三
先手:増田康宏 四段
後手:石田直裕 四段
手数=104 △2六飛成 まで
低スペック(32ビット、4ギガ、1スレ)PCで
YaneuraOu-NNUE_V482+illqha2で検討。
2分ちょいでmate33!!
詰みを読みました!
感動!
*illqha1.1では10分でも詰まなかった
illqha2ありがとうございました。 >『dolphin+illqha1.1』より少しだけ強くできたかなと思います。(超短時間ではillqha1.1に対して勝率56%、短時間では勝率54%程度でした、それ以上の時間でもおそらく負け越すことはないと推測します)
>基本的に短時間での計測しかしていないので中〜長時間での強さは謎です。
>対局における各評価関数との相性問題なども謎です。(少しのノード数の差で相性がころころ変わるようなので、あまり神経質に計測しても結局よくわからないということで気にしすぎない方向でいきます)
>Ryzen7 1700のPC1台(と少しだけ低スペノートPC)で作業しているので中々強くなりませんが、ちょっとずつ強くするので気長にお待ち下さい。 めきっと@鵺日々成長中@_illqha
https://drive.google.com/file/d/18lWusgxNdG1vXbY6GzXRHhA41pZovOtM/view
dolphin2+illqha2を公開します。
少ししか強くなっていないと思いますが、そこは許して頂けると幸いです。
今回は計測作業の一部を「ぷよ太郎@yorikone」さんに手伝って頂けました。ありがとうございます。
めきっと@鵺日々成長中@_illqha
透。さんのシリーズやなんとかちゃんねるのkaiシリーズの成長速度と張り合っていくのはかなりしんどいですが、頑張ります。
次回の公開まではかなり時間が空いてしまうと思われますが、ご了承ください
ツイッター見てない人がいるかもしれないから貼っときましょう dolphin/NNUEkai4 vs dolphin2/illqha2
46勝45敗9引き分け
持ち時間0、秒読み2秒 >>73
すまん、訂正
dolphin2/illqha2からみて、46勝45敗9引き分け >>74
CPU i3-6100、MEM:8GBの貧環境 ノード数少ないし対局数も少ないしでよくわからんけどイルカ2のほうが強いんだろうか >>77
対 dolphin/illqha1.1 なら対局数80くらいで打ち切ったけど、イルカ2の勝率58%くらいだった
只今イルカ2とGW5/QQRが対戦中だけど、今のペースだとイルカ2の勝率60%強と予想
ノード数はShogiGUIの表示を見ている限り、最大でも150万くらいかな >>78
数百局やっても勝率58%だったらもしかしたらかなり強くなってるのかもな >>71
スレ違いです。
自分のスレに貼ってくださいよ、suimonさん。
suimon_feat.anti_suimon応援スレッド17
https://mevius.5ch.net/test/read.cgi/bgame/1533862279/ >>79
公開はしていない、親しい人にだけ検証してもらう目的で渡しいるけど、透のブログでillqha1.1-dolphinに勝率64%って自慢していたやつも
uuunuuun氏の計測では透が渡したものが結局illqha1.1-dolphinに負け越していて弱かった、前から同じことの繰り返しでブログ記事はあてにならい NNUEkaiの人みたいにさっさと公開しちゃうのが一番手っ取り早い
キメラもできないから公開しても電王トーナメントへの影響は少ない 透の評価関数を付き合いで検証してあげているuuunuuunさんも気の毒だな
勝率64%って渡されたものが負け越すんだからがっかりするだろ >>71
右ミレニアム囲いとか昔からあるやん
ググれカス suimonさんが見つけた形は全て最新なのだけれど、ブログに書くかどうか 評価関数単体だとNNUEkai4とどっちが強いのか気になる
最近はエンジンは強さよりも相性が重視されるから公平な計測条件が難しいけど suimon関連の話題をこのスレでやり出したら、クエスト2分,アマ県棋戦,出版本の売れ具合,
他の指し手研究類似者とのTwitterでのやり取りがどうだとか、一般の将棋ソフト愛好家からしたら
どうでもいい話題なので本スレでやってくれ >>88
今、探索部をdolphin2に固定して、NNUEkai4とillqha2を対局させているけど、
対局数59 NNUEkai4が32勝(59%)、illqha2が22勝(40%)、引き分け5 となっている。
うちの貧環境では、NNUEkai4 が最強といえるかも。 もう何日かして対局数とかノード数がまともな計測結果がいくつか出てこないとなんとも言えないよな とりあえず速報値が知りたかったから
1手100万ノード固定で300局計測、探索はGW6で固定
NNUE-kai4 145-6-149 illqha2
完全に互角、有意差を出すのは現実的な対局数では無理っぽい ロタ @Rota_JP
【結果から得られた考察】
1手0.1秒→150-200万ノード レート測定に不適 解像度が低い
1手0.5秒→750-1000万ノード 一定の勝率測定能あり
1手1秒→1500-2000万ノード uuunuuunさんサイト測定基準
1手2秒→3000-4000万ノード 時間を2倍にしても勝率に大きな変動はなし
https://twitter.com/Rota_JP/status/1027149612761505792
最低1000万ノードは必要
https://twitter.com/5chan_nel (5ch newer account) 探索エンジンの違いで勝率が変わると評価値の良さが
分からなくなるので制限を設けて計測することにした。
途中経過は以下の通り。
まだ10局なので断言するのは早計かもしれないが、Kai4
よりillqha2の方が評価値としてノードリミット100万なら優れてそうです。
https://i.imgur.com/xOJzWEj.png なんとなくエンジンとセットだからイルカにしようかなってなるわ elmo以降、数百万程度の低ノード測定は不正確で、1500万以上は必須というのが定説だったと思うが、何故みんなあえて低ノード?
nnueだと低ノードでも信頼性があったりするの? 低ノードと高ノードで勝率に差が出てくるのは分かってるけど、
高ノードの結果の方が正解で、低ノードの結果は不正確って認識はなかったな >>100
さすがに深く読ませた同士の結果のほうが信頼性高いのでは? 低ノードだと金沢将棋'98がelmoに勝つこともある あるレギュレーションでの強さは、その条件で測定しなきゃわからん
高ノードだから正しいわけではない
そもそも正確性や信頼性ってなんだよってとこからの話になる ノード数が増えればRが上がることはわかってるんだから、指し手の精度はより高いのでは?
検討時に低スペで1秒しか読ませないなんてことはないしそこそこ多いノード数での計測を信用したいけどな >>104
高ノードで強くなるけど、問題は各ソフト毎にその曲線が異なるってことでしょ
あとはノード毎に出やすい戦型があれば、それによって相性問題が生じる可能性もある >>105本当はせめて3種類くらいのノード数でそれぞれ対局させたほうがいいんだろうけどね、計測班がキツすぎるわな 評価関数だけで比べたら、大樹の枝と最新ソフト比べたらどれくらいR上がってるの? ノード数とかレートもいいけど、ソフトには解けないって言われてた詰将棋がイルカ2ならそれなりに解けるようになってたりしないのかな
さすがに長手数は無理だろうから50手くらいまでで 出先なんでurlでカンベン
ttp://www.ne.jp/asahi/tetsu/toybox/challenge/c1044.htm
こんなのはどうかな? >>109
成らずとか特殊な作為のは簡単なのでも解けない様な >>111
今試してみたけどmateでも詰むので、連続王手の筋を読まないみたいだな 詰将棋用じゃないからより短手数で勝てるならそっちを選ぶのは自然 特殊なのはさすがにだめか
特殊じゃないやつで難しい長手数ってどこに行けばあるんだろうか >>117
局面によっては正しく評価値が出ないから >>119
そんなの言い出したらコンピュータ将棋なんて意味ないじゃん 特定の局面が頻出するなら、それは結局レートにも反映されるわけだし、
そういうの気にし出したら切りないからなあ
もちろん興味として、そういう特殊な状況が気になるのは理解できる NNUEが万能にどんな局面でも評価できるようになるのか気になるんだよね
ttp://www.ne.jp/asahi/tetsu/toybox/challenge/c3005a.htm
持ち駒多いと3駒では厳しそうだけどどうだろう 万能にどんな局面でも評価できるか?無理に決まってるでしょ
枝刈りしなけりゃどんな評価関数だろうが詰ますし、
運悪く枝刈りに引っかかれば詰ませられない、そんだけだ
個々の局面評価を見てソフトの特徴を推し量ろうなんてどだい無理な話 昔はまず無理と言われてたことがどんどん実現してるから、どんな局面でもとはいかなくてもよっぽど変な局面以外は評価できるようになるんじゃないかと思うんだけど 詰みがある局面はGUIのアシスタント機能+詰将棋ソフトに任せておきましょう 何回も言われているが
一番重要なのは対局数だからな
1000万ノードで50局しか計測出来ないなら
100万ノードに減らして500局計測した方が意味のあるデータになる テスト対局させてみました
1秒対局なのでノード数が少なめですが参考までに
定跡はオフです
illqha2+dolphin2とillqha1.1+dolphin
227-66-207 (ノード5〜600万)
illqha2+dolphin2とGW-QQR
288-18-194 (ノード4〜500万)
次はdolphin2固定で、illqha1.1やkai4と対局させてみます >>96
> 探索エンジンの違いで勝率が変わると評価値の良さが
> 分からなくなるので制限を設けて計測することにした。
> 途中経過は以下の通り。
> まだ10局なので断言するのは早計かもしれないが、Kai4
> よりillqha2の方が評価値としてノードリミット100万なら優れてそうです。
>
> https://i.imgur.com/xOJzWEj.png
もうやめようと思うが一応まで途中経過報告になります。
Kai4より若干強いかなといった感じです。
https://i.imgur.com/6b4cabC.png
対局数104
Kai4 GW3 L10^6 47勝
illqha2 GW3 L10^6 53勝
引き分け 4
=========================
illqha2からみたレイティング差は20ぐらい
100局 53勝 47敗
勝率: 0.53
標準誤差: 0.050288507734394784
95% 信頼区間 [0.43, 0.62]
相対イロレーティング: 20.87120466602866
標準誤差: 35.070287293772225
95% 信頼区間 [-48.96256003716197, 85.04323715257749] 今度はGW5.0.5 QQRとの対戦を開始しました。
同様にノードリミット100万で対戦するように設定しました。
まだ10局程度ですがKai4との対戦では見られなかった
逆転勝ちが早くも生じています。
60勝40敗ペースを達成しそうですね。
https://i.imgur.com/cRkZ0s0.png NPSかわるしノード固定よりも秒数固定のほうがいい
ヒトが検討するのにも研究するのにも長時間かけるし、コンピューター将棋の大会にしても一手に4000万ノード程度はかけてる
100万ノードの結果貼ってると開発者が失笑する Core i9-9900Kが10月1日って噂
メインストリームも16スレッドになるな。NNUEだとRYZEN2よりNPS出そう。 対局数が最優先
ノード数を増やして結果が変わるかどうかは調べたい奴が調べればいい
もちろん最低300局な フラゲ見てる限り2は長時間は1.1より微妙そうに見える ThreadRipper32コア64スレッド本日発売
25万くらい 相雁木が千日手という結論は個人的には違うのではないかと考えています(キリッ
じゃあお前先手から上手く打開してみろと。 uuunuuunさんは最近自分では計測しない
Rotaさん頼みだけど、対illqha1.1しか計測してない(+有意差出てない)から
さらなるRotaさんの計測結果待ちでしょう 別アカウントで千田さんに絡むことしかしてないあの人も廃スペPC回して計測したら色んな人から尊敬されるのにね なんか他との対局はせずに大体こんな感じですってくらいで終わる空気なのかと思ってしまったわ
ハイスペPC持ってれば計測手伝うんだけどなあ 低スペックPCで計測しているけど、
最低ノード数がどうのこうのいう輩がいるので
恥ずかしくて結果を晒す気がしない 低スペでも時間かけて計測すれば問題なし
10人集まればハイスペにもまさるぞ ノード数は多いほうが価値があるとは思うけど、対局数さえある程度多ければ充分に立派なデータだと思う >>145 >>146
ありがとう。
これまでの計測結果はもう捨ててしまったので、今後がんばる エンジンをdolphin2に固定して対局させてみました
定跡はオフです
illqha2+dolphin2とillqha1.1+dolphin2
203-66-231(ノード5〜600万)
illqha2+dolphin2とkai4+dolphin2
220-49-231(ノード4〜500万)
illqha1.1+dolphin2の組み合わせが意外と良い結果でした
次はillqha1.1+dolphin2をkai4+dolphin2及びGW+QQRと対局させてみます >>142
千田ショーがキレてるのはsuimon=suiseihuman
PVパクってるだけだから出力しないようにすればいいよ
Incineratorのひともキレてたし追放でいいでしょ 千田に絡んでたのはantisuimonだろう。つまり同一人物
複垢での粘着攻撃だし将棋ソフト開発者界隈もなんか対策できないかな? 低スペPCだけど、計測について教えてください。
指し手2秒で1000局(ピーク時ノード数で160万くらい)と、
指し手5秒で400局(ピーク時ノード数750万くらい)では、
どちらに意味があると思いますか?
指し手10秒だと200局(ピーク時ノード数は軽く1000万を超えると思うけど)はやる気は全く起こらない。 自分も400できるなら5秒で
100と40なら前者 >>152 >>553
ありがとう。
最低でも100は対局させるけど、
大まかな目安で以下の条件を満たしたら、
時間の無駄だと思うから対局を打ち切ることにしている
対局数 勝数
100 66以上
200 123以上
300 178以上
400 232以上
500 266以上
:
今は指し手2秒と5秒の結果の違いを調べるために対局させているけど、
結果が大して変わらないのなら、「あくまでも自分の環境」では、
指し手2秒で十分という判断を下すかも。 >>154
すまん。553ではなく、>>153だった。m(_ _;)m >>154
さらに訂正
誤:500 266以上
正:500 286以上
重ね重ねスマン。m(_ _;)m 100局以上で明らかな有意差があるなら打ち切ってもいいよね
他との対局数を揃えたいとかじゃなければ >>157
信頼区間95%で最低勝率が0.5以上が一般的らしいけど(当方は統計学に無知w)
自分は信頼区間99.99%で最低勝率が0.5以上の勝数で判断してる。
ソフトの相性とか、ノード数とかも関係するかもしれんけど、
当方は自分のPC環境で最も強いソフトを探すのが目的で、
計測すること自体が目的ではないので、これでいいのだw >>130
> 今度はGW5.0.5 QQRとの対戦を開始しました。
> 同様にノードリミット100万で対戦するように設定しました。
>
> まだ10局程度ですがKai4との対戦では見られなかった
> 逆転勝ちが早くも生じています。
> 60勝40敗ペースを達成しそうですね。
>
> https://i.imgur.com/cRkZ0s0.png
もうやめようかなと思うけど再び
マイナス評価からの逆転パターンが生じてました。
https://i.imgur.com/ur7qSFm.png
247局 142勝 105敗
勝率: 0.5748987854251012
標準誤差: 0.03155121733698077
95% 信頼区間 [0.5141700404858299, 0.6356275303643725]
相対イロレーティング: 52.439618125247335
標準誤差: 22.427284170889855
95% 信頼区間 [9.848989963332782, 96.66285718796355] >>158
早期打ち切りの判断は厳しめでいいと思う >>158
すまん。また訂正
誤:99.99%
正:99.9%
m(_ _;)m。 切り捨て目的ならともかく
欲しい結論に対してのデータなら、途中打切りはありえない >>162
切り捨て目的ってなんですか?おっしゃる意味がわからない。
自分の欲しい結論とは、自分のPC環境で最強のソフトが知りたい。
だから最大で1000局を目標としていても、途中で統計的に有意な差が出たら、
その時点で対局を打ち切る。
何が問題ですか? >>163
途中で打ち切るってことは多重検定してるのに近いから >>164
ごめん。多重検定とか意味わからないので、もうちょっと詳しく説明してくれるとありがたいです。
では、最初から対局数を例えば100とか、500とか決めてその対局数を完遂した結果で判断すれば
問題ないことですか?
対局数を1000と決めて、途中の100とか500で有意差が出たら、そこで打ち切るのとどう違うのかよくわかりません。
例えば、途中で100とか500で打ち切ったとしても、それが最初から100とか500とか決めていたのと、どう違うのですか?
無知で申し訳ないけど。 >>165 ごめん。書き間違い。
誤:例えば、途中で100とか500で打ち切ったとしても、
正:例えば、対局数を1000と決めていたとして、途中で100とか500で打ち切ったとしても、
m(_ _;)m >>164
では、もうひとつお尋ねします。
>自分の欲しい結論とは、自分のPC環境で最強のソフトが知りたい。
どういう対局をすれば、「統計的に」私の求める結果が得られますか?
指し手2秒、対局数1000でも自分の環境では重すぎる検証です。 はぁ、ShogiGUIに保存してた棋譜バグってて使い物にならなくなっててワロタ... 横レスだけど、こういう事じゃない?
http://www.igaku-shoin.co.jp/paperDetail.do?id=PA02941_06
途中で気に入った結果が出たところで打ち切ったデータ群を、いくつも収集する
って事になるなら、5%の間違いがあるデータを効率的に集めてしまう事になる
ので注意が必要。 >>171
ありがとうございます。
リンクを熟読しましたが、統計学に無知な私にはほとんど理解できませんでした。
自分の検証で言えることは、対局するどちらのソフトにも肩入れしないこと、
信頼区間99.9%の有意差で打ち切りを判断していることです。
1000局対戦しても統計的な有意差が出ない場合は、
単純に勝数の多さ(プラマイ13〜14%ぐらい?)という主観的な判断になります。 学習棋譜の質に直結するから
低ノードでの正確な棋力は今では超重要情報だぞ
短時間で強いソフトを喉から手が出るほど欲しい層が存在する >>172
あ、
>プラマイ13〜14%ぐらい?
というのは変ですね。m(_ _;)m 藤井七段の振り駒の後手番の多さは統計学的には有意に多そうだからな
先後が決まっている順位戦入れてもかなり後手が多いくらいだから >>159
とりあえずQQRとの相対レーティング差が判明しそうな雰囲気になってきたので
今晩まで続けることにしました。
https://i.imgur.com/q5e2fO2.png
339局 202勝 137敗 引き分け6 (対局数から取り除く)
勝率: 0.5958702064896755
標準誤差: 0.026711567948078614
99.9% 信頼区間 [0.5073746312684366, 0.6814159292035398]
相対イロレーティング: 67.45232091608678
標準誤差: 19.269530974741368
99.9% 信頼区間 [5.124790303986275, 132.0752897620778] ふと思ったが、
バイナリを配布するなら、NetworkDelayの初期値は0にした方がいいと思う >>165
有意差ってのは確率的にしか判定できない
5%とか1%とかは、差がなくても差があると判定されてしまう
仮に有意水準95%で10回同じ検定を繰り返せば、40%は差があると判定されてしまう
打切りって手法の場合は、前の結果を引き継いでいくからそこまでの影響はないだろうけど(99.9%ならなおさら)、
「統計的には有意水準◯◯%です」ってのは間違ってるので、得られた結論は統計的な後ろ盾が得られない
統計に基づいた有意差あるデータが欲しいなら、それこそ有意水準甘くして、試行回数も数百回くらいに落とせばいいんでは? 論文に使うデータでもあるまいし、200局以上で有意水準99.9%を軽く超えてるようなものは打ち切っても構わないと思うが ちゃんとしたレート差を知りたいのか、それともレーティングが少しでも上かどうかを知りたいだけなのかで
必要な対戦数は全然違う >>170
他の棋譜ソフトは?
テキストで見るとどうなってる? 両方dolphin,illqha1.1-kai4だと互角で両方dolphin2,illqha2-kai4だとkai4のほうが強いらしい
1500万と3000万で200局の合計400局 kai4側が55% ロタさんはGW+QQRとdolphin2+illqha2の計測はやらないのかな
結構ロタさんの計測いつも楽しみにしてるんだけど スレの流れ変えるけど
https://i.imgur.com/tAJ3XuM.jpg
MyShogiにこれに近い機能搭載できないかな?
例えば棋譜のフォルダを指定すると解析してこのような感じに表示する(指された手の割合などもあると尚いい)
使い道として、
・24などで自分の棋力に近い人の棋譜を集めて定跡の末端局面でどのように指すかを調べ研究に活かす
・大会で当たる対戦相手の棋譜をぶちこんで人対策
製品版限定でもいいから搭載してくれたら将棋神やねうら王買います 話を戻すけど、相性問題があるからやはり複数とやらないと正確なレートが出せんな >>186
やねさんはまともな意見だったら結構実現させてくれるイメージあるから直接お願いしてみたら? シャイだから直接お願いするのは照れるv(*^-^*)v
誰か、いい考えだと思ったら代わりにお願いしてきてくれ! illqha2とkai4がほぼ互角くらいのレートだとするとやっぱり開発環境の差でkaiシリーズのほうが有利なのかな
illqha3が出る頃にはkai6が出てそうなペースだし >>190
kai5強くなってると作者の方の書き込みありましたね
ペーストしてはkaiのがペース早いですからね 貧弱環境でも健気に頑張るillqhaはすごいがそろそろ差がつき始めてもおかしくないわな やねさんは何とかちゃんねる見てるからね
iPhone版、音声認識対応も頼みますよ あとillqhaは色々公開してるのが不利っちゃ不利なのかな >>195
ソフト全体が強くなるように公開してくれているので illqhaはdolphin探索開発にも手を出してるから大変そう
kai4がレート高かったとしても劣るって事は全くない
2990WXがシネベン5000程度らしいので1950Xとの比較からnps算出すると7980xよりnps出そう 今のgithubに入ってるMyShogi
コンパイルの仕方わかってる人だったらもうこれ使えるの? スリッパもすごいけど来年5月には16コアのCPUが5万円弱で買えるという予想のほうがすごいよな このスレの住民でCore i9-7960X使いでfloodgate1位の人 7960Xってシネベン余裕で3000オーバーの化け物だよな、16コアの3800X(?)はどこまで迫れるか >>186
ShogiGUIの定跡機能で似たようなことできるよ >>203
棋譜上で表示してるか盤上で表示してるかの違いだと思うけど、
盤上のほうがパッと見わかりやすい。
編集は棋譜上のほうがやりやすいからできれば両方欲しいけどなー。 yaselmoの頃のように
SDT6ではkaiシリーズやillqhaよりも強い評価関数は
1〜2個だけという展開になったりして suiseihuman強いな
Dolphin6950Xに勝ってるな Dolphin6950Xに勝てる人間とか完全にニュータイプだろ これを正しく評価できたのが今のとこillqha2だけなんだが
後手の持駒:角二 金 銀 歩三
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香v桂v銀 ・ ・ ・ ・ ・v香|一
| ・ ・v玉 ・v金 と ・ ・ ・|二
| ・v歩v歩v歩v歩 ・ ・ ・v歩|三
|v歩 ・ ・ ・ ・ ・ ・ ・ ・|四
| ・ ・ ・ ・ ・ ・v歩 ・ ・|五
| 歩 ・ ・ ・ ・ ・ ・ ・ ・|六
| ・ 歩 桂 歩 歩vと ・ 飛 歩|七
| ・ ・ 玉 銀 ・ ・ 金 ・ ・|八
| 香 ・ ・ ・ ・ ・ ・ ・ 香|九
+---------------------------+
先手の持駒:飛 金 銀 桂二 歩
後手番 先手有利?って事なら別にQQRでもillqha1でも正しく評価するがそういう事ではなくて? みたいなもんだな
音楽そのものには興味なくて
機器の性能だけに関心がある レーティング測定で、1手何秒で固定とか、ノード数を固定したりするけど
持ち時間制にしたらどうなるか気になる。
というか、持ち時間10分切れたら1手10秒で測定してみてるけど、
時間かかっちゃって大変。 そらオーディオマニアにも音楽そのものが好きな人もいれば音響機器が好きな人もいる
楽器好きもいるしね 自分の場合、
将棋の棋士や、戦ってる姿が好きだったり、
コンピュータ将棋なら、同じように、開発者の考えとか人柄とかが好きですね。
将棋自体は超弱かったりするけども。 やっぱり探索部をdolphin2に統一すると、illqha と illqha2で差がないみたいね。 illqha1.1が異常なレベルでdolphin2と相性いいのかillqha2がそれほど強くないのかが気になるところ めきっとさん気にしてるけど弱いんじゃなくてillqha1.1が長時間向けなのかもしれない
どちらにせよ凄い強いんだから気にする事はないと思うけど 厳しい意見を言う人も多いから気にしてしまうんだろうなあ、かわいそうに ある特定のソフトにやや強いのが出来ても、相性問題で他のソフト全般に強くなるとは限らないので開発するのも大変だな 探索は強さではなく相性の時代だから調査が難しい。
色々な組み合わせを試してみないと何が最強かは判断出来ないね。 >>213
鉄オタなんてもっと細分化されているぞw テスト対局させてみました
定跡はオフです
illqha1.1+dolphin2とGW+QQR
293-22-185(ノード5〜600万)
illqha1.1+dolphin2とkai4+dolphin2
223-56-221(ノード4〜500万)
テストしたノード数だとdolphin2との相性はillqha1.1やkai4のほうが良いのかもしれません
次はノード数を少し上げてテスト対局させてみます illqhaの人はいつ頃、次出すなんて必要ないと思うんだ
気長にしこしこやって、これはだいぶ伸びたかもってなったら出してみたらいい
口だけで強いのできたって言ってるだけの人とは違うので、応援してます そういうモチベの保ち方なんだろ
俺らが口出しする事でもないと思う なんとなく締め切りないとやる気出ない気持ちはわからんでもない もう少し続けてみることにした・・・
https://i.imgur.com/JyO4Wlj.png
502局 299勝 203敗 11引き分け
勝率: 0.5956175298804781
標準誤差: 0.021937031308189702
99.9% 信頼区間 [0.5239043824701195, 0.6673306772908366]
相対イロレーティング: 67.2700601644867
標準誤差: 15.822035905833712
99.9% 信頼区間 [16.623139016648043, 120.93133435570473] やっぱりillqha2短時間だと普通に強いよな
偶然丁度1500万ノードらへんが苦手な仕上がりになっちゃったのかな 短時間で強いなら学習の棋譜作りに向いているから良いんじゃないかな NNUEの力ならひたすら根気よく振り飛車しか学習させなければめちゃくちゃ強い振り飛車評価関数ができるのかな? 飛車の位置が2八限定なのが居飛車
飛車の位置を3八〜8八まで6か所から選ぶのが振り飛車
つまり、少なくとも居飛車の6倍学習させないといけない。 対抗形になってからの中終盤はそれほど大きな違いはなくなってくるだろうし6倍はないんじゃないかな ハニーワッフルは名前がダサい
誰かかっこいい振り飛車ソフト作って 振り飛車のBURRは序盤から評価値が悪いな、やはりソフト間では振り飛車は勝率が低くなる
居飛車が王道なのをBURRが証明してくれている >>246
最序盤はそうだね。
ただ、展開によっては振り飛車いける展開になるときもあるし、明らかにダメパターンもあるね。
ダイレクト向かい飛車とかもやっててまだ可能性があるんだなと でも中盤の評価値をみると結構振り飛車側を良く評価しててそのまま勝ったりしてるから、うまく学習すれば強いのかも? ただし人間同士ではソフトほど深く読まないし、悪手疑問手も普通に指すのでソフトほど差が付かないから
振り飛車も十分戦えるのは間違いない そうだね
プロ間で振り飛車がなくなることはないだろう suimon=名無し名人 (スップ Sd8a-bhxm) NNなら居飛車も振り飛車も強い評価関数は可能そうだよな >>253
可能に思える
結局、明らかにダメな序盤を取り除けば決勝ラウンドには振り飛車党ソフトでもいけそう
その前に将棋電王トーナメントがあるかどうかだが 現在入手出来る最強の振り飛車評価関数はtttakさんのnn_furibisha2(R4118) だと思うが
R4118はあくまでロタ氏計測QQR-GW505との対局だけの勝率からレート換算したもので、
この評価関数は定跡なしでも9割方あらゆる場所に飛車を振るので振り飛車党の練習には良いかも 気のせいかも知れないけどillqha2やNNUEkai4の序盤を見ていると矢倉が多くなり雁木が減った気がする godwhale_child5.05のNNUE評価関数版をベースに
NPSを落とさずDitto化する事に成功したので投下
https://i.imgur.com/9xvh4io.jpg
https://1.bitsend.jp/download/bf8c56350f3c25bd3948dbb51161dcfb.html
やねうら王の最新の変更も取り込んでいるから
エンジンと同じフォルダにengine_options.txtを置けば設定をまとめて適用できるようになってる
NPSは殆ど落ちないから、良さげなパラメータがあったらengine_options.txtだけ入れ替えればOK
Dolphin2のパラメータを再現できるengine_options.txtも同梱済み
上記の測定結果は付属のengine_options.txtを適用した状態での計測
NPSを落とさせない都合上設定項目が少し減っていて
NNUE-whaleのバージョンの選択肢が3,6,7だけで0は選べなくなっているので注意
7は超短時間でほんのり強いかな?程度で有意差までは出し切れていないので
検討用途なら実績のある6か3が無難かと
一番上のスクショは一応NNUE-whale7に設定しての対局結果 NNUEkai5作成中です
現在、illqha2に対して300戦(1500万ノード、両者dolphin)で
157-18-125(勝率55%、有意確率2.5)となっています
https://i.imgur.com/NiMDkRT.jpg
QQR/GWにkai5/dolphin2で挑んで、いい感じであれば公開します >>258 + >>260の組み合わせが最強になるかもしれないなこれは また、課題局面の結論が変わるのか
ソフトに踊らされるだけとも言えるな まあ先手よし後手よしとかはソフトがない時代でも研究で変わるものだったしそういうもんでしょ 結局、自分が強くないと、そして自分の中での判断基準がないとイタチごっこなだけだな
増田みたいにelmoで貫き通すのも1つの考え方だけど
俺は彼のように天才ではないからやはりソフトは差し替えるが >>257
俺も走らせてて同じ事を思った
矢倉多いよな? ShogiGUI使ってて思ったんだけど一回勝ち負け決まるまで対局したやつはちゃんと保存出来るのに
本とかの定跡の変化をちょっとなぞったりしたのはちゃんと保存されないんだけどなんか使い方間違えてる? FUTILITY_AT_PARENT_NODE_GAMMA2 の値が 157 になっているのは
編集漏れですかね?
(dolphin2 は 150) >>257
銀櫓から千日手模様を雁木に組み替えて打開した奴を見た。
銀櫓が良さげに思えた。 >>260
見切りでいいから公開して欲しいよ。
まずはillqha2に大幅に勝ち越したんならそれを確認したい。
勝率55%なら決定的な差だと思う。 >>262
結論が変わっているというより
曖昧だった部分がドンドンドンドン結論が出て
ドンドンドンドン限定的になっている感じなんだよな ああ、なんかShogiGUI意味わかんなくなってるな
もう棋譜保存しても5手目で途切れてるじゃん...
一回アンインストールするべき ああ、なんかShogiGUI意味わかんなくなってるな
もう棋譜保存しても5手目で途切れてるじゃん...
一回アンインストールするべき? ノード数100万で探索エンジンをGW3でやったら圧倒的に
illqha2の優位だった・・・
https://i.imgur.com/XwkzlUU.png
これから仕事だけど探索エンジンをdolphin2に変えて再度
試行してみる。 今日明日くらいにはkai5公開されるみたいだしこのタイミングでkai4の計測はどうなの QQR/GWに対して250局で勝率62%(一手1秒32T、有意確率0.0)でした
https://i.imgur.com/YpvXV7A.jpg
NNUEkai5をアップします(対QQRの棋譜250局が添付されています)
https://www.axfc.net/u/3929870
今回のkai5の主な修正点は、序盤の差し回しです。例えば、後手横歩を回避するようになったので、QQRの青野流(勇気流)を受けなくなりました
floodgateにも流しているので興味があれば対局お願いします
また、QQRに対する勝率も上がってきたので、ツイッターを始める準備もしようかと思っています >>279
ありがとうございます。いつも楽しみにしています。 >>279
超強そう、ありがとうございます
でもillqha1.1も1800万ノードとかだと65%だったらしいし実はそんなにレート離れてなかったりするのかな >>279
一手1秒というのは強さを比べる上で十分な長さなんでしょうか? 強さを比べる上で一番大事なのは対局数
とにかく対局数が最優先であって
持ち時間を増やすとしても絶対に対局数は減らしてはいけない >>282
7960Xの1秒だからそこらの1秒とはレベルが違うぞ kaiはしばらくillqhaにあまり勝ち越せない日々が続いていたけどこれはまた逆転したかな >>258
illqha2とillqha1.1を使用して試した Dolphin2に対してもWD3に対しても
6割以上勝ち越す 素晴らしい >>287
公開からたった2時間半で何をどれだけ試せたんだ・・・? しばらく前はWDばかりだったが
さいきんはSGばかりやな いま一番つおいのインストールしたいんだけど。エンジンと評価関数それぞれ教えてください kai5のレート測定するとしてエンジンはどうするんだろう 今のソフトって、NPSがヤバいだけで評価関数はうんこだよな
NPSが人間の数百倍だとしても初段レベルの強さしかない kai5が本当に圧倒的強さだったらillqhaの人はどうするんだろう 数手から数十手を読んであとは局面だけで評価する人間はかなり優秀
ノード数少なくても、depth浅くてもそれなりに強いDeepLearningが人に近いかもしれない めきっと@鵺日々成長中@_illqha
ついに某掲示板のシリーズ最新作が出てきてしまいました。
どうやらめちゃくちゃ強いらしいですね。
次に公開するもので抜くことはちょっと無理かもしれないです。
illqha1.1への再学習が究極的に上手く行ってもR+50は無理だと思うのでしばらくは追いつけない感じでしょうかね。
めきっと@鵺日々成長中@_illqha
高確率で弱くなりそうだけれども、もしかしたら結構強くなる可能性もあるんじゃないかと思っているアイデアを試さざるを得ないですかね。
illqhaの人も諦めへんで〜
>>260,279について、後手横歩避けるようになったとはいえ、先手も後手も勝率が変わらないことがちょっと気になる
NNUEは環境によって結果が結構変わってくるのでこのスレの住民の追試も必要だぞ、がんばれ君たち 強いソフトがほしいけど、そういう知識がない俺みたいな人ってほかにもいると思うのよ
だから前にエイプリーがやってたみたいに学習の一部を手伝えるようにしてくれれば、少しは足しにならない? kai5とillqha2で1手30秒で対局させてる
どちらも探索はdolphin2
のんびり眺めるのが楽しい
ちなみに1局目は角換わりから先手のillqha2が勝った こんな感じで有志によってどんどん評価関数が強くなっていってillqhaの人の計画通りだな しばらくは評価関数はNNUEkaiシリーズで決まりか >>302
教師作り手伝いましょうか?ってillqhaの人にDMしてみたら?計算資源かなりきつそうだし 2局目も後手のillqha2が勝ったわ
illqha2強いぞ 297>>
それはあると思う
最近のソフトは序盤がややアレなのと評価値の乱高下が激しい。
棋譜分析用に使ってたが、2の足を踏む
で、4月までの王者ソフトAperypaqを復権させてみた
短時間で本筋の手を指す。
大局観がいい。評価値がブレにくい。人間が見てわかりやすく参考になる
なかなかいいんで最新ソフトと対局させてみた
チープな4GBで32ビットPC環境w。
一手5秒で意外にもほぼ全勝
qqr,illqha1.1,kai5にも
もちろんしょぼい環境のせいですw(検索やねうら)
パワーが出せない4G環境なんで
棋譜分析用にはAperypaqに戻したね
それはそれとして
kaiとillqhaのレートがどれくらい伸びるかは楽しみです.
ロマンではあります >>308
NNUEって32ビットでも動くんだ 初耳 しょぼい環境ほどNNUEが強そうだけど、そもそも32bitのOSで動くの? レスアンカすらまともにつけられない奴の評など聞くに値せん
メモリ4GBで32bitOSってチープどころか化石中の化石でスマホにも劣る性能だろ >>258
解凍して出てきたYaneuraOu.slnをvisual studioで再ビルドしようとしたら失敗してしまったのですが、どのようにしたらビルドできましたか。
Release2018TNKで構成しビルドをしてみたら、C2672, C2780, C1083 のエラーが出て失敗しました。 32bit nosseはehash周り手に入れないとマルチスレッドで正常動作しないと思ったけど
大丈夫なんかね >>312
ご本人もしょぼい環境って言ってるのに何にキレてるの? 自分の感覚とこの板の情報に違和感があったので、自分で対戦させてみました。
探索部は whale7 Ditto2 (157→150修正済み)で固定。
illqha2 VS Kai5 の結果。
12-1-7
でした。
時間は1秒。NPSは2000kN/sくらい。 (ノード数は1秒なので同じです)
illqha2の方が強いと思うけど、同じような人いますか? 2700X買ったので報告
やねベンチでV4.82 TOで5800NPS
やっぱり8700KのがNPS出るOCしてどっこいどっこい
NNUE系ならIntelのが良いはず? >>319
値段こなれている2700はCPは高いかも
今度出る2950Xは供給が落ち着いたら買うかな NNUEkai5の作者様Twitter開設お待ちしております 設定ファイルを作ったので配布します
既存のエンジンのパラメータを手軽に再現するための設定ファイルです
Dolphinの設定ファイルはGAMMA2の記入ミス(>>269氏指摘)を修正済みです
最初に同梱した設定ファイルもそのままの状態(ミスがあるまま)で同梱してあります
https://1.bitsend.jp/download/c56f50c243fdf9f6fe4530e49edaa9bc.html
engine_options.txtは後から入れ替えをしても
既に登録済みのエンジンの設定パラメータは変化しないので気を付けてください
新規登録の際に、ファイルを設置してからエンジンを登録するというのが主な使い方となります
また、Ditto2はベースとなるエンジンが
やねうら王ではなくGodwhale_childのNNUE評価関数版なので
設定ファイルでパラメータを揃えてもオリジナルと完全に同一にはならない点にも注意して利用してください
>>313
MSYS2でclangを使ってコンパイルしました、visual studioではビルドが通るかは未確認です もう一度ベンチ
V4.82 TO 6400NPS
V4.82 SSE4.2 6500NPS
う〜ん >>324
illqhaの人も言ってたけどやっぱりSSE4.2の方がNPS出るんだな >>315
しょぼい環境+わけのわからん独自指標でソフトの優劣をつけてるのが気になったんだよ
あと無駄長文うぜぇとかもある
Apery推ししたいが為に他のソフトを不当に貶めてるのも気になる所だな 検証は秒読みではなくノード数制限でやって欲しいなあ
これならスペックの違いはほぼ問題にならないし
新参がやりがちなNetworkDelayやMinumumThinkingTimeの未設定も気にしなくていいでしょ >>327
NPS出るような改善とかが全部無意味になるからそれは同エンジンでしか通用しない >>327
ソフトごとにnps違うからノード数制限では駄目みたいよ >>328
あーそうか、
なんならエンジン配布者が予めそのパラメータを0に設定しておいてほしい 逆に言えば同エンジンならノード数で制限しても構わないと言えるな 開発者の人もそこら辺の設定がイマイチわからない人がどんどん検証に参加し始めるなんて思わなかったんだろ >>324
Ryzen買うなら絶対来年の3800Xでしょ
5万円そこそこで16コアは価格破壊レベル RyzenはAVX2周りの特許をIntelに持たれてるのがつらい kaiとかダウンロードしてなかったけど、検証時点でQQRに勝率62%ってのは本当っぽいねぇ
8月の勝率として順調そうでなにより よくわからん話が常識みたいな語りになっているのが不思議だ。
NodesLimitを仮に100万としたらどんな探索エンジン使おうが100万超えた時点でストップするとおもうんだが? >>340
だからそれが問題って話じゃ?
100万読むのに10秒のエンジンと1秒のエンジンがあったとしてそれを100万制限で比較していいのか?まずいだろってこと
そんなやり方したらDL勢の圧勝だし ノード数で切っちゃうと、エンジンによって枝刈りの有無だとか最適化してNPS確保とかの技が全部消えちゃうじゃん >>325
雑に全コア4.2GHzOC
V4.82 TO 6800〜7000NPS CUP温度69℃
V4.82 SSE4.2 6500〜6700NPS CUP温度75℃
TNK_WCSC28 TO 6200NPS CUP温度88℃
TNK_WCSC28 TO SSE4.2 5800NPS CUP温度90℃ >>344
一応AVX2版のほうがさすがに少しだけ速いのか >>345
定格だとSSE4.2のが速いか同等だったんだけど、よく分かんね
雑にOCしてるのもあるけど
ryzenでもやっぱりNNUEは熱くなる >>346
まあそれほど大きな差はないってとこか
熱さはもう線型の評価関数と比べたら結構計算複雑そうだから仕方ないっちゃ仕方ない >>341
いまみんなが注目しているのはillqha2やkai5の評価関数としてどちらが最強かということ。
それを客観的に評価するためには探索エンジンの要素を外して調べたいわけ。
秒数でやると探索数に違いが出る可能性があるので厳密にNodesLimitでやることで
どちらの評価関数が優れているのかわかると思うんだが? エンジンと評価関数はワンセットなのが最新の常識でしょう
それぞれの評価関数が一番実力を発揮できるエンジンにして計測しないと意味がない illqha2はdolphin2より1.1の方が相性がよく勝率が高いって結果も出たみたいだし、
エンジンと評価関数ではっきり分けて計測するのはどうかなって思うんだよな 逆だった
illqha1.1とdolphin2が相性が良いだった >>337
俺はZen2待ちだがレートとか観る限りRyzenの性能悪くなさそうだけどなぁ >>349
みんなはそんなことに注目してないよ
どの探索と評価関数のセットが強いかを気にしてるんだぞ >>353
いや別にRyzenが悪いって言ってるわけじゃないよ、かなりコスパいいし
ただAVX2がもっと有効に使えたらいいのになってこと >>356
確かにRyzen専用に最適化すれば多少速くはなると思うけど256bitで持ってるほうがやっぱり有利じゃない? Intelまた脆弱性見つかったそうだな
Intel CPUの「SGX」機能に新たな脆弱性、仮想マシンなどにも影響
http://www.itmedia.co.jp/news/spv/1808/15/news037_0.html i9はそこそこいい値段しそうだしいよいよRyzenが一時代を築くか 既に旧バージョンのソフトでも、あのポナンザに勝率81%か
R差258 勝率81.54%
dolphin/illqha1.1 R4307
Ponanza-wcsc27 R4049 脆弱性パッチ当ててベンチマーク25%低下するCPUとかいらん 残念ながらKai5はillqha2よりも強いとは思えない・・・
あとノードリミット100万で対局させると持ち時間1秒設定でも
100万まで読み込んだあとで着手しているように見える。
そしてそれにかかる時間はGW3<dolphin2で随分違っている。
結局探索エンジンの読み込みの速さがいいエンジンの第一要素
なんじゃないだろうか?
ここ1か月? ちかく対戦させてきたがGW3の方が常に良い成績を
収めてきた(秒数制限の場合)
https://i.imgur.com/YHO0FWE.png >>364
早く読めるにこしたことはないけど、それだけじゃないと思う
dolphinはもう少し超時間のほうが向いてるんじゃない? 探索深さやノード数を設定すると、
持ち時間は無視するのが仕様 >>366
基本的な事だよなあ
そんなん分からない輩がドヤッて結果だけ貼ると不正確になる つか>>349を主張しておきながら何でエンジンと評価関数バラバラで検証してんだ それなりに時間かけていい計測してる人達はもう少し時間かかるかな NNUEKAI5とQQRやqhapaqを1手2秒で対戦させているが、
illqha 2より強くなっていると思う。 3すくみって奴だろう
定跡オフだと戦型が偏るから
他の戦型に誘導された時にレーティングがブレるのかもしれないね >>349
同じノード数にしてもスレッド数が異なるとLazySMPが露骨に効いて
多スレッドの方が有意に強くなるというのがuuunuuunさんの調査で出てる
だから「コア数の違い」を考慮してノード数を同じにする、というのは
一見意味がありそうで実はない >>371
illqhaって対河童の勝率めちゃくちゃ高くなかったっけ? 法人で多コアサーバ利用する優位性が分かるなぁ
機械学習系は物量優位だな NNUEkai5、作者がテストで使われたdolphin2との組み合わせがよさそうだな。
昨日はGodwhele Ditto2と組み合わせたが、それよりも安定して強そう。
あくまで数局観戦しての印象です。あしからず。 水門のillqha2_6950Xって偽物だろ
流石に1コアの技巧2にそう簡単に負けるはずがない
レートで言ったら軽く1500以上離れてると思うんだが illqha2もkai5も評価値暴れすぎじゃない?
6950xのillqha2が技巧に負けてるし
そもそも探索の調整ってチョイチョイ弄って本家より精度あがるんかな
レートの算出に使うノードに特化させてるだけで枝刈りとか変になってないのかね
illqha1.1がfloodgate見る限りでは安定してそうだけど >>377
忘れたけど前にも技巧が一発入れたのあったから嘘じゃないと思うけど >>380
思い出せなくて申し訳ないけど3か月以内くらいの出来事だったと記憶
技巧の妙手?みたいなの読めなくて盛大に逆転されたのがこのスレでも話になってた
多分あとで誰かが貼ってくれると思うけど >>378
開発者がNNUE用にチューニングした本家の探索は今のところ存在しないよ
iillqha2はillqhaの人も微妙そうだから修正版出すみたいに言ってたし修正版を待とう >>381
ほーそうなのか
ただそんな前にはillqhaはまだ出ていないような・・・ >>375
そういう中で、絶芸や星陣には及ばないけどその次くらいに個人で来てる
山口さんの凄さが際立つ
電王トーナメント開催されてほしいなあ >>364
kaiシリーズはともかくillqhaシリーズはGodwhele Ditto2と
組み合わせた方がGW3やdolphin2よりも強いと思う >>344
追記
ちょっと煮詰めて
NNUEでも4,2GHzで70度以下で動作 NNUEの評価関数の場合dolphinよりgodwhaleのNNUE 版の方が強いって意見も前のスレで見た気がする >>386
いい感じだね
やっぱりソルダリングなのが効いてる気がする >>387
どれそれのエンジンが強い気がするってのはたまに見るけど、1500万ノードで数百局やってみたわって人はなかなか現れないよな ロタ@Rota_JP
illqha1.1_dolphin1 vs NNUEkai5_dolphin1
141-30-135
総試合数: 306, 勝率(引分0.5勝換算): 50.98%, ΔR(引分0.5勝換算): +6.81, 引分率: 9.80%
一手1秒(24T)
Hash=1GB,NoBook,PonderOff,Resign3000,Draw256 #コンピュータ将棋検証 #shogi #CSAlive
棋譜:https://t.co/U2tIBY7Ixr 👀
Rock54: Caution(BBR-MD5:b73a9cd27f0065c395082e3925dacf01) 300局で55%って結構有意差に関してはギリギリだから
どうやらツモってしまったっぽいな テスト対局させてみました
エンジンはdolphin2です
定跡はオフです
結果が微妙だったので、再検証はしてみたいと思います
ファイルは各PCで個別にDLしました
dolphin2+kai5とdolphin2+illqha2
186-65-249(ノード5〜600万)
38-17-45(ノード2000〜2500万) >>367
基本的なこととか言ってるけどどこにその記述があるの?
将棋GUIのマニュアルにでもあるのかい?
それともやねうら王のパラメター説明に記述でもあるの?
あなたにとっては基本的かもしれないけど具体的に
どこに記述があるか教えて欲しいよ。 >>396
やねうら王系のエンジン使うならソースのdocsの中のUSI拡張コマンドっての読むといいよ、大体のことはそれに書いてあるから >>369
同じ物での評価はすでにやったんだよ。GW3同士でね。
でもdolphin2がいいと皆が評価してるからKai5を変えてたら
成績が逆転するかと思ったわけだ。
しかし結果は同じだったというわけだ。
そこで探索エンジンは探索スピードが一番重要なんじゃないかと
思ったわけだ。 低ノードや短時間で計測してる人はdepth固定(教師局面はdepth10とかdepth12で作ってる)で計測した方が開発者の人のためになるかと
強いからといっていい教師になるとは言い切れないけど、100万ノードの計測結果は使い道も信頼性もなさ気 測定の精度は対局数で決まるのということを理解してない奴が多すぎる
ノード数があろうとなかろうと対局数を重ねることが最優先
一番無駄なのは最近多い100局未満の結果
あれマジでなんの参考にもならない >>323のファイルは書式を間違えていたので再アップ
設定値そのものは適用されるものの
オプションファイルを置いている状態ではGUI上での設定変更が効かなくなってた
あくまで設定ファイルのミスなのでエンジンはそのままで無問題
https://1.bitsend.jp/download/0a089154a1820aea85a4b2fb22772d05.html
kai5でDolphin2/illqha2に対して
1700局で勝率52%の設定ファイルも同梱(ほぼDolphin2)
https://i.imgur.com/FfA7xTV.jpg
計測データも少し入っているので興味のある人はどうぞ
エンジンと設定ファイルをワンセットにしたダウンロードURL
https://www.axfc.net/u/3930268 どんなにインパクトのある結果であっても、検証手法が間違っていれば全くの無意味
科学的な検証を行う際の基本中の基本だ >>405
何を偉そうに言ってるの?
インパクトのある結果が間違っているのなら、それを指摘して正しい検証方法でやり直せば本当に間違った結果か
どうかわかるんだから何も問題ないよ。何を指してインパクトのある結果といってるのか
今一つ伝わらないけど・・・ >>403
なるほどmax値とmin値が設定されていなかったのね
検証によるとR+15くらいか >>403
アンドロイド版も作ってもらえると、うれしいです。 ついにuuunさんのレーティングサイトが休止してしまった >>323
msys2ですか、あとで試してみます。 uuunuuunさんのサイトが無くなるのはかなり困るな 実際のところ、電気の無駄と気がついたんだろ
コンピュータ将棋界隈は目新しさもないし
辞めることができて彼にとっては良いことなんじゃないか 計測作業自体が大変と言うよりは新たな管理者(できれば複数人)に名乗り出てほしいといったところか 何人かの有志が居れば、確かにチェスのCCRLのようなもんは簡単に立ち上げれそうな気はする より高いレーティングのソフトの登場のためにはレーティングサイトは重要
開発者のモチベーションになる SCSRL(suimon compute shogi rating list)とか立ち上げようぜ Leelaのチェスと囲碁がやってるような、
棋譜生成、機械学習、比較検証まですべてやれるプロジェクトが将棋にも欲しい
協力者は難しい設定をする必要なくPCつけっぱにするだけ uuunuuunさん、サイトごと消しちゃったのね
http://www.uuunuuun.com
散々お世話になったので残念といえば残念だけど、なくてももう別に困らん なんで消したのだろう?
更新しなくても残しておくことに価値があるのに…
誰が嫌なことでも言ったのかな まあ維持するのもただじゃないししゃあないな
でもできることならレーティングサイトには復活してほしいね、きちんと組織的な新運営で uuunuuunさんがレーティング管理を引退したのは残念だが、今後は新しいソフトが出たら今までどおりロタ氏の計測に期待したい いつものテスト対局です
dolphin2+kai5とGW+QQRです
295-31-174(ノード5〜600万)
55-5-40(ノード2000〜2500万)
dolphin2+illqha2との対局で結構負け越したのですが、こちらは順当に勝ち越してます 自分のところの環境でも
NNUEkai5/dolphin2よりillqha2/dolphin2の方が有意に強いっぽい >>425
ドメイン料やサーバ代の支払い忘れとか? uuunuuunさんのサイト、今見たら復活してたw http://archive.fo/x60ex
ウェブ魚拓とったけどぐちゃぐちゃになった エンジンに同梱したオプションファイルを
評価関数をillqha2に固定してDolphin2を相手に計測
(初めからengine_optionsという名前になっている設定ファイル)
https://imgur.com/a/RW5NOk0
8000局で3964勝-252分-3784敗(勝率51.1%)
>>403と合わせて
Dolphin2ベースの2個の設定ファイルの計測はこれで終わり
500局で53%>>258だったから1700局で足りるかと思ったら
実際のレート差は実は小さかったようで
想定していたよりも対局数が必要になってしまった
>>409
android版は自分も作れるなら作りたいんですけど
コンパイルする方法がよく分からないので現状未定です 詰将棋エンジンのアンドロイド版が欲しい
なのはさんか脊尾さんお願いします
あ、やねうらさんが市販ソフトに詰めルーティンを入れるらしいからGPLだろううしそれをアンドロイド対応でもよかです NNUEの登場で普通に現れる詰みはわりとすぐ見つかるようになったし、詰将棋エンジンの必要性が薄れたわ nnueもそろそろ頭打ちかな
つらい停滞期がまた始まるね これの本体誰だよ?
コンピュータ将棋ファン@t3Jki1WDMTcZaRn
コンピュータ将棋の情報収集垢です。
https://twitter.com/t3Jki1WDMTcZaRn
https://twitter.com/5chan_nel (5ch newer account) kai5も実際にはillqha2から見てR+15くらいなんだろうけど
2週間という期間を考えると結構な進歩だと思う そろそろ厳しそうだけど今後R5000とか行くのかね 誰かが今年中にNNUEは今よりR200は上がるって言ってたが >>441
uuunuuunさんのレート表復活してるよ 既に初期からR200近く上げてるから伸びしろ小さいやん NNUEはAWSとかに100万課金する気があればR4700くらいはすぐ行くと思う >>444
スレのデータは探索部込みだったか、失礼
illqhaも1.1の方が強い説が出ているし
どうやら本格的に天井が近付いていそう >>447
探索部もあるけど超短時間だから結構結果が変わってきてるんじゃないかな Yssの山下さんがR4600くらいが限度みたいなこと言ってなかったか NNUEの容量大きくして限界まで学習するの繰り返すとどこで速度低下の影響のほうが上回るの? >>450
T.N.K.チームがあまり大きなNNを採用していないということはあまり大きくしても弱くなるってことなんじゃないかな?
せいぜい隠れ層のニューロンを増やすかもう一層増やすくらいじゃない?
それも速度低下以前に大きくなったNNをうまく学習出来ればの話になりそうだし 野良が各々学習や検証の為に消費してるリソースを一カ所に集めたら、
もっと強い評価関数ができるのにって常々思うんだよなぁ >>449
30年くらい前は、数学者でも「プロ棋士の4段クラスのソフトはこの世の終わりまで登場しないかもしれない」と書いていた
20年前でも四枚落ちでプロ棋士に負けていた
それが次々と壁を打ち破る手法が登場して、10年くらい前にプロ棋士の4段クラスのソフトが登場した
4600の壁はあっさり敗れると思う elmo絞り→一回でR200上がるすげえ!→何回回しても全然強くなんねぇ
NNUEもいっしょや!
ところでNNUEで作った教師局面でKPPTを絞ったら強くなる? 透。さん、illqhaの人やkaiの人の計測結果からある結論に至った
鵺は作成者を親だと思い、親の環境だと力を発揮する
オカルトです 久しぶりにこのスレ見に来たんだけど、
もしかして技巧もAperyもすでに息すらしてないの? 技巧は開発者が多忙により休止
Aperyは開発者が株式上場でがっぽりだからダントツ一位になれる可能性があるぞ >>403
Kai5のGW7版でillqha2のGW7版で試したらKai5に軍配が上がった。
ところがillqha1.1/dolphin2が強いというレスがあったので今試した。
まだ始まったばかりだがillqha1.1/dolphin2は期待できるかもしれない。
なお全てノードリミット100万で対戦して調査してます。
https://i.imgur.com/RkC6cPt.png
Kai5/GW7 vs illqha2/GW7
https://i.imgur.com/1ZYOqSm.png やねうら王とGodwhaleではNPSが微妙に違うから
ノードリミットではなく持ち時間制限にしないと駄目じゃないか?
そのNPSならNetworkDelay2を500にして秒読み2秒にしたらだいたい100万ノードになるはず >>453
そんな希望的観測じゃなくもうちょっと合理的な理論を持ってきてくれ 対局数至上主義の人はどのノード数以上までなら有意なの?
1万?50万?100万?500万?1000万?1500万?
何か曖昧なので 有意かどうかは対局数でしか決まらないから
例えばR差20を計測したいなら
ノードが1500万だろうが10億だろうが800局程度までは打ち切ってはダメだし
それが無理ならノード数を減らすべきという単純な話
ノード数を維持する為に対局数を減らすのは優先順位が逆 ノード数多いと計測は大変だけど、少なくとも500万くらいはほしい気がするかな
100万くらいだと勝率がuuunさん基準の測定と離れすぎる気がするし、そもそも超短時間で検討とかしないからそんな時間での強さ測ってもなあ どっちが強いか単純に測りたいならノード数なんてどうでもいいでしょ
対局数が多ければ多いほど信頼性のあるデータになる 短時間長時間なんて定量的なもんでもないし、どのノード帯で検討するかなんて人それぞれでしょ
一つの局面延々読ませる人もいれば、多くの棋譜の解析を一手数秒で流す人もいる
統計的な評価とノード数問題は別物で、まずは少なくとも統計的に価値のあるデータ数を確保しなさいよというだけの話
で、ノード数については現状一般化された理論がないので、◯◯ノードで測定しなければいけないなんてことは言えない 超短時間すぎると統計以前にそもそも対局データとしての価値は下がる
数十万ノードと数千万ノードで勝ち越すほうが逆になるなんてことはよくある
数十万ノードで使うことなどないので数十万ノードで強くてもあまり価値がない >>471
>数十万ノードと数千万ノードで勝ち越すほうが逆になる
そんなのあったっけ?
数十万ノードなら手元ですぐに再現実験が可能だから
具体的にどの組み合わせを数十万ノードで対局させると
レーティング表とは逆の結果になるのか知りたいんだけど 逆にそちら側が任意のノードで勝率が変わらないことを証明しないといけないと思うけど >>471
対局データとしての価値とは?
単にハイレベルな棋譜が欲しいなら、
時間を際限なく伸ばして一局やればいいだけ
>>473
任意のノード数で勝率が変わらないんじゃなくて、
◯◯ノードで測定したから大丈夫(何が?)保証はどのノード帯にもない >>472
例えばkai5とillqha1.1
4スレ0.1秒300局だとkai5が53%だったがロタさんの計測ではillqha1.1が勝ち越し
対局数少ないから誤差の範囲内といえばそうだがノード数によって強さが変わるのは間違いないと思うよ
ロタさんのillqha1.1とQQRの検証を見るべし ノード数で結果が逆転する実例を見つけているなら凄いけど
長時間厨は統計が分かってないから
彼らの書き込む「よくある」は全くあてにならないのが問題だな
0回でもよくあると思ってしまうフシがある >>474
検討で使うとき0.1秒しか読ませないなんてことはないから超短時間で強いよりはそこそこのノード数で強いほうが有用じゃない?
つまり両方十分な対局数をこなしていた場合ノード数が多い計測データのほうが価値があると思うんだけど >>475
それ全部誤差じゃん
言っておくけど300局で53%も誤差だぞ
1500万ノード側が有意差が出るレベルで計測されていないと話にならない >>478
誤差の範囲内と書いてあるんだが・・・
とりあえずロタさんの検証見てきなよ elmoが1手5秒以上だと勝ち越す相手に2秒以下だと
負け越すと昨年よく聞いた >>480
elmo絞りすると超短時間だとそれほど強くなくて、そこから計測が大変になったんだよな たしか初代elmoって1スレ0.1秒とかだと技巧2に負け越すんじゃなかったか? >>472
NNUEkai5は以下自分の計測では一手0.1秒のような超短時間ではillqha2にもillqha1.1にも勝率53%程度で強いけど、
uuunuuun氏の対局ログ(1500万ー2000万ノード)ではNNUEkai5がillqha1.1に勝率46%で逆の結果になっている
だから極端な低ノードでは、いくら対局数をこなそうが数千万ノードとは逆の結果になることが多いのでやっても参考にならないと思う
NNUEkai5-dolphin1 256-15-229 illqha2-dolphin1 対局数500 勝率52.7%
4スレ 一手0.1秒 定跡なし Hash1024 投了値2000
NNUEkai5-dolphin1 262-9-229 illqha1.1-dolphin1 対局数500 勝率53.3%
4スレ 一手0.1秒 定跡なし Hash1024 投了値2000
uuunuuun氏の対局ログ(1500万ー2000万ノード) 引き分け0.5勝換算
dolphin1/NNUEkai5 284-323 dolphin1/illqha1.1 勝率46% 散発的に持ち時間長くすると逆転したと言ってるだけで
ノード変化によるレート変化の網羅的なデータは無いしなあ しょぼいコンピュータで時間もかけないならば
持ち時間を少なくすれば統計的に正確でも実用上意味のないデータができて
持ち時間を多くすれば実用上意味があっても統計的に不正確なデータができて
どちらにしろ役に立たない
という当たり前の話じゃないの
なんの苦労もなく承認欲求を満たせるようなうまいはなしがあるわけない ハイスペック長時間の統計がどれだけ一般ユーザにとって有用なのか謎だけどね
そもそもマニアしか興味のないジャンルかもしれないけど ノード問題の戦犯?はelmoだわな
そういう結論になるわけではないのに、長時間計測が正義みたいな風潮を一部に作ってしまった >>485
まあそういうことだよね結局
自分含め一般ユーザーも検討のときはそれなりのノード数ないし深さを読ませるものじゃない?
uuunuuunさん基準の1500万ノードがハイスペック過ぎる条件だとは全く思わないかな
1手100万ノードでソフトの思考を終了させることなんてあまりないと思う、100万NPSの低スペックPCですら1秒なわけだし 1手0.1秒で対局させている人がいまだにいるみたいだが、棋譜のログ見れば分かるが探索深さバラバラだよ。
1スレッドで試してみたが深さ9〜14位で物凄く不安定だ。こんなんで正確な強さが測れるわけない。
思考時間が増えるほどどちらも同じような深さで安定しているから結果の信頼性高くなる 中盤や終盤で複雑な局面を検討させると最善手が変わるよね
100万ノードや数千万ノードでの最善手ももっと読ませると悪手だということが分かったりすることが多い印象がある
で、実戦で勝敗が決まるのもそうした局面で最善手を指せるかによるんだよ
だから、100万ノードでの結果が逆転しないとしても、検討に使うソフトは難解な局面で最善手を見つけることができるかなんだよな 結局何ノードなら有意?
1ノードもあり?
できれば根拠も添えてもらえればみんな納得しやすいかなと
ちなみに自分でもelmo以降のKPPTは何千回と計測してきたが、個人的には1500万は最低ラインかなと
むしろ足りない気もする
nnueはまた違って当たり前なので、有意な最低ノードが知りたかった
統計的に有意な最低ノードがあったほうが不必要な計測をやらなくて済むし、考慮しなくて済む
100万より少ないかもしれないし、多いかもしれない
100万というのは人間が思う切りの良い数字なだけかもしれない
ただ、KPPTとnnueの対戦なら秒数計測で1500万ノード分以上は必要だと思う >>492
それを知るには例えば1局10秒、100秒、1000秒、とたとえばFGの持ち時間の対局で
勝率の相関がどれくらいあるかを数組か数十組か数百組かどれくらいかしらないけど
統計的に十分な量の対戦カードの組み合わせについて調べないといけないんじゃない?
統計わかんないけど 統計はコスパも大切
コストかけても正確さが微増なら意味がない 「100万ノードだとA>Bだけど1000万ノードならA<Bである。
よって長時間ならBが強い」なんて結論出すのは相当頭悪い話だけどな。 >>494
ということで一手1500万ノードに決めたのがuuunuuunさんのレーティングサイトってことかな >>492
そもそもレーティング測るなら
測定環境、条件は揃えるべき >>323
258 配布のソースですが、MSYS2のビルドもエラーで上手くいきませんでした。
search.cppの3313行で、YaneuraOu2017GOKUが呼ばれてるのが原因っぽいです。 >>493
そう
なので今までは1500万ということになっているけど、それ以下に減らすと統計的にどうなのかな、という
>>495
どのソフトでも、ノード数が増えればその分勝率が高くなるが、勝率の伸び方が違うかもしれない
1000万や1500万が長時間と言えないかもしれないが、それ以下では長時間で強いとは更に言えない
実利用は検討用途が多い事も考えないといけない
>>497
そう
完全に同じ条件というのは難しいので、できるだけ揃えたほうが良くね?と思って 結局1500万ノードでは肝心の対局数が全然足りないから測定誤差での議論になる
対局数が足りないことが理解できない人ほど1500万ノード信者になるから議論の質も低い 信者だとか厨とかいってるレスよりは十分質が高いと思うけどね ノード数増加による棋力向上の変化は理論は何も手がかりは無いし
経験則と言えるほどのデータも集まってない。
1500万ノードで調査した結果からは1500万ノードの棋力がわかるだけで特に一般則は無い。 100万ノードではA>B、1500万ノードではA<Bの結果なら一手10億ノードで強いのはBの可能性が高いと思う
だから検討用に使うなら1500万ノードで割り切ってもいいのでは、理想は一手5000万、1億、2億とノード数を
変えて計測するのが理想だが有効な統計数を取るには個人では時間的に無理なので、この手の話をしても意味がない >>499
>>500
>>503
そもそも同一ハードでソフトによってNPS違うのにノード数で縛る意味とは? >>503
単調変化だと確信が無いのに二点測って結論出そうとする
頭の悪いことをここで言い出す人が現れるとは思わなかったわ >>500
そもそも2ちゃんねるの書き込みの信頼性が見積もれないと思うんだけど
対局条件がきちんとしているならば、それだけでは価値のない10局の結果は
価値のある1000局の一部になれる可能性がある
>>504
違うハードで条件を揃えやすい
レーティングの相性問題に目をつぶれるならば、ノード数の違う自己対戦の結果を
つかってレーティングを補正できる >>505
頭が悪いのはお前だろうが、計測はどこかで妥協しないとキリがないだろうが、強いのか弱いのか分からない一つのソフトの計測にお前のような理想ばっかり
述べても時間を取られるだけで実用性がないからな 何にもしねぇ、声だけデカイ馬鹿はどこにもいるからな
妄想カタカタしてる暇あったら、お前の好きな方法で計測してこい
誰にも必要とされてねえよ 理想とかじゃなく、◯◯ノードはダメだけど△△ノードは価値があるって判断そのものが
現状ナンセンスなんだって気づけよ >>507
単調変化すると仮定するなら1万ノードと10万ノードでの比較でもいい事になるんだけど理解してる? というかノード数変えてどこから統計的に有意とか、恥ずかしい発言だと思わんのか。
このスレで有意って単語見たからって知らん言葉使っとるんか
ある実験条件(ノード数なり思考時間なり)で無限に対局を重ねれば、ある勝率に収束する
その確からしさが欲しいならそれぞれ対局数を重ねるしかない。
短時間対局で対局数を重ねれば、短時間対局でのあるべき結果に収束する
実験条件を変えた時に異なる勝率に収束するかは別の問題
それは統計の問題ではない illqhaの作者は学習時にLAMBDAを0.05にしているようだけど、それ自体は悪いことじゃないだけども、
それだとせっかくdepth12で作った教師の評価値があまり意味がなくなっていると思う。
LAMBDA混合絞りで序盤の評価値のLAMBDAは大きくした方が深い探索が生きると思う TCECの同点のときの順位決定法ってSB優先じゃなかったんだな
1.クラッシュ数(少ないほうが勝ち抜け)
2.直接対決の成績上位
3.勝ち数の上位
4.後手番での勝ち数の上位
5.SBの上位
6.主催者の判断
TCEC 13の3部リーグは8エンジンによる4回戦総当たり全28回戦が終了し
Etherealが17勝0敗11分の22.5ptsで無敗優勝を飾った。
2位はArasanが9勝5敗14分、LeeraChessZeroが7勝3敗18分の16ptsで並んだが
直接対決で1勝3分と上回ったArasanが1期で2部への復帰を決めた
なお、3部リーグはずっとGPUの熱トラブルが続きLeeraChessZeroは実力を発揮
できなかったもよう。冷却と電力消費の問題を克服した20回戦から猛烈な追い上げを
開始したが、Arasanとの直接対決差に涙を飲んだ
やっぱNN勢を大会に出すってのはなかなか大変みたいね 今やってる議論とは別だけど、
高ノードだろうが、低ノードだろうが、
そもそもノードを固定して測定するってのが疑問
それが平等な条件なの? ノード数固定という意味ではなく大体どのくらいのノード数になるように秒数で固定という意味合が多いと思うのだけれど いつものテスト対局です
ノード5〜600万
対局数500 先手勝ち243(54%) 後手勝ち204(45%) 引き分け53
dolphin2+kai4
勝ち247(55%) 先手勝ち135(59%) 後手勝ち112(50%)
dolphin2+kai5
勝ち200(44%) 先手勝ち108(49%) 後手勝ち92(40%)
ノード2000〜2500万
対局数100 先手勝ち48(55%) 後手勝ち38(44%) 引き分け14
dolphin2+kai4
勝ち58(67%) 先手勝ち30(75%) 後手勝ち28(60%)
dolphin2+kai5
勝ち28(32%) 先手勝ち18(39%) 後手勝ち10(25%)
ということで、私の環境ではdolphin2+kai5はあまり良い結果は得られませんでした >>514
1500万ノードって記載があるのは全て大体1500万ー2000万ノードの範囲に収まるように秒数を固定したものでノード数固定ではない
そのため違うエンジンで対局する場合秒読みなのでノード数が違ってくるのは当然で、このスレでのノード数固定計測の話は100万ノードの人くらい
じゃないだろうか >>518
あそうなのね、勘違いしてたわ
ところで、kai5やdolphin2illqha2が自身の前バージョンよりも
強くなってるかどうか確認できないんだけど、
スレ全体的な評判としては、どうなってる感じなんでしょうか? dolphin1.1/illqha1.1とdolphin2/illqha2は僅差な気がするわ >>517
むしろdolphin2+kai4 が結構強いということ言えない?
dolphin2+illqha1.1もなかなかということだから、
「dolphin2が優秀&1つ前の評価関数と好相性」じゃないだろうか めきっと@鵺日々成長中@_illqha
illqha2、もしかしてほとんど強くなってないですかね?
あまりに微妙そうだった場合、修正版として来週末くらいにillqha2.1を出すかもしれません。(illqha2の詳細な計測等はちょっと様子見していてもらったほうがいいかもしれないです)
illqha2弱いぞという方はどんどん教えてください。
めきっと@鵺日々成長中@_illqha
返信先: @Rota_JPさん
はじめまして。いつも計測してくださってありがとうございます。
QQR+GWに対してさすがに少し勝率が低すぎますね。
過学習している感じではなかったので原因を突き止めるまで時間がかかりそうです。
おそらく修正版のillqha2.1を作成すると思いますが、その際は対QQR+GWの勝率をやや重要視してみます。 >>522
私の環境ではdolphin2とGW7を直接対決させると
GW7が勝ち越すけどねillqhaでもkaiでも GWシリーズは短時間に強いように調整してるはず
そのせいでは >>199
ど来年5月には16コアのCPUが5万円弱で買えるという予想ってのは誰の予想? ほんとAMDが頑張ってくれて良かった
Ryzen登場以前のコア数の鈍化は今思えば異常 >>525
私もGW7は優秀な気がする。
同じ結果が出た。 >>525
>>531
ちなみにノード数はどんなもん? 短距離走者と長距離走者みたいに得意な思考時間があるんだろうね 夏休みか何か知らんけど
基本的なアルゴリズム知らない中高生が増えたのかな
古い本で良いから基本的木探索勉強したら? 30すぎたオッサンだけど一週間前からAtCoder登録してみて絶望したわw
開発者はこんな奴と戦っていたのか・・・
単なるミニマックスのゲーム木探索だとビギナーコンテストのCの過去問だと今日気づいてさらに絶望した >>536
ある意味こういう競技性的なものが出来る事によって、上にいる奴はさらなる上を目指すけれども
それより中よりも下にいる奴はもうはなから諦めてそもそもプログラミング自体辞めるという事態とかもありえそう。
格ゲーの世界がまさにそんな感じだからな^^; >>532
>>525の場合 ノードはチェックしていないが i7-8700kで1手10秒 アルゴリズムと言う言葉すら知らないのが
ウヨウヨしてるからなw >>538
一手6000〜7000万ノードくらいか?すごいな
1日に50局もできないんじゃないかそれ
今勝率はどれくらい? 基本的にここの連中も
DLしてポチポチクリックするだけで出来る検証作業
これでしか盛り上がれないからね
何のスキルも持たない人間だと告白してるも同然よ まあ正直な所、電気代の無駄だよな
検証でできた棋譜を集めて更に学習させるならまだしも 検証作業とかやったことないけど全く同じの対戦させても結構勝率ばらついたりするんじゃないの
確かにあんまり意味なさそうな気がする 趣味なんて総じて無駄なもんよ
周りがごちゃごちゃ言うもんでもないと思う テスト対局です
1秒でスレッド数を変えてノードを変化させて対局させてみました
書いてるノード数はdolphinのものでGWは2〜3割増しです
1T(4〜50万)
対局数500 先手勝ち253(52%) 後手勝ち230(47%) 引き分け17
GW+QQR
勝ち295(61%) 先手勝ち155(63%) 後手勝ち140(58%)
+illqha1.1
勝ち188(38%) 先手勝ち98(41%) 後手勝ち90(36%)
2T(80〜100万)
対局数500 先手勝ち285(59%) 後手勝ち195(40%) 引き分け20
GW+QQR
勝ち264(55%) 先手勝ち155(64%) 後手勝ち109(45%)
illqha1.1+dolphin
勝ち216(45%) 先手勝ち130(54%) 後手勝ち86(35%)
4T(160〜200万)
対局数500 先手勝ち268(56%) 後手勝ち207(43%) 引き分け25
GW+QQR
勝ち257(54%) 先手勝ち147(60%) 後手勝ち110(47%)
illqha1.1+dolphin
勝ち218(45%) 先手勝ち121(52%) 後手勝ち97(39%)
6T(300〜350万)これはPCが異なります
対局数500 先手勝ち269(56%) 後手勝ち203(43%) 引き分け28
GW+QQR
勝ち225(47%) 先手勝ち130(54%) 後手勝ち95(40%)
illqha1.1+dolphin
勝ち247(52%) 先手勝ち139(59%) 後手勝ち108(45%) >>542
ここをどこだと思ってるんだ
東大と激指とAIとどれが一番強いかわかんなかった頃からすると
自分で納得してソフトを選んでる分ずっとマシになってるわけだが >>549
こんなところに投下するレベルじゃないようなすごく良いデータだな
NNUEはノード数が極端に少ないと力を発揮できないのかな
dolphinがという可能性もあるけど >>551
というか低ノードだとちょっとしたノード数の差で深度が変わるからでしょ スマホのアプリの将棋データベース2で評価値が出るのですが、
何というコンピュータ将棋を使用して
1手何分考えさせているのですか? >>552
ロタさんの計測だと1500万ノードくらいだと56%くらいになるみたいだし、5000万ノードくらいの結果でも伸びがあればいい感じのグラフが書けそうじゃない? >>549
本当にこんなに差が出るんなら実行環境への依存性はすさまじいな
他人の検証と一致させる方が難しいレベル elmo絞りのときも魔女が出てきたときもノード数で随分変わったし今に始まったことじゃないんだけどね
まあそれなりに多いノード数で強い方が有用な気はするけど どのソフトが強いか500局対戦させてテストするとなると1手1秒はやむを得ないだろうね
でも、昨日のプロの棋譜を解析するのに使うときは1棋譜に5分くらいは平気だから、欲しいのはその場合でも強いソフトなんだよな
ShogiGuiでは探索深度を固定して解析できるようになっているよね
例えば、探索深度を17手で固定して解析してみると、中盤以降は1000万単位のノードで、終盤には1億ノード以上読んだりするわけよ
そういうわけで、必要なソフトは探索深度17で最も信頼できるソフトだったりするんだよな
信頼度が同じなら解析が速いソフトのほうがいいけど、信頼度が違うなら、1棋譜の解析に1分遅くても信頼度が高いソフトを選ぶよ >>525
>>531
Ditto2添付のengine_optionsのPARENT_NODE_GAMMA2を150に修正したのを適用して以下floodgate
と同じ一手ごと加算方式で計測した、Ditto2で14秒あたり2330万ノード、自分の環境ではdolphin2の方が強みたい
dolphin2/illqha2 26-12-12 Ditto2/illqha2 対局数50 勝率64%
持ち時間7分 一手ごとの加算14秒 定跡なし 2スレ Hash1024 投了値1000 1000でもそこからの期待勝率で言えば85%くらいだしそんなに気にするほどでもないと思うけど 昨日やった0.1秒1500局と今日やった0.1秒1500局で、勝率結果が2%強違ったが
冷静に計算してみれば別に普通の事だった。 やらかしは評価がだいたい1000から2000の間で起きる
以前ほどではないが今でもときおり起きる
1000で切るとそういう情報はほとんど拾えない あくまで目的がレーティング調査ということであれば、
そういった逆転劇は統計的に無視しても問題なくて、
その分浮いた時間を、対局数の多さに費やした方が、
統計的にはより信頼性の高い結果が得られるという主張ではないのか? まーもし序盤中盤強くて終盤だけボコボコのソフトがあったとしたら、
1000で投了させた場合と最後までやった場合で結果は違うだろう。
途中で投了させて結果に影響ないことを確認する術は俺にはないので、俺は最後までやらせてる。 実際トップソフト同士だと1000からの逆転はマジでほぼない おーい。鍵かけてないでコメントしろよな。
333 名無し名人 sage 2018/08/21(火) 20:43:24.47 ID:+NcY+lso
2018.08.21
「コンピュータ発!現代将棋新定跡」についてのお詫び
将棋書籍編集部
2018年6月に発売しました「コンピュータ発!現代将棋新定跡」において、参考文献として挙げた千田翔太六段が作成した定跡(「C-book_2017」など)の手順と同一の部分がありました。
その他にも参考文献からの引用が多く、差別化が行われておらず、誠に申し訳ございませんでした。
同一部分は以下のとおりです。
「コンピュータ発!現代将棋新定跡」
第2章 角換わり▲4八金
第3節 ▲4八金・△6二金(▲2五歩型)
p.100〜p102、p.106〜p108の本手順 ハイスペPC持ちで時間もたっぷりかけられるなら投了までやるにこしたことはないと思うが中々そうもいかないからな stockfishからコードを引っ張って来て再調整(末尾のtはテスト用の名前なので中身は同じ)
https://i.imgur.com/GdFaIBD.jpg
外出先のPCでのテスト対局
他の持ち時間では弱体化している可能性もあるので注意
https://1.bitsend.jp/download/c149b30d25d1fc6fe122e277a9ba431a.html
>>498
トーナメントエディションでしかコンパイルが通らない状態になっていました
単純な修正をしたらほんのり勝率が落ちたので(有意差は取れない程度)
こちらのDitto3の方をコンパイルしてみてください nVidiaがTensorコアを載せたRTX20xxシリーズを発表したが
将棋AIの世界じゃGPUって下火なんだっけか >>569
なにこれ?
スイモンは名前だけじゃなくてチダショーの定跡からパクッて書籍化したって事か? >>573
定跡や棋譜に著作権は無いのでおk
てか角換わり最新系なら他にも本出てたと思うし suimonに興味があるならこっちに本スレがある
「suimon_feat.anti_suimon応援スレッド17」
https://mevius.5ch.net/test/read.cgi/bgame/1533862279/ >>574
著作権云々はあえて議論しないけど編集部が謝罪だしたって事は不味いんじゃないの?
スイモンに興味はないからスレ覗いてまで知りたくもないけどフラゲのPVパクッて悦に入ってる
ソフト指しがスイモンだから4ねとしか思わん suimonの話はsuimonに興味がある人以外はどうでもいい話なので本スレでやってくれ >>576
棋書書くのに棋書パクってるのもあるし
その辺の将棋界のスタンスってテキトーなのよね
渡辺明ブログ
https://blog.goo.ne.jp/kishi-akira/e/d666fafdee8261f0d73f0ce7ca68328c
2017-11-18
浅川書房から2005年に出した「四間飛車破り」が数年に1回、増刷になるので送ってもらうんですが、
あれ以来、定跡書は書いてないので執筆当時のことを思い出すと懐かしいです。
今と違って強いソフトが無い時代なので定跡書に書く検討は自力で行わないといけないので
大変で【急戦編】では藤井九段の「四間飛車の急所」がとにかく参考になりました。
あれはすごい本だと思います。 C-bookに千田さんがすべての手に解説文つけて出版してくれたら全部解決
12,000円まで出す こっちの方がこのスレ的には大ニュース
Ryoto_Sawada@Qhapaq@Qhapaq_49
レーティングサイト。後継者募集中なら引き継ぎますよ(ただし私のdjango歴は一日ですが >>579
手の数が尋常じゃないからそんなことしたら1冊10万とかになりそう
そもそも解説付け終わる前に定跡事情がそこそこ変わりそうかな、NNUE出てきたし >>580
澤田さんなら色々面白い機能つけてくれそうだし安心だ >>580
Qhapaqさんなら引き継ぐにふさわしいと思いますね
何か新しい要素も付け加えてくれるかも知れませんし >>571
おつかれさまです。試してみます。
SSE4.2版もいただけると助かります、 godwhale_child-NNUE-whale7_Ditto3 の SSE4.2版です
https://1.bitsend.jp/download/c1c174889eeec634c60a78e12d34b16a.html
engine_options.txt は入っていないので、注意してください 訳の分からん調整したエンジンありがたがるアホって何なの?
実践から(検討)かけ離れた短時間に調整したり計測範囲で優位を出したいだけ
少し前のキメラと同じでろくに検証もしない物を適当な使い方でありがたがるアホ多すぎ >>588
有り難がると言うより、作者が検証しきれない点も検証されるから、興味のある人には公開は良いんじゃないかな
興味ないなら無視すれば良いのだし
できが悪いと思うのなら自ら検証すれば良いだけ >>588
訳のわかる調整と訳のわからない調整の違いがイマイチわからないが 今のソフトからコマ割りの値を算出する方法ってある?
NNUEになってからどうなったか見てみたいんだけど
できれば局面Aの評価値と局面Bの評価値の比較みたいな感じで出せるとより嬉しい 評価値を元にコマ割りだけでパラメータ調整するとかかな
コマ割りだけでの評価関数を作るって感じで
こういうのじゃない? >>593
https://github.com/yaneurao/YaneuraOu/blob/master/source/evaluate.h
駒割りは89行目からの数値で固定だと思うんだけど
PawnValue = 90,
LanceValue = 315,
KnightValue = 405,
SilverValue = 495,
GoldValue = 540,
BishopValue = 855,
RookValue = 990,
ProPawnValue = 540,
ProLanceValue = 540,
ProKnightValue = 540,
ProSilverValue = 540,
HorseValue = 945,
DragonValue = 1395,
KingValue = 15000, >>597
これってこの数字変えると評価値もかわるの? >>597
変えた数字の分だけ評価値も変わるだろうけど、変えた後に学習やった場合は、変える前の評価値に近付くように収束すると思う。
学習せずに駒割りのみのソフト作るなら、bonanzaみたいに金より成金の数字を大きくした方が良いんだろうね。
bonanzaはやねうら王と違って学習で駒割りも変動するけど、特に「と金」の価値が自動的に大きくなっている。 じゃあ評価値が全体的に大きく出すぎて困るとかそういう現象が起きたら一応調整はできるのか >>549の勝率がノード数に依存しすぎなのをみて、時々回してたものの途中報告
(この後0.5秒,1秒もやるつもりだったけどこの結果だと途中で投げ出しそう)
エンジン:>>258を落としたまま使った(=およそDolphin2のengine_optionsだが一部間違っているらしい(>>269))
評価関数:NNUEkai5(>>279)
エンジン:GodwhaleChild-5.0.5(選手権あたりからあるもの)
評価関数:QQR
・4T 0.1秒(ノード30-50万程度?)
3071局 1796勝 1275敗
勝率: 0.5848257896450667
標準誤差: 0.008893948764004796
95% 信頼区間 [0.5672419407359166, 0.602084011722566]
相対イロレーティング: 59.51845902452462
標準誤差: 6.363294768915171
95% 信頼区間 [47.00926789156493, 71.94628210105508]
4T 0.2秒(ノード60-100万程度?)
3111局 1784勝 1327敗
勝率: 0.5734490517518482
標準誤差: 0.008869264257160205
95% 信頼区間 [0.5560912889746062, 0.5908068145290903]
相対イロレーティング: 51.409570870267466
標準誤差: 6.298920784965844
95% 信頼区間 [39.14096982006567, 63.80684135857484]
感覚を裏切らず、ノードが2倍になった程度では3000局やっても勝率に差があるとまでは言えず。
しかもQQRとの差が縮まる方向だが、uuunuuunさんの4T5秒相当でR差30ちょいなんだから縮んでいいのか。 100万ノード以下の計測って統計数は取れるけど実際にそのノード数で使うことは検討などでもあまりないし
ソフトを選ぶ参考にはならないと思うが >>604
ノード数がもう少し離れてないとやる意味が薄い気が >>554
5000は時間がかかるので3000〜3500万でテスト対局してみました
対局数300 先手勝ち165(58%) 後手勝ち117(41%) 引き分け18
GW+QQR
勝ち121(42%) 先手勝ち75(51%) 後手勝ち46(33%)
dolphin+illqha1.1
勝ち161(57%) 先手勝ち90(66%) 後手勝ち71(48%)
1500万とほぼおなじです
1500万は悪くないノード数の気がします
先の300〜350万と1500万の間を少し埋めてみます >>610
需要が有ればupしても良いのですが、需要は無いのでは
今回はタイプの違うエンジンを使って、ノード数での勝率変化をテストしてみる物なので 1500万ノードは、棋譜の検討で終盤の指し手が悪手なのか最善手なのかを確定させるノード数としては足りない
よって、1500万ノードの勝率テストでは、どのソフトが検討用に一番適したソフトかまでは分からない 1500万ノードというのも中途半端
一般人ならノートPCでの1秒解析での80万ノード辺りが1番使われているだろうし
ガチ勢なら億単位のノードは必須だから橋にも棒にも掛からない >>613
勝率の安定度の問題と思います
ある程度勝率が安定するのが1500万はいると言うことでは
億単位なら異なると言うのなら、億単位で検証してみるべきですね >>614
1500万ノードで勝率が安定すると言い切れるためには
3000万ノードや1億ノードとの比較データが必要なんだが?
それにその論法で
1500万と1億ノードで勝率が仮に変わらないとして
それ。1500万ノードの根拠にしたのなら
今度は1500万ノードと100万ノードで勝率が変わらなかった場合には
計測は100万ノードから安定するからそれで十分と言ってもいいという話にも繋がる 1500万ノードで計測してわかるのは1500万ノードの棋力のみ 勝率の安定度ってひどいパワーワードなのでは?
短時間であろうとなんであろうと、一回の試行の勝率がpであればそりゃ期待される分布は二項分布だとは思わんかね?
やってる最中に次第にPCが重くなりNPSがでなくなって、
だんだん試行の条件が変わっていくというなら分からなくもないが 前にaperypaqとのキメラを50種類くらい作って100万ノードから200万ノード程度でaperypaqとの計測に数か月もかけた
ことがあるけど、それで勝率55~60%のものが8種類くらいできたが1500万ノードで計測したらaperypaqにほとんど負け
越したので100万ノード程度の計測は無意味なことが分かった まあ二点では荒い予測しか出来ないからもう何点かプロットして傾向を出したいわな >>618
50回も計測していれば
kai5のように逆側を引くこともあるだろう
100万ノードで安定してaperypaqよりも強いキメラが公開されたことはない >>614
終盤に強いタイプのソフトはあるんじゃないかな
だから終盤力だけのテストみたいなこともやれたらいいのにな
終盤のありがちな互角局面を自動で作り出すアプレの開発が先になるけど 学習させて250万ノードくらいで有意差でて喜んだら1500万ノードでほぼ互角
という経験は何度かしてる >>621
過去のソフト同士の終盤から互角局面を500くらい拾ってきて
そこからテスト対局させればノード数の違いでどう勝率が変わるか分かるだろうな
過去の棋譜から互角局面集を作ってくれるアプレがあればいいんだな 実際にR15の変化があったとしても
1500局指して有意差が出る確率は半々といったところ
学習をさせるなら想定されるレーティングの変化から
必要な対局数の逆算をしておかなきゃ 仮に小さく見積もって1手10通りだとして100手まで完全解析するのに1秒間に1京ノードで計算しても"無量大数"年以上かかる
宇宙ができてからまだ150億年足らず 注意:tanuki-2018年版はCPUを酷使するプログラムになっているため、他の4つの思考エンジンを動作させる場合に比べてCPU温度が上がりやすいです。
また、他の4つのエンジンについても、スレッド数を上限に設定した場合、CPU負荷率は100%になります。PCの冷却には十分ご注意ください。 >>626
変な手を省きまくってもっと効率的にできないかな まあ、手数よりもまずは「合法局面の完全解析」からではないのか
それをしないと末端終局図もわからないからな TCEC 13の2部リーグ4回戦総当たり28回戦が終了
3部を無敗優勝したEtherealが2部でも11勝17分と無敗で優勝
2位は10勝2敗16分のChessBrainVB、2ソフトが1部に昇格した
現在1部リーグ開幕までの場繋ぎで、1部参加8ソフトとStockfish 8の
5分+3秒でのお好み対局が開催中 完全解析など必要ない。 むしろプロ厨の罠だろw
必勝手順の発見で事足りる。
・初期配置から合法手の応酬によってできる局面のみを調べればよい
(詰将棋のような仮想局面は必要なし)
・詰み・必至を見逃した後の(膨大な)変化も一切必要ない
・将棋のルールで一手パスはできない
・必勝手順は偶然発見されることもある
詰み・必至の局面から逆算していき、
(一手パスできないので)どう指しても悪くなる局面を見つけて行く、
そのような局面のデータを蓄積していけばいいだけ。
そこから先は、一切読む必要、時間を使う必要はなくなる。
よく指される戦型からの変化を最優先で潰していけば、効率もよく、
プロ将棋に与える影響も極めて大きい。 >>634
だから末端局面を発見するには結局合法局面の総当たりが必要なわけだ
詰み必至だけじゃなく持将棋の局面も必要なんだからな
というわけで、10^68の世界へようこそ >>634
君は、総当たり、完全解析が合法手だけで成り立っている事を理解してから書き込みしよう >>634
終盤の詰みや必至からさかのぼって定跡を形成してゆく。
逆算定跡
という。 NNUEkaiの作者って弁護士の先生なんだね、Twitterで知ったけど、法律に詳しそうなのでもしかしたらと思っていたけど >>634
終盤の詰みや必至からさかのぼって定跡を形成してゆく。
逆算定跡
という。
1.候補手には最も候補手範囲が広いAI将棋を使う。
2.5000点で切り上げる。
3.候補手によっては一進一退があるがすべて調べる。
4.充分に浅くなったら2000点で切り上げる。
5.定跡形成には激指の空の定跡を使う。
6.中盤になったら500点で切り上げる。
7.中盤の1手が悪手かどうか分かる。
自動化すれば、かなりの精度の定跡が早く形成される。 >>637
それは結局実際に指された手しかたどらないのだから
単に時間をかけて1局指すのと同じでしょ
ガンジス川の砂ひと粒にもならない >>643
いや、宮田新手潰しとかには使えます。
森内俊之さんが実戦で、渡辺明さんが解説で実践していました。 >>645
ある手が悪手であることをいうには相手の応手の中に1つ好手があればいい
ある手が好手であることをいうには相手の応手のすべてが好手でない手でなくてはならない
>>637のやり方でできるのはせいぜい敗着発見器じゃないの illqha2.1とkai6は25日-27日位にリリース? めきっと@鵺日々成長中@_illqha
やや過学習ぎみな仕上がりな気がします。
遊んでみたいという要望があれば番外編として公開しようかと思っています。
きちんとしたものの公開はもう10日程かかりそうです。
NNUEkaiの人は学習をしばらく取りやめて他の環境とで差が出る原因の究明をするみたいなこと言ってたから当分きそうになさそう >>646
自動化すれば、中盤の終わりぐらいまでは解析できます。
誰かソフトで自動化アプリを作って下さい。
コツはえ?こんな手?という候補手も取り込むことです。
終盤でも再逆転がありました。 また自称「○○に強い評価関数」が量産されたyaselmo時代を繰り返すの? >>635-636
残念ながらチェスはそうではないんだよなw
あれあれ?
・初期配置から可能な局面
・詰み&必至の見逃し後の変化は不要
は都合が悪すぎてスルーですか?w 名無し名人 (ワッチョイ eab3-vl9i)
なんでこんな将棋オンチがこのスレで威張っているんだ 何かアルゴリズム思い浮かんでるなら自分で書いてみればいいんじゃないですかね suimonの本がちょっとした騒動になってるけど実際のとこどうなん? >>653
そのような制約によって所要局面数を「大幅に」減らしたとして、屁のツッパリにもならんのが最大の問題
(100分の1とか1000分の1に出来たとして10^60を越えていたのでは人間の手に負えるオーダーではない) # 勝ち数 対局数 %
01 50.5 90 56% dolphin2 illqha1.1
01 50.5 90 56% nnue-w7-ditto3 illqha2
03 50 90 55% dolphin illqha1.1
04 49 90 54% dolphin2 illqha2
05 48.5 90 53% dolphin Kai5
06 44.5 90 49% dolphin illqha2
07 42.5 90 47% nnue-w7-ditto3 Kai5
08 42 90 46% dolphin2 Kai5
09 39 90 43% nnue-w7-ditto3 Kai5
10 33.5 90 37% GodwhaleChild-5.0.5 KPPT 4.80 64SSE4.2/QQR ■感想
これを実施する前に予想していた順位とはだいぶ違ってた。
予想通りなのはベンチマークとして使ったGW5.0.5 /QQRの成績のみです。
なんとillqha1.1の方がillqha2より若干成績がよかった。
nnue-w7-ditto3はillqha2以外とは相性が良くないみたいだ。
■その他
将棋所の最新バージョンをダウンロードしてリーグ戦で2秒設定で実施したが
将棋所はUSI_Ponder(相手番でも考慮)がデフォルトでTRUEとなっているのを知らなかった。
これだったら1秒設定で実施すれば半分で済んだのにと思った。
開始:8/22 20:52
終了:8/24 23:50 NGワードで書き込めなかったので分割した書き込みになってしまった。
結局短縮ダウンロードURLが引っかかったみたいだ・・・
https://28.gigafile.nu/0901-bc7a84ab35ae64d8d25a2ef5304d9110d ■リーグ戦で戦わせてみた!
■URL
https://28.gigafile.nu/0901-bc7a84ab35ae64d8d25a2ef5304d9110d
# 勝ち数 対局数 %
01 50.5 90 56% dolphin2 illqha1.1
01 50.5 90 56% nnue-w7-ditto3 illqha2
03 50^^ 90 55% dolphin illqha1.1
04 49^^ 90 54% dolphin2 illqha2
05 48.5 90 53% dolphin Kai5
06 44.5 90 49% dolphin illqha2
07 42.5 90 47% nnue-w7-ditto3 Kai5
08 42^^ 90 46% dolphin2 Kai5
09 39^^ 90 43% nnue-w7-ditto3 Kai5
10 33.5 90 37% GodwhaleChild-5.0.5 KPPT 4.80 64SSE4.2/QQR
■感想
これを実施する前に予想していた順位とはだいぶ違ってた。
予想通りなのはベンチマークとして使ったGW5.0.5 /QQRの成績のみです。
なんとillqha1.1の方がillqha2より若干成績がよかった。
nnue-w7-ditto3はillqha2以外とは相性が良くないみたいだ。
■その他
将棋所の最新バージョンをダウンロードしてリーグ戦で2秒設定で実施したが
将棋所はUSI_Ponder(相手番でも考慮)がデフォルトでTRUEとなっているのを知らなかった。
これだったら1秒設定で実施すれば半分で済んだのにと思った。
開始:8/22 20:52
終了:8/24 23:50 7位の評価関数が間違ってました。
nnue-w7-ditto3 Kai5 ⇒ nnue-w7-ditto3 illqha1.1
# 勝ち数 対局数 %
01 50.5 90 56% dolphin2 illqha1.1
01 50.5 90 56% nnue-w7-ditto3 illqha2
03 50^^ 90 55% dolphin illqha1.1
04 49^^ 90 54% dolphin2 illqha2
05 48.5 90 53% dolphin Kai5
06 44.5 90 49% dolphin illqha2
07 42.5 90 47% nnue-w7-ditto3 illqha1.1
08 42^^ 90 46% dolphin2 Kai5
09 39^^ 90 43% nnue-w7-ditto3 Kai5
10 33.5 90 37% GodwhaleChild-5.0.5 KPPT 4.80 64SSE4.2/QQR 評価値使って探索していくんだから少しくらいは相性がないわけがないんだけどね 相性があるというより
エンジンや評価関数に明確な有意差があまりないんじゃないかな? >>653
糞ワロタ
そういうの昔からあって焼け石に水って言うんだよ
勉強になったね💌 やねがクラウドファウンディングでオセロの完全解析やりたいって言ってるしその成果次第でいいんじゃない ツイート読み返したがやりたいとは言ってなかったw
オセロ完全解析にかかる費用が分かれば
オセロと将棋のゲーム木のサイズの違いから、
将棋の完全解析にかかる費用も概算できそう >>663
>将棋所はUSI_Ponder(相手番でも考慮)がデフォルトでTRUEとなっているのを知らなかった。
>これだったら1秒設定で実施すれば半分で済んだのにと思った。
うーんw >>663
ponder onのままだとテストにならんけど
大丈夫なんか? >>670
オセロくらいだと、有力定石を絞り込んだ上で、比較的手の狭そうな枝をセレクトしてから、その変化だけを完全解析というのなら割りとできそう >>664
なぜGodwhaleChild-5.0.5がSSE4.2なのか AVX2版より
強かったのならそのデータを併記してほしい ソフトで将棋の勉強ってどうすればいいの?
ソフト動かしててこれは自分では絶対に意図して動かせないって指し方見てもあんまり意味無くないか? >>676
悪手を教えてくれるのがでかい
悪手を指したらどんな手順で悪くなるのか細かく教えてくれる
普通は対局後に棋譜解析してどう指すべきだったか検討していく感じじゃない? >>673
今さらオセロてw お前は何年前で時間が止まってるんだよwwwww
オセロなんてとっくに実質的には解析できてるようなものだよ。
Wikiでも、すでに7年前に外部リンク先の最終更新が止まったり、ページ自体消えたりしていて
↓この状態なんだから、もうオセロは問題にならないステージに達している。
> 8×8盤
>
> 8×8盤オセロのゲーム木のサイズは10^54ノードと推定されており、
> 合法的なポジションの数は10^28と推定されている。数学的には未解決であるが、
> 速い並列ハードウェア上あるいは分散コンピューティングを通じたプログラムによる
> 徹底的な計算を行うことで解を見つけることは可能かもしれない。
>
> 一部の強豪プログラムは長年自身のデータベースを拡張してきた。
> 対角、垂直、平行の23つの主要なオープニングに関しては、対角オープニングと
> 垂直オープニングは引き分けの筋へ至る傾向にあり、一方で平行オープニングは
> 黒(先手)の勝ちとなる。引き分け木は、垂直オープニングの後よりも
> 対角オープニングの後の方が大きいようである[13]。平行オープニングは
> 黒(先手)に非常に有利であり、完璧に打った場合は常に勝つことができる[14]。
> 証明されてはいないが、実質的には双方のプレーヤーが完璧に打った場合は
> 試合は常に引き分けとなる。標準的ゲームでは、オープニングブックを使用することで、
> トッププログラムの勝率は99%を超える。
549 名前:名無し名人 (ワッチョイ 7fb3-sJj3)[sage] 投稿日:2017/11/13(月) 12:45:27.37 ID:QBnyEln60
今回の電王トーナメントでの収穫は、引退する山本一成から↓の発言が出た事だな。
以前から言われていた事ではあるが、将棋も暗記ゲーの時代に本格的に突入か。
30 名前:名無し名人[sage] 投稿日:2017/11/12(日) 16:30:03.16 ID:ILaYswGe [1/5]
定跡が進みすぎると、オセロのようになるのか
オセロは定跡だけになってるらしい
山本の話は興味深いな
256 名前:名無し名人[sage] 投稿日:2017/11/12(日) 17:10:11.32 ID:qYiaoJcH [4/5]
昔
山本「定跡は弱者の戦略」
今日
山本「定跡で勝負が決まるとか将棋の終わりが近づいている」
551 名前:名無し名人 (ワッチョイ 7f1e-fv10)[sage] 投稿日:2017/11/13(月) 12:52:52.36 ID:dd1rb9En0
>>549
人間の間では暗記だけでは絶対に勝てないから影響はない
コンピュータは普通の初形からの対戦がなくなるってだけ
553 名前:名無し名人 (ワッチョイ 7fb3-sJj3)[sage] 投稿日:2017/11/13(月) 12:55:18.07 ID:QBnyEln60
>>551
ただの暗記だけではなく、
プラスでプロ棋士やアマ高段くらいの棋力があれば、影響は大アリでしょう。
554 名前:名無し名人 (ワッチョイ 7f1e-fv10)[sage] 投稿日:2017/11/13(月) 13:01:00.56 ID:dd1rb9En0
毎回相手に二つの選択肢があったとすると60手まで暗記しようとすると
10億の変化を記憶しておく必要があるんだけど
556 名前:名無し名人 (ワッチョイ 7f9d-VvNY)[] 投稿日:2017/11/13(月) 13:15:27.55 ID:vtxX7Gkw0
>>554
実際は優勢になる変化は覚えるのは途中までで良かったり、
手順前後の同一局面や
部分定跡とかも使えるから対人でも有効 将棋の完全解析とか永久機関の発明を主張してるようなもんだし誰もまともに取り合わんぞ >>675
GW5.0.5の導入方法のページで「godwhale_child-evalmerge.exe」を選択しろと
なっていたからだけです。godwhale_child-tournament.exeに変えて、
すべてPonder Offの設定しなおして1秒設定でやり直してみます。 >>683
どうせやるならuuunuuunさん基準1500万〜2000万ノードでやったらいいのに、
数百万ノード以下の計測は1500万ノードとは逆の結果が多いので参考にならない せっかく1500万ノードでの膨大な対局データがあるんだからそれと比較もできるように同じ条件でやるのがいいよね
検討用途のことを考えて長時間でやるのももちろんいい、対局数が確保出来るくらいの余裕があればだけど NNUEkaiの作者さんが1500万ノードと1億ノードの勝率の違いを検証していたので興味深い記事だと思う
詳細はTwitter見た方がいいかも
1手1億ノード500局が終了しました。
QQR/YO4.82 vs AperySDT5/YO4.82(1手1億ノード、投了値3000、引分け256手)
293-19-188(勝率60.5%、R差74.1)
uuunuuunさん(@uuunuuun1 )のレーティングサイト(1手約1500万ノード)によれば、
QQR/YO4.82=4234
AperySDT5/YO4.80=4162
AperySDT5/YO4.82=4137(ただし、対局数が322局と少なめ)
というレーティングになっており、上記1億ノード対局の結果と大差がないのではないでしょうか。
今回の結果から、現時点において、私は、ソフト間の強さを計測する際には、1手1500万ノードの計測で十分であると
考えています。また、1手何ノードが必要だと考えられるのかについては、いずれ計測しようと思います。 200万ノードぐらいの結果は意味ないので検討するだけ無駄 意味ない流れで低ノードで32時間くらい回してみたわ
こんな感じになった
R4260 dolphin2/NNUEkai5
R4230 dolphin2/illqha1.1
R4210 GW7/NNUEkai5
R4210 dolphin1/illqha1.1
(やねうら4.74/elmo27R3800、技巧2R3710の独自基準) >>686
更に調査が進んで100万ノードでも十分という結果が出たらかなり楽になるね >>689
既にロタさんやuuunさんが調べて100万ノードでは不十分という結論が出てるよ >>689
100万~200万ノードと1500万ノードでは逆の結果になることが多いので、仮にソフトAが100万~200万ノードと1500万ノード
でほぼ同じ結果になったとしても、ソフトBでは逆の結果になることもあるので、100万~200万ノードの計測でOKということには
ならないよね >>688
dolphin2が少しだがちゃんと強くなってそうなのがわかるな 100万だの1500万だの、勝手に決めた数字が一人歩きしすぎ
各ノード域で差が出たとして
・二項分布の揺らぎにすぎない
・そもそもエンジンの時間制御が不正確
・単なるノード間の相性問題
以上の点についてはどう解釈するつもりなんだ? >>692
ちなみにdolphin2/illqha2も一応計測はしたのですが… >>693
その考えだとソフトを選択する計測をどうすればいいのか基準が一切ないので次から次へと公開されるソフトを決められなくなるが
あなたがソフトを選ぶ計測方法を教えてくれないとただの批判者になるが ノード数いくらで検証すべきか問題は個人に任せればいいと思っているが、
ノード数による各ソフトのR差の変化の件と、二項分布云々による対局数不足の件は一緒にして欲しくない >>694
illqha2は微妙そうだと作者も言ってたしまあそういうことなんだろう 低ノードなら微妙やけど高ノードならillqha2も同等に強いで >>693
その考え方では細かく1000万1100万1200万・・・・1億1千万1億2千万・・・・10億1千万10億2千万って
細かく1000万単位くらいで各500局計測しろって受け取ればいいのかな?どう考えても無理じゃないの? >>684
ノートPCの人にそんなこと言いますか?
1手30秒かかるわけで・・・
1手1秒で対戦すると150手平均で2分半。
450局やるのに900+225=1125分=約20時間かかります。
これが30倍になると600時間ですよw
25日ぐらいかかってしまいます。
専用のデスクトップパソコンを持ってる方にお任せします。 なんでノートPCなのに計測しようと思ったんだ
買えばええやん
俺は去年キメラだらけになった時期にi7 7700KのPC買ったし>>604はそのPCで片手間に計測した >>700
結局そのスペックだと検証作業をするのは厳しいということだと思うよ
スキルがあるならより強くできる手法を探したり
スキルがなくても検討を重ねて新手を探したりした方が有意義なのでは >>695
そもそもノードにこだわってるのは100万だの1500万だの言ってる連中であって、
じゃあこだわるならノード間問題は、こういう点についてちゃんと解釈できなきゃ意味ないよと言ってる
個人的にはノードがいくらだろうとどうでもいい ソフトの強さをどのノード数で測るかとうことは計算機資源の問題があるので
なるべく少ないノードで決めてしまっても問題ないと私は思います。
もし1500万ノードで結果が違ってたら、1500万ノードでの強さということで
終わりだと思いますけど?
現実のソフトの選手権だとF1並にレギュレーションが出来てきたり
して単なるソフトの強さだけでなくトーナメントを勝つための戦略とか
が出てきたりするわけだからです。
ソフトに求めるものが何かによると思うのですが、私は以下の2つを必要としています。
1.プロの対局においてリアルタイムでどちらが有利か不利か互角なのか知りたい。
2.プロの棋譜をソフトで解析してどの手が悪手だったのか知りたい。
そして多くのコンピュータ同士の対戦を眺めていると自ずと差し手の特徴が
見えてきました。
基本的に数の攻めで相手の守りを攻略しようとします。
守る方も弱いところは数の攻めにまけないように守ります。
私自身はそこまで将棋が強くありません。30年前に道場で
初段でさしていたぐらいで藤井君のお陰で再び将棋に興味を持ちこのスレに
まで出没するようになったクチです。 >>703
その考えは結局秒読み計測はあてにならないのでソフトを選択する基準は存在しないから計測しても無駄で
適当に大体の計測をして適当にソフトを選択したらよいわけね、あなたの考えは分かったよ 1日制と2日制みたいなものだろう
1500万ノードと100万ノード、両方で強くないと真のチャンピオンとは言えない ノートPCしかないならAWS使うといいよ
高NPSで熱や電気代も気にしなくていいし 短時間少ノードで検証するのはいいけど、
その場合NetworkDelay1、2とMinimumThinkingTimeの設定も明らかにしてくれや
前者はネットワーク遅延対策として、
残り秒数が指定のミリ秒を切ったら直ちに指すという設定
後者は一手の思考に少なくとも指定したミリ秒を費やすという設定
この設定がデフォルトのまま、
持ち時間1〜2秒で指させたらどうなるか分かるよな >>706
それを言うなら1500万ノードとそこそこ長時間のフィッシャールールでだろ 早指しに強いソフトと持ち時間長いのが強いソフトがあるってこと? >>706
1500万ノードと100万ノードなんて
NHK杯とアベマの5分+5sのフィッシャーみたいなもの >>653
総当たり=初期配置から可能な局面のみを対象。
詰み&必至を発見するためには、見逃し後の変化も含めて探索が必要。
もちろん、詰み必至探索でもαβ的な後方枝刈ありで、探索範囲を狭めるのは常識。
君は自分でプログラム組んでみれば良い。 >>713
> 総当たり=初期配置から可能な局面のみを対象
チェスの終盤データベース(「残り駒数○個以下は完全解析済み)は
そういう作り方してねーからw
> 詰み&必至を発見するためには、見逃し後の変化も含めて探索が必要。
あれあれ? これ総当たりじゃないよね?w >>679
オセロの場合10年くらい前の状態で、残り40手(最初から20手は定石使用)に
ついて、いくつかの定石は完全読み切りができている。これをパブリックドローと
呼んで、最初の20手についてお互いに合意の上で特定の定石を採用すると、
40手目以後引分が確定するというだけの事。
>>673が言っているレベルの事は既にやっている人がいる。
そして、その前の20手にどういう変化があるのかはわかっていない。
F5F4(平行オープニング)が、黒有利なのは、コンピュータで解析するはるか以前
から知られていた事だし、8×8オセロがおそらく引分ゲームである事も、昔から
言われていて、あなたが上げた例は、これだけコンピュータで解析しても、昔から
言われている事を同じ程度のレベルで認識しただけで、いまだ答えは出ていない
という事に他ならないのよね。
ちなみに、4×4は1秒かからずに完全解析完了する。
6×6は、まだ解析完了したというニュースを聞いていない。 >>714
チェスのエンドゲームのデータベースも合法局面のみでしょ? >>714
チェスの終盤データベースは、駒の数絞っているから。
コンピュータで把握可能な有限の数に収まる範囲のDBしかない。
チェスは、駒を打つ事が無いから、残り駒数が減ったら終盤近いとか、
そこまで行ったらチェックメイトが存在しないとかできる。
将棋は、持ち駒を打つ事ができるので、残り駒数は永遠に減らない。
>あれあれ? これ総当たりじゃないよね?w
意味がわからん。
恐らくだけど、君と僕とは、使っているテクニカルタームの種類が違うようだ。
だから、会話が成立しないんだな。 >>710
それがあるのは間違いない
どっちが偉いのかという議論
自分的には、自分の環境、検討に使う時間での強さ、信頼性が分かればいいって話だな
そういう意味では1500万ノードもあれば充分すぎる
もっと言えば過剰ですらある 1500万ノードが絶対に正しいなんてuuunuuun氏も開発者も言ってないだろ
統計を取るのに現実的に出来る範囲のノード数で対局数を稼ぐために設定しているだけであって
将来いまのi9程度が家庭用になればそりゃノード数も見直されるわ
棋譜がないものは信用(証拠)しないし個人でやりはじめたのに誰からも信頼されるuuunuuun氏のやり方と
何もせずにグダグダ文句つける馬鹿と比較するまでもない
100万でも悪いわけじゃないし棋譜添付して統計つみかさねれば逆の統計になるかもしれない
100万と1500万もかわらないと文句つけてる馬鹿は自分の好きな方法で統計でしてみろ >>719
1500万で過剰って検討時に一瞬しか読ませないってこと? >>715
6×6ってとっくに完全解析されて後手必勝なんじゃないっけ? >>683
> >>675
> GW5.0.5の導入方法のページで「godwhale_child-evalmerge.exe」を選択しろと
> なっていたからだけです。godwhale_child-tournament.exeに変えて、
> すべてPonder Offの設定しなおして1秒設定でやり直してみます。
ちょっとだけ試したらGW5.0.5はAVX2でやると弱くなるみたいだ・・・
https://i.imgur.com/vzoRp5V.png >>711
分からないこと言っているのはそっちじゃん
長時間検討でも使える優秀なソフトの選択に具体的な計測方法も明記出来ないでよく言えるわ とりあえずillqha1.1がベストっぽいのはどの計測でも共通しているね >>725
設定によってはAVX使うとCPUのクロック下げる設定になってたり
サーマルスロットリングでクロック下がってるたりとか >>725
RyzenならSSE4.2の方が強くても特に不思議はないけど多分違うだろうからサーマルスロットリングでクロックダウンかな
そもそもの対局数少ないからよくわからんけど >>726
長時間検討!1500万!ってこだわってるのが自己矛盾してるんだよ、あんた
◯◯ノードでは意味ないと言いながら、
△△ノードや複数ノード域の計測は現実的じゃないから1500万ノードで十分って
そんな論理が通用するとでも思ってんの? >>730
誰も1500万ノードだけで十分っていっていないよ、これが現実的に統計数を取るには適している
100万単位づつノード数を変えて細かい間隔で計測し、なおかつ十分な統計数を取ることは現実的に
時間がかかり過ぎて誰も出来ないだろ、君の言い分は誰も実行不可能なことだらけだわ 1500万が長時間みたいな言い方を見かけるけど1500万は短時間だよね?
もちろんスペック次第だけど一般的なイメージとして
じゃないと5000万くらいでも超超長時間みたいになるような 1500万ノードの結果はNNUEkaiの作者やロタ氏の計測で長時間の計測と大差ないことが分かっている
ロタ氏の計測や自分の数か月に及ぶ計測からも100万〜200万ノードは1500万ノードとは逆の結果になる
ことが多いことが分かっている >>731
1500万以下で一発測定でも何も問題ないわけだけど?
1500万にこだわってるのはあんたでしょ?
100万単位で区切って全部取れとなんて主張に仕立ててるのもあんたでしょ?
1500万以下ではおかしいというなら、それを証明しなさいよというだけ >>734
だから100万〜200万ノードは1500万ノードとは逆の結果になることが多いから無駄だってさっきから言ってるだろ >>735
それを統計的かつ一般的な結論としてもっていけてないからいってるんだろ 1500万ノードではA>B Aの勝率55%でも
100万〜200万ノードでA<B Aの勝率45%
のように逆の結果になることもあるし、同じ結果の場合ももちろんある
だから100万〜200万ノードはどっちに転ぶか分からないから計測には適さない ◯◯ノードではA>B Aの勝率55%でも
1500万ノードでA<B Aの勝率45%
のように逆の結果になることもあるし、同じ結果の場合ももちろんある
だから1500万ノードはどっちに転ぶか分からないから計測には適さない
なんとでも言える そういうのを定量的に言うためには、
100/200/400/800/1600とプロットしていって、収束していくかどうかの傾向をみるしかない。
(100刻みは無駄なので、倍々で可能な範囲が妥当だろう) このスレの計算資源で教師作ればそれなりに作れそうなのにな >>742
書かれてる手順、棋譜や定石ファイル化したり
本の言うとこが正しいか確認したり
本で以下先手優勢で書かれてないその後の手順確認したり >>735
>100万〜200万ノードは1500万ノードとは逆の結果になることが多いから無駄だってさっきから言ってるだろ
逆になること多いって自分で調べたの? 1500万ノードより増やしたときAがBより強くなるとわかったところで
Cが1500万ノードより増やしたときに強くなるかどうかなんてわからないのだから
1500万ノードだから十分とか結論出るわけ無いだろ 現時点では、1500万ノードあればそれ以上ノードが増えてもそう大きく対局結果は変わらないだろうと言う事じゃ無いかな
実験や経験則から来るものでしょうが、それに対して対局結果で否定する意見が無いような
其れなりのPCやAWSを借りられる予算のある人が集まれば詳しい検証は可能かもしれませんが、そこまでやる意味を感じない人がほとんどだと思います >>745
一つだけピックアップしたけどノード数で逆の結果になったもの
去年公開されたaとbを18gouのコマンドでキメラにしたものを去年計測したもの
キメラab 266-19-215 aperypaq 一手100万ノード 定跡なし 対局数500局 勝率55%
キメラab 219-26-255 aperypaq 一手1500万ノード 定跡なし 対局数500局 勝率46% >>749
棋譜は人に見せる目的で計測したわけではないので保存はしていない >>743
本で以下先手優勢で書かれてないその後の手順確認したり
これは本当にあるあるだな
こっちが優勢と言われてもそこまで優勢に見えないという >>749
勘違いしてた、大分前なので計測は去年の12月ごろかと思っていたら今年の2月ごろの事だった >>749
対局設定や探索エンジン何使ってるか書かないと >>749
あと、他にも逆の結果になったのは?
まさかそれだけじゃないよね? >>725
> >>683
> > >>675
> > GW5.0.5の導入方法のページで「godwhale_child-evalmerge.exe」を選択しろと
> > なっていたからだけです。godwhale_child-tournament.exeに変えて、
> > すべてPonder Offの設定しなおして1秒設定でやり直してみます。
>
> ちょっとだけ試したらGW5.0.5はAVX2でやると弱くなるみたいだ・・・
> https://i.imgur.com/vzoRp5V.png
2回戦だと少なすぎるかもということで4回戦版の実施しました。GWCはSSE4.2
に戻して実施しました。
https://imgur.com/gallery/tXBqk5E
今現在はGW505のSSE4.2版とAVX2版をリーグ戦に参加させて計測しています。
まだ始まったばかりですのでこれから出かけるのである程度結果が出たらまた
ポストします。
https://i.imgur.com/WRyszpF.png やねさんによると8×8のオセロの完全解析も現実の話になってきているようだ。
囲碁9路盤も近いうちには・・・
将棋はまだまだ無理だろう オセロの完全解析はグーグルが金ぶっこめばそれこそ3日でできそう 新規で興味もってくれる人が増えるのはいいことだけどなんというか話題がな
NNUEは入力の特徴量を256×先後の512次元にしてるけど本当に512次元も必要なのか
隠れ層を1層増やすことと今のままニューロンだけ増やすことのメリットとデメリット
とかそういう話題で盛り上がっててほしい NNUEは素晴らしい発明なのにここではなぜかあまり話題にならないよな
SDTがあったらやねさんが∇評価関数を完全体にして出てきてNNUEと激闘を繰り広げるのをみたい >>761
> 盛り上がっててほしい
他力本願だな、まず隗より…というより
常識的に考えて製作者より使用者のほうが何桁も多いのに
こんなところで製作者が議論してもすぐに薄まってもったいなくないか? 最近はもう開発者がここに書き込むことはほとんど無いんじゃないかな
別に開発者じゃなくても好きに議論したらいいと思うけどね >>763
そうそう、話題にならなさすぎて不自然なレベル
きっと学生が夏休みだからなんだろう
∇評価関数はメモリやばそうだから出てくるなら選手権? NNUEは本当ならNNのサイズは大きくして表現力マシマシにしたほうが検討するとき嬉しいけど
大会で勝ちたいならそこそこのサイズにしておいてNPS出したほうが勝てるんだろうな Ditto3/illqha1.1をDolphin1/illqha1.1と対局させたところ
400局で勝率44%台と、illqha2以外の評価関数との相性が悪そうだったので
評価関数との相性差が出にくいようにマイルド調整
https://i.imgur.com/6s9PidB.jpg
https://i.imgur.com/XOyVEzd.jpg
https://i.imgur.com/ekEMljM.jpg
godwhaleベースですとスマホ化がどうも上手く行かなかったので
土台部分をgodwhaleからYaneuraOuに移し替えています
スマホでoption.txtの入れ替えは無理があるので
android版のみパラメータの設定項目は選択式にしてあります
自分で数値を調整する場合には「手動調整」を選択してください
https://i.imgur.com/qMF4GJf.png
オプションファイルは設定項目の変更があって混乱するので
「ditto4_engine_options.txt」という名前に変更しています
上記の名前にしないと読み込まないので注意
PC版
https://1.bitsend.jp/download/2a484dc4a3eff42c3952a691fe0d93e1.html
スマホ版
https://1.bitsend.jp/download/1848c98105552feb1d36bd8298baa9fb.html >>767
参考データで計測に利用しているGAMMA2 の数値は150ですか
それとも157ですかはっきり明記してください
どちらの数値でも支障をきたす事がないのならその旨を明記
してください 強さに関わる更新はしばらくないので
一応保存期間の長い斧にも>>768をアップロード
https://www.axfc.net/u/3932358
>>769
エンジンの実行ファイルと
同じフォルダに同梱したオプションファイルそのままで計測しています
つまりGAMMA2の数値は157の状態で計測しています
150との比較は有意差を出すのに必要と予想される対局数が多すぎるので未確認です
本家のやねうら王ではGAMMA2の数値は51になっているので
150と157の違いでは支障をきたす程の差は生まれないとは思いますが
測定結果と揃えたい場合には同梱したファイルそのまま(157)で利用してください このスレが物語ってるようにもうコンピュータ将棋開発はオワコン。
山本はいい時期に引退したよ むしろ開発者は増えてるわけだし、このスレがオワコンなだけでは Noviceの人とか海底の人とかQhapaqの人とか、
Twitter見る限りやる気ありそうだよ >>768
お疲れ様です。
スマホ版も出していただき、ありがとうございました。 オワコンって言うより、昔の状態に戻ったってだけだな
人間超える前後はそりゃバブルになるのは当たり前 >>768
SSE4.2版もよろしくお願いします。 illqha2の評価値が不安定なのは少し気になってる >>772
そういえば山本さんって引退後、次の分野で活躍するような進展あったの?
教化学習のための資金がなくponaを強くしてくれる有能なパートナーも失ってやむなく引退したと思ってた
引退表明時に「コンピュータ将棋卒業して次のジャンルへ進みます」
とか言っていたけどプログラミングやシンギュラリティがどうのとかのツイートと
将棋をベースにした人工知能の、毎回似たような内容の講演をあちこちでしているようにしか見えない 一時は囲碁に行こうとしてたけど、結局途中でやめちゃったもんな
どの分野にいるのやら 大渡さんも彼はマネタイズの人って言ってたし
そういうことでは? 対戦回数が少ないので一概には言えないが以下の感想を得た。
1.探索エンジンはnnue-w7-ditto3が良さそうだ。
なおditto4については今追加して計測中です。
2.評価関数ではKai5が意外と強かったのは驚きだった。
特にnnue-w7-ditto3との相性がよくトータルでの成績に貢献している。
といってもillqha1.1とはほとんど差がないので次やればどうなるか・・・
今回はillqha2の出来が悪く驚いた。
これまでの自分の感触だとそこまで悪くないと思ってたから・・・
https://i.imgur.com/qeDXmyd.png
リーグ戦の条件設定:
1.秒読み1秒
2.相手手番中の先読み(USI_Ponder):なし
3.ハッシュメモリ(USI_Hash):1024MB
4.NetworkDelay:0
5.NetworkDelay2:0
6.MinimumThinkingTime:1000
7.BookFile:nobook 本業がボンクラだから素人相手の電波芸者やってる評論家に似てるんだよな
引退してからの文章で勉強になるなと思ったことがない 「将棋電王トーナメント」終了のお知らせ
株式会社ドワンゴ(本社:東京都中央区、代表取締役社長:荒木隆司 以下、ドワンゴ)は、同社が主催する最強コンピュータ将棋ソフトを決める大会「将棋電王トーナメント」を、第5回をもって終了することをお知らせします(2018年は開催なし)。
2019年からは、コンピュータ将棋協会(会長:瀧澤武信)が主催する「世界コンピュータ将棋選手権」に引き続き協賛するとともに、新たに「ドワンゴ賞」を設定し、1位から3位までの入賞者に賞金を贈呈することを決定しました。
http://dwango.co.jp/pi/ns/2018/0827/index.html >>785
10月に開催するとかいう怪情報は何だったんだ >>785
あー、無くなったか
結構毎年楽しみにしてたんだけどな 検討用ソフトは選手権の成績を参考に適当に引っ張ってくるのかな? ドワンゴの社長って川上じゃなくなったのか。その影響もあるのかね? ハード縛りなんて無意味なレギュレーションだからな
今は、計算機資源の殴り合いになってるもの ニコニコの経営のヤバさがよく分かる
決算もニコニコの部門が赤字になったしな 大会でのきふわらべを棋士が解説するの好きだったのになぁ 予算が確保できないんじゃ仕方ない。
叡王戦も打ち切りとかにはならなければいいけど。 >>785
SDTを打ち切ったのでプロ棋士のネット対局の棋譜解析に使用するために
WCSCのTOP3に賞金を出すことにしたというのが本音か いまのソフト対戦は探索部や評価関数の優秀さを競うだけじゃなくて
定跡ファイル合戦になってきたせいも大きいな
優秀な検討用ソフトを採用するためにトーナメントする意味がない
結局いまもぽんぽこだけじゃなくてポナンザを併用して使ってる訳だし 統一ハードとハード無制限で半年毎がバランスよかったのにな
たっぷり開発期間とれたから来年はNNUEが霞むような超新星が出てくるか abema将棋ソフトトーナメントはよ
abemaはニコ生以上に初心者向けの解説してるけど評価値見せたほうが将棋素人にはわかりやすいぞ 将棋ブームが起こり過去最高レベルで将棋が盛り上がってる時期に終了するコンピューター将棋大会
これが人類を遥かに超えた強さを得たコンピューター将棋の現実である
ソフトが人類を超えてプロ棋界は終了、これからはソフトが将棋の中心となる
などと妄想を嬉々として語ってた人も現実を知るべき 将棋が過去最高に盛り上がったのは2017年の話だろ 「人間vsコンピュータ」の命題が終わってしまったから、仕方ないね >>723
10×10以上では先手必勝になるらしいという予想もある >>757
まずは5五将棋の完全解析を目指すのが現実的だろう >>789
株式会社カドカワができる前からすでに社長ではなかった 結局コンピュータ同士の将棋は魅力的ではないってことだな 手前味噌と思うかもしれないが、ソフトがない頃はプロの将棋を観戦していてもモヤモヤすることが多かった
なんでここでこう指さないんだろうと
それがソフトで最善手がわかるようになってからは自分の読みと同じだからスッキリできるようになった
もっと早くソフトが出ていたらプロを目指していたかもしれない >>810
囲碁は全然そんなことなさそうなのが興味深い
> インターネットの対局サイトには囲碁AIが常駐しており、日々トップ棋士との練習対局が公開されていて、
> 5000人以上の観戦者を集めている。さらに、深夜に盛り上がっている対局をのぞいてみると、
> それはAI対AIの対局だ。これも日々、数千人が観戦しており、中国の囲碁ブームの熱さは計り知れない。
> 中国企業が囲碁AIを開発するのは技術面だけではなく、宣伝効果も大きいのだろう。
https://diamond.jp/articles/-/178038?page=2 1年に1回しかソフトの競技会を見れなくなるのは残念だな、半年ごとを楽しみにしていたのに、競技会で定跡使用
する場合10手くらいまでに短く手数を縛ったルールの方が探索や評価関数の性能勝負の比重が増えるので見ている
方は面白い、定跡勝負の将棋になるほどつまらないものはない >>813
中国で数千人の観戦者ってめちゃくちゃ少ないイメージなんだが 定跡疎かにするのって将棋弱いんだろうなぁって思うけどww 興味がなくなったらそれで終わりってのも薄情だな
チェスなんて有志が資金集めて長期間の測定兼大会を開いてるのに
日本人は文化や科学への投資が少なすぎるね 今の日本はとにかく金がないみたいだから、投資できないんだろうね。
それでも今はぐっとこらえて未来のために金を使うってのをやらない限り、衰退は続く。 >>817
まあコンピュータ選手権のほうにはスポンサーとして賞金出すみたいだし、単に電王トーナメントはニコニコの番組としては無価値だと判断しただけでしょ 総投資額がそのままな分けないだろ
これから漸減していくよ そんなん知るかよ
20年ぶりにコンピュータ選手権に賞金贈呈って記事があるのに、興味がなくなったらそれで終わりとか的はずれな指摘してるのが気になっただけだわ ソフト同士の対局は観戦していてもハラハラドキドキがないのが欠点だよね
大体が指し手が早すぎて手を吟味して観戦できないし
プロの将棋なら自分も気分が一緒になって考えられるし、いつ疑問手や悪手が飛び出すかわからないから面白い
勝勢ならどう勝負を決めるか、敗勢ならどうやって粘るか、いろいろなバリエーションを楽しめるのもいい あと叡王戦本戦が去年の11月末開始から
今年は10月開始になって
電王トーナメントにさく
将棋運営のリソースが足りなくなったんじゃないか 電王トーナメントやらないのなら統一ハードで「次の一手選手権」をやったらいい
過去の実戦から正解手を早く見つけるのが難しい50問を用意して採点する
点数が同じなら早く正解したほうが順位が上ということでどうだろう
問題は公募して決めてもいい
問題は試験開始と同時にネットにも上げてプロに解説してもらいながらの実況放送がいい 対人間用のソフトを選抜するのが当初の目的
目的がなくなった時点でソフトの大会は他でも行われているから
削り合うより一つの大会を盛り上げていくほうが良いという見方もある >>827
WCSCの方に協賛・賞金も出してれば、
電王盤解説にも使えるんだろうし、経営判断としては妥当なところなんだろうな >>815
ガバガバ換算だけど、
日本で500人視聴!大人気!
とか言ったらギャグだよね SDTは対局ソフトの評価値が見れるのが良かったのになあ >>828
SDT5のルールだと第26条に
>本大会終了後、1 位から 5 位となったソフトは、ドワンゴが主催する将棋放送・イベントでの使用において、主催者ならびに主催者の認める者に対してソフトウェアの使用を許諾するものとする。
とあるから、使えるけどWCSCだとこういう文はないので個別に許諾とるのじゃないかな
それでもクラスタ専用ソフトとか特殊なハードを要求するものはニコニコでは手に負えないかもだけど >>813
囲碁はコンピュータが人間を上回ってまだ3年くらいだから、将棋でいえば電王戦真っ最中の目新しさで盛り上がってた時期では
この先も人気が持続するならすごいけど >>832
コンピュータ囲碁は、布石において道策、呉清源に続く第三の革命ともいえるものを生み出したけど
(しかも鉱脈が尽きる気配が全然ない)
コンピュータ将棋は、定跡においてそこまでの革命を生み出したわけじゃないってのもありそう >>834
むしろ「やっぱレーティングサイト続けるしかないのか」みたいになってる件 >>835
見てきた
確かに「同一ハードで比較した場合の強さ」の情報は、レーティングサイトでしか得られなくなるから、今後はむしろ需要が増えるかもね 河童謹製の多機能レーティングサイトが今後重要な位置を占めそうだな >>834
まあuuun氏が引退するっていうのと、ドワンゴが辞める理由ってのは、
根本では同じようなことじゃないのか
山本氏が引退したのも含めて 許諾より運用サポートが必要なのかなと思ったり
繋いで動かすところまでは開発者のサポート貰わないと え?GPL-3.0のソフトって商用利用し放題なの? >>842
再配布には多少条件があるけど、ニコ生みたいにサーバー上で動かす分には問題ないはず ほー、じゃあ勝手にウォーズみたいに使ってもいいわけか GPLライセンス繋がりだけど
将棋神やねうら王に付属している
読み太とQhapaqの2018年版のソースコードってどこ?
保守の関係で評価関数だけ取り入れて探索部分はやねうら王って事なのかな? WCSCも来年で最後の可能性があるんじゃなかったっけ >>847
WCSCは毎年参加者増えてってるのに何で最後にする訳? >>849
運営の高齢化や現在のコンピュータ将棋に対応しきれない所とか
今年みたく高手数長期戦が増えてもそれに対応できるよう開催日程や時間伸ばすのは難しいから floodgate風の特設サイトを作って
オンラインで殴り合えば経費も浮くだろうけど
開発者のオフ会みたいな面が削がれるから楽しくなさそう WCSCが終了するのは運営側の問題もあるけど
参加ソフトがやねチルドレンばかりになって学術的な意義がなくなったからだろ
肝心のやねうらおは裏でニヤニヤして見てるだけだし
優勝ソフトはアンチコンピュータ戦略の優劣で決まるし 運営の高齢化は深刻らしいなー
もう30回近いのに運営あんま変わってないって前に聞いたような WCSCは部外者としては日程を短縮するなりして続けてほしい やねさんが本気を出して有終の美を飾って一旦の区切りなのかな 学術的にはルールを調整すれば問題ないけど、
手数の長大化って、ゲームとしては死活問題なんだよね 誰かやねうら王の詰将棋エンジンが公開されているのでビルドしてくれ
出来ればAVX使わないSSE4.2までのやつで SDTが終わるのは必然すぐる
PVで人類不在と言ってしまった以上、続けるとしたら
次は人類不要といわざるおえない 全体的にソフトの強さは頭打ち、SDT終了、将棋神やねうら王完成…
このまま、やねうらお氏も引退かと思っていたが、まだやる気あるんだな illqha1.1から強くなっていないという意味では頭打ち illqha1.1が公開されてから一ヶ月ちょいしか経ってない
aperypaqは公開から半年間トップだった Webmasterより
Eternal Blue さんへ
こんにちは
将棋倶楽部24の席主です。
この倶楽部24は、下記「守ってね」にあるように、
https://www.shogidojo.net/info/rule/access/
どのような理由があっても不愉快Chatは厳禁です。
2度目のイエローカードです。
このままでは他の会員の方の迷惑となりますので
残念ですが、会員停止いたします。
ごめんなさい。
将棋倶楽部24 席主
・24の内情を他の人にばらされるのが怖いので、抹消しました。
(お客が少ないので普段は有段タブで棋譜並べしている、級タブには過小しかいなくて適当に緩めてる)
・将棋指しは、ばれなければどんな卑怯な事もします。 >>864
そりゃやね師は賞金出るってなったらやる気出すからな。
でも一体いくら出るんやろ^^; やね先生にとって賞金なんて一ヶ月のお小遣いにもならないんじゃ、、、 別に年収と賞金の割合でやる気が変わったりはしないだろう。
趣味の大会で、順位に応じてうまい棒最大10本くれるって言われたら、「よっしゃ次は10本ねらうぜ!」って感じにちょっとやる気出るでしょ? Ditto4/illqha1.1とDitto4/kai5ってどっちが強い? >>850
むしろ256手引き分けが増えるのは、チェスと同じで「ゲームの幅」を増やす上では
歓迎なんだけどな個人的には
弱い者が強い者に引き分けに持ち込めるか、強い者が弱い者に引き分けを甘受するか
リスクを負って勝ちを取りに行くか、これがチェスでは醍醐味でもあるので 藤田綾がアマ二段ぐらいの頃
森田・金沢・柿木と当時の最強ソフトと平手三面指しで敗北 大会として観戦できる機会が単純に一回減ったのがなあ WCSCの運営スタッフ(ボランティア)を募集したら
優秀で元気な若いスタッフが集まるかもしれない
募集条件のひとつに”会場に電車バスで60分
以内で来られる人”という項目を入れて
有名大学を出てもヒマな奴が結構いるから
数人位集まるかも・・・
それと大会参加費を10万円ぐらい徴収したら
冷やかし参加が減ると思う 会場が高田馬場や川崎ならいいがかずさアークだったら話にならんぞ >>783の続きはまだか!!?
割と楽しみにしている そこで最近流行りになってるボランティアの募集ですよ WCSCまで終わったら、以前の状態に戻ったとは言えないな。 ずいぶん前に人間越えたチェスとかではどうなってるんだ? 110.44sったショタコンさんさすがに損切りしてるよなww >>879
誰が10万も払って参加するんだよ・・・
ボランティアといい、JOC脳か? >>887
stockfishみたいなコミュニティがあるから開発自体は延々続いてる
トッププレイヤーのトレーニング用に商業版の需要もあるから
stockfish以外も強くなるので dolphin/illqha1.1又はdolphin2+illqha2で、CPUクロック(XEON)が最大まで上がらない(1割減)のは俺だけ?
ちな、他のエンジンは問題なくターボブースト全開。 他のエンジンって何だよ具体的に挙げなきゃわからないだろ 893wに怒られたので今もっかい調べたけど、以下の組み合わせは問題なかった。
Godwhale5.0.5/QQR
Godwhale5.0.5/Qzilla9
YaneuraOu V482/Apery_SDT5
YaneuraOu V482/elmo
以下はクロック1割減。NNUEと俺の環境相性(XEON E5 V4)なのか・・・。
dolphin2/illqha2
dolphin1/illqha1.1
dolphin1/NNUEkai5 NNUEはSIMD命令使いまくってCPUを酷使するから発熱が多い
発熱が多いからターボブーストが抑えられる
これだけの話だと思うんだが >>895
スレッド数を減らすorコア数以上にしてもクロックダウン挙動は変わらず。
メモリは16GB、Hashは2048なんだけど減らしても同じ・・・。
CPU温度は全コアMaxブーストでぶん回して60度、クロックダウン状態だと50度安定なので冷え冷え。
頭に来て、同じXEON E5 V4でコア数違うCPUを試したけど、同じ・・・。
で、質問に来た今ココorz >>895
1thred
Memory 256MB
Pentium4 3.06Ghz 分かったかも。AVXを連続使用するとクロックダウンするそうな。
CPUによって下げ幅が違うので、最新だと有利が拡大する可能性もあるという事か・・・。 クロックダウンを差し引いてもNNUEが最強だから特に問題はない 32bitPCでは発売されたやねうら王が最強でいいのかな?
でも人間用の定跡は入ってないよなぁ。対局は激指で解析はやねうら王にしようかな WCSCの賞金を、単純な順位順ではなくて、
・ライブラリ不使用者(自作ライブラリ使用者を含む)
・特定ライブラリを使用した者の中の最上位者
として過去3大会(大樹の枝解放後)の上位3つを出してみる
2018 Hefeweizen(1位)Apery(3位)nozomi(11位)
2017 elmo(1位)Ponanza(2位)技巧(3位)
2016 ponanza(1位)技巧(2位)大将軍(3位)
うん、やっぱり上位勢がみなライブラリ組ということを考えると
賞金に関してはライブラリ制限入れたほうが良さそうだ
順位にはライブラリ制限を入れないこととのバランスが取れる まあそこらへんはうまいこと考えるだろ
別にライブラリが悪だとは思わないけどフルスクラッチ勢を褒め称えたいのもわかる
ここ最近だとelmo絞りもNNUEもすごい発展をもたらしてると思うが
フルスクラッチしか認めない世の中だったら果たして生まれたかどうか
いいものがあるならありがたく使えばいいでしょ >>904
うん、だから順位と独創賞の中間にドワンゴ賞を位置づければいいんじゃないか、って視点 ドワンゴ賞は順位だと思うな
皆が強いと認めるソフトをニコ生で使いたいわけだから >>906
言うて優勝すれば自動的にドワンゴ賞になるぞ、上の方式でも 一般人に還元されるのはむしろライブラリ勢のアイデアの比率の方が高いけどね
elmoもnnueもqhapaqもライブラリ発だし ライブラリでもパクリじゃないと認められるような改良が加えられていれば全然問題ないでしょ >>898
BIOSでAVX走らせると自動でクロックダウンする設定がある
Xeonならそもそも設定変えられない可能性もあるけど スクラッチからですが探索部はStockfishを参考にと言う名の写経ですは独自勢なのかとか Stockfishの探索を将棋用に改良にするのが強すぎるししかたない >>911
むしろ上位ソフトかつライブラリ不使用、または本家のうち
探索部がstockfishベースじゃないソフトってあるのかな
やねうら王、Apery、技巧、読み太、nozomi、・・・
全部stockfishを参考・流用にしている気がする
将棋ファンの間では神のような存在として崇められているponanzaも
ソースコード自体は非公開だけど過去の山本さんや平岡さんのツイートから判断するに
おそらくは結局stockfishベースだと思う というかStockfishを全くベースにせずにStockfishより強い探索書けたら相当の天才だよな 電王戦が始まる前後まではトップをキープしていられたけど、
stockfish勢のオープンソース化が始まってからはWCSCでも2次予選敗退が目立つようになった 探索部はstockfishには勝てないだろう
chessで半端ない試行錯誤と莫大な検証で作られてるからな
将棋とchessは違うと思ったが結局一緒らしい
結局将棋独自といえるのは保木さんの3駒関係と学習だけだな 自分の実戦をいくつかのソフトで解析してみたけど、強さに差はあってもグラフの推移は大きな差はなかった
読み筋とか諸々の部分で技巧がいいと感じた
最新ソフトと500はレート違うはずなのにグラフの形がほとんど同じって不思議 技巧て今更推されてももう今後何の進展も無いでしょ^^; 技巧は公開当初は神かと思ったわ
人間の感覚に近く、あの圧倒的王者ポナンザに最も近づいていた感じだったしね >>926
あなたの環境ではどうなるか試そうとは思わないの? >>925
現象だけみるとKai5だけ読み探索の深さやノード数が毎回相手を上回っている。
全部同じ設定にしてあるはずなので不思議だ・・・
https://i.imgur.com/VusVota.png 単純に同じ設定じゃないんでしょう
ほぼ確実にスレッド数を間違えてる >>926
今調べたら設定ミスでした。
全てのレスは無視してください。
なぜかKai5だけ相手の手番で読むようになっていました。
https://i.imgur.com/VxyW1vr.png あなたの環境ではどうなるか試そうとは思わないの?(キリッ アルファ将棋に価値があるとすれば、MCTSでstockfishより優秀(と主張)な探索作ったことだな とりあえず現状Ditto3がベストっぽいのはわかった 短時間調整だから時間伸ばしたらあっさりdolphin2が一番強いとかなりそう 教師って時間じゃなくて深さ制限で作るから超短時間で強くてもあんまり関係ないような >>936
同じ強さで時間が短くなればdepth上げられるし
同じ時間&depthで強くなれば学習の質が上がる
どうせNNUEも計算資源投入して殴るルートに入るんだから 枝狩りなしの全幅探索すれば深さ制限では鬼強だろうし意味ない
深さと時間のバランスが重要 山口さんって産総研勤めからフリーになるのか
どこに勤めているかまではこれまで明言していなかったと思うが 来年のWCSCでは、KPPTとNNUEの勢力図はどうなっているかな 将棋神やねうら王を購入すると
Qhapaqのソースコードの請求権が付いてくるはずだから
その内容次第ではKPPT勢の躍進もありえそう 前にこのスレでuuunuuunさんの測定基準を自分の解釈で勝手に書いたことがあるので誤解がないように念のため
Twitterから転載しました、以下uuunuuunさんのツイートより
私のところの測定基準について、一部誤解があるようですが、Core i7 4スレで一手五秒程度、やねうら王&KPPT
評価関数の場合中盤で一手1500万ノード相当なのですが、ほかのソフトでも一手五秒で測定しています。
同じやねうら王でもNNUE型の場合NPSが小さくなりますが同じ時間で対局させるので一手当たりのノード数は下
がります。また、探索部がApery, nozomiなど異なる場合NPSはソフト毎に違いますが一手当たりの時間の方をそ
ろえています。あくまでも持ち時間を同じにしたときにどちらのソフトが強いかという判定法です。 AVX+ターボブーストできるBroadwell-E以降だとさらに差が開く可能性大。 AVX512を多用するXeonPhiの発熱量は半端ないからな
Intel何か設計を間違ってないか
XeonPhiは開発終了になったが チェスはほぼ引き分けだから
単純に輸入して上手く行くということはなさそう やねさんのMyShogi、EXEファイルではずっと提供されないのかなぁん? まだDLしてないけど普通にビルドできないとかあるの? >>953
自分が開発環境を入れてない
&入れればできなくはないと思うけど、開発者じゃないから時間かかりそう。 将棋神やねうら王、開発者はβテストに無条件で参加受け付けてたよな
実質的に開発者には無償配布ってことか… 最初から期日に間に合わないのに仕事を受ける手口
詐欺師のやり方
やねうら王のこと? 開発者にベータテスターになってもらうんだから無償ではないでしょ 春はスペック無制限の大会
秋は同一ハードウェアの大会
両方があってちょうどいい感じだったのに無くなっちゃうのは残念(ただの視聴者だけど)
誰か藤田さんに同一ハードウェアの大会やってくれるように進言してきて
abemaがコンピュータの評価値導入して田村先生に番組中わんこ蕎麦でも食べてもらうくらいのバラエティ要素も取り入れてくれればニコニコプレミアムやめられるのに コンピュータ将棋すら排除して
バラエティ要素のみの方が視聴者多そうな現実を突き付けられるからダメてす 麻雀に入れ込む藤田晋がデジタルの極みのコンピュータ将棋など興味あるわけなかろう Abema社長に限らずコンピュータ将棋なんて極一部以外誰も興味ないから 藤田さんはIT企業立ち上げてるけど元々営業畑の人だよ 総当たり2回戦の結果
https://i.imgur.com/J7VCn3o.png
これからもう一度やろうかとおもってます。 出来れば通しで6回戦やって欲しいかも
Dittoは強そうな4Sだけ残せば対局数を節約できるでしょう 今日の近藤−藤井戦の感想戦を見ていたら、この局面から後手の藤井聡太が秒殺で先手玉を詰ましちゃったよ。すげーーー
後手の持駒:角 銀 桂二 歩五
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・ ・ ・ ・v玉 ・ ・v香|一
| ・ ・ ・ ・ ・ ・ ・ ・ ・|二
| ・ ・v桂v金v歩v歩 龍 ・ ・|三
|v歩 ・v歩 ・v銀 ・ ・ ・ ・|四
| ・v飛 ・ ・ ・ 歩v歩 ・v歩|五
| 歩 ・ 歩 歩 銀 ・ ・ ・ ・|六
| ・vと ・ ・ 歩 金 ・ ・ ・|七
| ・ ・ 金 ・ ・ ・ ・ ・ ・|八
| 香 桂 玉 ・ ・ ・ ・ ・ 香|九
+---------------------------+
先手の持駒:角 金 銀 歩
後手番 NNUE評価関数だと5000万ノードくらいで(詰み 51手)って出てくるんだな、すごい
そしてそれを読み切れる藤井は流石の詰将棋力ってとこか 長引かせるなら53手詰なのか
何回やってもあっさり読めすぎてびっくりだわ 脊尾詰は詰将棋的な感じで無駄合許さないから41なだけかな? これは人間の天才的なひらめきがどれだけAIと競えるかという話なのだよ 藤井のファンで藤井の指し手の良さを承認要求したいんだろうけど、棋戦に関することは棋戦や棋士の本スレでやるのが当たり前だろ ここに上げると誰かが最新バージョンで解析してくれてコメントをくれると思ったのさ
971さんありがとう もっと言おうか
局面を貼っているぐらいだから、当然、自分でも解析したのだ
一昔前のソフトで先手優勢から動かない。脊尾詰でも答えがなかなか出ない
一方の人間は秒殺している
そこでこのスレに貼ったのだ スペック公表しないでなかなかと言われてもピンとこない。 そう思うなら自分のPCでやってくれや。局面貼ってあるし >>971
5000万ノードでは詰まないんだけど
探索と評価関数の組み合わせはどれにしてる? 自己解決
illqha1.1を利用したら
どの探索でも1億ノード以内に詰みが見つかった 初期に登場した評価関数が一番強いというのはyaselmoを彷彿とさせるな でも33の龍を駒台に戻すと、詰みを見つけられなくなるけどな。
自玉が切羽詰ってないと詰みを見つけられないのは相変わらずか ワッチョイ 15b3-tpL7
FC2で配信規制くらって発狂している生ポ関数 このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 24日 0時間 54分 7秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。