▲コンピュータ将棋スレッド127
■ このスレッドは過去ログ倉庫に格納されています
平岡さん4スレでやってるってことは、i7だろうしponderオンでやってるっぽいな >>22
それって例えば100スレあったとして設定50スルでポンダーONでもそうなの? >>24
実際キッチリ50:50で使っていても
一台のリソースは増えるわけじゃないからお互いNPSを減らしてる訳で
ponder当たらなかったらリソースを無駄にするわけで
対戦で強いソフトを検証するならそれでもいいけど
純粋に強い評価値だったりを検証するなら切るべきだと思う 普通の人は探索+評価関数の強さが知りたいんだからそりゃponderなしじゃないか?
ponderありの時の強さなんて大会出るわけじゃないしどうでもよくね?
shotgunのponderの使い方がうまいとしても例えば局面検討には一切関係ないやん >>26
そうなんですね
詳しい解説ありがとうございます
ポンダーとスレッドを半分にした時の無駄にする事は証明されてるんでしょうか? >>29
ポンダー当たらなかったら読み直しで
ポンダーで使ったリソースが無駄になるでしょ >>29
ポンダー側がメモリ帯域を食いつぶすことによって
メイン側の性能を落とすことが示せるから
これにて証明完了かな もうaperySDT5とは戦わせてみてるんすね
Apery sdt5に対してR-50程度っすかぁ
nodchip@tanuki-? @nodchip
手元の計測では1スレッド5秒1000対局でelmo wcsc27に対してR+180、tanuki- wcsc27に対してR+190、tanuki- sdt4に対してR+280、Apery sdt5に対してR-50程度となっています。 >>31
それも含めてエンジンと評価関数の合わせた性能なのかと
>>32
RAM64GB積んでてて片方に16GB割り当ててもそうなるんですか? ああこれAperyマイナスって
やねうら王+Aperyじゃない方に−50か
ということは定跡で勝ち上がったのかな
それにしてもポナンザに勝ったのも定跡か?
いやポナンザが強くなってなかったのか >>34
だから何を検証するかによる
特にポンダーや定跡が効果的なのは持ち時間のある将棋だし
そもそも本当にキッチリ50:50で分け合えるのかが検証出来てない
実際に8スレッドのCPUで4スレッド使う設定にしても
使用率が4スレッドが100%残り4スレッドが0%になるわけじゃなく
8スレッドがそれぞれ50%付近になる
(この辺はOSだったりソフトによっても変わってくるはず) ponanza結局一敗しかしてないからなんともいえないのでは
他のソフトに対してR200くらい違っててもおかしくない カパックの作者も格上と感じたみたいだし >>37
ありがとうございます
例えばですが100スレで片方に40スレならば誤差がないんでしょうか?
噛みつくようで申し訳ないんですが1秒や5秒など決まった対局ではなく
エンジンがそもそも統一されてない中で含めた性能や長所なども考慮するべきなのではないかと思いました ponaは前回からR+100-150くらい(3位インタビュー)で、
前回のverがelmo wcsc27に対しR+120くらい(山本ブログ)だから
合計でelmo wcsc27に対しR+220-270くらい
ぽんぽこがelmo wcsc27に対しR+180
余裕で一発入る >>39
なにを検証するかで
電王トーナメントルールでの強さを検証するなら
それこそ電王トーナメントと同じスペックのPCを二台と対戦鯖を用意して同じ時間設定で検証すべき >>41
ん〜何というか平行線ですよね
何をというなら具体例を出してほしいです
極論いえば普通のi7で4c8tだと誤差がしょうじるならなら3c6tなら誤差がないのかと
メモリも32GBで片方4GBだったとしてもですが 言い方がおかしかった
i7 4c8tだとして片方1c2tで倍の時間だとしても >>42
一台のPCでリソースを分けた場合に
そもそも差が生じるかどうか
生じるならどの程度か、
ソフトによっては違いがあるのかどうか含めての検証が出来ていないので
そういった検証ができていない中でponde onはすべきではないし
多くの人が知りたいに評価値や探索部の強さを測る上ではponderは入れる必要はない まー使用スレッド半分以下にしてまで1PCでponderありの検証したいなら勝手にしてみればええやん
俺もその作業に需要はないとは思うが >>42
CPUにしろメモリにしろきっちり分けて使うことは困難だから
どうしても相手と同時に思考するとなると影響してしまうもんよ ハイスペのajkってどのソフトつかってんだろ?
4コアのエイプリーと互角だし takasan354?? @takasan354 11月14日
今思えば、先週のトライボーディアン打ち上げで見つけたクエストの怪しいアカウントがソフト指しかどうかを協議したメンバー凄かったな。囲碁は9路の研究さん、オセロは世界ランカーが判定。将棋誰か判定出来ませんか!?千田先生「私なら分かるかも知れません」
頼もしすぎるw
三浦さん冤罪事件を引き起こした千田を許すな😡😠👿 mizarさんはやねのビルド止めてしまったんか?
SSE4.2トーナメント版はあそこでしか手に入らないから残念や >>34
問題視してるのはRAMの容量ではなくてRAMの帯域幅
CPU群とRAM群を繋ぐ線はOSから見える仮想的なものとしては1本しかないんだよ
そこでPonder中を検出してメモリ帯域幅を食いつぶすことに専念するコードを書けば
相手の帯域幅を潰せるから性能を落とす攻撃が可能となる 第5回 将棋電王トーナメント
非ライブラリソフト順位
(主なライブラリの主要開発者によるソフト含む。PR文から独断と偏見により推定。)
1位 Ponanza
2位 読み太
3位 やねうら王withお多福ラボ
4位 Selene
5位 Apery
6位 nozomi
7位 たこっと
8位 習甦
9位 Squirrel (全ライブラリ申請だが使用したか不明)
10位 CGP
11位 なのは(評価ベクトルはライブラリ使用予定。他の部分は独自実装?)
12位 きのあ将棋
13位 海底
14位 Labyrinthus+囲
15位 カツ丼将棋 16位 mEssiah
17位 dlshogi
18位 shogi686
19位 ねね将棋
20位 メカ女子将棋
21位 芝浦将棋 Softmax
22位 こまあそび
23位 SilverBullet
24位 scherzo
25位 Windfall
26位 にこあ将棋
27位 Girigiri
28位 十六式いろは改
29位 きふわらべ
ツッコミあればどうぞ >>52
まったくその通り。
が、サーバ仕様でメモリ帯域が余りまくってるなら…いやプログラム部分もあるからわからんか。
いやいやNPSあたりのメモリアクセス量は一応わかるか?
しかしshotgunはponderにミソがあるのでponder offでは実力計れないな。
PC2台用意しないと。
幸いshotgunは非公開だけど。 読み太が公開してる中で一番と?
セレネも公開しないよね
自分の予想が当たるかな
自分の予想は
カパック≧Apery>たぬき
カパック待ちで〜す >>55
まあちょっと作ってみただけで
誰が上とか下とか言うつもりは全く無いよ
ただ、こういう順位が参考程度にあってもいいかなと思って ぽんぽこもキメラなのね
PR文書の手法を元に作成した評価関数です。
RP文書に記載していない手順として、
最後にelmo wcsc27評価関数と1:1でブレンドしています。 >>56
評価関数テーブルが1GBでキャッシュに到底乗らないので、メモリアクセスがボトルネックなのは明らかか。
いや、差分計算で評価関数テーブルへの直接アクセスは最小限にする実装か?
二次キャッシュまではコアごとに割当てられてるけど三次キャッシュは共有だし
余ってれば使う仕様だろうなあ。
三次キャッシュをコア毎に割当る設定できたっけ? >>57
カパックは後手ばかり引いてたから本当の実力が気になるね。
ただ本番はgentooでゴリゴリに最適化してるからwindowsだとそこまでじゃないと予想 >>53をちょっと補足すると、まふ定跡を主要ライブラリと考えるかどうかで、読み太が入ったり入らなかったりする
もう一度言うと、非ライブラリという視点だと結局どうだったのか、という試みで他意はないです
電王トーナメントは最強のソフトを決める戦いなので公式の順位が一番正しく最上なのは変わらない まふ定跡は来年の世界選手権でも出てきますね
勝敗はまふ定跡に左右されるなんて展開が続きますね Aperyは簡単に言うとどういう改良で強くしたの? 評価関数むっちゃつよって改善。
定跡と探索はノータッチ。 予測読みをponderというなら
通常思考は何て言えば良いんですかねJISで決めて欲しい
ていうかponderは〜erなのに動詞というのがイヤソ
ponderするモジュール名はpondererなのか、とか常々スゲー疑問を感じる aperyは特別なことはせず、単に学習部をきれいに書き直したら強くなったぽい
平岡 拓也??\(´・_・` )/??? @HiraokaTakuya 11月13日
PPP評価関数の機械学習の際、使用メモリが64GBに収まるようにする為に、学習部を書き直す必要がありました(´・_・`)
メモリ節約した学習部に書き直し、いざPPPの学習を行いましたが、期待より弱く、ボツになりました(´・_・`)
書き直して綺麗になった学習部だけが残りました(´・_・`)
平岡 拓也??\(´・_・` )/?? @HiraokaTakuya 11月13日
他の評価関数の比較になるだろうと、従来の3駒関係を、書き直した学習部で学習してみました。するとelmo(WCSC27)の評価関数に対して75%程度勝てる物が出来ました(´・_・`)
やねうら王? @yaneuraou 11月13日
いま振り返ってみるに、前回の電王トーナメントでは、やねうら王の学習部にバグがてんこ盛りだったため、やねうら王ライブラリで学習させたチームが全部爆死した。
使用してくれたチームには申し訳なかったとは思うがこの責任は私には取れない。だから、やっぱ自分で書かないとね…という話に落ち着く。 >>30
>>## book/user_book3.db
>>まふ氏より提供された「横歩取り(改)」をやねうら王形式に変換したものです。
>>第5回電王トーナメントにおいては
>>ConsiderBookMoveCountをtrueにして使用しました。
この定跡をやねうら王に組み込んでみたけど、初手からプログラムが思考するので、
定跡が機能していないような気がする。 >>53
海底はshogi686といい勝負だそうだぞ今回。
あと、カツ丼はBonanza3くらいのレベルまでは行ってる。 >>63
選手権ではまふ定跡フルオープンだからみんなその意味では互角よ 【エンジン】やねうら王4.73(評価関数Apery_sdt5)
【勝敗】185-9-106
【持ち時間】1手1秒
【CPU】Intel Core i7-7700
【OS】Windows10 64bit
【メモリー】32GB
【思考条件】8スレ、定跡なし、USI_Ponder=OFF、ハッシュメモリ各8GB
【特記事項】ノード数一手最高600万ノードくらい
対局数300 先手勝ち145(49%) 後手勝ち146(50%) 引き分け9
Apery
勝ち185(63%) 先手勝ち92(63%) 後手勝ち93(63%)
yaselmo
勝ち106(36%) 先手勝ち53(36%) 後手勝ち53(36%) >>69
bookdepthlimite を0にしてみて
たぶんそれでOKなはず。
元の16だと機能しない。
まふbookとオリジナルbook対戦してみるわ。 >>69
>>73
>>74
BookDepthLimit を 0 にしたら、定跡が機能しました。
どうもありがとうございました。 ぽんぽこ
>Apery sdt5に対してR-50程度となっています。
マイナス50というのはなんかショック
相性問題だろうか >>75
追記
## book/user_book3.db
ConsiderBookMoveCountをtrueに 非公開定跡を使ったら定跡作者もメンバーに入れないと
そして複数チームに登録で失格になると >>70
順序は公式の順位のまま
Aperyとseleneは本戦出場だが予選の順序となっている >>78
wcsc27に新たに盛り込まれた概念である「主要開発者」は、book作成者を含むのであろうか。私は含むと思うんだがお前らどう?
理由
書いた分量はともかく勝因の10%はbookのおかげと言ってもいいと思うから
非公開の要素を含み、誰でも取り入れることができるわけではなかったから >>81
お前の感想はいらんからルール使って説明しろよ WCSC27のルールを読む限りは
思考部には定跡は含む
開発部には定跡は含まない 開発者とは
開発部のコードを作成した人
主要な開発者とは
開発者のうち開発部の作成に置いて主要な貢献したとみなした一名以上の人
定跡は開発部には含まれないし
定跡整備しただけでは開発者でもない 開発部
思考部の中でライブラリ、定跡データ及び一般に流布している汎用ルーティン(チェス等、将棋以外のプログラムを含む。)を除いた部分。
公開されている定跡と自作の定跡を区別していないが、これはさすがに現状に合っていないのでは >>53
WCSC27時点では読み太はやねうら王ライブラリ使用(DT5では知らんけど)
たこっとはPR文でライブラリ使用を明言してる
その他数件 人造棋士18号(20種類以上のソフトとvsさせて)レート測定しているが現状yaselmoマイナス60くらい。
うーん(゜-゜)
まだ上位とはあててないんだけど・・・ これから伸びるかな 本番当日に評価関数書き換えているので、yaselmo特化したものとは違います。
なので負け越すかもしれません。
Dr.ゲロ >>53
Ponanzaややねうら王とかの上位勢と、下位勢とではオリジナルという意味でちょっと違うから、
それをごちゃまぜにした順位にどんな意味があるのかと思ったりするけど。
乱暴な言い方をすると3駒つかってるソフトはBonanzaライブラリ勢であるという言い方もできるし。 >>89
3駒ってボナンザが初だった?
最初のボナンザは2駒+他のパラメーターってwikiにあったけど。 >>90
よくわからん。うちのPCから見れるwikipediaでは3駒だと書いてあるけど、どこのwikiを見たんだ? >>79
すまん、独断と偏見で順序並べたのかと思った、カッコ内の記載見て >>83
その辺はうさ親さんが来年の選手権に向けてCSAの定例会で議論に上げるはず。
議論したいとは常々おっしゃっていた。 参加者全員が使おうと思えば使える技術情報ではなくて、
参加者のうちの特定のチームにだけ技術情報が配布されると考えると、
競技としてどうなん?と思ったりするよねw
まぁ、マシンリソースとかもあるから平等にしろとはいわんけど、
競技として興ざめはするよね。
チームに所属してうちのチームは定跡を重点的に独自開発しました、
ならとくに普通なんだけどね。 >>93
CSA的にはプログラムってのがメインだし
ソフトで生成した定跡ならまだしも、人力で整備した定跡が活躍するのは問題だろうな
チェスみたく共通の定跡使うとか排除の方向に行くんだろうな
運営?開発者?のパワーがあるなら定跡ありなしでレギュレーション分けるとかも・・・ >>90
>>91
Bonanzaはバージョン1〜3は2駒を含む多種評価項目、4以降が3駒
3駒の元祖(少なくとも実用レベルのもの)はBonanza4で間違いない KKはKKPに分散させればいらないというのは出来上がっているものならその通りだけど
学習時になにか違いはでないのかな 水門 標準のゲーム名以外だとMax_Moves:0なのね
フィッシャークロックを設定してこれだと
相入玉模様でだらだら手数が伸びると問題が起きる可能性が >>96
ありがとう。ver4ということは2009年か。GPSが優勝した年だね。
他のソフトはどうだったんだろう。
>>91
ごめんwikiじゃなかったか。うろ覚えで書いてすまん。 Qhapaqの作者の方、ヤネウラ王探索部分を10%高速化した&近いうちにコミットする言うてたから早く来てほしい(笑) >>100
大貧民のプログラム作成してるから当分来ないですよ >>101
なるほど。ありがとう。
Qhapaqチームは2人なんだけど、2人でUECda出るならまだ先ですね〜。
もし出場が澤田さんだけなら、高速化は伊藤さんがやってたらしいのでもちっと早く来るかも。 将棋ウォーズのApery2017のこの手筋は初めて見た
後手の持駒:歩二
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・v銀 ・ ・ ・ ・v桂v香|一
| ・v玉v金 ・ ・ ・ ・ ・ ・|二
| ・v銀v桂v金 ・ ・v角 ・ ・|三
|v歩v歩v歩v歩v歩v飛v歩v歩v歩|四
| ・ ・ ・ ・ ・ ・ ・ ・ ・|五
| 歩 歩 歩 歩 歩 ・ 歩 ・ 歩|六
| ・ 金 桂 銀 角 ・ 桂 ・ ・|七
| ・ 玉 金 ・ 銀 ・ ・ ・ ・|八
| 香 ・ ・ ・ ・ 飛 ・ ・ 香|九
+---------------------------+
先手の持駒:歩
https://twitter.com/naginyan135/status/930398726211772416 apery+やねうら王とrelmoを戦わせたけど200戦やって勝率はyaselmoと変わらなかった。
相性かなりキツい評価関数だね。uuunさんのところでも技巧2の勝率がイマイチとか >>88
失礼しました。KPP_KKPTでしたよね。
単純にどのくらいのレートか知りたかったのです。
yaselmoのみでレート測定していません。
前、何度かDB2で対局させていただきました。
応援しています。 KPP_KKPTをゼロから学習させようと思ったら
最後の仕上げepochのときどのくらい教師局面が必要かな?
あと30億でdepth10と50億でdepth9ならどっちが強くなると思う? ポンダーの件、教えていただきありがとうございました
>>88
人造棋士18号は定跡なくても思しろい棋風ですね
公開ありがとうございました >>53
なのははライブラリ使用したって本人のツイッターで言ってたはず 「なのは」の探索部は川端さんの「なのはmini」+「StockFish」だったと思うので、
評価バイナリだけライブラリ使用では? どうでもいいが誰かそろそろsdt5に出場して公開されたソフト一覧(下位ソフト含む)をまとめてくれないか?
(できれば公開URL含んで) >>85 >>93 >>94
やっぱ定跡に関する明確な規定は無かったわけだな。
特定のチームだけに、言い方は悪いが"加担する"まふ氏のような存在は想定されてなかったようだし
来年の規定がどうなるか期待したい WCSCなら規定的には複数のチームに開発者は関わってはいけないのだから
オープンならともかくそうでないのは問題があるようにも思われるが >>86
>>89
>>112
厳密な使用不使用と言うよりは独断と偏見ということ、かなあ
ここでは、所謂ライブラリ勢じゃない=非ライブラリ、という意味
StockfishやBonanzaその他先人の作ったソフトや技術を参考にしていないソフトって限定されるしPR文から推察するのは難しい
厳密な意味での非ライブラリの順位も見てみたい気はするが、自分には手に余るので誰かどうぞ しかしぽんぽこはmafu10に凄く似た数値が出るな
remuだと0.99とか1.008とかでる >>121
そこまでの数値って同じ定跡使って学習しても再現できるか怪しいレベルで似てるな ■ このスレッドは過去ログ倉庫に格納されています