▲コンピュータ将棋スレッド121 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
フラゲ復活したら地球編からナメック星編へと遷移したDB状態になりそう どうせならR基準ソフトも2800から変えたほうがよさそうだけど適当なものがないのかな 対局時の勝率が今までの対局数に依存してるみたいな言い方 >>340
意味不明な理論ですね。たとえば100戦やって54%勝ち越したするとそれは有意とはいえない。
この場合は400戦行う必要がある。 是非とも千田先生に千田定跡と千田評価関数で電王トーナメントに賛成して欲しい ここ一番で7戦やって4勝出来ないやつはその後何連勝しても意味はない
みたいな発想? 10秒60局なら0.1秒600局の方が
10分の1の時間で済む上に余程信頼出来るぞ
持ち時間を増やしたら対局数を減らしていいとかないから >>347
> 10秒60局なら0.1秒600局の方が
> 10分の1の時間で済む
算数すらできない奴が何言ってもな・・ 12戦だと10勝して参考になるかどうかというレベル
12戦全勝なら文句なしに強いと言えるけどね mafu10と野生の読み太2を50対50で混合したものと、elmo_wcsc27を、4スレ 一手5秒、探索やね(まふ野生はv4.72、elmoはwcsc27用v4.53)elmo定跡使用、BookMoves200の同じ設定で100局対戦させて、まふ野生側の64勝36敗で、レーティングは4061です。 >>347
一年前はそういわれてたけど、最近は棋力の時間依存性が問題視されててね...
まあ10局とかじゃ殆ど意味がないのはその通りだけど >>351
少なくとも短時間での棋力差は正確に測定出来るから有用だと思うけどね
やねうらおのように4スレ2秒で400局とか計測するリソースがないのなら
素直に短時間にしてその思考時間での棋力差をハッキリとしてくれた方が余程参考になる
流石に60局は論外でしょう 60局でelmoに56-4みたいなありえん強さの評価関数が公開されるはずもないし 0.1秒で何百局なら、0.1秒において信頼の置けるデータが得られる
10秒で60局では信頼の置けるデータはなんら得られない >>355
いやそれは否定される
私も書いてるが仮に60戦やって60戦全勝の場合
勝った側が強くないということはほぼありえない
この事実は信頼性が高い 電王Tなんてここ一番で1勝や2勝できるかって大会でしかないのに
雑魚ンザはそれを理由に言い訳しそう(笑)
ざっこ(笑) >>355
elmo以降のソフトは0.1秒の棋力と長時間の棋力にものすごい差があることがわかったから0.1秒でレート測定は難しい 今、自作でアレンジしたソフトとelmo_WCSC27を約8000万ノードでの連続対局をやっている者です。後日結果報告したいと思うのでよろしくお願いします。 >>356
それはそういう結果が出てから言ってくれ
>>359
だから0.1秒なら0.1秒の比較が正しくできてるってことでしょ
長時間が絶対的な前提である必要性はない >>362
0.1秒のレートとか測定してどうしたいの? >>363
別に0.1秒にこだわってるわけではなく、>>352が言ってるように短時間なら短時間なりの正確なデータが出ると言っている
短時間と聞くと脊髄反射のようにelmo以降は短時間だと〜と言い出す奴がいるが、それは論点が違うぞと
あとは短時間は無価値だってのもおかしくて、短時間のコンピュータ将棋のレギュレーションがあってもいいし
短時間で強いなら、より短時間で棋譜解析できることになる >>364
「正確なデータ」の定義がずれている
ソフトの全力を引き出して出た結果を「正確なデータ」とすることが一般的なので、短時間で出た結果を正確であると論じること自体がおかしい
同じソフトでも一手1秒対一手10秒で対局させれば後者が勝ち越すことは火を見るよりも明らかで、短時間で有意差が出たとしてもそれは「(ほかのソフトに比べて)短時間に強い」ソフトでしかない リルモに勝ち越せるソフト作った人はdownload公開して下さい >>370
野生の読み太とmafu10を5:5ブレンドした評価関数 そりゃ長時間で400局とか指してくれたら神データだろ
100局未満のゴミデータをドヤ顔で貼ってる長時間厨は何を示したいのか意味不明
データとして見て欲しいなら最低でも200局までは粘れよな
本来なら200局でも少ないくらいだが
正確なレート差ではなくどちらが強いか程度の議論では
偏り具合によっては使えるラインではある 最近サイレント・マジョリティがサイレント・マイノリティになってる? 6スレッド 1手2秒
mafuta1 relmo 46 9 45
mafuta2 relmo 60 5 35
mafuta2でmafu10と同じくらいかな http://ii.ttlv.jp/20170711/
野生の読み太作者さんによる蟲毒の壺2
が早朝まで続く模様 >>375
elmoだけ負け越しているのとどのソフトも同じようなもの >>364
残念ながら、0.1秒とかの短時間での強さそれ自体を計測したい人は居ないので。 >>339
麻布高校将棋部出身の臆測。
麻布→まふ elmo
rezero8
yasei2
mafu10
mafuta3
relmo8
yasema10 >>372
まあでもそのゴミが10人居ればプラチナに。
ほぼ同じ環境というかノード数に揃えて、だけど。 >>340
やねさん珍しく優しいよね。
御機嫌なのかしらん。 シーズンでいくら勝とうと日本シリーズ取れないチームは強くないということだろう >>380
測定者が100人いても、その100人が公表するわけではないので、結果の公表が恣意的になりNG >>375
リルモにどのソフトも勝ててないから、新しく作った評価関数はどれも不適格ですね 後手の持駒:歩三
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・ ・ ・ ・ ・ ・ ・v香|一
| ・ ・ ・v玉 ・ ・ ・ ・ ・|二
| ・ ・ ・v銀v金 ・ ・ 龍 ・|三
|v歩 ・v歩v桂 ・ ・v金 ・v歩|四
| ・ ・ ・v歩 ・ 歩v歩 ・ ・|五
| 歩 ・ 歩 ・ ・ ・v角 ・ 歩|六
| ・ ・ 銀 歩 銀vと 桂 ・ ・|七
| ・ ・ ・ ・ ・ 金 ・ ・ ・|八
| 香 金 ・v馬 ・ 玉 ・ ・ 香|九
+---------------------------+
先手の持駒:飛 銀 桂二 歩四
この局面、▲5四桂打 以下35手詰で先手勝ちなんだが、
詰将棋用エンジン以外だと中々詰みを見つけてくれないな
長手数だから詰みまで読めないのか >>314
しこりんがナレーターとはNHKも良く分かってるな 長手数の詰みは汎用エンジンではあきらめろ
そしてこの局面の詰みが読めたからこのソフトの終盤は強い!とかいう理論も聞き飽きた
求める部分が間違っている 現実に存在する棋譜で最も手数が長いのは何手詰めがあるんだ?
100手詰めとかあっても見逃しそうだけど 後手の持駒:桂二 歩
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 竜 ・ ・ ・ ・v歩v桂v玉|一
| ・ ・ ・v銀v馬 ・v金 ・v香|二
|v歩v歩v歩 ・ ・ ・ 銀v銀v歩|三
| ・ ・ ・v歩v金 ・ ・ ・ ・|四
| ・ ・ ・ ・v歩 ・ ・ ・ ・|五
| ・ ・ 歩 角 ・ 金 ・ ・ ・|六
| 歩 歩 ・ 歩 ・ ・ 歩 歩 歩|七
| ・ ・ ・ ・ ・v金 ・ 玉 ・|八
| 香 ・ ・ ・ ・vと ・ 桂 香|九
+---------------------------+
先手の持駒:飛 銀 歩二
次に▲2二銀打とすれば先手勝勢だが、
何故かソフトがこの手を読めない やっぱりいろいろ試したがまふ10が一番安定して強いように感じる。
技巧2にも8割近く勝ち、対relmoに6割5分程度 詰み探索ルーチン使いまくる終盤長時間検討特化型のソフトの需要はあるけど
やるひとはいない。 >>389
必死はかからないように見えたけど4八金が質駒になってるのか。。 ここ最近の流れを見ていると、狭い世界での最適化に進んでいて過学習してそうで怖い。
それとは別に、短時間と長時間で強さが違うってのは面白いね。局面だけ見て長手数読んだ
時と同じ評価値を返すように学習しているはずだけど出来ていないって事だよね。
めったに無い落とし穴の時も考慮して評価値を返すのが良いのか、それは出来ないけど
だいたいの場合ならより正しい値を返す方が強いのか、って世界になってきている感じかね。 >>389
読み筋が希望に添うか不明ですけど、22銀打のルートは返してきてる様子
*検討 時間 01:12.9 深さ 26/43 ノード数 165221892 評価値 31111
読み筋
▲2二銀打 △同 金(32) ▲3一龍(81) △3九銀打 ▲1八玉(28) △2六桂打
▲同 歩(27) △3三金(22) ▲2二飛打 △4三馬(52) ▲6二飛成(22) △2八銀成(39)
▲同 玉(18) △2七歩打 ▲1八玉(28) △2八歩成(27) ▲同 玉(18) ▲劣等局面 シンプル合議将棋の読み筋 詰探索をやれば多少はマシになるが どうも置換表への書き込みがうまくいってないっぽいんだよなぁ、書き込むんだけどすぐ塗り変わっちゃうというか 雑魚ンザは大会出た後に俺は長期的には負けてないんだーとか子供じみた言い訳しかしない雑魚ソフトだからもう世の中に必要とされてねーんだよ(笑) 5秒対戦の所見たら全ソフトに勝ち越しないようで
mafuta2が一番なのか そこらの最適解を突き詰めた研究ないんか
何秒まで詰めてもまともな評価できるのかとか まふさんのおかげで強いソフト入手できます
電王戦トーナメントの優勝レートの基準がどんどん上がっていきますね >>399
技巧2への勝率だとmafu10が圧倒的だった 蠱毒によると
yasema10とmafuta3が2強で
やねうらお検証によると
mafuta3よりもmafuta2の方が強いと
しかもmafuta2は長時間だと更に強くなるとな
もう追いきれねぇよ >>397
ブレンドで均質化が進むほど異系統が重要に成ってくる。 >>400
研究の前に理論的検討と仮説をたてないといかんだろう。
そもそもどんなに深く読んでもその末端は短時間読みになって、そこの正確さが問題に成るはず。
すると、普通に考えて、短時間で正確で強いソフトは長時間でも強いはず。
すると時間の長短で逆転が生じるのはおかしい。
逆転が生じるのではなくて、正確さ強さの差が強調されて、統計的に強弱判定しやすくなるというだけなのか。
ちょっと話を戻して、強い評価関数は、序盤から終盤までデコボコなく滑らかに有利さを評価しているのが理想的。
そうすれば枝狩りも正確になるし、逆転も生じない。
序盤の僅かな有利を隙無く徐々に拡大して完封して押しつぶす。
そのような棋風の高レートソフト同士の勝負では、わずかな評価関数のデコボコが間違った枝狩りに引っかかると敗北につながる。
弱い方に、そのような間違いをさせて、きちんと負けさせてそれを検出する為には、可能な限り多数回の枝狩りを行わせる必要がある。
それがつまり長時間対局ということではないか?
あとは任せた。 評価関数が正確になるほど細かい局面判断が出来るが、非常に細かい差なので時間をかけないと勝ちきれないケースが出てるってこと? >>407
将棋は悪手を指した方が負けるゲーム。
(不利な側がどんどん不利になる、一手の価値が終盤ほど上がって逆転を誘発するという性質もある)
どちらを主で考えるかだが、高レート同士では悪手率が減るので弱い側を主に考える方が良いと思う。
弱い方がキチンと悪手を指して、強い方に正しくとがめられて不利を拡大され、
観察者に弱い側が負けたという正しい結果を返すには、どうすべきかということ。 mafu10とmafuta2を対戦させてる人いる?
まふさんの評価関数の中で2強だけど >405
実際やってみると短時間(1秒未満)だとelmoに7割近く勝つ評価関数が
5秒でやるとelmoより弱いってことがあってどういう理屈なのかサッパリわからん アピール文が料理のレシピみたいになるのかな。
何々と何々をこの割合で混ぜた、定跡はこれこれにあとは秘伝のタレを少々 まふさんが
「mafuta2」70%+「yasema10」30%
を組み合わせた「yasetamafu70」をアップロードする予定とのこと
この組み合わせで「mafuta2」に短時間だと大幅に勝ち越すようになったと 3駒の表現能力の限界で読みはじめのメジャーな形では差が出なくて読んだあとのマイナーな形で差がついてるだけやろ
傾いたコップにどれだけうまく水を入れるかや
最終的には4駒で学習してた評価関数を3駒の評価関数に畳み込んで使うのが実戦上で最強になるんじゃね だいたい2駒の技巧2でも浮かむ瀬クラスに成長しているのに
3駒の限界がその真上にある訳もなかったな
毎回大会の度に3駒限界説が出るけど何だかんだ成長し続けている ディープラーニングで作った評価関数は既存の探索とは簡単にくっ付けられないの?ポナンザのやつは探索は既存のものだっけ? >>413
やせたまふ70現在計測勝ち越し中
来週にはこれを超えるものをまふさんが公開してくるのでしょうか >>416
そもそもponanzaのは指し手のオーダリングに使うpolicy networkであって、評価関数のようなものではない それはわかるんだけどもvaluenetを作ったとしてそれをモンテカルロ木探索じゃなくて既存の将棋の探索でいけるのかどうか 振り飛車棋風作ってブレンドがいいのかと思いまして
次プロジェクトはそれで >>421
丁寧な言葉でデブをdisるのはやめるのだフェネック > mafuta3兄弟について「やねうら王 開発者」より、なんと6500局もの対局結果を頂きました!(格が違った)
1手何秒かは知らないけど、この短期間に6500局はヤバすぎて乾いた笑いしか出ないわ 何百万マシンに投資してるんだろ
電気代も合わせたら凄いことになってそうだ 後手の持駒:金 銀 桂 歩五
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・ ・ 銀 と ・v玉 ・v香|一
| ・ ・ ・ ・ ・ ・ ・ ・ ・|二
|v歩 ・ ・ ・ ・v歩 とv桂 ・|三
| ・ ・ ・v金v銀 ・ ・ 角 ・|四
| ・v桂 ・v歩v歩v桂 ・ ・ 歩|五
| ・ ・ ・ ・ ・ ・ ・v飛 ・|六
| 歩 歩 ・ 歩 ・ 銀 ・ 金 ・|七
| ・ ・ ・ ・ 金 ・ ・ 玉v歩|八
| 香 ・ ・ ・ ・ ・ 飛 ・ 香|九
+---------------------------+
先手の持駒:角 歩二
後手番
昨日の藤井君の将棋の棋譜からの派生局面だが、
MPV=1の時の上下動がかなり激しかったので上げてみた。
(エルモ+やね4.68、スレッド1で詰みからプラス4桁まで変動した。) やねさんの計測はさすが。
今のところやせたまふ70が最強?
mafu10とmafta2より強いのは凄い やねぐらいマシン酷使してると次のサーバ用CPU出た時に今のマシンを中古で売った方がいいんじゃないだろうか
消費電力ヤバそう デュアルEPYCだと使用率100%でも327Wと
デュアルXeonより高性能なのにデュアルXeonより低消費電力だね
http://jisakutech.com/archives/2017/07/36256 >>430
suimonはやねから買ったとツイートしてたな
次は誰に売るんだ?w >428
すでに4.73やでgithub.com/yaneurao/YaneuraOu/releases 藤井4段vs最強コンピュータ将棋見てみたい気持ちはあるが、当分の間実現しないだろうな >>428
後手に勝ち筋があるケースだから
評価関数は候補の探索順に影響を与える感じかな。
ベンチマーク例としては簡単すぎる気も >>422
モンテカルロ木探索は、評価関数がゴミだからしゃーなしにつかうもんだろう。
精度が高く高速なバリューネット(局面の勝敗確率評価=評価値)ができあがっているなら、
モンテカルロ木探索などせずに将棋のというかstockfish風探索で足りる。 yasetamafu70 対 技巧2
デビュー以来の連勝記録は11連勝でストップ
コンピュータソフトでも無敗の29連勝が再現できない・・・ ■ このスレッドは過去ログ倉庫に格納されています