▲コンピュータ将棋スレッド121 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
>>364
「正確なデータ」の定義がずれている
ソフトの全力を引き出して出た結果を「正確なデータ」とすることが一般的なので、短時間で出た結果を正確であると論じること自体がおかしい
同じソフトでも一手1秒対一手10秒で対局させれば後者が勝ち越すことは火を見るよりも明らかで、短時間で有意差が出たとしてもそれは「(ほかのソフトに比べて)短時間に強い」ソフトでしかない リルモに勝ち越せるソフト作った人はdownload公開して下さい >>370
野生の読み太とmafu10を5:5ブレンドした評価関数 そりゃ長時間で400局とか指してくれたら神データだろ
100局未満のゴミデータをドヤ顔で貼ってる長時間厨は何を示したいのか意味不明
データとして見て欲しいなら最低でも200局までは粘れよな
本来なら200局でも少ないくらいだが
正確なレート差ではなくどちらが強いか程度の議論では
偏り具合によっては使えるラインではある 最近サイレント・マジョリティがサイレント・マイノリティになってる? 6スレッド 1手2秒
mafuta1 relmo 46 9 45
mafuta2 relmo 60 5 35
mafuta2でmafu10と同じくらいかな http://ii.ttlv.jp/20170711/
野生の読み太作者さんによる蟲毒の壺2
が早朝まで続く模様 >>375
elmoだけ負け越しているのとどのソフトも同じようなもの >>364
残念ながら、0.1秒とかの短時間での強さそれ自体を計測したい人は居ないので。 >>339
麻布高校将棋部出身の臆測。
麻布→まふ elmo
rezero8
yasei2
mafu10
mafuta3
relmo8
yasema10 >>372
まあでもそのゴミが10人居ればプラチナに。
ほぼ同じ環境というかノード数に揃えて、だけど。 >>340
やねさん珍しく優しいよね。
御機嫌なのかしらん。 シーズンでいくら勝とうと日本シリーズ取れないチームは強くないということだろう >>380
測定者が100人いても、その100人が公表するわけではないので、結果の公表が恣意的になりNG >>375
リルモにどのソフトも勝ててないから、新しく作った評価関数はどれも不適格ですね 後手の持駒:歩三
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・ ・ ・ ・ ・ ・ ・v香|一
| ・ ・ ・v玉 ・ ・ ・ ・ ・|二
| ・ ・ ・v銀v金 ・ ・ 龍 ・|三
|v歩 ・v歩v桂 ・ ・v金 ・v歩|四
| ・ ・ ・v歩 ・ 歩v歩 ・ ・|五
| 歩 ・ 歩 ・ ・ ・v角 ・ 歩|六
| ・ ・ 銀 歩 銀vと 桂 ・ ・|七
| ・ ・ ・ ・ ・ 金 ・ ・ ・|八
| 香 金 ・v馬 ・ 玉 ・ ・ 香|九
+---------------------------+
先手の持駒:飛 銀 桂二 歩四
この局面、▲5四桂打 以下35手詰で先手勝ちなんだが、
詰将棋用エンジン以外だと中々詰みを見つけてくれないな
長手数だから詰みまで読めないのか >>314
しこりんがナレーターとはNHKも良く分かってるな 長手数の詰みは汎用エンジンではあきらめろ
そしてこの局面の詰みが読めたからこのソフトの終盤は強い!とかいう理論も聞き飽きた
求める部分が間違っている 現実に存在する棋譜で最も手数が長いのは何手詰めがあるんだ?
100手詰めとかあっても見逃しそうだけど 後手の持駒:桂二 歩
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 竜 ・ ・ ・ ・v歩v桂v玉|一
| ・ ・ ・v銀v馬 ・v金 ・v香|二
|v歩v歩v歩 ・ ・ ・ 銀v銀v歩|三
| ・ ・ ・v歩v金 ・ ・ ・ ・|四
| ・ ・ ・ ・v歩 ・ ・ ・ ・|五
| ・ ・ 歩 角 ・ 金 ・ ・ ・|六
| 歩 歩 ・ 歩 ・ ・ 歩 歩 歩|七
| ・ ・ ・ ・ ・v金 ・ 玉 ・|八
| 香 ・ ・ ・ ・vと ・ 桂 香|九
+---------------------------+
先手の持駒:飛 銀 歩二
次に▲2二銀打とすれば先手勝勢だが、
何故かソフトがこの手を読めない やっぱりいろいろ試したがまふ10が一番安定して強いように感じる。
技巧2にも8割近く勝ち、対relmoに6割5分程度 詰み探索ルーチン使いまくる終盤長時間検討特化型のソフトの需要はあるけど
やるひとはいない。 >>389
必死はかからないように見えたけど4八金が質駒になってるのか。。 ここ最近の流れを見ていると、狭い世界での最適化に進んでいて過学習してそうで怖い。
それとは別に、短時間と長時間で強さが違うってのは面白いね。局面だけ見て長手数読んだ
時と同じ評価値を返すように学習しているはずだけど出来ていないって事だよね。
めったに無い落とし穴の時も考慮して評価値を返すのが良いのか、それは出来ないけど
だいたいの場合ならより正しい値を返す方が強いのか、って世界になってきている感じかね。 >>389
読み筋が希望に添うか不明ですけど、22銀打のルートは返してきてる様子
*検討 時間 01:12.9 深さ 26/43 ノード数 165221892 評価値 31111
読み筋
▲2二銀打 △同 金(32) ▲3一龍(81) △3九銀打 ▲1八玉(28) △2六桂打
▲同 歩(27) △3三金(22) ▲2二飛打 △4三馬(52) ▲6二飛成(22) △2八銀成(39)
▲同 玉(18) △2七歩打 ▲1八玉(28) △2八歩成(27) ▲同 玉(18) ▲劣等局面 シンプル合議将棋の読み筋 詰探索をやれば多少はマシになるが どうも置換表への書き込みがうまくいってないっぽいんだよなぁ、書き込むんだけどすぐ塗り変わっちゃうというか 雑魚ンザは大会出た後に俺は長期的には負けてないんだーとか子供じみた言い訳しかしない雑魚ソフトだからもう世の中に必要とされてねーんだよ(笑) 5秒対戦の所見たら全ソフトに勝ち越しないようで
mafuta2が一番なのか そこらの最適解を突き詰めた研究ないんか
何秒まで詰めてもまともな評価できるのかとか まふさんのおかげで強いソフト入手できます
電王戦トーナメントの優勝レートの基準がどんどん上がっていきますね >>399
技巧2への勝率だとmafu10が圧倒的だった 蠱毒によると
yasema10とmafuta3が2強で
やねうらお検証によると
mafuta3よりもmafuta2の方が強いと
しかもmafuta2は長時間だと更に強くなるとな
もう追いきれねぇよ >>397
ブレンドで均質化が進むほど異系統が重要に成ってくる。 >>400
研究の前に理論的検討と仮説をたてないといかんだろう。
そもそもどんなに深く読んでもその末端は短時間読みになって、そこの正確さが問題に成るはず。
すると、普通に考えて、短時間で正確で強いソフトは長時間でも強いはず。
すると時間の長短で逆転が生じるのはおかしい。
逆転が生じるのではなくて、正確さ強さの差が強調されて、統計的に強弱判定しやすくなるというだけなのか。
ちょっと話を戻して、強い評価関数は、序盤から終盤までデコボコなく滑らかに有利さを評価しているのが理想的。
そうすれば枝狩りも正確になるし、逆転も生じない。
序盤の僅かな有利を隙無く徐々に拡大して完封して押しつぶす。
そのような棋風の高レートソフト同士の勝負では、わずかな評価関数のデコボコが間違った枝狩りに引っかかると敗北につながる。
弱い方に、そのような間違いをさせて、きちんと負けさせてそれを検出する為には、可能な限り多数回の枝狩りを行わせる必要がある。
それがつまり長時間対局ということではないか?
あとは任せた。 評価関数が正確になるほど細かい局面判断が出来るが、非常に細かい差なので時間をかけないと勝ちきれないケースが出てるってこと? >>407
将棋は悪手を指した方が負けるゲーム。
(不利な側がどんどん不利になる、一手の価値が終盤ほど上がって逆転を誘発するという性質もある)
どちらを主で考えるかだが、高レート同士では悪手率が減るので弱い側を主に考える方が良いと思う。
弱い方がキチンと悪手を指して、強い方に正しくとがめられて不利を拡大され、
観察者に弱い側が負けたという正しい結果を返すには、どうすべきかということ。 mafu10とmafuta2を対戦させてる人いる?
まふさんの評価関数の中で2強だけど >405
実際やってみると短時間(1秒未満)だとelmoに7割近く勝つ評価関数が
5秒でやるとelmoより弱いってことがあってどういう理屈なのかサッパリわからん アピール文が料理のレシピみたいになるのかな。
何々と何々をこの割合で混ぜた、定跡はこれこれにあとは秘伝のタレを少々 まふさんが
「mafuta2」70%+「yasema10」30%
を組み合わせた「yasetamafu70」をアップロードする予定とのこと
この組み合わせで「mafuta2」に短時間だと大幅に勝ち越すようになったと 3駒の表現能力の限界で読みはじめのメジャーな形では差が出なくて読んだあとのマイナーな形で差がついてるだけやろ
傾いたコップにどれだけうまく水を入れるかや
最終的には4駒で学習してた評価関数を3駒の評価関数に畳み込んで使うのが実戦上で最強になるんじゃね だいたい2駒の技巧2でも浮かむ瀬クラスに成長しているのに
3駒の限界がその真上にある訳もなかったな
毎回大会の度に3駒限界説が出るけど何だかんだ成長し続けている ディープラーニングで作った評価関数は既存の探索とは簡単にくっ付けられないの?ポナンザのやつは探索は既存のものだっけ? >>413
やせたまふ70現在計測勝ち越し中
来週にはこれを超えるものをまふさんが公開してくるのでしょうか >>416
そもそもponanzaのは指し手のオーダリングに使うpolicy networkであって、評価関数のようなものではない それはわかるんだけどもvaluenetを作ったとしてそれをモンテカルロ木探索じゃなくて既存の将棋の探索でいけるのかどうか 振り飛車棋風作ってブレンドがいいのかと思いまして
次プロジェクトはそれで >>421
丁寧な言葉でデブをdisるのはやめるのだフェネック > mafuta3兄弟について「やねうら王 開発者」より、なんと6500局もの対局結果を頂きました!(格が違った)
1手何秒かは知らないけど、この短期間に6500局はヤバすぎて乾いた笑いしか出ないわ 何百万マシンに投資してるんだろ
電気代も合わせたら凄いことになってそうだ 後手の持駒:金 銀 桂 歩五
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・ ・ 銀 と ・v玉 ・v香|一
| ・ ・ ・ ・ ・ ・ ・ ・ ・|二
|v歩 ・ ・ ・ ・v歩 とv桂 ・|三
| ・ ・ ・v金v銀 ・ ・ 角 ・|四
| ・v桂 ・v歩v歩v桂 ・ ・ 歩|五
| ・ ・ ・ ・ ・ ・ ・v飛 ・|六
| 歩 歩 ・ 歩 ・ 銀 ・ 金 ・|七
| ・ ・ ・ ・ 金 ・ ・ 玉v歩|八
| 香 ・ ・ ・ ・ ・ 飛 ・ 香|九
+---------------------------+
先手の持駒:角 歩二
後手番
昨日の藤井君の将棋の棋譜からの派生局面だが、
MPV=1の時の上下動がかなり激しかったので上げてみた。
(エルモ+やね4.68、スレッド1で詰みからプラス4桁まで変動した。) やねさんの計測はさすが。
今のところやせたまふ70が最強?
mafu10とmafta2より強いのは凄い やねぐらいマシン酷使してると次のサーバ用CPU出た時に今のマシンを中古で売った方がいいんじゃないだろうか
消費電力ヤバそう デュアルEPYCだと使用率100%でも327Wと
デュアルXeonより高性能なのにデュアルXeonより低消費電力だね
http://jisakutech.com/archives/2017/07/36256 >>430
suimonはやねから買ったとツイートしてたな
次は誰に売るんだ?w >428
すでに4.73やでgithub.com/yaneurao/YaneuraOu/releases 藤井4段vs最強コンピュータ将棋見てみたい気持ちはあるが、当分の間実現しないだろうな >>428
後手に勝ち筋があるケースだから
評価関数は候補の探索順に影響を与える感じかな。
ベンチマーク例としては簡単すぎる気も >>422
モンテカルロ木探索は、評価関数がゴミだからしゃーなしにつかうもんだろう。
精度が高く高速なバリューネット(局面の勝敗確率評価=評価値)ができあがっているなら、
モンテカルロ木探索などせずに将棋のというかstockfish風探索で足りる。 yasetamafu70 対 技巧2
デビュー以来の連勝記録は11連勝でストップ
コンピュータソフトでも無敗の29連勝が再現できない・・・ それにしても、ブレンド素材の評価関数たち、矢倉もしなけりゃ横歩も取らないんだね
相掛かりか角換わりしか指さない。最終的に行き着く先はそこなのかね >>441
そんな序盤の選択はバックトラック自動定跡生成を24時間動かし続けるってのが
将棋プログラムのメインの使用法になるまで全く何とも言えないと思う やせたまふ70っていままで一番強いかもしれない。
技巧2と70戦までやって勝率85% アウトブリードは当てるとデカイな 四間飛車側を持たせて技巧2とyasetamafu70を対局させたら
見た事のない穴熊崩しを披露し始めた
http://i.imgur.com/2UXmkHZ.jpg >>445
いやこういう崩し方は普通にあるぞ・・・ 「yasetamafu70」が「mafuta2」70%+「yasema10」30%
「yasema10」が「mafu10」50%+「野生の読み太2」50%
ということは
「yasetamafu70」は実質、「mafuta2」70%+「mafu10」15%+「野生の読み太2」15%
ブリーダーの職人技が光る 何なのこのブリードって
何で混ぜると強くなるのか判明してるの?
なんかまじないじみてて怖いんだが 一方が過大評価しててもう一方が過小評価してるような局面があったとしたら
混ぜたらちょうどいい塩梅になるとかあるのかな 俺は最初聞いた時、平均顔みたいなものかと思った。
適当に顔を集めて平均するとイケメンになるやつ。
まぁ同レベルの奴集めて丸め込むとミスる局面が減るんじゃないか? お前ら、なにyasetamahuガーとかmahuta2ガーとか言ってんの?w
どれもレート差ほぼ横並びで、誤差の範囲内の勝率なのに必死になって自己対戦してるのいたら笑えるw
どれもドングリの背比べだろw
次の電王Tはponanzaが圧倒的に優勝するだろうなw 適当に混ぜたら強くなるとか黒魔術といいたくなるなw
合議とか最初否定的に見られてたが
アンサンブル効果みたいなものがそれなりに効果出すんだから、リソース増やさずに使えるブレンドは有力な強化法なのか? それはホンマモンのブリーディングも同じだろ実際
新馬セリ6億で1円も稼がずに引退とかw みんなで好き勝手にバラバラにそこそこ強い評価関数をたくさん作って
最後に寄せ集めて平均とれば3駒関係での最強の評価関数が出来る気がしてきた。 ブレンドって悪手率が下がる代わりに関数の平均精度自体は低下してるんじゃない? yasetamafu70 gikou2 81 1 18 こいつは序盤から中盤差し掛かりくらいまでで強い
ソフト選んで何したいんだろう?
https://live.fc2.com/53319816/ 👀
Rock54: Caution(BBR-MD5:e0d4793365125e4bd37cad56cd2ee290) >>389
elmoはなかなか読んでくれないな
技巧2と古いAperyは読んでくれたが浮かむ瀬がなかなか読んでくれない
浮かむ瀬ってAperyだよなぁ ■ このスレッドは過去ログ倉庫に格納されています