▲コンピュータ将棋スレッド121 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
まふは歪んでても強いという棋風を味わえる。
電王戦トーナメントで優勝するソフトはelmoから+300〜+400上げないとならないのかもしれない。 relmoに勝ち越せるブレンドはできたんだけど、今度は技巧2にやや負け越すようになってしまった
負け方が大反省ばかりなので、技巧に見えてこっちに見えてない筋がけっこうあるみたい
技巧の血が欲しい(吸血鬼かw) なんだかんだ将棋ダビスタはrezeroとelmo系の第一世代のイブリードしか上手くいかないことがほとんど。 >>177
まぁ実際はそれだろうな
自分で320勝250敗とか労力&時間を費やしてたら、「勝ち越せる」なんて軽いフレーズで流さないからね
驚くほど少ない対局数だろうことが容易に推測できる 最新のリゼロとelmoを混ぜるとelmo+R300ぐらいになっているんだろうか・・ 計測が追い付かん。
relmoの他にも、技巧2との勝率も出した方がいいんだろうが そういやここで統計を書くと必ず「そんな糞スペックでは意味ねーわ」というレスが付くので、スペックを書きたくなくなるのは分かる
実際問題NPSだけが大事なんだから、糞スペックのヤツはこうやって見栄を張るといい
NPS平均1000kのPCで3秒対局
ここに貼り付ける時は「NPS3000kのマシンで1秒対局してみたんだが・・・」
嘘だけど、実際無問題だし、見栄も張れるしこれでOK 「もうやめて、Ponanzaのライフはゼロよ」
状態だな
まふ神降臨
第5回 電王トーナメントどうなるんだこれ >>182
同じNPSでもスレッド数少ない方が強いんでしょ?それじゃ過小評価でしょ
そもそも低ノードでは〜って言い訳にはなってないよな
短時間で弱いっていう事実が残るだけで >>183
電王トーナメントはやねさんの言う通り大規模じゃんけん大会になるだろう じゃんけんでお金もらえても誰も損はしないけどなw
まあ頑張ってた人は気の毒ではあるが まあ山本もいずれはponanzaもそうなるって言ってたし
こんなにも早いとはおそらく誰も思わなかったろうけど じゃんけんってのは実力拮抗して運次第って意味?
そうはならないよね。最近数週間、数日の進歩をみてると R4200が基準としてなんだかんだ言って、やねさんや平岡さんなど強豪ソフト開発者はR4300クラスのソフトをぶつけて来るんじゃない? 平岡や磯崎も焦ってると思うよ
まふさんの評価関数は最強! プログラミングする人とチューニングする人それぞれがタッグを組むのがやはり最強か。オープンソース化した効果で凄まじい勢いだ。
いよいよポナンザの山下兎ペアもアドバンテージがなくなってきたか? floodgate復活したら4000超えで安定する世界になってそう?? 例年通りだと10月くらい?
まだあと3ヶ月もあると更に足切りライン上がりそうだが。 時間を掛けた計測の最中に
その評価関数が時代遅れになっているの悲しすぎ
まふ+rezero8評価関数 NPS1300kN/s 秒読み2秒 115局時点で
53勝 delta = Value(18);
56勝 delta = Value(30);
30に増やしても特に弱くなる様子はないみたいだ
(delta = Value(6);や(9)はあからさまに弱かったから増やす方向で計測した)
対局数116 先手勝ち57(52%) 後手勝ち52(47%) 引き分け7
mafuzero8 delta = Value(18);
勝ち53(48%) 先手勝ち28(50%) 後手勝ち25(46%)
mafuzero8 delta = Value(30);
勝ち56(51%) 先手勝ち29(53%) 後手勝ち27(49%)
誤差レベルだから1000局指しても有意な差は出ないかもしれない
まふが更新されたから何の意味もないデータになってしまった😇やる気ゲージは既にゼロ >>194
レートは相対的なものだからみんな同じくらいの強さだったらレート低くなるんじゃね? まふ10が強くなりすぎて既存のリゼロやレルモなどと混ぜてもかえって弱くなる >>200
まふ10は序盤だけじゃなくて終盤も強いの? 適当すぎて笑うわ
実際のところ強くなりすぎてどころか強くなってないけどな
野生の読み太とずっと4スレ5秒(1手1200万ノード程度)で対戦させてるが(まふの推奨どおりgithubにある定跡ありで)、
野生の読み太に比べて有意に強いとはとても言えない成績(それどころか今のところmafu10は負け越している)
まぁまふのgithubにも書いてあるが、mafu10はひとつ前の評価関数よりもレーティング的には低いくらいだよ
R4200も確実にない コロコロ言うこと変わるのは相変わらずだな。まぁ実験を繰り返すのは悪くない
超短時間のレート計測らしいから2秒とかでどうだか >>203
その持ち時間じゃ有意にも何も100局も指してないでしょ
具体的に何局指して何勝何敗なのよ? そのうち「elmoとハム将棋を配合すると面白い配合になって強くなる」
とかいう事例が出てきそう mafu10について
もの凄い反響ありがとうございます。すでに短時間対局で2800局程度の情報を頂きました。
それによりますと前回の「mafu」よりR30程度弱くR4100程度であるという計測結果です。
今回の評価関数は「教師局面生成用評価関数」という位置付けで作成しています。
具体的な違いは?と言われれば「mafu」+「mafu10」の配合でもレートが少し上がります。
これは出来るだけ正確な教師局面生成が出来るように評価パラメタの配分にこだわった効果で、次に学習した局面の特徴を捉えやすくするためです。ですから10人が「mafu10」から評価関数を作っても特定の評価パラメタにハマリにくいので、いろいろな評価関数が出来ることが期待されます。
さらに通常、学習で特徴を特化(過学習)してしまった評価パラメタを慣らすには、前に学習した教師局面と混ぜて再学習等行うことが必要ですが、この「mafu10」では評価パラメタが抑えられている(まふ評価関数は何故強いのですか?で私が書き込んだようなrezero系配合のような例外はあるが)ので突出した新しい評価関数と上手く配合するだけで慣らしが出来ます。(再学習を何時間もやるより超高速) 奴の型は有限なれどその組み合わせは甚大
無限に等しい数に及ぼう
キメラ化した世界についていけない >>207
win10pro
CPU_i7-6700K, MEM16G,
thread=4, own_book=on(mafu10はプロジェクト3学習用定跡、野生の読み太はオリジナルの定跡使用), hash=4096, byoyomi margin等はすべて0, 当然ponderもOFF
1手5秒
野生の読み太 44勝(64%) mafu10 24勝(35%)
局数が少ないから200局指せばここから互角近くまで戻す可能性はあるが、少なくともここまで離れてしまったら、現時点でも野生の読み太に比べてmafu10が有意に強いとはいえない、くらいは言えるでしょ
ちなみにrelmo,yaselmo,rezero8,mafu_project2等でも対戦結果を計測しているが、このPCで他所の結果とほぼ整合性が取れている
1手5秒計測で、50局以上計測した上でここまで離れた成績が数百局後に反転するなんてまず無い レート計測に異なる定跡をつかっちゃダメでしょ。
互角局面集、もしくは定跡を揃えるか定跡なしで計測するべき それで、どの流れを読むと教師局面生成用の定跡でソフトの強さが測れるか
説明していただけますか? 214 215 ですけど 211 への書きこみです。すみません 2800局のデータを集めたまふさん vs 100局にも満たないイキリオタク まふさんgithubにまともな対局の結果がでています ソフト界発展のためには、進歩早いほうがいいですし
一般の人に協力してもらうのもいいと思います
定跡はオフで対戦すれば評価関数の強さをたしかめられますね 進歩が早すぎるというほど早くはないだろ
せいぜいレーティングがelmoから50程度上がったくらい
アルファ碁の成長から見たらクソみたいなもん しかし圧倒的な棋譜不足から自己対戦での強化方法が確立したのに、また質の高い棋譜が必要とされるとは皮肉だな もうまふ定跡載せてキメラ化した状態が一番最強だと思えてきた。
フラゲ復活はよ 技巧2はなにこれ意味わかんねみたいな手が少なくて、筋のいい正着手を示してくれるから良い。
俺も技巧2がいいと思う 常に最新最強のソフト追っかけてる人の気持ちが分からん
コレクターの自己満的な感じなのかな?
研究検討に使いたいなら、追っかけてる時間があれば既存の技巧2なんかで研究検討してた方がよっぽど時間の効率がいいと思うんだが ソフトによって局面の過大評価、過小評価あるんだから複数の評価関数使うだろ普通は
最新ソフトもダウンロードして研究検討すればおk 強さが分かってるソフトならいいけど、
強くなってるか分からない、強くなってたとしてどれくらい強くなってるのか分からないソフトを落としたところで無意味だと思うけどね
強さの評価を自分でやるならやっぱり時間がかかるし、詰め将棋の一問でも解いてた方が棋力向上になるかと
最新ソフト追っかけてる人は、棋力向上諦めて自己満、コレクターに走ったとしか思えない
まあその人らのおかげで、ソフトを効率良く取捨選択できるんだけどw 強くなってるなら無意味じゃねえだろww
無意味の意味分かってる?ww
時間だの効率だの言う割には2ちゃんにゴチャゴチャ書き込むんだな(笑) コンピュータ将棋のスレでわざわざ人間の棋力(笑)について語る時点でコンピュータ将棋の追求を諦めて、自己満の棋力オナニーに走ったとしか思えない >>234
コンピュータ将棋スレでそれを言うのは場違いにも程がある(笑)
このスレはお前みたいに自分の棋力向上や研究してる人たちだけじゃないんだよ。 適当なランダム手ではなくε-greedy使ってる開発者はいないのかな このスレの住民は
1 競プロ的に楽しんでいるプログラマ
2 ダビスタ的に楽しんでいるちょっとPCに詳しい人
3 棋力向上のためのコンピュータ将棋研究家(笑)
4 ソフト指しのためのソフト探し
こんなところだろう。話が噛み合わないのも当然だな。
コンピュータ将棋研究家がフルボッコにされているので、隔離用にコンピュータ将棋研究スレというものを建ててもいいのかもしれない。 コンピュータ将棋研究スレ [無断転載禁止]©2ch.net
http://mevius.2ch.net/test/read.cgi/bgame/1499638034/
suimonさんのために専用スレ建てたんだよな。みんなでこっち使おうぜ。 >>239
適当なランダム手を確率的に入れて、それ以外では評価値の最大のものを使っているんだから、ε-greedy みたいなもんだろう 立てるのは自由だと思うがスレタイが分かりづらいと思う。
「研究」という単語が入っただけじゃ分からん。
棋力向上とか戦略研究とかそういうワードを入れるべき >>243
なるほど、そういうくすぐり方をしないとだめなのか。某ブログのタイトルパクったのがミスだった。 ソフト使いたいだけの輩がソフトの進歩に少しでも貢献してる人を馬鹿にするのって
自分は募金しないくせに募金してる人を偽善者呼ばわりする輩にも似て不愉快だな 今のところmafu.7zとrezero8の組み合わせが
単純な配合では一番強そう ブレンドが強くなる道だとしたら競技性が成立するのかって疑問がでてくるよな。
下手したら独自性のルール違反のが最強ソフトになる可能性もあるわけで。。 最強まで来れば最強である事が独自性だから問題ないと思うが
入賞ラインにどの程度の独自性を持ったソフトが入るかは分からないね
非やねうら王ライブラリのソフトが決勝進出まで行ったらそれだけで凄いという状況でしょう今や スレッド6 1手2秒 で定跡なしの100戦だけだけど技巧2と対戦させてみた。
mafu.7z 対 技巧2 77 0 23
relmo 対 技巧2 72 0 28
mafu10 対 技巧2 81 0 19
参考程度に >>249
relmoは2スレ0.4秒でもそんな感じだな
nozomiとやるとrelmoとまふで差が出るかも 他系統な自己対戦をしたいんだけど、技巧2も弱すぎるのがなぁ
ひとまずnozomiともやってみるか AlphaGoの成長と比較するのはお門違いだろうよ 今やっている竜王戦
丸山41手目をやねうらエルモは▲33銀成がいいというんだが、そのあとの変化△78桂成▲43馬まで進めると思考停止してしまい正しく読み筋が表示されなくなる
これはバグなんだろうか
先手後手どっちを持っていても、一手進めると回復するから実戦で致命的な欠陥にはならないのかもしれないが、ちょっと不気味だね 魔女や技巧は読み進めるようだからこれはやねうら王のバグかな
やね先生お願いします うちではShogiGUIで候補手3手以上にすると思考が止まる?模様
読み太、技巧、魔女は候補手3手以上指定しても問題ないみたい
棋譜は竜王戦の中継サイトにあるよ >>256
たぶん、環境やオプションに関係なく再現できるので、やねうらエンジンの特性に起因してると思います
棋譜は
http://live.shogi.or.jp/ryuou/kifu/30/ryuou201707100101.html
で40手目の局面から検討モードにして
▲33銀成△78桂成▲43馬としたところで発生します
△78桂成の局面では▲43馬△62玉▲54桂△同歩▲44角...と読みが正確に表示されるのですが、
▲43馬の局面で読ませると思考深度が△62玉▲54桂と2/3で止まってしまい終わりです。 >>259
解決しました
既出でしたね
ありがとうございます >>262
お前も次からリンクぐらい貼ってやれよw ついでで質問して申し訳ないけど
>あと、MultiPVを2以上に設定しているときは、fail low/highしたときに読み筋を出力しないようになっている。Stockfishがこうなっている。…
この仕様の元やねうら王は出力しないというわけなの?
将棋所で>>260試してみたけど、MultiPV2では動いて、MultiPV3では出力しないようだけど
上の記述の実際は、MultiPVを3以上に設定しているときはってことなのかな? >>260
>やねうらエンジンの特性に起因してると思います
そんなことはないです
>>256の指摘はもっともな指摘です
あなたのトラブルは環境を晒せばすぐ解決するような簡単なFAQレベルのトラブルに過ぎないと思いますw >>264
> MultiPV2では動いて、MultiPV3では出力しないようだけど
お前にとっての「動いて」がどういう状態なのかわからないし、
お前にとっての「出力しない」は何を出力しないというのか どれくらい強くなったかの検証に時間を割くよりも、研究やら詰め将棋やらに時間を割いた方が棋力向上になると思うんだけどなぁ
強いソフト追っかけて、高スペで動かして、FGで1位になって。でも将棋の内容は分からない、だったらなんのためのソフトなのって話。
実際、このスレで県代表狙える人ってどれくらいいるのかね。興味ある あなたが棋力向上を目的としてるなら、このスレは合ってないので>>241へどうぞ >>264
私のはオプションの検討モードをオフにしていたのが原因でした
オンにしたら読み筋が正常に戻りました >>267
楽しみ方は人それぞれだってーの
お前の楽しみ方を他人に強要すんなよ
将棋ソフトの開発者は自分が将棋に強くなるために将棋ソフトを作っているのではない 何か見落としがあるかもしれないけど
ひとまず王手掛けられたときに、詰みにならない逃げ道がMultiPV未満の場合に
思考停止(ノード探索数が数百程度から増えずに、思考時間ばかりが経過する状態)
することがある様子
GUI:将棋所とShogiGUI
将棋エンジン:やね4.72
エンジン設定項目:MultiPV(や候補の手数)を2以上にすると再現する模様
再現可能な局面の例
http://kyokumen.jp/positions/lns1k2nl/1rg2G1b1/pp2pSppp/2pp1p3/9/9/PPPPPPPPP/1B5R1/LNSGKGSNL%20w%20- ■ このスレッドは過去ログ倉庫に格納されています