▲コンピュータ将棋スレッド121 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
>>757
勝率別 ・・・ 有意に強いと言える対局数
51% 6764局
52% 1691局
53% 752局
54% 423局
55% 271局
56% 188局
57% 139局
58% 106局
59% 84局
60% 68局
elmo mafuta3 40 3 57 → 勝率58%、有意に強いと言うには後6局は欲しい
elmo yasema10 33 5 62 → 勝率65%、有意にelmoより強い◎
relmo yasema10 44 7 49 → 勝率52%、有意に強いと言うには後1500局は欲しい
elmo yasema10以外はデータ不足だね Qhapaq @Qhapaq_49
評価関数分解機、多分完成。これからwindows用にビルドしてやねうら王にプルリクしてアピールと使用法をブログに書いたらミッション完了ですか。うーん、ここからが長い。
新しいおもちゃが来るぞ suimonさんは有意検定にも詳しいんですね。
さすがコンピューター将棋の第一人者。勉強になります。 744で、mafuta2と野生の読み太2を5:5で配合が強いと書いたものですが、後でmafuta2との
対局をしていないことに気づきました。そして、早速対局の結果、mafuta2の方が、より
強いことが分かりました。間違った情報を伝え申し訳ありませんでした。この場を借りて
お詫び致します。<(_ _)> なんでtwitterから持ってきてyasema10最強という結論なんだ?
uuunuuun? @uuunuuun1 4時間前
ブリード種はたくさんあるしあとには残らないと思うのでレート表には載せないつもり。yasema10が一番強いと言っているものでもない。 検定はなぁ…
とにかくデータ数増やせば小さい差であっても有意と言えるようになるが、
そんな小さな差が現実的に意味のある差なのかという問題がある shogidroidで、一番弱いのはgpsだと思うけど、次は最初の技巧?
ある程度勝てるソフトと指したいw >>772
デュアルXeonだとかなり早いのですね。
suimon率で他のニワカコンピュータ将棋研究家のぼくのかんがえるさいきょうのとうけいがくを論破。
さすが! いつまでsuimon率以外で消耗してるの?
次のブログタイトルはこれだ! >>760
言いたいことは分かるが、コンピュータ将棋関係者であり将棋を指す方で県大会上位を争う研究をしているのはsuimonさんただ一人。
開発の委託とかしないと開発者にとってメリットや面白みがない。
今後の大きな課題だろうね。 よっちゃんとかいう何の実績もないゴミの報告はいらんぞ
まぁただの売名だろうけど よっちゃんって、あのFC2動画主のナマポ野郎が作ったやつだろうが(笑)
あんなの使ってる奴はあほ(笑) よっちゃんは有意差のあるレベルで
yasema10より強くなったら来てくれ レート4200やレート4300などと実際はレート4000程度の評価関数を、
誇大に公開したり(取り下げたり)するものではない。 まふさん質問の答えになってないよ。
なぜまふさん作成の評価関数は横歩取りを指さないの?って質問に対して。 てか本当にR4300もあったらぶっちぎりで優勝だろうがww XEON持ってる人羨ましいな。
一晩学習回していろいろ遊べるし、振り飛車の評価関数作ってみたり出来るだろうし
何より自己対戦も早い キメラはお手軽簡単だけど絞りで強くする方法は何か難しいな。シボレーの動かし方は分かっても細かい設定の意味わからんから諦め気味 やばい、mafuta2とelmoを4スレ一手5秒、定跡切りで対局中だけど、67局時点で52勝13敗
(勝率80%)R241差で、wcsc27のponanzaの対elmoの勝率65%を軽く超えていて、びっくり。yasema10
とはレベルが違う。なんで、こんなに強いの。 将棋24で対戦した棋譜をやねうら + elmo で解析して復習してます。
ちなみに私は将棋24の下の方の級位者です。
大変勉強になるのですが、贅沢を言うと私には絶対に読めないであろう手順が多数表示されます。
例えば(難解な)終盤31手詰めだとか、10手以上先でやっと理解出来る優位になる場面とか
詳しく見るとなるほどと思うことも多いのですが、私の上達にすぐ役に立つのかな?と少々疑問にも思っています。
多分、私の求めているのは私よりずっと強いけど、プロの解析では無く、将棋24の初段位の人が
解析してくれるのが一番勉強になるのではないかなぁ?と思っているのですが
その為にはやねうら + elmo の思考時間を調整する以外にどんな方法があるのかご教示頂けないでしょうか?
また、私の勉強方法についてアドバイスを頂けましたら益々幸いです。
よろしくお願いします。
もし、スレチでしたらごめんなさい。 >>795
技巧2でレベル落として解析するのがいいかも。3手先ぐらいの読みを示してくれる。 YouTubeで初段ぐらいの人の実況動画見るといいかも >>794
yasetamahu70の方が強いから.
>>413にそう書いてる 弱いソフトとかレベル落として解析ってのはあまり良くないと思う
気になるところをMultiPVで検討するのが一番いいのでは しういうオレは、ぴよとの対局をelmo系のソフトを検討モードで動かしながら推奨手を棋譜に記録していって、手を意味を考え、覚えるということをしている >>800 まふさんのは短時間であって一手5秒だとyasetamahu70はmafuta2には全然
弱いよ やねうらおのイントネーションってどっち?
や↑ねうらお
や↓ねうらお
どっちだ? 改正版2(勝率順)
mafu 372-320-8
mafuta2 371-325-4
mafuta3 368-329-3
mafuta1 368-330-2
yasema10 366-331-3
yasetamafu70 363-330-7
mafu10 346-351-3
elmo 230-468-2
elmo対まふ系統の評価関数
mafu 70-29-1
mafuta3 70-30
mafuta2 70-30
mafu10 67-32-1
yasetamafu70 67-33
yasema10 64-36
mafuta1 60-40
elmo対まふ系統の評価関数以外で最も勝敗差がついた対戦
mafuta3 mafu10 63-36-1
rezero8、relmo8は大体のレーティングが出ているようなので外しました
また、よっちゃんとyasetamafu70+も外しました
この計測結果が正しいかはわかりませんが
参考までに。 もしかしてeval_shareトラップに引っ掛かった方?
再計測ありがとうごさいます。mafuって最初のmafu.7zですか? 強いやつ同士で持ち時間1時間切れたら30秒でやってもらわないと、検討に使うソフトの選択としては残念だが役に立たない eval_share以外に設定ミスないでしょね
まふさんみたいにレートのウソ書くのとは違うだろうけど >>809
もし良かったらですが、各ソフトの個別の対戦成績も教えてもらえますか? >>816
わかりました
ただ、ちょっと用事があるので後ほど 上位陣は概ねelmoよりレート120以上強いのは間違いなさそうか
すごいなあ mafuta2とelmoを4スレ一手5秒、定跡切りで100局対戦させてmafuta2側の70勝25敗引分5(勝率73.68%) R差176で
レーティングはelmo+176で4137になります。単純計算上ではwcsc27のponanzaを超えていると思うのですが・・・ 「さっき、現局面をソフトで調べました。互角です」(千田六段)
「野生の読み太」と「まふ評価関数」で調べたそうだ。 >>821
suimonさんがmizumonに突撃するチャンスだな。 レート4100とかすごいね
技巧2に85%勝てる感じ? 全対戦成績
yasetamafu70 mafu10 48-52
yasetamafu70 mafuta2 49-49-2
yasetamafu70 yasema10 54-46
yasetamafu70 mafuta3 51-48-1
yasetamafu70 mafuta1 48-51-1
yasetamafu70 mafu 46-51-3
yasetamafu70 elmo 67-33
mafu10 mafuta2 52-47-1
mafu10 yasema10 55-45
mafu10 mafuta3 36-63-1
mafu10 mafuta1 40-60
mafu10 mafu 44-56
mafu10 elmo 67-32-1
mafuta2 yasema10 51-49
mafuta2 mafuta3 47-53
mafuta2 mafuta1 57-43
mafuta2 mafu 50-49-1
mafuta2 elmo 70-30
yasema10 mafuta3 58-41-1
yasema10 mafuta1 52-48
yasema10 mafu 52-46-2
yasema10 elmo 64-36
mafuta3 mafuta1 51-49
mafuta3 mafu 42-58
mafuta3 elmo 70-30
mafuta1 mafu 57-42-1
mafuta1 elmo 60-40
mafu elmo 70-29-1 いくら評価関数のキメラ化がブラッシュアップされようとも、
ディープラーニングがその遥か上を行っている可能性
電王トーナメントでPonanzaが優勝しても評価関数ブレンドブームは続くのかな ブレンドブームって開発者の人以外がブレンドして遊んでるだけでしょ
開発者の人たちは雑巾絞ってるんじゃ? 周りが遊んでるだけだから主要陣は流されないでほしいけどね
uuunuuunさんの投票も野良系の評価関数を載せた方がいいって意見が多くてびっくりだわ
絶対載せない方がいいと思うけど 自分は野良系の評価関数を載せた方がいいと思う。将棋は勝負の世界で、より強い
ものに価値があると思う。強ければそれでよい。あと、レーティングの数値が上がる
ほど、今まで一強だったポナの価値も下がり、他の開発者の人たちも頑張っている
という証になると思う。 野良の評価関数載せなくていいから、はよ水門開いてほしい 最大差
evalshare
yasema10 463-429-8 .5191
よっちゃん10 425-469-6 .475
mafu 372-320-8 .537
mafu10 346-351-3 .496
勝率50%の対局より差が少ないな そういや野生のfloodgateってあったよな。今こそ使うべきだろ >>832
どれか1つでも野良を載せたら、
じゃあ他の野良は何故載せないのか?
とか、自分が作った奴も乗せてくれ、とか喚くバカのせいで
いちいち面倒なやり取りが発生するからな さくらも山本にマシンをタダで貸すくらいならfloodgateに一鯖を提供すればいいのにな
命名はご自由に >>829
くっそ計算コスト重いディープラーニングをつかったPonanzaがスペック制限のある電王戦で優勝すると思った理由を聞いてもいいか
スペック制限のないWCSCでも優勝できなかったのに 別枠で野郎系のみのランキング表を作っておけばいいんじゃね?って思う レーティングの計算なんてマシンスペックいらないんだから、レーティング出してくれた人のために自分で出してむしろ公開してやれよ。
このスレでやれ対戦数が少ないとか文句言う奴はだいたいクレクレ 野良系なんてランキングに入れても僅差の中に同系統のソフトが無数に並ぶだけ
いらないと思うけどなあ? floodgateサーバーダウンと関係あるかわからないけど、、
Tomoyuki Kaneko? @tkaneko 7月12日
弊キャンパス、連日のように節電依頼があって、貧すれば鈍ずという感じで、精神に悪影響がある。
本郷ではそんな放送流れていないのだから、契約電力そのものを上げてもらえると良いのだが。
東京大学駒場図書館? @UTokyoKomabaLib 7月13日
駒場Iキャンパス全体の電力使用が契約上限に迫る日が続いているため、
駒場図書館では、やむを得ず12:00-16:00の間、断続的に冷房の運転を止めることがあります。
冷房停止時には、特に3、4階で気温が上昇しますので、なるべく下層階をご利用いただき、水分補給を心がけてください。 Rank Name BayesElo + - games score oppo. draws
1 mafu 4117 25 25 692 54% 4061 0%
2 mafuta1 4102 25 25 698 53% 4064 0%
3 mafuta3 4094 25 25 697 53% 4065 0%
4 yasema10 4084 25 25 697 53% 4066 0%
5 mafuta2 4082 25 25 696 53% 4066 0%
6 yasetamafu70 4060 25 25 693 52% 4069 0%
7 mafu10 4047 25 25 697 50% 4072 0%
8 elmo 3961 26 26 698 33% 4084 0% 上位の勝率は誤差レベルだな
対elmoを差し引いたらどれも有意差ないレベルの勝率しかない 丁度EvalShare有効で
実質同じ評価関数で対局したデータが
>>626にあるけど
中身が全く同じでも800局で勝率48.1%〜51.4%までブレてる
キメラで正確なランキング作るならそれぞれで数千局しないと無理 >>847
こんな評価関数ばかり作って発表して得意がってるの? >>809
>よっちゃんとyasetamafu70+も外しました
これはなんでです? elmo公開2ヶ月で+R200か
このキメラの伸び白がどこまであるか分からんが
SDT予選落ちラインがどこまで上がるやら >>837
その時点でtopの野良だけ乗せればいいのよ >>839
ディープラーニングをどこに使うかは色々選択肢があるから、絶対に使えないと言い切れるほどじゃないよ。
探索時には使えなくても、学習時に使うなら計算に物量投入できるから。
例えば評価関数のブレンド方法に使うとか、そういうメタな方法なら電王戦でも使える。 www.google.co.jp/?gws_rd=ssl#q=東京大学+本郷+節電 >>837 853番さんの意見に賛成です。別に全部細かく載せる必要はなく、一番強い
ものだけ載せればいいと思う。弱い野良が載せてほしいとか仮に言ってきても、弱い
奴が何ぬかしとんねんで撃沈されておしまい。837番さん考えすぎだと思いますよ。 次から次に湧いてくる野良を計測して野良トップを特定する作業を誰がやるの?
その時点のトップを特定したとして、後から湧いてくる自称最強野良をどう扱うのか
いちいち計測するのか…。他人にやってくれとは言えないなあ 847見てわかるように同じくらいのポンポン出てくるしその度に計測して一番強いの決めるとか手間がかかり過ぎる まふさん性能良くないパソコン1台のようで(6980円?、中古で買ったの?)
現在検証してほしい組み合わせ「mafuta3」60%+「rezero8」40%※対局結果求む
mafuta3がtanuki-wcsc27の遺伝子を色濃く受け継ぎ(6九玉、5八金の配点が高い)角換わりにおいてもelmoの6二金、8一飛型を5八金型で倒しているので、こちらの進化系に絞って配合情報を募集します。
Qhapaq新ツールREMUで「mafuta3」を解析すると「elmo41%近似」と出ました。KPPT型においてelmoと玉位置配点が異なり、tanuki-wcsc27遺伝子が棋風として見えるのに驚きです。
Qhapaq新ツールREMUが示唆しているように、人間の目で見て違っていても機械的に同一性が認められ、relmoのようにrezero8を1:1で(今回40%)配合するとレートが向上するのであれば、Qhapaq新ツールREMUはすごい配合発見器になるかもしれません。(評価関数自体が数字の集合体なので、検証の価値がかなり有ると思っています) ■ このスレッドは過去ログ倉庫に格納されています