▲コンピュータ将棋スレッド121 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
将棋24で対戦した棋譜をやねうら + elmo で解析して復習してます。
ちなみに私は将棋24の下の方の級位者です。
大変勉強になるのですが、贅沢を言うと私には絶対に読めないであろう手順が多数表示されます。
例えば(難解な)終盤31手詰めだとか、10手以上先でやっと理解出来る優位になる場面とか
詳しく見るとなるほどと思うことも多いのですが、私の上達にすぐ役に立つのかな?と少々疑問にも思っています。
多分、私の求めているのは私よりずっと強いけど、プロの解析では無く、将棋24の初段位の人が
解析してくれるのが一番勉強になるのではないかなぁ?と思っているのですが
その為にはやねうら + elmo の思考時間を調整する以外にどんな方法があるのかご教示頂けないでしょうか?
また、私の勉強方法についてアドバイスを頂けましたら益々幸いです。
よろしくお願いします。
もし、スレチでしたらごめんなさい。 >>795
技巧2でレベル落として解析するのがいいかも。3手先ぐらいの読みを示してくれる。 YouTubeで初段ぐらいの人の実況動画見るといいかも >>794
yasetamahu70の方が強いから.
>>413にそう書いてる 弱いソフトとかレベル落として解析ってのはあまり良くないと思う
気になるところをMultiPVで検討するのが一番いいのでは しういうオレは、ぴよとの対局をelmo系のソフトを検討モードで動かしながら推奨手を棋譜に記録していって、手を意味を考え、覚えるということをしている >>800 まふさんのは短時間であって一手5秒だとyasetamahu70はmafuta2には全然
弱いよ やねうらおのイントネーションってどっち?
や↑ねうらお
や↓ねうらお
どっちだ? 改正版2(勝率順)
mafu 372-320-8
mafuta2 371-325-4
mafuta3 368-329-3
mafuta1 368-330-2
yasema10 366-331-3
yasetamafu70 363-330-7
mafu10 346-351-3
elmo 230-468-2
elmo対まふ系統の評価関数
mafu 70-29-1
mafuta3 70-30
mafuta2 70-30
mafu10 67-32-1
yasetamafu70 67-33
yasema10 64-36
mafuta1 60-40
elmo対まふ系統の評価関数以外で最も勝敗差がついた対戦
mafuta3 mafu10 63-36-1
rezero8、relmo8は大体のレーティングが出ているようなので外しました
また、よっちゃんとyasetamafu70+も外しました
この計測結果が正しいかはわかりませんが
参考までに。 もしかしてeval_shareトラップに引っ掛かった方?
再計測ありがとうごさいます。mafuって最初のmafu.7zですか? 強いやつ同士で持ち時間1時間切れたら30秒でやってもらわないと、検討に使うソフトの選択としては残念だが役に立たない eval_share以外に設定ミスないでしょね
まふさんみたいにレートのウソ書くのとは違うだろうけど >>809
もし良かったらですが、各ソフトの個別の対戦成績も教えてもらえますか? >>816
わかりました
ただ、ちょっと用事があるので後ほど 上位陣は概ねelmoよりレート120以上強いのは間違いなさそうか
すごいなあ mafuta2とelmoを4スレ一手5秒、定跡切りで100局対戦させてmafuta2側の70勝25敗引分5(勝率73.68%) R差176で
レーティングはelmo+176で4137になります。単純計算上ではwcsc27のponanzaを超えていると思うのですが・・・ 「さっき、現局面をソフトで調べました。互角です」(千田六段)
「野生の読み太」と「まふ評価関数」で調べたそうだ。 >>821
suimonさんがmizumonに突撃するチャンスだな。 レート4100とかすごいね
技巧2に85%勝てる感じ? 全対戦成績
yasetamafu70 mafu10 48-52
yasetamafu70 mafuta2 49-49-2
yasetamafu70 yasema10 54-46
yasetamafu70 mafuta3 51-48-1
yasetamafu70 mafuta1 48-51-1
yasetamafu70 mafu 46-51-3
yasetamafu70 elmo 67-33
mafu10 mafuta2 52-47-1
mafu10 yasema10 55-45
mafu10 mafuta3 36-63-1
mafu10 mafuta1 40-60
mafu10 mafu 44-56
mafu10 elmo 67-32-1
mafuta2 yasema10 51-49
mafuta2 mafuta3 47-53
mafuta2 mafuta1 57-43
mafuta2 mafu 50-49-1
mafuta2 elmo 70-30
yasema10 mafuta3 58-41-1
yasema10 mafuta1 52-48
yasema10 mafu 52-46-2
yasema10 elmo 64-36
mafuta3 mafuta1 51-49
mafuta3 mafu 42-58
mafuta3 elmo 70-30
mafuta1 mafu 57-42-1
mafuta1 elmo 60-40
mafu elmo 70-29-1 いくら評価関数のキメラ化がブラッシュアップされようとも、
ディープラーニングがその遥か上を行っている可能性
電王トーナメントでPonanzaが優勝しても評価関数ブレンドブームは続くのかな ブレンドブームって開発者の人以外がブレンドして遊んでるだけでしょ
開発者の人たちは雑巾絞ってるんじゃ? 周りが遊んでるだけだから主要陣は流されないでほしいけどね
uuunuuunさんの投票も野良系の評価関数を載せた方がいいって意見が多くてびっくりだわ
絶対載せない方がいいと思うけど 自分は野良系の評価関数を載せた方がいいと思う。将棋は勝負の世界で、より強い
ものに価値があると思う。強ければそれでよい。あと、レーティングの数値が上がる
ほど、今まで一強だったポナの価値も下がり、他の開発者の人たちも頑張っている
という証になると思う。 野良の評価関数載せなくていいから、はよ水門開いてほしい 最大差
evalshare
yasema10 463-429-8 .5191
よっちゃん10 425-469-6 .475
mafu 372-320-8 .537
mafu10 346-351-3 .496
勝率50%の対局より差が少ないな そういや野生のfloodgateってあったよな。今こそ使うべきだろ >>832
どれか1つでも野良を載せたら、
じゃあ他の野良は何故載せないのか?
とか、自分が作った奴も乗せてくれ、とか喚くバカのせいで
いちいち面倒なやり取りが発生するからな さくらも山本にマシンをタダで貸すくらいならfloodgateに一鯖を提供すればいいのにな
命名はご自由に >>829
くっそ計算コスト重いディープラーニングをつかったPonanzaがスペック制限のある電王戦で優勝すると思った理由を聞いてもいいか
スペック制限のないWCSCでも優勝できなかったのに 別枠で野郎系のみのランキング表を作っておけばいいんじゃね?って思う レーティングの計算なんてマシンスペックいらないんだから、レーティング出してくれた人のために自分で出してむしろ公開してやれよ。
このスレでやれ対戦数が少ないとか文句言う奴はだいたいクレクレ 野良系なんてランキングに入れても僅差の中に同系統のソフトが無数に並ぶだけ
いらないと思うけどなあ? floodgateサーバーダウンと関係あるかわからないけど、、
Tomoyuki Kaneko? @tkaneko 7月12日
弊キャンパス、連日のように節電依頼があって、貧すれば鈍ずという感じで、精神に悪影響がある。
本郷ではそんな放送流れていないのだから、契約電力そのものを上げてもらえると良いのだが。
東京大学駒場図書館? @UTokyoKomabaLib 7月13日
駒場Iキャンパス全体の電力使用が契約上限に迫る日が続いているため、
駒場図書館では、やむを得ず12:00-16:00の間、断続的に冷房の運転を止めることがあります。
冷房停止時には、特に3、4階で気温が上昇しますので、なるべく下層階をご利用いただき、水分補給を心がけてください。 Rank Name BayesElo + - games score oppo. draws
1 mafu 4117 25 25 692 54% 4061 0%
2 mafuta1 4102 25 25 698 53% 4064 0%
3 mafuta3 4094 25 25 697 53% 4065 0%
4 yasema10 4084 25 25 697 53% 4066 0%
5 mafuta2 4082 25 25 696 53% 4066 0%
6 yasetamafu70 4060 25 25 693 52% 4069 0%
7 mafu10 4047 25 25 697 50% 4072 0%
8 elmo 3961 26 26 698 33% 4084 0% 上位の勝率は誤差レベルだな
対elmoを差し引いたらどれも有意差ないレベルの勝率しかない 丁度EvalShare有効で
実質同じ評価関数で対局したデータが
>>626にあるけど
中身が全く同じでも800局で勝率48.1%〜51.4%までブレてる
キメラで正確なランキング作るならそれぞれで数千局しないと無理 >>847
こんな評価関数ばかり作って発表して得意がってるの? >>809
>よっちゃんとyasetamafu70+も外しました
これはなんでです? elmo公開2ヶ月で+R200か
このキメラの伸び白がどこまであるか分からんが
SDT予選落ちラインがどこまで上がるやら >>837
その時点でtopの野良だけ乗せればいいのよ >>839
ディープラーニングをどこに使うかは色々選択肢があるから、絶対に使えないと言い切れるほどじゃないよ。
探索時には使えなくても、学習時に使うなら計算に物量投入できるから。
例えば評価関数のブレンド方法に使うとか、そういうメタな方法なら電王戦でも使える。 www.google.co.jp/?gws_rd=ssl#q=東京大学+本郷+節電 >>837 853番さんの意見に賛成です。別に全部細かく載せる必要はなく、一番強い
ものだけ載せればいいと思う。弱い野良が載せてほしいとか仮に言ってきても、弱い
奴が何ぬかしとんねんで撃沈されておしまい。837番さん考えすぎだと思いますよ。 次から次に湧いてくる野良を計測して野良トップを特定する作業を誰がやるの?
その時点のトップを特定したとして、後から湧いてくる自称最強野良をどう扱うのか
いちいち計測するのか…。他人にやってくれとは言えないなあ 847見てわかるように同じくらいのポンポン出てくるしその度に計測して一番強いの決めるとか手間がかかり過ぎる まふさん性能良くないパソコン1台のようで(6980円?、中古で買ったの?)
現在検証してほしい組み合わせ「mafuta3」60%+「rezero8」40%※対局結果求む
mafuta3がtanuki-wcsc27の遺伝子を色濃く受け継ぎ(6九玉、5八金の配点が高い)角換わりにおいてもelmoの6二金、8一飛型を5八金型で倒しているので、こちらの進化系に絞って配合情報を募集します。
Qhapaq新ツールREMUで「mafuta3」を解析すると「elmo41%近似」と出ました。KPPT型においてelmoと玉位置配点が異なり、tanuki-wcsc27遺伝子が棋風として見えるのに驚きです。
Qhapaq新ツールREMUが示唆しているように、人間の目で見て違っていても機械的に同一性が認められ、relmoのようにrezero8を1:1で(今回40%)配合するとレートが向上するのであれば、Qhapaq新ツールREMUはすごい配合発見器になるかもしれません。(評価関数自体が数字の集合体なので、検証の価値がかなり有ると思っています) >>846
一応わかってると思うけど、最高学府って大学全般のことやで? ポナンザに似ている評価関数が最強でいいと思うんだよな。
suimon @floodgate_fan
しかし、ponanzaと他の上位ソフトと指し手の傾向がかなり似てくるようになったな…。
この傾向は平岡さんが評価関数の雑巾絞りジェネレーターを公開しはじめたときからあったが、最近はより近づいてきている感がある。
すでにponanzaに似たソフトが無料で手に入る時代といえよう。
午後9:47 · 2017年7月16日
Shota Chida @mizumon_
うーん、これについては分からないところがあるんだよなあ。
強くなったら同じ箇所が増えてくるのではという観点を除いても、見る側がponaに似てるところだけを探してそう感じているとか、棋力が低くてそう見えているだけだとか。(人間目線では細かく見えるところは大きい差であるとか)
午後11:16 · 2017年7月16日 混ぜ方では強くなる配合はたくさんある
試さないといけないから時間がかかる スマホのCPUは最先端だが?
NPSでしか判断ができないのかな?
suimon @floodgate_fan
意外にスマホのCPUの性能向上は進んでいない模様。
最新のもので平均1200kN/sほどだと思います。
午前7:42 · 2017年7月17日 floodgateは事業仕分けにより廃止で良くないか。東大が金を出す意味がない。 混ぜるので強くするのは限界あるんじゃないかな
探索部分や評価関数強いの作る方がいい
作って混ぜて作って混ぜる 検証の仕方がバラバラすぎて意味がないという展開だからなぁ。
ダビスタで言うと自分の得意距離で強さ自慢しているようなものだから。 >>867
そうなのです
このソフトには対戦して強くなった、でもこのソフトには弱い
などそういう関係が出来るのでたくさん作っても同じようなレートになりますしね まふのやっていること
1 何かを思いつく問題提起
2 検証
3 結果 強い評価関数が出来ました
4 後日 弱かったので削除します
この繰り返しで評価関数だけ増えてゆく
これぞまふ定跡 所詮プログラミングができない素人がイキがってるだけだからな まふさん、また新しいの作ったら今度はR4500かも!とか言いそうだな(笑) >>872
まふさんの功績は認めてますので、レートのウソを書くのだけはやめて下さいね 「mafuta3」60%+「rezero8」40%
自前の KKP_synthesized.bin は、以下のハッシュ値なんだが、合ってるかな?
CRC32: 39B1DF5A
MD5: 406146B52B3C1615DBECB5C6AA071D1B
SHA-1: 1D7135A9FB34F57A60F51D4A2F8C31432D146966 雑魚ンザが最近だんまりなのは、やはりキメラエルモに追い抜かれてて焦ってるからか(笑) >>809
これでもmafuとmafu10のレート差は29か。 >>857-858
律儀に全部測る必要なんてないやん。
強いと評判のものは噂になるんだから、気になったやつを気の向いたときに測ればいい >>854
せっかくのDLをメタな方法に使う事自体がDLである必要性を薄れさせている気がするのだが
当然学習時にも大量のコストをかけて、本番にも大量のサーバーで計算せざるを得なかったPonanzaがWCSC27で負けたんだから、電王戦で勝てるとは思えないけどなぁ(個人の感想)。隠し玉持ってそうな屋根裏優勝を予想する
なんにせよ電王戦の勝者が、この黒魔術じみた状況から脱するヒントを示してくれることを楽しみにしている まふさんも楽しいおもちゃを与えられてよかったね
評価関数作りで時間過ごせる
そしてその研究結果がやねうら王に吸い取られる
やねうら王優勝だーー まふさん、remutama40.7zもらった
検証は参加出来ないけど
これと他の既存の評価関数配合してみるよ >>809
elmoに勝率7割りで頭打ちか。
これ以上はdepth深くして学習を行わないと棋力延びなそうだけど、将棋ダビスタでどこまで行けるかな。 実験対戦
4スレ1秒定跡なし100回対戦
remutama40 yasetamafu70 49-51
同じ感じですかね… >>887
それ差し替え前の間違ったバージョンじゃないの?
remutama48も同封されてるのが新しいのです >>880
何をどう考えても無理すぎるだろ
んじゃ自分でやってみ?
メチャハードルは下げて、今強そうな関数をお前の好みで9ほど選択してそれに生elmoを加えて10関数でリーグ戦、1手1000万ノード、リーグ戦は各関数毎に300対局、合計1500対局くらいでいいわ
で1位〜10位までのRを発表してくれ
対局数が少なすぎんだろ!とか
んなノード数で何が分かるんだよ?とか
選択基準がメチャクチャ・・・だとか
不満もガンガン出ると思うけど、それくらいやれば感心してくれたり提案してくれる者も山ほど出てくるわ
で、その後は「この関数が強いぜー」って教えてくれる人が続々出るから、その中から自分で相応に見える物があれば、その度に10関数とそれぞれ30対局合計300対局やって生エルモ以外の最下位を削って常にTOP10を残す作業をする
これでもメチャクチャハードル下げてるから、本来はこんなもんじゃ全然足りてないからな
そんな薄っぺらい検証・計測ですら、お前、自分でそれが出来ると思う? まぁ、似たような評価関数作ったって、どうせみんなponanzaより雑魚なんだから 最強の評価関数は何か!?
多種ある評価関数がルール無しで戦った時…
スポーツではなく早指し長時間ありの『将棋』で戦った時
最強の評価関数は何か!?
今現在 最強の評価関数は決まっていない ■ このスレッドは過去ログ倉庫に格納されています