▲コンピュータ将棋スレッド122 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
4スレ10秒相当、定跡無し ramu 12- 3- 6 yaselmo ※勝率64.3%(21局時)現在
※yaselmo(yaseiyomita0703+elmo)が強いらしいということで対局してみたが、あきらかに内容に差がある。
(yaselmoは駒の連結は強いが盤の使い方が狭く、評価値300程度の読み抜けをちょくちょくやらかす)
おそらく100局程度で有意差が出ると思う。
普通に考えてyaseiyomita0703とelmoのどちらにも勝ちこせるramuのほうが強いのは当たり前に思うが、
レート測定が難しくなって来ているのかな?(この4スレ10秒相当はuuunuuun氏4コア4スレ10秒相当) ダメだ、ramu相手には有意差出るのは大変ですね。後日yaselmoとyasema3とやってみます。
6スレ1手3秒
scissors対ramu
9-1-7 有意差でなくてもいいからまず100戦くらいはやってから報告してくれ ブレンドはブレンド同士で対戦させてレーティング水増ししてるだけで、実際にはたいして強くなってないのがなぁ
ramuやyaselmoなんかはレート的には技巧2やnozomiに9割弱勝てなければならないが、9割弱どころか8割すら勝てないからな
同系列同士での対戦成績が、そうではないソフトとの成績よりも極端になりやすいというのは、何年も前から言われてたけど、ブレンド評価関数の乱立で余計にそこらへんあやふやになってきたな 作るだけ作ってまともな検証はしない
どうでもいい評価が積み上がるだけ
シボレー公開も有象無象がふえただけで
雑魚のおもちゃにしかならないようだ Ponanzaとかのガチ勢はこれまでも苦行の自己対戦を繰り返してきたんだろうなぁ
それが広く体験できるようになったのは一つの成果 うちのパソコンだとramは技巧2に8割5分の勝率だった1秒150戦ほどだけど くっ、いいブレンド思いついたのに2台とも絞りに入っちゃって何もできねぇ… 弱いからってバッサリ今まで絞ってきた評価関数切り捨てれる人羨ましいわ
十数回絞ってくると上限見えてくるけど愛着わいて、特に弱い部分が個性に見えてくる
例えば玉頭から攻められると一気に崩れるとか、相手玉が三段目以上にあると楽観視してしまうとか
それでもエルモにたまに一発はいるとこの子天才かもと思ってしまったり ほんと、しょうもない評価関数ブリーダーズカップだったな。
yaselmoが一番強いと見抜く力が必要なんだよな。
454 名無し名人 sage 2017/07/25(火) 00:14:27.17 ID:eTxn6/V6
ここ以外でもだけど、粘着とは論理的な話ができないんだよな
感情だけで1+1が3だと言ってくる >>635
試したら強かったんですけど前にまふさんが検証していて失敗作だったようです
「remutama48」 = (「mafuta3」52%+「野生の読み太2」48%)
得意、不得意の局面が偏りすぎ。専用定跡を作れば強そうだけど「yasema10」使うほうが無難。
検証は個人的にやった結果でお願いするかも。 yaselmoは入玉が凄く下手になる以外は普通に強い。
もうuuunuunさんと蟲毒の壺の結果だけ見てればいい >>658
まふさんの対局でも思っていたより強かったらしく昨日までは>>637だったのが
4スレ10秒相当、定跡無し ramu 21-10-19 yaselmo ※勝率52.0%(50局時)現在
※yaselmo(yaseiyomita0703+elmo)が強いらしいということで対局してみた。
yaselmoは駒の連結は強いが盤の使い方が狭い。短時間探索ではなかなか崩せないようでレートが大きく出る感じ。
今回は勝率47%程度の後手番で50局を先にやってみて52%出たから勝ち越すとは思うが、
引き分け率20%はソフト的に言って同型扱い。次は先手で50局やってみるが同じような引き分け率なら直接対局にあまり意味は無いので、そこ終了する。
に更新されていました ramuは早指し練習するときには適してなく別評価関数で練習 絞ったら最低でも現状維持はできると思ってたけど、弱くもなるんだね
こりゃ難しいなぁ >>659
入玉最強の定義がわからんからなあ
ひたすら入玉含みで指すせいで負けるけど、まれに入玉できるみたいなパターンとかね
入玉数も入玉時勝率も高いけど、それで本当に入玉うまいと言えるのか uuunuuun @uuunuuun1 さん 野良評価関数 7/26公開
yaselmoのレートが少し下がりmafuta2が少しの差で1位に戻っている。
ソフトにより相性があるので直接対決では、レート下位が上位より強いことがあるかも。
ソフト名 レーティング 誤差 対局数
YO4.73/mafuta2* 4108 +14/-13 398
YO4.74/yaselmo* 4098 +10/-12 503
(Ponanza wcsc27*) 4077 +10/-15 266
YO4.73/yasema10* 4069 +13/-14 434
YO4.70/relmo* 3998 +9/-14 885
YO4.53/elmoQhapaq* 3980 +7/-9 1690
YO4.70/YaseiYomita1.1* 3978 +10/-12 800
YO4.53/elmo-wcsc27* 3960 +0/-0 2176
SM1.25/elmo-wcsc27* 3879 +8/-13 1180
YO4.70/rezero8* 3861 +11/-11 1000 まふさんのPC非力みたいだからね
だからこそ公開して皆んなに協力して貰うようにしたんでと思う
ただこっちも非力なPCだからこそ4000万ノードなんてむり
誰か大合神まふ作ってください
そしたら少しばかりでも協力できるのに yaselmoは早指し最強クラスな上に
長時間もramuと五分だとすると隙がないな
個人の検討用途だとほぼ一択か まふさんramu対yasema10の途中経過載せてるけど
最終結果以外は無意味なんだよなあ いつまでまふとかいうゴミ関数の話してんだよ
まふスレでも立てていい加減そっちでやってくれ鬱陶しい OCN モバイル使って書き込むとワントンキンって出るんだな。
始めて見た 本当まふはマジうざい
まふ関係のくだらない自己対局報告は他でやれ 振り飛車定跡使って絞ったら、最初のうちは、お!振り飛車指した!と喜べたんだが、教師局面をシャッフルして絞り続けたら居飛車党に戻って行った…。 生ポ関数はマジうざい
生ポ評価関数関係のくだらない宣伝は他でやれ まふも生ポもどっちもゴミ
電王T終わったら忘れられているであろう と、ウンコ製造機が意味不明な供述をしており・・・・ まふ氏によると、ramuは4スレ1手10秒だと強いらしいのでやってみました。
途中経過です。
scissors対ramu
25-7-20
相変わらず互角ですが有意差つくまでやります。 yasema10,yaselmo,ramuの三者間で一番強い評価関数を教えて下さい >>679
ここじゃなくてtwitterとかでやった方がいいよ。
もし公開したとしても生ポの一部として吸収されるだけ みんな評価関数あげるより、学習局面あげていった方がよくないか?とくにdepth7以上のやつ そのどれかがレート何十か強いとして、検討のとき何か意味あんのかね
今後の開発の知見としてならまだしも プロじゃなきゃぶっちゃけ強さなんてわからんしプロなら自分で判断しろだし 中間報告といえば
いつもは嬉々として途中結果を貼るまふ氏が
前後入れ替えたyaselmo vs ramuの途中結果を更新しないって事は
多分途中で負け越してんだろうな 私の所では、yasema10がyaselmoに無敗だ、、、 ようはおま環なわけでブレンド評価関数なんて好きなの使えばいいんだよ
いろいろ入れ替えてあーでもないこーでもないってやってる暇があったら一つの評価関数に絞ってみっちり研究したほうがいい トーナメントは誰が優勝持っていくんだろうなあ
順当ならやねうら王かな やねうらさんには技巧の学習方法の解説してほしいなあ >>694
今までのルールを踏襲すると
ライブラリ登録のあるやねうら評価関数バイナリを使うならOKで
ライブラリ登録の無いまふバイナリとか使うとルール違反になったりするのかも。 rezeroか自分で絞ってまふ系0%にして出るしかないな
まふ系さえ外せばいいのだ
てかまふさん、ライブラリ登録してよ
みんな幸せになれるよ rezeroはやねうらおさんが権利を放棄してると言っても、
ライブラリ登録されなかったら使えないんじゃないか
それともやねうら王のライブラリにrezeroも含まれてるのか
そもそも電王トーナメント本当にやるのか?w ドワンゴの独自性の審査は結構真面目に行ってるから
プログラム書けないような人は出られないと思う。野生の読み太の作者くらいじゃないの出られそうなの 混ぜてないのに一定割合あるだけでアウトってことはないだろ 去年新顔の人とか、ソースコード提出がどうのとか言われてたような気がするね ○百万円がかかっているからアピール文書は厳密に審査してほしいね ライブラリ登録されてるものなら、エンジンにやね使うかぎりは問題ないんじゃないの?
評価関数に関しては、河童さんの分析にでもかけてもらえばいい ライブラリルールが未だに理解できてない。プログラマには一目瞭然の話なのだろうか
自由に安心して使えるライブラリを規定しましょうってだけで、それ以外の使用を禁じる文言ってどこかにあるのかな
というか自作コードも規定ライブラリ外になるわけだけど、一般公開されてるライブラリで登録のないものについてだけだ常識的に考えろってこと?
あと評価関数バイナリってそもそもライブラリ扱いなのか?
電王戦の方はライブラリみたいな扱いしてるけど、申請鵜呑みで書いてるだけなのかちゃんと判断した上なのか不明
さらに追加学習とかブレンドとかなったらもうルール外なんじゃないかと
一時期やね関数の追加学習問題があったときは、平岡さんもまあグレーっちゃグレーかと言ってたくらいだし 現状は同一ファイルなら1億%クロだけど
追加学習は限りなく黒に近いグレーで疑わしきは罰せずという感じ そもそもなんでstockfishを使っていいのかが理解できない Stockfishを自力で将棋に移植できる時点で超絶プログラマだからだよ stockfishは別にライブラリ登録されないのに何で使えるかを聞きたいのです やねうら王もelmoもQhapaqもライブラリとして使えるとの報告きたでー
次回の将棋電王トーナメントに、やねうら王をライブラリとして申請しておきました。やねうら王のGitHub上のソースコード、公開されているリゼロ評価関数などがライブラリとして使用できます。おそらく8月中旬ぐらいに正式発表があるはず。
https://twitter.com/yaneuraou/status/890215192528773122
elmoも使えるようにしますー
https://twitter.com/mktakizawa/status/890215689394372609
Qhapaqもちゃんとライブラリ申請します。なお、今期のQhapaqの学習部は完全にやねうらベースですがライブラリのQhapaqはaperyに依存したもの(aperyの関数に旧河童絞りを加えたもの)ですのでご注意ください。
https://twitter.com/Qhapaq_49/status/890215938124992513 >>707
「一般に流布している汎用ルーティン」なのでOKなのです。
意味がわからん?こっちもわからんからCSAにでも聞いてくれ。 あとは野生の読み太の人が申請してくれたら
yaselmoの約4100が正真正銘の最低ラインになるね 4スレ10秒相当、定跡無し ramu 34-10-31 yaselmo ※勝率52.0%(75局時)現在
※yaselmo(yaseiyomita0703+elmo)が強いらしいということで対局してみた。
yaselmoは駒の連結は強いが盤の使い方が狭い。短時間探索ではなかなか崩せないようでレートが大きく出る感じ。
今回は勝率47%程度の後手番で50局を先にやってみて52%出たから勝ち越すとは思うが、
引き分け率20%はソフト的に言って同型扱い。
次は「ramu」先手で50局やってみるが同じような引き分け率なら直接対局にあまり意味は無いので、そこで終了する。
「ramu」先手にすると引き分けが無くなったのに驚いた。「ramu」後手は引き分け率20%もあったのに何故だろう?
「ramu」は後手は不利と見て引き分けに持ち込んだ?だとしたら面白い評価関数だな。 >>708
これやべぇな
野良やキメラが出回ってても完全に上いく宣言にしか思えん
もとより非公開でやってる「やね×まふ」もそうだが
表に出さないだけでアイツ達ウルトラ超人だから本気でR4300がボーダーになるかもしれん >>707
そもそもライブラリ制はコンピュータ将棋の発展のためにやってる
自由に使ってよいと明確化するために
ライブラリにないものは使っちゃいけません、じゃない
発想が逆 これ題名のAWAKEってのやっぱ巨瀬さんの許可一応取ってんのかな?
>グランプリの「AWAKE(仮題)」は、AIとプロ棋士の「将棋電王戦」でプロ棋士がハメ手でAIに勝った
>実話を基にしたオリジナルストーリーで、幼い頃からライバルだった2人が
>天才棋士とAI将棋の開発者として対局する人間ドラマ。
http://eiga.com/news/20170726/12/ 非公開の評価関数もブレンドしたとされるramuが
意外にも古参キメラのyaselmoとそう変わらない棋力だったから
Rindaの中の人以外はそこまで余裕はなさそうだけどね 他人の成果をベースに改良を加えるのは問題ない
流用元をはっきりさせていれば >>713
でもライブラリに無いもの使って処分されたんだな。 >>713
参加者は、プログラム開発者・開発予定者全員に選手権参加についての
承認を得ていなければならない
ハンドルネームだけの開発者全員に了解とったの? >>715
いうても野生の読み太も凄いんだけどな
評価関数以外を見ても相当な人でしょ
単にキメラしたのとは比較にならんよ
まふも同等だとしても流石としか言えん yaselmoは信頼して検討に使うにはまだパワーが足りなくないですか
郷田久保の王将戦での△95角(最善手)を見つける速さや、評価値が後手勝勢に変わるまでの時間、深さ、ノードなどを調べてみたかったけど、うちのノートPCでは日が暮れてしまうからやめた
他にも増田石田の新人王戦の▲72馬の詰みを発見する速さを(発見できるかいなかをふくめて)比較検討してみるのも面白そう
速い人に調べてほしいな それは探索部の方が影響大きいのでは?
今回の評価関数自主制作の流れ、主要開発者にとっては当て馬みたいなものかもしれないね
最低限やらなければいけないラインというのを見るための実験かも 終盤の検討はMultiPV多めにしとけば大抵足りると思うけどな 終盤の検討にはMPVを高くすると良い。
だがMPVが高くすると一局を通して弱くなる。
つまり一局を通した強さ(レーティングの高さ)と検討の向き不向きは単純な相関関係ではないってことだなぁ >>707
世界コンピュータ将棋選手権の方では、思考部を開発する必要があって、ライブラリ登録されたもの、汎用ルーチン、は使用可能
汎用ルーチンというのは一般的なライブラリ(c++ の boost とか stl とか 行列演算ライブラリとか…)を指すんだけど、stockfish は、汎用ルーチンとみなされるらしい
その辺りの合理的な説明はよくわからんかった
電王トーナメントの方は、その辺りの詳細は書かれていなかったと思うが、世界コンピュータ将棋選手権に準ずるっぽい雰囲気の模様
誰か知ってたら教えて >>689
その後、yaselmoがyasema10に勝ちだした。対局数こなさんとわからんね。 >>717-718
クジラちゃんのことだと思うけど(なお厳密には処分されてない模様)、
あれは作者不詳のソフトを使ったからだよ
これをOKにすると一人の開発者がこっそり複数のソフトに関われることになって問題だから ここで愚痴るのはスレチな予感がするけど、脊尾詰おかしい
後手の持駒:飛 金二 銀二 桂三 香三 歩十三
9 8 7 6 5 4 3 2 1
+---------------------------+
| ・ ・ ・ ・v玉v香 ・ ・ ・|一
| ・ ・ ・v桂 ・ ・ ・ ・ ・|二
| ・v歩 ・ 金v歩v銀v歩 ・v歩|三
| ・ ・ ・ ・ ・ ・ ・v歩 ・|四
| ・ ・ ・ ・ ・ ・ ・ ・ ・|五
| ・ ・ ・ ・ ・ ・ ・ ・ ・|六
| ・ ・ ・ ・ ・ ・ ・ ・ ・|七
| ・ ・ ・ ・ ・ ・ ・ ・ ・|八
| ・ ・ ・ ・ ・ ・ ・ ・ ・|九
+---------------------------+
先手の持駒:飛 角二 金 銀
先手:
後手:
これで
6一飛打 同 玉 5二銀打 同 銀 7二角打 5一玉
5二金 同 玉 6一角打 4二玉 4三銀打 3一玉
3二金打
って探索&余詰なし判定されるんだけど、(NPS1550Kほどで38秒)
6一飛打に4二玉で比較的長い手数の余詰になるとか聞いてないよ… ブレンド後のテスト結果です。
何故か強そうなので報告させていただきます。
ブレンド評価関数=yasema10(40%)+ramu(60%)
とりあえず、仮称"yasemaru"としておきます。
投了評価値は1100。Ponder:OFF。定跡:なし。
yasemaru-yasema10
4スレ、1秒
172(61%)-9-109(39%)
4スレ、5秒
91(59%)-5-62(41%)
yasemaru-ramu
4スレ、1秒
130(52%)-8-120(48%)
4スレ、5秒
53(65%)-2-29(35%)
yasemaru-yaselmo
4スレ、1秒
190(65%)-5-102(35%)
4スレ、5秒
68(66%)-3-35(34%) 勿論EVAL_SHAREは勿論オフで設定同じにしてますよね >>731
技巧2やelmoとの対局もおねがいします ■ このスレッドは過去ログ倉庫に格納されています