▲コンピュータ将棋スレッド122 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
>>658
まふさんの対局でも思っていたより強かったらしく昨日までは>>637だったのが
4スレ10秒相当、定跡無し ramu 21-10-19 yaselmo ※勝率52.0%(50局時)現在
※yaselmo(yaseiyomita0703+elmo)が強いらしいということで対局してみた。
yaselmoは駒の連結は強いが盤の使い方が狭い。短時間探索ではなかなか崩せないようでレートが大きく出る感じ。
今回は勝率47%程度の後手番で50局を先にやってみて52%出たから勝ち越すとは思うが、
引き分け率20%はソフト的に言って同型扱い。次は先手で50局やってみるが同じような引き分け率なら直接対局にあまり意味は無いので、そこ終了する。
に更新されていました ramuは早指し練習するときには適してなく別評価関数で練習 絞ったら最低でも現状維持はできると思ってたけど、弱くもなるんだね
こりゃ難しいなぁ >>659
入玉最強の定義がわからんからなあ
ひたすら入玉含みで指すせいで負けるけど、まれに入玉できるみたいなパターンとかね
入玉数も入玉時勝率も高いけど、それで本当に入玉うまいと言えるのか uuunuuun @uuunuuun1 さん 野良評価関数 7/26公開
yaselmoのレートが少し下がりmafuta2が少しの差で1位に戻っている。
ソフトにより相性があるので直接対決では、レート下位が上位より強いことがあるかも。
ソフト名 レーティング 誤差 対局数
YO4.73/mafuta2* 4108 +14/-13 398
YO4.74/yaselmo* 4098 +10/-12 503
(Ponanza wcsc27*) 4077 +10/-15 266
YO4.73/yasema10* 4069 +13/-14 434
YO4.70/relmo* 3998 +9/-14 885
YO4.53/elmoQhapaq* 3980 +7/-9 1690
YO4.70/YaseiYomita1.1* 3978 +10/-12 800
YO4.53/elmo-wcsc27* 3960 +0/-0 2176
SM1.25/elmo-wcsc27* 3879 +8/-13 1180
YO4.70/rezero8* 3861 +11/-11 1000 まふさんのPC非力みたいだからね
だからこそ公開して皆んなに協力して貰うようにしたんでと思う
ただこっちも非力なPCだからこそ4000万ノードなんてむり
誰か大合神まふ作ってください
そしたら少しばかりでも協力できるのに yaselmoは早指し最強クラスな上に
長時間もramuと五分だとすると隙がないな
個人の検討用途だとほぼ一択か まふさんramu対yasema10の途中経過載せてるけど
最終結果以外は無意味なんだよなあ いつまでまふとかいうゴミ関数の話してんだよ
まふスレでも立てていい加減そっちでやってくれ鬱陶しい OCN モバイル使って書き込むとワントンキンって出るんだな。
始めて見た 本当まふはマジうざい
まふ関係のくだらない自己対局報告は他でやれ 振り飛車定跡使って絞ったら、最初のうちは、お!振り飛車指した!と喜べたんだが、教師局面をシャッフルして絞り続けたら居飛車党に戻って行った…。 生ポ関数はマジうざい
生ポ評価関数関係のくだらない宣伝は他でやれ まふも生ポもどっちもゴミ
電王T終わったら忘れられているであろう と、ウンコ製造機が意味不明な供述をしており・・・・ まふ氏によると、ramuは4スレ1手10秒だと強いらしいのでやってみました。
途中経過です。
scissors対ramu
25-7-20
相変わらず互角ですが有意差つくまでやります。 yasema10,yaselmo,ramuの三者間で一番強い評価関数を教えて下さい >>679
ここじゃなくてtwitterとかでやった方がいいよ。
もし公開したとしても生ポの一部として吸収されるだけ みんな評価関数あげるより、学習局面あげていった方がよくないか?とくにdepth7以上のやつ そのどれかがレート何十か強いとして、検討のとき何か意味あんのかね
今後の開発の知見としてならまだしも プロじゃなきゃぶっちゃけ強さなんてわからんしプロなら自分で判断しろだし 中間報告といえば
いつもは嬉々として途中結果を貼るまふ氏が
前後入れ替えたyaselmo vs ramuの途中結果を更新しないって事は
多分途中で負け越してんだろうな 私の所では、yasema10がyaselmoに無敗だ、、、 ようはおま環なわけでブレンド評価関数なんて好きなの使えばいいんだよ
いろいろ入れ替えてあーでもないこーでもないってやってる暇があったら一つの評価関数に絞ってみっちり研究したほうがいい トーナメントは誰が優勝持っていくんだろうなあ
順当ならやねうら王かな やねうらさんには技巧の学習方法の解説してほしいなあ >>694
今までのルールを踏襲すると
ライブラリ登録のあるやねうら評価関数バイナリを使うならOKで
ライブラリ登録の無いまふバイナリとか使うとルール違反になったりするのかも。 rezeroか自分で絞ってまふ系0%にして出るしかないな
まふ系さえ外せばいいのだ
てかまふさん、ライブラリ登録してよ
みんな幸せになれるよ rezeroはやねうらおさんが権利を放棄してると言っても、
ライブラリ登録されなかったら使えないんじゃないか
それともやねうら王のライブラリにrezeroも含まれてるのか
そもそも電王トーナメント本当にやるのか?w ドワンゴの独自性の審査は結構真面目に行ってるから
プログラム書けないような人は出られないと思う。野生の読み太の作者くらいじゃないの出られそうなの 混ぜてないのに一定割合あるだけでアウトってことはないだろ 去年新顔の人とか、ソースコード提出がどうのとか言われてたような気がするね ○百万円がかかっているからアピール文書は厳密に審査してほしいね ライブラリ登録されてるものなら、エンジンにやね使うかぎりは問題ないんじゃないの?
評価関数に関しては、河童さんの分析にでもかけてもらえばいい ライブラリルールが未だに理解できてない。プログラマには一目瞭然の話なのだろうか
自由に安心して使えるライブラリを規定しましょうってだけで、それ以外の使用を禁じる文言ってどこかにあるのかな
というか自作コードも規定ライブラリ外になるわけだけど、一般公開されてるライブラリで登録のないものについてだけだ常識的に考えろってこと?
あと評価関数バイナリってそもそもライブラリ扱いなのか?
電王戦の方はライブラリみたいな扱いしてるけど、申請鵜呑みで書いてるだけなのかちゃんと判断した上なのか不明
さらに追加学習とかブレンドとかなったらもうルール外なんじゃないかと
一時期やね関数の追加学習問題があったときは、平岡さんもまあグレーっちゃグレーかと言ってたくらいだし 現状は同一ファイルなら1億%クロだけど
追加学習は限りなく黒に近いグレーで疑わしきは罰せずという感じ そもそもなんでstockfishを使っていいのかが理解できない Stockfishを自力で将棋に移植できる時点で超絶プログラマだからだよ stockfishは別にライブラリ登録されないのに何で使えるかを聞きたいのです やねうら王もelmoもQhapaqもライブラリとして使えるとの報告きたでー
次回の将棋電王トーナメントに、やねうら王をライブラリとして申請しておきました。やねうら王のGitHub上のソースコード、公開されているリゼロ評価関数などがライブラリとして使用できます。おそらく8月中旬ぐらいに正式発表があるはず。
https://twitter.com/yaneuraou/status/890215192528773122
elmoも使えるようにしますー
https://twitter.com/mktakizawa/status/890215689394372609
Qhapaqもちゃんとライブラリ申請します。なお、今期のQhapaqの学習部は完全にやねうらベースですがライブラリのQhapaqはaperyに依存したもの(aperyの関数に旧河童絞りを加えたもの)ですのでご注意ください。
https://twitter.com/Qhapaq_49/status/890215938124992513 >>707
「一般に流布している汎用ルーティン」なのでOKなのです。
意味がわからん?こっちもわからんからCSAにでも聞いてくれ。 あとは野生の読み太の人が申請してくれたら
yaselmoの約4100が正真正銘の最低ラインになるね 4スレ10秒相当、定跡無し ramu 34-10-31 yaselmo ※勝率52.0%(75局時)現在
※yaselmo(yaseiyomita0703+elmo)が強いらしいということで対局してみた。
yaselmoは駒の連結は強いが盤の使い方が狭い。短時間探索ではなかなか崩せないようでレートが大きく出る感じ。
今回は勝率47%程度の後手番で50局を先にやってみて52%出たから勝ち越すとは思うが、
引き分け率20%はソフト的に言って同型扱い。
次は「ramu」先手で50局やってみるが同じような引き分け率なら直接対局にあまり意味は無いので、そこで終了する。
「ramu」先手にすると引き分けが無くなったのに驚いた。「ramu」後手は引き分け率20%もあったのに何故だろう?
「ramu」は後手は不利と見て引き分けに持ち込んだ?だとしたら面白い評価関数だな。 >>708
これやべぇな
野良やキメラが出回ってても完全に上いく宣言にしか思えん
もとより非公開でやってる「やね×まふ」もそうだが
表に出さないだけでアイツ達ウルトラ超人だから本気でR4300がボーダーになるかもしれん >>707
そもそもライブラリ制はコンピュータ将棋の発展のためにやってる
自由に使ってよいと明確化するために
ライブラリにないものは使っちゃいけません、じゃない
発想が逆 これ題名のAWAKEってのやっぱ巨瀬さんの許可一応取ってんのかな?
>グランプリの「AWAKE(仮題)」は、AIとプロ棋士の「将棋電王戦」でプロ棋士がハメ手でAIに勝った
>実話を基にしたオリジナルストーリーで、幼い頃からライバルだった2人が
>天才棋士とAI将棋の開発者として対局する人間ドラマ。
http://eiga.com/news/20170726/12/ 非公開の評価関数もブレンドしたとされるramuが
意外にも古参キメラのyaselmoとそう変わらない棋力だったから
Rindaの中の人以外はそこまで余裕はなさそうだけどね 他人の成果をベースに改良を加えるのは問題ない
流用元をはっきりさせていれば >>713
でもライブラリに無いもの使って処分されたんだな。 >>713
参加者は、プログラム開発者・開発予定者全員に選手権参加についての
承認を得ていなければならない
ハンドルネームだけの開発者全員に了解とったの? >>715
いうても野生の読み太も凄いんだけどな
評価関数以外を見ても相当な人でしょ
単にキメラしたのとは比較にならんよ
まふも同等だとしても流石としか言えん yaselmoは信頼して検討に使うにはまだパワーが足りなくないですか
郷田久保の王将戦での△95角(最善手)を見つける速さや、評価値が後手勝勢に変わるまでの時間、深さ、ノードなどを調べてみたかったけど、うちのノートPCでは日が暮れてしまうからやめた
他にも増田石田の新人王戦の▲72馬の詰みを発見する速さを(発見できるかいなかをふくめて)比較検討してみるのも面白そう
速い人に調べてほしいな それは探索部の方が影響大きいのでは?
今回の評価関数自主制作の流れ、主要開発者にとっては当て馬みたいなものかもしれないね
最低限やらなければいけないラインというのを見るための実験かも 終盤の検討はMultiPV多めにしとけば大抵足りると思うけどな 終盤の検討にはMPVを高くすると良い。
だがMPVが高くすると一局を通して弱くなる。
つまり一局を通した強さ(レーティングの高さ)と検討の向き不向きは単純な相関関係ではないってことだなぁ >>707
世界コンピュータ将棋選手権の方では、思考部を開発する必要があって、ライブラリ登録されたもの、汎用ルーチン、は使用可能
汎用ルーチンというのは一般的なライブラリ(c++ の boost とか stl とか 行列演算ライブラリとか…)を指すんだけど、stockfish は、汎用ルーチンとみなされるらしい
その辺りの合理的な説明はよくわからんかった
電王トーナメントの方は、その辺りの詳細は書かれていなかったと思うが、世界コンピュータ将棋選手権に準ずるっぽい雰囲気の模様
誰か知ってたら教えて >>689
その後、yaselmoがyasema10に勝ちだした。対局数こなさんとわからんね。 >>717-718
クジラちゃんのことだと思うけど(なお厳密には処分されてない模様)、
あれは作者不詳のソフトを使ったからだよ
これをOKにすると一人の開発者がこっそり複数のソフトに関われることになって問題だから ここで愚痴るのはスレチな予感がするけど、脊尾詰おかしい
後手の持駒:飛 金二 銀二 桂三 香三 歩十三
9 8 7 6 5 4 3 2 1
+---------------------------+
| ・ ・ ・ ・v玉v香 ・ ・ ・|一
| ・ ・ ・v桂 ・ ・ ・ ・ ・|二
| ・v歩 ・ 金v歩v銀v歩 ・v歩|三
| ・ ・ ・ ・ ・ ・ ・v歩 ・|四
| ・ ・ ・ ・ ・ ・ ・ ・ ・|五
| ・ ・ ・ ・ ・ ・ ・ ・ ・|六
| ・ ・ ・ ・ ・ ・ ・ ・ ・|七
| ・ ・ ・ ・ ・ ・ ・ ・ ・|八
| ・ ・ ・ ・ ・ ・ ・ ・ ・|九
+---------------------------+
先手の持駒:飛 角二 金 銀
先手:
後手:
これで
6一飛打 同 玉 5二銀打 同 銀 7二角打 5一玉
5二金 同 玉 6一角打 4二玉 4三銀打 3一玉
3二金打
って探索&余詰なし判定されるんだけど、(NPS1550Kほどで38秒)
6一飛打に4二玉で比較的長い手数の余詰になるとか聞いてないよ… ブレンド後のテスト結果です。
何故か強そうなので報告させていただきます。
ブレンド評価関数=yasema10(40%)+ramu(60%)
とりあえず、仮称"yasemaru"としておきます。
投了評価値は1100。Ponder:OFF。定跡:なし。
yasemaru-yasema10
4スレ、1秒
172(61%)-9-109(39%)
4スレ、5秒
91(59%)-5-62(41%)
yasemaru-ramu
4スレ、1秒
130(52%)-8-120(48%)
4スレ、5秒
53(65%)-2-29(35%)
yasemaru-yaselmo
4スレ、1秒
190(65%)-5-102(35%)
4スレ、5秒
68(66%)-3-35(34%) 勿論EVAL_SHAREは勿論オフで設定同じにしてますよね >>731
技巧2やelmoとの対局もおねがいします >>730
確かなのは詰背尾詰共通で、持ち駒の歩が10になるとバグるらしい
なのは詰めはアップデートされたけど背尾詰はまだだったと思う まふ系列で一番強いmafuta2は何故か配布やめちゃったんだよね。
誰か持ってない? >>731
ブレンド評価関数=yasema10(40%)+ramu(60%)
アップローダーに上げときますので皆で試しましょう
斧に上げときますので >>723,724,728
拙いパソコンで、郷田久保の王将戦での△95角(最善手)を見つけるスピードを計ってみたよ
評価値が後手勝勢になるまで読めるかも調べたかったけど遅いのでやめた
ほんとにelmoより強くなっているのかな?
ちなみに、elmoとyaselmoのエンジンはどちらもYaneuraOu4.74で、Multipvは5、スレッド8なんですが
>>735
速いマシンで追検証して見ませんか?
増田石田の詰みは▲72馬を早くに枝切りしてしまうようなので計測をやめたんで、こちらもお願いします
結果同じなら、yaselmoは検討には信頼して使えないという結論になると思います
t D N万 評価値
技巧 6:10 19/32 12,000 -331
技巧2 4:59 19/40 9,500 162
elmo 5:47 19/37 7,800 010
yaselmo 8:51 20/37 15,500 283 一つの局面取り上げて検討に不向きだとか、幼児教育からやりなおしたほうがマシ https://www.axfc.net/u/3828535
>>731
ブレンド評価関数=yasema10(40%)+ramu(60%)
アップローダーに上アップロードしたので皆で試しましょう 部分的には東大将棋3がelmoより精確な局面だってあるしなあ 序盤の検討用に使うとしたらどのソフトが最適ですかね? 難解な終盤でどれだけ正確かを計測しないなら局面を数百と用意しないと >>729
タヌキもライブラリ登録されたものと違う版を使ったということで
審議対象にはなった。
なのでその理由でもライブラリ制度の説明がおかしくなる。 >>682
趣味が多くていろんな垢作ってるので、将棋専用垢作ろうか躊躇します(・・;)
>>731
投了評価値1100だと正確なデータ測れないですよ。僕もたくさん自己対戦してきましたが、1000点前後の評価値でもひっくり返ることがよくありましたから。 4.「yasemaru」対局結果(「yasema10」40%+「ramu」60%)
コンピュータ将棋スレッドで下記ブレンド報告のあった組み合わせ。
(個人的にramuよりRは下でもyasema10のほうが人間向きだと思っていたので、この配合報告は嬉しい)
yasemaru-yasema10
4スレ、1秒、定跡無し 172-9-109 ※勝率(61%)
4スレ、5秒、定跡無し 91-5-62 ※勝率(59%)
yasemaru-ramu
4スレ、1秒、定跡無し 130-8-120 ※勝率(52%)
4スレ、5秒、定跡無し 53-2-29 ※勝率(65%)
yasemaru-yaselmo
4スレ、1秒、定跡無し 190-5-102 ※勝率(65%)
4スレ、5秒、定跡無し 68-3-35 ※勝率(66%) あとrelmoにどれだけ勝てるかも目安になる。
yaselmoはrelmoと戦っても100戦じゃ有意差出なかった。 ponanzaが卒業宣言したのは今まで開発環境を維持できないからというのが本当のところじゃないかね
金がかかりすぎだ。人員にしてもそう。WCSC27で優勝できてれば継続できたかもしれんが… 1ヶ月に1000万以上かかるのはねえ?
しかもそれで勝ててないし
chainerのブランドにも僅かながら傷がついたようにも思える >>750
クジラの問題はライブラリと違う版を使ったからじゃなくて魔女という誰が作ったかはっきりしないソフトを思考部に使用していたこと
だから結果としてはライブラリの問題ではない uuunさんはなんでramuのレーティング測らないのかな
まふさんが公開停止したmafuta2を載せてramu測らないなんて、まふさんの事嫌いなの? >>756
公式発表でライブラリ違反も触れてます。 4スレ1秒100戦
yasemaru - Gikou2
64勝 - 34勝 2引き分け
(65%) (34%)
elmoより対技巧2の勝率が落ちてる
地雷関数では
というか入玉時(入るときではなく、入玉しきった時)の評価値が超過大評価型だね
寄せに行かずにと金ばかり作っちゃうから勝てない(まるで何年も前のソフトを見ているようだ)
他の複数のブレンド関数でも同じようなの見たけど、みんな好き勝手に混ぜ合わせてるからバランスが崩れてるのでは
特定の形になるとボロボロになる ■ このスレッドは過去ログ倉庫に格納されています