▲コンピュータ将棋スレッド121 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
蟲毒2だと最上位ソフトは丁度elmo+R100辺りなんだよな
ponanzaに近い位置で団子状態だけども
ここから更に大きく進化とか出来るのだろうか・・・ まふさんもソフト出してすぐ引っ込めたりしない方がいいですよ ベース素材に同じものを使っているかぎり、最高の棋力は全部のベストブレンドより強くなるはずないよね
やっぱこの先は、自分でオリジナルのアウトブリードを作るしかないか うさぴょん作者かデュアルEPYCの見積もりを出したらしい
Xeon勢はうさぴょんに追い越されるピンチ!! ドワンゴも賞金出すからにはソフトの「同一性」をどう判定するかの基準を決めておいたほうがいい
>uuunuuun? @uuunuuun1 10 分前
> 評価関数間の近さを測定するソフトをどなたか作ってもらえないものか。これだけ自作が盛んになると盗作の問題は必ず出てくると思うのだけど。 よしchokudaiさん監修で大会に参加するのに簡単なプログラミングのテストをやろう。 ぴゅう太の日本語BASICにすれ
イースを作った剛の者がいたがw 4スレ一手5秒、互角局面集を使用して対局しましたが、mafuta2(70%)とyasema10(30%)で配合し(カッコ内は配合の比率)、次にmafuta1とrezero8を5:5で配合し、更に、この2つをを5:5で配合して完成です。暫定ですが、今の所4スレ一手5秒では圧倒的に一番強いです。 >>540
逆じゃないの?
たまたま配合率同じになっただけで
盗作疑惑持たれる可能性あるじゃん >>544
レシピが複雑すぎて訳が分からないのでBitSendで下さい<(_ _)>
https://bitsend.jp >>544
「圧倒的」なんて表現使わず、勝敗を書いてほしい 去年の電王トーナメント直後に平岡さんがエイプリーの評価関数とやねの評価関数のdiffとってほぼ一緒っていってなかったっけ?(猿はライブラリー登録されていたので、それを使うのは全然問題ないんだけど
Linux でdiffとればある程度は分かるんじゃない? >>480
NPSが同じでもスレッド数によって挙動は変わるので(逆も然り)、その二つはORじゃいけない
あとメモリの搭載量はいらないにしてもHASHの設定値はいるでしょ >>550
ライブラリ登録されてたのはApery_WCSC26までで、真やねは浮かむ瀬とほぼ一致してたから問題視されてたぞ
電王トーナメントで使った証拠は無いからその後何もなかったが
評価関数の比較するのこれだろ
https://twitter.com/HiraokaTakuya/status/787871913817231360 もっと強くなってるかと思ったが、elmoからR100ちょっとしか上がってないのな
Ponanzaは定跡整備とelmo絞りは殆ど確定でやってるだろう(痛い目見た)し、意外とponaがあっさり優勝するかもしれん 名人とやっちゃったしもうあんま人との対戦に関心なさそうだしponanzaまだやってんのかね? お前らがR100「しか」とか言ってるのが信じられんよ
雑巾絞り以降、ここ一年ちょいの伸びはそれまでに比べれば異常なレベル
それでも半年でR200、一年でR400くらいのペース
elmoの公開が5月だからまだ2カ月ちょいだぞ?
2カ月でR100伸びてたら十分だろ elmoオワコン化はその内来るのは分かってたけどいくら何でも早すぎる
これponanzaでも対応できるのかね リゼロ作ったやねうら王はリゼロバージョンアップでelmo+500くらい
先行ってる よっちゃんという評価関数はどんなものですか?ついていけなくて。教えて下さい。 やねうらおは密かに四駒開発してて電王トーナメントでぶちあげてくれるとおもってる
現在の学習方法集めてるのはそのための布石だと この勢いだと去年までの話は
もはや全部なかったことになるレベルだろw そうなったらポナ元の
「下手したら今後数年最強」
発言がより光るな 電王トーナメントで使われるPCのスペックが分からないから四駒は手を出しにくいでしょう
ドワンゴがメモリを64GBから32GBに削減したせいで、N4Sこと大将軍が急遽三駒に変更した事例があるし
あれはKKPPだったかな? 持ち時間が長いほど悪手が減り、互角で中終盤を迎えるようになる=中終盤力が重要になるってことなのかな?
関係性は不明だけど、最近の大会上位ソフトは終盤力あるソフトが多い気がする。Ponaもelmoも技巧もクジラも終盤強い やねは少し前GitHubの開発メモにPPAP型評価関数の実験について書いてなかったっけ
本気かは知らんが これか。既に黒歴史発言だな
山本一成@Ponanza電王? @issei_y
今年の世界コンピュータ将棋選手権のPonanzaはたぶんめちゃめちゃ強いことになる。過去現在、そして下手したら今後数年の未来までも含めて史上最強の将棋プログラムになるかもしれない。 >>566
16bit化とか飛角だけとか
メモリ節約する方法はあるから問題ないだろう >>571
会社の名前を出して始めたのに一年も経たずに撤退したら、正しくどん判金ドブ >>569
かっけーーーー
次も同じソフトで挑んでほしいね 透。 @co2845229 3時間
yasetamafu70 VS yasetamafu70+ 200局計測結果
一手2秒 yasetamafu70+は一晩追加学習したもの
長時間での結果も気になり一手10秒計測しながら眺めていると
1勝-8勝-1分けで長時間だと更に強くなりそう
https://pbs.twimg.com/media/DEmvDNeUwAA0r2P.jpg
またR100伸びたのか!!
雑巾カチカチとは何だったのか・・・ >>543
あれはぴゅう太の実機で動いてはいるが、日本語BASICではない
TMS9900用のアセンブラで書いてある 黒歴史発言は
囲碁の世界もぶっ倒そうと思っているんで
だろw yasetamafu70+凄いね。これでR4100は越えたかな。
非公開だけどアノニマス+やねさんでelmoからR100以上上がったのは快挙 今現在elomoにこの成績と同等以上になりそうなソフトはどれくらいあるの?
>Ponanza173勝 elomo89勝 4引分 勝率65.8%でした。(対局条件は10秒秒読み・Xeon24core ・定跡なし・クラスタなし・Deep Learning未使用) >>580
最新のやねうら王 + relmo8で同等
mafu各種がrelmo8と同等以上 >>581
実際にelmoと300以上対戦すればわかるけど65%以上の勝率はないよ
elmoに+60の評価関数に対して+60の評価関数作っても+120の勝率が出ずに+50前後だったりもする。
相性の問題が出ているだけで真のレートは選手権ポナの少し下あたりで伸び悩んでる。 yasema10は300局以上指してelmoに勝率66%超えだし
複数ソフトとの対局で算出したレート差でもelmo+R100超えてるから
探索部の強化も含めたら当時のponanzaは超えていそう
http://ii.ttlv.jp/20170711/
蟲毒で検証されていない評価関数はデータがイマイチ信頼できないから
検討用にはyasema10を使っておくのが確実な気がする 長時間になるほどelmoと他の評価関数は互角に近付くらしい。 >>586
だからそのデータを出してくれよ
300局でいいからさ yasetamafu70に升田幸三の勝局集を追加学習させたのを見たいね
それらしい棋譜ができるのじゃないかと シャッフルしたのを幾重にも重ねて学習させるのは駄目ですかね? 546さんへ 配布されている評価関数は、著作権の関係で配布主に無断で勝手に再配布してはいけないと思うので、申し訳けないです。ごめんなさい。
ブレンド出来る人用に書いたつもりです。でも、すぐにより強いのが、まふ先生などから公開されるので大丈夫ですよ。 評価関数が乱立しすぎ
頭一つ抜けたのが出てきたら起こしてくれ 抜けた評価関数が出来ても
すぐにそのブレンド評価関数が乱立するから同じこと
ブレンド無しだとmafu.7zが強いからそれを使えばよい うらおがリゼロepoch9以降を公開しないと始まらんよ 現状だとmafu10、mafuta2、野生の読み太2の組み合わせが最強
これにリゼロ8を混ぜると強いと書いてる方がいたが、うちだとどうやっても弱くなっちゃう Threadripperの価格確定
https://www.youtube.com/watch?v=J3pJ_--nf5E
Ryzen 1950X 16C32T 3.4GHz $999
Ryzen 1920X 12C24T 3.5GHz $799
Corei9 7900X 10C20T 3.3GHz $999
ついに16コアが12万円で買える時代が来たか… >>510
>技巧の序盤の穴埋めとソフトメタドーピングで強くできること
いや、それ自体がすでに十分すぎるくらい立派な知見だし、
新しい技術のきっかけになってると思うのだが。 >>564
やねの意見を敢えて過激にまとめるなら、Bonanzaからelmoまでの12年間は
チェス由来のStockfish探索の導入を除いてすべて結果的には無駄な努力だった、
ってことだし。 >>598
定跡の効能とデメリットについては初めからわかってたことでしょ
定跡という概念を新しく持ち込んだわけでもないし >>599
強化学習(Bonanzaの機械学習とはまた違う)をソフトが導入し始めたのはPonanzaでも数年前くらいだし、現在の主流はBonanzaの全幅探索と正反対だ
流石にそれは吹かしすぎ yasema10はmafuta3に勝ててない、それでいて勝手な推測レートが4200など評価関数として不完全であるね >>603
だから探索についてはStockfish由来の〜と言及してるんでしょ
んで、次元下げとか学習手法については全部無駄で、
KPPTに単純なelmo式で事足りたと 蟲毒の棋譜はNPS3000万で4秒対局だからかなり貴重だな
家庭用PC換算だと1手30秒くらいの上質な棋譜が1500種類近く手に入るとは贅沢な話だ >>540
ライブラリ使用とはポケモンやダビスタのようなプラットフォーム上で勝負をするという意味とイコールなんだから
独自性なんてないと思ったらいい
6Vポケモン作ったら勝ち 4スレッド1秒定跡なし
よっちゃん、まふ系統の全ての組み合わせを
100回ずつ対戦させ、総勝数で順位をつけた
mafuta3 406-383-11
yasema10 405-387-8
yasetamafu70 402-388-10
mafu10 398-391-11
よっちゃん9 395-398-7
mafu 394-401-5
mafuta2 392-402-6
mafuta1 391-403-6
よっちゃん10 382-412-6
結果はこうなった(見辛くてすまん)
マシンスペックや対戦条件によって全然違った
結果になると思うが、参考までに。 >>606
たぶんそれ約3,000,000nps(3百万nps)ですよね? やねうら未来探索をぶち上げた時は
従来のいかなる将棋ソフトの流れも汲まない
とか言ってたけどな
まあネタだけどw まふさんへ質問
ソフトの対戦見てると横歩取り指さないのは何故でしょうか? >>574
キメラではそんなに強くならないみたいですし、大合神シボレーだれか作らないかな。
例えば、クライアントを起動しているだけで、大合神パワーでまふさんが絞った評価関数を作成、公開。
それを、対戦させて結果報告するとか
ちなみに、私はプログラムの能力0です >>602横からだが
実験で検証されないアイデアなんかただの妄想じゃん?
その証拠にwcsc27でまふ定跡の有用性が確かめられるまでは定跡スナイプ戦略なんか全然なかった。そんなに既知であると言うなら、まふ定跡より前の例を示してくれませんか。 ryzen7 1700買おうと思ってるんだが、yaneuraでどれくらいnpsでるかな 将棋ソフトのため"だけ"にPCを買ったりハイパフォーマンスモデルを選ぶのは無駄
AWS借りて使ったほうがいい方がいい
やねみたいな富豪かつケチ臭い人は別 >606
1500でなく2000くらいアルのでは
決着がついたのだけで1913 KifuBaseにブチコム
あと256手と千日手 >614
人間の世界で有用性は分かっていたけれど、コンピュータの世界では昔は質の
いい定跡が作れなかった、ってことかいな >>617
ここ二週間だけで一万円ぐらい課金してるんだけど本当に現物買うよりお得なのか? >>622
読みの浅い段階では▲3四飛を読んでいるけど、深くなってくると途端に「これあかんヤツや」ってなる
そんなに悪い手なのかね?w 学習時の定跡で棋風が変わるなら、リゼロ方式でも学習初期のランダムムーブの手数、割合で棋風が変わるんだろうか >>608
mafuta3 406-383-11 .514
yasema10 405-387-8 .511
yasetamafu70 402-388-10 .508
mafu10 398-391-11 .504
よっちゃん9 395-398-7 .498
mafu 394-401-5 .495
mafuta2 392-402-6 .493
mafuta1 391-403-6 .492
よっちゃん10 382-412-6 .481
よく途中で嫌になって止めなかったなw >>626
丸1日半かかったw
好奇心だけで頑張ったが結果が平凡すぎて
こんなもんかと脱力したわw >>621
20週で10万やろ
4年で100万や
どのスペックでどの程度回し続けるのか考えたら損益分岐点は出るやろ 引き分けはノーカウントにしたけど
勝率51.4%でも約800局信頼区間95%で誤差±3.5%だから、有意差無しだな これじゃあまり強くなってないと言われても仕方ない。これ以上の棋力の向上にはブレンド前の強化学習 でもっと強くするしかないのかな 大会で勝ちたければここに出ているような話を一つ突き抜けた
発想をひねり出さなきゃ無理か。当たり前だが。 自分はちょっと違う実験してるんだけど、完成した評価関数にrezeroのepoch0混ぜてどれだけ棋力が維持できるのか調べてる
mafu10に半分epoch0混ぜても大樹の枝には勝てたりするんだよ、これはどういう風に考えたらいいか?
あと伸びない評価関数にepoch0極少量混ぜたら伸び代が出来ないかなと期待している ■ このスレッドは過去ログ倉庫に格納されています