▲コンピュータ将棋スレッド121 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
>>566
16bit化とか飛角だけとか
メモリ節約する方法はあるから問題ないだろう >>571
会社の名前を出して始めたのに一年も経たずに撤退したら、正しくどん判金ドブ >>569
かっけーーーー
次も同じソフトで挑んでほしいね 透。 @co2845229 3時間
yasetamafu70 VS yasetamafu70+ 200局計測結果
一手2秒 yasetamafu70+は一晩追加学習したもの
長時間での結果も気になり一手10秒計測しながら眺めていると
1勝-8勝-1分けで長時間だと更に強くなりそう
https://pbs.twimg.com/media/DEmvDNeUwAA0r2P.jpg
またR100伸びたのか!!
雑巾カチカチとは何だったのか・・・ >>543
あれはぴゅう太の実機で動いてはいるが、日本語BASICではない
TMS9900用のアセンブラで書いてある 黒歴史発言は
囲碁の世界もぶっ倒そうと思っているんで
だろw yasetamafu70+凄いね。これでR4100は越えたかな。
非公開だけどアノニマス+やねさんでelmoからR100以上上がったのは快挙 今現在elomoにこの成績と同等以上になりそうなソフトはどれくらいあるの?
>Ponanza173勝 elomo89勝 4引分 勝率65.8%でした。(対局条件は10秒秒読み・Xeon24core ・定跡なし・クラスタなし・Deep Learning未使用) >>580
最新のやねうら王 + relmo8で同等
mafu各種がrelmo8と同等以上 >>581
実際にelmoと300以上対戦すればわかるけど65%以上の勝率はないよ
elmoに+60の評価関数に対して+60の評価関数作っても+120の勝率が出ずに+50前後だったりもする。
相性の問題が出ているだけで真のレートは選手権ポナの少し下あたりで伸び悩んでる。 yasema10は300局以上指してelmoに勝率66%超えだし
複数ソフトとの対局で算出したレート差でもelmo+R100超えてるから
探索部の強化も含めたら当時のponanzaは超えていそう
http://ii.ttlv.jp/20170711/
蟲毒で検証されていない評価関数はデータがイマイチ信頼できないから
検討用にはyasema10を使っておくのが確実な気がする 長時間になるほどelmoと他の評価関数は互角に近付くらしい。 >>586
だからそのデータを出してくれよ
300局でいいからさ yasetamafu70に升田幸三の勝局集を追加学習させたのを見たいね
それらしい棋譜ができるのじゃないかと シャッフルしたのを幾重にも重ねて学習させるのは駄目ですかね? 546さんへ 配布されている評価関数は、著作権の関係で配布主に無断で勝手に再配布してはいけないと思うので、申し訳けないです。ごめんなさい。
ブレンド出来る人用に書いたつもりです。でも、すぐにより強いのが、まふ先生などから公開されるので大丈夫ですよ。 評価関数が乱立しすぎ
頭一つ抜けたのが出てきたら起こしてくれ 抜けた評価関数が出来ても
すぐにそのブレンド評価関数が乱立するから同じこと
ブレンド無しだとmafu.7zが強いからそれを使えばよい うらおがリゼロepoch9以降を公開しないと始まらんよ 現状だとmafu10、mafuta2、野生の読み太2の組み合わせが最強
これにリゼロ8を混ぜると強いと書いてる方がいたが、うちだとどうやっても弱くなっちゃう Threadripperの価格確定
https://www.youtube.com/watch?v=J3pJ_--nf5E
Ryzen 1950X 16C32T 3.4GHz $999
Ryzen 1920X 12C24T 3.5GHz $799
Corei9 7900X 10C20T 3.3GHz $999
ついに16コアが12万円で買える時代が来たか… >>510
>技巧の序盤の穴埋めとソフトメタドーピングで強くできること
いや、それ自体がすでに十分すぎるくらい立派な知見だし、
新しい技術のきっかけになってると思うのだが。 >>564
やねの意見を敢えて過激にまとめるなら、Bonanzaからelmoまでの12年間は
チェス由来のStockfish探索の導入を除いてすべて結果的には無駄な努力だった、
ってことだし。 >>598
定跡の効能とデメリットについては初めからわかってたことでしょ
定跡という概念を新しく持ち込んだわけでもないし >>599
強化学習(Bonanzaの機械学習とはまた違う)をソフトが導入し始めたのはPonanzaでも数年前くらいだし、現在の主流はBonanzaの全幅探索と正反対だ
流石にそれは吹かしすぎ yasema10はmafuta3に勝ててない、それでいて勝手な推測レートが4200など評価関数として不完全であるね >>603
だから探索についてはStockfish由来の〜と言及してるんでしょ
んで、次元下げとか学習手法については全部無駄で、
KPPTに単純なelmo式で事足りたと 蟲毒の棋譜はNPS3000万で4秒対局だからかなり貴重だな
家庭用PC換算だと1手30秒くらいの上質な棋譜が1500種類近く手に入るとは贅沢な話だ >>540
ライブラリ使用とはポケモンやダビスタのようなプラットフォーム上で勝負をするという意味とイコールなんだから
独自性なんてないと思ったらいい
6Vポケモン作ったら勝ち 4スレッド1秒定跡なし
よっちゃん、まふ系統の全ての組み合わせを
100回ずつ対戦させ、総勝数で順位をつけた
mafuta3 406-383-11
yasema10 405-387-8
yasetamafu70 402-388-10
mafu10 398-391-11
よっちゃん9 395-398-7
mafu 394-401-5
mafuta2 392-402-6
mafuta1 391-403-6
よっちゃん10 382-412-6
結果はこうなった(見辛くてすまん)
マシンスペックや対戦条件によって全然違った
結果になると思うが、参考までに。 >>606
たぶんそれ約3,000,000nps(3百万nps)ですよね? やねうら未来探索をぶち上げた時は
従来のいかなる将棋ソフトの流れも汲まない
とか言ってたけどな
まあネタだけどw まふさんへ質問
ソフトの対戦見てると横歩取り指さないのは何故でしょうか? >>574
キメラではそんなに強くならないみたいですし、大合神シボレーだれか作らないかな。
例えば、クライアントを起動しているだけで、大合神パワーでまふさんが絞った評価関数を作成、公開。
それを、対戦させて結果報告するとか
ちなみに、私はプログラムの能力0です >>602横からだが
実験で検証されないアイデアなんかただの妄想じゃん?
その証拠にwcsc27でまふ定跡の有用性が確かめられるまでは定跡スナイプ戦略なんか全然なかった。そんなに既知であると言うなら、まふ定跡より前の例を示してくれませんか。 ryzen7 1700買おうと思ってるんだが、yaneuraでどれくらいnpsでるかな 将棋ソフトのため"だけ"にPCを買ったりハイパフォーマンスモデルを選ぶのは無駄
AWS借りて使ったほうがいい方がいい
やねみたいな富豪かつケチ臭い人は別 >606
1500でなく2000くらいアルのでは
決着がついたのだけで1913 KifuBaseにブチコム
あと256手と千日手 >614
人間の世界で有用性は分かっていたけれど、コンピュータの世界では昔は質の
いい定跡が作れなかった、ってことかいな >>617
ここ二週間だけで一万円ぐらい課金してるんだけど本当に現物買うよりお得なのか? >>622
読みの浅い段階では▲3四飛を読んでいるけど、深くなってくると途端に「これあかんヤツや」ってなる
そんなに悪い手なのかね?w 学習時の定跡で棋風が変わるなら、リゼロ方式でも学習初期のランダムムーブの手数、割合で棋風が変わるんだろうか >>608
mafuta3 406-383-11 .514
yasema10 405-387-8 .511
yasetamafu70 402-388-10 .508
mafu10 398-391-11 .504
よっちゃん9 395-398-7 .498
mafu 394-401-5 .495
mafuta2 392-402-6 .493
mafuta1 391-403-6 .492
よっちゃん10 382-412-6 .481
よく途中で嫌になって止めなかったなw >>626
丸1日半かかったw
好奇心だけで頑張ったが結果が平凡すぎて
こんなもんかと脱力したわw >>621
20週で10万やろ
4年で100万や
どのスペックでどの程度回し続けるのか考えたら損益分岐点は出るやろ 引き分けはノーカウントにしたけど
勝率51.4%でも約800局信頼区間95%で誤差±3.5%だから、有意差無しだな これじゃあまり強くなってないと言われても仕方ない。これ以上の棋力の向上にはブレンド前の強化学習 でもっと強くするしかないのかな 大会で勝ちたければここに出ているような話を一つ突き抜けた
発想をひねり出さなきゃ無理か。当たり前だが。 自分はちょっと違う実験してるんだけど、完成した評価関数にrezeroのepoch0混ぜてどれだけ棋力が維持できるのか調べてる
mafu10に半分epoch0混ぜても大樹の枝には勝てたりするんだよ、これはどういう風に考えたらいいか?
あと伸びない評価関数にepoch0極少量混ぜたら伸び代が出来ないかなと期待している >>608
これぐらいじゃ誤差の範囲だよな
たぶんもう一回同じ対戦させたら
全く順位が変わると思うわ
あとelmoは基準だから絶対入れてほしいね 初期状態を相入玉のランダムな状態にして学習させたら入玉うまいのができるんかな? 入玉は詰ますのと点数勝負を別々に学習させたら面白そう こんな け゛ーむに まし゛に
なっちゃって と゛うするの >>632
epoch0って評価値0のファイルじゃなかったっけ?
だとしたら、50%でブレンドすると単純に元の評価値が半分になるだけな気がする
ということは、自分の中では全部半分の評価値の中からいいもんを選ぶだけだから、指し手は変わらんのでは? >>608
よく頑張ったな。
ここからさらに強くするには大規模な学習が必要かな >>641
そうか。ポナンザの駒割りも表に出てたから、ポナンザ駒割りでも強いのが出来るんだね。 >>631
次回の電王トナメは同じくらいのレーティングの団子レースになるから
正直勝ち抜けに一番必要なものは当日の運やで まあとにかく一発勝ちゃ勝ちだからな
稲庭みたいな変なのでいってみてもいいのかも >>648
玉以外100とか適等に割り振ってもいいぐらいコマ割りはどうでもよい yasema10対elmoで2秒6スレで300対局の結果
yasema10から見て128-28-144と何故か負け越し。
一方でmafu10ではなくmafuとの混合だとelmoに99-16-85と勝ち越し。
まふ氏のところで上がってる勝率66%のデータは5秒4スレだけどここまで変わるものかな?
それとも互角局面開始(24手?)だとmaf10が定跡強化しているからそちらのほうが効いているのか? 駒割りは意外と重要だけど大きく違わなければ差は出てこないと思う
ponanzaはaperyと違って飛車より馬の価値が高いから、そういうのは影響でそう >>652
評価関数で間接的にコマ割りが表現されてるから気にしなくてええんやで コンピュータ将棋とプロ棋界の歩み
http://qiita.com/tibigame/items/c3566aca81ada69d2c71
elmo以降に何が起こったのか
・Qhapaqがelmo絞りを行いエロ河童となりelmoと互角の力を得た。
・やねうら王がelmo絞りによる評価関数学習用のルーチンを洗練させて野良評価関数が多数育成される。
・ゼロベクトルからの学習をループさせることでelmoと同等以上になることが示される。
・ゼロベクトルから定跡を食わせて学習させることで少ない局面で浮かむ瀬級にできることが示される。
・複数の評価関数を合成させる技術:キメラ合成が解禁されelmoより+100となる合成法が発見される。
・洗練された定跡を用いて遥かに少ない局面でelmo+200以上の領域に到達できることが示される。(この間選手権からわずか2ヶ月) 激指定跡道場4クッソ強いな
yasema10に87-13で勝ち越しだわ 改正版(勝率順)
yasema10 463-429-8
mafuta3 461-428-11
elmo 459-438-3
yasetamafu70 450-438-12
mafu10 449-440-11
よっちゃん9 450-443-7
mafu 438-457-5
mafuta2 435-459-6
mafuta1 434-459-7
よっちゃん10 425-469-6
elmoに勝ち越した評価関数
yasema10 elmo 58-42
mafuta3 elmo 55-45
よっちゃん9 elmo 55-45
最も勝敗差が大きかった対戦
yasetamafu70 mafuta2 62-35-3
以上です。 >>656
どうもです
elmoより強くなったって間違いだったのか?
そして
よっちゃん9>よっちゃん10なの? けっきょくelmoに勝っててレートも高いのはyasema10 mafuta3の2つだけかな。
自己対戦ベースで強くなってても他と戦わせるとそうでもないって言うのはあるあるらしいからね。 ちゃんと初手から指させたら
yasema10とrelmoのどっちが強いんだろう 前にnodchip互角局面を使って6スレ2秒で戦わせたけどもう少し差が出たよ。
それだとelmoのレートが下がると思う。たぶん4スレ1秒だとどの評価関数も精度が高くて差がでない。 >>653
ゼロフィルのepoch0評価関数にランダム値の評価関数から作った棋譜を学習させると
値が付けばつくほど弱くなる、値の付いてない局面は駒割りだけで評価してて、そっちの方が強いから
駒割りが無効化されるほど評価関数の学習が進むまでは駒割りは効いてくる 持ち時間10分一手10秒加算でやったら結局elmoが最強だったり >>660
あくまで参考程度にして下さいw
ただ、個人的に互角局面から指させるのは反対です SDTを占うなら結局大会仕様機で検証せにゃならんだろ
というステマ まふ関数が思ったより定跡チックに指さない
と言っても交配が進むともっと歪な序盤になるけどね
今更ながらポナって最序盤は変な手だけど、銀冠穴熊組んだり銀矢倉狙ったり構想は手堅くて人間好みな気がする やねうら王以外、GitHub更新がないみたいだけど、オープンソースにも色々あるんだね >>653を解説
例えば、歩の駒割りを;-1して、「KK歩」を全て+1、「KKv歩」を全て-1すれば評価値は変らない。
同様に、歩の駒割りを;-1して、「K歩PT」を全て+1/37、「Kv歩PT」を全て-1/37すれば評価値は変らない。
取り合いの評価で駒割りだけを使うようなロジックが入っている場合は挙動が違ってくるけどおおまかな
所は上のように、学習していけば駒割りの値は評価値に組込まれるので大丈夫ってこと。
逆に、KKPやKPPTのうち駒割り成分を、例えば最大最小が同じになるようなルールで取り出せば、
その評価関数における駒割りがどのように評価されているかの傾向もわかるね。 それなら駒割りって元々いらなくない?
計算資源の無駄な気もするけど何かメリットあるの? ■ このスレッドは過去ログ倉庫に格納されています