▲コンピュータ将棋スレッド139
レス数が900を超えています。1000を超えると表示できなくなるよ。
NNUE育成ってcmdで動くのかこれ…
超初心者だから起動後クラッシュしてしまう。セキュリティソフトに強制介入されてるんか、パソコンの環境が悪いのか、CPUの世代が悪いのかすら分からんが…頑張ってみる。 >>815
まふさんは評価関数公開しなさそうだけど、
レシピは公開してるから再現は可能性かも NNUE学習の問題点に対するアプローチ
1)nn_batch_size を大きくとる
2)互角局面等を使って教師生成する
3)ランダムムーブを使う
4)生成した教師局面を全部使わずに運にまかせる
実際私がやったのは「4」です。
自前PCの物理メモリ的に「nn_batch_size」を大きく出来なかった。
ランダムムーブは使いたくなかった。
互角局面等よりも、レートが上がった「depth 10」でやってみたかった。
これらの理由から
30%程度に重複局面があるなら、生成した40%程度ずつ学習するを選択しました。
【以下手順】
1億局面の教師局面を生成した。
4000万局面ずつ学習した。
1回の学習で8個の評価関数を作成し、
トーナメント方式で競わせ、優勝したものをepoch2とする。
これを3セット繰り返した。 まあ後一週間もすれば、またなかったことになってるんだろうね。 教師局面生成
depth 10
random_move_count 0
write_minply 9
write_maxply 160
eval_limit 3000
1)depth 10
depth 8だとブレが4%程度あるのに対して、
depth 10はブレが2%程度と精度が高いから。
2)write_minply 9
トップレートであるQQRがレーティング計測の
1手1500万局面程度(uuunuuunさん基準)の場合に、
先手で「横歩取り青野流」を多用して勝率を稼いでくるので、
序盤を学習対象にした。
(序盤を学習すると勝率は高くなるが、局面のばらつきが悪くなるので本当は学習対象にしたくない※学習せずに定跡で制御すべきだと考えている)
3)eval_limit 3000
「大駒が相手陣へ突破することが良いことだ」とAIが学習するには、
相手陣で飛車+角の成駒が暴れまわっている局面が必要と考え、
調べると評価値1000〜3000の局面が良いことがわかったから。
4)write_maxply 160
「depth 10」+「eval_limit 3000」の場合は、
160手引き分け程度が「勝敗項」が上手く付くことがわかったから。 まふブログより以下の文章
---------
現在トップレートの「Godwhale5.0.5/QQR」
6コア3.5秒のuuunuuunさん基準として100局
中、終盤はNNUEのほうが強すぎるので「投了値600」
勝率77%なのでレーティング+210となります。
先月トップレートを更新した相手に
いきなりぶっ飛んだ勝率が出ました。
---------
相性問題あるから、他のソフトとも検証してから
レート+210とか書いて下さい 評価関数は相性問題が重要だと思うんだが
今回まふさんがQQR以外に相性問題を検証していないのを見てsdt5の人造棋士18号さん
のyaselmoとの検証結果と似ているような気がする
4,000万ノード縛りで対局させて人造棋士18号がyaselmoに40戦3敗だったが まふ氏へ伝言
レートサイトのトップ3ソフトは以下
Godwhale5.0.5/QQR 4244
T.N.K./nn20180608mafu 4244
YO4.82/Qhapaq_WCSC28 4204
この3つのソフトと対戦結果検証出してから
レート+210かどうか判断して下さいますか? 探索部の相性もあるからやねうら王同士にするべき
uuunuuunはGW3は一生計測しないと宣言しているからDittoでの計測も当然ノーカン 負けても利点があるという電王トーナメントの裏街道戦術を思わず思い出したわ^^; 教師局面も探索部に何を採用して作ったのか分からないし説明不足
色々と実験していたし
まさかGW3かGW6で教師作ってないか? 最初4連勝して当たりきつくなった技巧が敗退して、最初2連敗したけど当たり緩くなって決勝トーナメント上がれたうさぴょん2 'だよな
懐かしい nnueは技巧やnozomiに対してもきっちり強くなってるから
物が違うと思ったよ まふさんへ新評価関数をすみやかに公開してください
みんなで検証できるから早く結果が出ますよ 誰か開発者の方がDittoを公開してくれませんかね
そうすればレーティングサイトにも載るはず >>835
なんであえてNPSが低いDitto?
あれは色々な条件を楽に変更して計測するためのものであってレーティングに使うようなものではないと思うけど
とういかエンジンは素直にgodwhale使えばいいのでは うん探索部はやねうら王かgodwhaleに統一してレートを計測すべきだよね。 >>832
それより以前にはラビリンタスがメカ女子将棋相手に勝ち局面でわざと負けて裏街道に行ったとかあったぞ
まぁあれはネタソフト枠だったけど 遠山雄亮@funnytoyama
将棋もAIが強くなるにつれて、多様性はどんどん減っています。
振り飛車を指すソフトが少ないのが典型例です。
そこを抜けるには、ゲームの深みと密接な関係があると思うので、どうなるかは分からないというのが正直なところです。
多様性を重視したポナンザの引退は、やっぱり痛いかもしれません。
電王トーナメントの立会人を務めるようなプロ棋士からこの発言が出ることにビックリした
千田先生も同じ考えだろうか
振り飛車が不利飛車だとしても人対人で咎めるのは無理なんじゃないの? こういう発言はちょっと残念
なら雁木をはじめとした諸々のソフトのおかげで指されるようになった手はなんなのか
振り飛車も四間飛車は-50くらいの評価値だし作戦として成立しないとも思わない 先手四間飛車はおよそ−150の戦法。
-50になるのは手順の前提が間違っている。 投了値600ってDeepMindの900より酷くないか? 間違えた
先手四間飛車が-100で後手四間飛車が-150か
まあ勝ちたいなら指さないでしょ今時四間飛車なんてw 振り飛車が原因で本当に全然勝てなくなるなら久保王将のレーティングはバグかなにかなんだろうか
人間同士では全然問題ないと思うけどな、振り飛車
NNUEのおかげで振り飛車でも強い評価関数も登場しそうだし 久保や菅井は力戦に持ち込んで誤魔化してるじゃん
不利飛車ってそういう戦法でしょ
不利なものはいくら評価関数に学習させたところで不利なんだよな 人間同士では振り飛車が通用してもレートの高いソフトはごまかしがきかないので
やはり不利飛車は咎められる >>845
力戦に持ち込んで勝てる、タイトルも獲れる、十分すぎる気が 人間同士では十分だろうな、ただタイトルホルダー数は居飛車の4分の1だが >>848
この先ますます勝率は落ちていくでしょ
不利なんだから 居飛車だらけの中4分の1ならむしろ快挙と言えるのでは 居飛車有利なのに53%しか勝てないとか全然咎めきれてないw ▲7六歩△3四歩▲2六歩と▲7六歩△3四歩▲6六歩(不利飛車縛り)
欠陥的な2手目△3四歩を咎められない時点で大損だろうよ
なんでこうも不利であるという現実を直視できない人が多いんだろうねぇ 居飛車同士より居飛車対振り飛車の方が見てて面白いので振り飛車はこの先も無くなって欲しくないが わざと不利な序盤にすれば相手の研究から外れることができるので振り飛車は有力な戦法だよ
オセロとかのマイナスn進行とかといっしょ そもそも菅井も3月に角換わり腰掛け銀指してたし純粋不利飛車党とは言えないだろw あーだこーだと論点をずらして誤魔化そうとするあたりがさすが不利飛車党のみなさんなんだよな >>858
振り飛車見るのは好きだけど居飛車党なんだよね…… 振り飛車にすると序盤数手で評価値がプラスになるようにスパルタ教育した振り飛車ソフトがあるが
居飛車ソフトだと-200の序盤数手がスパルタ教育した振り飛車ソフトだと+200とかなって
いるのを見ると評価値が正反対なので見てて面白いし観賞用としては価値があると思うんだが
人によっては凄い違和感を感じるが NNUE-GW3誰か開発者の方が公開してくれませんかね それよりNNUEkaiのリンクが期限切れになってるぞ
再配布は未許可っぽいしオワタ NNUEkaiの期限切れで出回っているのが少しってことはPonanzaほどとは言わないが
価値があるんじゃないか、どうせまたより強いのがNNUEkaiの人が公開してくれると思うが floodgateが今日10時から18時まで1局を除いて全て上位ソフト勢が以下4弱としか当たってないんだが
いくら何でもfloodgateのマッチングシステムは偏りすぎだろ
gikou2_1c、tenuki、coduck_pi2_600MHz_1c、kifuwarabe2018 16スレッドフル稼働で教師局面作成してるとエアコンつけててもPCぶっ壊れそう
まふさんの再現とかまさにSTAP細胞を未だに探し続ける中国の学者状態 >>867
MAXだと危険な感じするから2スレくらい減らしてやってる
ちょっとした作業ならサクサクできるようになるし完全にPC塞がらないからいいよ 温度モニタすりゃいいだろ
エンコでほぼ常時100度近辺は長年やっとるが
まあ3年くらいは普通に持つで 指定した温度行ったらクロック下げるような設定にしとけばいいのでは? やっぱ増田に負けた藤井聡太の棋力はyaneuraOu mini(R2845)程度か そりゃフリーザもクリリンの気円斬に当たれば死ぬもんな こことり@kocotori_30
95%はちゃんとできてるのになぜ残りの5%だけ取り出してなぜあんなにも全部がダメみたいな言い方をされるんだろう。主治医のとこに上司が面会に行くみたいな事態になってしまった。上司こそ認知行動療法受けろよ
posted at 23:41:45 >>875
こいつ藤井ヲタだな藤井の棋力をずぼししている人をキチガイっているお前がキチガイだろ藤井ヲタは巣から出てくるな 棋士のレーティング的な強さは、ヒトとしての棋士の一部分でしかない。お茶を飲んだり、手が震えたり、そういうのも含めての棋界。
だからコンピュータ将棋を引き合いに出して棋士を云々して何になるのだろうか。
コンピュータ将棋は強いし、人間は追いつけない。でもコンピュータ将棋が可動しているサーバールームを見て誰が感動するだろうか。コンピュータ将棋も、開発者の色んなストーリーがあってこそ面白いのに。
コンピュータ将棋は棋士を貧相に見せるための舞台装置ではない。 >>878
あなたがストーリーがないと感動できないタイプなのは別に構わないが、盤上にしか興味のないタイプも少数派ながら一定数いるって理解してないのは流石にただのバカだぞ >>878
要するに将棋ファンって将棋それ自体は大して好きじゃないってことでしょ qhapaq_wcsc28に勝率89%とかワロス。
SDTがもし開催されればqhapaq wcsc28に勝率9割が最低ライン GW3やDittoを使用してのレーティング計測は
ミニ四駆に例えるとプラズマダッシュモーターを装着してのタイムを自慢するようなもの 最近のまふさんの検証結果は捏造の可能性があるんじゃないか公開していないものは
信用出来ないんだが、設定を変えればいくらでも勝率は変えられるから >>805を上げた者です
短い期間で約100人もの人にDLしてもらったみたいで驚きました
まふさんがたった4000万の教師で学習しても強くなることを公開してくれたことで学習のハードルが過去最低レベルだと思います
雨後の筍的にぽんぽん強い評価関数が出てくる展開を期待しているので、良ければ挑戦してみてください >>885
100歩譲ってGW3までならセーフだとしても
設定を明かさないDittoでの計測は論外だよね
その部分が非公開だと再現性が全くないし
エンジン名を隠し始めたのが更に胡散臭さを増幅させてる まふ新作が新手、新作戦を指すようだから楽しみやなぁ >>886の続き
まふさんの計測結果ですが
相手のエンジンがYO4.82かつこちらが好きにパラメーターを弄ったエンジンを使う
という条件だと同評価関数を使用して使用エンジン差だけで65%以上勝つことも可能です(特に100局なんかでは)
なのでそこら辺が公開されるまでは+R200は怪しい気がします
ですが、勝率の高さから+R50は少なくとも伸びている気がします >>889の続き
4000万教師で学習を3セット(仮にここを一週間とする)
これでR50以上あがるなら来年の5月までにRはどこまで行くのか……
サチってくるまでにものすごいR&新手だらけになって将棋の歴史に革命を起こしそうですね
学習用にかなりパラメーターを弄ったエンジン(短時間でwhale6に7割、数百万ノードでgodwhaleと同等)
を使うと強くなるのか検証しているので、いい結果が出ればまたそれも公開しようと思います
長文失礼致しました まふさんは飛ばししたがりだから、最初のうちは話半分に楽しませてもらってる まふさんは公開しなくていいからRotaさんとかuuumさんに預けてみろよ〜
あやしすぎるわ 俺はまふ氏のNNUEとクジラで長時間で対戦させてるけど、ほとんど互角だったな ソフトの設定依存で勝敗が変わるような勝負の棋譜に
盤上の感動などあるやあらざるや、 >>899
学習のパラメーター自体は秘密みたいなので再現はちょっと難しいですね……
トーナメント方式も計算資源豊富じゃないと厳しいですし何か別の方法を考えてみます 時代は藤井システムだの風車だの言ってるし、このスレで振り飛車、振り飛車と騒いでいたのもまふ氏だろうw 教師局面の重複排除できれば、複数作成のトーナメントは省略可能では? >>902
そもそも完全に重複を削除するのがいいかは微妙なところです
残したものが間違った勝敗項がついてしまった局面だったりするとむしろよくないような
AdaGradは頻出局面があったりすると学習率調整してくれたりするんですけどね……(たぶん) まふ氏の説明だと再現が難しい
失敗した多くの人からヘイトを集めてアンチを量産する 棋譜は見せない
Dittoの設定は言わない
棋譜生成に使ったエンジンも言わない
学習パラメータも言わない
最新のスクショではエンジン名を隠し始める
怪しさ満点ですねぇ・・・ まふさんのスクショだけの俺の強いは信用度ゼロなんだが公開しないことには信用できん >>879
指摘されている点はご最も。そういう人も居る。でもだからといって、棋士が負けた時に >>879
指摘されている点はご最も。そういう人も居る。でも、純粋に「盤上にしか興味が無い人」がソフト名を比較の引き合に出して「この棋士はこのソフト以下だ」とわざわざこのスレに書き込むのも自己矛盾な気がする。
本当に盤上にしか興味が無いなら、そんな棋士個人の棋力を云々して、このスレで提示しなくても良いのにと思った。 開発者の方がまふさんのツイートにいいねを押さなくなってきた
信用されてない証拠
それでもAWS使って再現しようとしてる人いるからふかしだったらとんでもないヘイトを買うことになる
そもそもまふさんはAWSも使えないのにどうやってトーナメント方式に必要な莫大な計算資源を得たのか
k_ohgaさんがバックアップしてくれたなら理解できるが >>805
使い方よく分からんけどシボレーと一緒にいれてシボレーを立ち上げればいいの? このスレなんかマニマックな話ばかりで受け付けなくなってきた
一般的な将棋ファンや少しコンピュータ将棋に興味があるくらいではもうついてけんね
電王トーナメントが開催されたらまた違うかな >>910
そりゃ当然詳細を発表するであろう事を前提とした「いいね!」だったろうし
あんな適当な記事でお茶濁されたらキレるだろ マニアックなことやってくれる人がいないと発展しないしそこらへんはいいんじゃないの?
へーなんか頑張ってんなあくらいに思っとけば >>915
まぁね
多分電王トーナメントまでは俺はROM専のまま
qhapaqさんはコンピュータ将棋界の将来をよく心配してるよね
またドワンゴと違うスポンサーが付く可能性もあるけど、一部のマニアック層だけ関心のある分野になるのは避けられないかもな >>911
シボレーみたいにバッチファイルでもいけるはずです
その場合は多分シボレーの中身をメモ帳とかで開いて○○.exeのところを>>805のやつに代えてください
イマイチわからないという方は同梱の『学習のヒント』を読んで頂くといいと思います
個人的に教師作成と学習は完全に別作業だと思っているのでシボレーみたいに一気にはやらないです レス数が900を超えています。1000を超えると表示できなくなるよ。