コンピュータ将棋スレッド 153
■ このスレッドは過去ログ倉庫に格納されています
>>684
suimonやまふがクソという点に関してはアンチが全面的に正しい
ただこのスレでsuimonやまふを叩く書き込みを未だに続けてるアンチは邪魔だし荒れるから消えてほしい suimonとまふの話題は禁止、という話題で勢いが出るコンピュータ将棋スレ suimonさんはコンピュータ将棋の第一人者だもんな >>687
ブログの自己紹介
全国アマチュア将棋レーティング選手権大会予選3勝3敗
第2期将棋ウォーズ棋神戦本戦ベスト16
https://shogiwars.heroz.jp/special/kishinr2
第31回全国アマチュア将棋竜王戦三重県代表
他、主要アマ大会における県予選で上位入賞多数
【これまでの活動】
・2014年12月〜将棋用Twitterアカウント作成
アカウント名:suimon@floodgate_fan
コンピュータ将棋の戦術にフォーカスを当てたツイートが各方面でたちまち反響を呼ぶ。 そういやwcsc29でやねうら王が優勝したのは他のソフトが実は強くなってなくて、やねうら王だけが強くなったから、
とのことだった気がするけど、実際のところどうなん?
まったく強くなってないは言い過ぎな気はするけど、過学習気味かなくらいには思うし、
そのへんAlphaZeroも、初期局面からしか学習してなかったら怪しいんじゃないかという
30手目までにノイズを入れてるとはいえ googleが計測に使った環境だとfull timeで1手20億ノード弱いけそうだし、
これを数億ノードの検討で読めた読めないといわれるとあれだ 計測基準で強さ出すから序盤矯正がほとんどで教師のlimitが3000程度、たややんさんとかは1000とか1500で
その分depthが12とか14もあるけど数千万くらいしか学習してないんじゃなかったっけ
やねさんはlimit32000とかで教師作ってそうだけど(妄想)それが大会ノード数では効いたかもしれないと予想
depth10で15億(limit32000)作った教師をtnk-に食わせてみたけど話題になる読みにくい局面も
いまのtop3より読めてる気がするので案外見当違いではない気もする 入玉宣言勝ちの付近を学習させるには、eval_limitは最低でも7000位は必要
教師の探索depthを深くすると終盤の局面生成スピードが極端に落ちるので、eval_limitを小さくしがち
結果、序盤特化の先行逃げ切り評価関数が出来てしまう。
だからやねさんとか滝澤さんとか野田さんは終盤でも局面生成スピードが速度が落ちないように工夫していた 入玉宣言勝ち付近の局面を検討させることなんてないからどうでもいいな
1500くらいまでの評価が正確なほうがありがたい
ソフト同士の対局ではそりゃ大事だろうけど とりあえずnobook測定はもういいでしょ
定跡は大会とかじゃなくても、一般的な利用でも簡単に使えるわけで
一時期の浮かむ瀬みたいにnobook思考でそこらの定跡より優位に立てるって言うやつならいいけど
1500万ノードは仕方ない妥協点かなとは思うけど どんな定跡を測定に使うかって問題もあるから大変そう
ペタショック定跡が公開されればそれを使うんだろうけど 入玉宣言勝ち付近の学習が不十分だと、1点勝ちのとき正確に評価できなくて逆転負けするときがあるからな 定跡有りだとたいへんだから、AobaZeroがやってるみたいに初期局面ばらけさせて計測がよさそう
というと先後入れ換えるか入れ換えないかで対立するんだけど あまり極端にばらけさせると必要な対局数が増えるし
指定の50局面くらいまで定跡で誘導するくらいがいいんじゃないかな 特定の定跡ファイルに依存しすぎると偏りが出るからやねうら王(テラショック定跡)、水匠(白黒定跡)、tanuki-、illqha、C-bookの五大定跡ファイルを照合して過半数の3つ以上に登録されてる局面を汎用局面として抽出したらどうだろう?
定跡でよく現れる局面でちゃんと指せるかというのは初形からの対局よりも実用的な測定になると思う フリーソフトのk-shogiの長考(64bit)って
24だとどれくらいの強さ? もうソフトの強さは異常。
24で1級だけどやねうら王に2枚落ちで勝ったことない。
羽生さんが昔将棋の神様と角一枚の違いだと言っていたが飛車落ちで最強の
ソフトと対戦してもらいたい。
0780 名無し名人 2019/08/09 14:14:07
ウォーズなら三級じゃよ^^
🌻🐝くらい暇ならすぐに六段くらいにはなれると思うが他にやることがあるからな^^ >>706
TVの放送で言ってね
羽生が不思議な所は自分は人間レベルでは超越してると意識してた事と
将来が読めなかった事かな 羽生さんは「羽生さんなら神様と香落ちくらいかな?」という世論の中で謙遜する意味で「香落ちでは勝てません。角落ちでなんとか」と言っただけなのに今となっては全然別の意味になってしまったな >>704
s-book_blackも入れて六大な^^ 定跡off測定に異論を唱え、公開直後から🐬❹を評価した天才のワイ^^
後出し丸パクリの初心者では評価できないからな^^ 定跡オフ測定への異論なんてずっと出てるしillqhaは最初から評価されてたけど
天才を名乗るなら他人に文句言うばかりじゃなくて自分で何か作ってみたら? stockfishにNNUE入れれば無双…とは単純には行かないんだな >>716
チェスは将棋よりも複雑性が低いから評価関数は単純なものにしてNPSを出すのが重要ってことなのかな? 引き分けがめっちゃ多いから
学習に関しては相当工夫しないと難しいでしょう
そういう意味で同一の学習法で囲碁、チェス、将棋を同時攻略したAlpha Zeroの凄さが分かる EPYC Romeの詳細出てきたけどAmazonが登壇してないのが気になった
この雰囲気だとGCPの方が先にEPYC Rome使えそうやね
https://gigazine.net/news/20190809-amd-epyc-gen2-rome/
ベンチマークも出てるし期待できる
https://www.anandtech.com/show/14694/amd-rome-epyc-2nd-gen/
話変わるけどニコ生のマシンスペックの詳細知ってる人おる?
エンジンは更新されたけど電王戦のポンコツスペックのマシン使いまわしてるものだと思ってたわ
白ビールのblog見た感じm5.24xlarge使ってそうだけどハッシュの設定が気になる NPSを出すw
717 名無し名人 (スップ Sdda-b3Ss) 2019/08/09(金) 21:21:42.84 ID:5NI03SQZd
>>716
チェスは将棋よりも複雑性が低いから評価関数は単純なものにしてNPSを出すのが重要ってことなのかな? >>717
チェスに3駒の位置関係使ってもあまり効果ないかな チェスは駒が減るからN駒関係は終盤にいくほど表現力が減ってしまいそう 個人的にAlphaZeroのすごいところって、「同一の学習法で囲碁、チェス、将棋を同時攻略」というより
もっと物理的な部分のような希ガス 少し前にc5.24xlarge と c5.metal がAWSに増えたけどそれぞれm5比でNPSが 5% 〜 10% ぐらい上がる
c5.metalはnnue使ったベンチコマンドで5000万npsにぎりぎり届かない感じ
npsでる局面なら5200万npsぐらいになる
m5と比べてメモリ半分だけど2割ぐらい安いし学習や計測用に使いやすい予感
まあEPYC Romeから見たら微妙な進歩やね 将棋は教師信号のS/Nが強いから適当な評価関数でも学習できるんだろう チェスの場合はNNUEがだめというよりAlphaZeroのMCTSのやりかたが優れていたということかしらん
一応NNを使ってる部分は同じなんだし イケダハヤトスレ怖いな
175 名無しさん@明日があるさ sage 2019/08/08(木) 18:55:23.54 0
ダサイクルの輪
ttp://i.imgur.com/uO4zLEj.jpg >>729
いや、tanuki-チームの野田さんが試行錯誤しても上手く行かないからチェスから一時撤退するって昨日発表したからスレで話題になってるんだよ 将棋であれだけ成功してるのにチェスではダメなのかな?
KPPTも成功した、という話はあまり聞かないし。
nodchip@tanuki-@nodchip
Stockfish with NNUE、何度か強化学習を試みたものの、Stockfishに全く歯が立たない…。一旦保留しよう…。 野田さんは所詮コーダーだから高速化以外の能力は並だからね stockfishには評価関数に相当するものはないの? >>730
YouTubeのイケハヤの表情も怖い^^ >>734
昔ながらの人間に知識を書きだした手作業で作った単純で軽いやつ
そんなのがAlphaZeroでも抜くのが困難なほど強いのに逆に困惑する >>733
あんたの認識ではただのコーダーがGoogleに入社できるのか..
このスレ、将棋馬鹿しかいねぇw https://mobile.twitter.com/bleu48/status/1159651603818799104
これ見たけどニコ生はハイスペ使ってるから評価値が高く出る(探索が深いため)事に言及してるけど
awsで検討させながら見てたがニコ生の評価値とは違かったんだが
awsより高性能なpcをニコ生は配信用に使用してるって事か?
仮にそうならばawsで二倍時間使ったとしても同じような評価値出力にならないんだけど
https://twitter.com/5chan_nel (5ch newer account) 開発者本人は学習が進んだ結果評価値の絶対値が大きくなったといってるようだけど
教師を恣意的に選別したことによる過学習が起こってるんじゃないかと思ってるけどね 思うのは自由だ。
ただ結果を出している方が説得力がある。 別に評価値なんて例えば1/2倍して出力したって指し手には影響しないんだからニコ生のエンタメとして小さく見せたいなら縮小すればいいと思うけど そもそも評価値の一歩=100点の基準をもう誰も守ってないし学習の過程からすると勝率をポナンザの式で変換したものが評価値の定義と言うしかないようになってるよね >>739
評価値の大小は探索の深さも関わってるけど、評価関数の違いのほうがデカイよ。恐らくニコ生のビールは全く別物の評価関数の可能性もあると思ってる。 将棋倶楽部24で水匠Uが2枚落ち以上の駒落ち対局で
現在18勝3敗とのこと 早くupしてくれないかな そうなんだよね
もともと根拠が怪しい値なんだから絶対値がでかいだの小さいだのは結構どうでもいい問題だと思うんだけど
ニコ生中継のPonanzaの評価値で刷り込まれた人間の感覚に、最新のソフトの見た目の評価値を合わせてやるってのは必要かもしれない >>746
2枚落ちでプロが負け越す時代が来るというのも
まんざらではなくなってきてるかもしれないね いや、言いたいことはだねぇ・・・
「ニコ生の評価値が大きく出てるのは俺のせいじゃなくお前らの貧弱PCのせだぞ」
「awsとかハイスペpcで検討すれば同じになるからw」
要約すればこんな事だろうけどaws使ってみたけど同じにはならんかったよ ニコ生運営がビールの評価関数とやねうら王の評価関数を取り違えてましたみたいなオチは普通にありえると思ってる >>748
ゲェジ
お前みたいな低級なら2枚落ちでも勝てないだろうが AIをponder off 持ち時間を10分の1にしても人間は
平手で強豪エンジンに勝てないから技巧2等でレベルを
落して対戦するか駒落ちで対戦するか位しかないから
やむを得ない >>751
単純にソフトの進歩について驚嘆しただけだったんだけどな
上から目線で偉そうにしているように見えたのであれば失礼しました 評価関数については、評価値の値の大きさよりも、戦型の相性が重要な問題なんだよな^^ >>756
KPPTのときみたいに単純なキメラじゃうまくいかないのかな KPP系の評価関数の学習結果はOUの位置別に完璧に独立に弄れるしさらに
局面xの盤面に現れないPPの重みがどう変わろうがxには影響しないという頑健さがあるが
ニューラルネットワークは一部分でも弄ったときの影響範囲が限定し難い
追加学習のみならず大々的なmixingともなると、転移学習の超高度なテクが要る希ガス ていうかむしろ過学習を起こしやすいのはKPP系の評価関数の方であって
ということはむしろ表現能力に関してはKPP系の方がまだまだフロンティアのはず… 最近の、レート4000オーバーのソフトってノード数30万程度でプロレベルなんか?
スマホ版NNUEkaiXFと、ノード数30万前後で指してるけど半分くらい勝ってる印象
一応24では2700はあるけど >>760
nnueは1000万未満の低ノードでは加速度的に
棋力が低下するらしいから やねうらお、怒ってたんだなw
てかLc0のソース解析記事書いてほしいな
weightファイルの仕組みとか
>これでもう「将棋ソフトはStockfishの丸パクリ」みたいな発言は言わせません。言うなよ、この、ちゃんころゴキブリどもめ!ヽ(`Д´)ノ
※ 「ちゃんころ」とは、なんとかちゃんねるの住人を指すネットスラング。あめぞう時代(1997年〜)にそう呼ばれることが多かった。 そんなこと誰か言ったのか?^^
酷い奴がいるんだなぁ^^ NNのよりすぐれた表現力が強さに貢献した、というのは想像しやすいけど、
それを活用するのにMCTSが従来のαβよりも優れていた、というのがAlphaZeroの強さの秘訣じゃないかと思い始めてきた AlphaZeroの強さは単純に使った計算資源の量だろ >>762
超低ノードではNNUEよりもKPPTやKPP_KKPTのほうが強いって話はよく聞くけどちゃんと検証した人いるんだろうか? 強さの秘訣は第2世代TPU×4やな。
AobazeroだとCUDA+cudnnを使って高速化した上で、2080tiを2枚使えば近いNPSが出せるだろうけど。 強さの秘訣は第2世代TPU×4やな。
AobazeroだとCUDA+cudnnを使って高速化した上で、2080tiを2枚使えば近いNPSが出せるだろうけど。 >>759
NNUEにもまだまだ課題は残ってるのね uuunuuunさんのAobaZeroのレートのツイート記事を見たら「2ヶ月でR500の進歩。この調子で行くと10月でR3200, 12月にR3700。
どのあたりまで強くなるのだろう。」って書かれてたがAobaZeroのレートが順調に上がってるらしい、強化学習には誰でも参加出来るの
でまだ参加していない人は参加してみては 論文出た当初はあんなに疑ってたのに
何がうんこを心変りさせたの?
それとも老人特有の痴呆症かアルツかなにかで
自分がツイートしたこと自体忘れてんのかね?
知り合いのチェスの友人はどこ行った?www
アルパゼロの棋力はR3500です(キリッ 何がって、arxivの最初の論文はひどかったけど
後から出てきた2018年末の論文は信頼に値するものだったからじゃないの スマホ用にnnueで作成した教師をkppkkptに10億ガブガブさせてみたんだが
qqrをkppkkpt化したのよりかは若干強くなってそうだけど
nnueの序盤矯正した棋風みたくなってて実際強いのかも分からんわ(横歩圧殺)
npsが1.3〜1.5倍くらい出るから(nnue比)玩具としてはいいけどね スマホ想定のノード数とHashで仮想敵nnueより強ければいいんじゃないの、低めのノードなら連続対局もすぐ終わるだろうし >>775
すげえ
depthいくつで教師作ってますか?
自分も実験としてNNUEの教師でQQRの強化とか試みたけど全然強くならなかった >>676
まふさんの言動で自分が一番意味分かんねえと思ったのはこれですねぇ……
未だに読み返しても分からん
SDT5くらいの頃は凄い定跡作る人だなあと思ってたんだけど
https://i.imgur.com/qIUzeqH.png
https://i.imgur.com/zDHfXWh.png >>775
10億ってことはdepth8?
KPPTだと100億必要という風潮があったからKPPKKPTでも10億ではまだまだ足りないのかもね >>774
なんだか曲解されてるようだけど、ブログには論文中の強さだとR5000で家庭用GPUで動かすとR3400だと書かれている。
山下さんも800playoutでR3500くらいじゃないかと見積もっている。
https://524.teacup.com/yss/bbs/3480 depth10で15億作ったけど10億毎の更新?なのか分からんから10億で打ち切り
kpptでもqqrより勝率良さげだけどrotaさんとかみたく計測頑張ってるわけじゃないし
横歩で勝率稼いでるだけの意味ないものなんかと思うけど >>782
このスレの住人たちが計測してくれるからギガファイル便からでも公開されたら? ■ このスレッドは過去ログ倉庫に格納されています