▲コンピュータ将棋スレッド139
■ このスレッドは過去ログ倉庫に格納されています
評価値と勝率の関係からできてる今の評価関数は多くのソフトがだいたい同じだよね?
評価値がaの時の勝率=1/(1+exp(-a/600)) プログラマの努力と各種テクノロジーの進化で、ここ数年で+R1000くらい上がってるけど、このままのスピード感だと単純計算では将来R25000とかピンとこない単位になる。
しかし、そんな少年漫画みたいなレーティングに本当になるのか。何処かで伸びも鈍化するような気もして、 >>333 の書き込みをした。
Alpha Go Zeroとかも学習効果のグラフが鈍化してたし、ある所からはR上げに必要な計算資源が指数関数的に増えて、事実上の頭打ちになるんかなぁ。
でもスパコンの性能は指数関数的に進化してるし、予想が難しい。 >>344
すまん。
比較的保守的な所見を言ったら、誰かが別の視点でコンピュータ将棋の将来像を言ってくれるかなぁと。 >>341
今のソフト(全部かどうかはともかく)は勝率と評価値を関連付けているから、評価値から同一ソフトて指し継いだ場合の勝率が出せるぞ。 >>342
おお、この式を使えばエクセルとかで簡単に勝率が出せるのね
評価値500で7割の勝率なのかー ポナンザ定数の600を長いことそのまま使ってるけど実際620とか580とかにしたら弱くなるんだろうか googleで検索するだけでできるけどな
=1/(1+exp(999/-600))
https://goo.gl/1MtYDR >>348
意味があるかどうかわからないけどより正確な値がほしければ、評価値ごとの勝率の統計とって回帰してやればいいだけだ。 >>342
学習時や内部的にはその式でやってるけど、USIで表示の際はセンチポーン、1歩100点に補正するよね。
Aperyだと1割くらい加算してるんでは?
その辺はどうなんだろ? やねうら王、ソフトと対局するときに、先手後手を振り駒で決めるようにしてほしい 東大はあったはず、激指はない
将棋所とかShogiGUIはないよね? >>353
激指もレーティング戦やレベル対局はランダムだったはず サッカー日本代表勝ちました 将棋でいえば序盤に将棋エンジンの
バグで飛車をタダ取りした棋士が勝ったようなもの lczeroはセンチポーンと勝率両方表示できる
// UCI-like output wants a depth and a cp, so convert winrate to a cp estimate.
int cp = 290.680623072 * tan(3.096181612 * (feval - 0.5)); >>175
Komodo MCTSはAlphazeroのときに言われてた棋風の変化(positional chessが得意)もあるそうな
将棋でもやってほしいな
https://komodochess.com/Komodo12.htm 勝率をcpに変換するのがロジットじゃなくてtanなのはなんか意味があるのか、
というわけでもないか 気にしないことにしよう tanの曲線は0付近の勾配が緩やか、つまり勝率50%前後はだいたいでよくて、勝率100%と0%付近に値の差をつけたいってことなのかな?
将棋の場合sigやtanhを使ってるから0付近の勾配が急だから、勝率50%付近は細かく差をつけて、勝率100%と0%付近はだいたいでいいだろ、っていうコンセプトだけど。 あぁ、勝率→評価値は逆関数になるから将棋はlogitか。
だとすると、おんなしようなカーブか。tanとlogitって範囲指定すれば変換できるようなもんだっけか? https://ja.numberempire.com/graphingcalculator.php
ここで- 600 * log (1 / x- 1), 290.680623072 * tan(3.096181612 * (x - 0.5))を入れて比較してみると
0.99程度で5000超えるのはとなって指数関数の方が自然に見える NHKの朝ドラ”半分・青い”を見ていて某棋士を
モデルにした”ソウタの夢”という作品を書いて
くれる漫画家がいないかなと思った >>326-327
こちとらノーパソじゃ!冷房つけても熱暴走で無理なんじゃ! >>365
熱とか関係なくノーパソじゃ一ヶ月ずっと回し続けても終わらんだろ
どこか借りるのが賢い アルファ先生のパフォーマンスが見たいのですが、
どうすれば叶いますか? チェスだと駒の価値が王以外全部で3900しかないから
勝率91%で900センチポーンはそんなもんだろうか >>369
Full Paperがいまだに出てこないのはやはり何かおかしいよね。
Rejectくらったのは間違いなさそう。 対局条件とか色々怪しかったし表に出てくるようなデータではないだろうなあれは
棋譜すら公開されないのを見るとリジェクトされたどころか明らかな欠陥があるんだろうな 誰も論文が再現できないからな
中国のテンセントだけがGoogle並みの金を投入してAlpha並みに強くなったから
Googleに謝意を表したそうだが チェスと将棋に関してはかなり怪しいね。
コンピューター将棋の部分も金子先生あたりに査読してもらう必要がある。 Komodoもモンテカルロ使って面白いチェス指すようになったとは言ってるけど強くなったとは言ってない感じ
昔あったモンテカルロ将棋は全然ダメだったからチェスでどうやったのか詳細がわかればいいんだけど
Komodo 12 with AlphaZero techniques
https://en.chessbase.com/post/komodo-12-with-alphazero-techniques すー@CosMos_519
これがわたしの #発達障害 テストの結果だ#ADHD 2年前のだ、だいぶ鬱の時のやつだ、参考にしてくれ、参考になったなら当事者に届けたいからRTしてくれ https://pic.twitter.com/cxwbsJRbep Alphazero側のハードが妥当なのか誰にもわからないから強いかどうかわからないんだよな結局 ポナンザ定数の600という数値が正しい勝率を表しているのかという問題だけど、
elmoに関して言えば実際の対局結果からは、深さ8の100万局で756という数値か出ている
http://tadaoyamaoka.hatenablog.com/entry/2017/05/24/220807 remiさんもうcrazy shogiはやめたの? 【速報】
佐藤天彦、羽生善治から名人防衛
ぽんぽこの推薦手を何度もコケにした解説のナベは自分の方が間違ってばかりで赤っ恥かきまくり >>371
AlphaZero将棋はありまぁす(笑)
棋譜すらないんじゃ、どうしようもないね 今年SDTやらないとすると検討ソフトどうするんだろうね。
やねうら王とのコラボを考えてたりするのかな SDT-final的な感じで今年はやってほしいけどな 定跡に制限をかけて開催してほしい
視聴者として定跡ゲームは見たくないです nozomi20180529のSource codeはupされていますが
バイナリはupしないとのことなので 誰かバイナリを
ビルドしてupしてくれませんか
https://github.com/saihyou/nozomi/releases NNUEkaiでfloodgateに流してました。
NNUE0608からDepth8の1億局面を作成し、学習。
まふ氏のパラメータでは上手く学習できなかった(おそらくまふ氏の場合は教師局面が優秀なんだと思う)ので、
異なるパラメータで学習
自己計測では、探索にGW3を使用して、
対NNUE0608に勝率55%(1手1500万ノード500局)
対QQR/GWに勝率54%(1手1秒32スレッド(1500万ノード〜2000万ノード相当)200局)
https://1.gigafile.nu/0627-ce2650c9938f14ddbf15ec005e8cb82f0
お暇なら試してみてくださいね >>390
同じくあのパラメーターではうまく学習できず
教師とパラメーターの相性があるってことはあるのだろうか nnueはポテンシャルが半端ないので、すぐQQR+R100ぐらい行きそう
深さ14の2億局面とかで勝敗情報の比率上げたりすれば まふさんがDepth10の1憶で実験中ってツイートしてたな。 >>389
めんどくさいからって他人にやらせようとするなks bonanzaの保木さんとnnueの那須さんのお二人は天才 NNUEkai/GW3対elmo/YO4.79
1手2秒32スレッド(3000万〜4000万ノード相当)、定跡なし、投了値なし、引分手数なし
で、87-3-10(100局、勝率89%)でした
https://i.imgur.com/XQv9RXF.jpg
ほぼAlphazeroに追いついたかな >>396
elmo側ってYO4.53とかじゃなかった? そろそろ自然な弱さのソフトは出来ないのか?
24中級程度の棋譜から機械学習して評価関数をつくる
こんな方法で可能な気がするが
プログラミングが全く分からないので自分で出来ないのが残念 自然な弱さのソフトを作るのはたぶん不可能。
何が自然なのかは使う人の匙加減でしかないから。
何が自然なのかを定義できれば可能。 プログラミングが分からないとか言い訳すんな死ね
プログラミング知らなくても言ってることぐらい実施可能やぞ死ね
それやっても自然な弱さにはならんぞ死ね
弱いだけでいいならuuun見れば分かるだろ死ね 自然な弱さがどんなもんか知らんけど最新評価関数からdepth2で何十億か教師作ってゼロから学習したらまあまあいい感じになるんじゃね? 普通に探索する限り、弱い評価関数作っても、変な大局観な終盤だけ鬼強のソフトが出来るだけだわな。 この手の輩はたとえ苦労して作っても
これは俺の求める自然さではないと言い出すから相手しない方がいい
せめて自然を定量化する方法を提示してくれないと >>397
4.53がもう公開されてないから仕方なく代用した >>390,396
優秀
>>397
alphazeroと対局したのは4.73だね
一手約21億ノード GW3って結局深い読みでも強いんだな。やねうら王、godwhale5.0.5よりも
完全に短時間特化かと思ってた >>405
やねうらベースの本家よりnpsが出る点もあって、若干強いと思っている。
1秒対局で少し試したら強かった(有意差が出るほどは試していない) 自然な弱さとかネット将棋で格下と指せばいいだけやん ゲームのランク調整的な
リアルタイム処理やな
難しそうだけどできるんでねか >>398
自分でできないなら、できる人に発注すればよろしいでしょう。
・・・
「24中級程度の棋譜から機械学習して評価関数をつくる」
この評価関数を作ってくれるよう発注するだけなら、いくらかはわかりませんが、いると思いますよ。 >>398
お金出せばやるやつ居るだろ
無料でってなら甘えんな >>407 下記のページの将棋エンジン(探索部)の項目の
YaneuraOu-whale6_Dittoの必要な方をダウンロードして
将棋所 or ShogiGUIにエンジン登録してエンジン設定の
項目の中のNNUEWhaleVersionを6から3へ変更する
http://www.mafujyouseki.com/article/455142113.html >>418
2スレ 一手0.1秒(数万ノード程度)だとwhale3が有意差あって強そう
1500万ノード程度だと検証してないので分からない
nn20180608-whale3 91-6-71 nn20180608-whale6 定跡なし
対局数168 勝率56% >>416
NNUE WHALE1も可能であればお願いします。ohga氏のものと比較したい boltはwslでperfコマンドが動かなかったので今日は挫折
llvmリポジトリのcloneとビルドが入るので下準備に1時間以上かかるので注意 >>422
YaneuraOu-whale6_Dittoを使えばwhale1からwhale6まで変更できる >>422
確かにそうなんですが、npsが低いと言われると少しなー、と >>398
自己レス 今現在の棋力QQR(NPS3000K程度)に対して
平手→勝てるわけがない 角落ち→勝ったことがある 飛車落ち→そこそこ勝てる
毎日駒落ちで鍛えてもらっているので自分が必要としているわけではない
ボナンザが出始めた頃遠山が将来的には初級者から有段者まで丁度よい練習相手に
ソフトがなれれば理想的と語っていたのが印象的で今現在ならそろそろ可能では?
と思い軽い気持ちで自然な弱さの表現でコメしてしまった
気分を害された方が多かったようで申し訳ない
ただ死ぬかどうかは50年ぐらい考えて決めたいと思います >>426
一手どのくらいのノード数で角落ちで勝てる? >>417
いままでGW3が何故いいのか理解してなかったけど今回設定変更してみたら
確かに強くてうれしくなった!
https://imgur.com/wfykYoC >>426
その手合割だとプロ級かアマトップクラスだと思われるが
そこより落ちるアマ高段クラスで勝てているなら
今のソフトにおける駒落ちの課題とかの情報を出してもらいたいな NPS3000K程度で5秒設定
勝ったことがあるなので勝てるではないですw 一手1500万ノードで飛車落ちでそれなりに勝てるならアマ高段はあるか
まさか元奨だったりする? 平手で勝てるのはボナンザまで
ボナンザから駒落ちで棋力向上に励んできたのでソフト特有の癖のような感じを把握してるかも
自分から勝ちに行かなければ基本焦れて無理攻めしてくる
ひたすら手厚く受ければ飛車落ちまではアマ有段なら勝てる ボナンザとかかなりノード数少なくないと勝てる気がしないわ
同じ時間同士ならちょうどプロくらいの棋力なわけだし 切り合いだとマズイという事だから、すでに普通に指したらアカンと。
手待ちで暴発させる系だな そういやむかし真吾おじさんってのがいたな(遠い目) プロでも同じ持ち時間だと平手で勝ち越せるのはBonanza6程度までじゃないの
一般家庭にもあるi7の8スレで同じ持ち時間でやったとしてだが 2枚落ちで以下の対戦させたら上手が2連勝w
上手:NNUE0608Kai GW3
下て:GPSfish 0.2.1+r2837
下手は1秒、上手は5秒の時間設定
https://imgur.com/fyOBvzU
以前も考慮時間にハンデつけると弱い方のコンピュータソフトでも勝てることは
知っていたけど2枚落ちで互角の持ち時間だと勝てるわけないので下手1秒の
ハンデつけたら上手は楽勝という恐ろしい結果になった。
コンピュータソフト相手に駒落ち定跡使わずに戦ったら勝てるアマチュアは
いないような気がする・・・・ イメージのアップロード初心者のためURLがおかしかった気がする。
https://i.imgur.com/fyOBvzU.png >>436
ボナ6が奨励会初段ぐらいだっけ?
だとするとロートルのC2だと勝ち越せるかも怪しい お強い人のコメントだったのね。
そんなに強いんなら、最善手じゃなくて、2〜3番手を指させるようにしたら、平手で勝てるかもしれないね。 ■ このスレッドは過去ログ倉庫に格納されています