▲コンピュータ将棋スレッド128
■ このスレッドは過去ログ倉庫に格納されています
調査報告テンプレート
【エンジン】
【勝敗】
【持ち時間】
【CPU】
【OS】
【メモリー】
【思考条件】
【特記事項】
例:
【エンジン】技巧2、やねうら王4.55(elmo-qhapaq評価関数)
【勝敗】40-5-55
【持ち時間】1手5秒
【CPU】Intel Core i7-6950X 定格 (HT ON)
【OS】Windows10 64bit
【メモリー】16GB
【思考条件】Threads=20、NarrowBook=ON、USI_Hash=256,USI_Ponder=OFF など
【特記事項】使用定跡や感想とかなんでも
対戦させる場合でよく間違っている人のケース
※Ponder=OFFにすること
ここを忘れてる人多い
定跡のONOFFも忘れずに 【悲報】suimon,YouTuberのクロノさんに敗れる
suimonのIDってなんですか? apery評価関数が次のWCSCまで最強の座に居座るかと思いきやapery qhapaqが登場して
さらに透。さんがR4200の評価関数を作成とか凄い。
ビットコイン並みのインフレやな >>8
透。さんのTwitter垢分かりますか?
教えてください<(_ _)> twitterは垢消したみたい。
今はブログがやってる 何でもいいけどよぉ
強いと言うからには定量的な実験してるんだろうな? 透。さんに関してはtamore,rereが強い強いって言ってたけど
実際公開された後調べてみても強かったからまあ確からしいんじゃない しかしお前らって、誰かが強いの出来たと言ったらすぐ信じるんだな。本当に強かったらfloodgateに流すだろ。 R4200とやらをなんとか公開して欲しい
yaselmoに7割勝てるなんてすごい 透。はニコ生の公式将棋放送ミラーして、放送URL削除されたw floodgateでバージョンとCPUを名前にして100戦することを条件に使用を許諾する
水門ウェアとかつくってみたらどうだろう 前はspecとソフト名毎回表示してたが、specにまでケチつける輩が発生した。
なんのメリットもないので非公表にした。
いまだにspecにケチつける感覚が全く理解できない。 ソフトが強いのかそれともハードが強いのかわからないと
なんとなく面白みが半減すると思うんだよな ソフトがほぼ同一レベルの相性じゃんけん大会や指運大会となった今、
むしろ争点はハード戦争の時代にまた舞い戻ったような気もする >>11
302局 219勝 83敗 引き分け9
勝率: 0.7251655629139073
標準誤差: 0.025753242806821414
95% 信頼区間 [0.6754966887417219, 0.7748344370860927]
相対イロレーティング: 168.5464089856178
標準誤差: 22.447496049866377
95% 信頼区間 [127.36163669336156, 214.68277788156257]
yaselmo R4064+168=R4232
あとブログにスクショあったよ てか透のブログ読むと、Aperypaqに勝率54%じゃないか(笑) Apery_sdt5 R4130
Aperypaq +R50=R4180
透。 Aperypaq 勝率54%=+R30 R4180+30=R4210
概ね合ってるけど? いままでyaselmoだったけどこれからはAperypaq相手に勝率65%目指そうってとこなのかな? 苦しいなー
うちのAperelmoは、めっちゃくちゃ検討用には向いてるんだけどなー
検討用は、人造棋士18号が優秀だから、そっちで頑張ってもらうか。 もう段々流れが読めてきたな
今後はAperypaq相手に勝率60%だの、いやそれよりこっちが勝ち越しただのと、もう個々の相性でどれが一番か分からん状態が続く
→ 次の選手権でそれらを一蹴するR100高いソフトが出る
→ 「おいおい、こりゃスゲー!」といてるそばから、更にR100高いブレンド関数が出来る
→ そのブレンド関数相手に、相性で勝ったり負けたり、どれが一番か分からん状態が続く
→ 次のSDTでそれらを一蹴するR100高いソフトが出る
この繰り返しになるんだろう 次はやねさんがAWSにお金をじゃぶじゃぶつぎ込んだめちゃくちゃ強いのが登場して、満を持して優勝という気がする 次のWCSCはやねさん出ないよ。
来年の電王トナメはどうなるんだろ、ドワンゴに大会開催するかどうかも怪しくないか >>32
電王トーナメントの開発者インタビューでやねうらおが「来年ドワンゴがあれば」という発言が笑えなくなってくるとはな… 110億局面学習6日目の朝
https://imgur.com/DQvQw6s
フォルダ作ってなかったよてへ >>34
その状態からnewevalフォルダ作成して
EvalSaveDir neweval
test evalsave
とすればどう? レート測るとレートが落ちていくので4200以下になっていくw
自己申告の4200がキメラで誕生するし >>35
学習前に読み込まれたevalが保存されただけたっだよ
まあ、しょうかないね。しょうがないね >>37
learnコマンドで評価関数のパラメーター自体を書き換えているので学習前の値がファイルに書き出されることはないよ。
仮に、学習前の値が書き出されるとしたら、それは再度学習前のファイルを読み直していることになるけども、evaldirが変更にならない限り、1度しか読み込まない。 12スレッドで計測してるそうですね。
ノード4000万越えて計測していれば、かなり正確かと思う。
yaselmo 以外にも最低2ソフトくらいは対戦させて推定Rだしたほうが良いような。
tamoreよりrereのほうが強いのは前々から知ってました。
作成した人でも計測が難しいのでしょう。
yaselmoに対して70%越えは凄いですね。
こちらの計測では
Aperey sdt5-y479 vs yaselmo-y479 (ノード5000万越え/200局)が60%強でした。 山本が姫路のイベント出た時に紹介のネーム板に山本アマチュアって書かれててワロタ
芸人のヤナギブソンさんはアマチュアとは書かれてなかったのに
山本は連盟から嫌がらせ受けてるねwww >>39
yaselmoには7割こえても、それ以外、tamoreやその他のキメラに勝率が落ちるので、
結局は総合的なレートは下がっている。キメラは基本的にある特定のものに強いだけの
偏ったものが出来る。最低7つ位の強いソフトやキメラと対局して平均勝率を見ないと、
2つ位のソフトだけでは得意不得意があてにならないので意味がない。キメラ検証経験
者より。 よく見ると〇〇王さんがいますね
110億学習させてるんですが10億毎にnew_evilに上書きされるのは合ってます? 全うに評価関数作成しても相性問題出ることあるし
キメラして本当に強くなることあるし実際確かめて見ないことには分からない >>39
人造棋士18号さんのyaselmoに40戦3敗はマジだったが、あんなの相性問題の最たるも
のだよ。ってツイッターにあったが、まさに相性のいい見本。何々に勝率何割は、意味が
ない。 もはやいくらレートが上がろうが世間は見向きもしない
評価値の最適化なんて技術的な価値がないし
名人倒したプログラマは引退に追い込まれて稼いだ金も2000万くらいとしょぼい
人間のプロは相変わらず年間賞金数億レベルなのにな 結局個人だと限界があるから蟲毒の人やuuunuuunさんの検証を待たないと分からない。
ポナンザですら強くなったかと思いきや他のソフトと対戦させたら勝利上がってなかったことがあったし。
キメラかどうかは関係なく相性問題が出てくる運命 3駒もそろそろ限界っぽいし >>42
「意味がない」は以前自分もそう思った。
R測る時、最低20以上のソフトと対戦させてる。(4局1セットで人間のR測定のように)
yaselmoとtamore 4060程度 / rere 4120程度が自身の計測。
Aprey-sdt5-yは(ハード買い替え中の為)未測定。
rereに関しては格下ソフトに取りこぼしが少ない。
どうして、いまだに特定のソフトとの対戦のみでR算出するのか理解に苦しむ。
だがyaselmoに常時70%越えは凄いとおもうけど。
前のソフトの検証した結果、透。氏の推定Rについてはある程度近い提示とおもっている。
計測してはみたいけど、公開しないのかな。 蟲毒の人とuuunuuunさんに事前検証をお願いしてから公開すれば情報が錯綜しないかと ここの住人と同じでPC持っててライブラリの使用だけ出来る素人(言い方が悪いけど悪意はない)が
個人で公開されたライブラリなど使って誰でも出来る事をやってる
そして計測のお手伝いもして貢献もしてるのに
その個人ブログで書いてる事に文句をつけるのは理解できない
単にキメラだけして適当な計測を当たり前のように言ってもね
人造棋士が40-3だったとして、それこそ相性問題の確たるものとして
開発者なんだから根拠を示すべきじゃない?
それを素人に被せるのは、やっかみでしかないと思うけど
相性問題が無いとは思わないが全ての物に勝ち越すけど勝率がやや悪い
その比較対象のレートも確定しているものじゃないんだから不満なら計測に参加してあげればいい
素人が個人で誰でも出来る事やってるのに勘違いしてる人多すぎない? というか今の将棋ソフト開発者全員が素人ってかアマチュアやん…
検定者を安易に素人呼ばわりとかお前馬鹿か 計測に参加したい気持ちはあるが、R測定の方法が違うので時間がかかり、迷惑がかかる恐れがある。
単なるお遊びなんだが、計測に期限とかあったら仕事にまで支障がでそう。
主流計測の3倍は時間喰うとおもう。
floodgateとオリジナルbookの作成に時間が必要で、そっちがメイン。
ちなみにbook対決で、対 まふ横歩取り(改)72% / 対 C-book 2017 70% まではいったが、更に強い評価関数
使ったら5%-7%勝率落ちた・・・book対決 7日程度試みたが、夢中になり過ぎたため現在中断。 定跡って結局試合前に時間をかけていい手をたくさん計算しておくってことだから
そのうち定跡無しの対局がスタンダードになりそう >>42
キメラの元ネタとの計測は相性問題出やすいに決まってるよね。
なるべく異系統のソフトと計測しないと。
そういう意味で技巧2は非常に貴重。 >>56
主催者提供定跡が落としどころだろうが、ハニーワッフルのような振り飛車特化が出来なくなるね。
それもつまらないような。 そもそもソフトの序盤なんて人の後追いだからつまらんわ TCECのsuperfinalは62回戦終了してHoudiniの10勝4敗48分で進行しているが、
superfinalで3シーズンぶりかな?でKomodoが後手番で1勝した(52回戦)
その時のチャット見たかったな 技巧2も読み太もちょっとレート差が離れてるのがね。
ポナンザは結局公開されないし >>38
yaneuraouは11月25日のコミット入りをビルドしたもの。sse42。
楽しみに朝起きたら
Error : save_eval() failed
と出てたので「慌てるのはまだ早い・・」と念じながら、
とりあえず自分でevalsaveフォルダ作って
test evalsave
すると画像の通りCheck Sumが違ってしまっている。
test evalsaveで何故か読み込まれちゃったのかなあ
みんな気をつけてね。俺だけかorz そもそもフルスクラッチ勢がライブラリそのまま勢にすらフルぼっこされる大会に競技性ってあるの?って話だな 有志が100億局面ファイルで技巧2を鍛え直してくれたら良いんだろうけどね
あれを技巧2の学習用に変換するスクリプトがあればシボレー勢がやってくれるはず みんな好き勝手バラバラの事書いてて匿名掲示板らしくて良い。
というわけで俺はaperyとqhapaqの50%キメラの続報を落書きいたす。
前回R140差?ってくらい妙にyaselmoに勝ち越してしまったので
今週は日によって色々と適当に戦わせながら放置した。
ソフトはaperyとqhapaqの50%キメラ
思考時間2秒・NPSは中盤で4Mくらい(ukamuseはもっと低い)
対apery_sdt5
126-15-102
対aperypaq
145-12-141
対ukamuse
225-2-7
対yaselmo
172-12-106
今回は比較的まともそうなデータになった。
これをみるとキメラは中々強そうだが、もちろんこんな匿名掲示板の書き込みを信じる必要はない。 これだけキメラで強くなったり相性問題があったりするところをみると
本当は三駒に必要な教師局面数って数千億とかなのかもな >>67
3年前のポナンザの8億局面で目ん玉飛び出てたときが懐かしいレベル 技巧2も110億局面で再学習したらelmo超えたりする事もありえる やねうら王にかずさんによるMATE_ENGINE(たぬき詰め)のバグ修正がマージされてる 【ひろゆき氏がニコ動凋落の原因を指摘】
http://blogos.com/article/262404/
・過去
ユーザーを見ている誰かに判断権限を持たせる。
↓
誰かがユーザーが喜ぶサービスを企画する
↓
社内事情を経営陣がなんとかする
↓
ユーザーが喜ぶサービスが世に出る。
↓
ユーザー喜ぶ
・現在
ユーザーを見ている人に権力がない。
↓
誰もユーザーが喜ぶサービスを企画しない
↓
ユーザーを見ていない経営陣がやりたいことを企画する
↓
ユーザーが喜ばないサービスが世に出る
↓
ユーザー喜ばない >>68
手の一致率もロス関数に入れた方が良い
局面評価でも正則化が行われる、なおnnの場合。
dlshogi
SL policyの出力のsoftmax_cross_entropyと
Value networkの出力のsigmoid_cross_entroyの和を損失として、SGDで学習する。
Value network単体とマルチタスク学習のValue networkの出力では、
マルチタスク学習の方が良い一致率になっている。
http://tadaoyamaoka.hatenablog.com/entry/2017/06/08/000040 定跡で勝負が決まる現状が好ましくない
しかも開発者じゃない「まふ定跡」で勝敗が決定する
5月のelmo程度の強さでも今の現状ならば定跡次第で優勝してしまう
やねうら王ライブラリで出場し、それだけで入賞してしまう
強く出来ない開発者ばかり(アピール文章には適当に書けばいいし)
ほぼ中身やねうら王で出場して入賞できるし 定跡進行に乗ってしまっているかは、ノータイムの応手かどうかで判定できそうだから小細工できそうじゃね? 以前はライブラリ制限で3つまでとかだったんでしょ
このままだと次回大会もやねうら王系統が定跡スナイプの優勝争いとなる WCSCは金払って参加する大会だから問題ないでしょう。
肝心の電王トーナメントはそもそも来年やるか分からない状態じゃない? あとは、マニアックな人だけが続ける競技となる
しかし、コンピュータの残す棋譜の価値は落ちることはないし、今後も重宝されるだろう ニコニコ動画が本格的にヤバくなってきたからな
叡王戦もあと何年もつのか分からない >>80
資金力でyoutubeに勝てるわけないし、もともと衰退するのはあのひろゆきも著書で予測していた イケメン藤田社長はエンジニアを大切にするし、ネズミみたいな顔の川上に未来はないかも >>82
サイバーエージェントの藤田は文系営業マン上がり。
川上は文系ディスってるし、川上の方が技術者よりやろ。
経営手腕は知らんが。 西尾明 @nishio1979
我慢できず7980XEを購入した。楽しみ。 >>85
すごいなあ、でもソフトでも研究する棋士からすれば棋具と同じくらい大事か 川上とかいうシーマンみたいな奇形生物はもう終わっただろ 技術者なのにエンタメに走ったのが敗因
たまたま初期に集客力のあるユーザーが集まっただけで
ドワンゴ自体は一貫して寒かった まあabemaもabemaでミスったらその場で怒号が飛ぶ職場だけど >>74
>今の現状ならば
Infoseekマルチ翻訳にかけると
If it is the present present conditions
馬から落馬してます 今一番強い疑惑あるのってaperyと河童のキメラだっけ? いや、カパックの作者が公開したaperypaqが公開されてるもののの中で一番強い。
キメラじゃなくてapery sdt5を再学習させたもの 上に出てるデータでは一応そうだね
ていうかAperyとapreypaqのキメラ周辺が怪しいと睨んでいる 例の110億教師で作った評価関数とaperypaqを7:3で混ぜたやつが中々強くて
tanuki-に大幅に勝ち越せる可能性もあるかとちょっと期待してる もうponanza亡き今、電王トーナメントはライブラリ勢のじゃんけん大会なんでもう終わってくれてもいいよ
これから面白くなっていくのはハード無差別級の世界コンピュータ将棋選手権の方だと思う ハード無差別はくじらちゃんみたいなのがいるからそこは面白いよな ■ このスレッドは過去ログ倉庫に格納されています