▲コンピュータ将棋スレッド128
■ このスレッドは過去ログ倉庫に格納されています
Apery_sdt5 R4130
Aperypaq +R50=R4180
透。 Aperypaq 勝率54%=+R30 R4180+30=R4210
概ね合ってるけど? いままでyaselmoだったけどこれからはAperypaq相手に勝率65%目指そうってとこなのかな? 苦しいなー
うちのAperelmoは、めっちゃくちゃ検討用には向いてるんだけどなー
検討用は、人造棋士18号が優秀だから、そっちで頑張ってもらうか。 もう段々流れが読めてきたな
今後はAperypaq相手に勝率60%だの、いやそれよりこっちが勝ち越しただのと、もう個々の相性でどれが一番か分からん状態が続く
→ 次の選手権でそれらを一蹴するR100高いソフトが出る
→ 「おいおい、こりゃスゲー!」といてるそばから、更にR100高いブレンド関数が出来る
→ そのブレンド関数相手に、相性で勝ったり負けたり、どれが一番か分からん状態が続く
→ 次のSDTでそれらを一蹴するR100高いソフトが出る
この繰り返しになるんだろう 次はやねさんがAWSにお金をじゃぶじゃぶつぎ込んだめちゃくちゃ強いのが登場して、満を持して優勝という気がする 次のWCSCはやねさん出ないよ。
来年の電王トナメはどうなるんだろ、ドワンゴに大会開催するかどうかも怪しくないか >>32
電王トーナメントの開発者インタビューでやねうらおが「来年ドワンゴがあれば」という発言が笑えなくなってくるとはな… 110億局面学習6日目の朝
https://imgur.com/DQvQw6s
フォルダ作ってなかったよてへ >>34
その状態からnewevalフォルダ作成して
EvalSaveDir neweval
test evalsave
とすればどう? レート測るとレートが落ちていくので4200以下になっていくw
自己申告の4200がキメラで誕生するし >>35
学習前に読み込まれたevalが保存されただけたっだよ
まあ、しょうかないね。しょうがないね >>37
learnコマンドで評価関数のパラメーター自体を書き換えているので学習前の値がファイルに書き出されることはないよ。
仮に、学習前の値が書き出されるとしたら、それは再度学習前のファイルを読み直していることになるけども、evaldirが変更にならない限り、1度しか読み込まない。 12スレッドで計測してるそうですね。
ノード4000万越えて計測していれば、かなり正確かと思う。
yaselmo 以外にも最低2ソフトくらいは対戦させて推定Rだしたほうが良いような。
tamoreよりrereのほうが強いのは前々から知ってました。
作成した人でも計測が難しいのでしょう。
yaselmoに対して70%越えは凄いですね。
こちらの計測では
Aperey sdt5-y479 vs yaselmo-y479 (ノード5000万越え/200局)が60%強でした。 山本が姫路のイベント出た時に紹介のネーム板に山本アマチュアって書かれててワロタ
芸人のヤナギブソンさんはアマチュアとは書かれてなかったのに
山本は連盟から嫌がらせ受けてるねwww >>39
yaselmoには7割こえても、それ以外、tamoreやその他のキメラに勝率が落ちるので、
結局は総合的なレートは下がっている。キメラは基本的にある特定のものに強いだけの
偏ったものが出来る。最低7つ位の強いソフトやキメラと対局して平均勝率を見ないと、
2つ位のソフトだけでは得意不得意があてにならないので意味がない。キメラ検証経験
者より。 よく見ると〇〇王さんがいますね
110億学習させてるんですが10億毎にnew_evilに上書きされるのは合ってます? 全うに評価関数作成しても相性問題出ることあるし
キメラして本当に強くなることあるし実際確かめて見ないことには分からない >>39
人造棋士18号さんのyaselmoに40戦3敗はマジだったが、あんなの相性問題の最たるも
のだよ。ってツイッターにあったが、まさに相性のいい見本。何々に勝率何割は、意味が
ない。 もはやいくらレートが上がろうが世間は見向きもしない
評価値の最適化なんて技術的な価値がないし
名人倒したプログラマは引退に追い込まれて稼いだ金も2000万くらいとしょぼい
人間のプロは相変わらず年間賞金数億レベルなのにな 結局個人だと限界があるから蟲毒の人やuuunuuunさんの検証を待たないと分からない。
ポナンザですら強くなったかと思いきや他のソフトと対戦させたら勝利上がってなかったことがあったし。
キメラかどうかは関係なく相性問題が出てくる運命 3駒もそろそろ限界っぽいし >>42
「意味がない」は以前自分もそう思った。
R測る時、最低20以上のソフトと対戦させてる。(4局1セットで人間のR測定のように)
yaselmoとtamore 4060程度 / rere 4120程度が自身の計測。
Aprey-sdt5-yは(ハード買い替え中の為)未測定。
rereに関しては格下ソフトに取りこぼしが少ない。
どうして、いまだに特定のソフトとの対戦のみでR算出するのか理解に苦しむ。
だがyaselmoに常時70%越えは凄いとおもうけど。
前のソフトの検証した結果、透。氏の推定Rについてはある程度近い提示とおもっている。
計測してはみたいけど、公開しないのかな。 蟲毒の人とuuunuuunさんに事前検証をお願いしてから公開すれば情報が錯綜しないかと ここの住人と同じでPC持っててライブラリの使用だけ出来る素人(言い方が悪いけど悪意はない)が
個人で公開されたライブラリなど使って誰でも出来る事をやってる
そして計測のお手伝いもして貢献もしてるのに
その個人ブログで書いてる事に文句をつけるのは理解できない
単にキメラだけして適当な計測を当たり前のように言ってもね
人造棋士が40-3だったとして、それこそ相性問題の確たるものとして
開発者なんだから根拠を示すべきじゃない?
それを素人に被せるのは、やっかみでしかないと思うけど
相性問題が無いとは思わないが全ての物に勝ち越すけど勝率がやや悪い
その比較対象のレートも確定しているものじゃないんだから不満なら計測に参加してあげればいい
素人が個人で誰でも出来る事やってるのに勘違いしてる人多すぎない? というか今の将棋ソフト開発者全員が素人ってかアマチュアやん…
検定者を安易に素人呼ばわりとかお前馬鹿か 計測に参加したい気持ちはあるが、R測定の方法が違うので時間がかかり、迷惑がかかる恐れがある。
単なるお遊びなんだが、計測に期限とかあったら仕事にまで支障がでそう。
主流計測の3倍は時間喰うとおもう。
floodgateとオリジナルbookの作成に時間が必要で、そっちがメイン。
ちなみにbook対決で、対 まふ横歩取り(改)72% / 対 C-book 2017 70% まではいったが、更に強い評価関数
使ったら5%-7%勝率落ちた・・・book対決 7日程度試みたが、夢中になり過ぎたため現在中断。 定跡って結局試合前に時間をかけていい手をたくさん計算しておくってことだから
そのうち定跡無しの対局がスタンダードになりそう >>42
キメラの元ネタとの計測は相性問題出やすいに決まってるよね。
なるべく異系統のソフトと計測しないと。
そういう意味で技巧2は非常に貴重。 >>56
主催者提供定跡が落としどころだろうが、ハニーワッフルのような振り飛車特化が出来なくなるね。
それもつまらないような。 そもそもソフトの序盤なんて人の後追いだからつまらんわ TCECのsuperfinalは62回戦終了してHoudiniの10勝4敗48分で進行しているが、
superfinalで3シーズンぶりかな?でKomodoが後手番で1勝した(52回戦)
その時のチャット見たかったな 技巧2も読み太もちょっとレート差が離れてるのがね。
ポナンザは結局公開されないし >>38
yaneuraouは11月25日のコミット入りをビルドしたもの。sse42。
楽しみに朝起きたら
Error : save_eval() failed
と出てたので「慌てるのはまだ早い・・」と念じながら、
とりあえず自分でevalsaveフォルダ作って
test evalsave
すると画像の通りCheck Sumが違ってしまっている。
test evalsaveで何故か読み込まれちゃったのかなあ
みんな気をつけてね。俺だけかorz そもそもフルスクラッチ勢がライブラリそのまま勢にすらフルぼっこされる大会に競技性ってあるの?って話だな 有志が100億局面ファイルで技巧2を鍛え直してくれたら良いんだろうけどね
あれを技巧2の学習用に変換するスクリプトがあればシボレー勢がやってくれるはず みんな好き勝手バラバラの事書いてて匿名掲示板らしくて良い。
というわけで俺はaperyとqhapaqの50%キメラの続報を落書きいたす。
前回R140差?ってくらい妙にyaselmoに勝ち越してしまったので
今週は日によって色々と適当に戦わせながら放置した。
ソフトはaperyとqhapaqの50%キメラ
思考時間2秒・NPSは中盤で4Mくらい(ukamuseはもっと低い)
対apery_sdt5
126-15-102
対aperypaq
145-12-141
対ukamuse
225-2-7
対yaselmo
172-12-106
今回は比較的まともそうなデータになった。
これをみるとキメラは中々強そうだが、もちろんこんな匿名掲示板の書き込みを信じる必要はない。 これだけキメラで強くなったり相性問題があったりするところをみると
本当は三駒に必要な教師局面数って数千億とかなのかもな >>67
3年前のポナンザの8億局面で目ん玉飛び出てたときが懐かしいレベル 技巧2も110億局面で再学習したらelmo超えたりする事もありえる やねうら王にかずさんによるMATE_ENGINE(たぬき詰め)のバグ修正がマージされてる 【ひろゆき氏がニコ動凋落の原因を指摘】
http://blogos.com/article/262404/
・過去
ユーザーを見ている誰かに判断権限を持たせる。
↓
誰かがユーザーが喜ぶサービスを企画する
↓
社内事情を経営陣がなんとかする
↓
ユーザーが喜ぶサービスが世に出る。
↓
ユーザー喜ぶ
・現在
ユーザーを見ている人に権力がない。
↓
誰もユーザーが喜ぶサービスを企画しない
↓
ユーザーを見ていない経営陣がやりたいことを企画する
↓
ユーザーが喜ばないサービスが世に出る
↓
ユーザー喜ばない >>68
手の一致率もロス関数に入れた方が良い
局面評価でも正則化が行われる、なおnnの場合。
dlshogi
SL policyの出力のsoftmax_cross_entropyと
Value networkの出力のsigmoid_cross_entroyの和を損失として、SGDで学習する。
Value network単体とマルチタスク学習のValue networkの出力では、
マルチタスク学習の方が良い一致率になっている。
http://tadaoyamaoka.hatenablog.com/entry/2017/06/08/000040 定跡で勝負が決まる現状が好ましくない
しかも開発者じゃない「まふ定跡」で勝敗が決定する
5月のelmo程度の強さでも今の現状ならば定跡次第で優勝してしまう
やねうら王ライブラリで出場し、それだけで入賞してしまう
強く出来ない開発者ばかり(アピール文章には適当に書けばいいし)
ほぼ中身やねうら王で出場して入賞できるし 定跡進行に乗ってしまっているかは、ノータイムの応手かどうかで判定できそうだから小細工できそうじゃね? 以前はライブラリ制限で3つまでとかだったんでしょ
このままだと次回大会もやねうら王系統が定跡スナイプの優勝争いとなる WCSCは金払って参加する大会だから問題ないでしょう。
肝心の電王トーナメントはそもそも来年やるか分からない状態じゃない? あとは、マニアックな人だけが続ける競技となる
しかし、コンピュータの残す棋譜の価値は落ちることはないし、今後も重宝されるだろう ニコニコ動画が本格的にヤバくなってきたからな
叡王戦もあと何年もつのか分からない >>80
資金力でyoutubeに勝てるわけないし、もともと衰退するのはあのひろゆきも著書で予測していた イケメン藤田社長はエンジニアを大切にするし、ネズミみたいな顔の川上に未来はないかも >>82
サイバーエージェントの藤田は文系営業マン上がり。
川上は文系ディスってるし、川上の方が技術者よりやろ。
経営手腕は知らんが。 西尾明 @nishio1979
我慢できず7980XEを購入した。楽しみ。 >>85
すごいなあ、でもソフトでも研究する棋士からすれば棋具と同じくらい大事か 川上とかいうシーマンみたいな奇形生物はもう終わっただろ 技術者なのにエンタメに走ったのが敗因
たまたま初期に集客力のあるユーザーが集まっただけで
ドワンゴ自体は一貫して寒かった まあabemaもabemaでミスったらその場で怒号が飛ぶ職場だけど >>74
>今の現状ならば
Infoseekマルチ翻訳にかけると
If it is the present present conditions
馬から落馬してます 今一番強い疑惑あるのってaperyと河童のキメラだっけ? いや、カパックの作者が公開したaperypaqが公開されてるもののの中で一番強い。
キメラじゃなくてapery sdt5を再学習させたもの 上に出てるデータでは一応そうだね
ていうかAperyとapreypaqのキメラ周辺が怪しいと睨んでいる 例の110億教師で作った評価関数とaperypaqを7:3で混ぜたやつが中々強くて
tanuki-に大幅に勝ち越せる可能性もあるかとちょっと期待してる もうponanza亡き今、電王トーナメントはライブラリ勢のじゃんけん大会なんでもう終わってくれてもいいよ
これから面白くなっていくのはハード無差別級の世界コンピュータ将棋選手権の方だと思う ハード無差別はくじらちゃんみたいなのがいるからそこは面白いよな このスレのみんなはsuimonが執筆した本買うの? aperyとaperypaqはremuで調べたらdiff ratioが0.001だったんで、キメラで合成しても強くなるかは疑問だなあ
それよりもaperypaqとponpokoをaperypaq65%位で合成した方が強くなると思うけど OmmGkNOc0
こんな奴ばっかだから自己計測の意味もない
uuunuuun基準の1000〜1500万ノード+対局結果のスクショ+棋譜ないと意味ない
自身あるなら、この条件でこんだけ勝ったよ〜みたいな自己主張の一段上が簡単なのになw ここは便所の落書きやぞ 突然怒りだしてどうしたんだ?
カッとなったときはなんたらかんたら >>103
なにカリカリしてるんだ?
そもそもまだtanuki-との対局結果は出ていないんだろうということが文から読み取れないか? 50手目くらいから千日手模倣になって205手目で千日手成立w
こんなん初めて見たわ。お互いに千日手をなるべく避けるようなアルゴリズムでも搭載してるのか?
Yane_Mob-sp1_E5-2670 vs. WesternLariat (2017-12-02 22:00)
http://wdoor.c.u-tokyo.ac.jp/shogi/view/2017/12/02/wdoor+floodgate-300-10F+Yane_Mob-sp1_E5-2670+WesternLariat+20171202220006.csa >>106
やねうら王の千日手は初期設定では評価値-1だから緩やかに避けるよ まともな計測もしないで7:3とか変な合成して喜んでるのってFC2の生ポ関数 合成全然詳しくないんだけど、7:3ってなにか変なの? WesternLariat流してる人って、12コアマシンかな? USIのヘッダーにオプションでCPUの種別を送信する項があればいいな
将棋所を使っていれば調べて送るようにできる
それをfloodgateで表示する 電王トナメで開発者同士で独自性の議論してた
時に半ギレしてた長髪っぽい人、あれ誰? カパックの高速化に貢献した人
だからやねうら王を高速化したというyorkieの辞退が納得できなかったのだろう
ところでyorkieの独自性ってどうだったの? 結果的に高速化なってただけで4駒出来てなく
アピールが、いわばデタラメ
中身やねうら王で出場して入賞していくエセ開発者ばかり 運営がソース読んで独自性なしとしたならまだしも調べてもいないのに突然独自性なしって話し出してソースは5ch なんだこいつら 高速化といっても色々だからなぁ・・・
コンパイルオプションで高速化しても独自性になるのだろうか アピール文章が意味ないのが、どうかと思うのです
審査もないですし >>107
なるほど.ってことは千日手の評価値をプラスにしておけば積極的に千日手狙いをする棋風になるのかな ぶっちゃけソフト開発を競技(ゲーム)にすること自体に無理がある
企業のコンペと似たような構造なのに、求められるのが実利ではなく競技性という矛盾
みんな巨人の肩に乗ってるのに、下駄を生産するやつ、それを履くやつ、草履自作するやつの区別に必死になってる なるほど最初から無理があるというのは分かる。
カパックチームの伊藤さんもトーナメント制な時点でエンターテイメントって言ってるし
厳密に強さを決める大会を行うなら、独自のプロトコルを策定、ソフトを提出させてサーバーで何千局と対戦を行えばいい やねさんがyorkieの高速化を取り入れてバージョンアップするってツイートしていなかったけか? 賞金を出す理由が放送で使うソフトの選定なんだから技術力で競えって言うのもおかしいような 激指や東大、AIやボナンザが切磋琢磨してる時代が一番面白かった
今は同じ家系ラーメンの中で一番うまいラーメンを決めるだけみたいなつまらん大会 世界コンピュータ将棋選手権の大幅ルール改定がメーリングリストで流れてきましたな
えびふらいとかが大きく影響ありそうだ ■ このスレッドは過去ログ倉庫に格納されています