▲コンピュータ将棋スレッド128
レス数が1000を超えています。これ以上書き込みはできません。
調査報告テンプレート
【エンジン】
【勝敗】
【持ち時間】
【CPU】
【OS】
【メモリー】
【思考条件】
【特記事項】
例:
【エンジン】技巧2、やねうら王4.55(elmo-qhapaq評価関数)
【勝敗】40-5-55
【持ち時間】1手5秒
【CPU】Intel Core i7-6950X 定格 (HT ON)
【OS】Windows10 64bit
【メモリー】16GB
【思考条件】Threads=20、NarrowBook=ON、USI_Hash=256,USI_Ponder=OFF など
【特記事項】使用定跡や感想とかなんでも
対戦させる場合でよく間違っている人のケース
※Ponder=OFFにすること
ここを忘れてる人多い
定跡のONOFFも忘れずに 【悲報】suimon,YouTuberのクロノさんに敗れる
suimonのIDってなんですか? apery評価関数が次のWCSCまで最強の座に居座るかと思いきやapery qhapaqが登場して
さらに透。さんがR4200の評価関数を作成とか凄い。
ビットコイン並みのインフレやな >>8
透。さんのTwitter垢分かりますか?
教えてください<(_ _)> twitterは垢消したみたい。
今はブログがやってる 何でもいいけどよぉ
強いと言うからには定量的な実験してるんだろうな? 透。さんに関してはtamore,rereが強い強いって言ってたけど
実際公開された後調べてみても強かったからまあ確からしいんじゃない しかしお前らって、誰かが強いの出来たと言ったらすぐ信じるんだな。本当に強かったらfloodgateに流すだろ。 R4200とやらをなんとか公開して欲しい
yaselmoに7割勝てるなんてすごい 透。はニコ生の公式将棋放送ミラーして、放送URL削除されたw floodgateでバージョンとCPUを名前にして100戦することを条件に使用を許諾する
水門ウェアとかつくってみたらどうだろう 前はspecとソフト名毎回表示してたが、specにまでケチつける輩が発生した。
なんのメリットもないので非公表にした。
いまだにspecにケチつける感覚が全く理解できない。 ソフトが強いのかそれともハードが強いのかわからないと
なんとなく面白みが半減すると思うんだよな ソフトがほぼ同一レベルの相性じゃんけん大会や指運大会となった今、
むしろ争点はハード戦争の時代にまた舞い戻ったような気もする >>11
302局 219勝 83敗 引き分け9
勝率: 0.7251655629139073
標準誤差: 0.025753242806821414
95% 信頼区間 [0.6754966887417219, 0.7748344370860927]
相対イロレーティング: 168.5464089856178
標準誤差: 22.447496049866377
95% 信頼区間 [127.36163669336156, 214.68277788156257]
yaselmo R4064+168=R4232
あとブログにスクショあったよ てか透のブログ読むと、Aperypaqに勝率54%じゃないか(笑) Apery_sdt5 R4130
Aperypaq +R50=R4180
透。 Aperypaq 勝率54%=+R30 R4180+30=R4210
概ね合ってるけど? いままでyaselmoだったけどこれからはAperypaq相手に勝率65%目指そうってとこなのかな? 苦しいなー
うちのAperelmoは、めっちゃくちゃ検討用には向いてるんだけどなー
検討用は、人造棋士18号が優秀だから、そっちで頑張ってもらうか。 もう段々流れが読めてきたな
今後はAperypaq相手に勝率60%だの、いやそれよりこっちが勝ち越しただのと、もう個々の相性でどれが一番か分からん状態が続く
→ 次の選手権でそれらを一蹴するR100高いソフトが出る
→ 「おいおい、こりゃスゲー!」といてるそばから、更にR100高いブレンド関数が出来る
→ そのブレンド関数相手に、相性で勝ったり負けたり、どれが一番か分からん状態が続く
→ 次のSDTでそれらを一蹴するR100高いソフトが出る
この繰り返しになるんだろう 次はやねさんがAWSにお金をじゃぶじゃぶつぎ込んだめちゃくちゃ強いのが登場して、満を持して優勝という気がする 次のWCSCはやねさん出ないよ。
来年の電王トナメはどうなるんだろ、ドワンゴに大会開催するかどうかも怪しくないか >>32
電王トーナメントの開発者インタビューでやねうらおが「来年ドワンゴがあれば」という発言が笑えなくなってくるとはな… 110億局面学習6日目の朝
https://imgur.com/DQvQw6s
フォルダ作ってなかったよてへ >>34
その状態からnewevalフォルダ作成して
EvalSaveDir neweval
test evalsave
とすればどう? レート測るとレートが落ちていくので4200以下になっていくw
自己申告の4200がキメラで誕生するし >>35
学習前に読み込まれたevalが保存されただけたっだよ
まあ、しょうかないね。しょうがないね >>37
learnコマンドで評価関数のパラメーター自体を書き換えているので学習前の値がファイルに書き出されることはないよ。
仮に、学習前の値が書き出されるとしたら、それは再度学習前のファイルを読み直していることになるけども、evaldirが変更にならない限り、1度しか読み込まない。 12スレッドで計測してるそうですね。
ノード4000万越えて計測していれば、かなり正確かと思う。
yaselmo 以外にも最低2ソフトくらいは対戦させて推定Rだしたほうが良いような。
tamoreよりrereのほうが強いのは前々から知ってました。
作成した人でも計測が難しいのでしょう。
yaselmoに対して70%越えは凄いですね。
こちらの計測では
Aperey sdt5-y479 vs yaselmo-y479 (ノード5000万越え/200局)が60%強でした。 山本が姫路のイベント出た時に紹介のネーム板に山本アマチュアって書かれててワロタ
芸人のヤナギブソンさんはアマチュアとは書かれてなかったのに
山本は連盟から嫌がらせ受けてるねwww >>39
yaselmoには7割こえても、それ以外、tamoreやその他のキメラに勝率が落ちるので、
結局は総合的なレートは下がっている。キメラは基本的にある特定のものに強いだけの
偏ったものが出来る。最低7つ位の強いソフトやキメラと対局して平均勝率を見ないと、
2つ位のソフトだけでは得意不得意があてにならないので意味がない。キメラ検証経験
者より。 よく見ると〇〇王さんがいますね
110億学習させてるんですが10億毎にnew_evilに上書きされるのは合ってます? 全うに評価関数作成しても相性問題出ることあるし
キメラして本当に強くなることあるし実際確かめて見ないことには分からない >>39
人造棋士18号さんのyaselmoに40戦3敗はマジだったが、あんなの相性問題の最たるも
のだよ。ってツイッターにあったが、まさに相性のいい見本。何々に勝率何割は、意味が
ない。 もはやいくらレートが上がろうが世間は見向きもしない
評価値の最適化なんて技術的な価値がないし
名人倒したプログラマは引退に追い込まれて稼いだ金も2000万くらいとしょぼい
人間のプロは相変わらず年間賞金数億レベルなのにな 結局個人だと限界があるから蟲毒の人やuuunuuunさんの検証を待たないと分からない。
ポナンザですら強くなったかと思いきや他のソフトと対戦させたら勝利上がってなかったことがあったし。
キメラかどうかは関係なく相性問題が出てくる運命 3駒もそろそろ限界っぽいし >>42
「意味がない」は以前自分もそう思った。
R測る時、最低20以上のソフトと対戦させてる。(4局1セットで人間のR測定のように)
yaselmoとtamore 4060程度 / rere 4120程度が自身の計測。
Aprey-sdt5-yは(ハード買い替え中の為)未測定。
rereに関しては格下ソフトに取りこぼしが少ない。
どうして、いまだに特定のソフトとの対戦のみでR算出するのか理解に苦しむ。
だがyaselmoに常時70%越えは凄いとおもうけど。
前のソフトの検証した結果、透。氏の推定Rについてはある程度近い提示とおもっている。
計測してはみたいけど、公開しないのかな。 蟲毒の人とuuunuuunさんに事前検証をお願いしてから公開すれば情報が錯綜しないかと ここの住人と同じでPC持っててライブラリの使用だけ出来る素人(言い方が悪いけど悪意はない)が
個人で公開されたライブラリなど使って誰でも出来る事をやってる
そして計測のお手伝いもして貢献もしてるのに
その個人ブログで書いてる事に文句をつけるのは理解できない
単にキメラだけして適当な計測を当たり前のように言ってもね
人造棋士が40-3だったとして、それこそ相性問題の確たるものとして
開発者なんだから根拠を示すべきじゃない?
それを素人に被せるのは、やっかみでしかないと思うけど
相性問題が無いとは思わないが全ての物に勝ち越すけど勝率がやや悪い
その比較対象のレートも確定しているものじゃないんだから不満なら計測に参加してあげればいい
素人が個人で誰でも出来る事やってるのに勘違いしてる人多すぎない? というか今の将棋ソフト開発者全員が素人ってかアマチュアやん…
検定者を安易に素人呼ばわりとかお前馬鹿か 計測に参加したい気持ちはあるが、R測定の方法が違うので時間がかかり、迷惑がかかる恐れがある。
単なるお遊びなんだが、計測に期限とかあったら仕事にまで支障がでそう。
主流計測の3倍は時間喰うとおもう。
floodgateとオリジナルbookの作成に時間が必要で、そっちがメイン。
ちなみにbook対決で、対 まふ横歩取り(改)72% / 対 C-book 2017 70% まではいったが、更に強い評価関数
使ったら5%-7%勝率落ちた・・・book対決 7日程度試みたが、夢中になり過ぎたため現在中断。 定跡って結局試合前に時間をかけていい手をたくさん計算しておくってことだから
そのうち定跡無しの対局がスタンダードになりそう >>42
キメラの元ネタとの計測は相性問題出やすいに決まってるよね。
なるべく異系統のソフトと計測しないと。
そういう意味で技巧2は非常に貴重。 >>56
主催者提供定跡が落としどころだろうが、ハニーワッフルのような振り飛車特化が出来なくなるね。
それもつまらないような。 そもそもソフトの序盤なんて人の後追いだからつまらんわ TCECのsuperfinalは62回戦終了してHoudiniの10勝4敗48分で進行しているが、
superfinalで3シーズンぶりかな?でKomodoが後手番で1勝した(52回戦)
その時のチャット見たかったな 技巧2も読み太もちょっとレート差が離れてるのがね。
ポナンザは結局公開されないし >>38
yaneuraouは11月25日のコミット入りをビルドしたもの。sse42。
楽しみに朝起きたら
Error : save_eval() failed
と出てたので「慌てるのはまだ早い・・」と念じながら、
とりあえず自分でevalsaveフォルダ作って
test evalsave
すると画像の通りCheck Sumが違ってしまっている。
test evalsaveで何故か読み込まれちゃったのかなあ
みんな気をつけてね。俺だけかorz そもそもフルスクラッチ勢がライブラリそのまま勢にすらフルぼっこされる大会に競技性ってあるの?って話だな 有志が100億局面ファイルで技巧2を鍛え直してくれたら良いんだろうけどね
あれを技巧2の学習用に変換するスクリプトがあればシボレー勢がやってくれるはず みんな好き勝手バラバラの事書いてて匿名掲示板らしくて良い。
というわけで俺はaperyとqhapaqの50%キメラの続報を落書きいたす。
前回R140差?ってくらい妙にyaselmoに勝ち越してしまったので
今週は日によって色々と適当に戦わせながら放置した。
ソフトはaperyとqhapaqの50%キメラ
思考時間2秒・NPSは中盤で4Mくらい(ukamuseはもっと低い)
対apery_sdt5
126-15-102
対aperypaq
145-12-141
対ukamuse
225-2-7
対yaselmo
172-12-106
今回は比較的まともそうなデータになった。
これをみるとキメラは中々強そうだが、もちろんこんな匿名掲示板の書き込みを信じる必要はない。 これだけキメラで強くなったり相性問題があったりするところをみると
本当は三駒に必要な教師局面数って数千億とかなのかもな >>67
3年前のポナンザの8億局面で目ん玉飛び出てたときが懐かしいレベル 技巧2も110億局面で再学習したらelmo超えたりする事もありえる やねうら王にかずさんによるMATE_ENGINE(たぬき詰め)のバグ修正がマージされてる 【ひろゆき氏がニコ動凋落の原因を指摘】
http://blogos.com/article/262404/
・過去
ユーザーを見ている誰かに判断権限を持たせる。
↓
誰かがユーザーが喜ぶサービスを企画する
↓
社内事情を経営陣がなんとかする
↓
ユーザーが喜ぶサービスが世に出る。
↓
ユーザー喜ぶ
・現在
ユーザーを見ている人に権力がない。
↓
誰もユーザーが喜ぶサービスを企画しない
↓
ユーザーを見ていない経営陣がやりたいことを企画する
↓
ユーザーが喜ばないサービスが世に出る
↓
ユーザー喜ばない >>68
手の一致率もロス関数に入れた方が良い
局面評価でも正則化が行われる、なおnnの場合。
dlshogi
SL policyの出力のsoftmax_cross_entropyと
Value networkの出力のsigmoid_cross_entroyの和を損失として、SGDで学習する。
Value network単体とマルチタスク学習のValue networkの出力では、
マルチタスク学習の方が良い一致率になっている。
http://tadaoyamaoka.hatenablog.com/entry/2017/06/08/000040 定跡で勝負が決まる現状が好ましくない
しかも開発者じゃない「まふ定跡」で勝敗が決定する
5月のelmo程度の強さでも今の現状ならば定跡次第で優勝してしまう
やねうら王ライブラリで出場し、それだけで入賞してしまう
強く出来ない開発者ばかり(アピール文章には適当に書けばいいし)
ほぼ中身やねうら王で出場して入賞できるし 定跡進行に乗ってしまっているかは、ノータイムの応手かどうかで判定できそうだから小細工できそうじゃね? 以前はライブラリ制限で3つまでとかだったんでしょ
このままだと次回大会もやねうら王系統が定跡スナイプの優勝争いとなる WCSCは金払って参加する大会だから問題ないでしょう。
肝心の電王トーナメントはそもそも来年やるか分からない状態じゃない? あとは、マニアックな人だけが続ける競技となる
しかし、コンピュータの残す棋譜の価値は落ちることはないし、今後も重宝されるだろう ニコニコ動画が本格的にヤバくなってきたからな
叡王戦もあと何年もつのか分からない >>80
資金力でyoutubeに勝てるわけないし、もともと衰退するのはあのひろゆきも著書で予測していた イケメン藤田社長はエンジニアを大切にするし、ネズミみたいな顔の川上に未来はないかも >>82
サイバーエージェントの藤田は文系営業マン上がり。
川上は文系ディスってるし、川上の方が技術者よりやろ。
経営手腕は知らんが。 西尾明 @nishio1979
我慢できず7980XEを購入した。楽しみ。 >>85
すごいなあ、でもソフトでも研究する棋士からすれば棋具と同じくらい大事か 川上とかいうシーマンみたいな奇形生物はもう終わっただろ 技術者なのにエンタメに走ったのが敗因
たまたま初期に集客力のあるユーザーが集まっただけで
ドワンゴ自体は一貫して寒かった まあabemaもabemaでミスったらその場で怒号が飛ぶ職場だけど >>74
>今の現状ならば
Infoseekマルチ翻訳にかけると
If it is the present present conditions
馬から落馬してます 今一番強い疑惑あるのってaperyと河童のキメラだっけ? いや、カパックの作者が公開したaperypaqが公開されてるもののの中で一番強い。
キメラじゃなくてapery sdt5を再学習させたもの 上に出てるデータでは一応そうだね
ていうかAperyとapreypaqのキメラ周辺が怪しいと睨んでいる 例の110億教師で作った評価関数とaperypaqを7:3で混ぜたやつが中々強くて
tanuki-に大幅に勝ち越せる可能性もあるかとちょっと期待してる もうponanza亡き今、電王トーナメントはライブラリ勢のじゃんけん大会なんでもう終わってくれてもいいよ
これから面白くなっていくのはハード無差別級の世界コンピュータ将棋選手権の方だと思う ハード無差別はくじらちゃんみたいなのがいるからそこは面白いよな このスレのみんなはsuimonが執筆した本買うの? aperyとaperypaqはremuで調べたらdiff ratioが0.001だったんで、キメラで合成しても強くなるかは疑問だなあ
それよりもaperypaqとponpokoをaperypaq65%位で合成した方が強くなると思うけど OmmGkNOc0
こんな奴ばっかだから自己計測の意味もない
uuunuuun基準の1000〜1500万ノード+対局結果のスクショ+棋譜ないと意味ない
自身あるなら、この条件でこんだけ勝ったよ〜みたいな自己主張の一段上が簡単なのになw ここは便所の落書きやぞ 突然怒りだしてどうしたんだ?
カッとなったときはなんたらかんたら >>103
なにカリカリしてるんだ?
そもそもまだtanuki-との対局結果は出ていないんだろうということが文から読み取れないか? 50手目くらいから千日手模倣になって205手目で千日手成立w
こんなん初めて見たわ。お互いに千日手をなるべく避けるようなアルゴリズムでも搭載してるのか?
Yane_Mob-sp1_E5-2670 vs. WesternLariat (2017-12-02 22:00)
http://wdoor.c.u-tokyo.ac.jp/shogi/view/2017/12/02/wdoor+floodgate-300-10F+Yane_Mob-sp1_E5-2670+WesternLariat+20171202220006.csa >>106
やねうら王の千日手は初期設定では評価値-1だから緩やかに避けるよ まともな計測もしないで7:3とか変な合成して喜んでるのってFC2の生ポ関数 合成全然詳しくないんだけど、7:3ってなにか変なの? WesternLariat流してる人って、12コアマシンかな? USIのヘッダーにオプションでCPUの種別を送信する項があればいいな
将棋所を使っていれば調べて送るようにできる
それをfloodgateで表示する 電王トナメで開発者同士で独自性の議論してた
時に半ギレしてた長髪っぽい人、あれ誰? カパックの高速化に貢献した人
だからやねうら王を高速化したというyorkieの辞退が納得できなかったのだろう
ところでyorkieの独自性ってどうだったの? 結果的に高速化なってただけで4駒出来てなく
アピールが、いわばデタラメ
中身やねうら王で出場して入賞していくエセ開発者ばかり 運営がソース読んで独自性なしとしたならまだしも調べてもいないのに突然独自性なしって話し出してソースは5ch なんだこいつら 高速化といっても色々だからなぁ・・・
コンパイルオプションで高速化しても独自性になるのだろうか アピール文章が意味ないのが、どうかと思うのです
審査もないですし >>107
なるほど.ってことは千日手の評価値をプラスにしておけば積極的に千日手狙いをする棋風になるのかな ぶっちゃけソフト開発を競技(ゲーム)にすること自体に無理がある
企業のコンペと似たような構造なのに、求められるのが実利ではなく競技性という矛盾
みんな巨人の肩に乗ってるのに、下駄を生産するやつ、それを履くやつ、草履自作するやつの区別に必死になってる なるほど最初から無理があるというのは分かる。
カパックチームの伊藤さんもトーナメント制な時点でエンターテイメントって言ってるし
厳密に強さを決める大会を行うなら、独自のプロトコルを策定、ソフトを提出させてサーバーで何千局と対戦を行えばいい やねさんがyorkieの高速化を取り入れてバージョンアップするってツイートしていなかったけか? 賞金を出す理由が放送で使うソフトの選定なんだから技術力で競えって言うのもおかしいような 激指や東大、AIやボナンザが切磋琢磨してる時代が一番面白かった
今は同じ家系ラーメンの中で一番うまいラーメンを決めるだけみたいなつまらん大会 世界コンピュータ将棋選手権の大幅ルール改定がメーリングリストで流れてきましたな
えびふらいとかが大きく影響ありそうだ これはwww
きふわらべの方にもついに規制が入ったかwww クジラちゃんは参加できるのかな。
彼が参加しないと予選の放送がなくなるし一気にWCSCがオワコンになるのだが >>124
4月のニコニコ動画(く)の発表で10月には「画質重さ完全解決」と謳っておきながら11月末ほ発表で「その点に関しては何にもできてません」とユーザーを苛つかせるのがニコニコ動画の独自性だからしょうがないね >>127
ライブラリ規定を厳しくしたせいで、
世界コンピュータ将棋選手権決勝進出ソフト(素人のブレンド評価関数にはかてません)
みたいなことになったりしてな。 >>132
なっていいでしょ
げんにそうだったし
tamoreGとか超えられてないでしょ クラスタ技術に関してはクジラちゃんは独自性かなりあると思うんだけどな >>133
上のほうで比較的色んな対戦させてた人いたけどrereが4120(当時のRで)あるみたいだし
平岡さんが大会前の強烈な相性が出たから差し替えたって言ってたけど
時期的にrereしかないし評判高い Twitterでuuunuuun氏がレート出してるyaselmoって、エルモのほうはSDT5のやつ?
それともWCSC27? >>137
そうなんですか、今までSDT5のほうだと思ってました >>138
yaselmoができて評価されている経緯が「WCSC27直後の雨後の筍評価関数の中で一歩抜けていてかつ早期に出てきたもの」だからね
この早期に登場したってのがポイントで技巧2のように検証者も多いし対局数も多いんだよ
だから一つのマイルストーンみたいになってる elmoSDT5と野生の読み太ブレンドしたらどうなるんだろ もう試したけど強くなんないよ。
素人があれこれブレンドしてもaperypaqより強いものは作れなかった。 sdt5以前の評価関数にはyasei2(7月公開)やrezero8などが合成ネタに有効だったけど、
sdt5以降の評価関数では棋力に差が付きすぎて使えない。単独で大体レート4050以上
はないと合成ネタには適さなくなったと思う。でも今思えばyasei2やrezero8は合成ネ
タとしてはひときわ優秀だったな。 野生の読み太の作者は本当に凄い人だよね。
将棋ソフトのソースコードが公開されてから魔女を代表するようにアノニマスの開発者や集合知がレートの向上に貢献するようになった。
賞金大会には向かなくなったかもしれないが そういやaperyってGPL3だけど評価関数もGPLなんだろうか >>144
GPLではないけど改変、再配布は自由ってreadme.txtには書いてるね uuunuuun? @uuunuuun1
さんのTwitterより
Aperypaq、私の方でも簡単なチェックはしています。
私のサイトの時間規定でY/Aperypaq 160-20-120 Y/Apery (R差46)でした。
ただ、他の評価関数も色々出てくるかな、と様子見中。
今はSDT5の計測が一段落つきつつある時期ですので、
年明けくらいあたりから新規評価関数の測定は始めます。 apery_sdt5とqhapaq-SDT5の50%キメラの報告ラスト
週末にaperypaqと戦わせた。
思考時間2秒・定跡なし・NPSは中盤で4Mくらい(ukamuseはもっと低い)
対aperypaq
249-27-273
前回は145-12-141
aperyそのままよりはこの単純キメラのほうが強いかもしれないけど普通にaperypaqでいいんじゃないかな WCSC29の変更点
○大会ルールの主な変更点
・一次予選の対局数を7局から8局に増やしました。(第19条第一項)←良変更
・これまで、どのプログラムの後継となるか、あるいはならないか(シード権に影響します)は参加者が選択
できるようになっていましたが、参加者の申告を参考にしつつ運営委員会が決定することとしました。(第14条)
↑これ、後継でこういう変更しなきゃいけないような事情あったっけ?
・また、これまでシード権の放棄を認める運用としていましたが、それを認めないこととしました。←クジラちゃん強制2日目送りw
・これまで、定跡データは「開発部」(第1条で定義)に含まないこととしていましたが、それを「一般に流布している定跡データ」
に限定し、非公開で改良した定跡データは開発部に独自の工夫を加えたものとみなすこととしました。
・これまで、評価関数を学習するための局面とその評価値のセットは「思考部」の一部である「学習部」と
みなしていましたが(第1条で定義)、一般に流布しているものは思考部から除くこととし、floodgate等の
評価値や読み筋を学習データとして使えるようにしました。
ただし、CSA利用可能ライブラリに含まれている局面とその評価値のセットを使う場合は、そのライブラリを
使っていると宣言することを推奨します。
○運用に関する主な変更点
・アピール文書について、A4サイズで25ページを上限とします。
・一般に流布している定跡データを組み込んだ場合や、評価関数の学習に一般に流布している局面と
評価値のセット、読み筋等を使った場合は、アピール文書に記載することを推奨することとします。
・ライブラリ使用者のアピール文書について、ライブラリの選定理由の記載を求めることとします。 別にきふわらべのアピール文書を排除しなくちゃならんほどCSAのサーバが
容量逼迫してるとも思えないのだが、独創賞とか出す手前、運営委員は全参加者の
アピール文書全文に目を通さないといけないとかそういう事情なんだろうか。 アピール文書が500ページぐらいあったらたまらんからな クジラちゃんは強制2日目送りだけど、1日目に会場来て1日中テスト対局やってても
別にいいんでしょ? 定跡はこの決まりなら前回みたいにまふさんが大会30分前公開したものは使えるな。
クジラちゃんが予選から参加できなくなって、事実上予選の放送は消滅した。 >>150
これって定跡だけでも出られるって事か? >>155
つまりハニーワッフルWCSC27みたいなのは28回から明確にシロになるということ >>156
ハニワってそんなにグレーな存在だったっけ? >>150
> 後継でこういう変更しなきゃいけないような事情あったっけ?
シード権の放棄を認めない、が影響してんじゃね? アピール文にフォントサイズ指定とかあったか?
ページ数制限とかイミフ
なら文字数制限にしろよ 電王トーナメントもあれだが、CSAの無能感も凄いよな。 >>154
非公開で改良された定跡データは開発部と見なされるので、まふさんは開発者の中に入ってしまうのでは?
となると複数にあげることはできなくなるのでは?
というか、開発者でもないマフ氏が人力で編集した定跡が暗躍し勝敗に大いに関わる事態を排除するためのルール変更ではなかったのか?
なぜ明確にしないのか理解に苦しむ >>161
一般に公開されてればOKだから、昨年のやねうら王と同じように大会の当日に更新しまくれば問題ない。 きふわらべ『よし! 今までの1/10の大きさにすれば250ページ相当いけるな』 画像データの解像度を物凄く高くして拡大したら大量の文字が書かれてるA4サイズPR文書を25ページとかでもいいのだろうか ブレンド評価関数(aaa)を検証したらaperypaqよりちょっと強いのが出来たみたい。
設定 4スレ秒読み1秒 定跡なし
対局数100 aaa 53勝 aperypaq 43勝 引分4 勝率55%
対局数100 aaa 54勝 apery_sdt5 43勝 引分3 勝率55.5%
対局数100 aaa 62勝 yaselmo 37勝 引分1 勝率62.5% >>168
対局数は置いておいて、たぶんちょっとノード数足りなくないかい? >>163
えっそんなんでいいの。そんなライブラリじみた扱いでいいの?
マフ定跡は非公開ではない。非公開ではないが、それが当日特定の人にのみ利用できるタイミングで更新され公開版ともはや別物になっていない事を保証するものではない…みたいな。
そんな利根川理論でええんか? >>169
aaa vs aperypaqをfloodgate放流用には、たぶん最適設定の持ち時間10分 秒読み10秒
tanuki互角局面集使用の設定で現在 対局数24 aaa 12勝 aperypaq 9勝 引分3 勝率57%
の途中経過だけど、100局になったら、また結果を書き込むね。誰も興味ないと思うけど。 やねエンジン+野良評価関数+まふ定跡でほぼ最強ソフトが出来上がる
それをどこまで変えれば独自性が認められるかだろうけど抜け穴は大きそうだね >>158
あー、山本さんが芝浦卒業したあと、ひまわりと芝浦Jrのどっちも芝浦の後継
否定してシード権実質放棄になったもんな。 シード権放棄不可については、開発者名義を毎回増加減して、前回とは別ソフトですと主張すれば抜け道にならんかな 今回のルール変更で明確に不利になっったのは
「くじらちゃん」のみ!!! >>160
電王トーナメントのグダグダな規則の立案に比べたら、
CSAのルールメイキングは比較にならんほど明確よ。
法律とか契約の条文作成とプログラミングはかなり似ているところがあるけど、
WCSCのルールメイクはさすがプログラマだわと思うところがある。 >>174
それを許さないためにも、何が後継かは実行委員が決める、という一文が効果を持つ >>157
単に振り飛車定跡入れたうかむ瀬やんけ!って声はあった。 Bonanzaと文殊が連合してBonanzaFelizになったときはBonanzaの後継だったけど、
仮に芝先生がshotgunで選手権に出て、ハードウェアはえびふらいのクラスタが担当します、
芝先生は都合があって岡山から出てこれないので定跡だけえびふらいにわたして
現地のオペレーションは全部えびふらいがやります、だったら、これ、shotgunとして
初出場を実行委員は認めてくれるだろうか。 平岡さん+クジラちゃん+芝先生の合同チームの可能性もなくはないもんな
まぁえびふらいは1次予選からテスト対局兼放送でいるだろうけど
それとgitの仕組みとかけ離れた時代遅れのルールは直ったの? まふ定石は穴だらけだよ。現に73%(R差170くらい)勝ってる・・・
登録手が多いのでアマチュアの研究(練習)対局には向いていると思う。
どのチームも同じ定石使うようになったら、単なる定石披露会になってしまう。
個人的に今回のSDT5の(公開されている)bookではQhapaqが一番優れていると思う。
河童パーク定石に対しては今のところ55%までしかいってない・・・
河童パーク定石、先手番やたら強いね。 初手38銀はあると思います。 >>179
シードを設けた趣旨からすれば認めない方向だろうが…
実績ある強豪が2年ぶり参戦もあり得るので、
どっちが主体なのかで判断するのでは。 Qhapaqの人は自己対戦で1手8スレ1秒でやってたけど、ノード数ってそんな大事ですかね?
個人的には長時間の100局200局とかより、0.1秒とかでも数千局とかやったほうがいいような気がするのですが。 >>185
2〜3年前、技巧が超短時間多数対局の戦略で学習後の検証回して、やねうら王他も採用してた。
しかしelmo以降、短時間で差がでないが長時間で逆転するタイプの評価関数が現れた。
なぜそうなるのかを理論的に詰めた人は居ないはず。 >>185
SDT5より前/WCSC27の後くらいに、シボレー&キメラでelmoに対して
測定したのだが、0.1〜1秒とかだと対elmo 85%とかの評価関数ができた。
当然超強とおもっていたが、念のため3秒 5秒 10秒とかで確認してみた。
すると60〜70%程度しか勝てないことが判明。
その評価関数yaselmoとも対戦させてが、負け越し。
ノード数低いとソフトの真の力がでてないのでは。
個人的にはノード数は最低でも3000万を目安に計測するようにした。
局数多ければいいってものではない気がするが。 定跡って同じものを使うと盾と矛の戦いになるタイプと
後手に穴があって先手勝ちまくりってタイプがあるのかな
後手の定跡が先手より圧倒的に大切だと思うんだが 評価値自体は探索でごまかされるし、ランダム性も多少はある動的な値だけど
bookは固定値だからしゃーない
しばらくは評価関数作るより、どれだけ効率的に計算資源を前借りするかが的になるんじゃないかな
結局何が言いたいかというと評価関数更新で定跡作り直しは無駄がでかい >>183
まふ定跡をメタるのはそもそも選手権で滝澤さんがやってたし、その方法で決着でしょう。
ただ、そうすると定跡の搭載手順が異常に少なくなるので一般公開向けにならなくなるだけで。 そろそろコンピューター将棋も共通オープニングブックを大会主催者が用意した方がいい。
一成さんの言う通りソフトが強くなりすぎて定跡の優劣で勝敗が決まってしまう >>187
>>188
そうなんですね。自分は以前、磯崎氏が自己対戦で短時間対局をたくさんこなしてるのを見て、それで充分だと思ってました。
floodgateに流してた自分のYapata_Lも、8スレ1秒で200局ほどやってAperypaqに57%程度の勝率だったので、8スレ10秒でどう変わるかやってみようと思います。 >>192
スイスドローで共通オープニングブックはなかなか厳しいぞ
TCECのように、同一対局で双方が先手後手最低1回ずつ持つのならありだけど。
(そうでないと先手と後手で勝率差の少ないオープニングを選び出すのが大変
それでなくても、将棋の定跡はチェスのオープニングに比べて穴だらけなのに) >>192
その時代がやってきてから対策を立てれば良い気はするけどな
定跡の発展なんて即座に将棋界へのフィードバックが見込める部分だし フィッシャーランダムチェス(チェス960)みたいに一段目をランダムにして先後対称にした初期局面から
レート測定したらどれくらい普通のレートと変化するのかな?ほとんど同じくらいなら面白いけど >>195
いま現状、定跡はアマやプロからフィードバック受けてる状態・・・ チェスはBook使うと引き分けにしかならない事情があるからであって
将棋で取り入れる意味はない >>198
それは違うんでは?互角局面用意した今の方が引き分け多いと思う。8、9割引き分けだよ >>167
そうだぜ☆
アピール文書が25ページになってもそれに見合った面白い文書を書くだけだぜ☆(^〜^) >>198
戦型選択というメタゲームが除外されるから意味あるでしょ
単純にノータイム指しっていうインチキ効果もついてるし スッップ Sd0a-SfGS
コイツのレスを見てみよう
https://imgur.com/a/cDu3F
ご覧の通りに貶す場合と取り入られたい場合の
二面性のレスの仕方をする典型的な
※双極性障害
※統合失調症
※演技性パーソナリティ障害
などである
さして強くもないのに優位性の証拠も提示できずに他者には押し付ける
バグッたRで勘違いをしているのに我慢できずに自己主張したくなる
病気の持ち主=Yapata系の自称キメラ屋(笑) >>193
評価関数にもよると思うが、特にシボレーやキメラの評価関数は
例として1秒で200局、3〜5秒で100局、両方計測したほうがいいと思う。
あまり勝率がズレている場合は1秒計測のほうは信用しないほうがいいです。
ノード数多い場合100局から150局くらいも計測すれば、そこそこ正確なデータといえます。
ふつうは長い時間の計測のほうが勝率少し落ちる。
すでにAperypaqに勝つのがあるんだあ。 >>191
自分は元のオリジナルbookから差し手を減らさないで、差し手選択肢を増やして勝率あげました。
対まふだけ考えるのならあと5%は上がるとおもう。
だが他のbookに対してあきらかに弱くなるのでそれはしない。
戦形によっては狙い撃ち的な部分も多少はあるのは否めないが、
その方法では使えないものになるので、違うコンセプトで作成してる。
自分のは完全に大会向けのbookですかね(大会とは無関係) >>185
去年まではそれでよかった(?)
しかしelmo以降はなくなった >>120
ソフトの将棋に魅力がないから仕方ないじゃん
マシンパワーで名人倒して何なの?産業としてもゴミだしまじで哀れ >>206
マシンパワーには全く頼っていないわけだが
(教師局面の自動生成のことまで言うとマシンパワーの問題だが
それを問題にする人はいないよな) >>206
名人は低スペックに負けたんだけど。
囲碁と真逆のルール設定。
最高峰の戦いであのスペックはいかがなものか。
ドワンゴ&連盟らしいルール設定。
電王戦対局用PC
OS:Windows 10 Home 64bit(Linuxに換装することも可)
CPU:Core i7-6700 *(実買四万円程度)
メモリ:32GB DDR4 *(実買二万円程度) え?事前の強化学習はマシンパワーじゃなかったら何なんだ?
評価関数アルゴリズムの最適化などをして論文になるレベルのことでもしたんか(笑)w >>208
事前に何千時間も強化学習しておいて、定跡的に指し手を登録するなり評価関数を強化してたわけで
それって結局はマシンパワーゴリ押しな手法であると認定されても何も言えないじゃんw >>197
なので定跡勝負になっていいんじゃね?と思う
個人の知識やノウハウではなく
体系的に有用な定跡を作る方法が確立されていないのであれば
それを元により強力な定跡を作っていく中で効率的に定跡が作られたほうが良い
山本も定跡勝負がくだらないと思うなら持ち前の物量で定跡作ってデファクトスタンダード築けばいいのにな
ちなみにチェスの定跡ってどうなってるんやろね 名人に勝ったのは一言で言えば、
ソフト側の事前カンニング行為があったからということですな 定跡はむしろ
ライブラリ勢が一番独自性を発揮出来る部分でしょ。
そういう意味では評価関数よりも重要。 なるほど。ソフトが勝ったとか言う話も専門的に見れば胡散臭い部分が満載なんですね ID ワッチョイ 無しの奴にかまうなよw
誰だかすぐ分かるのに yaselmoがなんでこんなに強くなったかはまだ分かってないんだっけ? >>217
それ、途中からelmoの仕組みの考察だけになってて、
問題提起の長時間での逆転現象の説明がどこなのかわかりにくいな。
elmoは遠い局面の勝率と評価値を、現局面の教師にしている、という辺りか。 >>218
そもそも野生の読み太って何だったのかまとまってなくね? >>219
そう、確かに途中から話が変わっているような気がして分かりづらいw
単純に考えれば、勝敗項は終局まで探索したとみなしてるから、時間をかけて深く読めば読むほど真の評価に近づくのかと
一方普通の雑巾絞りは6手程度の浅い読みの結果しか使っていないので、超短時間の対局でも特に問題なかったのかなあと感じる >>203
とりあえず、今は8スレ10秒(40000k〜50000kノード)でやってます。長時間だと先手番の勝率も増えた気がします。 >>222
>>202
スッップ Sd0a-SfGS
コイツのレスを見てみよう
https://imgur.com/a/cDu3F
ご覧の通りに貶す場合と取り入られたい場合の
二面性のレスの仕方をする典型的な
※双極性障害
※統合失調症
※演技性パーソナリティ障害
などである
さして強くもないのに優位性の証拠も提示できずに他者には押し付ける
バグッたRで勘違いをしているのに我慢できずに自己主張したくなる
病気の持ち主=Yapata系の自称キメラ屋(笑) >>222
たぶん皆、お強いソフトを計測したいわけで、
自己満足状態にならないために2パターンの時間、対3〜5ソフト
理想は200局以上だけど。ノード高ければ100局でもある程度の信頼性あると思われる。
自分は時間が長い場合は50局x2セットとかにしてPC負荷かけすぎないようにしてる。
実際は連続100局くらいで壊れるわかないが、気分的に休ませてやりたい(笑) ノード高いと100局でもある程度信頼できるって言うのははじめて聞いたぞ。
m5.24xlargeあたりで4スレ5秒相当を2千局くらいやるのがオススメ。
linuxだbニ値段そんなに麹bュないよ どれくらいのR差を検出したいのかによって対局数は変わって来るんでは.
厳密なレート差はわからなくてもどっちかが強いかどうか知りたいだけなら少なくてすむ なんとなくやや強そうかもとか、アバウトな予想を立てるくらいなら別に対局数少なめでもかまわないと思う >>226
>>227
言いたかったのは、ほぼそういうことです。
信頼って言葉つかったから誤解を招いた。
1000局とかやった方が信頼できるに決まっている。
人は7番勝負で勝敗決める大会もある・・・それと比べたら100局でも多い。
ソフトだから1000局〜2000局って発想が自分にはないなあ。 今のところ、aaa対paqは秒読み1秒と長時間でも同じ位の勝率になっているけど、apery
_sdt5とQhapaq_sdt5の合成のときは、明らかに短時間では超強くて、長時間では超弱
かった。 TCEC10のsuperfinal77回戦、Houdiniも後手番で1勝。お互いに後手番ブレイク1つずつ。
まだまだ後手で勝てるもんなんだねえ。 最近は二項分布のうんちくとか、有意に強いといえる対局数一覧とか貼られないから統計数への意識が低いな
みんな自分で少し計算してみたらどうだ?
数学的な信頼性とは数字で表せるものよ 統計的には不十分でも例えばyaselmoに1勝9敗しているソフトがあったとして
そのソフトが超強いかもしれないから何百局と対局させてみようって気持ちにはなりづらいっていう
人間の印象の問題とかは少なからずあると思うけどな、レート測定にもやる気がいるし
強そう弱そうとか個人の感想言うぶんには別になんでもいいと思うけどね、信頼するかは情報を受け取る側が決めるってだけで 測定する人が納得するならどんな計測でもいいのではないか。
vs単一ソフトと1000局やっても、他のソフトとの相性でレート通りいかない場合も多々ある。
それなら4ソフトと250局ずつ計1000局対局したほうが信頼するデータがでるような。
毎回1000局できたら数学統計的には理想だろうけど。楽しさがゼロ〜マイナスになりそう。 test evalmerge aperypaq epoch8 AperyPaqZero 95
ノード500万100局以上でaperypaqに6割勝つ
ぽんぽこ達と相性があるみたい。やや勝ち越す?
95以外は弱くなるふしぎ キメラはキメラ元との対局では相性が出まくるから、キメラ元意外の評価関数との対局をメインにしたほうがいい
キメラ元意外にはむしろ元よりやや弱くなることもしばしばあるからね
あとせっかく対局させるならuuunuuunさんのとこのレート表を参考にできるように1500万ノードくらいでやるといいと思う >>235
1500万だと丸一日かかるからねえ
誰か興味持って追試してくれることを願う 自分で色々対局させてみてもaperypaqはApery+30~50くらいのR差かなという印象 elmoだけとの差だけで見るとelmoから+250か 次のWCSCはelmoに勝率9割の世界 まさに天下一武道会
透さんの評価関数も蟲毒で検証してほしい。 >>235
そうだね、キメラはキメラ元には、ほぼ強くなるけど、その反面、他の今まで勝率が良
かったものには勝率が落ちることが結構あるからね。あと実際にyaselmoはramuと対局
させてみると負け越すので相性問題があるという、いい見本だと思う。 しかしそうなると対局相手系のキメラ評価関数用意してのメタゲームが捗るな しかし対コンピュータにレートが100あがっただのなんだのみみっちい争いして何になるんだ
これが人類にとっての将棋譜の進化になんか意味あるんか?コムがコムメタ対策しだすとか馬鹿の極み
だからお前らは市場価値がないアマチュアなんだよw こいつらストックフィッシュとbonanzaがなければ
永久に手打ち時代から脱却できなかったような3流以下の雑魚だから こういう書き込み見ると今日も平和だなーとほほえましくなるね 4200 VS apery-qhapaq
互角局面集8手
150局 82勝 68敗
勝率: 0.5466666666666666
標準誤差: 0.04085139548755903
95% 信頼区間 [0.4666666666666667, 0.62]
相対イロレーティング: 32.52197587099214
標準誤差: 28.635907594090487
95% 信頼区間 [-23.196778791074703, 85.04323715257749]
apery-qhapaq R4180+30=R4200超え
だってさ
まだ強いの持ってるみたいだし
次はR4250が優勝ラインなんかな 確かに強そうだけど、他との対局結果も早くでないかな >>230
初期配置から対戦している訳ではないからあまり意味はないよ
単なる開始局面の欠陥と区別はつかない ゴミみたいな対局結果多すぎだろ
誰が有意差の一覧表貼ってやれよ 長時間なら対局数が少なくていいみたいな
頭悪過ぎる理論振りかざしてる奴もいるし
スレのレベルが落ち過ぎ >>246
はあ?俺は京大からMITに行き、情報系の博士号とってからGoogleに入社して
10年くらいだったか働いたあとに親のコネでとあるソシャゲ会社の役員やってんだけど?
君ら何かとは次元が違うし、ゴミ技術者もどきの君らはまるで社会の役に立たないクズだよ
まるで市場価値のないアマチュア。恥を知るべきだね ただの顔真っ赤系かと思ったら二行目後半で草
中々いいセンスだと思うよ、荒らし以外に生かしてほしいもんだ >>256
ID無し ワッチョイ無し
この時点でお察っしください > ID無し ワッチョイ無し
職業:プロ2chネラー 長時間でもやっぱり対局数は多くこなさないとダメなんですね… >>259
▲9六歩つくのが定石とは知らなかった。
普通に香車取られても▲78銀と桂馬守って、馬の働きの差で先手が指せるかと。
この形は何度検証しても振り飛車が良くならなかったはず。 身バレしたくない人が選手権に出場しても大丈夫なのか? >今回私は「クジラちゃん」のところにお世話になる予定です。
まじかよ よしショットガンの芝先生もクジラちゃんチームに参加しよう。 >>271
これでえびちゃんも心置きなく結婚できるな >>272
>「クジラちゃん」は今回、過去「世界コンピュータ将棋選手権」に優勝したこともある人と
> コラボ企画が進行中だそうです。
> それによっては、私はお払い箱になるかもしれません!
だってよ。
どう考えても「定跡に頼るようじゃ終わり」のあの人しかいないだろ、まふさんお払い箱なら。 >>270
まふさんが「主たる開発者」ならえびちゃんは堂々と1次予選から参加できるわけで。 アピール文章、いくら25ページに限定したところで続きはwebでってやられたらいくらでも続き書けるやん シード権の放棄禁止令って、なんのために発せられたの?
意味わかんない CSA幹部の頭の中は激指・YSSに時代のままだからな 入玉はもっと改善の余地はあるから256手ルールの方を変えるのが最善かどうかはわからんぞ。 >>279
それはCSA例会で一次予選参加者から出た要望。
強いやつがシード権放棄して降りてきたら実質通過枠減るじゃんって主張には
理があるでしょ。
個人的には放棄した分だけ枠を増やせば良いのではとも思うが、スイス式である以上は
強いやつに当たってソルコフ稼げるからいいだろ、という脳天気な話でもないわけで。 シード権放棄するのって、戦略的に有利なくじらちゃんくらいなもんでしょ? >>284
今年はタヌキも放棄した(多分去年の2次予選の調整不足を防ぎたかったのだろう
名人コブラの放棄はライブラリ勢としてのこだわりのようなものだろう
あと、GA将とか、上位のシード権者の放棄で譲られたシード権を放棄する、
みたいな感じの動きをしたこともあったはず。 通過枠は放棄の分は増やしてたぞ。
場違いに強い奴と当たって負けると不満に思うのはわかるが。
しかしライブラリがあれだけ強い以上
シード放棄を禁じても初出場で一次予選から上位の実力者は出てくるとも思う 通信の遅延などの質は会場まで行かないと分からないからな
ぶっつけで二次予選初戦落とすよりかは一次で落とす方がマシ >>286
シード権放棄の分は通過枠は増えない。
通過枠が増えるのは「シード権保持者の4月1日以降の参加キャンセル」だけ。 >>283
>>288
シード権放棄の分は通過枠は増えないんだったら、実質通過枠減らないじゃん >>289
いや、通過するかどうかギリギリのソフトが繰り上がりでシード権得て
通過するのが確実のソフトが上から降りてくるんだから、どう考えても
実質通過枠減ってるよね。 >>290
だから、シード権放棄の分は通過枠は増えないんだってば
「通過するかどうかギリギリのソフトが繰り上が」らないってば なるほど上位がシード放棄すると、
前年に17位よりもっと下だったソフトが順に一次免除になってくルールだったんすねー
確かにこれだと一次予選の難易度が上がっちまいますね。
シード放棄が問題というよりその分のシード権が下位に回るのが問題のように感じる。 ライブラリのルール含めルール直すところはたくさんあるのにシード権だけ >>293 >>294
もうCSAの方も割とルールが滅茶苦茶なんだよな。
今の時代に即してない >>293
シード権獲得者が次の大会に出ないのはこの大会では日常茶飯事だから
欠場者の分のシード権繰り上げは当然よな。
で、シード権繰り上げがある以上は、シード権放棄に伴う繰り上げもある、
というのは当然ではないにせよ不自然ではなかったわけだ。
もちろん、シード権放棄を認めない、も放棄された分枠を増やす、もあり。
ただ、基本的にはこの大会3日間東京でやる、ということを考えると、
地方在住者の宿泊費負担を考えれば、2日目からの参加者をできるだけ増やしたほうが
いいという判断もあるわけで、1次の枠増やす代わりに繰り上げ禁止、はないかなと。
そうするとシード権放棄を認めないのが一番落ち着きはいいよな。 >>294-295
そうか?
理想を言えばきりがないだけの話で、今のルールは割りとよくできてると思うぞ。 WCSCは賞金もかかってないし、ハード制限ないから実質競技というよりはお祭りだから
あまりルールでがちがちに縛るのは違うんじゃないかと思ったりするけどね。 apery「四駒のためにいじってたら学習部改善されてなんかしらんけど評価関数めっちゃ強くなったわ」
yorkie「四駒のためにいじってたら探索部改善されてなんかしらんけどノードめっちゃ出るようになったわ」
時代は四駒だな >>278
正当性担保のためにwscsのための提出分としてはだらだら書かずに25ページ以内にまとめてこいってことだろ。
伝わる人にしか伝わらない例えをするならばmmd杯の本線動画時間を5分以内に収めよという趣旨と同じ
より詳しく知りたい人向けに別にリンクを貼って読んでもらう事はOK んで結局肝心の256手ルールやライブラリについてはどーなるんですかーと ライブラリはどんなルールが良いか開発者でも意見が分かれるからな
自作しか認めるなって人からなんでも使ってOKにすべきって人までいる なんか来たぞ
Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm
David Silver, Thomas Hubert, Julian Schrittwieser, Ioannis Antonoglou, Matthew Lai, Arthur Guez,
Marc Lanctot, Laurent Sifre, Dharshan Kumaran, Thore Graepel, Timothy Lillicrap, Karen Simonyan, Demis Hassabis
(Submitted on 5 Dec 2017)
The game of chess is the most widely-studied domain in the history of artificial intelligence.
The strongest programs are based on a combination of sophisticated search techniques,
domain-specific adaptations, and handcrafted evaluation functions that have been refined by human experts over several decades.
In contrast, the AlphaGo Zero program recently achieved superhuman performance in the game of Go,
by tabula rasa reinforcement learning from games of self-play.
In this paper, we generalise this approach into a single AlphaZero algorithm that can achieve, tabula rasa,
superhuman performance in many challenging domains. Starting from random play,
and given no domain knowledge except the game rules,
AlphaZero achieved within 24 hours a superhuman level of play in the games of chess and shogi (Japanese chess) as well as Go,
and convincingly defeated a world-champion program in each case.
https://arxiv.org/abs/1712.01815 げげーーーーーーーー!!!
convincingly defeated a world-champion program in each case.
????すげーーーー AlphaZeroが最強将棋ソフトに勝ったということですか 500以上の差は測れないだけじゃないかな
結局やりましたー勝ちましたって言われても状態ではある エルモ相手に+500くらい
チェスの方は微差っぽい Elmoに対して
先手Alpha 43勝5敗2分け
後手Alpha 47勝3敗
トータル 90勝8敗2分け >>316
drawが多いからレート的には微差だけど
先手で50%ぐらい勝ち越してる >>317
将棋における黒盤は先手でいいんだよな
チェスだけ逆だからその辺間違ってたりしないよなw チェスは棋譜載ってるのに
将棋は棋譜載ってない・・・
KI2形式で乗っけてくれw CSAは次のWCSCにAlphaShogiを招待するべき evaluation speedはノード数で良いのかな?
エルモ35000kに対して
アルファゼロは40kか 囲碁、将棋、チェスの順で評価関数(大局観)の方が読みの深さより重要になってくるからそれだけ
深層学習では伸び率が大きいって感じなんかな? 相性問題でelmoにだけ勝ち越してるってことはない?yaselmoに9割勝ってるのにr4200無かったとかあるし やっぱり日曜プログラマーだらけのとこに、deep mind様かやってきたら一瞬で駆逐されちゃうよね floodgateに来てほしいな
またはsdt5の上位プログラム全部Googleに送り付けよう 入玉ルールは無しでやってるけど
入玉将棋にはならなかったのかな 入玉自体を制限するのは無理だろうし点数関係なく相入玉したら引き分け扱いとか? グーグルがちょっと本気だしたら将棋ソフトの歴史40年があっさり否定されてワロタ >>336
千日手になるまでやったとか?
終局までの手数もわからないし256手ルール入れた場合引き分け数はもっと多いかも?
とりあえず誰か棋譜チョーダイしてきてw それより、チェスのvsストックフィッシュの
先手Alpha 25勝0敗25分け
後手Alpha 3勝0敗47分け
の方がびっくりしたよ
こんなゲームなの?チェスって アルファ将棋とブーハー竜王のワンマッチやって山本さんを涙目にさせよう ワロタ
https://twitter.com/ymg_aq/status/938255270144237568
5000TPUを12時間投入してelmo+400。
GTX1080Tiなら110年くらい学習すれば実現できますね。 グーグルを超えるアイデアあっても計算に100年ではどうにもならん 正直今の三駒の学習でも、depth32で有意な5000億局面が用意できればR4400くらいなら行くと思うんだ 滝澤「elmoじゃなくてElmoって書いてあるから書き直しな」 まあその計算資源をディープラーニングじゃなくて既存の評価関数の学習法でやればもっと強くなるんじゃないかとは思うよな 現時点でもR4200くらいまできてるし、意外とそんなに騒ぐほどでも無さそうな気がしてきた Googleとしては汎用性のアピールをしたいからチャンピオンクラスに有意に勝てるならそれでよしということではないかな >>352
結局そういうことなんだよね
でも将棋で負けっぱなしは嫌だから、誰か開発者の人にスパコン貸してあげて > AlphaZero achieved within 24 hours a superhuman level of play in the games of chess and shogi (Japanese chess) as well as Go,
ここだろ最注目は >>351
右の方の実レートがどれだけあるのかっていう怖さはあるけどね
引き分け率少ないからひたすら伸びていってる可能性もあるし
4400ぐらいで止まってる可能性もある 1080Ti使って110年とかワロス
elmoとだとレート差離れすぎててわからんな
aperypaqもelmoに8割だし >>356
計算資源さえまともに確保できれば、三駒でもR4500以上は堅いと思ってる
あっちがこのままR5000とかまで行くならちょっとどうしようもないかもだが >>339
今やってるTCEC見ても、そんなもん。
決勝100回戦の89回戦終了時点でHoudiniの14勝9敗66分だけど、
後手番でHoudini1勝、Komodo2勝。これでも今年は後手の勝利が多いくらい。 膨大な計算資源・非公開とか数年前のポナですね分かります。 >>360
論文出してるだけponaよりはるかに上 resignValue -900だってよ
これは終盤弱いDLの弱点をごまかしてるな。
aperypaqとどっこいどっこいじゃね ポナンザがゴミだとすると、Googleは天界の神だ やっば…日曜AI連合に火付いたぞ、これ。
終わりかけのお通夜ムードが一転して、ワンチャン王道展開まであるぞ… このレベルのDLなら単体のほうが3駒ハイブリッドより強いのかな しかし、deepmindの連中、将棋所どうやって使ったんだろうな。
英語スキンも自分たちで開発したのか?
あと、AlphaZeroをusi対応したのか、対局どうやってやったのかも気になる。 ゼロレベルから学習して1日で将棋の名人を超えるらしい・・・ dasapon? @dasapon17
resignValue -900ってちょい早くないかなぁ?
これもあるし、MCTS based だと終盤弱い、みたいなことが起こってる可能性もあるので
平岡 拓也??\(´・_・` )/??? @HiraokaTakuya
ほんとだ(´・_・`)将棋は終盤がクソむずいから3000点くらいまは少なくとも見て欲しい気もする(´・_・`)
そうそう!(´・_・`)そこ気になるんですよね?(´・_・`) なお1080Ti一枚だと数十年近くかかる模様。
平岡さんいわく3駒でもこの程度ならマシンリソースさえあれば越えられるみたいね。
それに-900で打ちきりにしてるから盛り気味のレート おまえら、もし日本に米の将棋プログラムが攻めてきて、向こうの大将と日本代表が将棋一番勝負で対決し、負けたら植民地にされる
という事態になったら、日本代表はどうするの? 将棋でも少なくとも序中盤は深層学習で強くなる余地あるってことかな 俺はあまり関わりたくないが、この結末だけは見届けてやろうと思う
Google VS やねうら関数・aperyキメラ連合
オッズは?ちなみに俺は現時点ではGoogleね AlphaZeroは藤井猛だった?
投了値900で判定勝ちなら藤井は永世7冠取ってただろうし ていうか、千田はこれ終わったパターンあるぞwあいつ間違った評価身に着けてやんのw早とちりめw 研究用途では序盤が重要だから
googleの計測方法の方が実用的なソフトを抽出出来るよね Google出てきたけどやねうら王は開発続けるのかな? >>373
そうは言うけどさ
>-900 centipawns for 10 consecutive moves for Stockfish and Elmo, 5% winrate for AlphaZero
だから、10手連続で-900以下だったら投了で、この場合は勝率5%以下だっていうから、
そこまで大きな影響は出てないだろ。統計的には処理できるレベルで。 日曜将棋AI連合がクラウドファンディングとかやらないかな >>383
将棋としてはそうかもしれないけど
DLだと終盤頓死する可能性がある 終盤怪しいから900って数字に設定してるのはまあ間違いない 真電王戦やろう!
日曜AI連合ソフト5対Googleでさ
ニコ生で中継解説はプロ棋士と開発者 終盤や入玉は別ゲーに相転移するのが将棋の特徴でもあるからな
そこを避けているのはどうかっていう主張はわかる 終盤弱いのがDL
入玉負けするのを減らすために-900に設定してるのかも
floodgateあたりに来てもわらないと分からない 終盤ガーとかどうでもいい
そんなん既存のソフトに切り替えればいいだけ WCSCルールとかの場合どうなのか?ってのも気になるよな
>>385
その辺のチェスと将棋の表現の差があるのに一緒に書かれてるのは論文として駄目だな >>386
for AlphaZeroだから、予備実験して、勝率5%になる評価値の基準決めたのかもしれない。
実際-900×10手で5%という閾値が予備実験で出ていたのであれば、問題ないってことよね? なんかスレ伸びてると思ったらえらいことになっててワロタ ぐーぐるさんの計算資源ってどれくらいかわかる?
一日で他のPCの100年分とかぶんまわしたら、表記詐欺だし。 戦法がどんな感じになってるのか気になる。ハメ手いうほどでなくてもコンピュータが
苦手とされてきた局面でも対応できるのかとか 面白そうだから飛んできた
-900は開発者もやっぱり疑問なのか
棋譜が欲しいなあ 瀧澤 誠@elmo? @mktakizawa
ponanza引退してる場合じゃないですよ
ほんこれ
逃げんなイッセー!もどってこい! ELMOが一瞬でAlphaGoに抜かれたと聞いて
結局物量と機械学習には勝てないわな 評価関数の質自体はAZの方が上だろうからponanzaはきついだろうな googleすげーってなる一方で、レーティング見るに従来の流れでも来年越えられそうな強さに
落ち着いていて、囲碁ほど伸びしろがあるわけでもないんだなって、チェスのほうはより >>396
そう言えばぽんぽこの人グーグル勤務と聞いたが ホントにFGに来たらサーバ落ちそう
平岡 拓也??\(´・_・` )/??? @HiraokaTakuya
@DeepMindAI Hey! I develop Shogi AI Apery! Let's play shogi with Apery in floodgate!
http://wdoor.c.u-tokyo.ac.jp/shogi/floodgate.html …
返事よろ?(´・_・`) DLが、終盤弱いのは失敗している?国産DL勢での経験則であって一般論ではないような コンピュータ将棋開発者連合でも立ち上げてグーグルさんの鼻をへし折って欲しい >>400
山本はこの論文にYamamotoの文字列が一つすらなかったことを恥じるべき
保木先生、金子先生、飯田先生は引用されてたぞ >>405
透。さんの評価関数って言うほど強いのだろうか? >>408
残念ながらelmo瀧澤さんが言わないとスルーでしょうな・・・ EnteringKingRuleをオフってことは入玉なしか グーグルがTPUを企業向けにも、一般向けにも販売する予定ないからNvidiaに期待してる
自動運転とかに手入れてるし、GPUのグラフィック機能排除して計算特化
ハードウェア分野ならNvidiaのほうがグーグルより上! >>393
それなら5%求めるまで予備実験やったのならそっちデータのがむしろ重要なんじゃ・・・
しかもチェスと将棋も同じ投了値っても・・・ >>414
論文書いてないしオープンソースじゃないし
引用されるレベルのものを発表してないからね >>418
teslaってグラフィックあったっけか? 入玉宣言勝ちってパターンもあるしそこはもやっとする。まぁ宣言勝ち採用しても強いだろうけど なんだ…入玉なしの将棋って(^_^;)…
グーグルさん 入玉なしの将棋なんかあり得ないよ(^_^;)ww
入玉を入れたら他ソフトよりも劣ってたから、入れなかったのかな〜 将棋は突き詰めたら入玉を狙うゲームかもしれない説まであるのにな ドワンゴが元気なら企画やってくれそうだが果たして?
対決相手がたぬきだと不満が残りそうなので上位5位でお願いします >>423
入玉得意なソフトと対戦させたら
稲庭的なハメ手で倒せる、とかっていうの? DeepMindの人がやねさんにやねうら王の導入方法聞いてきてた説 >>415
まあ野良関数でapery-qhapaq同等ま唯一ぽいし
tamoreの時もそうだが異形統のソフトは出してくれたほうが
有志連合の弄り倒しで進捗がチョット早まる気がする
ブログ見る限りリリースされそうな気配はあるけど まだ公開されてないけど、棋譜公開してくれる可能性あるよね
将棋に新しい発見がありそうで楽しみ 入玉なしwwwww
googleの論文は将棋風チェスだね。elmoの一番の長所をなくしてる。 機械学習、強化学習、DLは全て既存のもの。保木さんのボナンザメソッドはチェスソフトのパクリ。
本当にすごいのは出村さんの多クラスロジスティック回帰ではないのだろうか。山本って誰? >>342
まさにレベルを上げて物理で殴れば良いだな ぐーぐるさんのが、今のソフトに比べて、どれくらい強いのか、みんな半信半疑だろうな。 >>428
aperypaqを素材につかわずにR4200超えを期待してるわ 今年のwcscのelmoでしょ?
その計算資源使ってaperyの評価関数学習させてみて欲しいわ >>426
得意不得意関係ないよ
入玉なしってのは将棋では無いって言いたい
グーグルさんたちがやった将棋は将棋と似た別のゲームであると言ってもいいよ まあでも序盤は強いんでしょ
どんな感じなんだろうか それだけ計算資源投入してその程度だと逆にDLとの相性の悪さが際立って見えるな ニコニコは囲碁の時みたいに日の丸ソフト連合との60局勝負を三顧の礼をもってお願いすべき チェスは線形分類や棋譜まで書かれてるのに
将棋は・・・ >>435
aperypaq同等の物出来ててキメラしたのが少し勝率高いらしいから
キメラ素材を野に放ってほしい
floodgateに後手で一敗しかしてない奴いるから怪しいんだけどね >>437
なしって言っても相手がやってきた場合はどうすんのかを見たいんだよね
あっちがベースボールをやってるかも知れないけどこっちは野球をする、みたいなこと alphazero vs elmo 勝率.918
aperypaq vs elmo 勝率.811
よし!、こうやって見ると差がほとんどないな! TCECのチャット欄もAlphaZeroで盛り上がってるわ
>>419
チェスで900センチポーン差って十分resignな値だぞ。
TCECでは4moves8pliesの間6.5ポーン差が続いたらそれで勝敗決定になる。 じゃあ投了値900でも良いからelmoに9割勝てるソフトがあるんですか?
・・・って話っすよ >>446
だから将棋の場合も900で良いんだっけ?ってのがどこまで検証されてるのかが謎 >>411 多分、将棋の研究はこれからもうちょっとぐらいやるんじゃないかな まあ、確かに言われてみれば、投了値は1200が個人的にはベストじゃないかな? >>445
ほんまや!たいしたこないぃw
レート計測で75%超えたあたりから1%でレート10以上増えるから実際はねぇ・・・ グーグルの論文は暗に山本一成はなんの役にも立ってないゴミだと言ってるようなもんだな
実際そうなんだろうし事実なんだけどね aperyカッパやねうらマフ定跡計算資源
で対抗できる? >>445
ただしalphagoは入玉なしの別ゲーというおまけ付き >>457
だれか入玉なしで勝率がどうなるかやってみてくれないか 対alphazero戦をくじらちゃんでやったらめっちゃクライアント集まりそう くじらvsGoogleDeepMindって面白そうだね むしろくじらちゃん方式で学習のための計算資源をかき集められないんだろうか それよか、クジラのやり方を応用して技巧2の強化できない?そっちのほうが良いと思うんだが やねうら王 @yaneuraou
以前、やねうら王のGitHubで導入の仕方がわからんと英語で質問してきた人がいて、
私は英語苦手だし、「なんで英語で書いてくるねん!死ね!」と思っていたのだが、
あれ、今考えるとDeepMindの人だったのかも知れん…。 >>451
対elmoでの単純比較なら+150だけど
aperypaq相手にも勝率9割近い可能性もあるし、まったく勝てない可能性もあると思う
投了値900も気になるし、もっと情報がほしい お前らって素人がそこそこ強いの作ったら相性じゃんけんだの試行回数少なすぎだの文句言いまくりなのに
Google様が同じことしたら崇拝するのなw >>467
語弊ありそうなので訂正
対elmo比較でaperypaqに+150 序盤から中盤にかけてR4500くらいなんだろうなとアバウトに思っておけばいいんじゃないかな googleも将棋に似た何かで強くなったって言ってるだけだからDL単体はコスパ悪いな。
SDTのポナみたいにKPPTを補う形が理想かな DLが将棋やチェスと相性が悪いのは変わらないということでおk? >>468
崇拝はせんが、学術論文という体裁が重要 >>468
お前さ…社会って信用で成り立ってるの知らないの?
信用偏差値80越えのGoogle様の一声で平均ちょい上が騒ぐのは当たり前じゃないか?
(やねうらで60程度として測定しといたので詳しい値ではないので悪しからず。) NVIDIAのVoltaにはTPUに似た機能があるから
Voltaがあればそんなに天文学的な時間はかからないと思うけど >>473
プレプリントだからねえ
ピアレビューだしたらいくつか上がってる疑問はつけられそう >>472
囲碁に比べてもレートの伸びの頭打ちが速い
その点ではまふさんの言ってることが結構端的
まふ@まふ定跡開発者? @mafu_op_theory
今回の件で誰が一番被害デカかったと言えば、
DeepMind社の専門家が膨大な計算資源を使って、
コンピューター将棋をディープラーニングしても
こんな程度までしか出来ないって分かってしまった、
ディープラーニング勢の未来。
https://twitter.com/mafu_op_theory/status/938281668363812865
一方mEssiahの人は意気盛ん
将棋ソフト「mEssiah」公式? @messiah_ai
グーグルDeepMind社がコンピュータ将棋を作成したという論文が発表されたようですね。
mEssiah Stage2の開発は順調で、学習アルゴリズム的にはAlpha Zeroを上回っていると考えています。
現在mEssiah開発者は一緒にグーグルDeepMindを倒しに行く企業様を募集しております。
将棋の神の卵はすでに手の中にあります。神を育ててDeepMindを倒したい企業様、お待ちしています。 >>478
取り敢えず詰みまで指せるようにして持ってこいって言いたい まふ@まふ定跡開発者
今回の件で誰が一番被害デカかったと言えば、
DeepMind社の専門家が膨大な計算資源を使って、
コンピューター将棋をディープラーニングしても
こんな程度までしか出来ないって分かってしまった、
ディープラーニング勢の未来。
正直なところこれはちょっと思った まぁGoogleがどうこうはさておき、ノード数が少なすぎるのに強いのは凄い
今までは数の暴力で強かったわけだけど、人間と同じノード数だとしてもトッププロレベルかそれ以上まで行きそう 単純にノード数が少なくて済むほうが優れているという認識でいいのか? 人間のノードなんてどうやって測るんだ
1億と3手か Googleが本気になればポナ本ごとき瞬殺ってのは正しかったようだな deep blueのときに、カスパロフで2〜3npsとか議論してたような記憶がある >>483
羽生さん曰く30分から1時間で1000局面くらいか? こ、これは…
【if】将棋でDL頭打ち
↓
実は囲碁は論理的には簡単なゲーム
↓
世界で一番難しいゲームは将棋
↓
時たま将棋ソフトを凌駕する寄せを見せた永世七冠王はやはりすごいものである
なるほど………Googleの粋な計らいなのか。高度過ぎだろ… >>485
羽生「1000手読むのに30分から1時間」
DeepZero「16000手に1分」 >>488
コンピューターのノード数とは一致しないニュアンスかな… 羽生善治永世七冠王の全力で30分間で1000手くらいらしいからな、もちろん繰り返し読むからってのはあるが >>456
クジラちゃんクラスタでPC100万台ぐらい繋ごう
(なお低スペPCだとかえって足を引っ張る模様) >>485
詰将棋で考えると人は5〜7NPSよめれぬのが十分なんじゃないか? 一瞬で見えた手や軽く流した手も含めるかでかなり変わるな
精査した手になると数NPSだろうなあ 計算資源のためにクラスタに協力してくれってなったらどのくらい集まるかな 日本のコンピュータ将棋界隈ではalphazeroそこまで大したことねぇなという空気になりつつあるのを
むこうの人たちにそれとなく伝えて欲しいわ てかさ汎用性示すのにチェスと将棋やったんだと思うんだけどさ
汎用性って意味ならやっぱり
終盤の詰む詰まないのスピード勝負や
ゲーム性の大きく変わる入玉も含めた形でやるべきだな >>496
くじらちゃん2017は565台だったらしい まさかくじらちゃんの大物コラボ相手が本当はGoogleだったとは >>497
まあこの結果をgoogle以外が公表してたら、入玉なしやリザインバリューの件でボロクソ言われだろうな。 評価値−900を投了条件としても、elmo相手に勝率9割は果たして大したことがないの領域なのか?伸びしろも含めるとヤバそうなんですが、それは… 正直、思ったよりなんとかなりそうなレベルなんだなという印象だよね
新しいAlphaGoのときみたいな衝撃はないな >>503
それが論文に出てるグラフを見ればわかるようになっているんだが、
Googleの有り余る計算資源で強化を繰り返してもこれ以上の伸びが弱いのよ
(チェスについては完全にプラトーに見える。囲碁はじりじり伸びてる) 大したことないことはないにしてもwcsc27相手に勝率9割なら手が届きそうって感じだし、
イ・セドルバージョンのAlphaGoに100戦100勝にくらべたらやっぱり印象負けする レート5000!とかじゃないとな。旧masterに全勝と比べたらelmoまだ勝てるんだって感じ それまでの棋譜とか使わない学習ならソフトでも対応できない見たこともないハメ手を使いそうやな というかDL無くてもでwcsc27のelmo相手に8割以上勝てるからなー やっぱ終盤の深い読みが関わってくる局面でも適切に対応できるのかが気になる DLで先読みなしのポナがFGにあったと思うけど、
Googleのを先読みなしにしてもそれよりは強いよな?多分 >>507
ポナが絶対王者だと思ってたら
2015のぞみちゃんがいいところにいって
技巧がでてきて、elmoやぽんぽこも続いてっていうのを見てきたからこそだよね >>513
そうなんだ、ありがとう。
あんまり詳しくないんだけどちょっとビックリしてスレに来てみたんだ
googleにしてみれば、将棋の序盤というわからないものをわかることが大事なんであって、終盤などのパズル的な部分はわからなくても良いという考え方なのでは >>515
DLっていろんなことできるんだぜ! ってアピールだな結局 >>515
と言っても定跡入れるし
やねの探索は序盤枝刈りは激しすぎるし >>514
ブレードたくさん積んだトレーラー引っ張ってきそう ハサビスがカスパロフとの対談で、強化学習で既存ソフトを上回ったら驚きますかとか聞いてたからやると思ってたよ
そしてpretty sureとか言ったときはもう実験に成功してる we never actually found the limits of how good this version AlphaGo could get.
maybe we'll go back one day and finish off that experiment
but we needed to use the computers for something else.
so, we had to put stop there.
something elseはチェスと将棋の事だったかw elmoに8,9割の作戦勝ちできる棋譜ってだけでも価値あるんやから公開してくれ プロ棋士+ぽんぽこのアドバンスド vs AlphaZeroとかやったらアドバンスド側勝てるかな
もうプロ棋士いても脚を引っ張るだけかしら -900打ち切りなら終盤までそれぐらいで行ければプロならひっくり返しそうだな それではAlphaZeroの開発者をご紹介致しましょう。Google傘下のDeepMindさんです!
「うわあああああああああ、すげええええええええ」
「グーグルがちょっと本気だしたら将棋ソフトの歴史40年があっさり否定されてワロタ」
「やねうら王オワタ」
「elmoに完勝してるな」
それではAlphaZeroの開発者をご紹介致しましょう。山本一成さんです!
「入玉オフとかゴミやん」
「-900で投了?マレーシア行くの?」
「こんなにガチっても4500で頭打ちか所詮ポナ山だな」 AIって人間みたいに自分で意志決定できるの?
例えばハサビスがAI先生ちょっくら将棋のソフトでも作っていただけませんか?とお願いしたらちょっと間を置いて「いやです」みたいな感じで フィルタの数とか書いてないからなあ
alphagozero40フィルタよりはなんか軽そう 24時間しかまわしてないのに回数多いし 巧遅の4万局面なのか、同じ計算量(て言えばいいの?)で4万局なのか チェス 25勝3敗72分
将棋 90勝8敗2分
時間短縮のためかチェスと将棋は20ブロックのresnetでやったのね
40ブロックだとあと1000 eloぐらい強くなるけど あとまふさんのツイートはなんだかなあと思う
完全DLでmctsだと三駒+sf探索には及ばないと思われてたんだから
層を更に深くしたら伸びるかもしれないし、汎用学習型であるalphazeroの限界なだ毛かもしれない 学習2400万局だから、トータルで30億局面ぐらいしか学習させてないな
100億局面を5回も回したaperyとは何だったのか 入玉なしのなんちゃって将棋のルールで900点で投了だし
なんだ対したことないなって思われても仕方ない。 まふって勘違いの痛い奴だってのが本性出してよく分かったじゃん 手数が伸びがちなコンピュータ将棋で入玉禁止はちょっと卑怯だな
aperyは相入玉型になったら点数計算して入玉勝ち出来るのに これまでの歴史で今まで入玉云々で苦労してその兼ね合いでやってるのに
勝手に入玉なしルールに決めてんじゃねーよ馬鹿もんが!
グーグルはただ単に過剰にアピールしたいだけの糞企業にすぎない ゼロベースで既存の最強ソフトを超えられたのが凄いよね
リゼロも追い付くのが精一杯でゼロベースのメリットは誰も示せていなかったしさ googleの論文は将棋じゃないですよ。将棋に似た何か 終局まで対局できるものを用意してから出直してほしいって気持ちが強すぎるわ Googleの人たちは将棋を指したことがないんだよ
だからチェスと同じ条件でいいだろう、むしろ同じにするべきだと思っているんだろう
Googleの執筆者に将棋が分かる人がいたらresignの条件も変わっただろう 入玉なしってのがどういう意味かがよくわからないんだよね
現象自体は起きるんだからどう扱ってるんだろうという疑問が
無効対局にするのか引き分け扱いなのかも ところで、チェスはエンドゲームが全然違う思考法なんだと思うのだけど、そこらへんはどうなっているのだろうか 入玉なしルールってのがよく分からんけど
実際のとこどういうルールでやったんだろ
まさか玉は敵陣の3段目以上に入れないようになってるってことはなかろうし、
相入玉したら引き分けにする、ってぐらいなら
勝率計算上もレアケースだろうから理解できないでもないかなぁ まあ27点法とか24点法とかトライルールとかたくさん書かれてもどれを選べばいいのか頭がいたくなるってのは分かる 日本の開発者の人らは入玉で苦労してたもんな
なんだつまらんグーグルルールでやったのかよ
それじゃ将棋の亜種、グーグル将棋じゃんw だいたいコンピュータなら
切れ負けにしておけば、持将棋なしでも成立するよな?
人間向けのルールでしょアレは 入玉なしルールだったら
第2期電王戦のプエラαvs塚田はプエラαの圧勝だったなw Chess and shogi games exceeding a maximum number of steps (determined by typical
game length) were terminated and assigned a drawn outcome
具体的に何手で打ち切ってるのかよくわからん まあGoogleが256手ルールが正式な将棋のルールだと思っていたら入玉なんて無視できるわけだが そういや今回はaperypaqに勝率6割超えのキメラできたとか言うやつ中々現れないな >>550
気になる人は棋譜下さいって聞いてみよう 入玉将棋だなんだってのが昔のプロvsソフトみたいになってて笑う alphazeroがやりたいのは囲碁だけじゃなくてチェストか将棋みたいな囲碁とは違う構造を持ったゲームに対しても使えるもっと一般性のある手法の提案でしょ
将棋だけに特化してとにかく強くしたい訳じゃないんだから入玉とかどうでもいいだろ 論文読むとわかるけど
1手60秒で対局してる
入玉とかやってられねぇわな という一方で多分入玉将棋も含めて正式なルールやってみたけど結果が良くなかったんだろうな
論文はネガティブデータ見せない傾向があるから 終盤抜きでいいなら森下5冠、藤井7冠とかある世界やな >>558
一番結果が良かったのが900で切った場合として見るのがいいやろね >>543
>with the usi option of EnteringKingRule set to NoEnteringKing.
って書いてあるから、usiのオプションを使ったってことで、
これ、宣言勝ちオプションを切ったって意味じゃないの?
usi絡みで入玉って、それしか思いつかないんだけど。 チェスはオープニングと勝率みたいなのが載ってて、将棋にも戦型別にこういうのがほしいと思う。
でも向こう将棋にくわしい人いなさそうだし、時間かかりそう 別にfloodgateの棋譜を「棋譜の管理」にぶち込めば出るし 今来
a. 驚異的な計算資源を使って、極々短期間に将棋ソフトに現存するどのソフトよりも強いソフトを作り上げた
b. 対局条件は-900でresignの設定、探索数はelmoの約1000分の1(スマホとXeon Goldで対戦させるより差が大きい)、それでいて、戦績は90勝8敗2分と圧倒
こんな理解でいいのかい?
それでいて、将棋村の人達の反応がこんな感じ
・ -900resign設定は不当!時間短縮をまっとうな理由に置きつつ、実際は将棋のルールを歪めたオレオレルールで戦績はまったく参考にならない!
・ DeepMindは将棋をわかってない
・ (探索数や学習局面の差に目をつむりながら)elmoに9割?俺の作ったソフトで8割超えるんだけど?Deepmindたいしたことねぇな!来年こんなのあっさり超えてるわ!
・ お偉い人「むしろこの結果はDeepLearningの限界を示しただけ。DeepMindでもこの程度でがっかり」 今回の論文の主旨はルールを教えただけでどれくらいの時間でどの程度強くなるかを示すことであり
ゲーム固有の知識をいれたらもっとパフォーマンスが上がるだろうがそれは将来の課題とする
と書いてあるから続編が出るかも
パフォーマンスが強さの意味だったら空恐ろしい >>562
羽生さんが出向いて1局ずつ分析するか
将棋が選ばれたってことは他のチャトランガ系のソフトはあまり熱心に開発されてないのか? >>564
スマホとXeon Gold←この表現はちょっと微妙じゃないか? ランダムから強くなること示すために無駄に時間かけてるけど
elmoとかから作った棋譜使えば遥かに早くこのレベルの強さになる 強い将棋ソフトを作るのが目的じゃなくて
アルファのエンジンは簡単にいろんなもんに転用できるという宣伝だから
これ以上煮詰めないんじゃなかろうか 1080Tiを110年分使って学習させて序盤から中盤にかけてならelmoに勝率9割は
まあそうですか。って印象だわな。
詰みまでさして入玉ありだと勝率落ちるだろうし まあすごさはわかった、でも普段使いできないしそもそも将棋に興味無さそうだしでなんだかなあ やねさんに早くアップデートしてもらって最新やねうら王+aperypaqで対局してほしい >>561
宣言勝ちをなしにして評価値と手数(と千日手)で終局させているという意味だろう
だれだよ入玉なしの別のゲームと騒いでいるやつは google先生なら3駒関係の限界を極められそう。
3駒関係はともかく、なんだかんだ言って囲碁にはけっこう関わってくれてるから、
将棋やチェスでももうすこし貢献してくれるんじゃなかろうかとちょっと期待 >>569
どちらも単位はposition/sec
AlphaZeroは評価スピードが遅い
評価スピード遅いから終盤の信頼度ってどうなのよって話 >>564
勝率9割ってのがまた微妙で、
電王戦Finalのselene vs 永瀬ぐらいの差でしかないからなぁ そもそもなんで極東のゲーム
天下のGoogle様がやってるわけ? googleが言いたい事を一言で表すと
「stockfish雑っ魚w」「elmo雑っ魚w」という事だな
将棋やチェス云々というより
チェス系はディープラーニング向かないもか言ってた
一部の開発者を結果でぶん殴った形 >>567
すまん、自分で書いててこれ変かもと思った
よりスマートで一般人にわかりやすい表現ないかね
あと、DeepLearningを使って強くしたAlphaZeroではあるが、
当然のように「終盤弱い(だから-900でresign設定にしている)」を真であるかのように喋ってる人たちはなんなのだろう
支えられている根拠があまりにも薄くないかい? レートの上がり具合見ると碁とかと比べて相対的にDL向かないってのも事実じゃないかな 今やってるコンピュータチェスの世界一決定戦のTCECの雰囲気がどうなってることやら。。 googleとかDLとか三駒とか関係なく結局のとこ計算資源次第、結局金なんだよな 自分たちのalphago zeroの宣伝のための論文なんだし
徐々に投了値を下げていって-900でelmoに投了させるのが一番勝率が高くなったと考えるのが自然。 >>578
自分たちのアルゴリズムの汎用性を証明するため。将棋に興味あるわけではない >>571
そこらへんはalphago zeroも1台のPCだと学習に1200年かかるししょうがないかと dlshogi触ったことあるなら分けるけど
詰み探索オフに設定すると全駒しに行く、AlphaZeroも多分そうなる
詰み探索入れればいいだけだが 評価関数の精度は恐らく最強なので既存の探索と組み合わせるためにもなんとか公開してほしいもんだ
人類のためにもとか誰か説得してくれw 既存の探索と組み合わせるのは無理。
無理やり組み合わせても悲惨なものができる。 既存のものと組み合わせて強くなったSDT5のポナ方式の方が現実的 −900っていうのはチェスのトーナメントのresign条件に将棋も合わせただけでしょ
チェスが900だから将棋もそれでいいかってぐらいの
だいたい900の将棋の局面見てもそれが終盤なのか中盤なのかちんぷんかんなんだから とりあえず、棋譜を見てみないことには何もわからないな たぶんAlphaZeroのソースにはやねうら王がごっそり入っているのだろう
こういうところにも貢献しているな ついに山本も反応したな
まだコンピュータ将棋に未練はありそう 下山さんは無反応。というか反応したら逆に驚くタイプだな akiさんはそもそもTwitter見てない可能性大 山本はこれからもこんな感じで引退したけどコンピュータ将棋の新しい話題には反応するタイプになるのかな
ボンクラの伊藤氏みたいに >>597
オセロは20年前の評価関数サイズ数十MBとかで止まってるから
従来手法のパターン数を増やすだけでも強くなる余地が十分残ってる
けどやってもしょうがないから誰もやってない >>580
答えは単純で、
大局観で詰め将棋は解けないから。 AlphaZero君の好きな戦型はなんなのかな?気になるね とりあえず次の将棋ソフトの目標ラインは
elmoに勝率91%だね
それ未満だと優勝ソフトだとしても煽られる悲しさ グーグルはケチだから公開はないだろ
AlphaGoも非公開だし 上位勢はレートの検証方法に疑問はあるようだけれど、概ねalphazeroに好意的だね
ずっと目標にしていたponanzaが引退して張り合いがなくなりかけていたから嬉しいだろうな
そして、もしWCSC28に出てくるならそれはもう大騒ぎになるだろう
空前前後の盛り上がりだろうな 連合組んで計算資源を確保して天下のgoogleをボコボコにして欲しいわ >>607
アンチまふ定跡戦略を学んだだけだったりして。 特に平岡さんのやる気が凄いね
彼女にフラれたのか知らんがこっちとしては開発に力を入れてくれた方がいいわ >>613
あ、elmoとの対戦棋譜は学習してないからそれはないか。 >>591
そうなのかも。
せめて2000点を閾値にして欲しかった。 とりあえずニコニコの佐藤映像に煽りPV作って貰おうか 将棋はなかなか国際色が出せなかったからグーグルを引きずり出せ 取り敢えず圧倒的成長を遂げていく可能性のあるGoogleをあまり本気にさせない方針で勝利の称号だけ手に入れましょうか。 ルールの整備もちゃんと出来てないような将棋世界選手権なぞに
Googleが出場しませんよ 将棋は駒が漢字だからさ、今更アジア圏以外には広く受け入れられないんじゃないかな… floodgateには来そうじゃない?
平岡さんがTwitterでURL載せて誘っている >>623
終局まで指したら弱いことがバレるから来ないだろ いやー来ないんじゃないか?
aperypaqがelmoに8割だし、これで全然勝ち越せなかったら赤っ恥晒すことになるし ただまあ、上に行くようになったらつまらなくなるのがチェスであり、さらに面白くなるのが将棋であり、そもそも前提の達成が難しいのが囲碁…
この中じゃあ、実は一番指してる時の幸福度が高かったりするのかもな グーグルが将棋に人的リソースを使う理由はないんだよ
評価値(+2000とか)だけで勝敗を決定するとか特殊ルールなら
のってくる可能性がないことはないけど 外国人向けのネット将棋なら王がKでもいいんだがな
ネットでしか指さない人がほとんどだろうし でもこのまま何もしないで「三部門で世界最強になりました」とか言われても微妙じゃない?
それこそガチ勢から不平不満が出るのは必然 >>618
しかも両者FMでその取材の時対局して1勝1敗 逆に個人的な開発でAlphaZeroに迫っているソフトすげーとか
計算資源的に学習効率たけーとかにはならんだろうか >>632
今回は応用効くのがポイントだから
チェスと将棋と囲碁を同時攻略出来るソフトバンクなんて前代未聞でしょ AlphaGo Zeroは2.5万トレーニングステップごとに1個前のネットと400局やって勝率55%のネットを棋譜生成に採用していたけど
それすらやめた、学習してるネットを直で棋譜作成に使ってる
Self-play games are generated by using the latest parameters for this neural network 2.5万トレーニングステップじゃなくて1000ステップだった あくまでも選手権版elmoより強くなったというのでしょう?
今のaperyとやらせてみないと 第2世代TPUを64個使ったとあるから180TFLOPS*64=11.5PFLOPS
NVIDIAのVoltaが1個で120TFLOPSだからその96倍
つまり1個のGPUでも数百時間でできる
110年は大ウソ
今後ゲームの知識を入れると大幅に時間も短縮できるだろう >>639
探索はやねうらおう4,73だから実際選手権版とも違うはず >>632
その視点だとponanza(山本×下山×さくら×PFN)対elmo(個人)の時点でもかなりインパクトはあったからな これを受けて開発やめる人はさすがにいないか
棋譜が公開されたり対局環境ができればまた変わってくるかな
正直今はただの机上の空論でしかないし 90TOPSのTPU 5000個 2時間でelmo超えてるから
V100を50個7日(200時間)使えばelmo超えられる
AWSスポットで100万ぐらいだな どんな棋譜なんだろうな
初手はなんなのか
人間のどんな定跡を使うのか、使わないのか
どんなふうに囲うのか、または囲わないのか
単純に知りたいものだ 第一世代TPU5000台で24時間学習とかいくつか設定が違うのがあるのは別々に学習してるのか? >>647
これは案外、今のソフトと大差ないと予想している >>651
矢倉がないってことは5手目77銀矢倉が不成立って言うんだろ。流石に無理じゃないかなー。 18号の作者の言う通り、やねうら王探索は序中盤枝狩りがキツすぎるのと
先手は攻め急ぎすぎ、後手は受けすぎな傾向あるからDLだと、もっとバランス良く指すのかな。 4TPU対64CPUとかだと、まだいい勝負してるけど
Figure 2がそのまま伸びるとして
MCTSはクラスタでも普通にスケールするから
クラスタではもっと差が出るな TPUだなんだって大掛かりなことしてる割に大したことないよな。
汎用性とかどうでもいいから跳び抜けて強いの作って欲しい。 F時間による延びについてはelmo+Yaneuraou側はもうちょっとまともにTT確保すれば改善されたりしないんだろうか 今の状態でプロと指させるのが、
勝ち逃げできる可能性がある妙手じゃね? ようわからんけどAlphaZeroまだ伸びしろがあるとみていいの? でも、そういえば、今のPonanzaはディープラーニング使っているから、
AlphaZeroはPonanzaと同程度という見方もできるわけ? 強さを測る相手が強くないとレートを測れないから分からんね
将棋特化させれば効率は良くなるだろうけど >>660
論文中のグラフみる限りむしろ延びしろは少なそうに思う アルファの伸びしろがないのか将棋というゲームの天井が近いのか >>664
やねが4600言ってたけど
今でも引き分けになるのが遠いから1万超えることもあり得るで アルファ碁マシンパワーでゴリ押しだだけで、sdt仕様だとエルモマイナス200程度という情報もあるがどうなのだろうか? elmoと互角まで2時間、elmoに9割まで12時間
SF8と互角まで4時間、SF8に9割(引き分け除き)まで9時間
棋譜生成 5000 TPU
学習 64 TPUv2 今までコンピューターソフトがヒールの立場だったけど、グーグルの登場でベビーフェイスになりそうだな、グーグルはヒールで もしwscsでponanzaが勝ってたらこんなふうにgoogleが取り上げることもなかったのかなあ
別にponanzaは何も悪くないけど、そんなことも思ってしまう 4600の根拠がなんだかわからんけどもしそれが本当なら
アルファは将棋の天井に手を伸ばせば触れられるとこまで来てることになる 将棋にこれだけ金かけてくれたGoogleには感謝だな
日本の会社でもGoogle程じゃなくても投資してくれる会社があればなぁ あ、表の見方の間違えてた
対SF8は28勝0敗72分だ
チェスの方がやばいな カドカワが数年間のニコニコ独占使用と引き換えに金だせばいいのに チェスは引き分けが多いけど
将棋の場合どうなるか
AlphaZero vs AlphaZero見てみたいね
それと
AlphaZero vs Aperypaqどうなるか気になる >>670
"優勝ソフト(≒最強)が公開されてる"っていうのも大きかったかもしれないね 一成さんが反応してるけど、googleが将棋を扱ってくれたのは、オープンソースだからっていうのも皮肉だね elmoじゃなくてHeiseiShogiGassenPonpokoだったら面白かったのに
YaneuraOuでも笑えただけに残念 良く分からんけど
赤ちゃん状態から1日程度学習してponaレベル
みたいな話? World computer shogi championship
という名前が有能だったw >>674
でもグラフ見るとstockfishのレートと張り付いてるんだよね
あの対局結果なんか間違ってるような気がする 結果を出したのは凄いけど
COM将棋のようなR換算ができるもので
ponaは正直運が良かった部分が大きいと思うよ
今のオープンソース化作った平岡さん他
やねうら王の凄さを証明した滝沢さん(elmo)の
elmo絞りの革命と今でもキメラでの優秀性は
pona以上だと思うけどね なんつーか論文の査読ってやっぱ大事だな
疑問点が多すぎるわ 900点は低過ぎる。
入玉は余裕であり得る評価でしょこれ。 よく言われるけど
「これが凄いだろ」と
「この部分の駄目な部分も立証してます」的な
反証がなければ認めてもらえないからね 論文は基本都合が悪いデータ隠すからな
評価値900で打ち切りとかまず間違いなく終盤が全然強くなれなかったと思って良い ただ投了値900点という設定だとたいていの場合入玉模様になるとどっちかに振れるから打ち切られてしまうと思うんだよね チェスなら入玉とかあり得ないからそれで良いんだが。
入玉という状態を開発者が理解してないのかも? >>633
何年もしこしこ将棋のプログラム改良してたら、
googleの開発した碁とチェスと将棋全部学習できる汎用プログラムに一瞬で追い抜かれたとか
お釈迦様の手のひらの上で踊らされてた孫悟空みたいだね no opening book, no endgame database, no heuristics, no nothing! full paper coming soon,
will have things like early games.
https://twitter.com/demishassabis/status/938347604462542849 >>684
引き分けは0.5勝だから64勝36敗換算になって、100 elo程度の差になっちゃう
グラフでもそれぐらいの差 既存のソフトが強いから色々とチェス勢の突っ込みも激しいな
日本人も頑張れ 入玉とか投了値よりもなにより棋譜出さないのはおかしいって誰か突っ込んで欲しいよな 電王トーナメント基準だとelmoにR-200くらいみたいね。 推定で
やはりマシンスペックは正義 >>693
チェスと違って終盤データベースが使えない将棋
これでelmoに勝ったと言われても困るなあ AlphaGoの公開対局は良かったよな
データだけじゃ認めない奴が出てくるし、あのやり方は素晴らしかった
将棋もタイトルホルダーと公開対局すれば良いのでは なんで駒が消えるチェスより将棋の方が早く追い付かれるん? >>701
対戦相手がelmo & 評価値900打ち切り >>701
難しいゲームのほうが既存のソフトが未熟なのよ >>633
盤面とかルール部分は作りこまなきゃならないけど、ツリーサーチ部と
評価関数は共通で使える。
オーダリングとか絞り込みをポリシーネットに委ねているから汎用性が
高くなるんだよね。
とはいえ、詰み処理をどうしているのかは知りたい。
そこだけ別マシンでmin-Maxを動かしているのではないかと。 Masterとの60番勝負の将棋版をやってほしいなあ
単純に見たいだけだけど >>705
将棋プロは逃げまくって勝負しないから無理 平岡さんの最新エンジン+クジラちゃんクラスタ+ショットガン監修の定跡VS alphagozero 増田千田とかあの辺りはalphazeroとネット対戦できたら好んでやりそうだが
井山みたいに羽生が挑むのは想像つかんなってかないだろうな uuunuuun氏のレート表見る限り手を伸ばせば届きそう このスレでもいる何より何%勝ったより棋譜が大事なのがよくわかる 詳細な論文いつ出るんやろ
速報なんか出してんじゃねえよ全部書いてから出せって感じだわ待ちきれん DeepMind社に上手くアポ取れる人材が連盟にいれば、囲碁のMasterがやっていたみたいなことが将棋倶楽部24で実現する可能性もあるけど、
果たしてそういう人材が連盟にいるかどうか…… googleが将棋ソフト作ればレーティング5000は余裕かと思ってたよ。
夢のない結果だ。 有効手数が減らないゲーム、将棋、完全解析までまだ先なのか…遥か遠き最善手(オールコンプリート) >>698
ただ1080ti一台だと囲碁でさえ人間トップに勝てるかどうか怪しいんだよな
それくらいDLは計算資源大喰らい
>>699
この内容はむしろチェスでよくstockfish相手にやれてるって感じでは?
エンドゲームDB使ってないんだから 900差の棋譜ではまだどっちが勝つかわからない局面だね
将棋は終盤に逆転が起きるゲームだから終盤術にも長けていることがわからないと信用できないな 900差って何%ぐらいの勝率なんだったっけ?
AlphaZeroの論文では5%って書いてあるけど 入玉なしってのはelmoが入玉しだしたらalphazero側が不利であっても「はい無勝負」って打ち切るんだよな?
elmoは結構入玉好きだからそういう無勝負がどれくらいあったのかってのも知りたいわ 2割って書いてあるのをツイッターで見た
本当かどうかは知らない >>720
だとするとチェスでは900センチポーン離れていたら95%で勝てるけど、将棋では80%ぐらいだということだね twitter.com/issei_y/status/589642166818877440 5000TPUを12時間と
GTX1080Ti、110年くらい
って本当?ymg_aqさん以外指摘してないけど(山本さんに至っては続けていれば何とかなって手みたいな書き方だし)
如何にいっても差がありすぎないか?
ここまで差があると、山本さんにしても続けていたからといっても意味が無くない? >>719
そんな単純な動作で打ち切れるのかなあ
優勢の局面で中段玉なったから打ち切ってしまうとかありそう
USIオプションで宣言勝ちしない程度じゃないかな でも今のPonanzaってディープラーニングだから、同じ手法で同程度の強さまですでにたどり着いているという見方もできない? elmoやAperyなんかもそうだけど最近のfloodgateの棋譜を見ると入玉率が異常に高いんだよな.
入玉の上手さ下手さがレーティングに結構な割合で影響するレベルじゃないのかって想像してるんだけど 侵略者グーグルに立ち向かうのは将棋星人羽生さんしか居ない 同程度は盛りすぎかな?でも、圧倒的な差ではないよね
WCSC27のPonanzaはelmoに7割ぐらい勝つんだったっけ? まぁチェスのついででしかないから設定とかもガバガバなんだろうね。
結果として将棋じゃなくて将棋に似た何か >>730
やってみるしかないが。
根拠はないものの、結果は圧倒的な差になる気がする。 >>732
たぶんポナは強化に使えた時間とお金が足りてないからあの程度だった プログラミング技術はPFNの方が圧倒的だよ。
金と時間の問題でああいう結果になったけど floodgateに来れば明確だけどCGOSも来ないからだめだろうな チェスは100戦やって無敗だから満足だろうけど、将棋は8敗したから満足してないと思う
将棋の専門家がdeepmindにいればな 意外とGoogleもしょぼい、というかdlが将棋に向かないというだけか。
透。の持ってる最強関数をXeonで回して多分互角以上だろうね。 >>723
それはponanza の仮定だが、elmoも同じ仮定で学習してるので同じやね。 人間トップからのレーティング差から見れば囲碁と同じくらいの差なんだけどな
チェスと将棋は既存のソフトが十分強いから 来年の選手権に是非出てもらわないと
そこで白黒はっきりすればいい 評価関数がウンコだったら意味ない
棋譜公開 千田率の出番 AWSが本気を出せば一般庶民も大規模学習に手を出せるんだが
だからもっと値下げして♪ >>714
elmo相手にしかやってないから仮にR6000でも分からん
400以上差があると精度のあるレーティングは無理 ハサビス羽生さんに直電であっさり口説き落とす可能性大。 To evaluate performance in shogi, we used Elmo version WCSC27 in combination with
YaneuraOu 2017 Early KPPT 4.73 64AVX2
これ、将棋ソフト知らない人が見たら意味わからんだろうな
優勝したバージョンのパッケージを公式に置いといた方が良いと前から思ってた
ぽんぽこもエンジン付きで置いといた方が良い >>738
かなりのスペック差で対戦を行いそのうえ900で投了・入玉勝ちをオフにして9割って言われてもって感じだよね。
twitterだとelmo側のやねうら王エンジンのhash値も小さい値らしいし あえてDeepMindに批判するなら、将棋はチェスとは違うから、チェスの条件をそのまま当てはめるな
将棋の900センチポーンでの勝率は80%程度でしかない。低すぎる
チェスとは違って、引き分けが少ないから、最後まで指せ
ということかな
案外、最後まで指させたら、違う結果になるかも >>744
R6000もあったら、さすがにelmoに90勝8敗なんてことはないだろうさ 序中盤DLで終盤は従来のハイブリッドが来年の選手権には増えるのかな? >>749
1手詰め入ってないから互角のままいったときに頓死でワンパン入ってるんじゃね? >>752
ならんとは言えん
やねうらエンジンならR4600の評価関数でも似たような結果になるんじゃね 35Mn?でhash1GBって少ないかなあ?
スペック差に関してはそもそもCPUとGPUで発展の差があるからまあしょうがないとは思う
1080ti一基だと実力が発揮できない一人だけノートPC使ってるような感じになるし GPSの金子先生
Tomoyuki Kaneko? @tkaneko
いくつか気になるので、(ジャーナルなどに投稿されているなら)査読者頑張って欲しい
https://twitter.com/tkaneko/status/938282976902868993 elmoをCPU256コア 消費電力1500wにしても
4 TPU 300w +CPU200wに勝てない
低スぺなら勝てる 一発勝負な運ゲー要素ある選手権よりもやはりfloodgate出てきてそれこそ1日中色んなソフトと対局してほしい daigo? @daigog
[Shogi-server/Floodgateのお知らせ] 停電のため、12月9日〜11日夜にかけて、停止予定です。
http://wdoor.c.u-tokyo.ac.jp/shogi/ とりあえず序盤は死ぬほど上手いのは間違いないだろうから序盤戦術を見たい 羽生とも指してほしいけど、全盛期の藤井との対局見てみたい
一歩竜王の頃の藤井なら期待できると思ってる やね氏のウェブサイトがぜんぜん違うページになってるんだけど、
ドメインの更新忘れかな
http://yaneuraou.yaneu.com/ 囲碁のように画期的な序盤をやるのかどうかってのはホント知りたい ponanzaもelmoを上回っていたことを忘れていた >>735
一敗しなきゃ上位と当たらない欠陥サイトで動かされても・・・
延々とGPS将棋と当たるgoogle製ソフトとか見たいか? >>764
elmoに無敗ならまだしも、勝率9割(しかも序盤重視の特殊条件)くらいだったらそんな革命的なのはないでしょ
YaneuraOu rezero epoch19もかなり人間的な序盤だったわけで
人間の序盤をなめてはいけない 新手は山のように有るだろうけどそれは今も変わらんしな
凄さをアウトプットさせるのは難しい >>770
例えば横歩になったとき先手Alphazeroなら常に勝率100%とかならこれは何かあるぞってならんか?
後手は横歩に付き合ったらほぼ確実に悪くなりますみたいなのがあるかもしれん 普通ではない状況に対応するやり方は多分なんじゃこりゃ的なものはあるんじゃね
根幹はさほど変わらないが、なぜそうすべきなのかの理由付けがまったく変わるという意味で
序盤概念が変わる可能性はあると思う なんかスペック差がどうこう言われてるみたいだけど、elmoよりAlphaZeroのほうがスケールするだろうから、むしろ4TPUしか使ってないAlphaZeroのほうが不利なんじゃ
あとαβ法は疎結合並列探索の効率がうんこだから、クラスタ化するとさらに差がひらきそう 全然話変わるんだが、AdaGradで学習するときのetaってどんな感じで変化させるのがベストだと思う?
例えばミニバッチサイズ100000で100億局面学習だったらどんなもんかな? そういえばやねうら王ってHashの設定が特殊(USI_Hashを無視する)けど、日本語わからないチームだとそのあたり大丈夫なんだろうか… お前らがやってたことって
Googleが本気出したら2時間で超えられることだったとか
虚しくならないの?wwwwwwwwwwww ポナの上位版って感じしかしないが
ソース公開されてるものを後から出してもな
実際に2日で強くなる過程を公開するなら価値があるが >>775
クラスタもそうだし
elmo 18コア 165W i9-7980XE
Zero 4コア 65W+75W i7-7700 + 1TPU
これでもAlphaZeroが勝つと思う DLは計算力の物量を使いこなす技術
ぐぐる先生レベルの物量を持たない人間には縁のない世界だからしかたがないね Katsuki Ohto? @cute_na_piglets
AlphaZeroの件、「強いゲームAIを作るためにやるべきことは、ゲームAIのコードを書くことでは無く、
勉強して論文を大きな会議に通してDeepMindに入ること」だということが再確認されたと思う。
自分のやってきたことに悔いはないが、これから何かやろうという人には逃げずに正しい努力をしてほしいな。 ここにソフト導入のやりかたをしつこく聞いてきた人はGoogleの人だったかもしれないなw 毎回そうだけど都合の良いことしか公開しないから本当にそうなのか?って検証が誰にもできない
発表時は後からあれだすよ。これだすよ。と言うが後からではその時点で出来てたのか分からず結果が正しいのか判断もできない
出すと言ってるものはいつになっても出さないし検証されたくない雰囲気がぷんぷん >>783
まず日本語にすら興味ないだろ
あっちはオックスフォード卒で英語で博士号とってんだから 棋譜が公開されてないのが残念だが、多分矢倉とか穴熊じゃなくて角道空けて
居飛車の急戦模様、という今のソフトが好きな戦型しかできないと思う チェスは駒得あんまり気にしないらしい。そういうソフトはたぶん珍しいんじゃないのかな?
もうちょっとチェス強い人のコメントを聞きたいな
棚瀬 寧 TANASE Yasushi? @tanaseY
AlphaZeroのチェスは駒得よりも効率重視か。人間が手で値を付けると駒の価値がどうしても大きくなりますからねえ。 ここら辺の情報からか
Chess.com?認証済みアカウント @chesscom
>MASTERPIECE!
>AlphaZero plays creative positional chess
https://twitter.com/chesscom/status/938390544216154112 今までBonanza革命だの、合議制だの、GPSのモンスターマシンだの、
技巧だの、やねうらライブラリだの、絞りだの、ブレンドだの、キメラだの、定跡だの
何十年も必死こいてやってきたのに、Googleの手にかかるとゼロから二時間で余裕でブチ抜かれた
虚しすぎるわ >>777
さすがにパフォーマンスモニタでメモリ使用量くらい見るだろ。
たぶん。 何十年も必至こいたのはニューラルネットワーク関連も一緒でしょ
突然ぽっと出で現れて涼しい顔で結果を出してきたわけじゃない >>789
googleに挑む相手と認められる積み上げがあったことを誇っても良いだろう。
一発で蹴り飛ばされたとしても。
ただ、alphazeroが900点有利から、将棋の複雑な探索勝負の終盤を切り抜けてelmoやトップ将棋ソフトを完封できるのかはまだ疑ってるけど。
終盤戦でNPS900倍差が付いてると、逆王手で手番取られて頓死喰らいまくりのような。
コンピュータ将棋の流行りの薄くて広い玉は読みぬけが怖い。
まさかdeepzeroが穴熊採用ってことはなかろうし。 Jon Ludvig Hammer? @gmjlh ←チェスのGMらしい
AlphaZero has a massive winrate against formerly unbeatable Stockfish. It plays insane attacking chess and
couples it with profound positional play. If anything chess is looking more exciting! For now.
We already knew computers were tactical beasts - it's the positional wins that strike my fancy. Games 7-9 are superb.
ChessVibes? @ChessVibes
Not only was AlphaZero better than Stockfish after four hours of self tutoring. It also discovered centuries of opening theory all by itself.
うる? @urutom
chessの#alphazero は相当強いらしい。そしてゲーム内容も美しいとのこと。ポーンを失ってもポジショニング重視で、エンドゲームも正確。
粘りに粘るストックフィッシュを確実に追い詰める。すごい衝撃をみんな受けてることがビデオからもコメ欄からも分かる alphazero shogiの棋譜も見てみたいもんだなあ 二時間って言うけどお化けスペックの二時間だからあんまりそこアピールされてもなって感じ
圧倒的な計算資源あれば素人がやねうら王かApery使うだけでも1週間あればアホみたいに強いのできるだろうし >>789
同じ計算資源があればelmoはさらに強くなってるだろうがな 三駒でもelmoに9割以上はまだ作れるだろうね
全駒関係を見るNNはもっと強くなる可能性を秘めているが 河童絞りってどんな感じなのかは公開されてないんだっけ? そういやDemis Hassabis氏はチェスだけでなく将棋も指せるんだったよな。
棚瀬さんがやってるトライボーディアンみたいなマインドスポーツ大会でずっと優勝していたくらいの
ボードゲームマニアらしい
http://www.msoworld.com/pentamind/
https://en.wikipedia.org/wiki/Demis_Hassabis#cite_note-Pentamind-63 >>795
サチるから無理だよ
ひと工夫しないと頭打ちだからみんな苦労してる >>800
depthあげて教師の質を上げつつ数を増やして過学習避ければまだまだいけると思うんだが AlphaZeloにレーティング推移を見ると
途中で落ちたりもしつつ右肩上がりになってるから
一瞬レーティングが停滞しようがなんだろうが
学習ブン回し続けたら3駒でもまだまだ上がるかもね エルモ、いい時に輝いたな
グーグルに相手してもらえて、おいしいポジション 評価値900程度だと、入玉したらドローって可能性も普通にある。
そもそも入玉に対応しているのだろうか。 ガバガバ計測だったが、目標を失った開発者に目標が出来た
今回将棋を扱ってくれたのは良いこと これで平岡さんもヤル気が出たっぽいし >>719
>>561読めって。
入玉なしなんてあるわけないだろ。 >>785
Zenの加藤さんが、Deepmindのalphagoチームには日本語堪能な人がいるって
言ってるぞ。 >>793
エンドゲームデータベース使わないでチェスでそこまで終盤正確なら、
将棋の終盤もそこまで酷いことにはならなさそうだな
(チェスの終盤はあれはあれで相当大変なので) deep neural network, rather than the linear function approximation used in typical chess programs.
This provides a much more powerful representation, but may also introduce spurious approximation errors.
MCTS averages over these approximation errors, which therefore tend to cancel
out when evaluating a large subtree. In contrast, alpha-beta search computes an explicit minimax,
which propagates the biggest approximation errors to the root of the subtree. alphago zeroとaperypaqで対局がみたい。
CSAルールで投了までのきちんとした対局を uuunuuunさんがブログで物申してるな、これは面白い AlphaGoの盛り上がりを横目で見てるだけだったのが
Google側から将棋に殴り込みかけて来てくれたんだから
これはモチベーション上がるやろ ブログよく読むと微妙に的外れなこと書いてある気がしないでもないな、対局にHash10GBも使わんだろさすがに >>795
お化けスペックと言うけど本当に?
その話をしてる人が一人しかいないしどうにもよく分からない >>815
今回の時間は、庶民にはとても高価な1080Tiを搭載したPC1台で頑張ると約110年かかるらしいよ いずれにせよ、評価値900は切る値としては低過ぎるよ。
ソフトは強くなればなるほど、早い段階で高い評価が出る傾向が強まるから、
これ終盤に入る前に打ち切られてんじゃね?
つまり、DLが苦手とする土俵を避けてる可能性がある。 R4200の評価関数使って、終局まで指せばそこそこいい勝負なんじゃないかな >>816
そこも気になるところだな。
110年かけてそれなら、従来型+DLの方が効率は良いのでは、っていうね。 >>819
別に強い将棋ソフト作りたい訳じゃなくて、DLで色々できるよってアピールだからさ HASHはまぁ4096あたりでもいいような。
>>816
AWSのスポットで100万かければ近いところまで行けるみたいだぞ
まぁSDT基準の1080Tiだと既存ソフト+DLの組み合わせの方が強いけど 評価値900程度で、とあるけど
そもそもAlphaZeroの900の定義は他の将棋ソフトの5000相当とかってオチはないの? >>821
むしろ、もし金が有り余ってたらAWS使って既存ソフトでdepth16の500億局面とか試してみたいもんだ >>822
評価値-900が10手継続で投了はelmoの方
AlphaZeroは期待勝率が5%未満になったところで投了。
alphazeroはusiプロトコル使ってないっぽく、センチポーン単位の評価値出せないから
囲碁と同じで期待勝率による評価値。 で、将棋の-900が期待勝率5%未満と言えるかどうかだけど、
多分自己対局だけしてたら900ついたら逆転率5%未満じゃないかなあ、
という感じはするんだけど、どうだろね。 >>822
alphagoは5%だよ。投了の設定は。
実際強いんだろうけど定跡の記述もないし、将棋の対局設定の雑さにガッカリ
どうせチェスの片手間なんだろうな。 I hope that you may test these programs before declaring AlphaZero beats currently available shogi programs.
uuunuuunさん完全に煽ってるよなこれ >>825
あ、そうだったのか…
論文全く見ずお恥ずかしい Anatomy of a Computer Chess Program
でいろんな既存手法を説明した後
このセクションで説明されている技術のどれもAlphaZeroで使用されていません。
これらの技術のいくつかは、さらにAlphaZeroのパフォーマンスを向上させることができると思われます。
しかし、私たちは、純粋な自己対局強化学習アプローチに焦点を当て、将来の研究のためにこれらの拡張を残しています。
AlphaGo Zeroでrolloutを使わないのも同じ理由 英語が苦手で、結果として煽るニュアンスになってたらワロス
まふさんが検証してるけど、公開の投了値の設定ならaperypaqでも今回くらいの結果は出せるみたい。 elmoに勝ったとか言ってるけどさぁ、もっと強いソフトあるし、そもそも設定ちゃんとしてそいつら倒してから出直してくれない?
って言ってるよなこれw A transposition table facilitates the reuse of values and move orders when the same position
is reached by multiple paths.
と説明しちゃってるから、ハッシュも使ってないんだ
AlphaGo Zeroでは使ってたのに
ハッシュ使っただけでも少しは強くなるだろうな >>830
つまりドラゴンボールで例えると
AlphaZeroはフリーザ第一形態って訳だな Anatomy of a Computer Chess Programで
opening book、endgame tablebaseも説明してるから使ってない
ハサビスのツイート見なくても論文読めばわかることだったか やっぱり英語力がないと怖いな。間違ったニュアンスで伝わってしまう AlphaGoZeroの時には40日回したのに
12時間しか回してない時点で察して欲しいよね。
相手にならないから途中で論文書き始めただけ。
googleの事だから
裏ではまだ学習回しているだろうし
次回の論文ではブッチギリに強い結果を出してきて黙らせに来るよ。 >>837
これ見た感じだと時間さえあれば天井知らずで強くなる、ってわけでもなさそう
ttp://www.itmedia.co.jp/news/articles/1712/06/news138.html
ttp://image.itmedia.co.jp/l/im/news/articles/1712/06/l_ki1609376_alphazero01.jpg アピールなんだから短時間でこれだけ強くできるって出さなきゃ見向きもされないだろう
実際にどれだけの時間がかかるかは分からないから鵜呑みには出来ないが
あとルール以外教えてないよってのがどこまで本当かってのも重要だろう
これで汎用性をアピールしてるんだし 入玉ありで最後までやらせたら40勝10敗50引き分けとかになりそう グーグルに嫉妬してもしかたないだろ。素直にほめてやれよ。
アルファシリーズを有料販売してくれないかな。有料と言っても格安でね。 AlphaGo Zeroは1万2000くらいだっけ 囲碁の方だと6月くらいにツールを出しますと言って半年経っても出せてないしある程度のクオリティ(論文で発表してる強さ)になるまで出さないと思うが >>873
汎用性のアピールに将棋とチェスが選ばれただけだから、既にDEEPMINDは違うことやってるで たぶん 世の中金ってことがよくわかってしまってほんと悲しい >>837だった。
設定に関して突っ込みどころ満載だったから仕方ないね。 将棋に関しては半年後くらいに達成できそうな強さだけど
チェスはかなり未来に行った強さに感じるね。 AlphaZeroに1発も入らなかったStockfish先輩マジ可哀想 伸びることは伸びるだろうな、R5000には届かないかもだが >>776
そういう苦労をしないためのAdaGradなんじゃね? NGCでアクセスできるAIやHPC用ソフトウェアも増加:NVIDIA TITANユーザーがAI開発に「NVIDIA GPU Cloud(NGC)」を利用可能に - @IT http://www.atmarkit.co.jp/ait/articles/1712/06/news061.html >>848
コンピューター将棋開発者って趣味で開発してるわけだし学習、対局に数百万は出せんわな。 その計算資源を他の学習方法にまわせばもっと強いのができるっていうけど、将棋ソフト未経験者がノウハウなしに作ったことに価値があるんだろう
3つ星レストランの味をご家庭で味わえますって感じで いや、箱根に歩いていこうとしていたら新幹線で追い抜かれたって感じだわ deepmindに物申すのはいいけど自分が何者かでどういう実績があるのか説明しないと、俺らがここで煽ってるのと同じ扱いされるような Googleの将棋ソフトがelmo超えたのニュースの反応見ても
日本人は嫉妬深いですね
屁理屈こねて否定ばかしの開発者
見苦しさは渡辺明のようですね >>862
大丈夫ここ便所の落書きと違って、ほとんど開発者は論文を読んだ上で冷静に分析してるよ。 査読中みたいだし保木さんや金子さんは引用されているから物言う資格はあるだろう
対局条件をもっと将棋に合わせて再実験してほしいね
評価値3000とか手数300とかに 妬むと言うんだろうか
科学の論文で根拠を出さない方が変だと思うが
同じ位の既存が無いなら凄いって話で終わるけど WCSCまでにR4500くらいの評価関数を用意してalphazeroを招待したいもんだ 論文発表は、NatureかScienceとかだろうね >>865
いや〜それがdeepmindに伝わっているかどうかが問題で
送っただけじゃたくさんあるクレームの一つで終わっちゃうのではと WCSCルールならaperypaqの方が強いだろ
新バージョンのalphazero作ってくれるなら見てみたいけど チャンピオンベルトを持ってないから仕方ないね。
本番での強さがこういう場面で大きく響いてくる。
Qhapaqが廃課金して臨んでいたら
論文に載っていたのはelmoではなくQhapaqだったかもしれないけど後の祭り。 これさ。将棋AI開発者が挑戦状たたきつけたら、公開対局してくれるんじゃね? alphazero倒すためにAWS使って超強い評価関数作るためのクラウドファンディングやって
見返りは完成した評価関数とかだったらある程度金集まるかな? >>816
その話してる人ツイッターで一人だけだし本当のところどうなのかと気になってる
山本さんとかもう少しDeep Learning頑張っていれば良かったみたいなツイートしてるけど
PCスペックが全く足りなかったら頑張っても意味がないわけだしさー
>>821
その話おおかたの見方?
とりあえず、一人だけがPCスペック凄いって主張しているように見えて
嘘か本当かちょっと判断が付かない
というか、これが本当ならマスコミももっとこのことを報道すべきなのになんかその辺りの話が聞こえてこないし・・・
あと100万円というけど実際にはこのプログラムが完成する前で何千回とか試行錯誤してるし
DLの方法って普通の人には作成が困難なのだろうか? sdtルールでもaperypaqの方が有利だろ
なんせショボいハードに強制統一だから >>877
具体的な年数はどうでもいいとして、GPUの数十倍の性能のTPUが5000個だぞ?
これが個人でできるお手軽スペックならやるやつたくさんいるわ >>879
マスコミはプログラムの方ばかり強調してるけど本当に重要なのはハードウェアって事になるよな
そういえば格安で高スペックなスパコンチップ作ってた社長逮捕されてしまったな
ソフトもだがそれを作る人材を増やすという意味で、本当はこういった研究の方が重要って事なのだろうか? >>880
結局のところ、世の中お金ですってことよ
PEZYは性能に関しては本物っぽいから期待してたんだがどうなることやら
ハードが進化しないことにはどうしようもない、NNとかDLの理論は結構前からあったがハードのスペック不足で机上の空論だった
それが、ハードの進化によってアイデアをマシンパワーによって形にできるようになってきたって段階だな今は >>614
えっ、平岡さんて彼女に振られたん!?!????(´・_・`)(´・_・`)(´・_・`)(´・_・`)(´・_・`) GoogleはNNに特化したハードウェアをどっさりこさえてるからそのぶん強いんだよ
GoogleのTPUはGPUの10倍の価格性能比を持つとされる
Pezyのような汎用スパコンはGPUをのっけてるからNNの処理自体はGPU同等だが
汎用である分価格性能比では圧倒的に劣る
TPU >>>>>>>> GPU >>>>>>> スパコン
だからこの種の用途に使うのはまったくの無駄
Googleもスパコンは使ってるけど
その強みはしょぼい機械を大量に積み上げた徹底した分散型処理にある
単体のハードウェアの性能を競う方向とは正反対 チェスの方がCOMのレートの伸びが緩やかだし将棋よりずっと天井ありそうなのに将棋より結果いいの謎だな >>884
NNに価値があると分かれば
その機能だけ詰め込んだ演算チップにして売り出せないの?
スパコンUのような複雑な物よりも遥かに安く
多くの人の役に立つチップになりそうじゃない?
GPUボードなんて1枚10万でも飛ぶように売れてるし(マイニング用途が多そうだけど) AlphaZeroに挑戦できる権利が1ソフトだけで、その1ソフトを決める1戦100局決着の大会開いて
それに勝ち抜いたソフトがAlphaZeroに1戦1000局決着で勝負できるっていうの開催したら大いに盛り上がると思う(´・_・`)
>>882
ご想像にお任せします(´・_・`) 時間が経てば経つほどGoogle先生の計算資源は充実していくわけで、半年でレーティング200上昇したとか騒いで勝負しようとしても
絶望的な差を見せつけられて終わりそう だがしかしelmoに1割も負けんの?だっさwとか上手く煽れば
ここから数年の目標となるようなレートをgoogleに作らせることができるのではないか >>886
もう結構な数のメーカーがDeepLeaning専用プロセッサの開発をしてる。
来年くらいに市場に出てくると思う。 DLプロセッサが大量にあったとしても
それを価格・性能の両面で効率的に稼働させる能力はGoogleが圧倒しているのが現状
おもちゃみたいなデバイスが目の前に1000個あっても
ふつうのプログラマじゃ途方に暮れるだけ なんでもいいから個人としてはXeonPlatinum 8180 2個積みのPCがそこらへんに落ちててほしいんじゃー AWSの計算機リソースを借りりゃいいだろうが
今や大学の研究室ですら当たり前になってるのに
頭が20世紀で止まってるんじゃねーの? >>890
それは楽しみだな
>>893
アホみたいにお金取られたOrz
レンタルカーを想像してみると良いと思うけどある程度使うなら所有した方が良い
それにHDD丸ごと転送とか凄い時間が掛かる AWS借り続けると車買えるくらいになるからびっくりよな 化け物みたいなスペックのソフトが今後WCSCに出てくるだろうし
ドワンゴが死にそうだけどSDTは続いてほしいなぁ SDT無くなると半年サイクルじゃなくなっちゃうしな 計算機リソースというのはふつうの商品とは正反対で
小分けにすればするほどトータルのコストが下がる
安くチョコレートを食べたかったら1kgの板チョコの固まりじゃなくて
1gの豆チョコを1000個買うしかない >>895
1時間だけ凄いサーバーが欲しいとかならありだけどね
しかも英語が苦手だとよく分からないのに課金されていて泣きそうになったよ
無料で始めたんだけどその範囲が正直よく分からなかった;;
未だになぜ課金されたのか分からないし・・・ aperypaq+まふ定跡 vs elmo wcsc27でaperyqaq+まふ定跡の勝率100%だって
まふ氏のブログだと対局条件がさっぱりわからんけど そうなんだけど、ソフト組む立場としたら並列化やらなんやら超めんどいから
性能が高いやつ1個で済むようになってほしいんだけどね。
2台で150%、4台で280%とかそういう増え方するから貧乏人としては
何台が一番コストパフォーマンスがいいか、とか考えないといけないし。 >>896
前回ポナがXeon22台 Titan X128台 メモリ4.8TB
だったけど
エルモのXeon2基に負けてるからな >>901
定跡って対局前に超長時間思考してから対局しているようなもんだから、その条件は流石にいかんでしょ >>898
計算機リソース
例えば家で4TBのHDDが1万円、バックアップにもう1台追加、壊れるまで5年としたら4TBのストレージが僅か2万円。
これをサーバで借りたらもう1桁は必須になるでしょ
もし2万円以下で済むなら教えて欲しい
ちなみに容量無制限のサービスとかあったけど全てサービス停止に追い込まれてる
むしろ、個人と違い、ダウンタイムの耐性が必要になったり、利益を上乗せする必要があるから、かなり割高になってるじゃん >>904
でもそれ言うとAlphaZeroもハードウェアが対等なのかという疑問が >>905
ストレージの話ではなくて、計算能力の話だよね、きっと。
CPUのコストパフォーマンスを見てみればだいたいわかると思う。
最上位CPUと中堅CPUって価格は10倍とかいくことがよくあるのに、
処理能力差は3倍いけばいいほうってことが多い。 >>906
対等じゃないと思う(ややAlphaZero有利か)し、完全に対等な条件を探すのは大変だと思う チェス界からも絶賛と同時に疑問の声もあるそうだ
ーーーーーーーーー
takodori? @takodori
カスパロフ、ニールセンのコメントあり。
Stockfish が考えられないミス、ブランダーを指していると指摘している人が複数。多分、Stockfish の性能が発揮しにくいコンピュータ環境なのではないと推測している人が結構いるね。
https://www.chess.com/news/view/google-s-alphazero-destroys-stockfish-in-100-game-match だからさ
ちいっちゃいものをいっぱい並列で動かすのはめんどいし性能も出しづらいってのは大前提なんだよ
その面倒なのことを他よりうまくやれてるのがGoogle
Googleとまったく同じハードウェア・ネットワークリソースが使えたとしても
Googleの数十分の一、数百分の一しか性能がでないようなコードしか書けなかったら
そのコストは数十倍、数百倍
趣味や大学の純粋な研究ならともかく商売に繋げるならこの差は致命的
Googleが「2時間で終わったw」と言ってることが
200時間かかってもまだ終わらないんじゃ勝負にならない >>910
商売につなげるならそのへんの並列化技術をもった企業は日本にはたぶんいくつもあるぞ。
最近自前スパコンを用意したPFNとかを筆頭として。
話題のPEZYもそのへんがものすごい得意なんだろう。
PFNはDeepLearningをいまいち信用してないPonanzaチームと組んじゃったから残念なことになったけど。
単独で出ればよかったのにねw 平岡さんがマシンリソース欲しがってるし
PEZYのtanakhさんとコラボとか見てみたい。 スパコンで言われる並列化とGoogleの得意とする並列化とは
まったく別物なんだよ
Googleが得意なのは物理的には地球のこっち側と裏側にある
ハードウェアリソースを連携して動かす技術 >>914
別にネットワークでつながってるのは同じなんだから、
DelayTime変えるだけで1m隣だろうが地球の裏側だろうが変わらんとは思うけど。
というよりか、近くのぶっとい回線を効果的に使うほうが技術力がいるよ? 伊藤第0代電王がハサビス氏に煽りツイートしているな だいたい今時のスパコンは全部並列機なんだから
あんたの言いぐさだとスパコン関係者は全員並列処理が得意になっちゃうだろうにw 計算資源の差はともかく、特化したAI?に汎用的なAIが勝った(あるいは匹敵した)のが大きいんじゃないのかな
そこを差し置いてグーグルに挑戦状叩きつけるのもどうかと とりあえずお祭り騒ぎで強いソフト同士の対局が見られりゃなんでもいいのよ >>917
並列化技術持ってなくてスパコン技術者名乗れるのはハード屋さんだけだと思うけど。
違うのか? 山本一成@Ponanza @issei_y
既存の強豪プログラムも強化学習といって人間の棋譜に頼らず強くなっているのですが、
AlphaZeroがすごいのは将棋に関する知識がほぼ0で作られている点でしょう。
チェス/将棋プログラムはとりわけ探索技術にドメインに関する知識が大量に利用されています。
また既存のαβ法を使ってない点も衝撃的です。 Googleのそれと同じ意味での並列化の研究をしてたのは金子研究室とGPS
大学内の教室端末iMac数百台を使う
スパコンと比較すればほんのおもちゃだ
今回の件でGoogleは汎用AIの能力を誇示したことになっているが
ハードウェアの観点からすれば
単体では家庭用のビデオカード一枚にも劣るおもちゃの山と
それを使いこなす能力の誇示でもある 単純なこと
コンピュータ将棋選手権に出てきてからほざけ >>921
「マスメディアの取材歓迎!」みたいなしょうも無いこと言ってるなw 十分性能のいい評価関数が出来れば探索はやらなくていいっていう話が現実になったってことだよな たぶん将棋知識が殆んどない人のツイッターでAlphaZeroの話題になってたが面白かった
ソイツ「なんかちょっと昔に話題になってた将棋ソフト業界にGoogleが参入して一日勉強したら勝ったらしい」
たぶんちょっとだけCOM将棋知ってる人「日本の将棋ソフトはプログラムコードがギリ書けるAI研究者と、AIド素人の敏腕プログラマーが切磋琢磨してる状態だから、そりゃ本職が来たら一瞬で抜かれるよ」
ソイツ「鳥人間コンテストに企業が参入したらボロ勝ちしたみたいな感じ?」
たぶんちょっとだけCOM将棋知ってる人「そうそう、上手いこと言うね」
ほんと上手いこと言うもんだと思った そもそもコンテスト(大会)に出てないから全然うまくないと思うんだ…… 直観早指し派と研究定跡派の違いを見てるみたい
今後は力戦変態派のソフトもでてきて欲しいなあ レビュー中ってことはまたNature?でも今まではプレプリントは投稿しなかったから別のところかも
>For now, the programming team is keeping quiet. They chose not to comment to Chess.com,
>pointing out the paper "is currently under review"
https://www.chess.com/news/view/google-s-alphazero-destroys-stockfish-in-100-game-match AlphaZeroの学習時だけの並列化を例にとれば、
要約すれば分散して各ノードで勾配を計算して、それを集めて合算だか平均だかして適用する、みたいな感じだったと思うけど、
同じようなことはChainer MNでもできるはず。
実戦時はAlphaZeroも1台のはずだから並列化云々にはたぶん関係ないな。 論文はチェスだけなんじゃないかと予想
将棋も入っているんだったら、レビュアーは誰なのか。金子さんではないみたいだから、保木さん?
保木さんだったら、頑張ってレビューしてもらいたい >>926
病院へ行ってお医者様にその話をしてきなさい テンセントがシャンチーとチェスの最強プログラム作って将棋だけ取り残される流れ >>909
この記事でも
「Stockfishを64コアで動かすならハッシュは32ギガは要るよな。
それが1ギガなんて理想から程遠いだろ!」
って言われてるね。
ハッシュの値をなんでチェスでも将棋でも小さくしたのかはわからない。 論文のここかな
Evaluation
To evaluate performance in chess, we used Stockfish version 8 (official Linux release) as a
baseline program, using 64 CPU threads and a hash size of 1GB.
To evaluate performance in shogi, we used Elmo version WCSC27 in combination with
YaneuraOu 2017 Early KPPT 4.73 64AVX2 with 64 CPU threads and a hash size of 1GB with
the usi option of EnteringKingRule set to NoEnteringKing. AlphaZeroに負けたからと言って日本の将棋ソフトの価値がなくなるわけではない。
どうしても勝てないなら駒落ちで指してもらえばいい 向こうが何十日も学習を続けていたら駒落ち対局になるかもだけど、このレベルなら半年後にはそれほどでもない相手になってると思う 日本製将棋ソフトに負けたからと言って
プロ棋士の価値がなくなるわけではないのと同じですよね このやり方ならalphazeroを公開してくれれば勝ちましたといくらでも棋譜出せるんだけど・・・・ 開発者陣が正しい対局条件と強化した評価関数でボコボコにするだろうね R4000代が角落ち飛車落ちしてもらって負けるということがありえるのかが分かるから、ぜひともやってほしい
チェスもどこまで駒落勝利が成り立つかは興味深そうだし 日経にオンライン科学誌ってかいてあるけど、まさかまだ査読をしていないプレプリのことを勘違いしているのか??
一般紙は査読を終わってない論文は報じないよな?
>5日にオンライン科学誌に論文を…
https://www.nikkei.com/article/DGXMZO24325500W7A201C1FF1000/ >>931
どう考えても飯田先生が筆頭候補だと思うのだが たぬきさんがuuunuuunさんのブログにコメントしてるけど、elo ratingをero ratingと綴ってるのが気になる >>943
よくわからないので教えてほしいのだけどarxiv.orgってオンライン科学誌なのか?
それとも、学会発表の予稿集みたいなものなのか?
レビューされているわけではないよね?(Submitted on 5 Dec 2017)って書いてあるし 探索部はやねうら王だったりハッシュサイズは1Gだったり定跡は採用してない(だろう)だったりで、
実際にwcscに出場したときのelmoとどれくらいの違いがあるのかがよくわからん プレプリントサーバは査読無しだけどポアンカレ予想の論文も
ここなので直ちにゴミと言うわけではない 16スレで1GBでもそんなに力が変わったようには見えなかったけどなあ でもどんなに評価関数の精度が上がったとしても
初手26歩で3000点とかなって代りに56歩指させると-3000になるとか時代は絶対来ないよね
絶対とは言い切れないのかな どうぶつしょうぎはもう9999か-9999しかない世界になってるから、いずれはそういう評価値になるだろうよ それは読み切ってるからでしょ
評価関数の精度を上げるにも記憶容量の制限がかかってくると思うから
そんなに上がる前に限界があるように思うんだけど Nov 23, 2017
Larry Kaufman
Their latest learning program beat the pants off all other, previous Go programs.
But that does not apply to chess.
Nobody has a self-teaching chess program that can fight with Houdini or Komodo.
That’s a fantasy. Maybe that’s the challenge, to get Google to prove that it applies to chess too.
チェス界の伊藤が誕生してしまったか >>959
ラリー・カウフマンはチェスのGMでKomodoの開発者だから、
伊藤さんよりはより発言に正統性がある。 >>929
そっちの業界知らないので素朴な疑問なんだが、
Nature って embargo 指定がめちゃくちゃ厳しくて
解禁指定時間過ぎないと一切表に出せないってきいてるんだが
arxiv.org にのせるのはありなわけ? TCEC Season10 Superfinalは96回戦を終了してHoudiniの14勝9敗73分。
Houdiniの6シーズンぶり4回目の優勝が確定した。 >>948
簡単にいうと自主的に論文を掲載するサイト。
昔は査読無しだけど、それだと野放図になりすぎたので
登録している会員の何人かがOK出せば掲載される。
精査されるわけでは無いけど。
競争が激しいジャンルだと、ライバルより早めに自分の成果を示したいときなどに使われる >>963
>そんなわけで、先日公開した教師データ(depth10、110億局面)をWCSC28まで公開しておくのではなく、
>WCSC28までに定期的に新しい教師データを期間限定で公開していこうと思います。(あくまで予定ですが..)
神かよ 神すぎてもはや意味がわからんぞもう、色々遊べてめっちゃ嬉しいけどさ ハッシュ値問題になってますが
floodgate程度の持ち時間の場合は8192と16384では
結構かわるもんなんでしょうか? 例えばもし112コアとかだと多めに欲しいんじゃね? >>969
112スレッドだわ、個人的に1倫理スレッドあたり512MBあればいいかなと思ってる >>965
Thanks
ところで疑問なんだけど、arxiv.orgに載せた後でも、そのネタで論文発表もできるの?
異種分野だからか、違和感がある 日本の新聞は海外記事、特にコンピュータサイエンス関連の記事の引用は誤訳だらけ
AlphaGo Zeroの時なんて学習3日目で
セドル版AlphaGoに100-0とかいうトンデモ誤訳カマしてたし まあ要はfloodgateにお越しくださいませってところだな。
その結果によっちゃ、皆一瞬で黙るよ。 ていうかさ、この件の本質ってDMの開発した学習アルゴリズムの汎用性だよな
勝敗条件がどうのとか入玉がどうのとかハードがどうのとか言ってる奴いるがぶっちゃけ五分五分の戦績だとしてもトップニュースだろ
DMが凄くて囲碁で人にAIが勝てると聞いて驚いてたが、そこからたった2年でチェスも将棋も囲碁もできるAIとか開いた口が塞がらんしもはや怖いレベルだよ >>973
おまえ根本を勘違いしてないか?
メディアに正しさなんてあるわけがないだろ
注目される情報をいち早くだせば内容なんかどうでもいいんだよ
見る人は信じるんだから
日本のって言ってるけど世界どこでも同じでばれて指摘されたらごめんなさいって修正するだけだよ >>972
普通はarxiv.orgはもう論文提出しちゃって査読待ってる状態で、さっさと発表しちゃえ、て
載せてる場合が多いと思う。ので、今回のもどっかに投稿してるはず。
ただネットワークの構造とか書いてないし、かなりなドラフトな気もする。将棋の棋譜もないしね さくらインターネット、「高火力シリーズ」の新モデルとして「Tesla V100モデル」を提供開始
キターーー(゚∀゚ 三 ゚∀゚)
料金(税別)は月額11万5000円。初期費用は92万4000円 >>978
AWSでおk
皆V100がTPUと同レベルなことも知らないんだなぁ
ちゃんとした比較ができて無いのはどっちかな やっぱり今の探索は序盤と終盤は工夫が必要だよね。
ポナンザなき今将棋ソフトのレートがまだ、延びそうでよかったわ
次のスレどうなるの? >>977
査読の末、Rejectくらったらどうなるのかね?他のジャーナルに投稿し直してもOKということなんだろうね
理論系の学問はそういう作法なのかな 既にこれだけ話題になってるのにリジェクトとか余程のことが無い限りありえないだろ TPUはGPUの性能が10倍というGoogle発表を真に受けているのが多すぎる
GPUの方が汎用性があるからいろんな面で有利なのに >>981
もちろん他に再投稿OK。こんなの全然公式じゃないし TPUはINT8で92TOPS、1080 TiもINT8は44TOPSで倍ぐらいの差しかないけど
ガチ勢以外はINT8を使いこなせないから宝の持ち腐れになってる 定跡のいたちごっこがAlphaZeroにも有効だったらロマンを感じる 定跡も深くたくさん読んでおかないとだからこれまた計算資源問題が 全然ニュースにならなくて不思議だったがなるほどね
arxiv.orgって査読もなくて正式な発表場じゃないのか
通りでツイッターのDeepMind垢もハサビスさんの垢もこれに全く触れてないわけだ
そもそもの論文の方も将棋の方の解説はほとんど触れてなかったし
これは待ってたら正式に発表されてもっと詳細な情報が得られるかもね
俺はとにかく棋譜を見てみたいわ >>989
ハサビスはメンションにはリプライ返してるから、ツイートと返信のほうで見てみ? 投稿先がNature、Scienceのような商業誌だったら、こういうarxiv.orgみたいなネタバラシは嫌うんじゃないのかな?
どうなんだろう
>>961も同じこと言っている Natureは事前に情報を流すのを禁止してたと聞いたことがある
想像だとNatureが落としたので(囲碁でお腹一杯で新鮮さがないと思われたのかも)
別の学会に出してここに投稿したと思われる >>992
おそらくそれですね。科学誌の反応がイマイチだった。がありえそう。 Natureはうちの研究室も画期的な論文書いて提出してたのにあと一歩押しが足りないとかの理由ではねられてたな。
なかなか権威ある雑誌だわ インパクトあると思うんだけどねえ
AlphaGOZeroのアプローチでチェス・将棋も攻略できたということでしょう? チェス、将棋はとっくに人間超えてて、囲碁より簡単なゲームで同じことしたら
やっぱり超えました、というだけ、とも言える
将棋好きな俺としては落とすとかありえないんだけどねw 結局日本人の挑戦心や心のゆとりや器があまりにも小さいのが原因なんだろうね。素直に喜ぼうぜ、お前ら。 1000なら、人間はただ醜く生きたいと願いさして生き続ける、獣と機械のどちらにも属せない半端者。 このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 7日 5時間 40分 41秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。