▲コンピュータ将棋スレッド145
■ このスレッドは過去ログ倉庫に格納されています
↑スレ立て時は1行目と2行目に「!extend:checked:vvvvv:1000:512」をコピペして立てて下さい 荒らし対策のために強制コテハン(ワッチョイ)を表示するコマンドです 第28回世界コンピュータ将棋選手権 参加チーム https://www.apply.computer-shogi.org/wcsc28/team.html 詰将棋メモ コンピュータ将棋2018 http://toybox.tea-nifty.com/memo/2018/01/post-0205.html 世界コンピュータ将棋選手権参加ソフトリンク集 http://www.ne.jp/asahi/tetsu/toybox/soft/softlink.htm floodgate 最新2週間レーティング http://wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html コンピュータ将棋協会 http://www.computer-shogi.org/ コンピュータ将棋 http://ja.wikipedia.org/wiki/ コンピュータ将棋 コンピュータ将棋 まとめサイト(コンピュータ将棋レーティング) https://www.qhapaq.org/shogi/ ※前スレ ▲コンピュータ将棋スレッド143 https://mevius.5ch.net/test/read.cgi/bgame/1540817996/_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured なんかちょろっと棋譜見ただけだけどelmoが単純に弱いような でもAlphaが強い事は確かそう 78番目の棋譜のこの局面で△4六歩の攻め合いが最善と判断する最新のソフトは少ない感じ gpsとか昔のソフトの方が最善になるっぽい。alphazeroは受け好きに見えるけど無難な3四銀じゃなくて 攻め合いを選ぶのはかなり攻撃的 後手の持駒:角 9 8 7 6 5 4 3 2 1 +---------------------------+ |v香v桂 ・v金v玉 ・ ・v桂v香|一 | ・v飛 ・ ・ ・ ・v金 ・ ・|二 | ・ ・v歩 ・v歩 ・v銀v歩v歩|三 |v歩 ・ ・v歩v銀 ・ 歩 ・ ・|四 | ・v歩 ・ ・ ・v歩 ・ 歩 ・|五 | 歩 ・ 歩 ・ ・ 銀 ・ ・ ・|六 | ・ 歩 銀 歩 歩 歩 ・ ・ 歩|七 | ・ ・ 金 玉 ・ ・ ・ 飛 ・|八 | 香 桂 ・ ・ ・ 金 ・ 桂 香|九 +---------------------------+ 先手の持駒:角 歩 後手番 その図は46とって47歩成るで46角見て後手充分に思えるけど そう進んでも37に歩受けて僅かに先手持ちなんだねえ 短時間しか読ませてないがkai7 は評価値+100〜150な感じだった 1番目だけ見たけど泥仕合って感じ 羽生さんの選んだ棋譜って何番になるの? >>26 羽生セレクションの棋譜DL 棋譜の管理で見たけど引き分けの棋譜無くない? Aperyqhapaqにも勝つって書いてある。YaneuraOuの文字も(笑) For the shogi match, one game was selected at random for each unique opening sequence of 25 plies (when AlphaZerowasblack)or10plies(whenAlphaZerowaswhite). ってどういう意味だろう。なんの定跡? >>30 なるほど!ありがとう! なんか5手目▲9六歩ってこれから流行りそうw こういうのってどうなんですか?教えて詳しい人 To evaluate performance in shogi, we used Elmo version WCSC27 in combination with YaneuraOu 2017 Early KPPT 4.79 64AVX2 TOURNAMENT as a baseline program, using 44 CPU threads (on two 2.2GHz Intel Xeon Broadwell CPUs with 22 cores) and a hash size of 32GB with the usi options of EnteringKingRule set to CSARule27, MinimumThinkingTime set to 1000, BookFile set to standard book.db, BookDepthLimit set to 0 and BookMoves set to 200. Additionally, we also evaluated against Aperyqhapaq combined with the same YaneuraOu version and no book ?le. For Aperyqhapaq, we used the same usi options as for Elmo except forthebooksetting. 未だにボードゲームネタとかどーなってんの DLもまるで成長していないイメージにしかならんぞ >>33 そういう君にはカスパロフのこの言葉を Chess has been used as a Rosetta Stone of both human and machine cognition for over a century. AlphaZero renews the remarkable connection between an ancient board game and cutting-edge science by doing something extraordinary. Garry Kasparov, former World Chess Champion 羽生さんの言葉も Some of its moves, such as moving the King to the centre of the board, go against shogi theory and - from a human perspective - seem to put AlphaZero in a perilous position. But incredibly it remains in control of the board. Its unique playing style shows us that there are new possibilities for the game." Yoshiharu Habu, 9-dan professional, only player in history to hold all seven major shogi titles 玉が中央に進出するっていうのは12番目の棋譜のことを言っているのかな? 本当にゼロから学習してるのか?既存の定跡に近いものがたくさん 違った学習法だから見たことない指し方、展開期待してたのに、拍子抜け 横歩は江戸時代からあるけど▲3四飛のまま戦うのは400年間見落としていたともいえる 相掛かりで78金受けないで24歩つく棋譜や大駒や歩の不成まで何個か混じってるのは 勝負に影響がない類の「悪手」は残ってるんだねw 長年培われてきた定跡やら戦型がかなり洗練されたものだということがわかったな その中で新しい展開を探していくって感じで、全く未知のゲームになるわけではなくて安心した 囲碁みたいに謎の手順だらけになってやばいかと思ったわ 結局のところ良い手が有っても相手がそれを回避するから棋譜に残らないっていう1点に尽きるかと 棋譜だけ見せられてもな ソフト自身の解析見なきゃ意味がない ちょっと待って。>>28 にも書いたけど 定跡に使用についての For the shogi match, one game was selected at random for each unique opening sequence of 25 plies (when AlphaZero was black) or10plies(when AlphaZero was white). ってどういう意味だろう? 初手78金が結構多いな 後手の34歩と84歩を先手は歩を突かずに待ったほうが得だってことなのか? 21番の棋譜ここで▲6七玉も普通のソフトは指さないだろうな 中段玉マンぶりが表れている 後手:elmo 後手の持駒:歩二 9 8 7 6 5 4 3 2 1 +---------------------------+ |v香v桂v玉v金 ・ ・ ・ ・v香|一 | ・ ・v銀 ・ ・v銀v金 ・ ・|二 | ・ ・v歩v歩v歩v歩v桂v歩v角|三 |v歩 ・v飛 ・ ・ ・ ・ ・v歩|四 | ・ ・ ・ ・ ・ ・ ・ 歩 ・|五 | 歩 ・ ・ 歩 歩 歩 歩 ・ ・|六 | ・ 歩 歩 ・ ・ 銀 桂 ・ 歩|七 | ・ 角 金 銀 玉 金 ・ ・ ・|八 | 香 桂 ・ ・ ・ ・ ・ 飛 香|九 +---------------------------+ 先手:AlphaZero 先手の持駒:なし 手数=46 △7一玉 まで >>47 そこらへんは囲碁でも言われていたけどほとんど差がないけど学習の過程である特定の指し方が 強化されて選ばれやすくなっているだけなんじゃないかな >>48 浅い読みだと100点くらいは評価下がるから深く読まないと見えてこない手なのかもな >>49 その微妙な差が重要なのか気にしなくても良い物なのかを人間が判断しないといけないから大変だわな >>32 Xeon44コアのTCECでもハッシュサイズは16GBだから、32GBのハッシュサイズは 十分すぎるくらい十分だと思われる 設定についてはほぼ申し分ないかと >>46 アルファ将棋が先手のときは25手まで、後手のときは10手まで定跡進行にした 定跡の選択は1局ごとにランダムに変更、ってことだね どちらも「先に定跡を抜けるのはelmo」という点はいっしょだけど、 なぜこの数字を選んだかはわからない 最近の角換わりばかりの棋譜に食傷気味だったからかもしれないが 相掛かりがよく見られて楽しめる棋譜多いと感じた >>48 米長羽生の名人戦であったな この手見た瞬間羽生が負けを悟った、と ハッシュは1手当たりのノード数によるでしょ 10億ノードぐらいまでなら32GBぐらいで十分だけど それ以上ならあればあるだけいい elmoは1手120億局面で対局しているから AlphaZeroの手を評価するには 最低でもNNUEkai7で1手120億局面は欲しいね それでも互角くらいだろうから倍の240億局面が理想だけど現実的ではない >>53 羽生さんも棋譜見たときその記憶がよみがえったかもなw 中盤で差をつけてからの勝ち方が真綿で首を締める的な「ぬるい手」が多いのは 囲碁のモンテカルロ法の影響かな.詰みがあるときも詰まさないのがちらほらあるし >>51 どうも定跡を使ったのはElmo側でAlphaZeroは使っていないようだね。Table S9を見ると Table S3を見ると、Training timeは12時間って書いてあるけど、それだけ?はぁ Rotaさんが最新orqha or NNUEkai7 vs aperypaqやってるかなっと思って調べたけどやってなかった aperypaqにも勝率9割近いね 改めて見るとelmoのNPS2500万の3時間対局ってすごいな AlphaZeroじゃなくともそれだけリソース注ぎ込んだ最近の強豪ソフトの長時間対局棋譜(しかも100局も)というだけで価値があると思う 今の最強ソフトってAperypaqに85%以上の勝率残せるのかね? AlphaZeroはそのくらい勝てるみたいだけど レートからの期待勝率ではなく、実際に対戦してどのくらいの勝率なんだろう 最近のごちゃまぜ系列のソフトって相性問題がより過敏になっている印象 ソフトによってレート差と実際の勝率で差があることがよくあるよね >>59 レート的に今の最強でも80%くらいが限界だと思う もうちょいで追いつきそうってくらいかな >>59 その凄いことを出来るのにやらないのがnishimon 対elmoWCSC27勝率だけ見るとNNUEkai7とほとんど変わらないけど対Aperypaq勝率を見るとNNUEkai7よりR100-150ぐらい強いのかな でも結局マシンリソース的に互角の手合いなのかがわからないからなんとも言えないんだよね >>39 やねうら王/Rezeroも手法こそ従来と同じでも人の棋譜を参考にしてないのにあの結果なことを考えると予想できてたことでしょ リゼロは探索部に人類の工夫(ただ捨ては避けるとか)が含まれているから 完全なゼロベースとは言い難い AlphaZeroの棋風が既存のソフトと全く違って新鮮だな >>59 1局3時間の1000局 ディープブルー開発者、カスパロフ、羽生のコメント付き Deepmindらしいやり方 initialQ(FPU)論争を終わらせるために、MCTSの疑似コードまで付いてる terminal stateも前の論文は不明瞭だったのが 512手で引き分けと明確化された Cpuct C(s) = log ((1 + N(s) + cbase)/cbase) + cinit 再現が難しい数字出して一方的に殴るのはgoogleの得意分野 どうやらAlphaZeroは2時間の学習でelmoを超えたらしいからね self.pb_c_base = 19652 self.pb_c_init = 1.25 initialQとCpuctをいじる必要がなくなった LCZ 20xxx系のCpuct 5とか強くなるわけないわ 今、見たらもう30xxx系がCpuct 3から1.3になってた、クソ早い で、それを再現するのに2080Tiで何時間かかるやら Leela zero chessですら最新stockfishにまだ追い付けない ブレイクスルーというか、バーケードが破られた秘密が何か掴めるか >>74 2080Ti単品でやったら学習終わるまでにこっちが寿命迎えてしまう 成っても成らなくてもいいときは成らん.あえてね 取っても取らなくてもいいときは取らん.あえてね 挑発じゃないからね 三倍の電力差でaperypaqに勝率85%くらい 現在の最新ソフト(同スペック)で勝率70%くらい 仕事の片手間でソフト開発してる人からすればNNUE改造してる方が伸び代がありそう 41番105手目▲1三歩△同龍▲1四歩△同龍▲1六歩 先手勝勢の局面で歩を二枚プレゼント.まるで不利な方がやる水平線効果のような手 後手の持駒:角 香二 9 8 7 6 5 4 3 2 1 +---------------------------+ |v香v金 ・ ・v銀 ・v金v玉 ・|一 | ・ ・ ・ ・ と ・ ・v歩 ・|二 |v歩v歩 ・ ・v歩 ・v桂 ・ ・|三 | ・ ・ ・v歩 ・ 桂v歩 ・v龍|四 | ・ ・ ・ ・ 金 ・ ・ ・v角|五 | 歩 ・v歩 ・ ・ 銀 歩 歩 ・|六 | ・ ・ 桂 歩 歩 歩 ・ 金 ・|七 | ・ ・ ・ 銀 ・ 玉 ・ ・ ・|八 | 香 ・ ・ ・ ・ ・ ・ ・ 龍|九 +---------------------------+ 先手の持駒:銀 桂 歩四 elmo先手番の時、初手▲7六歩ばっかりじゃん なんで? AlphaZero先生によると、初手は▲2六歩らしい (Fig 3B) 初手▲7六歩だと負けが多い 対する後手の応手は△3四歩ということかな? △8四歩より勝率が高いから でも自己対戦は▲2六歩△8四歩の進行が圧倒的に多いけど 26歩34歩には76歩からの横歩取り青野流があるぞw >>78 平岡さんの以下ツイートにはaperypaqではなくelmoとあまりレート差がないelmoに追加学習したeloqhappaらしいんだが AlphaZeroと対局したelmo以外の評価関数、Aperypaqではなくeloqhappaの方か(´・_・`) 澤田さんのネーミングセンスがキツいっす(´・_・`) たしかあれはSDT5以前のやつだからelmoとそんなに強さ変わらないやつだったっけ?(´・_・`) >>85 それ平岡さんが勘違いしてる可能性が高い aperypaqが置いてあるURLがeloqhappaだから >>83 76歩34歩で後手ボロ負けしてるから、26歩34歩76歩で合流するのでは。76歩34歩の次の一手はほぼ間違いなく26歩だろうし >>78 白ビール(ショットガン)の芝先生も平岡さんへの返信でeloqhappaをaperypaqと勘違いしている可能性があるって AlphaZeroの中の人が勘違いしてる可能性あるね https://twitter.com/HiraokaTakuya/status/1070895184097857536 https://twitter.com/5chan_nel (5ch newer account) URLがエロ河童なだけでAperypaqが一番上にあるから間違えないだろ 平岡さんの勘違いでしょ AlphaZeroはelmoに三倍以上の電力で対局しているのでフェアじゃないよな 同じメーカー同士の家庭用パソコンでも三倍以上の電力のスペックなら強いからな stockfishの開発版は2018年1月バージョン使ってるよ 論文は History: Received for publication March 2, 2018 Accepted for publication November 7, 2018 電力消費揃えたらAlphaZeroはR4300くらいってとこなのかな eloqhappa aperyqhapaq 澤田先生のオリジナリティ溢れるネーミングのせいでdeepmindを混乱させてしまった説 deepmindが勘違いしたんじゃなくて平岡さんが勘違いした 参照元として貼られたURLのeloqhappaを見て判断したんだろう 実際にaperypaqは一番上に置いてある https://github.com/qhapaq-49/qhapaq-bin/releases/tag/eloqhappa >>96 そうはいってもaperypaqは2017.11.28リリースだが時期的に合わないんじゃないのか >>97 時期? 2017年12月に発表された論文と別だよ 今回はelmoも定跡使ってるし、ほぼ詰みまで指してる stockfishも2018年のバージョン使ってる >>96 後から一番上に追加されたからからいつそのページを見に来たのかという >>101 aperypaqは公開された時からずっとそのURLにあった あとから追加されたものが一番上に表示されるわけではない(QQRもここにある) >>99 例えAlphaZeroがelmoやaperypaqに今の最新ソフトより勝率が高いとしても三倍以上の電力差で対局して いるのでソフトだけの強さでいえば今の最新ソフトよりやや弱い程度だろう、今の最新ソフトも三倍以上の 電力差のパソコンで対局したらAlphaZeroよりもっと勝率が高くなるはず そもそもaperypaqが追加される前にページに来たならaperypaqの存在も知らずにelmo-qhapaqって書くだろう >>102 ん? あそこの置き場は後からどんどん追加されていっているのでは? QQRも追加されたんじゃなかったっけ? キャッシュ32GBの使用率考えたら120億ノードでも実質半分ぐらいの性能しか出てないんでは? まあHUGE HASHがデフォでオフだからしゃーないけど >>106 10億ノードで6GBくらいハッシュ使うからちょっと少なめかもね 勝率91.2%からaperypaqで約87.7%まで落ちてるから 70 Elo差が縮まってて、上出来だろう あの辺は同系統でレートインフレしてるだけだし 結論は三倍以上の電力差に加えて32GBの使用率考えたら120億ノードだと衝突して性能が十分出ていない のでフェアじゃないのは確かだな、ソフトだけの性能は最新ソフトの方がやや強いのは間違いないな >>105 そもそもなぜエロガッパを使ったと思うんだ? エロガッパは当時最強でもなんでもなかったし 優勝ソフトでもないのでdeepmindが論文に載せるはずがない ただURLがエロ河童だっただけだろ ユニバーサルメルカトル法並みの低能だなw フェアかどうかはelmo側だけ定跡使ってるのもどうなのってことになる wcscも環境は同じじゃないからフェアな大会じゃないことになる >>110 たしかにそうだが、向こうさんが何か間違えてる可能性もなくはないかと思ってね 結論としては電力消費やハッシュなんかを平等に近い条件に調整してあげると ちょうど現在のR4350とかなり近いくらいの棋力ってことになるのかな elmoの定跡は1年7か月前の大分古いもので今の最新ソフトには大してアドバンテージはないだろう >>112 wcscは青天井とは言わないけど 金積めば積んだだけハード上げられるしフェアな大会じゃないと思うけどな 厳密にルールが決まってるならフェアと言われるだろうし 何でもありも当事者の責任で最高のものを用意できる点でフェアだと思う ただ自分に都合のいい仮想敵を作って殴るのはフェアとは思えない いずれにしても三倍以上の電力差に加えてハッシュの衝突などを考慮すれば今の最新ソフトよりやや弱い程度だろう 消費電力ガーとか言い出すが奴がいるから 持ち時間を1/10にしても圧勝してる情報載せてるのになぁ >>119 持ち時間を1/10しても三倍以上の電力差は変わらんのじゃないのか ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる