▲コンピュータ将棋スレッド126
■ このスレッドは過去ログ倉庫に格納されています
>>539 探索部も評価関数も違うなら自己対戦のバイアスかからないはずなのに、勝率66% ってすげーな dlshogi動いた、確かに1000npsでボナンザ6に勝てる https://i.imgur.com/tubOboz.jpg でも1手3秒ってのはどうなんだ? 山本だって、1手10秒でやったのに、それより短いんじゃ、 ちょっと正確性が担保できてるか疑問。 今回の電王トーナメントでの収穫は、引退する山本一成から↓の発言が出た事だな。 以前から言われていた事ではあるが、将棋も暗記ゲーの時代に本格的に突入か。 30 名前:名無し名人[sage] 投稿日:2017/11/12(日) 16:30:03.16 ID:ILaYswGe [1/5] 定跡が進みすぎると、オセロのようになるのか オセロは定跡だけになってるらしい 山本の話は興味深いな 256 名前:名無し名人[sage] 投稿日:2017/11/12(日) 17:10:11.32 ID:qYiaoJcH [4/5] 昔 山本「定跡は弱者の戦略」 今日 山本「定跡で勝負が決まるとか将棋の終わりが近づいている」 >>545 定跡offで互角局面集でたくさん対局させるのがいいらしいのですが 定跡offで互角局面集なしで検証してる人がおおいみたいです >>549 人間の間では暗記だけでは絶対に勝てないから影響はない コンピュータは普通の初形からの対戦がなくなるってだけ まあ、今回の大会でも、あんだけ強いソフトの評価が反省したり色々あったから、 十分将棋の沼がまだまだ深いことを示せたとは思う。 >>551 ただの暗記だけではなく、 プラスでプロ棋士やアマ高段くらいの棋力があれば、影響は大アリでしょう。 毎回相手に二つの選択肢があったとすると60手まで暗記しようとすると 10億の変化を記憶しておく必要があるんだけど 今のコンピュータ将棋の定跡は最善手というより実践的な戦略 >>554 実際は優勢になる変化は覚えるのは途中までで良かったり、 手順前後の同一局面や 部分定跡とかも使えるから対人でも有効 互角局面集などそれこそゴミ 初期局面からそこにいかなくなってしまったら何の意味もないし そもそも本当に互角である保証すらない 今やるテストを楽ちんぽんにする程度の代物だよ 完全な引き分け局面じゃなくても両方に前後持たせてやれば問題ない ちゃんと双方勝てれば一勝一敗で互角になるし チェス: Deep Blue (IBM) 囲碁: Alpha Go (Google Deep Mind) 将棋: 平成将棋合戦ぽんぽこ(のだくん) >>560 チェス: Deep Blue (IBM) 囲碁: Alpha Go (Google Deep Mind) 将棋: Tanuki-(Mr. Noda) こうだろ そういうときに使えるのが屋根の定跡やな 互角部分だけ切り抜いて使えば超簡単(ダイマ) >>559 両方先手が勝つかあるいは後手が勝つかしたら互角じゃないじゃん 同一局面で先後入れかえはテスト手法としては有効なのは認めるが それと自称互角局面集の有効性は別物 >>557 今互角と判断していても、強くなった1年後のソフトが多くの局面で互角と評価しない可能性が高い。 そんな局面で対局しても、信憑性に欠ける。 特に信頼区間とかこだわるのなら、少し時間かかっても普通に平手で一定ノード以上で計測すべし。 人間にとって都合のいいことばかりやっててはダメと思うがね。 だいたい先後両方今のやねうら王で対局させると 序盤から中盤にかけて両方俺がいいとかなるケースがしばしばある どっちかが勝手読みしているか 両方勝手読みだがどちらかが結果オーライなわけだが これは互角局面集以前の状況の話になる 互角局面集でのテストですべてがわかるわけではない 僕は全くの素人で、Aperyを使いたくてsuimonさんのブログの説明通りにやっても出来なかったのですが、ブログが間違ってたんでしょうか >>558 平岡 拓也??\(´・_・` )/??? @HiraokaTakuya 53分前 返信先: @floodgate_fanさん ブログ拝見しました。Apery_SDT5ではKKは使用しないので、やねうら王などで使用する際にはKK_synthesized.binは0埋めしたものにする必要があります。 オセロの定石にも2種類あって。 一つは、パブリックドローと呼ばれるもので、双方最善で引き分けが保証されて いるもの。これはオセロ程度の局面数だからできる事。完全解析はまだだけど 20手目以後なら完璧。オセロが定石でオワコンなのは、こちらの話。 もう一つは、二度と同じ負けをしないためのもので、言ってしまえばQ値をDB化 して発生する都度登録更新するようなタイプ。相手が変わったら必要となるエントリ も変わってしまうけど、同じような評価関数を使っていれば、皆同じような手を選択 するから、Q学習と違って全部の局面を登録する必要が無いし、全部の変化をテスト してはいけないもの。ただ、これを定石と呼ぶのは個人的にかなり抵抗がある。 将棋の定石も後者なんでしょ? 結局本番のやねうら王ってどういう仕様だったの? ナブラは使ったの? Apery強いな 長時間読ませた場合は分からないけど 短時間ならyaselmoと評価値食い違ってて面白い 詳細の検証は人に任せる >>568 456がsuimonさんのブログを参考に変換したものですけど平岡さんのと同じくできました >>528 と >>558 は同じものなの? 528のを落として試しているところだけども >>568 最後の方のEYaneuraOu-2017-early-learnを起動の次にコマンド画面で先に SkipLoadingEval trueを入力したら出来たよ。suimonさんのブログの説明通り だと自分も出来なかった。まあ平岡さんが変換したものを公開されたので、そ れを使えばいいだけだけど、平岡さん親切だけど、suimonさんもいち早く、やり 方を公開してくたのでsuimonはとても親切な人だと思う。 >568 https://twitter.com/HiraokaTakuya で本家本物(大樹の枝 やねうらおう 読み太などで使える)がある >>455 じゃあどうして下山さんはいなくなってしまったんやろ・・ AUTO君と下山さんでPonanzaが自動で強くなってれば、 山本さんは広告の効果を享受できつつ、今後の別の活動にも支障がないよね? >今回のやねうら王は、学習時に人間の棋譜を用いていない。いわゆるリゼロ系である。学習時に人間の定跡も用いていない。 >初期局面から何手かランダムムーブさせた局面からdepth 10で対局させたものを教師局面として用いている。 そういやナブラ評価関数ってこういうことでOK? >>576 >>578 >>579 ありがとうございます。Apery使えるようになったので、これからyaselmoと対戦させてみます。 今のところ計測中 Aperyの特徴 NPSが多い(その分枝刈り激しくて見落とす? 終盤弱い原因?) 一番強いかは疑問(やねうら王発言) 公開されている中では今のところ暫定一位ですね >>582 502さんの情報でAperyとYaseiYomita_20170703のキメラが強そうなのでためしてみてはどうでしょうか 4T5Sec yaneuraou(apery_sdt5+YY) 44-4-18 yaselmo 2T5Sec yaneuraou(apery_sdt5+YY) 35-4-23 rere >>584 分かりました。Apery、yaselmoより強い感じですね。これからキメラしてやってみようと思います。 >第27回世界コンピュータ将棋選手権が終わってから作成しているものは、 >現時点においても「横歩取り」を一切指さずにyaselmoに勝率80%程度あります。 >何とか開発時間が取れるようになりましたら、第28回世界コンピュータ将棋選手権においては、 >【横歩は終わった】と言えるものを発表出来たらと思っております。 横歩の選択権は後手にあるから、ということはつまり 先手番で後手が横歩にしたらほぼ確実にスナイプ可能な定跡ということか。 まあ、実際プロでも後手が横歩を受けずに回避している現状を見ると、 そういう方向に向かっていくのかもしれないけど、 今回どのソフトも後手番の定跡で横歩を回避しなかったのは、 後手横歩でもそこそこやれるって判断だったのかなあ。 >局面はひねり飛車を理解出来ていないようです。 >※たぶんelmoは飛車振っても戻すくらい飛車の配点が偏っているから、このような誤評価が起こると考えています。 >こういった部分はいまのところ定跡でカバーするしか無いのでは? モテのひねり飛車にえらく辛い評価値出すのもこのせいなのかな。 あ、ひねり飛車と向かい飛車間違えた。ボケ過ぎorz >>580 そもそも下山さんが入る前のponanzaだって、ザコでも何でもない。 プロ棋士はそのソフトに負けたし、 2013年のWCSCは準優勝だ。 まあ、山本が嫌いなゆえにちょっと極端な表現を使ってしまったんだろうが。 ちなみに、下山さんが抜けた理由は、満足したから。 下山さんは将棋界最高峰の頂点に登り詰めて満足して下山したんですね分かります。 電王トーナメントの棋譜が公開になったね! これを盤駒で並べてみよー >>551 >>553 6x6オセロは後手必勝の手筋が判明してるが、変化が多すぎて人の脳では覚えきれないんだよな しかし今のPCのRAMとHDDなら全変化を記録し読み出すのは簡単 >>549 つまり山本が言うように6x6オセロは人にとってはゲームだが PCにとっては定跡データベースを読むだけの作業になってる チェスはつまんないから定跡データベース選手権にならないようにしてるんでしょ また、まふさんのポエム聞けて良かった。 まふさんほどは定石作りこめないが、もう少し真剣に作り込んでみます。 Twitterで誰かが言ってたけど、book禁止の大会があったら面白いなと思う >>594 今年のTCECでは、1次ラウンドは24チームの1回戦総当りだった。 チェスの先手番後手番の有利不利は言わずと知れた事で、TCECでは全ラウンドで オープニングは主催者指定のものを必ず同じものについて先手後手両方でするようにしているが、 今回については、1次ラウンドは特に先手と後手の差が出ないオープニングを選定したと言っている。 Special selection of openings: TCEC will have the finest selection of openings, guaranteeing combative chess and also eliminating the one more white game advantage in single round robins. The amazing openings are the work of the finest experts in the field ? Nelson Hernandez and Jeroen Noomen. You can see Nelson Hernandez explaining the huge work behind the scenes in the video here >>561 人間を破った歴史的なソフトという意味なのでは つまりポナンザ 今は途上国向け劇安スマホでもDeepBlueよりはるかに強いが それでカスパロフGMを破ったDeeoBlueの価値が下がる訳ではないからな shotgun対たぬきを見る限り、 たぬきは横歩定跡で徹底的にいじめられたら、多分人間にも勝てない。 ま、だからたぬきが弱いわけではなく、対人とは別という話だが。 尤も、ソフトも定跡勝負となってくると、そうも言ってられないかもな。 shotgunだから仕留め損ねただけで、 ベスト5のソフトとshotgun定跡抜けた段階で対局したら、まず逃さないだろう。 AperyはR4200ほどだと思われます(やねエンジン使用) 公開されたとして たぬき>カパック>Aperyくらいで 微差となると思います Aperyをやねうらエンジンで対戦させてるけど 本当に強いみたいだな core i7-7700のPCでtamoreと対戦させてるけど 定跡なし、5秒の設定で 20戦させた時点で18勝2敗で大幅な勝ち越しだ aperyの評価値って、もともと少し数値として高めに出る傾向あったけど、 どういう原因なんだろうね。 長時間での計測を例の人にやってもらいたいところだな。 >>603 ゴメン間違えた 16戦した時点で 14勝2敗でした >>604 以前の超楽観と言われてた頃のponanzaと同じじゃね? shogi686_sdt5 shogi686の第5回電王トーナメントバージョンです。 ダウンロード→https://github.com/merom686/shogi686_sdt5/releases shogi686micro 2.0をベースに、2駒関係の評価関数と自己対戦による学習を追加しました。 駒割だけの状態から学習させています。 探索は、優越局面の検出と簡易的な置換表を加えた程度で、ほとんどいじっていません。 評価関数も探索も、終盤は弱いです。 select766@ねね将棋 @select766 11月12日 ねね将棋のソースコードを公開しました。環境設定が煩雑ですが、それでもよければDeep Learningベースの将棋ソフトの一例として試せるかと思います。 https://twitter.com/select766/status/929563035487760386 https://github.com/select766/neneshogi >>602 個人的にですが Apery R4200強 ぽんぽこ R4180 Qhapaq R4170 だと思うんですが力戦を主力とするQhapaqだけ 他のソフトと毛色が違うような気がするので楽しみです 棋譜見ると初手で銀動かしてるようですね どなたかaperyの導入手順1から教えてくれませんか? elmo導入と同じだと思ってやってみましたが7月24日以降やねうら王のフォルダ構成が変更されたらしくわかりません 僕の環境だと野生読み太ブレンドしてもそんなに強さ変わらないですね。 今のところ、8スレッド3秒で、対yaselmoに、12-0-10 やねうら王+Apery強いなぁ これでYorkieマージして野生化させたらさらに強くなるのか でもyaselmoとAperyと戦わせてみたけど そこまで圧倒的に強いって感じはしない >>618 瀧澤さん曰く、選手権時より自己対局でR200強くなってるとのことで、R4300か。 yselmo+100相当だな。 >>621 ついにトッププロに対して+1000超か・・胸熱 >>612 そうではなくてやねうら王でApery_SDT5を動かすにはどうしたらいいのか聞いてるのですが elmo R400弱に勝率71%だと+150程度だと思うけど もう少し強そうだからR4160付近じゃなくて? >>615 no_book, ResignValue1000、タヌキ互角局面集使用での対局みたいなので条件によってかわるのかもしれませんね Aperyの改良点がよくわからん、3駒は頭打ちしてたんじゃないの?学習方法? あとKKP16bitってやねうら王対応してるんだっけ してないなら最適化してあるAperyエンジンの方が探索が浮かむ瀬相当でも強いとかあるのでは? >>623 平岡さんが公開してくれた変換済み評価関数をダウンロードしてelmoの評価関数といれかえれば すぐに使えます >>622 それはすでにyaselmoの段階で達成できてる >>627 やねがちらっと言っていたが教師局面の作り方に改良があるらしい Aperyもキメラ伸びないから既に何かとキメラしてる可能性あるかなぁ・・・ >>628 elmoじゃなくてやねうら王のファイルと入れ替えるんだよね 今のフォルダ構成がどうなってるかわからんけど evalフォルダの中にある奴でしょ キメラで伸びる評価関数は、その評価関数に欠陥があるだろう派 >>623 100やそこら上のレスぐらい見たらどう? 平岡さん公式の変換済バイナリがあるよ。後はそれをevalにいれるだけ。 >>622 トッププロのレートって実際どれくらいかは難しくない? ハードウエア制限とか、貸し出しハンデを込みで-1400前後ぐらいとみていて、 プロ側に優しく判定しても+1000は堅いという意味だった。 >>632 やねうら王でelmoを使っているのを前提として書いてしまいました。すみません v479だと実行ファイルが入っているだけです 名人相手で10枚落ちでもソフトが全勝するのに 10年くらいで到達できそう? >>635 readmeの通りにフォルダ配置して評価値入れるだけだぞ 10枚落ちって王と歩だけだろ それなら神様にでも勝てるだろ 続・途中経過 同エンジン同設定・定跡なし・3秒(12-15Mノード) apery対yaselmo 86-5-58 おいおい、WesternLariatつえーな elmo_sdt5_14cが一方的にボコられやんけ すみません最後にもう一度確認させてください やねうら王最新バージョンを使用してます source→eval→kkp〜やeval〜などいろいろあるところにBINファイル3つ貼り付ければおkですよね? >>643 最新版よく知らないんだけど yaneuraOuの実行ファイル(.exe)があるところに evalフォルダを作って その中にAperyの評価関数ファイル(.bin)の三つのファイルを入れればいいと思う ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる