コンピュータ将棋スレッド 148
■ このスレッドは過去ログ倉庫に格納されています
>どういう理由かはわからんが、
>早く賢くなるそうだよ
(mjk
何と比べて早くなると言っているんだ
勝った/負けたとか評価値が上がった/下がったとかいった情報の取り扱いに
確率以外の手段があるとでもいうのか ソフトが強くなりすぎて人間には正しく計測することすらできない時代か
そりゃ盛り下がるな 最近の統計学では、結果を点推定値(平均値など)ではなく、ベイズ推定による確率分布で示すことも増えてきたけど、それと関係あるのかな >>754
たとえば、
「最善手」は300±500、
「次善手」は250±50、
って時に、より確実に有利を維持できる次善手を選ぶようにならないかな?
より自然な指し回しになるかも >>759
確率「分布」を使わない場合と比べてだ
更新されたアピール文書を嫁 出力が確率関数でも勝ち負け引き分けの3値でも行列でも複素数でも何でもいいんだけどさ
要は全順序をどう入れるんだ?って話なんじゃないの?
じゃないと、単なる理系のオナニーだよw
本人は衆人監視プレーが好きなのかもしれんが 期待勝率じゃなくて期待勝率分布を使うってのはオナニーとかどうとかではなくて
単に強化学習の効率を上げるための一つの手段だよ
素の強化学習アルゴリズムでは地球が超新星爆発するまでに将棋が解けるかどうかっていうレベルから、微々たる効率アップでもたくさん積めばちょっとはましになるんじゃないか、という発想だな
それの現在の最も成功している例がDeepMindが発表したRainbowっていうDQNの発展形
そのRainbowアルゴリズムの中に、確率分布を使うってのも含まれてる >>767
猿が鉄になるまで待たないといけないのが
シェイクスピアの文章ができるまで待つに短縮できるぐらいかな suimonの本は400億ノードだったはずだが、陳腐化してしまったな
金のあるやつが勝ちというゲーム 元ネタの100メガショックはNEOGEOキャッチフレーズだから
むしろおっさんホイホイ 選手権前のこの時期にこんな成果物出してくるのはもしかして選手権はギブアップなのか? 強くならないし横歩も避けられへん…せや!パルプンテ唱えたろ!からの100テラショック やねさん、あきらめたら、いつも場をぐちゃぐちゃに帰っていくもんなw
WCSC27のときも大会前日とかに大幅に強くなった探索部のアップデート
まあ、あれでelmo優勝、pona引退になったわけだけどw >>781
elmoのときは探索もあったけど、elmo絞りがとにかく優秀だった やねうら王エンジンは1500万ノードよりWCSCのような高ノードでは強いからね
実際にポナ本さんの個人PC計測ではelmoよりポナンザの勝率が高かったそうだが
WCSCだとelmoが2連勝しているのもやねうら王エンジンの特性が出ている あとelmo、ぽんぽこ、白ビールと3大会連続でやねうら王エンジンが優勝していることから
やねうら王エンジンがWCSCのような高ノードでは強いことが分かる 初手の評価値プラスのこれであってる?
深さ 24 評価値 69 読み筋 ▲2六歩(27) △8四歩(83)
深さ 24 評価値 69 読み筋 ▲7六歩(77) △8四歩(83)
深さ 16 評価値 54 読み筋 ▲7八金(69) △8四歩(83)
深さ 3 評価値 16 読み筋 ▲1六歩(17) △3四歩(33)
深さ 2 評価値 14 読み筋 ▲9六歩(97) △3四歩(33)
深さ 9 評価値 8 読み筋 ▲4八銀(39) △8四歩(83)
深さ 2 評価値 6 読み筋 ▲3六歩(37) △8四歩(83) この二人は5chねらーだよな
suimon
@floodgate_fan
>RT
やねうらおさん定跡公開ありがとうございます。
100テラショック定跡、あとでその内容を精査してみます。
BigHopeClasic
@BigHopeClasic
@floodgate_fan
精査結果、楽しみにしています。
まふさんの反応も見てみたいなと個人的には。
suimon
@floodgate_fan
ありがとうございます。 一成さん、wcscにふらっと遊びに来るんじゃないかな。
言うてもコンピュータ将棋界の主役中の主役
だから盛り上がるのは間違いない。 なんか変だと思ったら設定のところの
BookMoves が初期値16だけど変更しないとだめなのか テラショックに初手68飛とかあるけどこれは振り飛車まだまだやれるってことなのか? >>786
初手76歩に対しては
84歩 26歩 評価値 -69 残り深さ 23
32金 26歩 評価値 -69 残り深さ 23
34歩 26歩 評価値 -76 残り深さ 24
62銀 26歩 評価値 -88 残り深さ 6
54歩 26歩 評価値 -169 残り深さ 3
他には74歩、42飛、32飛、52飛、24歩など
初手26歩だと
84歩 25歩 評価値 -69 残り深さ 23
32金 25歩 評価値 -69 残り深さ 23
34歩 76歩 評価値 -76 残り深さ 24
62銀 25歩 評価値 -88 残り深さ 6
52飛 76歩 評価値 -293 残り深さ 2 概念が違うとはいえdepth24とか見ると瞬間的には思ったより凄くないなとか感じてしまった。実際に搭載することでのレート上昇を見ないとなんともいえん。 テラショック定跡ありのレートもレート表に載せて欲しいな テラショック100局短時間対局させて見たら三間飛車をよく指すね、中飛車もたまに指す、
振り飛車をよく指すので、超低ノードではC-book2018 55-3-42 テラショックだった
やはり振り飛車は居飛車に対しては勝率が低いね、計測はillqha3-ditto4Sを使った >>792
> 概念が違うとはいえdepth24とか見ると瞬間的には思ったより凄くないな
24手先の局面でdepth 36以上相当で探索させてあるわけだから、これ単純計算だとdepth 60相当だよ >>798
(depth36相当の)最善手が24手先まで続くと読めば、確かに結構深い定跡ですね >>794
うちは三間飛車なんか一切指さないな
もしかしてBookEvalDiffを0にしてないんじゃ・・ >>801
0はBookDepthLimitだった
BookEvalDiffは初期値30のまま
やねさんの使い方には特にBookEvalDiffを0にするとは書かれていないけど depth24っていうのは、単に24手後まで定跡の入力があるというだけで、探索深さとはなんら関係ない。
定跡の最終入力手について、depth36で検討した評価値が定跡の評価値らしいので、信頼性は相当高いのではないか? >>803
BookEvalDiffは0にしとかないと最善手選ばないから悪い指し手選んじゃうよ
あとBookMoves 100とかにしとかないと17手目以降の定跡にhitしないよ
dolphin+illqha3(no_book) vs YaneuraOu(無改造) + tanuki-2018年度版
1手2秒対局はいまのところ18-3-33だな
レーティングサイトによると定跡なしならillqha3が相当強いはずなんだけど
定跡つけると少なくとも互角ぐらいにはなってるようだ 先手三間は入ってるね
駒組み段階で定跡切れるけど
全体的に本番までにはもっと深くなるのかな 定跡使うだけで上位ソフトの勝率ガタ落ちなのかw
ここ1年上位ソフトが強くなってない説ってマジだったの? >>806
BookMovesは120でやった、BookEvalDiffは30でやったけど片方のC-bookも同じ設定なので
お互いが最善手選ばない同条件なのであまり関係ない気がする、片方だけ0でもう片方が30なら
条件が違うので差が付くのも分かるけど 見かけ残depth0や1の指し手が多く入ってるのは、差がついて必要なくなったので以降はdepth36相当での検討を打ち切ったってことか。
depth4とか8の奴もその局面から近いうちに差がつくという意味合いになるんかな。 手数は短いけど相当石橋を叩いて渡り作った定跡という印象を受けた
評価値眺めるだけでもある程度勉強になるな >>809
> C-bookも同じ設定なので
俺C-book見てないけど、千田先生が手で入力されてるなら
そこについてる評価値って出現頻度か何かで局面の評価値とは異なるのでは・・
とりまBookEvalDiffは5以下が良さそうだよ(俺は0にしてる) 定跡ファイルはとりあえず嵌め負けを防ぐ安全志向のと
積極的に得意戦法に誘導しに行くタイプがあるんかな。
同じ定跡ファイルでも設定でその辺を調整できるだろうから
強さも多少変わってきそう >>806
気になるのは、tanuki-2018が中終盤型で序盤型のNNUE評価関数に対して序盤を切り抜けたら強いと書いてあるところ。
もしかして100Tショック定跡同士でもtanuki-2018の方がアドバンテージあるのでは? depth 36相当 *以上* って書いてあるね。
さすがに凄い定跡 そしてなぜか大会前に公開 BookEvalDiffを30から0にしたらテラショックの振り飛車採用率が2割弱まで下がったので勝率が上がった感じ?
共通設定 illqha3-ditto4S使用 BookMoves=120 一手0.2秒 2スレ Hash1024 投了値3000
両方BookEvalDiff=30 C-book2018 55-3-42 テラショック
両方BookEvalDiff=0 C-book2018 51-1-48 テラショック 最近のAobaZero右四間v.s四間飛車が気にいってるようでおもしろい ponanzaはさくらインターネット使って圧倒的な数の暴力で教師データ作って無理やり強くしていたけど
elmoの登場であっさりと追い付かれて今までかけた金が無駄になってしまって協力受けるのが難しくなったんだろうね
成果が出ないものに企業は協力してはくれないからね ポナは今後数年最強との触れ込みで、前評判が凄かったからelmoの衝撃は大きかったな
しかも、手法とソフトすぐ公開してくれたし、前回は200手の件で残念だったが瀧澤さんには今回も期待している >>806
評価関数の強さを比較したいのになんで別々の探索使ってるんだ
それじゃあきちんと比較できないだろ >>822
俺は評価関数の強さを比較したいのではないよ
定跡なしのときにR100ぐらい差があると言われている2つのソフトに対して、
弱いほうのソフトだけ定跡ありにして比較したときにそのR100が覆るかを検証している
illqha3は、探索部dolphinとセットで配布されていて、レーティングサイトにRの記載がある(R4370)
https://www.qhapaq.org/shogi/
対してtanuki-2018 + 標準やねうら王は、この表でR4250付近であることがわかっている >>823
なるほど理解した
レーティングサイトと同じ対局条件で定跡ありでやってるってことかな? >>806
2秒で1500万ノード超えだと9700Kとかかな?
そのくらいのスペックでも羨ましいわ
Zen2が16コアで出たら買うかなー >>820
お前、高収入で美人の嫁がいる山本さんに嫉妬してるの? 序盤強い評価関数で定跡掘って
中終盤強い評価関数で戦えば最強ということでは? 山本君給与上がったのね。
HEROZの中の人が巡回中らしい。 昼休みにやねうら王のtanukiに角落ちで軽く3回負けたw 評価関数が思ったほど成長してないのほかに定跡がそれだけ優秀って見方もありなの? やっぱ
「コンピュータ将棋と言えば?」
と問われれば
「ponanza の山本さん!」
てことになっちゃうのかなぁ。
※保木さんは別格なので除く >>831
たややんさんが互角局面だったか定跡だったか使って対局してちゃんと強くなってたはずだが 今日の日本棋院のメルマガ
>【明日11時〜】囲碁AIに関する重大発表
> 明日18日午前11時より囲碁AIに関する重大発表があります。その模様は日本棋院囲碁チャンネルで中継されますので、ぜひご覧いただければと思います。
コンピュータ囲碁は大きな動きがあるのかな? >>836
テラショック定跡は振り飛車とかもガンガン入っていて対局で使ってもあまり強くない >>823
狸は4250じゃなくて4150だよな? テラショックはuuunさんの計測では相手が定跡なし、テラショック同士で戦型や振り飛車採用率が
全く違うらしいね、うちの対C-book2018では振り飛車採用率が2割弱もあったのにuuunさんの計測では
テラショック同士では角換わり100%で、対定跡なしだと横歩取りが多いとかここまで変わる定跡も珍しい テラショックは他の人の計測を見ても相手によって振り飛車をガンガン指すこともあるので
勝率優先のガチの対局には向いてないのかも >>839
>>840
初手に飛車振るかどうかって相手は関係なくて単に設定の問題じゃないの? >>841
設定は全く問題ないはず、以下の共通設定で同じ条件で対局させているから
BookMoves 120
BookEvalDiff 0 or 30(どちらも振り飛車を普通に指す)
BookDethLimit 0
ConsiderBookMoveCount 0 >>838
tanuki-2018年度版というのは、将棋神やねうら王に収録されてるやつ
tanuki-のWCSC28版よりR50以上強いことが手元の計測でわかってる
>>839
uuunさんもBookEvalDiffを0にしてないとか?
あとは片側を定跡ありにした時点で戦型がかなり偏るので持ち時間を
色々変えたりしないと意味のある計測にはならない
俺はある局面についてdepth 36の指し手が登録されてるだけでも驚異だと思うよ
これ50億ノードぐらい探索させないと到達しない指し手でしょ >>842
訂正
× ConsiderBookMoveCount 0
〇 ConsiderBookMoveCount True >>844
俺そのオプションよく知らないんだけど説明見た感じだとそこTrueにしちゃうと
評価値無視して採択率(すべて1)に従って等確率で指さない? >>842
BlackLimitとWhiteLimitは? >>843
定跡ヒットは持ち時間関係なくない?
一手1秒でも一手100秒でも定跡がヒットすればノータイムで指すから
定跡が切れたら当然持ち時間でノード数が変わるので指し手は変わるけど
両方が定跡使用している場合は振り飛車を定跡ヒットで指す場合は持ち時間に依存しないのでは 100T定跡は大定跡新定跡寄りの評価値ベースのdbなのでNarrowbookはonoffで特に意味を為さないし、
Considerbookmovecountについては>>845が言ってる通り。
それにしても定跡関連コマンドの再説明からしなくちゃならんとはやねさんも大変だなw >>846
BookMoves 120
BookEvalDiff 0 or 30(どちらも振り飛車を普通に指す)
BookEvalBlackLimit 0 (初期値)
BookEvalWhiteLimit -140 (初期値)
BookDethLimit 0
ConsiderBookMoveCount True >>847
俺のもともとの趣旨は>>823なので片方だけ定跡ありでの話をしている
両方定跡ありの場合は定跡抜ける局面までは持ち時間関係ないのはその通りだけど
その場合でも定跡抜けたあとの局面での勝率を計測したいのでそのあとの指し手が
ばらついて欲しいので持ち時間のランダム化はするのが好ましい 実際は互角局面でも振り飛車が不得意だから負けてしまうのでは? プロの間でも振り飛車党が多数派だったことなど一度もないのだから
推して知るべきというのが統計的なものの見方だろう
勝利を得る手段としては簡明ではないのであれば強化学習ではつねに否定的に扱われて当然 >>845
>>848
>>849の設定をConsiderBookMoveCountだけFlaseに変更して前と同一対局したら
テラショックの振り飛車採用率は10局中3局もあったのでこの設定はテラショックに関しては
あまり関係ないと思う 勝率はC-book2018 (振り飛車採用率0%) 8-2 テラショック(振り飛車採用率30%) テラショックはC-book2018との対局に限っては設定をどのように変えても振り飛車採用率を
2割弱より下げることは無理かも 毒饅頭定跡か
中身をしっかり確認せずに使う開発者をあざ笑うための公開だな、きっと 確かに中身見てみるとかなり点差がある局面も入ってるな 点差のある局面は相手が悪手を指した時に咎めるために入ってるだけ ■ このスレッドは過去ログ倉庫に格納されています