コンピュータ将棋スレッド 148
■ このスレッドは過去ログ倉庫に格納されています
何をもって廃れたと仮定するのかがよくわからないけどね
ソフトを使っての研究なんていまやほとんどの若手が取り入れてるし、藤井くんに至ってはもうパソコンを買い換えるらしいぞ 見るコンテンツ、エンターテイメントとしてはね
人間を超えるってのを大目標にやってきて、それを達成してしまったわけで
ただ人間を超えて、ツールとしては、プロ棋士には逆にもう無視できない存在になった 西尾も書いていたがソフトが1000点とか言い出す局面がどんどん序盤になって
棋士はその理由が分からなくなっていくんじゃないか?
仮にソフトが+500とかいう20手目の変な形を真似したとして、それで棋士が
その後を正確に指せるとは思えない やねさんの記事での時間1000倍でR+2000は盛り過ぎじゃない?
同系対決という話もあるけど、R2000差はorqhaとGPSshogiくらいあるでしょ >>735
そこから考えてもわからないかもしれないが、指してみれば確かにそうなる。
と言うのが進歩のあり方になる。 >>735
ぽんぽこがponaよりも評価値を大きめに出すのもそれか >>733
一成さんのようなタイプの人物が去った。
↓
華のない、おいしくない分野になったから。
↓
つまり廃れた。
明瞭な三段論法だよね。 ソフトの候補手や評価も変化するんだからあまりとらわれ過ぎるのもどうかと思うわ この先10年くらいはまだ健全にソフトとつきあえそう
もっとっもっと進化したら戦型が絞られまくるんだろうな
初手76歩ついたら評価値-200みたいな 一成さんのようなタイプの人物が去った。
↓
×華のない、おいしくない分野になったから。
〇やねうら王ライブラリ勢に勝てなくなって去った
↓
Xつまり廃れた。
〇NNUE、3駒、ディープラーニング勢の主に3つどもえの対決になり
3駒全盛期より面白みが増している >>739
やはりPONA山本のような憎まれ役がいたほうが
観戦に熱が入るかも >>742
引き分け定石(未解明だけど)が周知されているオセロなんかだと、
強い人は、暗記対策でわざと2目負けの筋に誘導して、純粋な読みの
勝負に持ち込むとか何とか聞いた事がある。 >>744
ソフト同士の戦いと言いながら、実は開発者という人間同士の戦いだったという事 来月のWCSCはプロ棋士や女流棋士の人たちも注目している人が多いはず
多数の棋士がソフトを先生代わりに研究に使っているので身近な大会に興味がある人は多いはず wcscに興味があるなら、同時期開催のR選手権には出ないよね。 今やプロは最新ソフトの序盤戦術に興味津々のはず
表だっては言わないけどマイナーな最新ソフトもチェックしてると思うよ OpenAIの人工知能「OpenAI Five」が人間の世界王者を撃破、
誰でもオンラインでOpenAI Fiveと戦えるキャンペーンも期間限定で開催予定
https://gigazine.net/news/20190415-openai-defeat-world-champion/ こういうのってBOTなのかそれともマウスやキーボードを操作してのAIなのかで雲泥の差だと思うんだが
BOTなら別に大したことないでしょ もし、2手目3四歩が悪い手という結論になったら、
俺は、将棋をやめる 評価値が確率分布ででるとどういうメリットがあるんだろ?
不利な時に勝負手指せるとか? 山本がいなくなったのは単にフロントランナーを努められなくなったからだろ
DLに至っては他人を巻き込んで恥をさらしたのみ
事実だけながめれば一発当てた山師となんらかわるところはない >>754
どういう理由かはわからんが、強化学習の学習効率があがる、つまり早く賢くなるそうだよ
それ以外に分布で出ることを利用していろいろできるのかもしれないが
そういう実用例はまだなかった気がするよ 後手の持駒:なし
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香v桂v銀v金 ・ ・ ・v桂v香|一
| ・ ・v玉 ・v金v飛v銀 ・ ・|二
| ・v歩v歩v歩v歩 ・v角v歩v歩|三
|v歩 ・ ・ ・ ・v歩v歩 ・ ・|四
| ・ ・ ・ ・ ・ ・ ・ 歩 ・|五
| 歩 ・ 歩 ・ 歩 ・ 歩 ・ ・|六
| ・ 歩 ・ 歩 銀 歩 ・ ・ 歩|七
| ・ 角 ・ 玉 金 ・ ・ 飛 ・|八
| 香 桂 銀 金 ・ ・ ・ 桂 香|九
+---------------------------+
先手の持駒:なし
後手番
手数=19 ▲3六歩(37) まで
【右ミレニアムを含みにした△7二玉型四間飛車対策決定版】
△4三銀→▲7八銀から対振り銀冠、隙あらば銀冠穴熊。
△8二玉→右ミレニアムが消えたので、▲7八玉から居飛車穴熊を目指す。
△6四歩→▲7八玉。△4三銀には▲5五角で6筋を咎めに行く。△8二玉には▲7七角からやはり居飛車穴熊模様。
持久戦中心の指し方は堅さが生きる展開になりやすく、実戦的にも勝ちやすい。
持ち時間の短いアマ大会や将棋対戦アプリでは特にオススメだ。 >どういう理由かはわからんが、
>早く賢くなるそうだよ
(mjk
何と比べて早くなると言っているんだ
勝った/負けたとか評価値が上がった/下がったとかいった情報の取り扱いに
確率以外の手段があるとでもいうのか ソフトが強くなりすぎて人間には正しく計測することすらできない時代か
そりゃ盛り下がるな 最近の統計学では、結果を点推定値(平均値など)ではなく、ベイズ推定による確率分布で示すことも増えてきたけど、それと関係あるのかな >>754
たとえば、
「最善手」は300±500、
「次善手」は250±50、
って時に、より確実に有利を維持できる次善手を選ぶようにならないかな?
より自然な指し回しになるかも >>759
確率「分布」を使わない場合と比べてだ
更新されたアピール文書を嫁 出力が確率関数でも勝ち負け引き分けの3値でも行列でも複素数でも何でもいいんだけどさ
要は全順序をどう入れるんだ?って話なんじゃないの?
じゃないと、単なる理系のオナニーだよw
本人は衆人監視プレーが好きなのかもしれんが 期待勝率じゃなくて期待勝率分布を使うってのはオナニーとかどうとかではなくて
単に強化学習の効率を上げるための一つの手段だよ
素の強化学習アルゴリズムでは地球が超新星爆発するまでに将棋が解けるかどうかっていうレベルから、微々たる効率アップでもたくさん積めばちょっとはましになるんじゃないか、という発想だな
それの現在の最も成功している例がDeepMindが発表したRainbowっていうDQNの発展形
そのRainbowアルゴリズムの中に、確率分布を使うってのも含まれてる >>767
猿が鉄になるまで待たないといけないのが
シェイクスピアの文章ができるまで待つに短縮できるぐらいかな suimonの本は400億ノードだったはずだが、陳腐化してしまったな
金のあるやつが勝ちというゲーム 元ネタの100メガショックはNEOGEOキャッチフレーズだから
むしろおっさんホイホイ 選手権前のこの時期にこんな成果物出してくるのはもしかして選手権はギブアップなのか? 強くならないし横歩も避けられへん…せや!パルプンテ唱えたろ!からの100テラショック やねさん、あきらめたら、いつも場をぐちゃぐちゃに帰っていくもんなw
WCSC27のときも大会前日とかに大幅に強くなった探索部のアップデート
まあ、あれでelmo優勝、pona引退になったわけだけどw >>781
elmoのときは探索もあったけど、elmo絞りがとにかく優秀だった やねうら王エンジンは1500万ノードよりWCSCのような高ノードでは強いからね
実際にポナ本さんの個人PC計測ではelmoよりポナンザの勝率が高かったそうだが
WCSCだとelmoが2連勝しているのもやねうら王エンジンの特性が出ている あとelmo、ぽんぽこ、白ビールと3大会連続でやねうら王エンジンが優勝していることから
やねうら王エンジンがWCSCのような高ノードでは強いことが分かる 初手の評価値プラスのこれであってる?
深さ 24 評価値 69 読み筋 ▲2六歩(27) △8四歩(83)
深さ 24 評価値 69 読み筋 ▲7六歩(77) △8四歩(83)
深さ 16 評価値 54 読み筋 ▲7八金(69) △8四歩(83)
深さ 3 評価値 16 読み筋 ▲1六歩(17) △3四歩(33)
深さ 2 評価値 14 読み筋 ▲9六歩(97) △3四歩(33)
深さ 9 評価値 8 読み筋 ▲4八銀(39) △8四歩(83)
深さ 2 評価値 6 読み筋 ▲3六歩(37) △8四歩(83) この二人は5chねらーだよな
suimon
@floodgate_fan
>RT
やねうらおさん定跡公開ありがとうございます。
100テラショック定跡、あとでその内容を精査してみます。
BigHopeClasic
@BigHopeClasic
@floodgate_fan
精査結果、楽しみにしています。
まふさんの反応も見てみたいなと個人的には。
suimon
@floodgate_fan
ありがとうございます。 一成さん、wcscにふらっと遊びに来るんじゃないかな。
言うてもコンピュータ将棋界の主役中の主役
だから盛り上がるのは間違いない。 なんか変だと思ったら設定のところの
BookMoves が初期値16だけど変更しないとだめなのか テラショックに初手68飛とかあるけどこれは振り飛車まだまだやれるってことなのか? >>786
初手76歩に対しては
84歩 26歩 評価値 -69 残り深さ 23
32金 26歩 評価値 -69 残り深さ 23
34歩 26歩 評価値 -76 残り深さ 24
62銀 26歩 評価値 -88 残り深さ 6
54歩 26歩 評価値 -169 残り深さ 3
他には74歩、42飛、32飛、52飛、24歩など
初手26歩だと
84歩 25歩 評価値 -69 残り深さ 23
32金 25歩 評価値 -69 残り深さ 23
34歩 76歩 評価値 -76 残り深さ 24
62銀 25歩 評価値 -88 残り深さ 6
52飛 76歩 評価値 -293 残り深さ 2 概念が違うとはいえdepth24とか見ると瞬間的には思ったより凄くないなとか感じてしまった。実際に搭載することでのレート上昇を見ないとなんともいえん。 テラショック定跡ありのレートもレート表に載せて欲しいな テラショック100局短時間対局させて見たら三間飛車をよく指すね、中飛車もたまに指す、
振り飛車をよく指すので、超低ノードではC-book2018 55-3-42 テラショックだった
やはり振り飛車は居飛車に対しては勝率が低いね、計測はillqha3-ditto4Sを使った >>792
> 概念が違うとはいえdepth24とか見ると瞬間的には思ったより凄くないな
24手先の局面でdepth 36以上相当で探索させてあるわけだから、これ単純計算だとdepth 60相当だよ >>798
(depth36相当の)最善手が24手先まで続くと読めば、確かに結構深い定跡ですね >>794
うちは三間飛車なんか一切指さないな
もしかしてBookEvalDiffを0にしてないんじゃ・・ >>801
0はBookDepthLimitだった
BookEvalDiffは初期値30のまま
やねさんの使い方には特にBookEvalDiffを0にするとは書かれていないけど depth24っていうのは、単に24手後まで定跡の入力があるというだけで、探索深さとはなんら関係ない。
定跡の最終入力手について、depth36で検討した評価値が定跡の評価値らしいので、信頼性は相当高いのではないか? >>803
BookEvalDiffは0にしとかないと最善手選ばないから悪い指し手選んじゃうよ
あとBookMoves 100とかにしとかないと17手目以降の定跡にhitしないよ
dolphin+illqha3(no_book) vs YaneuraOu(無改造) + tanuki-2018年度版
1手2秒対局はいまのところ18-3-33だな
レーティングサイトによると定跡なしならillqha3が相当強いはずなんだけど
定跡つけると少なくとも互角ぐらいにはなってるようだ 先手三間は入ってるね
駒組み段階で定跡切れるけど
全体的に本番までにはもっと深くなるのかな 定跡使うだけで上位ソフトの勝率ガタ落ちなのかw
ここ1年上位ソフトが強くなってない説ってマジだったの? >>806
BookMovesは120でやった、BookEvalDiffは30でやったけど片方のC-bookも同じ設定なので
お互いが最善手選ばない同条件なのであまり関係ない気がする、片方だけ0でもう片方が30なら
条件が違うので差が付くのも分かるけど 見かけ残depth0や1の指し手が多く入ってるのは、差がついて必要なくなったので以降はdepth36相当での検討を打ち切ったってことか。
depth4とか8の奴もその局面から近いうちに差がつくという意味合いになるんかな。 手数は短いけど相当石橋を叩いて渡り作った定跡という印象を受けた
評価値眺めるだけでもある程度勉強になるな >>809
> C-bookも同じ設定なので
俺C-book見てないけど、千田先生が手で入力されてるなら
そこについてる評価値って出現頻度か何かで局面の評価値とは異なるのでは・・
とりまBookEvalDiffは5以下が良さそうだよ(俺は0にしてる) 定跡ファイルはとりあえず嵌め負けを防ぐ安全志向のと
積極的に得意戦法に誘導しに行くタイプがあるんかな。
同じ定跡ファイルでも設定でその辺を調整できるだろうから
強さも多少変わってきそう >>806
気になるのは、tanuki-2018が中終盤型で序盤型のNNUE評価関数に対して序盤を切り抜けたら強いと書いてあるところ。
もしかして100Tショック定跡同士でもtanuki-2018の方がアドバンテージあるのでは? depth 36相当 *以上* って書いてあるね。
さすがに凄い定跡 そしてなぜか大会前に公開 BookEvalDiffを30から0にしたらテラショックの振り飛車採用率が2割弱まで下がったので勝率が上がった感じ?
共通設定 illqha3-ditto4S使用 BookMoves=120 一手0.2秒 2スレ Hash1024 投了値3000
両方BookEvalDiff=30 C-book2018 55-3-42 テラショック
両方BookEvalDiff=0 C-book2018 51-1-48 テラショック 最近のAobaZero右四間v.s四間飛車が気にいってるようでおもしろい ponanzaはさくらインターネット使って圧倒的な数の暴力で教師データ作って無理やり強くしていたけど
elmoの登場であっさりと追い付かれて今までかけた金が無駄になってしまって協力受けるのが難しくなったんだろうね
成果が出ないものに企業は協力してはくれないからね ポナは今後数年最強との触れ込みで、前評判が凄かったからelmoの衝撃は大きかったな
しかも、手法とソフトすぐ公開してくれたし、前回は200手の件で残念だったが瀧澤さんには今回も期待している >>806
評価関数の強さを比較したいのになんで別々の探索使ってるんだ
それじゃあきちんと比較できないだろ >>822
俺は評価関数の強さを比較したいのではないよ
定跡なしのときにR100ぐらい差があると言われている2つのソフトに対して、
弱いほうのソフトだけ定跡ありにして比較したときにそのR100が覆るかを検証している
illqha3は、探索部dolphinとセットで配布されていて、レーティングサイトにRの記載がある(R4370)
https://www.qhapaq.org/shogi/
対してtanuki-2018 + 標準やねうら王は、この表でR4250付近であることがわかっている >>823
なるほど理解した
レーティングサイトと同じ対局条件で定跡ありでやってるってことかな? >>806
2秒で1500万ノード超えだと9700Kとかかな?
そのくらいのスペックでも羨ましいわ
Zen2が16コアで出たら買うかなー >>820
お前、高収入で美人の嫁がいる山本さんに嫉妬してるの? 序盤強い評価関数で定跡掘って
中終盤強い評価関数で戦えば最強ということでは? 山本君給与上がったのね。
HEROZの中の人が巡回中らしい。 昼休みにやねうら王のtanukiに角落ちで軽く3回負けたw ■ このスレッドは過去ログ倉庫に格納されています