▲コンピュータ将棋スレッド127
■ このスレッドは過去ログ倉庫に格納されています
>>729
カパックは後手で二手目△6二銀をずっとやってたら同じような角換わりの展開になってたね。
自己対戦だけだと定跡のよしあしは測定できないし危険やね >>728
誰も前のポナに全く強くなっていないとは一言もいっていない。自己対局で勝率7割
になっても他のソフトの相性の関係で、レートをそのまま7割分上乗せにはならない
といいたいわけだ。勘違いするな。 角換わりも、一時期ソフトは避ける傾向が出ていて、
角換わりを避けるのがトレンドみたいな時期もあったが、
今のソフトに角換わり評価させるとフツーの評価なんだよな。
ただ、角換わりすると先手の評価が一時的に上がるので、
枝刈りで後手が悪くなると判断して切っちゃうのかもしれん。
まだまだソフトの序盤にはこういう盲点が沢山あるんだろうな。 読みだけではなんともならない序盤の構想をディープラーニングでできたら面白いよな。
手動作成の定跡DBは技術の敗北だと思う(大会で使うなと主張はしてない)。 まあ定跡も否定はしないけども。
従来評価+DNN+定跡とか胸熱やん。
ただ定跡に偏り過ぎると何かなぁってのは分かる。
恐らく、今後はこの三者の力を如何に最大限発揮させるかが、
そのまま覇者を決する時代がしばらく続き、
その後は本格的にDNNや四駒の時代に移っていくのだろう。 >>726
もしかしたら、評価関数の精度が上がったことで、手番のボーナスが過剰になってるのかな。
先手は攻め急ぐのも気になる。 先手用と後手用で最善の評価関数は微妙に違うって可能性はないの?
先手は攻め重視で後手はカウンター重視とか。手番評価だけで先後の微妙な差を表現しきれるのかなって でも仮にあったとしても探索するときに先手の評価関数で後手の手を読むことになっちゃうか、、 電王トーナメントのルールもルールだが、WCSCも酷いな。
「局面とその評価値のセットを使いたい場合はライブラリ登録されてなければならず、ライブラリとは選手権までに誰もが取得可能で・・・」
やねさんがずっと教師局面公開し続けないと大会に出られないとかワロス >>738
手番ボーナス過剰はあり得るね。
手番ボーナス過剰→後手はマイナスに偏りやすい
→先手が攻め急ぎやすくなる
てのはあるかも。
チェスは一度盤上から除外した駒を戻ってこないに対し、
将棋はかつての味方が敵になって戻ってくる。
結局、stockfishはどこまで行ってもその感覚を理解できないのかもしれん。 しばらく千駄ヶ谷の道場に行っていないのですが
激指定跡道場3のレーティングで5級だと
道場で何級ぐらいでしょうか?
自分で行って確かめろと言われればそれまでなんですが・・・ 互角局面でやってもあまり変わらなかった。523-27-450
https://i.imgur.com/VUBOTrC.jpg Apery-sdt5が終盤読みぬけするからQhapaqとキメラするとか草
棋風とか全く見てないのがバレバレでお察っしレベル >>746
それ1秒以下でやってね?
どんな設定でやってるかも分からんのに参考にもならんわ カスみたいな計測自慢してるやつまだいたのか…
suimonさんのDualXeonで長時間回した対戦結果だけが信頼できるんだよな Aperyの終盤は探索の問題で評価関数は関係ないだろ 読み抜けって言うけどさ、枝刈りした手の確認した?
一回確認してみてよ やねうら王探索のaperyはqhapaqより終盤強いと感じるけどなぁ。 aperyといえば読み抜け、というレッテルを拭うのはなかなか大変なんだよは
オープンソースにしたタイミングで技巧がいたから余計目立った印象
そのせいでみんなaperyの読み抜けの残り香を探してしまうんだよな >>753
例えば、たこっとvsポナンザの96手目の局面とかかなあ。
やね+Aperyは、6一龍、5一歩で互角というけど、
6一龍に4八銀という変化をなかなか読めない。
4八銀だと、6七玉でも7八玉でも2五金でも後手有利になる。
ただ、これは評価関数の問題か探索の問題かは分からん。
4八銀、2五金、5一歩、2四金、同歩の角金交換を先手に利ありと見ちゃうのかな。 1局面だけで話ししてもなんの意味もない件
超手数の詰みが絡む局面を数百用意するならまだしも >>695
穿った見方かもしれないが、負け惜しみに聞こえる
まふ定跡自体の扱いはともかくとして、負けた途端こんなことを言うのはちょっとがっかり。例え相手にマフ定跡使われても、ポナが勝ってたらこんなこと言わないよね
もう十分遊べたから本人としては満足だと言っていたから、外野がとやかくいうことではないのは知ってるけども
所で関係ないけど今シンギュラリティ講座見直してるんだけど、28角とか懐カシスwww
もう水平線効果なぞはないと言っても良い。少なくとも人間に咎められるようなレベルの話ではなくなってしまったなぁ そもそも最善手の応酬が定跡なんだから有利不利が出来るなら定跡とは言わない >>760
最善を外れた時に咎める手順も定跡なのでは? 別にポナ本は変なこと言ってないと思うが。
定跡=序盤で勝敗が決まるってことは、
もう中盤の形勢判断の精度が極まってて、
そこから先は逆転しないってことだし、
工夫の余地も序盤しかないってことだから。
人間将棋の先手矢倉全盛時代とか、そんな雰囲気あったでしょ。
まあただの勘違いで、人間の中終盤は間違いだらけだったのだけど。 Qhapaqレーティング計測で2位浮上
やはりぽんぽこ以上だったか
優勝してた展開もあったか 大方予想通りですね
やはり知りたいのはAperyQhapaq合成 >>743
別にやねさん自身が使って参加するのなら制限はない(とルールを読んだ限りでは思う)のだが。
やねさん以外の人がそれを使うのであれば、やねさんがライブラリ登録をすれば十分では。
一旦ライブラリになったものはCSAが責任もって公開し続ける(となってたと思う)し。 レーティング計測時の条件(持ち時間、定跡等)がSDT5と違うから、
優勝があったかと言われればやっぱりなかったんじゃないかな。 WCSCでapery優勝の時は完全に運だけ
そういうことも起こりうるし そうであるからこそ試行する意味がある 大会じゃ相手によって
定跡入れ替えたり、時間の使い方の設定変えたりもしてますし・・・ Qhapaqは他の定跡使用と違って不利にならない力戦で評価関数で勝負しようとしてるから
他の定跡使用組とは違うけどな >>763
Qhapaqは探索エンジン側への数パーセントの高速化を仕込んでいるはずなので、
Qhapaq SDT5フルセット版は、公開されているQhapaq評価関数とやねうら王v4.79との組み合わせより、間違いなく強いのではないでしょうか? 今回の二次エロ河童絞りが公開されたらまたシボラーが活発化するのだろうか >>762
ソフトも中終盤間違いだらけだろ。
中盤なんてほぼ全て間違いだろ。
将棋の神からしたら。 まふ定跡搭載した技巧とカパックでやってるけど、中盤くらいまで技巧の方が良かったりするな
カパックに搭載されてる定跡がイマイチっぽい >>773
アマの勉強ソフトには一番でしょう
対戦相手がポナとかやねうら王なんてありえないんだし >>762
むしろ否定されたのは序盤では?
例えば、角換わり腰掛け銀先後同型の評価は、先手が仕掛けてよしで覆されてないやろ(ソフトは互角の評価をしてしまうが)
時間をかければ、人間でもソフトでも終盤は答えが出るので定跡研究ではあまり差はない
矢倉も序盤の構想の欠陥によって絶滅した
人間が出した課題局面の結論が間違ってるというより、そもそも課題局面にいかない
それがソフトによって変わったこと 自己対戦のときに思考時間は同じにして投了値を1000点や500点とかにしたら
対戦成績はどれくらいかわるもんなの?
中終盤の逆転率は同じようなものだからそんなに変わらないのかなって気がするんだけど 最低eimo程度の強さで出場すれば定跡で優勝してしまうってのが次回の大会で起こる
次回も定跡の戦い
まふ定跡が勝敗に関わってくる大会となる 定跡関係なく現状のレート差なら、大会程度の対局数ではある程度運ゲーみたいなもんでしょ
定跡も正直どうでもいい
極論Ponder Hit運ゲーやってるのと変わらない
定跡局面の評価なんてソフトの進化で覆ったりするし、定跡外し定跡入れときゃあとは力勝負なんだから >>780
それこそ力勝負になったら運ゲーだから
大会じゃ定跡勝負ゲーになったんじゃ・・・ >>778
100番勝負だと評価値1000からの逆転は数局
評価値500からの逆転だと10-20局程度は現れる
95-99%の信頼区間で云々を議論するときに
1割ほどのランダムノイズが入ると考えると
評価値1000程度での打ち切りは厳しいとみるが 最近のソフトは入玉が多いから、投了値は設定せず256手で打ち切る設定がいい コンピュータ将棋第一人者のsuimonさんの見解は? >>782
それは終盤力が勝率に影響をあたえるほど相対的に強い評価関数とかソフトが存在するってこと?
そういうソフトはあり得るだろうが、終盤が強い評価関数ってあるんだろうか
知ってたら教えてほしいな 終盤が強くなくても短時間対局とかなら、頓死とかあるし投了値1000以下でやるのは無理がある。 そもそも256手ルール自体がいらない
そんなただの時間の都合ごときで勝負に水差すなってーの >>782
ノイズは平等に入るからその分対局数を稼げばいいって発想すると
同じ時間をかけるなら評価値をどこかで打ち切るのと精度が釣り合う点があるんじゃないかな?って疑問 参考記事はソフト内部の駒の価値なので、ちょっと関係ないのでは?
Aperyも歩=100に換算してから出力してるし とりあえず投了値設定せずに1万局ぐらいデータ取って
最適な投了値がいくつぐらいか検証してみては? >>790
確かにAperyは決め打ちの駒割のパラメタを元に正規化しているはず
ただ決めうちのパラメータだけじゃなくKPPT、KKPTにも駒の価値の成分は含まれてて、それがどのくらいなのかは正規化時に加味されていないため、三駒の値が大きくついてる/小さくついてるケースにはうまく対応できないはず… 評価値の閾値でなくて、自身の詰み筋を発見したら投了ってのが潔くて良いかもね 力が上回ってても10連敗する事あるからな
一発勝負じゃ本当の力なんてわからん やねうら王を使った学習のときに表示される「hirate eval」の数字って
どういう意味なのかわかる方いませんか? >>796
そもそも今回の電王トーナメントに限っては勝利後のプロとの対局が無かった訳だから、
自分が思う最強の指し筋一本に絞ってランダム性無くしても何も問題無かった訳で。
(選手権の方は元々勝利後何もないし)
相手がランダムあって勝敗が別れるのはあると思うけど、
自身のソフトの指し筋ランダムにして負けたら指運がーとか言い訳するのは
阿保の言い訳としか思えないわ >>797
初期配置の時の評価値じゃなかったかな。
この値が大きくブレてると、なんかあったなとあたりをつけられる。 >>798
ランダム性が大きくないから
超手数の定跡にハマるんじゃ・・・ >>799
なんかあったな、じゃなくて、ブレなくなって安定したなという判断に使う。 将棋ウォーズでソフト指ししてたら牢獄アバターになってしまった(笑)
強制解約で、対局できなくなった(笑) >>799
>>801
ありがとうございます
初めは値が動いて途中から安定してくるのが普通の動きってことですね 平岡さんがやねうら王形式の評価関数を公開する神対応
それでひまわりブログの誤情報導入記事のPVが伸びなくなったから、ひまわりは自演してAperyの悪口ばかりを書き込んでいるのか kpp_kkptで一番強いのってどれ?
tamore<人造棋士で合ってるかな
お猿とかハニワの比較した人いる? マルチponderは機能として欲しいね
理想は評価値の近い手が多ければ動的にマルチPV数増やして少なければ減らす機能かな >>798
ランダム性ってマルチスレッドプログラムだと意図してなくてもある程度はでるからしゃあない
ランダム性を排除するためにいちいち同期とってたらどうしても探索速度が落ちて弱体化するし Aperyの評価関数にケチをつける書き込みが多いと思ったらひまわりの自演だったのか ひまわりは平岡に竜王戦騒動で苦言を呈されているからな
棋王戦が終わったら千田と渡辺が謝罪すべきだとかアホなツイートして平岡が呆れていたことがある
そのせいで粘着されているのか? >>806
公開はされてないけど、やねうら王がkpp_kkptで一番強いのは間違いない >>811
というか、ブレンドの素材としてすごく魅力的です。Aperyとキメラしたら最強になりそう。 >>808
えっ、探索ってそんなランダムに結果変わるようになってんの!?
そりゃあ時間での探索打ち切りとかで完全に同一結果にするのは難しいとは思うのだけどさ >>811
公開されてないのに間違いない?
日本人ですか? ひまわりってsuimonのことなん?
将棋ソフトひまわりの作者のことかと思ってたわ >>816
いや、やり方によっては完全固定させる事はできるけど、それやってないってだけでしょ >>817
完全に固定させると、非常に弱くなるという意味では >>813
lazySMPのlazyの意味考えてどうぞ >>814
評価関数そのものは公開されてないけど、評価関数の強さはどんなもんか公開されてるからね 馬鹿の一つ覚えのブレンドキメラ化の書き込みで恐縮なんだけど
二日間放置してたPCみたら、微妙に強いかもしれないので一応は書き込みます。
qhapaq+apery 50% 対 yaselmo
i7-7700K 2秒 定跡なし
461-28-205
・引き分けを取り除く
相対イロレーティング: 140.7788257335575
標準誤差: 14.599690388995302
95% 信頼区間 [113.41570540145834, 169.9095894637351]
・引き分けを0.5勝に
相対イロレーティング: 134.49979791389933
標準誤差: 14.204469610889587
95% 信頼区間 [107.42810731185929, 163.2263737043487]
同じPCでapery対yaselmoを3秒で400局くらいやったときは
R差70でuuunuuunさんのレーティングと一致してたんだけど今回はちょっと差が大きめ。
まぁ95%では測りきれない謎のミラクルが起こったとかなんでしょうね。
あんまり信じないほうがいい。 楽しませる為に着ぐるみ着たっていうぽんぽこの人
ウケ狙いと感じて白けてしまうんですよね
自分だけかな >>823
何のことか知らんが周りが何も言ってなけりゃお前だけでね? 実際に対局するときに一手5秒以下ってあり得ないから
短い時間でのレートってかなり信頼度低い気がするんだけど >>825
>>821
1秒 T1,b1000,432 ? 14 ? 554(43.81% R-43.21) win black : white = 51.62% : 48.38%
2秒 T1,b2000,425 ? 14 ? 561(43.1% R-48.23) win black : white = 48.17% : 51.83%
4秒 T1,b4000,444 ? 14 ? 542(45.03% R-34.65) win black : white = 50.41% : 49.59% 同じ探索部で同じような作り方をした評価関数なら短時間で十分 100局や200局でレート語る方がもっとあり得ないけどな >>820 >>821
らしい、推測
やね氏の考察にケチつけるでもなく記事も読んでる
それでも実際は結構違う事も多いんだけどな
kpp_kppt変換でR落ちない?落ちる事例ほとんどだろ
rezero19だけ落ちない特殊だと思ったほうが普通 >>829
なんか勘違いしてないかな?
やねさんはkpp_kpptを初めから作成して、kpp_kpptで大会で使用している。上の記事
では、kppt変換後のApery_sdt5と対局する際に同じ実行エンジンでないと、同条件に
ならないので、大会用のrezero19をkpptに変換して(変換の劣化はない)検証している。
これだけ書いてもまだ理解できないかな。 kpp_kpptって誤記する人、用語の意味分かってなさそう ■ このスレッドは過去ログ倉庫に格納されています