▲コンピュータ将棋スレッド141
■ このスレッドは過去ログ倉庫に格納されています
illqha2.1とkai6は25日-27日位にリリース? めきっと@鵺日々成長中@_illqha
やや過学習ぎみな仕上がりな気がします。
遊んでみたいという要望があれば番外編として公開しようかと思っています。
きちんとしたものの公開はもう10日程かかりそうです。
NNUEkaiの人は学習をしばらく取りやめて他の環境とで差が出る原因の究明をするみたいなこと言ってたから当分きそうになさそう >>646
自動化すれば、中盤の終わりぐらいまでは解析できます。
誰かソフトで自動化アプリを作って下さい。
コツはえ?こんな手?という候補手も取り込むことです。
終盤でも再逆転がありました。 また自称「○○に強い評価関数」が量産されたyaselmo時代を繰り返すの? >>635-636
残念ながらチェスはそうではないんだよなw
あれあれ?
・初期配置から可能な局面
・詰み&必至の見逃し後の変化は不要
は都合が悪すぎてスルーですか?w 名無し名人 (ワッチョイ eab3-vl9i)
なんでこんな将棋オンチがこのスレで威張っているんだ 何かアルゴリズム思い浮かんでるなら自分で書いてみればいいんじゃないですかね suimonの本がちょっとした騒動になってるけど実際のとこどうなん? >>653
そのような制約によって所要局面数を「大幅に」減らしたとして、屁のツッパリにもならんのが最大の問題
(100分の1とか1000分の1に出来たとして10^60を越えていたのでは人間の手に負えるオーダーではない) # 勝ち数 対局数 %
01 50.5 90 56% dolphin2 illqha1.1
01 50.5 90 56% nnue-w7-ditto3 illqha2
03 50 90 55% dolphin illqha1.1
04 49 90 54% dolphin2 illqha2
05 48.5 90 53% dolphin Kai5
06 44.5 90 49% dolphin illqha2
07 42.5 90 47% nnue-w7-ditto3 Kai5
08 42 90 46% dolphin2 Kai5
09 39 90 43% nnue-w7-ditto3 Kai5
10 33.5 90 37% GodwhaleChild-5.0.5 KPPT 4.80 64SSE4.2/QQR ■感想
これを実施する前に予想していた順位とはだいぶ違ってた。
予想通りなのはベンチマークとして使ったGW5.0.5 /QQRの成績のみです。
なんとillqha1.1の方がillqha2より若干成績がよかった。
nnue-w7-ditto3はillqha2以外とは相性が良くないみたいだ。
■その他
将棋所の最新バージョンをダウンロードしてリーグ戦で2秒設定で実施したが
将棋所はUSI_Ponder(相手番でも考慮)がデフォルトでTRUEとなっているのを知らなかった。
これだったら1秒設定で実施すれば半分で済んだのにと思った。
開始:8/22 20:52
終了:8/24 23:50 NGワードで書き込めなかったので分割した書き込みになってしまった。
結局短縮ダウンロードURLが引っかかったみたいだ・・・
https://28.gigafile.nu/0901-bc7a84ab35ae64d8d25a2ef5304d9110d ■リーグ戦で戦わせてみた!
■URL
https://28.gigafile.nu/0901-bc7a84ab35ae64d8d25a2ef5304d9110d
# 勝ち数 対局数 %
01 50.5 90 56% dolphin2 illqha1.1
01 50.5 90 56% nnue-w7-ditto3 illqha2
03 50^^ 90 55% dolphin illqha1.1
04 49^^ 90 54% dolphin2 illqha2
05 48.5 90 53% dolphin Kai5
06 44.5 90 49% dolphin illqha2
07 42.5 90 47% nnue-w7-ditto3 Kai5
08 42^^ 90 46% dolphin2 Kai5
09 39^^ 90 43% nnue-w7-ditto3 Kai5
10 33.5 90 37% GodwhaleChild-5.0.5 KPPT 4.80 64SSE4.2/QQR
■感想
これを実施する前に予想していた順位とはだいぶ違ってた。
予想通りなのはベンチマークとして使ったGW5.0.5 /QQRの成績のみです。
なんとillqha1.1の方がillqha2より若干成績がよかった。
nnue-w7-ditto3はillqha2以外とは相性が良くないみたいだ。
■その他
将棋所の最新バージョンをダウンロードしてリーグ戦で2秒設定で実施したが
将棋所はUSI_Ponder(相手番でも考慮)がデフォルトでTRUEとなっているのを知らなかった。
これだったら1秒設定で実施すれば半分で済んだのにと思った。
開始:8/22 20:52
終了:8/24 23:50 7位の評価関数が間違ってました。
nnue-w7-ditto3 Kai5 ⇒ nnue-w7-ditto3 illqha1.1
# 勝ち数 対局数 %
01 50.5 90 56% dolphin2 illqha1.1
01 50.5 90 56% nnue-w7-ditto3 illqha2
03 50^^ 90 55% dolphin illqha1.1
04 49^^ 90 54% dolphin2 illqha2
05 48.5 90 53% dolphin Kai5
06 44.5 90 49% dolphin illqha2
07 42.5 90 47% nnue-w7-ditto3 illqha1.1
08 42^^ 90 46% dolphin2 Kai5
09 39^^ 90 43% nnue-w7-ditto3 Kai5
10 33.5 90 37% GodwhaleChild-5.0.5 KPPT 4.80 64SSE4.2/QQR 評価値使って探索していくんだから少しくらいは相性がないわけがないんだけどね 相性があるというより
エンジンや評価関数に明確な有意差があまりないんじゃないかな? >>653
糞ワロタ
そういうの昔からあって焼け石に水って言うんだよ
勉強になったね💌 やねがクラウドファウンディングでオセロの完全解析やりたいって言ってるしその成果次第でいいんじゃない ツイート読み返したがやりたいとは言ってなかったw
オセロ完全解析にかかる費用が分かれば
オセロと将棋のゲーム木のサイズの違いから、
将棋の完全解析にかかる費用も概算できそう >>663
>将棋所はUSI_Ponder(相手番でも考慮)がデフォルトでTRUEとなっているのを知らなかった。
>これだったら1秒設定で実施すれば半分で済んだのにと思った。
うーんw >>663
ponder onのままだとテストにならんけど
大丈夫なんか? >>670
オセロくらいだと、有力定石を絞り込んだ上で、比較的手の狭そうな枝をセレクトしてから、その変化だけを完全解析というのなら割りとできそう >>664
なぜGodwhaleChild-5.0.5がSSE4.2なのか AVX2版より
強かったのならそのデータを併記してほしい ソフトで将棋の勉強ってどうすればいいの?
ソフト動かしててこれは自分では絶対に意図して動かせないって指し方見てもあんまり意味無くないか? >>676
悪手を教えてくれるのがでかい
悪手を指したらどんな手順で悪くなるのか細かく教えてくれる
普通は対局後に棋譜解析してどう指すべきだったか検討していく感じじゃない? >>673
今さらオセロてw お前は何年前で時間が止まってるんだよwwwww
オセロなんてとっくに実質的には解析できてるようなものだよ。
Wikiでも、すでに7年前に外部リンク先の最終更新が止まったり、ページ自体消えたりしていて
↓この状態なんだから、もうオセロは問題にならないステージに達している。
> 8×8盤
>
> 8×8盤オセロのゲーム木のサイズは10^54ノードと推定されており、
> 合法的なポジションの数は10^28と推定されている。数学的には未解決であるが、
> 速い並列ハードウェア上あるいは分散コンピューティングを通じたプログラムによる
> 徹底的な計算を行うことで解を見つけることは可能かもしれない。
>
> 一部の強豪プログラムは長年自身のデータベースを拡張してきた。
> 対角、垂直、平行の23つの主要なオープニングに関しては、対角オープニングと
> 垂直オープニングは引き分けの筋へ至る傾向にあり、一方で平行オープニングは
> 黒(先手)の勝ちとなる。引き分け木は、垂直オープニングの後よりも
> 対角オープニングの後の方が大きいようである[13]。平行オープニングは
> 黒(先手)に非常に有利であり、完璧に打った場合は常に勝つことができる[14]。
> 証明されてはいないが、実質的には双方のプレーヤーが完璧に打った場合は
> 試合は常に引き分けとなる。標準的ゲームでは、オープニングブックを使用することで、
> トッププログラムの勝率は99%を超える。
549 名前:名無し名人 (ワッチョイ 7fb3-sJj3)[sage] 投稿日:2017/11/13(月) 12:45:27.37 ID:QBnyEln60
今回の電王トーナメントでの収穫は、引退する山本一成から↓の発言が出た事だな。
以前から言われていた事ではあるが、将棋も暗記ゲーの時代に本格的に突入か。
30 名前:名無し名人[sage] 投稿日:2017/11/12(日) 16:30:03.16 ID:ILaYswGe [1/5]
定跡が進みすぎると、オセロのようになるのか
オセロは定跡だけになってるらしい
山本の話は興味深いな
256 名前:名無し名人[sage] 投稿日:2017/11/12(日) 17:10:11.32 ID:qYiaoJcH [4/5]
昔
山本「定跡は弱者の戦略」
今日
山本「定跡で勝負が決まるとか将棋の終わりが近づいている」
551 名前:名無し名人 (ワッチョイ 7f1e-fv10)[sage] 投稿日:2017/11/13(月) 12:52:52.36 ID:dd1rb9En0
>>549
人間の間では暗記だけでは絶対に勝てないから影響はない
コンピュータは普通の初形からの対戦がなくなるってだけ
553 名前:名無し名人 (ワッチョイ 7fb3-sJj3)[sage] 投稿日:2017/11/13(月) 12:55:18.07 ID:QBnyEln60
>>551
ただの暗記だけではなく、
プラスでプロ棋士やアマ高段くらいの棋力があれば、影響は大アリでしょう。
554 名前:名無し名人 (ワッチョイ 7f1e-fv10)[sage] 投稿日:2017/11/13(月) 13:01:00.56 ID:dd1rb9En0
毎回相手に二つの選択肢があったとすると60手まで暗記しようとすると
10億の変化を記憶しておく必要があるんだけど
556 名前:名無し名人 (ワッチョイ 7f9d-VvNY)[] 投稿日:2017/11/13(月) 13:15:27.55 ID:vtxX7Gkw0
>>554
実際は優勢になる変化は覚えるのは途中までで良かったり、
手順前後の同一局面や
部分定跡とかも使えるから対人でも有効 将棋の完全解析とか永久機関の発明を主張してるようなもんだし誰もまともに取り合わんぞ >>675
GW5.0.5の導入方法のページで「godwhale_child-evalmerge.exe」を選択しろと
なっていたからだけです。godwhale_child-tournament.exeに変えて、
すべてPonder Offの設定しなおして1秒設定でやり直してみます。 >>683
どうせやるならuuunuuunさん基準1500万〜2000万ノードでやったらいいのに、
数百万ノード以下の計測は1500万ノードとは逆の結果が多いので参考にならない せっかく1500万ノードでの膨大な対局データがあるんだからそれと比較もできるように同じ条件でやるのがいいよね
検討用途のことを考えて長時間でやるのももちろんいい、対局数が確保出来るくらいの余裕があればだけど NNUEkaiの作者さんが1500万ノードと1億ノードの勝率の違いを検証していたので興味深い記事だと思う
詳細はTwitter見た方がいいかも
1手1億ノード500局が終了しました。
QQR/YO4.82 vs AperySDT5/YO4.82(1手1億ノード、投了値3000、引分け256手)
293-19-188(勝率60.5%、R差74.1)
uuunuuunさん(@uuunuuun1 )のレーティングサイト(1手約1500万ノード)によれば、
QQR/YO4.82=4234
AperySDT5/YO4.80=4162
AperySDT5/YO4.82=4137(ただし、対局数が322局と少なめ)
というレーティングになっており、上記1億ノード対局の結果と大差がないのではないでしょうか。
今回の結果から、現時点において、私は、ソフト間の強さを計測する際には、1手1500万ノードの計測で十分であると
考えています。また、1手何ノードが必要だと考えられるのかについては、いずれ計測しようと思います。 200万ノードぐらいの結果は意味ないので検討するだけ無駄 意味ない流れで低ノードで32時間くらい回してみたわ
こんな感じになった
R4260 dolphin2/NNUEkai5
R4230 dolphin2/illqha1.1
R4210 GW7/NNUEkai5
R4210 dolphin1/illqha1.1
(やねうら4.74/elmo27R3800、技巧2R3710の独自基準) >>686
更に調査が進んで100万ノードでも十分という結果が出たらかなり楽になるね >>689
既にロタさんやuuunさんが調べて100万ノードでは不十分という結論が出てるよ >>689
100万~200万ノードと1500万ノードでは逆の結果になることが多いので、仮にソフトAが100万~200万ノードと1500万ノード
でほぼ同じ結果になったとしても、ソフトBでは逆の結果になることもあるので、100万~200万ノードの計測でOKということには
ならないよね >>688
dolphin2が少しだがちゃんと強くなってそうなのがわかるな 100万だの1500万だの、勝手に決めた数字が一人歩きしすぎ
各ノード域で差が出たとして
・二項分布の揺らぎにすぎない
・そもそもエンジンの時間制御が不正確
・単なるノード間の相性問題
以上の点についてはどう解釈するつもりなんだ? >>692
ちなみにdolphin2/illqha2も一応計測はしたのですが… >>693
その考えだとソフトを選択する計測をどうすればいいのか基準が一切ないので次から次へと公開されるソフトを決められなくなるが
あなたがソフトを選ぶ計測方法を教えてくれないとただの批判者になるが ノード数いくらで検証すべきか問題は個人に任せればいいと思っているが、
ノード数による各ソフトのR差の変化の件と、二項分布云々による対局数不足の件は一緒にして欲しくない >>694
illqha2は微妙そうだと作者も言ってたしまあそういうことなんだろう 低ノードなら微妙やけど高ノードならillqha2も同等に強いで >>693
その考え方では細かく1000万1100万1200万・・・・1億1千万1億2千万・・・・10億1千万10億2千万って
細かく1000万単位くらいで各500局計測しろって受け取ればいいのかな?どう考えても無理じゃないの? >>684
ノートPCの人にそんなこと言いますか?
1手30秒かかるわけで・・・
1手1秒で対戦すると150手平均で2分半。
450局やるのに900+225=1125分=約20時間かかります。
これが30倍になると600時間ですよw
25日ぐらいかかってしまいます。
専用のデスクトップパソコンを持ってる方にお任せします。 なんでノートPCなのに計測しようと思ったんだ
買えばええやん
俺は去年キメラだらけになった時期にi7 7700KのPC買ったし>>604はそのPCで片手間に計測した >>700
結局そのスペックだと検証作業をするのは厳しいということだと思うよ
スキルがあるならより強くできる手法を探したり
スキルがなくても検討を重ねて新手を探したりした方が有意義なのでは >>695
そもそもノードにこだわってるのは100万だの1500万だの言ってる連中であって、
じゃあこだわるならノード間問題は、こういう点についてちゃんと解釈できなきゃ意味ないよと言ってる
個人的にはノードがいくらだろうとどうでもいい ソフトの強さをどのノード数で測るかとうことは計算機資源の問題があるので
なるべく少ないノードで決めてしまっても問題ないと私は思います。
もし1500万ノードで結果が違ってたら、1500万ノードでの強さということで
終わりだと思いますけど?
現実のソフトの選手権だとF1並にレギュレーションが出来てきたり
して単なるソフトの強さだけでなくトーナメントを勝つための戦略とか
が出てきたりするわけだからです。
ソフトに求めるものが何かによると思うのですが、私は以下の2つを必要としています。
1.プロの対局においてリアルタイムでどちらが有利か不利か互角なのか知りたい。
2.プロの棋譜をソフトで解析してどの手が悪手だったのか知りたい。
そして多くのコンピュータ同士の対戦を眺めていると自ずと差し手の特徴が
見えてきました。
基本的に数の攻めで相手の守りを攻略しようとします。
守る方も弱いところは数の攻めにまけないように守ります。
私自身はそこまで将棋が強くありません。30年前に道場で
初段でさしていたぐらいで藤井君のお陰で再び将棋に興味を持ちこのスレに
まで出没するようになったクチです。 >>703
その考えは結局秒読み計測はあてにならないのでソフトを選択する基準は存在しないから計測しても無駄で
適当に大体の計測をして適当にソフトを選択したらよいわけね、あなたの考えは分かったよ 1日制と2日制みたいなものだろう
1500万ノードと100万ノード、両方で強くないと真のチャンピオンとは言えない ノートPCしかないならAWS使うといいよ
高NPSで熱や電気代も気にしなくていいし 短時間少ノードで検証するのはいいけど、
その場合NetworkDelay1、2とMinimumThinkingTimeの設定も明らかにしてくれや
前者はネットワーク遅延対策として、
残り秒数が指定のミリ秒を切ったら直ちに指すという設定
後者は一手の思考に少なくとも指定したミリ秒を費やすという設定
この設定がデフォルトのまま、
持ち時間1〜2秒で指させたらどうなるか分かるよな >>706
それを言うなら1500万ノードとそこそこ長時間のフィッシャールールでだろ 早指しに強いソフトと持ち時間長いのが強いソフトがあるってこと? >>706
1500万ノードと100万ノードなんて
NHK杯とアベマの5分+5sのフィッシャーみたいなもの >>653
総当たり=初期配置から可能な局面のみを対象。
詰み&必至を発見するためには、見逃し後の変化も含めて探索が必要。
もちろん、詰み必至探索でもαβ的な後方枝刈ありで、探索範囲を狭めるのは常識。
君は自分でプログラム組んでみれば良い。 >>713
> 総当たり=初期配置から可能な局面のみを対象
チェスの終盤データベース(「残り駒数○個以下は完全解析済み)は
そういう作り方してねーからw
> 詰み&必至を発見するためには、見逃し後の変化も含めて探索が必要。
あれあれ? これ総当たりじゃないよね?w >>679
オセロの場合10年くらい前の状態で、残り40手(最初から20手は定石使用)に
ついて、いくつかの定石は完全読み切りができている。これをパブリックドローと
呼んで、最初の20手についてお互いに合意の上で特定の定石を採用すると、
40手目以後引分が確定するというだけの事。
>>673が言っているレベルの事は既にやっている人がいる。
そして、その前の20手にどういう変化があるのかはわかっていない。
F5F4(平行オープニング)が、黒有利なのは、コンピュータで解析するはるか以前
から知られていた事だし、8×8オセロがおそらく引分ゲームである事も、昔から
言われていて、あなたが上げた例は、これだけコンピュータで解析しても、昔から
言われている事を同じ程度のレベルで認識しただけで、いまだ答えは出ていない
という事に他ならないのよね。
ちなみに、4×4は1秒かからずに完全解析完了する。
6×6は、まだ解析完了したというニュースを聞いていない。 >>714
チェスのエンドゲームのデータベースも合法局面のみでしょ? >>714
チェスの終盤データベースは、駒の数絞っているから。
コンピュータで把握可能な有限の数に収まる範囲のDBしかない。
チェスは、駒を打つ事が無いから、残り駒数が減ったら終盤近いとか、
そこまで行ったらチェックメイトが存在しないとかできる。
将棋は、持ち駒を打つ事ができるので、残り駒数は永遠に減らない。
>あれあれ? これ総当たりじゃないよね?w
意味がわからん。
恐らくだけど、君と僕とは、使っているテクニカルタームの種類が違うようだ。
だから、会話が成立しないんだな。 >>710
それがあるのは間違いない
どっちが偉いのかという議論
自分的には、自分の環境、検討に使う時間での強さ、信頼性が分かればいいって話だな
そういう意味では1500万ノードもあれば充分すぎる
もっと言えば過剰ですらある 1500万ノードが絶対に正しいなんてuuunuuun氏も開発者も言ってないだろ
統計を取るのに現実的に出来る範囲のノード数で対局数を稼ぐために設定しているだけであって
将来いまのi9程度が家庭用になればそりゃノード数も見直されるわ
棋譜がないものは信用(証拠)しないし個人でやりはじめたのに誰からも信頼されるuuunuuun氏のやり方と
何もせずにグダグダ文句つける馬鹿と比較するまでもない
100万でも悪いわけじゃないし棋譜添付して統計つみかさねれば逆の統計になるかもしれない
100万と1500万もかわらないと文句つけてる馬鹿は自分の好きな方法で統計でしてみろ >>719
1500万で過剰って検討時に一瞬しか読ませないってこと? >>715
6×6ってとっくに完全解析されて後手必勝なんじゃないっけ? >>683
> >>675
> GW5.0.5の導入方法のページで「godwhale_child-evalmerge.exe」を選択しろと
> なっていたからだけです。godwhale_child-tournament.exeに変えて、
> すべてPonder Offの設定しなおして1秒設定でやり直してみます。
ちょっとだけ試したらGW5.0.5はAVX2でやると弱くなるみたいだ・・・
https://i.imgur.com/vzoRp5V.png >>711
分からないこと言っているのはそっちじゃん
長時間検討でも使える優秀なソフトの選択に具体的な計測方法も明記出来ないでよく言えるわ とりあえずillqha1.1がベストっぽいのはどの計測でも共通しているね >>725
設定によってはAVX使うとCPUのクロック下げる設定になってたり
サーマルスロットリングでクロック下がってるたりとか >>725
RyzenならSSE4.2の方が強くても特に不思議はないけど多分違うだろうからサーマルスロットリングでクロックダウンかな
そもそもの対局数少ないからよくわからんけど >>726
長時間検討!1500万!ってこだわってるのが自己矛盾してるんだよ、あんた
◯◯ノードでは意味ないと言いながら、
△△ノードや複数ノード域の計測は現実的じゃないから1500万ノードで十分って
そんな論理が通用するとでも思ってんの? >>730
誰も1500万ノードだけで十分っていっていないよ、これが現実的に統計数を取るには適している
100万単位づつノード数を変えて細かい間隔で計測し、なおかつ十分な統計数を取ることは現実的に
時間がかかり過ぎて誰も出来ないだろ、君の言い分は誰も実行不可能なことだらけだわ 1500万が長時間みたいな言い方を見かけるけど1500万は短時間だよね?
もちろんスペック次第だけど一般的なイメージとして
じゃないと5000万くらいでも超超長時間みたいになるような 1500万ノードの結果はNNUEkaiの作者やロタ氏の計測で長時間の計測と大差ないことが分かっている
ロタ氏の計測や自分の数か月に及ぶ計測からも100万〜200万ノードは1500万ノードとは逆の結果になる
ことが多いことが分かっている >>731
1500万以下で一発測定でも何も問題ないわけだけど?
1500万にこだわってるのはあんたでしょ?
100万単位で区切って全部取れとなんて主張に仕立ててるのもあんたでしょ?
1500万以下ではおかしいというなら、それを証明しなさいよというだけ >>734
だから100万〜200万ノードは1500万ノードとは逆の結果になることが多いから無駄だってさっきから言ってるだろ >>735
それを統計的かつ一般的な結論としてもっていけてないからいってるんだろ 1500万ノードではA>B Aの勝率55%でも
100万〜200万ノードでA<B Aの勝率45%
のように逆の結果になることもあるし、同じ結果の場合ももちろんある
だから100万〜200万ノードはどっちに転ぶか分からないから計測には適さない ◯◯ノードではA>B Aの勝率55%でも
1500万ノードでA<B Aの勝率45%
のように逆の結果になることもあるし、同じ結果の場合ももちろんある
だから1500万ノードはどっちに転ぶか分からないから計測には適さない
なんとでも言える そういうのを定量的に言うためには、
100/200/400/800/1600とプロットしていって、収束していくかどうかの傾向をみるしかない。
(100刻みは無駄なので、倍々で可能な範囲が妥当だろう) このスレの計算資源で教師作ればそれなりに作れそうなのにな >>742
書かれてる手順、棋譜や定石ファイル化したり
本の言うとこが正しいか確認したり
本で以下先手優勢で書かれてないその後の手順確認したり >>735
>100万〜200万ノードは1500万ノードとは逆の結果になることが多いから無駄だってさっきから言ってるだろ
逆になること多いって自分で調べたの? ■ このスレッドは過去ログ倉庫に格納されています