▲コンピュータ将棋スレッド141
■ このスレッドは過去ログ倉庫に格納されています
>>689
既にロタさんやuuunさんが調べて100万ノードでは不十分という結論が出てるよ >>689
100万~200万ノードと1500万ノードでは逆の結果になることが多いので、仮にソフトAが100万~200万ノードと1500万ノード
でほぼ同じ結果になったとしても、ソフトBでは逆の結果になることもあるので、100万~200万ノードの計測でOKということには
ならないよね >>688
dolphin2が少しだがちゃんと強くなってそうなのがわかるな 100万だの1500万だの、勝手に決めた数字が一人歩きしすぎ
各ノード域で差が出たとして
・二項分布の揺らぎにすぎない
・そもそもエンジンの時間制御が不正確
・単なるノード間の相性問題
以上の点についてはどう解釈するつもりなんだ? >>692
ちなみにdolphin2/illqha2も一応計測はしたのですが… >>693
その考えだとソフトを選択する計測をどうすればいいのか基準が一切ないので次から次へと公開されるソフトを決められなくなるが
あなたがソフトを選ぶ計測方法を教えてくれないとただの批判者になるが ノード数いくらで検証すべきか問題は個人に任せればいいと思っているが、
ノード数による各ソフトのR差の変化の件と、二項分布云々による対局数不足の件は一緒にして欲しくない >>694
illqha2は微妙そうだと作者も言ってたしまあそういうことなんだろう 低ノードなら微妙やけど高ノードならillqha2も同等に強いで >>693
その考え方では細かく1000万1100万1200万・・・・1億1千万1億2千万・・・・10億1千万10億2千万って
細かく1000万単位くらいで各500局計測しろって受け取ればいいのかな?どう考えても無理じゃないの? >>684
ノートPCの人にそんなこと言いますか?
1手30秒かかるわけで・・・
1手1秒で対戦すると150手平均で2分半。
450局やるのに900+225=1125分=約20時間かかります。
これが30倍になると600時間ですよw
25日ぐらいかかってしまいます。
専用のデスクトップパソコンを持ってる方にお任せします。 なんでノートPCなのに計測しようと思ったんだ
買えばええやん
俺は去年キメラだらけになった時期にi7 7700KのPC買ったし>>604はそのPCで片手間に計測した >>700
結局そのスペックだと検証作業をするのは厳しいということだと思うよ
スキルがあるならより強くできる手法を探したり
スキルがなくても検討を重ねて新手を探したりした方が有意義なのでは >>695
そもそもノードにこだわってるのは100万だの1500万だの言ってる連中であって、
じゃあこだわるならノード間問題は、こういう点についてちゃんと解釈できなきゃ意味ないよと言ってる
個人的にはノードがいくらだろうとどうでもいい ソフトの強さをどのノード数で測るかとうことは計算機資源の問題があるので
なるべく少ないノードで決めてしまっても問題ないと私は思います。
もし1500万ノードで結果が違ってたら、1500万ノードでの強さということで
終わりだと思いますけど?
現実のソフトの選手権だとF1並にレギュレーションが出来てきたり
して単なるソフトの強さだけでなくトーナメントを勝つための戦略とか
が出てきたりするわけだからです。
ソフトに求めるものが何かによると思うのですが、私は以下の2つを必要としています。
1.プロの対局においてリアルタイムでどちらが有利か不利か互角なのか知りたい。
2.プロの棋譜をソフトで解析してどの手が悪手だったのか知りたい。
そして多くのコンピュータ同士の対戦を眺めていると自ずと差し手の特徴が
見えてきました。
基本的に数の攻めで相手の守りを攻略しようとします。
守る方も弱いところは数の攻めにまけないように守ります。
私自身はそこまで将棋が強くありません。30年前に道場で
初段でさしていたぐらいで藤井君のお陰で再び将棋に興味を持ちこのスレに
まで出没するようになったクチです。 >>703
その考えは結局秒読み計測はあてにならないのでソフトを選択する基準は存在しないから計測しても無駄で
適当に大体の計測をして適当にソフトを選択したらよいわけね、あなたの考えは分かったよ 1日制と2日制みたいなものだろう
1500万ノードと100万ノード、両方で強くないと真のチャンピオンとは言えない ノートPCしかないならAWS使うといいよ
高NPSで熱や電気代も気にしなくていいし 短時間少ノードで検証するのはいいけど、
その場合NetworkDelay1、2とMinimumThinkingTimeの設定も明らかにしてくれや
前者はネットワーク遅延対策として、
残り秒数が指定のミリ秒を切ったら直ちに指すという設定
後者は一手の思考に少なくとも指定したミリ秒を費やすという設定
この設定がデフォルトのまま、
持ち時間1〜2秒で指させたらどうなるか分かるよな >>706
それを言うなら1500万ノードとそこそこ長時間のフィッシャールールでだろ 早指しに強いソフトと持ち時間長いのが強いソフトがあるってこと? >>706
1500万ノードと100万ノードなんて
NHK杯とアベマの5分+5sのフィッシャーみたいなもの >>653
総当たり=初期配置から可能な局面のみを対象。
詰み&必至を発見するためには、見逃し後の変化も含めて探索が必要。
もちろん、詰み必至探索でもαβ的な後方枝刈ありで、探索範囲を狭めるのは常識。
君は自分でプログラム組んでみれば良い。 >>713
> 総当たり=初期配置から可能な局面のみを対象
チェスの終盤データベース(「残り駒数○個以下は完全解析済み)は
そういう作り方してねーからw
> 詰み&必至を発見するためには、見逃し後の変化も含めて探索が必要。
あれあれ? これ総当たりじゃないよね?w >>679
オセロの場合10年くらい前の状態で、残り40手(最初から20手は定石使用)に
ついて、いくつかの定石は完全読み切りができている。これをパブリックドローと
呼んで、最初の20手についてお互いに合意の上で特定の定石を採用すると、
40手目以後引分が確定するというだけの事。
>>673が言っているレベルの事は既にやっている人がいる。
そして、その前の20手にどういう変化があるのかはわかっていない。
F5F4(平行オープニング)が、黒有利なのは、コンピュータで解析するはるか以前
から知られていた事だし、8×8オセロがおそらく引分ゲームである事も、昔から
言われていて、あなたが上げた例は、これだけコンピュータで解析しても、昔から
言われている事を同じ程度のレベルで認識しただけで、いまだ答えは出ていない
という事に他ならないのよね。
ちなみに、4×4は1秒かからずに完全解析完了する。
6×6は、まだ解析完了したというニュースを聞いていない。 >>714
チェスのエンドゲームのデータベースも合法局面のみでしょ? >>714
チェスの終盤データベースは、駒の数絞っているから。
コンピュータで把握可能な有限の数に収まる範囲のDBしかない。
チェスは、駒を打つ事が無いから、残り駒数が減ったら終盤近いとか、
そこまで行ったらチェックメイトが存在しないとかできる。
将棋は、持ち駒を打つ事ができるので、残り駒数は永遠に減らない。
>あれあれ? これ総当たりじゃないよね?w
意味がわからん。
恐らくだけど、君と僕とは、使っているテクニカルタームの種類が違うようだ。
だから、会話が成立しないんだな。 >>710
それがあるのは間違いない
どっちが偉いのかという議論
自分的には、自分の環境、検討に使う時間での強さ、信頼性が分かればいいって話だな
そういう意味では1500万ノードもあれば充分すぎる
もっと言えば過剰ですらある 1500万ノードが絶対に正しいなんてuuunuuun氏も開発者も言ってないだろ
統計を取るのに現実的に出来る範囲のノード数で対局数を稼ぐために設定しているだけであって
将来いまのi9程度が家庭用になればそりゃノード数も見直されるわ
棋譜がないものは信用(証拠)しないし個人でやりはじめたのに誰からも信頼されるuuunuuun氏のやり方と
何もせずにグダグダ文句つける馬鹿と比較するまでもない
100万でも悪いわけじゃないし棋譜添付して統計つみかさねれば逆の統計になるかもしれない
100万と1500万もかわらないと文句つけてる馬鹿は自分の好きな方法で統計でしてみろ >>719
1500万で過剰って検討時に一瞬しか読ませないってこと? >>715
6×6ってとっくに完全解析されて後手必勝なんじゃないっけ? >>683
> >>675
> GW5.0.5の導入方法のページで「godwhale_child-evalmerge.exe」を選択しろと
> なっていたからだけです。godwhale_child-tournament.exeに変えて、
> すべてPonder Offの設定しなおして1秒設定でやり直してみます。
ちょっとだけ試したらGW5.0.5はAVX2でやると弱くなるみたいだ・・・
https://i.imgur.com/vzoRp5V.png >>711
分からないこと言っているのはそっちじゃん
長時間検討でも使える優秀なソフトの選択に具体的な計測方法も明記出来ないでよく言えるわ とりあえずillqha1.1がベストっぽいのはどの計測でも共通しているね >>725
設定によってはAVX使うとCPUのクロック下げる設定になってたり
サーマルスロットリングでクロック下がってるたりとか >>725
RyzenならSSE4.2の方が強くても特に不思議はないけど多分違うだろうからサーマルスロットリングでクロックダウンかな
そもそもの対局数少ないからよくわからんけど >>726
長時間検討!1500万!ってこだわってるのが自己矛盾してるんだよ、あんた
◯◯ノードでは意味ないと言いながら、
△△ノードや複数ノード域の計測は現実的じゃないから1500万ノードで十分って
そんな論理が通用するとでも思ってんの? >>730
誰も1500万ノードだけで十分っていっていないよ、これが現実的に統計数を取るには適している
100万単位づつノード数を変えて細かい間隔で計測し、なおかつ十分な統計数を取ることは現実的に
時間がかかり過ぎて誰も出来ないだろ、君の言い分は誰も実行不可能なことだらけだわ 1500万が長時間みたいな言い方を見かけるけど1500万は短時間だよね?
もちろんスペック次第だけど一般的なイメージとして
じゃないと5000万くらいでも超超長時間みたいになるような 1500万ノードの結果はNNUEkaiの作者やロタ氏の計測で長時間の計測と大差ないことが分かっている
ロタ氏の計測や自分の数か月に及ぶ計測からも100万〜200万ノードは1500万ノードとは逆の結果になる
ことが多いことが分かっている >>731
1500万以下で一発測定でも何も問題ないわけだけど?
1500万にこだわってるのはあんたでしょ?
100万単位で区切って全部取れとなんて主張に仕立ててるのもあんたでしょ?
1500万以下ではおかしいというなら、それを証明しなさいよというだけ >>734
だから100万〜200万ノードは1500万ノードとは逆の結果になることが多いから無駄だってさっきから言ってるだろ >>735
それを統計的かつ一般的な結論としてもっていけてないからいってるんだろ 1500万ノードではA>B Aの勝率55%でも
100万〜200万ノードでA<B Aの勝率45%
のように逆の結果になることもあるし、同じ結果の場合ももちろんある
だから100万〜200万ノードはどっちに転ぶか分からないから計測には適さない ◯◯ノードではA>B Aの勝率55%でも
1500万ノードでA<B Aの勝率45%
のように逆の結果になることもあるし、同じ結果の場合ももちろんある
だから1500万ノードはどっちに転ぶか分からないから計測には適さない
なんとでも言える そういうのを定量的に言うためには、
100/200/400/800/1600とプロットしていって、収束していくかどうかの傾向をみるしかない。
(100刻みは無駄なので、倍々で可能な範囲が妥当だろう) このスレの計算資源で教師作ればそれなりに作れそうなのにな >>742
書かれてる手順、棋譜や定石ファイル化したり
本の言うとこが正しいか確認したり
本で以下先手優勢で書かれてないその後の手順確認したり >>735
>100万〜200万ノードは1500万ノードとは逆の結果になることが多いから無駄だってさっきから言ってるだろ
逆になること多いって自分で調べたの? 1500万ノードより増やしたときAがBより強くなるとわかったところで
Cが1500万ノードより増やしたときに強くなるかどうかなんてわからないのだから
1500万ノードだから十分とか結論出るわけ無いだろ 現時点では、1500万ノードあればそれ以上ノードが増えてもそう大きく対局結果は変わらないだろうと言う事じゃ無いかな
実験や経験則から来るものでしょうが、それに対して対局結果で否定する意見が無いような
其れなりのPCやAWSを借りられる予算のある人が集まれば詳しい検証は可能かもしれませんが、そこまでやる意味を感じない人がほとんどだと思います >>745
一つだけピックアップしたけどノード数で逆の結果になったもの
去年公開されたaとbを18gouのコマンドでキメラにしたものを去年計測したもの
キメラab 266-19-215 aperypaq 一手100万ノード 定跡なし 対局数500局 勝率55%
キメラab 219-26-255 aperypaq 一手1500万ノード 定跡なし 対局数500局 勝率46% >>749
棋譜は人に見せる目的で計測したわけではないので保存はしていない >>743
本で以下先手優勢で書かれてないその後の手順確認したり
これは本当にあるあるだな
こっちが優勢と言われてもそこまで優勢に見えないという >>749
勘違いしてた、大分前なので計測は去年の12月ごろかと思っていたら今年の2月ごろの事だった >>749
対局設定や探索エンジン何使ってるか書かないと >>749
あと、他にも逆の結果になったのは?
まさかそれだけじゃないよね? >>725
> >>683
> > >>675
> > GW5.0.5の導入方法のページで「godwhale_child-evalmerge.exe」を選択しろと
> > なっていたからだけです。godwhale_child-tournament.exeに変えて、
> > すべてPonder Offの設定しなおして1秒設定でやり直してみます。
>
> ちょっとだけ試したらGW5.0.5はAVX2でやると弱くなるみたいだ・・・
> https://i.imgur.com/vzoRp5V.png
2回戦だと少なすぎるかもということで4回戦版の実施しました。GWCはSSE4.2
に戻して実施しました。
https://imgur.com/gallery/tXBqk5E
今現在はGW505のSSE4.2版とAVX2版をリーグ戦に参加させて計測しています。
まだ始まったばかりですのでこれから出かけるのである程度結果が出たらまた
ポストします。
https://i.imgur.com/WRyszpF.png やねさんによると8×8のオセロの完全解析も現実の話になってきているようだ。
囲碁9路盤も近いうちには・・・
将棋はまだまだ無理だろう オセロの完全解析はグーグルが金ぶっこめばそれこそ3日でできそう 新規で興味もってくれる人が増えるのはいいことだけどなんというか話題がな
NNUEは入力の特徴量を256×先後の512次元にしてるけど本当に512次元も必要なのか
隠れ層を1層増やすことと今のままニューロンだけ増やすことのメリットとデメリット
とかそういう話題で盛り上がっててほしい NNUEは素晴らしい発明なのにここではなぜかあまり話題にならないよな
SDTがあったらやねさんが∇評価関数を完全体にして出てきてNNUEと激闘を繰り広げるのをみたい >>761
> 盛り上がっててほしい
他力本願だな、まず隗より…というより
常識的に考えて製作者より使用者のほうが何桁も多いのに
こんなところで製作者が議論してもすぐに薄まってもったいなくないか? 最近はもう開発者がここに書き込むことはほとんど無いんじゃないかな
別に開発者じゃなくても好きに議論したらいいと思うけどね >>763
そうそう、話題にならなさすぎて不自然なレベル
きっと学生が夏休みだからなんだろう
∇評価関数はメモリやばそうだから出てくるなら選手権? NNUEは本当ならNNのサイズは大きくして表現力マシマシにしたほうが検討するとき嬉しいけど
大会で勝ちたいならそこそこのサイズにしておいてNPS出したほうが勝てるんだろうな Ditto3/illqha1.1をDolphin1/illqha1.1と対局させたところ
400局で勝率44%台と、illqha2以外の評価関数との相性が悪そうだったので
評価関数との相性差が出にくいようにマイルド調整
https://i.imgur.com/6s9PidB.jpg
https://i.imgur.com/XOyVEzd.jpg
https://i.imgur.com/ekEMljM.jpg
godwhaleベースですとスマホ化がどうも上手く行かなかったので
土台部分をgodwhaleからYaneuraOuに移し替えています
スマホでoption.txtの入れ替えは無理があるので
android版のみパラメータの設定項目は選択式にしてあります
自分で数値を調整する場合には「手動調整」を選択してください
https://i.imgur.com/qMF4GJf.png
オプションファイルは設定項目の変更があって混乱するので
「ditto4_engine_options.txt」という名前に変更しています
上記の名前にしないと読み込まないので注意
PC版
https://1.bitsend.jp/download/2a484dc4a3eff42c3952a691fe0d93e1.html
スマホ版
https://1.bitsend.jp/download/1848c98105552feb1d36bd8298baa9fb.html >>767
参考データで計測に利用しているGAMMA2 の数値は150ですか
それとも157ですかはっきり明記してください
どちらの数値でも支障をきたす事がないのならその旨を明記
してください 強さに関わる更新はしばらくないので
一応保存期間の長い斧にも>>768をアップロード
https://www.axfc.net/u/3932358
>>769
エンジンの実行ファイルと
同じフォルダに同梱したオプションファイルそのままで計測しています
つまりGAMMA2の数値は157の状態で計測しています
150との比較は有意差を出すのに必要と予想される対局数が多すぎるので未確認です
本家のやねうら王ではGAMMA2の数値は51になっているので
150と157の違いでは支障をきたす程の差は生まれないとは思いますが
測定結果と揃えたい場合には同梱したファイルそのまま(157)で利用してください このスレが物語ってるようにもうコンピュータ将棋開発はオワコン。
山本はいい時期に引退したよ むしろ開発者は増えてるわけだし、このスレがオワコンなだけでは Noviceの人とか海底の人とかQhapaqの人とか、
Twitter見る限りやる気ありそうだよ >>768
お疲れ様です。
スマホ版も出していただき、ありがとうございました。 オワコンって言うより、昔の状態に戻ったってだけだな
人間超える前後はそりゃバブルになるのは当たり前 >>768
SSE4.2版もよろしくお願いします。 illqha2の評価値が不安定なのは少し気になってる >>772
そういえば山本さんって引退後、次の分野で活躍するような進展あったの?
教化学習のための資金がなくponaを強くしてくれる有能なパートナーも失ってやむなく引退したと思ってた
引退表明時に「コンピュータ将棋卒業して次のジャンルへ進みます」
とか言っていたけどプログラミングやシンギュラリティがどうのとかのツイートと
将棋をベースにした人工知能の、毎回似たような内容の講演をあちこちでしているようにしか見えない 一時は囲碁に行こうとしてたけど、結局途中でやめちゃったもんな
どの分野にいるのやら 大渡さんも彼はマネタイズの人って言ってたし
そういうことでは? 対戦回数が少ないので一概には言えないが以下の感想を得た。
1.探索エンジンはnnue-w7-ditto3が良さそうだ。
なおditto4については今追加して計測中です。
2.評価関数ではKai5が意外と強かったのは驚きだった。
特にnnue-w7-ditto3との相性がよくトータルでの成績に貢献している。
といってもillqha1.1とはほとんど差がないので次やればどうなるか・・・
今回はillqha2の出来が悪く驚いた。
これまでの自分の感触だとそこまで悪くないと思ってたから・・・
https://i.imgur.com/qeDXmyd.png
リーグ戦の条件設定:
1.秒読み1秒
2.相手手番中の先読み(USI_Ponder):なし
3.ハッシュメモリ(USI_Hash):1024MB
4.NetworkDelay:0
5.NetworkDelay2:0
6.MinimumThinkingTime:1000
7.BookFile:nobook 本業がボンクラだから素人相手の電波芸者やってる評論家に似てるんだよな
引退してからの文章で勉強になるなと思ったことがない 「将棋電王トーナメント」終了のお知らせ
株式会社ドワンゴ(本社:東京都中央区、代表取締役社長:荒木隆司 以下、ドワンゴ)は、同社が主催する最強コンピュータ将棋ソフトを決める大会「将棋電王トーナメント」を、第5回をもって終了することをお知らせします(2018年は開催なし)。
2019年からは、コンピュータ将棋協会(会長:瀧澤武信)が主催する「世界コンピュータ将棋選手権」に引き続き協賛するとともに、新たに「ドワンゴ賞」を設定し、1位から3位までの入賞者に賞金を贈呈することを決定しました。
http://dwango.co.jp/pi/ns/2018/0827/index.html >>785
10月に開催するとかいう怪情報は何だったんだ >>785
あー、無くなったか
結構毎年楽しみにしてたんだけどな 検討用ソフトは選手権の成績を参考に適当に引っ張ってくるのかな? ドワンゴの社長って川上じゃなくなったのか。その影響もあるのかね? ■ このスレッドは過去ログ倉庫に格納されています