X



トップページ将棋・チェス
1002コメント365KB
▲コンピュータ将棋スレッド141
レス数が1000を超えています。これ以上書き込みはできません。
0001名無し名人
垢版 |
2018/08/08(水) 01:41:32.08
!extend:checked:vvvvv:1000:512
↑スレ立て時は1行目と2行目に「!extend:checked:vvvvv:1000:512」をコピペして立てて下さい
荒らし対策のために強制コテハン(ワッチョイ)を表示するコマンドです

第28回世界コンピュータ将棋選手権 参加チーム
https://www.apply.computer-shogi.org/wcsc28/team.html
詰将棋メモ コンピュータ将棋2018
http://toybox.tea-nifty.com/memo/2018/01/post-0205.html
世界コンピュータ将棋選手権参加ソフトリンク集
http://www.ne.jp/asahi/tetsu/toybox/soft/softlink.htm
floodgate 最新2週間レーティング
http://wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html
コンピュータ将棋協会
http://www.computer-shogi.org/
コンピュータ将棋
http://ja.wikipedia.org/wiki/%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E5%B0%86%E6%A3%8B
将棋フリーソフト rating on single machines(各ソフトのレーティング評価)
http://www.uuunuuun.com/

※前スレ
▲コンピュータ将棋スレッド140
http://mevius.5ch.net/test/read.cgi/bgame/1530439639/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured
0002名無し名人 (ワッチョイ 4361-9e/1)
垢版 |
2018/08/08(水) 04:58:56.20ID:Io60FdDF0
948 名前:名無し名人 (ワッチョイ cf9f-10BI)[sage] 投稿日:2018/08/06(月) 23:43:43.82 ID:6HN23Pbb0
NNUEkai4をアップロードします
https://www.axfc.net/u/3927181

今回は、前回の反省を踏まえ、対illqha1.1に対して、1500万ノード、投了値3000、引き分け256手の設定で1500局対局しました
https://i.imgur.com/MlE6VFf.jpg
https://i.imgur.com/CkaNqbL.jpg
勝率は53.5%とほとんど強くなっておらず、透。さんなどと比べると残念な結果ですが、
有意確率0.2なので流石に有意差はあるのではないかと思ってます
上記評価関数には500局分の棋譜も添付しました

お暇な方はまた遊んでください
0004名無し名人 (ワッチョイ 7fe7-Xflc)
垢版 |
2018/08/08(水) 06:52:18.89ID:DMQ4VXek0
>>2
私の1050回の対戦結果では対illqha1.1に対して負けてしまいました。
https://i.imgur.com/I5SXcwZ.png
1028局 545勝 483敗

勝率: 0.5301556420233463
標準誤差: 0.015577552550149339
95% 信頼区間 [0.5, 0.5603112840466926]

相対イロレーティング: 20.97974861005213
標準誤差: 10.863909119450144
95% 信頼区間 [0, 42.11361944473197]

対局は双方1秒設定
https://i.imgur.com/rAsCwGo.png

エンジン設定はillqhaの作者が作成したdolphin版です。
https://i.imgur.com/5BC2RQs.png

illqhaはGW3に設定しています。
https://i.imgur.com/CWp2a8v.png
https://i.imgur.com/DTXjeFp.png
0005名無し名人 (アウアウアー Saff-fwln)
垢版 |
2018/08/08(水) 07:44:19.24ID:dsw4UAJJa
>>4
細かいことを言うようだが、kai4が公開されたのが月曜日の23:30で、あなたの結果公開が水曜日の7:00なので、公開から113400秒しか経過してないことになる
113400/1050=108となり、平均108手で決着が付いていることになるが、最近のコンピュータ将棋でそんなに早い決着は稀だと思うのだけど…
0008名無し名人 (アウアウエー Sadf-7fjJ)
垢版 |
2018/08/08(水) 08:31:54.39ID:VOWGxdrRa
いやいや、そもそも公開と同時にダウンロードなんてありえん
捏造の可能性あるで
0009名無し名人 (ワッチョイ ffb3-fogD)
垢版 |
2018/08/08(水) 08:45:29.18ID:EMGL2CWx0
>>4 の人みたいに一手ノード数3万とNNUEkaiの人の1500万ノードじゃ逆の結果になっても別に不思議ではない
ノード数が300万違うと勝率は大分変動する
0012名無し名人 (アウアウエー Sadf-7fjJ)
垢版 |
2018/08/08(水) 09:46:40.34ID:VOWGxdrRa
>>11
一枚目の画像で分かるだろ
0013名無し名人 (JP 0Hff-QB3m)
垢版 |
2018/08/08(水) 11:50:23.28ID:RjoVZUL1H
人はなぜNetworkDelayやMinumumThinkingTimeをそのままで1秒設定するのだろうか
0015名無し名人 (ササクッテロル Spc7-Ry9x)
垢版 |
2018/08/08(水) 12:15:20.37ID:Awuyfrdsp
kai4とillqhaを500局程テスト対局させて見ました
一手1秒なのでノード数が多少低いですが参考まで

kai4+dolphinとillqha1.1+dolphin
202-73-225(ノード5〜600万)

kai4+やね4.82とillqha1.1+dolphin
187-58-255 (ノード4〜500万)
0016名無し名人 (アウアウアー Saff-fwln)
垢版 |
2018/08/08(水) 12:26:46.37ID:dsw4UAJJa
>>13
なるほど、それだ。1秒対局の謎が解けた
0020名無し名人 (ワッチョイ ffb3-fogD)
垢版 |
2018/08/08(水) 19:08:42.82ID:EMGL2CWx0
初手のノード数が1500万からのロタ氏計測ではillqha1.1-dolphinはQQR-GW5.0.5に勝率52%と
あまり勝てないが、初手のノード数が1800万からの自分や他の人(前スレ他で3人いた)の計測によると
勝率65%程度だったので、数万ノードと1500万ノードの計測だと逆の結果になっても全然ふしぎではないよ
0025名無し名人 (ワッチョイ bf7e-XjIH)
垢版 |
2018/08/08(水) 22:22:51.86ID:GEmYuTd70
>>18
NNUEどうしの対戦なのでillqha1.1も同様に強くなる
その上kai4はi7-8700Kで5分持ち秒読み1手10秒で
GW5.0.5-QQR相手に5割位だがillqha1.1はQQRに6割
以上の戦績を残している
0026名無し名人 (ワッチョイ dee8-13rw)
垢版 |
2018/08/09(木) 00:00:54.80ID:VQcgQnKp0
持ち時間12時間対決、時間かかりすぎ!
結果も、統計的に何も言えん!
10試合まであと3試合くらいかな、
面白棋譜ができて楽しんでくれると良いな。
お酒飲んでるからテンション高いんです〜〜〜〜〜
じゃあ、10試合終わったらまたよろしくね。
0027名無し名人 (ワッチョイ b3b3-2km2)
垢版 |
2018/08/09(木) 00:24:33.76ID:shg+gyQ00
>>4は最たるもんだが、新参の諸君
NetworkDelayの1と2は間違いなく0にするのだ

特にNetworkDelay2のデフォルトは1120で1秒以上となっているので
1秒設定で対局をさせようとしても究極の早指しになってしまうだけだぞ!
0029名無し名人 (ワッチョイ 5f9d-2km2)
垢版 |
2018/08/09(木) 02:07:37.88ID:SztGJQyh0
ライブラリ非使用者の優遇を検討されててライブラリ非使用者を少しでも救済したいっていう意図は分かるのだけど、
ライブラリ使用/非使用の判断って結局本人による申告で判断する事になるのだろうか?
それって結局開発者の性善説に基づいてるからそれはそれで賛否両論ありそうな。

そしてどこまでがライブラリ使用/非使用の境界となるのか。
ソース流用はライブラリ使用になりそうだけど、文献参照とかソースコードを見て真似たとかは
ライブラリ使用の範囲になるのか否か。

結局そういうのって明確な線引き自体が難しいように思えてならないな
0031名無し名人 (ワッチョイ 4a90-2km2)
垢版 |
2018/08/09(木) 10:38:22.20ID:6FGwY/Wp0
MyShogiビルドしてみた。当然リソースもエンジンも無いので触りだけ
起動すると画面いっぱいに真っ黒な画面、赤いバツ印。ああ…リソースがないんだなと。少し寂しい気持ちになる。
しかしめげずに通常対局を選んでみる。対局条件を設定していざ対局!…またもや災難、『例外が発生しました』の文字。
なんてことだ…だが俺は負けない。次は検討モード…GUIソフトなら必ずチェックしたい所。『例外が発生しました…』
そうか。MyShogiがしっかりしてると将棋神やねうら王が売れないんだ。俺はようやくやねさんの意図に気付く。
8月31日の発売日まであと22日、スレは大いに盛り上がるだろう、更に発売後のアップデートも用意している筈。
その売上をしっかり確保するためには後2ヶ月ぐらいは必要ということ。つまりそれまでずっと黒い画面のままなのだろう。
0035名無し名人 (ワッチョイ 8ab3-tyrq)
垢版 |
2018/08/09(木) 17:37:26.08ID:ifK86kRs0
ロタ氏がノード数を変えて計測されていたが(以下がその計測結果)、このスレでも200万ノード以下で計測した結果の
書き込みをよく見かけるけど、結果を見ると低ノード数の計測はあてにならないのが分かる
以下 illqha1.1_dolphin vs QQR GW5.0.5による計測 
一手0.1秒(18T) 150-200万ノード 総試合数500 245-17-238, 勝率50.70%, R+4.86
一手2秒(18T) 3000-4000万ノード 総試合数312 179- 7 -126, 勝率58.49%, R+59.60
0036名無し名人 (スップ Sdea-KXUo)
垢版 |
2018/08/09(木) 19:13:38.23ID:FwTpupend
30億から40億ノードでやったらまた変わるかもしれないじゃないか

きりがないけど
0037名無し名人 (ワッチョイ 9e9f-VDz4)
垢版 |
2018/08/09(木) 19:26:55.77ID:ZIBp5tf50
NNUEkai4を試していただいている方、ありがとうございます

現在はkai5に向けて試行中です
評価関数はおそらく徐々に強くなっており、対QQRにR+100も夢ではないかもしれません
https://i.imgur.com/rWuaLkM.jpg
1手1秒(1500万ノード〜2000万ノード)、256手引き分け、投了値3000で対局しています
https://www.axfc.net/u/3927830
↑棋譜ファイルです
0038名無し名人 (ワッチョイ 8ab3-tyrq)
垢版 |
2018/08/09(木) 19:40:34.13ID:ifK86kRs0
>>36
じゃあ200万ノード以下で計測したらいいじゃん、その代わり計測結果をこのスレに書き込んでも誰もあてにしないけど
それから一手40億ノードとかキリがない話をしても意味ないんじゃないの、3000-4000万ノードだと普段使うことも多いので
そっちの話よりよっぽど現実的な話じゃん
0039名無し名人 (ワッチョイ 9ee9-Rf1C)
垢版 |
2018/08/09(木) 19:46:30.43ID:k6HkgqYl0
>>38
当てにならないとかいうから
じゃあ1000万のオーダーなら当てになるのかという反論やろ
お分かり?
0040名無し名人 (ワッチョイ aa2e-2km2)
垢版 |
2018/08/09(木) 19:46:42.23ID:jNs1Ai9T0
測定時のノード数は難しい 物ですが測定サイトの1500万は一般的なPCの能力を考えると現時点ではよい感じと思いますね
で、先にも書き込ましたが1手約5〜600マンノードで対局させたkai4とillqha1.1を約2500〜3000万ノードで対局させています
途中経過はkai4から見て
43(47%)-14‐47(52%)
です。先の対局は
202(47%)-73-225(52%)

で対GW-QQRも少しやってみたのですが、kai4から見て
204(66%)-22-104(33%) ノード数5〜600万
246(51%)-26-228(48%) ノード数2〜300万

すべて定跡はオフです
対GW-QQRあたりの結果を見るとノード数の影響はある感じはします
0042名無し名人 (ワッチョイ 0361-RrwP)
垢版 |
2018/08/09(木) 20:44:23.09ID:FRd//Zqu0
>>37
期待して待ってます
でもillqha1.1も環境によってはQQR相手に勝率65%近く出るみたい

illqhaの人も今週中に新しいの投下するらしい
楽しみぃ〜
0044名無し名人 (ワッチョイ 5f25-tyrq)
垢版 |
2018/08/09(木) 21:44:06.29ID:au5zyJF80
>>23
>おまけに、今回の『将棋神やねうら王』では、GUIすらもオープンソース化しています。

やねうら王のソースコードってApery、技巧、読み太その他多数の強豪ソフトと違って
トップ部分にstockfish系列のGPL宣言からstockfish不使用だと思っていたんだけど、
商用化するためにはGUIのソースコードも公開しなければいけないのかな
0045名無し名人 (アウーイモ MM2f-6s+d)
垢版 |
2018/08/09(木) 21:48:04.38ID:PxvUQNAHM
>>44
http://yaneuraou.yaneu.com/2018/06/15/pc%e5%b0%86%e6%a3%8b%e3%82%bd%e3%83%95%e3%83%88%e3%80%8c%e5%b0%86%e6%a3%8b%e7%a5%9e-%e3%82%84%e3%81%ad%e3%81%86%e3%82%89%e7%8e%8b%e3%80%8d%e3%81%ab%e9%96%a2%e3%81%97%e3%81%a6%e3%81%8a%e7%ad%94/
> Q) 売れると思わないのに、なぜ、商用版を出そうと思ったのですが?
> A) 私はかねてよりオープンソースの将棋用のGUIを作りたかったのですが、良いデザイナーさんに恵まれませんでした。
> 激指を販売しているマイナビさんなら、腕のいいデザイナーを擁しているはずですから、マイナビさんから発売するということで、そのへんご協力いただけるのではないかと考えたからです。
> また、棋譜読み上げの素材等についても同様です。
0046名無し名人 (アウアウエー Sac2-Ixsi)
垢版 |
2018/08/09(木) 21:50:19.59ID:JrjccDRCa
ローソンLINEの将棋強いな
なんやあれ
0047名無し名人 (ワッチョイ 5f25-tyrq)
垢版 |
2018/08/09(木) 21:54:06.30ID:au5zyJF80
>>45
なるほど、さすがやねさんだ
どうもありがとう
0048名無し名人 (ワッチョイ 63c3-I1aA)
垢版 |
2018/08/09(木) 22:08:34.01ID:y6nziQ+70
>>41
てんこ盛りになって面倒なパターンだな
シンプルモードとマニアモードみたいにメニューバー切り替えさせないと情弱は飽きてしまいそう
0049名無し名人 (ワッチョイ 63c3-I1aA)
垢版 |
2018/08/09(木) 22:09:37.12ID:y6nziQ+70
ところでsuimonさんが質問を投稿したこの方も開発者の方ですか?
2年間粘着がどうとか

suimon@floodgate_fan
https://youtu.be/Kcy3ziIZH7s
0052名無し名人 (ワッチョイ 9ee9-Rf1C)
垢版 |
2018/08/09(木) 22:48:49.19ID:k6HkgqYl0
illqhaに勝てるの?
0053名無し名人 (アウアウエー Sac2-Ixsi)
垢版 |
2018/08/09(木) 23:06:58.22ID:JrjccDRCa
>>51
マジかよ道理で勝てんわけだ
0055名無し名人 (ワキゲー MM56-45IB)
垢版 |
2018/08/10(金) 00:03:51.75ID:noHY8ShYM
最新ソフトが0.1秒で九段相当というやねうら氏の発言が正しいかどうか調べてみた。
NNUE kai4- whale6をノード315000に固定し、相手は技巧2depth13

結果
NNUE kai4の65勝32敗3分

ちなみにの技巧2depth13の24推定レートは3479らしいのでレーティングでは九段相当はありそう。
0058名無し名人 (ワッチョイ 8ab3-tyrq)
垢版 |
2018/08/10(金) 02:54:15.33ID:xsctLo+d0
日本将棋連盟は棋士の先生方が将棋ソフトを利用して棋力向上に役立って恩恵を受けているはすなので、
恐らく資金問題で開催が危ぶまれるドワンゴがSDT開催できるように資金をもっと援助してあげてほしい
0059名無し名人 (ワッチョイ 4a33-5rxo)
垢版 |
2018/08/10(金) 07:43:30.65ID:Xspe/MMI0
TCEC 13は4部リーグ全28回戦が終了して、優勝が14勝2敗12分のLeelaChessZero、
2位が13勝4敗11分のDeusXで、NN勢2エンジンが3部昇格
ただ、3位のWaspも11勝3敗14分で2位とは0.5点差と、そこまで差はなかった。
0060名無し名人 (アウアウエー Sac2-Ixsi)
垢版 |
2018/08/10(金) 20:42:57.84ID:NMzH+PFia
>>54
激指14と対戦させたが普通に激指が負けた
24の5段レベルじゃないわ
0062名無し名人 (ワッチョイ 3a7e-o2zv)
垢版 |
2018/08/11(土) 06:27:18.42ID:mSMRGdBf0
>>60
腐っても鯛というからaperypaqぐらいの強さはあるだろう
0063名無し名人 (ワッチョイ 678a-o2zv)
垢版 |
2018/08/11(土) 07:39:16.79ID:ywNspM770
>>58
藤井七段他多くの棋士がソフトで対局して棋力向上に役立てている
棋士より強いソフトの登場で、棋士の出番がなくなったのも事実
将棋連盟の棋士先生に聞くよりも、ポケットに入っているスマホに聞いたほうが優れた答えが出るようになったw
連盟の棋士先生がやるとしたら解説になる
解説をして貫禄があることを示す
0064名無し名人 (ワッチョイ 9ee9-Rf1C)
垢版 |
2018/08/11(土) 08:06:05.57ID:DgbSdW1a0
答えは出るけど解説はないからね
0065名無し名人 (ワッチョイ 3a7e-o2zv)
垢版 |
2018/08/11(土) 10:17:43.65ID:mSMRGdBf0
>>56
スマホを使用して棋士とエンジンが組んでペア対局を
実施してネット中継したら視聴者が増えると思う

棋士が好みのエンジンを選択できるようにしたら
フリーの強豪エンジンが注目されるかも
プロ棋士は自尊心が高いからどれだけエンジンの
推奨する手を採用するか興味深い
0067名無し名人 (アウアウエー Sac2-Ixsi)
垢版 |
2018/08/11(土) 10:45:56.32ID:MbH5dVxda
uuunさんのレート測定待ちだわ
0068名無し名人 (ワキゲー MM56-RTaW)
垢版 |
2018/08/11(土) 11:56:07.51ID:ZKl2WXhAM
*2016-10-11_新人王戦決勝第2局 増田康宏_四段_vs_石田直裕_四段
*例の「ソフトの詰め課題局面」をillqha2でテスト

後手の持駒:角 金 銀 歩
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・ ・ ・ ・ ・ ・ ・ 杏|一
| ・v玉v金 ・ ・ ・ ・ ・ ・|二
| ・v銀v桂 馬 ・v歩 とv歩 ・|三
|v歩v歩v歩v歩v歩 ・ ・ ・ ・|四
| ・ ・ ・ ・ ・ ・ ・ 歩 ・|五
| 歩 歩 歩 歩 ・ ・ ・v龍 ・|六
| ・ 銀 桂 ・ ・ 玉 ・ ・ ・|七
| ・ ・ ・ ・ 歩 ・ ・ ・ ・|八
| 香 ・ ・ ・ ・ ・ ・ ・ ・|九
+---------------------------+
先手の持駒:飛 金二 銀 桂二 香 歩三
先手:増田康宏 四段
後手:石田直裕 四段
手数=104 △2六飛成 まで

低スペック(32ビット、4ギガ、1スレ)PCで
YaneuraOu-NNUE_V482+illqha2で検討。
2分ちょいでmate33!!
詰みを読みました!
感動!
*illqha1.1では10分でも詰まなかった
illqha2ありがとうございました。
0069名無し名人 (ワッチョイ 0361-RrwP)
垢版 |
2018/08/11(土) 12:00:24.42ID:I2GF4nw50
>『dolphin+illqha1.1』より少しだけ強くできたかなと思います。(超短時間ではillqha1.1に対して勝率56%、短時間では勝率54%程度でした、それ以上の時間でもおそらく負け越すことはないと推測します)
>基本的に短時間での計測しかしていないので中〜長時間での強さは謎です。
>対局における各評価関数との相性問題なども謎です。(少しのノード数の差で相性がころころ変わるようなので、あまり神経質に計測しても結局よくわからないということで気にしすぎない方向でいきます)
>Ryzen7 1700のPC1台(と少しだけ低スペノートPC)で作業しているので中々強くなりませんが、ちょっとずつ強くするので気長にお待ち下さい。
0070名無し名人 (ワッチョイ 3a7e-o2zv)
垢版 |
2018/08/11(土) 12:50:45.34ID:mSMRGdBf0
おまけ4の公開早よ
0072名無し名人 (ワッチョイ 0361-RrwP)
垢版 |
2018/08/11(土) 15:22:58.26ID:I2GF4nw50
めきっと@鵺日々成長中@_illqha
https://drive.google.com/file/d/18lWusgxNdG1vXbY6GzXRHhA41pZovOtM/view
dolphin2+illqha2を公開します。
少ししか強くなっていないと思いますが、そこは許して頂けると幸いです。
今回は計測作業の一部を「ぷよ太郎@yorikone」さんに手伝って頂けました。ありがとうございます。

めきっと@鵺日々成長中@_illqha
透。さんのシリーズやなんとかちゃんねるのkaiシリーズの成長速度と張り合っていくのはかなりしんどいですが、頑張ります。
次回の公開まではかなり時間が空いてしまうと思われますが、ご了承ください



ツイッター見てない人がいるかもしれないから貼っときましょう
0078名無し名人 (ワッチョイ 1b51-2km2)
垢版 |
2018/08/11(土) 18:14:44.82ID:P5gNjwnZ0
>>77
対 dolphin/illqha1.1 なら対局数80くらいで打ち切ったけど、イルカ2の勝率58%くらいだった
只今イルカ2とGW5/QQRが対戦中だけど、今のペースだとイルカ2の勝率60%強と予想
ノード数はShogiGUIの表示を見ている限り、最大でも150万くらいかな
0079名無し名人 (ワッチョイ 9ee9-Rf1C)
垢版 |
2018/08/11(土) 18:15:08.10ID:DgbSdW1a0
透。って人の作ったものはどこにあるの
0082名無し名人 (ワッチョイ 8ab3-tyrq)
垢版 |
2018/08/11(土) 19:49:33.53ID:7GrtO2ml0
>>79
公開はしていない、親しい人にだけ検証してもらう目的で渡しいるけど、透のブログでillqha1.1-dolphinに勝率64%って自慢していたやつも
uuunuuun氏の計測では透が渡したものが結局illqha1.1-dolphinに負け越していて弱かった、前から同じことの繰り返しでブログ記事はあてにならい
0083名無し名人 (ワッチョイ 0361-RrwP)
垢版 |
2018/08/11(土) 20:00:59.65ID:I2GF4nw50
NNUEkaiの人みたいにさっさと公開しちゃうのが一番手っ取り早い
キメラもできないから公開しても電王トーナメントへの影響は少ない
0084名無し名人 (ワッチョイ 8ab3-tyrq)
垢版 |
2018/08/11(土) 20:06:59.13ID:7GrtO2ml0
透の評価関数を付き合いで検証してあげているuuunuuunさんも気の毒だな
勝率64%って渡されたものが負け越すんだからがっかりするだろ
0086名無し名人 (ワッチョイ 63c3-I1aA)
垢版 |
2018/08/11(土) 21:26:44.54ID:buFThzjG0
suimonさんが見つけた形は全て最新なのだけれど、ブログに書くかどうか
0088名無し名人 (ブーイモ MM76-ZNjX)
垢版 |
2018/08/11(土) 22:19:30.26ID:r7huj5GkM
評価関数単体だとNNUEkai4とどっちが強いのか気になる
最近はエンジンは強さよりも相性が重視されるから公平な計測条件が難しいけど
0090名無し名人 (ワッチョイ 8ab3-tyrq)
垢版 |
2018/08/11(土) 23:15:29.62ID:7GrtO2ml0
suimon関連の話題をこのスレでやり出したら、クエスト2分,アマ県棋戦,出版本の売れ具合,
他の指し手研究類似者とのTwitterでのやり取りがどうだとか、一般の将棋ソフト愛好家からしたら
どうでもいい話題なので本スレでやってくれ
009173 (ワッチョイ 1b51-2km2)
垢版 |
2018/08/11(土) 23:21:50.66ID:P5gNjwnZ0
>>88
今、探索部をdolphin2に固定して、NNUEkai4とillqha2を対局させているけど、
対局数59 NNUEkai4が32勝(59%)、illqha2が22勝(40%)、引き分け5 となっている。
うちの貧環境では、NNUEkai4 が最強といえるかも。
0094名無し名人 (ワッチョイ 03a0-2BkB)
垢版 |
2018/08/12(日) 00:17:05.95ID:Yzlbq4Es0
とりあえず速報値が知りたかったから
1手100万ノード固定で300局計測、探索はGW6で固定
NNUE-kai4 145-6-149 illqha2
完全に互角、有意差を出すのは現実的な対局数では無理っぽい
0095名無し名人 (ワッチョイ 0361-RrwP)
垢版 |
2018/08/12(日) 10:10:51.14ID:R6GM6hAY0
ロタ @Rota_JP
【結果から得られた考察】
1手0.1秒→150-200万ノード レート測定に不適 解像度が低い
1手0.5秒→750-1000万ノード 一定の勝率測定能あり
1手1秒→1500-2000万ノード uuunuuunさんサイト測定基準
1手2秒→3000-4000万ノード 時間を2倍にしても勝率に大きな変動はなし
https://twitter.com/Rota_JP/status/1027149612761505792


最低1000万ノードは必要
https://twitter.com/5chan_nel (5ch newer account)
0096名無し名人 (ワッチョイ 6ae7-2km2)
垢版 |
2018/08/12(日) 10:20:04.79ID:JAO4J9uE0
探索エンジンの違いで勝率が変わると評価値の良さが
分からなくなるので制限を設けて計測することにした。
途中経過は以下の通り。
まだ10局なので断言するのは早計かもしれないが、Kai4
よりillqha2の方が評価値としてノードリミット100万なら優れてそうです。

https://i.imgur.com/xOJzWEj.png
0098名無し名人 (ワッチョイ 9fed-IeV5)
垢版 |
2018/08/12(日) 10:53:07.34ID:aHr3XuUE0
elmo以降、数百万程度の低ノード測定は不正確で、1500万以上は必須というのが定説だったと思うが、何故みんなあえて低ノード?
nnueだと低ノードでも信頼性があったりするの?
0100名無し名人 (ワッチョイ 4aaf-2km2)
垢版 |
2018/08/12(日) 10:55:55.20ID:sXUby8tk0
低ノードと高ノードで勝率に差が出てくるのは分かってるけど、
高ノードの結果の方が正解で、低ノードの結果は不正確って認識はなかったな
0103名無し名人 (ワッチョイ c69f-IYYR)
垢版 |
2018/08/12(日) 11:17:41.62ID:p4jE2fgo0
あるレギュレーションでの強さは、その条件で測定しなきゃわからん
高ノードだから正しいわけではない
そもそも正確性や信頼性ってなんだよってとこからの話になる
0104名無し名人 (ササクッテロ Sp03-xE7Q)
垢版 |
2018/08/12(日) 11:20:50.64ID:kR58CCwXp
ノード数が増えればRが上がることはわかってるんだから、指し手の精度はより高いのでは?
検討時に低スペで1秒しか読ませないなんてことはないしそこそこ多いノード数での計測を信用したいけどな
0105名無し名人 (ワッチョイ c69f-IYYR)
垢版 |
2018/08/12(日) 11:27:13.37ID:p4jE2fgo0
>>104
高ノードで強くなるけど、問題は各ソフト毎にその曲線が異なるってことでしょ
あとはノード毎に出やすい戦型があれば、それによって相性問題が生じる可能性もある
0108名無し名人 (ワッチョイ f39f-xUyW)
垢版 |
2018/08/12(日) 11:55:56.63ID:TKoDyd140
1ノードってどれくらいの強さなの?
0109名無し名人 (ササクッテロ Sp03-xE7Q)
垢版 |
2018/08/12(日) 11:59:52.48ID:1GN+48tep
ノード数とかレートもいいけど、ソフトには解けないって言われてた詰将棋がイルカ2ならそれなりに解けるようになってたりしないのかな
さすがに長手数は無理だろうから50手くらいまでで
0112名無し名人 (ワッチョイ 1b91-q/aD)
垢版 |
2018/08/12(日) 13:05:56.88ID:h/81oIXJ0
>>109
成らずとか特殊な作為のは簡単なのでも解けない様な
0116名無し名人 (ワッチョイ 1b91-q/aD)
垢版 |
2018/08/12(日) 13:24:38.09ID:h/81oIXJ0
>>115
詰将棋選手権の問題
0117名無し名人 (ワッチョイ c69f-IYYR)
垢版 |
2018/08/12(日) 13:49:34.85ID:p4jE2fgo0
非詰将棋エンジンに詰将棋解かせて何がしたいんだか
0118名無し名人 (アウアウカー Sacb-q/aD)
垢版 |
2018/08/12(日) 13:51:53.10ID:g8wmPoola
>>117
局面によっては正しく評価値が出ないから
0119名無し名人 (ワッチョイ c69f-IYYR)
垢版 |
2018/08/12(日) 14:04:40.24ID:p4jE2fgo0
>>118
それやってなんか意味あんの?
0120名無し名人 (アウアウカー Sacb-q/aD)
垢版 |
2018/08/12(日) 14:06:01.34ID:g8wmPoola
>>119
そんなの言い出したらコンピュータ将棋なんて意味ないじゃん
0121名無し名人 (ワッチョイ 4aaf-2km2)
垢版 |
2018/08/12(日) 14:12:53.66ID:sXUby8tk0
特定の局面が頻出するなら、それは結局レートにも反映されるわけだし、
そういうの気にし出したら切りないからなあ
もちろん興味として、そういう特殊な状況が気になるのは理解できる
0122名無し名人 (ササクッテロ Sp03-xE7Q)
垢版 |
2018/08/12(日) 14:16:28.22ID:1GN+48tep
NNUEが万能にどんな局面でも評価できるようになるのか気になるんだよね

ttp://www.ne.jp/asahi/tetsu/toybox/challenge/c3005a.htm

持ち駒多いと3駒では厳しそうだけどどうだろう
0123名無し名人 (ワッチョイ c69f-IYYR)
垢版 |
2018/08/12(日) 14:48:20.07ID:p4jE2fgo0
万能にどんな局面でも評価できるか?無理に決まってるでしょ
枝刈りしなけりゃどんな評価関数だろうが詰ますし、
運悪く枝刈りに引っかかれば詰ませられない、そんだけだ
個々の局面評価を見てソフトの特徴を推し量ろうなんてどだい無理な話
0124名無し名人 (ササクッテロラ Sp03-xE7Q)
垢版 |
2018/08/12(日) 14:56:25.00ID:M7A+o5Ivp
昔はまず無理と言われてたことがどんどん実現してるから、どんな局面でもとはいかなくてもよっぽど変な局面以外は評価できるようになるんじゃないかと思うんだけど
0127名無し名人 (ワッチョイ ca1e-riSJ)
垢版 |
2018/08/12(日) 18:06:18.38ID:KuuRg/jJ0
何回も言われているが
一番重要なのは対局数だからな
1000万ノードで50局しか計測出来ないなら
100万ノードに減らして500局計測した方が意味のあるデータになる
0128n ) (ワッチョイ aa2e-2km2)
垢版 |
2018/08/12(日) 19:00:45.16ID:UG9VN03X0
テスト対局させてみました
1秒対局なのでノード数が少なめですが参考までに
定跡はオフです

illqha2+dolphin2とillqha1.1+dolphin
227-66-207 (ノード5〜600万)

illqha2+dolphin2とGW-QQR
288-18-194 (ノード4〜500万)

次はdolphin2固定で、illqha1.1やkai4と対局させてみます
0129名無し名人 (ワッチョイ 6ae7-2km2)
垢版 |
2018/08/12(日) 20:18:21.36ID:JAO4J9uE0
>>96
> 探索エンジンの違いで勝率が変わると評価値の良さが
> 分からなくなるので制限を設けて計測することにした。
> 途中経過は以下の通り。
> まだ10局なので断言するのは早計かもしれないが、Kai4
> よりillqha2の方が評価値としてノードリミット100万なら優れてそうです。
>
> https://i.imgur.com/xOJzWEj.png

もうやめようと思うが一応まで途中経過報告になります。
Kai4より若干強いかなといった感じです。

https://i.imgur.com/6b4cabC.png
対局数104
Kai4 GW3 L10^6 47勝
illqha2 GW3 L10^6 53勝
引き分け     4
=========================
illqha2からみたレイティング差は20ぐらい

100局 53勝 47敗

勝率: 0.53
標準誤差: 0.050288507734394784
95% 信頼区間 [0.43, 0.62]

相対イロレーティング: 20.87120466602866
標準誤差: 35.070287293772225
95% 信頼区間 [-48.96256003716197, 85.04323715257749]
0130名無し名人 (ワッチョイ 6ae7-2km2)
垢版 |
2018/08/12(日) 23:14:32.52ID:JAO4J9uE0
今度はGW5.0.5 QQRとの対戦を開始しました。
同様にノードリミット100万で対戦するように設定しました。

まだ10局程度ですがKai4との対戦では見られなかった
逆転勝ちが早くも生じています。
60勝40敗ペースを達成しそうですね。

https://i.imgur.com/cRkZ0s0.png
0131名無し名人 (ワッチョイ 0361-RrwP)
垢版 |
2018/08/12(日) 23:44:47.71ID:R6GM6hAY0
NPSかわるしノード固定よりも秒数固定のほうがいい

ヒトが検討するのにも研究するのにも長時間かけるし、コンピューター将棋の大会にしても一手に4000万ノード程度はかけてる
100万ノードの結果貼ってると開発者が失笑する
0132名無し名人 (ワッチョイ 83d2-Ixsi)
垢版 |
2018/08/13(月) 00:07:17.47ID:copU2+y+0
そのとおりだ
0134名無し名人 (ブーイモ MM4f-ZNjX)
垢版 |
2018/08/13(月) 07:52:51.29ID:cxlCUKa/M
対局数が最優先
ノード数を増やして結果が変わるかどうかは調べたい奴が調べればいい
もちろん最低300局な
0135名無し名人 (ワッチョイ 861b-8FTb)
垢版 |
2018/08/13(月) 08:16:17.13ID:NfuMbuzv0
フラゲ見てる限り2は長時間は1.1より微妙そうに見える
0139名無し名人 (スププ Sdea-NfX4)
垢版 |
2018/08/13(月) 09:04:29.83ID:7LdhTUiPd
相雁木が千日手という結論は個人的には違うのではないかと考えています(キリッ
じゃあお前先手から上手く打開してみろと。
0141名無し名人 (ワッチョイ 0361-RrwP)
垢版 |
2018/08/13(月) 17:10:22.62ID:a8RZB1N+0
uuunuuunさんは最近自分では計測しない
Rotaさん頼みだけど、対illqha1.1しか計測してない(+有意差出てない)から
さらなるRotaさんの計測結果待ちでしょう
0142名無し名人 (ワッチョイ 0361-RrwP)
垢版 |
2018/08/13(月) 17:12:56.11ID:a8RZB1N+0
別アカウントで千田さんに絡むことしかしてないあの人も廃スペPC回して計測したら色んな人から尊敬されるのにね
0143名無し名人 (ササクッテロラ Sp03-xE7Q)
垢版 |
2018/08/13(月) 17:17:54.16ID:h+fkbb6Zp
なんか他との対局はせずに大体こんな感じですってくらいで終わる空気なのかと思ってしまったわ

ハイスペPC持ってれば計測手伝うんだけどなあ
0144名無し名人 (ワッチョイ 635d-2km2)
垢版 |
2018/08/13(月) 17:22:26.47ID:iLaeujNV0
低スペックPCで計測しているけど、
最低ノード数がどうのこうのいう輩がいるので
恥ずかしくて結果を晒す気がしない
0148名無し名人 (ワッチョイ aa2e-2km2)
垢版 |
2018/08/13(月) 19:13:45.90ID:NcEb6mMt0
エンジンをdolphin2に固定して対局させてみました
定跡はオフです

illqha2+dolphin2とillqha1.1+dolphin2
203-66-231(ノード5〜600万)

illqha2+dolphin2とkai4+dolphin2
220-49-231(ノード4〜500万)

illqha1.1+dolphin2の組み合わせが意外と良い結果でした
次はillqha1.1+dolphin2をkai4+dolphin2及びGW+QQRと対局させてみます
0149名無し名人 (ワッチョイ 861b-8FTb)
垢版 |
2018/08/13(月) 19:58:02.46ID:NfuMbuzv0
>>142
千田ショーがキレてるのはsuimon=suiseihuman
PVパクってるだけだから出力しないようにすればいいよ
Incineratorのひともキレてたし追放でいいでしょ
0150名無し名人 (ワッチョイ 4a7c-QLcu)
垢版 |
2018/08/13(月) 20:28:43.06ID:czQ7w4sZ0
千田に絡んでたのはantisuimonだろう。つまり同一人物


複垢での粘着攻撃だし将棋ソフト開発者界隈もなんか対策できないかな?
0151名無し名人 (ワッチョイ 635d-2km2)
垢版 |
2018/08/13(月) 20:36:13.08ID:iLaeujNV0
低スペPCだけど、計測について教えてください。
指し手2秒で1000局(ピーク時ノード数で160万くらい)と、
指し手5秒で400局(ピーク時ノード数750万くらい)では、
どちらに意味があると思いますか?
指し手10秒だと200局(ピーク時ノード数は軽く1000万を超えると思うけど)はやる気は全く起こらない。
0154名無し名人 (ワッチョイ 635d-2km2)
垢版 |
2018/08/13(月) 21:16:10.18ID:iLaeujNV0
>>152 >>553
ありがとう。
最低でも100は対局させるけど、
大まかな目安で以下の条件を満たしたら、
時間の無駄だと思うから対局を打ち切ることにしている

対局数 勝数
100   66以上
200  123以上
300  178以上
400  232以上
500  266以上
 :

今は指し手2秒と5秒の結果の違いを調べるために対局させているけど、
結果が大して変わらないのなら、「あくまでも自分の環境」では、
指し手2秒で十分という判断を下すかも。
0158名無し名人 (ワッチョイ 635d-2km2)
垢版 |
2018/08/13(月) 21:58:45.25ID:iLaeujNV0
>>157
信頼区間95%で最低勝率が0.5以上が一般的らしいけど(当方は統計学に無知w)
自分は信頼区間99.99%で最低勝率が0.5以上の勝数で判断してる。

ソフトの相性とか、ノード数とかも関係するかもしれんけど、
当方は自分のPC環境で最も強いソフトを探すのが目的で、
計測すること自体が目的ではないので、これでいいのだw
0159名無し名人 (ワッチョイ 6ae7-2km2)
垢版 |
2018/08/13(月) 22:01:38.67ID:iSh9nucZ0
>>130
> 今度はGW5.0.5 QQRとの対戦を開始しました。
> 同様にノードリミット100万で対戦するように設定しました。
>
> まだ10局程度ですがKai4との対戦では見られなかった
> 逆転勝ちが早くも生じています。
> 60勝40敗ペースを達成しそうですね。
>
> https://i.imgur.com/cRkZ0s0.png

もうやめようかなと思うけど再び
マイナス評価からの逆転パターンが生じてました。

https://i.imgur.com/ur7qSFm.png

247局 142勝 105敗

勝率: 0.5748987854251012
標準誤差: 0.03155121733698077
95% 信頼区間 [0.5141700404858299, 0.6356275303643725]

相対イロレーティング: 52.439618125247335
標準誤差: 22.427284170889855
95% 信頼区間 [9.848989963332782, 96.66285718796355]
0162名無し名人 (ワッチョイ c69f-IYYR)
垢版 |
2018/08/13(月) 22:23:32.55ID:lQPMC3ls0
切り捨て目的ならともかく
欲しい結論に対してのデータなら、途中打切りはありえない
0163名無し名人 (ワッチョイ 635d-2km2)
垢版 |
2018/08/13(月) 23:02:42.05ID:iLaeujNV0
>>162
切り捨て目的ってなんですか?おっしゃる意味がわからない。
自分の欲しい結論とは、自分のPC環境で最強のソフトが知りたい。
だから最大で1000局を目標としていても、途中で統計的に有意な差が出たら、
その時点で対局を打ち切る。
何が問題ですか?
0164名無し名人 (ワッチョイ c69f-IYYR)
垢版 |
2018/08/13(月) 23:51:01.11ID:lQPMC3ls0
>>163
途中で打ち切るってことは多重検定してるのに近いから
0165名無し名人 (ワッチョイ 635d-2km2)
垢版 |
2018/08/14(火) 00:07:27.76ID:1IvZGby30
>>164
ごめん。多重検定とか意味わからないので、もうちょっと詳しく説明してくれるとありがたいです。
では、最初から対局数を例えば100とか、500とか決めてその対局数を完遂した結果で判断すれば
問題ないことですか?
対局数を1000と決めて、途中の100とか500で有意差が出たら、そこで打ち切るのとどう違うのかよくわかりません。
例えば、途中で100とか500で打ち切ったとしても、それが最初から100とか500とか決めていたのと、どう違うのですか?
無知で申し訳ないけど。
0166名無し名人 (ワッチョイ 635d-2km2)
垢版 |
2018/08/14(火) 00:11:02.32ID:1IvZGby30
>>165 ごめん。書き間違い。
誤:例えば、途中で100とか500で打ち切ったとしても、
正:例えば、対局数を1000と決めていたとして、途中で100とか500で打ち切ったとしても、
m(_ _;)m
0167名無し名人 (ワッチョイ 635d-2km2)
垢版 |
2018/08/14(火) 00:25:47.07ID:1IvZGby30
>>164
では、もうひとつお尋ねします。
>自分の欲しい結論とは、自分のPC環境で最強のソフトが知りたい。
どういう対局をすれば、「統計的に」私の求める結果が得られますか?
指し手2秒、対局数1000でも自分の環境では重すぎる検証です。
0172名無し名人 (ワッチョイ 635d-2km2)
垢版 |
2018/08/14(火) 01:06:55.32ID:1IvZGby30
>>171
ありがとうございます。
リンクを熟読しましたが、統計学に無知な私にはほとんど理解できませんでした。
自分の検証で言えることは、対局するどちらのソフトにも肩入れしないこと、
信頼区間99.9%の有意差で打ち切りを判断していることです。
1000局対戦しても統計的な有意差が出ない場合は、
単純に勝数の多さ(プラマイ13〜14%ぐらい?)という主観的な判断になります。
0173名無し名人 (ワッチョイ ca1e-2BkB)
垢版 |
2018/08/14(火) 01:35:05.16ID:jerJSx/L0
学習棋譜の質に直結するから
低ノードでの正確な棋力は今では超重要情報だぞ
短時間で強いソフトを喉から手が出るほど欲しい層が存在する
0175名無し名人 (ワッチョイ 8a75-RrwP)
垢版 |
2018/08/14(火) 03:31:01.46ID:JT+ehn+00
藤井七段の振り駒の後手番の多さは統計学的には有意に多そうだからな
先後が決まっている順位戦入れてもかなり後手が多いくらいだから
0176名無し名人 (ワッチョイ 6ae7-2km2)
垢版 |
2018/08/14(火) 06:35:34.57ID:+9mvVfZG0
>>159
とりあえずQQRとの相対レーティング差が判明しそうな雰囲気になってきたので
今晩まで続けることにしました。
https://i.imgur.com/q5e2fO2.png

339局 202勝 137敗 引き分け6 (対局数から取り除く)

勝率: 0.5958702064896755
標準誤差: 0.026711567948078614
99.9% 信頼区間 [0.5073746312684366, 0.6814159292035398]

相対イロレーティング: 67.45232091608678
標準誤差: 19.269530974741368
99.9% 信頼区間 [5.124790303986275, 132.0752897620778]
0178名無し名人 (ワッチョイ c69f-IYYR)
垢版 |
2018/08/14(火) 06:53:56.57ID:5r8D81hy0
>>165
有意差ってのは確率的にしか判定できない
5%とか1%とかは、差がなくても差があると判定されてしまう
仮に有意水準95%で10回同じ検定を繰り返せば、40%は差があると判定されてしまう
打切りって手法の場合は、前の結果を引き継いでいくからそこまでの影響はないだろうけど(99.9%ならなおさら)、
「統計的には有意水準◯◯%です」ってのは間違ってるので、得られた結論は統計的な後ろ盾が得られない
統計に基づいた有意差あるデータが欲しいなら、それこそ有意水準甘くして、試行回数も数百回くらいに落とせばいいんでは?
0179名無し名人 (ワッチョイ b3b3-4gwP)
垢版 |
2018/08/14(火) 07:01:06.11ID:jpWSE2Ar0
論文に使うデータでもあるまいし、200局以上で有意水準99.9%を軽く超えてるようなものは打ち切っても構わないと思うが
0180名無し名人 (ワッチョイ 8a75-RrwP)
垢版 |
2018/08/14(火) 07:07:49.54ID:JT+ehn+00
ちゃんとしたレート差を知りたいのか、それともレーティングが少しでも上かどうかを知りたいだけなのかで
必要な対戦数は全然違う
0181名無し名人 (ワッチョイ 1b91-q/aD)
垢版 |
2018/08/14(火) 07:21:36.22ID:lkJin3ZO0
>>170
他の棋譜ソフトは?
テキストで見るとどうなってる?
0182名無し名人 (ワッチョイ 861b-8FTb)
垢版 |
2018/08/14(火) 07:51:02.61ID:sKcW2jeO0
両方dolphin,illqha1.1-kai4だと互角で両方dolphin2,illqha2-kai4だとkai4のほうが強いらしい
1500万と3000万で200局の合計400局 kai4側が55%
0185名無し名人 (ワッチョイ b3b3-4gwP)
垢版 |
2018/08/14(火) 10:16:07.45ID:jpWSE2Ar0
ロタさんはGW+QQRとdolphin2+illqha2の計測はやらないのかな
結構ロタさんの計測いつも楽しみにしてるんだけど
0186名無し名人 (ワッチョイ 0361-RrwP)
垢版 |
2018/08/14(火) 10:52:20.76ID:c2BoE05v0
スレの流れ変えるけど
https://i.imgur.com/tAJ3XuM.jpg
MyShogiにこれに近い機能搭載できないかな?
例えば棋譜のフォルダを指定すると解析してこのような感じに表示する(指された手の割合などもあると尚いい)
使い道として、
・24などで自分の棋力に近い人の棋譜を集めて定跡の末端局面でどのように指すかを調べ研究に活かす
・大会で当たる対戦相手の棋譜をぶちこんで人対策

製品版限定でもいいから搭載してくれたら将棋神やねうら王買います
0187名無し名人 (ワッチョイ 83d2-Ixsi)
垢版 |
2018/08/14(火) 10:54:41.00ID:gzD3GH1j0
話を戻すけど、相性問題があるからやはり複数とやらないと正確なレートが出せんな
0189名無し名人 (ワッチョイ 0361-RrwP)
垢版 |
2018/08/14(火) 11:00:16.93ID:c2BoE05v0
シャイだから直接お願いするのは照れるv(*^-^*)v
誰か、いい考えだと思ったら代わりにお願いしてきてくれ!
0190名無し名人 (ササクッテロラ Sp03-xE7Q)
垢版 |
2018/08/14(火) 12:05:05.78ID:4JL8C4rIp
illqha2とkai4がほぼ互角くらいのレートだとするとやっぱり開発環境の差でkaiシリーズのほうが有利なのかな
illqha3が出る頃にはkai6が出てそうなペースだし
0192名無し名人 (ワッチョイ afd2-rjfX)
垢版 |
2018/08/14(火) 12:12:36.14ID:Uz5gs+6r0
>>190
kai5強くなってると作者の方の書き込みありましたね
ペーストしてはkaiのがペース早いですからね
0196名無し名人 (ワッチョイ afd2-rjfX)
垢版 |
2018/08/14(火) 12:31:19.18ID:Uz5gs+6r0
>>195
ソフト全体が強くなるように公開してくれているので
0197名無し名人 (ワッチョイ 861b-8FTb)
垢版 |
2018/08/14(火) 12:35:08.69ID:sKcW2jeO0
illqhaはdolphin探索開発にも手を出してるから大変そう
kai4がレート高かったとしても劣るって事は全くない

2990WXがシネベン5000程度らしいので1950Xとの比較からnps算出すると7980xよりnps出そう
0204名無し名人 (オッペケ Sr03-FYsT)
垢版 |
2018/08/14(火) 14:36:44.30ID:bGYGv4t2r
>>203
棋譜上で表示してるか盤上で表示してるかの違いだと思うけど、
盤上のほうがパッと見わかりやすい。
編集は棋譜上のほうがやりやすいからできれば両方欲しいけどなー。
0207名無し名人 (ワッチョイ ca1e-2BkB)
垢版 |
2018/08/14(火) 15:40:47.64ID:jerJSx/L0
yaselmoの頃のように
SDT6ではkaiシリーズやillqhaよりも強い評価関数は
1〜2個だけという展開になったりして
0208名無し名人 (スップ Sdea-Hc0o)
垢版 |
2018/08/14(火) 15:47:26.79ID:5qAwr/Zad
suiseihuman強いな
Dolphin6950Xに勝ってるな
0211名無し名人 (ワッチョイ 9eed-Qb5F)
垢版 |
2018/08/14(火) 16:08:20.71ID:n2DgOcX00
これを正しく評価できたのが今のとこillqha2だけなんだが

後手の持駒:角二 金 銀 歩三
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香v桂v銀 ・ ・ ・ ・ ・v香|一
| ・ ・v玉 ・v金 と ・ ・ ・|二
| ・v歩v歩v歩v歩 ・ ・ ・v歩|三
|v歩 ・ ・ ・ ・ ・ ・ ・ ・|四
| ・ ・ ・ ・ ・ ・v歩 ・ ・|五
| 歩 ・ ・ ・ ・ ・ ・ ・ ・|六
| ・ 歩 桂 歩 歩vと ・ 飛 歩|七
| ・ ・ 玉 銀 ・ ・ 金 ・ ・|八
| 香 ・ ・ ・ ・ ・ ・ ・ 香|九
+---------------------------+
先手の持駒:飛 金 銀 桂二 歩
後手番
0213名無し名人 (アウアウカー Sacb-rRCy)
垢版 |
2018/08/14(火) 17:40:45.98ID:ipo9lalUa
お前らってオーディオマニア
0214名無し名人 (アウアウカー Sacb-rRCy)
垢版 |
2018/08/14(火) 17:42:06.56ID:ipo9lalUa
みたいなもんだな
音楽そのものには興味なくて
機器の性能だけに関心がある
0215名無し名人 (ワッチョイ dee8-13rw)
垢版 |
2018/08/14(火) 17:50:05.58ID:kLgJXtYg0
レーティング測定で、1手何秒で固定とか、ノード数を固定したりするけど
持ち時間制にしたらどうなるか気になる。
というか、持ち時間10分切れたら1手10秒で測定してみてるけど、
時間かかっちゃって大変。
0216名無し名人 (ワッチョイ f39f-xUyW)
垢版 |
2018/08/14(火) 17:51:11.03ID:VqmFzbM/0
そらオーディオマニアにも音楽そのものが好きな人もいれば音響機器が好きな人もいる
楽器好きもいるしね
0217名無し名人 (ワッチョイ dee8-13rw)
垢版 |
2018/08/14(火) 17:55:37.40ID:kLgJXtYg0
自分の場合、
将棋の棋士や、戦ってる姿が好きだったり、
コンピュータ将棋なら、同じように、開発者の考えとか人柄とかが好きですね。
将棋自体は超弱かったりするけども。
0220名無し名人 (ワッチョイ 861b-8FTb)
垢版 |
2018/08/14(火) 19:28:54.49ID:sKcW2jeO0
めきっとさん気にしてるけど弱いんじゃなくてillqha1.1が長時間向けなのかもしれない
どちらにせよ凄い強いんだから気にする事はないと思うけど
0222名無し名人 (ワッチョイ 8ab3-tyrq)
垢版 |
2018/08/14(火) 19:49:48.74ID:vrOX2Sir0
ある特定のソフトにやや強いのが出来ても、相性問題で他のソフト全般に強くなるとは限らないので開発するのも大変だな
0223名無し名人 (ブーイモ MM4f-ZNjX)
垢版 |
2018/08/14(火) 19:52:29.30ID:JZmdXNVFM
探索は強さではなく相性の時代だから調査が難しい。
色々な組み合わせを試してみないと何が最強かは判断出来ないね。
0225名無し名人 (ワッチョイ aa2e-2km2)
垢版 |
2018/08/14(火) 20:15:19.03ID:VLpMQWEF0
テスト対局させてみました
定跡はオフです

illqha1.1+dolphin2とGW+QQR
293-22-185(ノード5〜600万)

illqha1.1+dolphin2とkai4+dolphin2
223-56-221(ノード4〜500万)

テストしたノード数だとdolphin2との相性はillqha1.1やkai4のほうが良いのかもしれません
次はノード数を少し上げてテスト対局させてみます
0226名無し名人 (ワッチョイ 4aaf-2km2)
垢版 |
2018/08/14(火) 20:26:51.09ID:qglmdp6V0
illqhaの人はいつ頃、次出すなんて必要ないと思うんだ
気長にしこしこやって、これはだいぶ伸びたかもってなったら出してみたらいい

口だけで強いのできたって言ってるだけの人とは違うので、応援してます
0229名無し名人 (ワッチョイ 6ae7-2km2)
垢版 |
2018/08/14(火) 21:30:09.16ID:+9mvVfZG0
もう少し続けてみることにした・・・
https://i.imgur.com/JyO4Wlj.png

502局 299勝 203敗 11引き分け

勝率: 0.5956175298804781
標準誤差: 0.021937031308189702
99.9% 信頼区間 [0.5239043824701195, 0.6673306772908366]

相対イロレーティング: 67.2700601644867
標準誤差: 15.822035905833712
99.9% 信頼区間 [16.623139016648043, 120.93133435570473]
0230名無し名人 (ワッチョイ b3b3-4gwP)
垢版 |
2018/08/14(火) 21:46:30.78ID:jpWSE2Ar0
やっぱりillqha2短時間だと普通に強いよな
偶然丁度1500万ノードらへんが苦手な仕上がりになっちゃったのかな
0232名無し名人 (ワッチョイ 83d2-Ixsi)
垢版 |
2018/08/14(火) 22:49:47.19ID:gzD3GH1j0
ってか1500万ノードの方が時間短いんじゃね
0240名無し名人 (ワッチョイ 678a-8FTb)
垢版 |
2018/08/15(水) 17:17:39.94ID:Ii9nQJIy0
飛車の位置が2八限定なのが居飛車
飛車の位置を3八〜8八まで6か所から選ぶのが振り飛車

つまり、少なくとも居飛車の6倍学習させないといけない。
0241名無し名人 (オッペケ Sr03-Ixsi)
垢版 |
2018/08/15(水) 17:43:03.93ID:AQxT6YRRr
なるほど
頭いいな
0246名無し名人 (ワッチョイ 8ab3-tyrq)
垢版 |
2018/08/15(水) 19:26:25.27ID:KIlnXm1/0
振り飛車のBURRは序盤から評価値が悪いな、やはりソフト間では振り飛車は勝率が低くなる
居飛車が王道なのをBURRが証明してくれている
0247名無し名人 (スップ Sd8a-bhxm)
垢版 |
2018/08/15(水) 19:29:43.25ID:Ni2h88Gzd
>>246
最序盤はそうだね。
ただ、展開によっては振り飛車いける展開になるときもあるし、明らかにダメパターンもあるね。
ダイレクト向かい飛車とかもやっててまだ可能性があるんだなと
0248名無し名人 (ワッチョイ b3b3-4gwP)
垢版 |
2018/08/15(水) 19:30:35.91ID:pgmFjxoq0
でも中盤の評価値をみると結構振り飛車側を良く評価しててそのまま勝ったりしてるから、うまく学習すれば強いのかも?
0249名無し名人 (ワッチョイ 8ab3-tyrq)
垢版 |
2018/08/15(水) 19:31:42.87ID:KIlnXm1/0
ただし人間同士ではソフトほど深く読まないし、悪手疑問手も普通に指すのでソフトほど差が付かないから
振り飛車も十分戦えるのは間違いない
0251名無し名人 (ワッチョイ 63c3-I1aA)
垢版 |
2018/08/15(水) 19:36:52.35ID:S31N64+W0
suimon=名無し名人 (スップ Sd8a-bhxm)
0254名無し名人 (スップ Sd8a-bhxm)
垢版 |
2018/08/15(水) 19:52:22.13ID:Ni2h88Gzd
>>253
可能に思える
結局、明らかにダメな序盤を取り除けば決勝ラウンドには振り飛車党ソフトでもいけそう

その前に将棋電王トーナメントがあるかどうかだが
0256名無し名人 (ワッチョイ 8ab3-tyrq)
垢版 |
2018/08/15(水) 20:25:11.64ID:KIlnXm1/0
現在入手出来る最強の振り飛車評価関数はtttakさんのnn_furibisha2(R4118) だと思うが
R4118はあくまでロタ氏計測QQR-GW505との対局だけの勝率からレート換算したもので、
この評価関数は定跡なしでも9割方あらゆる場所に飛車を振るので振り飛車党の練習には良いかも
0257名無し名人 (ワッチョイ 8ab3-tyrq)
垢版 |
2018/08/15(水) 20:39:19.72ID:KIlnXm1/0
気のせいかも知れないけどillqha2やNNUEkai4の序盤を見ていると矢倉が多くなり雁木が減った気がする
0258名無し名人 (ワッチョイ 06fb-WkF6)
垢版 |
2018/08/15(水) 20:48:17.91ID:f00B/zhF0
godwhale_child5.05のNNUE評価関数版をベースに
NPSを落とさずDitto化する事に成功したので投下

https://i.imgur.com/9xvh4io.jpg
https://1.bitsend.jp/download/bf8c56350f3c25bd3948dbb51161dcfb.html

やねうら王の最新の変更も取り込んでいるから
エンジンと同じフォルダにengine_options.txtを置けば設定をまとめて適用できるようになってる
NPSは殆ど落ちないから、良さげなパラメータがあったらengine_options.txtだけ入れ替えればOK
Dolphin2のパラメータを再現できるengine_options.txtも同梱済み
上記の測定結果は付属のengine_options.txtを適用した状態での計測

NPSを落とさせない都合上設定項目が少し減っていて
NNUE-whaleのバージョンの選択肢が3,6,7だけで0は選べなくなっているので注意
7は超短時間でほんのり強いかな?程度で有意差までは出し切れていないので
検討用途なら実績のある6か3が無難かと
一番上のスクショは一応NNUE-whale7に設定しての対局結果
0264名無し名人 (ワッチョイ de76-HuOL)
垢版 |
2018/08/15(水) 21:59:51.07ID:7xbdF6/U0
結局、自分が強くないと、そして自分の中での判断基準がないとイタチごっこなだけだな
増田みたいにelmoで貫き通すのも1つの考え方だけど
俺は彼のように天才ではないからやはりソフトは差し替えるが
0266名無し名人
垢版 |
2018/08/15(水) 22:34:28.11
>>260
明日あたり公開してもらえますか?
0268名無し名人 (スフッ Sdea-5j/J)
垢版 |
2018/08/15(水) 23:03:57.76ID:E1vTtWm5d
ShogiGUI使ってて思ったんだけど一回勝ち負け決まるまで対局したやつはちゃんと保存出来るのに
本とかの定跡の変化をちょっとなぞったりしたのはちゃんと保存されないんだけどなんか使い方間違えてる?
0269名無し名人 (ワッチョイ de81-4gwP)
垢版 |
2018/08/15(水) 23:10:07.77ID:Wzt940bu0
FUTILITY_AT_PARENT_NODE_GAMMA2 の値が 157 になっているのは
編集漏れですかね?
(dolphin2 は 150)
0271名無し名人 (ワッチョイ 6ae7-2km2)
垢版 |
2018/08/15(水) 23:19:36.05ID:kkchIbnO0
>>260
見切りでいいから公開して欲しいよ。
まずはillqha2に大幅に勝ち越したんならそれを確認したい。
勝率55%なら決定的な差だと思う。
0273名無し名人 (ワッチョイ 3ae0-C8SZ)
垢版 |
2018/08/15(水) 23:39:55.30ID:1o7Ubk1I0
>>262
結論が変わっているというより
曖昧だった部分がドンドンドンドン結論が出て
ドンドンドンドン限定的になっている感じなんだよな
0274名無し名人 (スフッ Sdea-5j/J)
垢版 |
2018/08/15(水) 23:53:58.84ID:E1vTtWm5d
ああ、なんかShogiGUI意味わかんなくなってるな
もう棋譜保存しても5手目で途切れてるじゃん...
一回アンインストールするべき
0275名無し名人 (スフッ Sdea-5j/J)
垢版 |
2018/08/15(水) 23:54:19.16ID:E1vTtWm5d
ああ、なんかShogiGUI意味わかんなくなってるな
もう棋譜保存しても5手目で途切れてるじゃん...
一回アンインストールするべき?
0279名無し名人 (ワッチョイ 0f9f-QxOT)
垢版 |
2018/08/16(木) 11:47:56.33ID:+VKDnfBc0
QQR/GWに対して250局で勝率62%(一手1秒32T、有意確率0.0)でした
https://i.imgur.com/YpvXV7A.jpg

NNUEkai5をアップします(対QQRの棋譜250局が添付されています)
https://www.axfc.net/u/3929870
今回のkai5の主な修正点は、序盤の差し回しです。例えば、後手横歩を回避するようになったので、QQRの青野流(勇気流)を受けなくなりました

floodgateにも流しているので興味があれば対局お願いします
また、QQRに対する勝率も上がってきたので、ツイッターを始める準備もしようかと思っています
0283名無し名人 (ブーイモ MMbf-8AJI)
垢版 |
2018/08/16(木) 13:15:59.45ID:ypWL942JM
強さを比べる上で一番大事なのは対局数
とにかく対局数が最優先であって
持ち時間を増やすとしても絶対に対局数は減らしてはいけない
0285名無し名人 (アウーイモ MM4f-JZs+)
垢版 |
2018/08/16(木) 13:21:38.15ID:wfwKxMByM
>>284
そうなんですね
0287名無し名人 (ワッチョイ df7e-SHmu)
垢版 |
2018/08/16(木) 14:13:20.08ID:afPBye5z0
>>258
illqha2とillqha1.1を使用して試した Dolphin2に対してもWD3に対しても
6割以上勝ち越す 素晴らしい
0292名無し名人 (ワッチョイ db81-WHzP)
垢版 |
2018/08/16(木) 14:46:46.73ID:vbVlRwZa0
いま一番つおいのインストールしたいんだけど。エンジンと評価関数それぞれ教えてください
0297名無し名人 (ワッチョイ 0f96-rzEm)
垢版 |
2018/08/16(木) 15:46:42.27ID:cajf2P0Y0
今のソフトって、NPSがヤバいだけで評価関数はうんこだよな
NPSが人間の数百倍だとしても初段レベルの強さしかない
0300名無し名人 (ワッチョイ ab61-5lJU)
垢版 |
2018/08/16(木) 16:04:16.81ID:Ft5GMJLA0
数手から数十手を読んであとは局面だけで評価する人間はかなり優秀
ノード数少なくても、depth浅くてもそれなりに強いDeepLearningが人に近いかもしれない
0301名無し名人 (ワッチョイ ab61-5lJU)
垢版 |
2018/08/16(木) 16:10:11.95ID:Ft5GMJLA0
めきっと@鵺日々成長中@_illqha
ついに某掲示板のシリーズ最新作が出てきてしまいました。
どうやらめちゃくちゃ強いらしいですね。
次に公開するもので抜くことはちょっと無理かもしれないです。
illqha1.1への再学習が究極的に上手く行ってもR+50は無理だと思うのでしばらくは追いつけない感じでしょうかね。

めきっと@鵺日々成長中@_illqha
高確率で弱くなりそうだけれども、もしかしたら結構強くなる可能性もあるんじゃないかと思っているアイデアを試さざるを得ないですかね。



illqhaの人も諦めへんで〜

>>260,279について、後手横歩避けるようになったとはいえ、先手も後手も勝率が変わらないことがちょっと気になる
NNUEは環境によって結果が結構変わってくるのでこのスレの住民の追試も必要だぞ、がんばれ君たち
0302名無し名人 (ワッチョイ eb9f-YDPB)
垢版 |
2018/08/16(木) 16:14:23.04ID:7/bC52qy0
強いソフトがほしいけど、そういう知識がない俺みたいな人ってほかにもいると思うのよ
だから前にエイプリーがやってたみたいに学習の一部を手伝えるようにしてくれれば、少しは足しにならない?
0303名無し名人 (ワッチョイ 0fe9-JZs+)
垢版 |
2018/08/16(木) 16:20:12.86ID:J27grfjm0
kai5とillqha2で1手30秒で対局させてる
どちらも探索はdolphin2
のんびり眺めるのが楽しい
ちなみに1局目は角換わりから先手のillqha2が勝った
0307名無し名人 (ワッチョイ 0fe9-JZs+)
垢版 |
2018/08/16(木) 17:41:23.74ID:J27grfjm0
2局目も後手のillqha2が勝ったわ
illqha2強いぞ
0308名無し名人 (ワキゲー MM7f-zjF7)
垢版 |
2018/08/16(木) 17:52:13.68ID:0ka4AVnSM
297>>
それはあると思う
最近のソフトは序盤がややアレなのと評価値の乱高下が激しい。
棋譜分析用に使ってたが、2の足を踏む
で、4月までの王者ソフトAperypaqを復権させてみた
短時間で本筋の手を指す。
大局観がいい。評価値がブレにくい。人間が見てわかりやすく参考になる

なかなかいいんで最新ソフトと対局させてみた
チープな4GBで32ビットPC環境w。
一手5秒で意外にもほぼ全勝
qqr,illqha1.1,kai5にも
もちろんしょぼい環境のせいですw(検索やねうら)
パワーが出せない4G環境なんで
棋譜分析用にはAperypaqに戻したね

それはそれとして
kaiとillqhaのレートがどれくらい伸びるかは楽しみです.
ロマンではあります
0309名無し名人 (ワッチョイ df7e-SHmu)
垢版 |
2018/08/16(木) 18:02:09.01ID:afPBye5z0
>>308
NNUEって32ビットでも動くんだ 初耳
0311名無し名人 (ワキゲー MM7f-zjF7)
垢版 |
2018/08/16(木) 18:17:19.69ID:0ka4AVnSM
話題にならなかったがやねうらさんが最近NNUE版を公開したようです

2018年7月29日
やねうら王 NNUE型評価関数ビルド V4.82公開しました
http://yaneuraou.yaneu.com/2018/07/29/%E3%82%84%E3%81%AD%E3%81%86%E3%82%89%E7%8E%8B-nnue%E5%9E%8B%E8%A9%95%E4%BE%A1%E9%96%A2%E6%95%B0%E3%83%93%E3%83%AB%E3%83%89-v4-82%E5%85%AC%E9%96%8B%E3%81%97%E3%81%BE%E3%81%97%E3%81%9F/

リリースされた
YaneuraOu-2018-Otafuku-nosse.exe
が32ビットPC版で、NNUEが動きました

やねうらさんに感謝
0312名無し名人 (ワッチョイ 9f23-ipLS)
垢版 |
2018/08/16(木) 18:17:37.62ID:YiJC1pMi0
レスアンカすらまともにつけられない奴の評など聞くに値せん
メモリ4GBで32bitOSってチープどころか化石中の化石でスマホにも劣る性能だろ
0313名無し名人 (オイコラミネオ MM3f-gVLV)
垢版 |
2018/08/16(木) 18:19:54.47ID:1nDzsZ2xM
>>258
解凍して出てきたYaneuraOu.slnをvisual studioで再ビルドしようとしたら失敗してしまったのですが、どのようにしたらビルドできましたか。
Release2018TNKで構成しビルドをしてみたら、C2672, C2780, C1083 のエラーが出て失敗しました。
0318名無し名人 (ワッチョイ fbb6-Mwiu)
垢版 |
2018/08/16(木) 19:24:58.58ID:TLyZOBK60
自分の感覚とこの板の情報に違和感があったので、自分で対戦させてみました。

探索部は whale7 Ditto2 (157→150修正済み)で固定。

illqha2 VS Kai5 の結果。
12-1-7
でした。
時間は1秒。NPSは2000kN/sくらい。 (ノード数は1秒なので同じです)


illqha2の方が強いと思うけど、同じような人いますか?
0319名無し名人 (ワッチョイ cb91-l28Z)
垢版 |
2018/08/16(木) 20:04:21.74ID:By4Sofmf0
2700X買ったので報告
やねベンチでV4.82 TOで5800NPS

やっぱり8700KのがNPS出るOCしてどっこいどっこい

NNUE系ならIntelのが良いはず?
0323名無し名人 (ワッチョイ effb-7gaa)
垢版 |
2018/08/16(木) 20:32:09.62ID:Aw8war5I0
設定ファイルを作ったので配布します
既存のエンジンのパラメータを手軽に再現するための設定ファイルです
Dolphinの設定ファイルはGAMMA2の記入ミス(>>269氏指摘)を修正済みです
最初に同梱した設定ファイルもそのままの状態(ミスがあるまま)で同梱してあります
https://1.bitsend.jp/download/c56f50c243fdf9f6fe4530e49edaa9bc.html

engine_options.txtは後から入れ替えをしても
既に登録済みのエンジンの設定パラメータは変化しないので気を付けてください
新規登録の際に、ファイルを設置してからエンジンを登録するというのが主な使い方となります

また、Ditto2はベースとなるエンジンが
やねうら王ではなくGodwhale_childのNNUE評価関数版なので
設定ファイルでパラメータを揃えてもオリジナルと完全に同一にはならない点にも注意して利用してください

>>313
MSYS2でclangを使ってコンパイルしました、visual studioではビルドが通るかは未確認です
0326名無し名人 (ワッチョイ 9f23-ipLS)
垢版 |
2018/08/16(木) 20:46:07.61ID:YiJC1pMi0
>>315
しょぼい環境+わけのわからん独自指標でソフトの優劣をつけてるのが気になったんだよ
あと無駄長文うぜぇとかもある
Apery推ししたいが為に他のソフトを不当に貶めてるのも気になる所だな
0327名無し名人 (オッペケ Sr8f-Qgk0)
垢版 |
2018/08/16(木) 20:56:06.64ID:ufytHEKqr
検証は秒読みではなくノード数制限でやって欲しいなあ
これならスペックの違いはほぼ問題にならないし
新参がやりがちなNetworkDelayやMinumumThinkingTimeの未設定も気にしなくていいでしょ
0333名無し名人 (ワッチョイ ebb3-83+p)
垢版 |
2018/08/16(木) 21:12:58.08ID:R2+vLi5h0
開発者の人もそこら辺の設定がイマイチわからない人がどんどん検証に参加し始めるなんて思わなかったんだろ
0338名無し名人 (ワッチョイ ebb3-ipLS)
垢版 |
2018/08/16(木) 21:34:31.27ID:q2BUJR2S0
kaiとかダウンロードしてなかったけど、検証時点でQQRに勝率62%ってのは本当っぽいねぇ
8月の勝率として順調そうでなにより
0340名無し名人 (ワッチョイ 1fe7-ipLS)
垢版 |
2018/08/16(木) 22:06:55.73ID:lwojmeXI0
よくわからん話が常識みたいな語りになっているのが不思議だ。

NodesLimitを仮に100万としたらどんな探索エンジン使おうが100万超えた時点でストップするとおもうんだが?
0341名無し名人 (ササクッテロラ Sp8f-PCkI)
垢版 |
2018/08/16(木) 22:13:20.65ID:jkiZpZlOp
>>340
だからそれが問題って話じゃ?
100万読むのに10秒のエンジンと1秒のエンジンがあったとしてそれを100万制限で比較していいのか?まずいだろってこと
そんなやり方したらDL勢の圧勝だし
0342名無し名人 (ワッチョイ eb9f-YDPB)
垢版 |
2018/08/16(木) 22:13:47.12ID:7/bC52qy0
ノード数で切っちゃうと、エンジンによって枝刈りの有無だとか最適化してNPS確保とかの技が全部消えちゃうじゃん
0344名無し名人 (ワッチョイ cb91-l28Z)
垢版 |
2018/08/16(木) 22:16:48.00ID:By4Sofmf0
>>325
雑に全コア4.2GHzOC

V4.82 TO 6800〜7000NPS CUP温度69℃
V4.82 SSE4.2 6500〜6700NPS CUP温度75℃

TNK_WCSC28 TO 6200NPS CUP温度88℃
TNK_WCSC28 TO SSE4.2 5800NPS CUP温度90℃
0348名無し名人 (ワッチョイ ebb3-83+p)
垢版 |
2018/08/16(木) 22:28:52.78ID:R2+vLi5h0
>>346
まあそれほど大きな差はないってとこか

熱さはもう線型の評価関数と比べたら結構計算複雑そうだから仕方ないっちゃ仕方ない
0349名無し名人 (ワッチョイ 1fe7-ipLS)
垢版 |
2018/08/16(木) 22:47:38.55ID:lwojmeXI0
>>341
いまみんなが注目しているのはillqha2やkai5の評価関数としてどちらが最強かということ。
それを客観的に評価するためには探索エンジンの要素を外して調べたいわけ。
秒数でやると探索数に違いが出る可能性があるので厳密にNodesLimitでやることで
どちらの評価関数が優れているのかわかると思うんだが?
0350名無し名人 (ワッチョイ aba0-0xMQ)
垢版 |
2018/08/16(木) 22:50:45.18ID:b3vtIIAh0
エンジンと評価関数はワンセットなのが最新の常識でしょう
それぞれの評価関数が一番実力を発揮できるエンジンにして計測しないと意味がない
0351名無し名人 (ワッチョイ 0bb3-Qgk0)
垢版 |
2018/08/16(木) 22:52:09.60ID:gjJl8aQB0
illqha2はdolphin2より1.1の方が相性がよく勝率が高いって結果も出たみたいだし、
エンジンと評価関数ではっきり分けて計測するのはどうかなって思うんだよな
0355名無し名人 (ワッチョイ ebb3-83+p)
垢版 |
2018/08/16(木) 23:18:21.36ID:R2+vLi5h0
>>353
いや別にRyzenが悪いって言ってるわけじゃないよ、かなりコスパいいし
ただAVX2がもっと有効に使えたらいいのになってこと
0356名無し名人 (ワッチョイ cb91-iGBs)
垢版 |
2018/08/16(木) 23:20:53.18ID:By4Sofmf0
>>355
ソフト側がryzenに寄せれば良い
0360名無し名人 (ワッチョイ cb91-iGBs)
垢版 |
2018/08/16(木) 23:36:52.43ID:By4Sofmf0
>>359
脆弱性というよりかはi9との差別化
0362名無し名人 (ワッチョイ 9fb3-mZ3i)
垢版 |
2018/08/17(金) 02:56:16.39ID:DAoWyXpb0
既に旧バージョンのソフトでも、あのポナンザに勝率81%か
R差258 勝率81.54%
dolphin/illqha1.1 R4307
Ponanza-wcsc27 R4049
0364名無し名人 (ワッチョイ 1fe7-ipLS)
垢版 |
2018/08/17(金) 07:13:53.27ID:Dd6dLAcw0
残念ながらKai5はillqha2よりも強いとは思えない・・・
あとノードリミット100万で対局させると持ち時間1秒設定でも
100万まで読み込んだあとで着手しているように見える。
そしてそれにかかる時間はGW3<dolphin2で随分違っている。
結局探索エンジンの読み込みの速さがいいエンジンの第一要素
なんじゃないだろうか? 
ここ1か月? ちかく対戦させてきたがGW3の方が常に良い成績を
収めてきた(秒数制限の場合)

https://i.imgur.com/YHO0FWE.png
0367名無し名人 (オッペケ Sr8f-S98F)
垢版 |
2018/08/17(金) 07:46:22.19ID:B55ruR+3r
>>366
基本的な事だよなあ
そんなん分からない輩がドヤッて結果だけ貼ると不正確になる
0372名無し名人 (ブーイモ MM7f-8AJI)
垢版 |
2018/08/17(金) 09:23:17.30ID:0495Gc/lM
3すくみって奴だろう
定跡オフだと戦型が偏るから
他の戦型に誘導された時にレーティングがブレるのかもしれないね
0373名無し名人 (ワッチョイ 9f23-hE18)
垢版 |
2018/08/17(金) 09:35:10.34ID:ugyRe8Gx0
>>349
同じノード数にしてもスレッド数が異なるとLazySMPが露骨に効いて
多スレッドの方が有意に強くなるというのがuuunuuunさんの調査で出てる

だから「コア数の違い」を考慮してノード数を同じにする、というのは
一見意味がありそうで実はない
0375名無し名人 (JP 0H7f-QxOT)
垢版 |
2018/08/17(金) 11:30:21.65ID:KPEb+MFhH
法人で多コアサーバ利用する優位性が分かるなぁ
機械学習系は物量優位だな
0376名無し名人 (JP 0H0f-gLMN)
垢版 |
2018/08/17(金) 11:50:09.42ID:1dz/PyJRH
NNUEkai5、作者がテストで使われたdolphin2との組み合わせがよさそうだな。
昨日はGodwhele Ditto2と組み合わせたが、それよりも安定して強そう。
あくまで数局観戦しての印象です。あしからず。
0377名無し名人 (ササクッテロラ Sp8f-PCkI)
垢版 |
2018/08/17(金) 12:43:03.92ID:wdWwwYQVp
水門のillqha2_6950Xって偽物だろ
流石に1コアの技巧2にそう簡単に負けるはずがない
レートで言ったら軽く1500以上離れてると思うんだが
0378名無し名人 (ワッチョイ ef1b-JoLF)
垢版 |
2018/08/17(金) 12:46:58.96ID:hHhLgrbc0
illqha2もkai5も評価値暴れすぎじゃない?
6950xのillqha2が技巧に負けてるし
そもそも探索の調整ってチョイチョイ弄って本家より精度あがるんかな
レートの算出に使うノードに特化させてるだけで枝刈りとか変になってないのかね
illqha1.1がfloodgate見る限りでは安定してそうだけど
0379名無し名人 (ワッチョイ ef1b-JoLF)
垢版 |
2018/08/17(金) 12:48:06.08ID:hHhLgrbc0
>>377
忘れたけど前にも技巧が一発入れたのあったから嘘じゃないと思うけど
0381名無し名人 (ワッチョイ ef1b-JoLF)
垢版 |
2018/08/17(金) 12:57:46.76ID:hHhLgrbc0
>>380
思い出せなくて申し訳ないけど3か月以内くらいの出来事だったと記憶
技巧の妙手?みたいなの読めなくて盛大に逆転されたのがこのスレでも話になってた
多分あとで誰かが貼ってくれると思うけど
0382名無し名人 (ワッチョイ ebb3-83+p)
垢版 |
2018/08/17(金) 12:58:41.61ID:eRz9zWfO0
>>378
開発者がNNUE用にチューニングした本家の探索は今のところ存在しないよ

iillqha2はillqhaの人も微妙そうだから修正版出すみたいに言ってたし修正版を待とう
0384名無し名人 (ワッチョイ 9f23-hE18)
垢版 |
2018/08/17(金) 14:01:22.30ID:ugyRe8Gx0
>>375
そういう中で、絶芸や星陣には及ばないけどその次くらいに個人で来てる
山口さんの凄さが際立つ
電王トーナメント開催されてほしいなあ
0385名無し名人 (ワッチョイ df7e-SHmu)
垢版 |
2018/08/17(金) 14:03:42.61ID:mLHfIJry0
>>364
kaiシリーズはともかくillqhaシリーズはGodwhele Ditto2と
組み合わせた方がGW3やdolphin2よりも強いと思う
0386名無し名人 (ワッチョイ cb91-iGBs)
垢版 |
2018/08/17(金) 14:40:15.40ID:egVSgk1R0
>>344
追記
ちょっと煮詰めて
NNUEでも4,2GHzで70度以下で動作
0390名無し名人 (ワッチョイ ab61-5lJU)
垢版 |
2018/08/17(金) 17:56:38.64ID:AQ2CmuRs0
ロタ@Rota_JP
illqha1.1_dolphin1 vs NNUEkai5_dolphin1
141-30-135

総試合数: 306, 勝率(引分0.5勝換算): 50.98%, ΔR(引分0.5勝換算): +6.81, 引分率: 9.80%

一手1秒(24T)

Hash=1GB,NoBook,PonderOff,Resign3000,Draw256 #コンピュータ将棋検証 #shogi #CSAlive
棋譜:https://t.co/U2tIBY7Ixr 👀
Rock54: Caution(BBR-MD5:b73a9cd27f0065c395082e3925dacf01)
0395名無し名人 (ワッチョイ 1f2e-ipLS)
垢版 |
2018/08/17(金) 18:57:05.40ID:cE0fpb5J0
テスト対局させてみました
エンジンはdolphin2です
定跡はオフです
結果が微妙だったので、再検証はしてみたいと思います
ファイルは各PCで個別にDLしました

dolphin2+kai5とdolphin2+illqha2
186-65-249(ノード5〜600万)
38-17-45(ノード2000〜2500万)
0396名無し名人 (ワッチョイ 1fe7-ipLS)
垢版 |
2018/08/17(金) 21:47:15.44ID:Dd6dLAcw0
>>367
基本的なこととか言ってるけどどこにその記述があるの?
将棋GUIのマニュアルにでもあるのかい?
それともやねうら王のパラメター説明に記述でもあるの?
あなたにとっては基本的かもしれないけど具体的に
どこに記述があるか教えて欲しいよ。
0397名無し名人 (ワッチョイ ebb3-83+p)
垢版 |
2018/08/17(金) 21:50:53.24ID:eRz9zWfO0
>>396
やねうら王系のエンジン使うならソースのdocsの中のUSI拡張コマンドっての読むといいよ、大体のことはそれに書いてあるから
0398名無し名人 (ワッチョイ 1fe7-ipLS)
垢版 |
2018/08/17(金) 21:50:53.43ID:Dd6dLAcw0
>>369
同じ物での評価はすでにやったんだよ。GW3同士でね。
でもdolphin2がいいと皆が評価してるからKai5を変えてたら
成績が逆転するかと思ったわけだ。
しかし結果は同じだったというわけだ。
そこで探索エンジンは探索スピードが一番重要なんじゃないかと
思ったわけだ。
0399名無し名人 (ワッチョイ ab61-5lJU)
垢版 |
2018/08/17(金) 21:58:17.35ID:AQ2CmuRs0
低ノードや短時間で計測してる人はdepth固定(教師局面はdepth10とかdepth12で作ってる)で計測した方が開発者の人のためになるかと


強いからといっていい教師になるとは言い切れないけど、100万ノードの計測結果は使い道も信頼性もなさ気
0400名無し名人 (ブーイモ MMcf-8AJI)
垢版 |
2018/08/17(金) 22:08:55.21ID:g0lpikeGM
測定の精度は対局数で決まるのということを理解してない奴が多すぎる
ノード数があろうとなかろうと対局数を重ねることが最優先
一番無駄なのは最近多い100局未満の結果
あれマジでなんの参考にもならない
0401名無し名人 (ワッチョイ 2bc3-Qgk0)
垢版 |
2018/08/17(金) 22:11:28.74ID:iVvMXyX20
suimonさん鍵垢って何か事件あったんですか?
0403名無し名人 (ワッチョイ effb-7gaa)
垢版 |
2018/08/17(金) 22:39:27.67ID:v0ij6F0Z0
>>323のファイルは書式を間違えていたので再アップ
設定値そのものは適用されるものの
オプションファイルを置いている状態ではGUI上での設定変更が効かなくなってた
あくまで設定ファイルのミスなのでエンジンはそのままで無問題
https://1.bitsend.jp/download/0a089154a1820aea85a4b2fb22772d05.html

kai5でDolphin2/illqha2に対して
1700局で勝率52%の設定ファイルも同梱(ほぼDolphin2)
https://i.imgur.com/FfA7xTV.jpg
計測データも少し入っているので興味のある人はどうぞ

エンジンと設定ファイルをワンセットにしたダウンロードURL
https://www.axfc.net/u/3930268
0405名無し名人 (ワッチョイ 0fe9-vP1O)
垢版 |
2018/08/17(金) 23:54:07.37ID:jtVc4yCx0
どんなにインパクトのある結果であっても、検証手法が間違っていれば全くの無意味
科学的な検証を行う際の基本中の基本だ
0406名無し名人 (ワッチョイ 1fe7-ipLS)
垢版 |
2018/08/18(土) 00:26:02.98ID:t8K5cN140
>>405
何を偉そうに言ってるの?
インパクトのある結果が間違っているのなら、それを指摘して正しい検証方法でやり直せば本当に間違った結果か
どうかわかるんだから何も問題ないよ。何を指してインパクトのある結果といってるのか
今一つ伝わらないけど・・・
0413名無し名人 (ワッチョイ 2bc3-Qgk0)
垢版 |
2018/08/18(土) 10:09:14.98ID:Vde4lUY30
実際のところ、電気の無駄と気がついたんだろ
コンピュータ将棋界隈は目新しさもないし
辞めることができて彼にとっては良いことなんじゃないか
0415名無し名人 (ペラペラ SDbf-VMBl)
垢版 |
2018/08/18(土) 10:46:33.02ID:Y7/+mjzDD
何人かの有志が居れば、確かにチェスのCCRLのようなもんは簡単に立ち上げれそうな気はする
0416名無し名人 (ワッチョイ 2bc3-Qgk0)
垢版 |
2018/08/18(土) 11:15:07.43ID:Vde4lUY30
ここでsuimonが立ち上がらないと
0417名無し名人 (ワッチョイ 0fe9-JZs+)
垢版 |
2018/08/18(土) 11:26:22.98ID:7fxaMw4+0
需要ねえ
0418名無し名人 (ワッチョイ 0b59-7xDZ)
垢版 |
2018/08/18(土) 11:48:01.39ID:AkTqECYh0
より高いレーティングのソフトの登場のためにはレーティングサイトは重要
開発者のモチベーションになる
0419名無し名人 (ワッチョイ 2bc3-Qgk0)
垢版 |
2018/08/18(土) 11:53:29.01ID:Vde4lUY30
SCSRL(suimon compute shogi rating list)とか立ち上げようぜ
0420名無し名人 (ワッチョイ 2bc3-Qgk0)
垢版 |
2018/08/18(土) 11:54:10.15ID:Vde4lUY30
計測の負担が大きい時代なんだよな
0421名無し名人 (ワッチョイ 0bb3-Qgk0)
垢版 |
2018/08/18(土) 12:02:18.77ID:Mw5Qn/9D0
Leelaのチェスと囲碁がやってるような、
棋譜生成、機械学習、比較検証まですべてやれるプロジェクトが将棋にも欲しい
協力者は難しい設定をする必要なくPCつけっぱにするだけ
0425名無し名人 (スップ Sdbf-bOgO)
垢版 |
2018/08/18(土) 18:24:22.82ID:hfz3FVsTd
なんで消したのだろう?
更新しなくても残しておくことに価値があるのに…

誰が嫌なことでも言ったのかな
0426名無し名人 (ワッチョイ ebb3-83+p)
垢版 |
2018/08/18(土) 18:38:22.37ID:UHq1XkTH0
まあ維持するのもただじゃないししゃあないな
でもできることならレーティングサイトには復活してほしいね、きちんと組織的な新運営で
0427名無し名人 (ワッチョイ 9fb3-mZ3i)
垢版 |
2018/08/18(土) 18:41:18.46ID:m+OOhLw30
uuunuuunさんがレーティング管理を引退したのは残念だが、今後は新しいソフトが出たら今までどおりロタ氏の計測に期待したい
0428名無し名人 (ワッチョイ 1f2e-ipLS)
垢版 |
2018/08/18(土) 19:02:48.49ID:XQGSt8iF0
いつものテスト対局です
dolphin2+kai5とGW+QQRです

295-31-174(ノード5〜600万)
55-5-40(ノード2000〜2500万)

dolphin2+illqha2との対局で結構負け越したのですが、こちらは順当に勝ち越してます
0429名無し名人 (ワッチョイ 0fe9-JZs+)
垢版 |
2018/08/18(土) 19:06:14.37ID:7fxaMw4+0
自分のところの環境でも
NNUEkai5/dolphin2よりillqha2/dolphin2の方が有意に強いっぽい
0431名無し名人 (オッペケ Sr8f-S98F)
垢版 |
2018/08/18(土) 19:14:12.25ID:LfQDj4QUr
>>425
ドメイン料やサーバ代の支払い忘れとか?
0435名無し名人 (ワッチョイ effb-7gaa)
垢版 |
2018/08/18(土) 20:25:07.81ID:IJUP3cOW0
エンジンに同梱したオプションファイルを
評価関数をillqha2に固定してDolphin2を相手に計測
(初めからengine_optionsという名前になっている設定ファイル)
https://imgur.com/a/RW5NOk0
8000局で3964勝-252分-3784敗(勝率51.1%)

>>403と合わせて
Dolphin2ベースの2個の設定ファイルの計測はこれで終わり
500局で53%>>258だったから1700局で足りるかと思ったら
実際のレート差は実は小さかったようで
想定していたよりも対局数が必要になってしまった


>>409
android版は自分も作れるなら作りたいんですけど
コンパイルする方法がよく分からないので現状未定です
0436名無し名人 (ワッチョイ fbff-ipLS)
垢版 |
2018/08/18(土) 20:52:19.30ID:pnmL7yxO0
詰将棋エンジンのアンドロイド版が欲しい
なのはさんか脊尾さんお願いします
あ、やねうらさんが市販ソフトに詰めルーティンを入れるらしいからGPLだろううしそれをアンドロイド対応でもよかです
0437名無し名人 (ワッチョイ ebb3-83+p)
垢版 |
2018/08/18(土) 21:03:31.47ID:UHq1XkTH0
NNUEの登場で普通に現れる詰みはわりとすぐ見つかるようになったし、詰将棋エンジンの必要性が薄れたわ
0442名無し名人 (アウアウエー Sa3f-S98F)
垢版 |
2018/08/18(土) 23:12:15.40ID:BgWgiaj4a
そろそろ厳しそうだけど今後R5000とか行くのかね
0443名無し名人 (ワッチョイ 9fb3-mZ3i)
垢版 |
2018/08/18(土) 23:19:03.01ID:m+OOhLw30
誰かが今年中にNNUEは今よりR200は上がるって言ってたが
0447名無し名人 (ワッチョイ aba0-0xMQ)
垢版 |
2018/08/18(土) 23:35:26.08ID:/rPbVgK10
>>444
スレのデータは探索部込みだったか、失礼
illqhaも1.1の方が強い説が出ているし
どうやら本格的に天井が近付いていそう
0449名無し名人 (アウアウエー Sa3f-S98F)
垢版 |
2018/08/18(土) 23:49:28.95ID:BgWgiaj4a
Yssの山下さんがR4600くらいが限度みたいなこと言ってなかったか
0451名無し名人 (ワッチョイ ebb3-83+p)
垢版 |
2018/08/19(日) 00:03:28.47ID:cbHHrWpV0
>>450
T.N.K.チームがあまり大きなNNを採用していないということはあまり大きくしても弱くなるってことなんじゃないかな?
せいぜい隠れ層のニューロンを増やすかもう一層増やすくらいじゃない?
それも速度低下以前に大きくなったNNをうまく学習出来ればの話になりそうだし
0452名無し名人 (ワッチョイ 0bb3-Qgk0)
垢版 |
2018/08/19(日) 00:04:55.94ID:gIv3nYVt0
野良が各々学習や検証の為に消費してるリソースを一カ所に集めたら、
もっと強い評価関数ができるのにって常々思うんだよなぁ
0453名無し名人 (ワッチョイ db8a-CEJQ)
垢版 |
2018/08/19(日) 03:05:58.14ID:nQUR+idf0
>>449
30年くらい前は、数学者でも「プロ棋士の4段クラスのソフトはこの世の終わりまで登場しないかもしれない」と書いていた
20年前でも四枚落ちでプロ棋士に負けていた
それが次々と壁を打ち破る手法が登場して、10年くらい前にプロ棋士の4段クラスのソフトが登場した
4600の壁はあっさり敗れると思う
0454名無し名人 (ワッチョイ ab61-5lJU)
垢版 |
2018/08/19(日) 04:27:06.24ID:4BRrz90R0
elmo絞り→一回でR200上がるすげえ!→何回回しても全然強くなんねぇ

NNUEもいっしょや!


ところでNNUEで作った教師局面でKPPTを絞ったら強くなる?
0455名無し名人 (ワッチョイ ab61-5lJU)
垢版 |
2018/08/19(日) 04:30:08.30ID:4BRrz90R0
透。さん、illqhaの人やkaiの人の計測結果からある結論に至った
鵺は作成者を親だと思い、親の環境だと力を発揮する
オカルトです
0457名無し名人 (ワッチョイ ab61-5lJU)
垢版 |
2018/08/19(日) 04:48:58.96ID:4BRrz90R0
技巧は開発者が多忙により休止
Aperyは開発者が株式上場でがっぽりだからダントツ一位になれる可能性があるぞ
0459名無し名人 (ワッチョイ 1fe7-ipLS)
垢版 |
2018/08/19(日) 07:19:56.98ID:ATTxcArU0
>>403

Kai5のGW7版でillqha2のGW7版で試したらKai5に軍配が上がった。
ところがillqha1.1/dolphin2が強いというレスがあったので今試した。
まだ始まったばかりだがillqha1.1/dolphin2は期待できるかもしれない。

なお全てノードリミット100万で対戦して調査してます。
https://i.imgur.com/RkC6cPt.png

Kai5/GW7 vs illqha2/GW7
https://i.imgur.com/1ZYOqSm.png
0460名無し名人 (ワッチョイ aba0-0xMQ)
垢版 |
2018/08/19(日) 07:32:38.62ID:yJ6gr3CH0
やねうら王とGodwhaleではNPSが微妙に違うから
ノードリミットではなく持ち時間制限にしないと駄目じゃないか?
そのNPSならNetworkDelay2を500にして秒読み2秒にしたらだいたい100万ノードになるはず
0462名無し名人 (ワッチョイ abd2-S98F)
垢版 |
2018/08/19(日) 08:26:39.77ID:ZnqX4Df30
>>453
そんな希望的観測じゃなくもうちょっと合理的な理論を持ってきてくれ
0464名無し名人 (ワッチョイ 7bed-QxOT)
垢版 |
2018/08/19(日) 08:53:15.59ID:cfa13kme0
対局数至上主義の人はどのノード数以上までなら有意なの?
1万?50万?100万?500万?1000万?1500万?
何か曖昧なので
0465名無し名人 (ブーイモ MMbf-8AJI)
垢版 |
2018/08/19(日) 09:07:01.64ID:ZOevn6axM
有意かどうかは対局数でしか決まらないから
例えばR差20を計測したいなら
ノードが1500万だろうが10億だろうが800局程度までは打ち切ってはダメだし
それが無理ならノード数を減らすべきという単純な話
ノード数を維持する為に対局数を減らすのは優先順位が逆
0467名無し名人 (ワッチョイ ebb3-83+p)
垢版 |
2018/08/19(日) 09:15:34.35ID:cbHHrWpV0
ノード数多いと計測は大変だけど、少なくとも500万くらいはほしい気がするかな
100万くらいだと勝率がuuunさん基準の測定と離れすぎる気がするし、そもそも超短時間で検討とかしないからそんな時間での強さ測ってもなあ
0468名無し名人 (スッップ Sdbf-uQoa)
垢版 |
2018/08/19(日) 09:21:13.16ID:T4SkDi/Cd
どっちが強いか単純に測りたいならノード数なんてどうでもいいでしょ
対局数が多ければ多いほど信頼性のあるデータになる
0470名無し名人 (ワッチョイ ef9f-B6o8)
垢版 |
2018/08/19(日) 09:43:01.72ID:dXPmJjxi0
短時間長時間なんて定量的なもんでもないし、どのノード帯で検討するかなんて人それぞれでしょ
一つの局面延々読ませる人もいれば、多くの棋譜の解析を一手数秒で流す人もいる
統計的な評価とノード数問題は別物で、まずは少なくとも統計的に価値のあるデータ数を確保しなさいよというだけの話
で、ノード数については現状一般化された理論がないので、◯◯ノードで測定しなければいけないなんてことは言えない
0471名無し名人 (ササクッテロラ Sp8f-PCkI)
垢版 |
2018/08/19(日) 09:47:33.00ID:UyyUoVARp
超短時間すぎると統計以前にそもそも対局データとしての価値は下がる
数十万ノードと数千万ノードで勝ち越すほうが逆になるなんてことはよくある
数十万ノードで使うことなどないので数十万ノードで強くてもあまり価値がない
0472名無し名人 (ワッチョイ aba0-0xMQ)
垢版 |
2018/08/19(日) 09:51:10.58ID:yJ6gr3CH0
>>471
>数十万ノードと数千万ノードで勝ち越すほうが逆になる

そんなのあったっけ?
数十万ノードなら手元ですぐに再現実験が可能だから
具体的にどの組み合わせを数十万ノードで対局させると
レーティング表とは逆の結果になるのか知りたいんだけど
0474名無し名人 (ワッチョイ ef9f-B6o8)
垢版 |
2018/08/19(日) 10:14:33.93ID:dXPmJjxi0
>>471
対局データとしての価値とは?
単にハイレベルな棋譜が欲しいなら、
時間を際限なく伸ばして一局やればいいだけ

>>473
任意のノード数で勝率が変わらないんじゃなくて、
◯◯ノードで測定したから大丈夫(何が?)保証はどのノード帯にもない
0475名無し名人 (ササクッテロラ Sp8f-PCkI)
垢版 |
2018/08/19(日) 10:19:52.31ID:UyyUoVARp
>>472
例えばkai5とillqha1.1
4スレ0.1秒300局だとkai5が53%だったがロタさんの計測ではillqha1.1が勝ち越し

対局数少ないから誤差の範囲内といえばそうだがノード数によって強さが変わるのは間違いないと思うよ
ロタさんのillqha1.1とQQRの検証を見るべし
0476名無し名人 (ブーイモ MMbf-8AJI)
垢版 |
2018/08/19(日) 10:20:29.08ID:ZOevn6axM
ノード数で結果が逆転する実例を見つけているなら凄いけど
長時間厨は統計が分かってないから
彼らの書き込む「よくある」は全くあてにならないのが問題だな
0回でもよくあると思ってしまうフシがある
0477名無し名人 (ササクッテロラ Sp8f-PCkI)
垢版 |
2018/08/19(日) 10:25:35.32ID:UyyUoVARp
>>474
検討で使うとき0.1秒しか読ませないなんてことはないから超短時間で強いよりはそこそこのノード数で強いほうが有用じゃない?
つまり両方十分な対局数をこなしていた場合ノード数が多い計測データのほうが価値があると思うんだけど
0478名無し名人 (ワッチョイ aba0-0xMQ)
垢版 |
2018/08/19(日) 10:27:51.99ID:yJ6gr3CH0
>>475
それ全部誤差じゃん
言っておくけど300局で53%も誤差だぞ
1500万ノード側が有意差が出るレベルで計測されていないと話にならない
0480名無し名人 (ワッチョイ df7e-CEJQ)
垢版 |
2018/08/19(日) 10:31:21.22ID:TUERk72n0
elmoが1手5秒以上だと勝ち越す相手に2秒以下だと
負け越すと昨年よく聞いた
0483名無し名人 (ワッチョイ 9fb3-mZ3i)
垢版 |
2018/08/19(日) 11:10:52.48ID:ehl6uW7Y0
>>472
NNUEkai5は以下自分の計測では一手0.1秒のような超短時間ではillqha2にもillqha1.1にも勝率53%程度で強いけど、
uuunuuun氏の対局ログ(1500万ー2000万ノード)ではNNUEkai5がillqha1.1に勝率46%で逆の結果になっている
だから極端な低ノードでは、いくら対局数をこなそうが数千万ノードとは逆の結果になることが多いのでやっても参考にならないと思う

NNUEkai5-dolphin1 256-15-229 illqha2-dolphin1 対局数500 勝率52.7%
4スレ 一手0.1秒 定跡なし Hash1024 投了値2000

NNUEkai5-dolphin1 262-9-229 illqha1.1-dolphin1 対局数500 勝率53.3%
4スレ 一手0.1秒 定跡なし Hash1024 投了値2000

uuunuuun氏の対局ログ(1500万ー2000万ノード) 引き分け0.5勝換算
dolphin1/NNUEkai5 284-323 dolphin1/illqha1.1 勝率46%
0484名無し名人 (ワッチョイ ab61-Yx6K)
垢版 |
2018/08/19(日) 11:19:21.85ID:siQjcBT70
散発的に持ち時間長くすると逆転したと言ってるだけで
ノード変化によるレート変化の網羅的なデータは無いしなあ
0485名無し名人 (ワッチョイ ab23-rbCU)
垢版 |
2018/08/19(日) 11:32:31.98ID:1C7qNVSg0
しょぼいコンピュータで時間もかけないならば
持ち時間を少なくすれば統計的に正確でも実用上意味のないデータができて
持ち時間を多くすれば実用上意味があっても統計的に不正確なデータができて
どちらにしろ役に立たない
という当たり前の話じゃないの
なんの苦労もなく承認欲求を満たせるようなうまいはなしがあるわけない
0486名無し名人 (ワッチョイ 9faf-ipLS)
垢版 |
2018/08/19(日) 11:45:27.87ID:cCCf+7zb0
ハイスペック長時間の統計がどれだけ一般ユーザにとって有用なのか謎だけどね
そもそもマニアしか興味のないジャンルかもしれないけど
0487名無し名人 (ワッチョイ ef9f-B6o8)
垢版 |
2018/08/19(日) 12:08:33.68ID:dXPmJjxi0
ノード問題の戦犯?はelmoだわな
そういう結論になるわけではないのに、長時間計測が正義みたいな風潮を一部に作ってしまった
0488名無し名人 (ワッチョイ ebb3-83+p)
垢版 |
2018/08/19(日) 12:13:57.52ID:cbHHrWpV0
>>485
まあそういうことだよね結局

自分含め一般ユーザーも検討のときはそれなりのノード数ないし深さを読ませるものじゃない?
uuunuuunさん基準の1500万ノードがハイスペック過ぎる条件だとは全く思わないかな
1手100万ノードでソフトの思考を終了させることなんてあまりないと思う、100万NPSの低スペックPCですら1秒なわけだし
0489名無し名人 (ワッチョイ dbcc-ipLS)
垢版 |
2018/08/19(日) 12:14:51.68ID:VIcbV6lG0
1手0.1秒で対局させている人がいまだにいるみたいだが、棋譜のログ見れば分かるが探索深さバラバラだよ。
1スレッドで試してみたが深さ9〜14位で物凄く不安定だ。こんなんで正確な強さが測れるわけない。
思考時間が増えるほどどちらも同じような深さで安定しているから結果の信頼性高くなる
0491名無し名人 (オッペケ Sr8f-CP3z)
垢版 |
2018/08/19(日) 13:02:02.21ID:0TWl/WB3r
中盤や終盤で複雑な局面を検討させると最善手が変わるよね
100万ノードや数千万ノードでの最善手ももっと読ませると悪手だということが分かったりすることが多い印象がある
で、実戦で勝敗が決まるのもそうした局面で最善手を指せるかによるんだよ
だから、100万ノードでの結果が逆転しないとしても、検討に使うソフトは難解な局面で最善手を見つけることができるかなんだよな
0492名無し名人 (ワッチョイ 7bed-QxOT)
垢版 |
2018/08/19(日) 14:03:46.75ID:TEKJ3Fxi0
結局何ノードなら有意?
1ノードもあり?
できれば根拠も添えてもらえればみんな納得しやすいかなと
ちなみに自分でもelmo以降のKPPTは何千回と計測してきたが、個人的には1500万は最低ラインかなと
むしろ足りない気もする
nnueはまた違って当たり前なので、有意な最低ノードが知りたかった
統計的に有意な最低ノードがあったほうが不必要な計測をやらなくて済むし、考慮しなくて済む
100万より少ないかもしれないし、多いかもしれない
100万というのは人間が思う切りの良い数字なだけかもしれない
ただ、KPPTとnnueの対戦なら秒数計測で1500万ノード分以上は必要だと思う
0493名無し名人 (ワッチョイ ab23-rbCU)
垢版 |
2018/08/19(日) 14:25:50.63ID:1C7qNVSg0
>>492
それを知るには例えば1局10秒、100秒、1000秒、とたとえばFGの持ち時間の対局で
勝率の相関がどれくらいあるかを数組か数十組か数百組かどれくらいかしらないけど
統計的に十分な量の対戦カードの組み合わせについて調べないといけないんじゃない?
統計わかんないけど
0495名無し名人 (ワッチョイ ab61-Yx6K)
垢版 |
2018/08/19(日) 14:42:19.21ID:siQjcBT70
「100万ノードだとA>Bだけど1000万ノードならA<Bである。
よって長時間ならBが強い」なんて結論出すのは相当頭悪い話だけどな。
0498名無し名人 (オイコラミネオ MM7f-gVLV)
垢版 |
2018/08/19(日) 15:28:04.45ID:qSIPP2DrM
>>323
258 配布のソースですが、MSYS2のビルドもエラーで上手くいきませんでした。
search.cppの3313行で、YaneuraOu2017GOKUが呼ばれてるのが原因っぽいです。
0499名無し名人 (ワッチョイ 7bed-QxOT)
垢版 |
2018/08/19(日) 15:44:02.75ID:TEKJ3Fxi0
>>493
そう
なので今までは1500万ということになっているけど、それ以下に減らすと統計的にどうなのかな、という

>>495
どのソフトでも、ノード数が増えればその分勝率が高くなるが、勝率の伸び方が違うかもしれない
1000万や1500万が長時間と言えないかもしれないが、それ以下では長時間で強いとは更に言えない
実利用は検討用途が多い事も考えないといけない

>>497
そう
完全に同じ条件というのは難しいので、できるだけ揃えたほうが良くね?と思って
0500名無し名人 (ブーイモ MMbf-8AJI)
垢版 |
2018/08/19(日) 16:06:29.78ID:ZOevn6axM
結局1500万ノードでは肝心の対局数が全然足りないから測定誤差での議論になる
対局数が足りないことが理解できない人ほど1500万ノード信者になるから議論の質も低い
0501名無し名人 (アウーイモ MM4f-JZs+)
垢版 |
2018/08/19(日) 16:17:03.72ID:jZWKdsuIM
信者だとか厨とかいってるレスよりは十分質が高いと思うけどね
0502名無し名人 (ワッチョイ ab61-Yx6K)
垢版 |
2018/08/19(日) 16:21:57.52ID:siQjcBT70
ノード数増加による棋力向上の変化は理論は何も手がかりは無いし
経験則と言えるほどのデータも集まってない。
1500万ノードで調査した結果からは1500万ノードの棋力がわかるだけで特に一般則は無い。
0503名無し名人 (ワッチョイ 9fb3-mZ3i)
垢版 |
2018/08/19(日) 16:26:36.08ID:ehl6uW7Y0
100万ノードではA>B、1500万ノードではA<Bの結果なら一手10億ノードで強いのはBの可能性が高いと思う
だから検討用に使うなら1500万ノードで割り切ってもいいのでは、理想は一手5000万、1億、2億とノード数を
変えて計測するのが理想だが有効な統計数を取るには個人では時間的に無理なので、この手の話をしても意味がない
0504名無し名人 (ワッチョイ cb91-iGBs)
垢版 |
2018/08/19(日) 16:29:01.40ID:XM4EcoQ70
>>499
>>500
>>503
そもそも同一ハードでソフトによってNPS違うのにノード数で縛る意味とは?
0505名無し名人 (ワッチョイ ab61-Yx6K)
垢版 |
2018/08/19(日) 16:58:36.81ID:siQjcBT70
>>503
単調変化だと確信が無いのに二点測って結論出そうとする
頭の悪いことをここで言い出す人が現れるとは思わなかったわ
0506名無し名人 (ワッチョイ ab23-rbCU)
垢版 |
2018/08/19(日) 17:03:18.80ID:1C7qNVSg0
>>500
そもそも2ちゃんねるの書き込みの信頼性が見積もれないと思うんだけど
対局条件がきちんとしているならば、それだけでは価値のない10局の結果は
価値のある1000局の一部になれる可能性がある

>>504
違うハードで条件を揃えやすい
レーティングの相性問題に目をつぶれるならば、ノード数の違う自己対戦の結果を
つかってレーティングを補正できる
0507名無し名人 (ワッチョイ 9fb3-mZ3i)
垢版 |
2018/08/19(日) 17:10:43.55ID:ehl6uW7Y0
>>505
頭が悪いのはお前だろうが、計測はどこかで妥協しないとキリがないだろうが、強いのか弱いのか分からない一つのソフトの計測にお前のような理想ばっかり
述べても時間を取られるだけで実用性がないからな
0508名無し名人 (ワッチョイ ef1b-JoLF)
垢版 |
2018/08/19(日) 17:12:03.03ID:jJVjgVEy0
何にもしねぇ、声だけデカイ馬鹿はどこにもいるからな
妄想カタカタしてる暇あったら、お前の好きな方法で計測してこい
誰にも必要とされてねえよ
0509名無し名人 (ワッチョイ ef9f-B6o8)
垢版 |
2018/08/19(日) 17:15:13.26ID:dXPmJjxi0
理想とかじゃなく、◯◯ノードはダメだけど△△ノードは価値があるって判断そのものが
現状ナンセンスなんだって気づけよ
0511名無し名人 (ワッチョイ efac-ipLS)
垢版 |
2018/08/19(日) 17:30:04.99ID:6cIuGvPp0
というかノード数変えてどこから統計的に有意とか、恥ずかしい発言だと思わんのか。
このスレで有意って単語見たからって知らん言葉使っとるんか

ある実験条件(ノード数なり思考時間なり)で無限に対局を重ねれば、ある勝率に収束する
その確からしさが欲しいならそれぞれ対局数を重ねるしかない。

短時間対局で対局数を重ねれば、短時間対局でのあるべき結果に収束する
実験条件を変えた時に異なる勝率に収束するかは別の問題
それは統計の問題ではない
0512名無し名人 (ワッチョイ dbcc-ipLS)
垢版 |
2018/08/19(日) 17:36:00.99ID:VIcbV6lG0
illqhaの作者は学習時にLAMBDAを0.05にしているようだけど、それ自体は悪いことじゃないだけども、
それだとせっかくdepth12で作った教師の評価値があまり意味がなくなっていると思う。
LAMBDA混合絞りで序盤の評価値のLAMBDAは大きくした方が深い探索が生きると思う
0513名無し名人 (ワッチョイ 9f33-couo)
垢版 |
2018/08/19(日) 18:02:24.21ID:T4ckvBIM0
TCECの同点のときの順位決定法ってSB優先じゃなかったんだな

1.クラッシュ数(少ないほうが勝ち抜け)
2.直接対決の成績上位
3.勝ち数の上位
4.後手番での勝ち数の上位
5.SBの上位
6.主催者の判断

TCEC 13の3部リーグは8エンジンによる4回戦総当たり全28回戦が終了し
Etherealが17勝0敗11分の22.5ptsで無敗優勝を飾った。
2位はArasanが9勝5敗14分、LeeraChessZeroが7勝3敗18分の16ptsで並んだが
直接対決で1勝3分と上回ったArasanが1期で2部への復帰を決めた

なお、3部リーグはずっとGPUの熱トラブルが続きLeeraChessZeroは実力を発揮
できなかったもよう。冷却と電力消費の問題を克服した20回戦から猛烈な追い上げを
開始したが、Arasanとの直接対決差に涙を飲んだ

やっぱNN勢を大会に出すってのはなかなか大変みたいね
0514名無し名人 (ワッチョイ 9faf-ipLS)
垢版 |
2018/08/19(日) 18:37:24.50ID:cCCf+7zb0
今やってる議論とは別だけど、
高ノードだろうが、低ノードだろうが、
そもそもノードを固定して測定するってのが疑問
それが平等な条件なの?
0517名無し名人 (ワッチョイ 1f2e-ipLS)
垢版 |
2018/08/19(日) 19:01:17.92ID:66he4ZSC0
いつものテスト対局です

ノード5〜600万
対局数500 先手勝ち243(54%) 後手勝ち204(45%) 引き分け53
dolphin2+kai4
勝ち247(55%) 先手勝ち135(59%) 後手勝ち112(50%)
dolphin2+kai5
勝ち200(44%) 先手勝ち108(49%) 後手勝ち92(40%)

ノード2000〜2500万
対局数100 先手勝ち48(55%) 後手勝ち38(44%) 引き分け14
dolphin2+kai4
勝ち58(67%) 先手勝ち30(75%) 後手勝ち28(60%)
dolphin2+kai5
勝ち28(32%) 先手勝ち18(39%) 後手勝ち10(25%)

ということで、私の環境ではdolphin2+kai5はあまり良い結果は得られませんでした
0518名無し名人 (ワッチョイ 9fb3-mZ3i)
垢版 |
2018/08/19(日) 19:04:41.32ID:ehl6uW7Y0
>>514
1500万ノードって記載があるのは全て大体1500万ー2000万ノードの範囲に収まるように秒数を固定したものでノード数固定ではない
そのため違うエンジンで対局する場合秒読みなのでノード数が違ってくるのは当然で、このスレでのノード数固定計測の話は100万ノードの人くらい
じゃないだろうか
0519名無し名人 (ワッチョイ 9faf-ipLS)
垢版 |
2018/08/19(日) 19:15:11.60ID:cCCf+7zb0
>>518
あそうなのね、勘違いしてたわ

ところで、kai5やdolphin2illqha2が自身の前バージョンよりも
強くなってるかどうか確認できないんだけど、
スレ全体的な評判としては、どうなってる感じなんでしょうか?
0520名無し名人 (ワッチョイ 0fe9-JZs+)
垢版 |
2018/08/19(日) 19:24:19.17ID:TYs0quck0
dolphin1.1/illqha1.1とdolphin2/illqha2は僅差な気がするわ
0522名無し名人 (ペラペラ SDbf-VMBl)
垢版 |
2018/08/19(日) 20:32:29.39ID:QjCYO93UD
>>517
むしろdolphin2+kai4 が結構強いということ言えない?
dolphin2+illqha1.1もなかなかということだから、
「dolphin2が優秀&1つ前の評価関数と好相性」じゃないだろうか
0523名無し名人 (ワッチョイ 3bd2-dA6k)
垢版 |
2018/08/19(日) 20:37:54.52ID:IZqWkuy/0
2.1?
次は3じゃないの?
0524名無し名人 (ワッチョイ ab61-5lJU)
垢版 |
2018/08/19(日) 20:46:33.59ID:4BRrz90R0
めきっと@鵺日々成長中@_illqha
illqha2、もしかしてほとんど強くなってないですかね?
あまりに微妙そうだった場合、修正版として来週末くらいにillqha2.1を出すかもしれません。(illqha2の詳細な計測等はちょっと様子見していてもらったほうがいいかもしれないです)
illqha2弱いぞという方はどんどん教えてください。


めきっと@鵺日々成長中@_illqha
返信先: @Rota_JPさん
はじめまして。いつも計測してくださってありがとうございます。
QQR+GWに対してさすがに少し勝率が低すぎますね。
過学習している感じではなかったので原因を突き止めるまで時間がかかりそうです。
おそらく修正版のillqha2.1を作成すると思いますが、その際は対QQR+GWの勝率をやや重要視してみます。
0525名無し名人 (ワッチョイ df7e-CEJQ)
垢版 |
2018/08/19(日) 20:53:54.76ID:TUERk72n0
>>522
私の環境ではdolphin2とGW7を直接対決させると
GW7が勝ち越すけどねillqhaでもkaiでも
0535名無し名人 (アウアウエー Sa3f-QxOT)
垢版 |
2018/08/20(月) 00:22:01.07ID:bSf0FQiva
夏休みか何か知らんけど
基本的なアルゴリズム知らない中高生が増えたのかな
古い本で良いから基本的木探索勉強したら?
0536名無し名人 (ワッチョイ ebb3-ipLS)
垢版 |
2018/08/20(月) 00:55:45.44ID:KQeu2v/50
30すぎたオッサンだけど一週間前からAtCoder登録してみて絶望したわw
開発者はこんな奴と戦っていたのか・・・

単なるミニマックスのゲーム木探索だとビギナーコンテストのCの過去問だと今日気づいてさらに絶望した
0537名無し名人 (ワッチョイ 7b9d-ipLS)
垢版 |
2018/08/20(月) 02:34:46.88ID:4tHwRApE0
>>536
ある意味こういう競技性的なものが出来る事によって、上にいる奴はさらなる上を目指すけれども
それより中よりも下にいる奴はもうはなから諦めてそもそもプログラミング自体辞めるという事態とかもありえそう。

格ゲーの世界がまさにそんな感じだからな^^;
0538名無し名人 (ワッチョイ df7e-CEJQ)
垢版 |
2018/08/20(月) 09:50:17.92ID:Fzzs9GGz0
>>532
>>525の場合 ノードはチェックしていないが i7-8700kで1手10秒
0540名無し名人 (アウアウエー Sa3f-S98F)
垢版 |
2018/08/20(月) 10:08:16.91ID:r5Uk4ulRa
未だに自分のPCのスペックが分からない奴もいるし
0542名無し名人 (スププ Sdbf-T1P1)
垢版 |
2018/08/20(月) 11:48:08.40ID:XBEp+Is1d
基本的にここの連中も
DLしてポチポチクリックするだけで出来る検証作業
これでしか盛り上がれないからね
何のスキルも持たない人間だと告白してるも同然よ
0545名無し名人 (ワッチョイ 3b1e-ERMF)
垢版 |
2018/08/20(月) 12:26:52.46ID:Pqk1wlXm0
検証作業とかやったことないけど全く同じの対戦させても結構勝率ばらついたりするんじゃないの
確かにあんまり意味なさそうな気がする
0547名無し名人 (ワッチョイ 0f00-9ica)
垢版 |
2018/08/20(月) 17:00:20.70ID:2AJjBt5B0
そもそも楽しみに意味を求めるべきなのかどうか
0548名無し名人 (ワッチョイ eb9f-YDPB)
垢版 |
2018/08/20(月) 17:02:19.51ID:3zP960q10
趣味なんて総じて無駄なもんよ
周りがごちゃごちゃ言うもんでもないと思う
0549名無し名人 (ワッチョイ 1f2e-ipLS)
垢版 |
2018/08/20(月) 20:28:32.93ID:tXejuUkU0
テスト対局です
1秒でスレッド数を変えてノードを変化させて対局させてみました
書いてるノード数はdolphinのものでGWは2〜3割増しです

1T(4〜50万)
対局数500 先手勝ち253(52%) 後手勝ち230(47%) 引き分け17
GW+QQR
勝ち295(61%) 先手勝ち155(63%) 後手勝ち140(58%)
+illqha1.1
勝ち188(38%) 先手勝ち98(41%) 後手勝ち90(36%)

2T(80〜100万)
対局数500 先手勝ち285(59%) 後手勝ち195(40%) 引き分け20
GW+QQR
勝ち264(55%) 先手勝ち155(64%) 後手勝ち109(45%)
illqha1.1+dolphin
勝ち216(45%) 先手勝ち130(54%) 後手勝ち86(35%)

4T(160〜200万)
対局数500 先手勝ち268(56%) 後手勝ち207(43%) 引き分け25
GW+QQR
勝ち257(54%) 先手勝ち147(60%) 後手勝ち110(47%)
illqha1.1+dolphin
勝ち218(45%) 先手勝ち121(52%) 後手勝ち97(39%)

6T(300〜350万)これはPCが異なります
対局数500 先手勝ち269(56%) 後手勝ち203(43%) 引き分け28
GW+QQR
勝ち225(47%) 先手勝ち130(54%) 後手勝ち95(40%)
illqha1.1+dolphin
勝ち247(52%) 先手勝ち139(59%) 後手勝ち108(45%)
0550名無し名人 (ワッチョイ ab23-rbCU)
垢版 |
2018/08/20(月) 20:29:34.61ID:bpRXYzkA0
>>542
ここをどこだと思ってるんだ
東大と激指とAIとどれが一番強いかわかんなかった頃からすると
自分で納得してソフトを選んでる分ずっとマシになってるわけだが
0551名無し名人 (ササクッテロラ Sp8f-PCkI)
垢版 |
2018/08/20(月) 20:47:43.69ID:VI6IfL1Qp
>>549
こんなところに投下するレベルじゃないようなすごく良いデータだな

NNUEはノード数が極端に少ないと力を発揮できないのかな
dolphinがという可能性もあるけど
0553名無し名人 (ワッチョイ 0f60-ipLS)
垢版 |
2018/08/20(月) 21:06:01.58ID:nnhlh6ih0
スマホのアプリの将棋データベース2で評価値が出るのですが、
何というコンピュータ将棋を使用して
1手何分考えさせているのですか?
0554名無し名人 (ササクッテロラ Sp8f-PCkI)
垢版 |
2018/08/20(月) 21:06:16.29ID:VI6IfL1Qp
>>552
ロタさんの計測だと1500万ノードくらいだと56%くらいになるみたいだし、5000万ノードくらいの結果でも伸びがあればいい感じのグラフが書けそうじゃない?
0556名無し名人 (ワッチョイ ebb3-83+p)
垢版 |
2018/08/20(月) 21:26:32.60ID:J0O+enmA0
elmo絞りのときも魔女が出てきたときもノード数で随分変わったし今に始まったことじゃないんだけどね
まあそれなりに多いノード数で強い方が有用な気はするけど
0558名無し名人 (オッペケ Sr8f-CP3z)
垢版 |
2018/08/21(火) 08:35:03.12ID:xVToD9XVr
どのソフトが強いか500局対戦させてテストするとなると1手1秒はやむを得ないだろうね
でも、昨日のプロの棋譜を解析するのに使うときは1棋譜に5分くらいは平気だから、欲しいのはその場合でも強いソフトなんだよな
ShogiGuiでは探索深度を固定して解析できるようになっているよね
例えば、探索深度を17手で固定して解析してみると、中盤以降は1000万単位のノードで、終盤には1億ノード以上読んだりするわけよ
そういうわけで、必要なソフトは探索深度17で最も信頼できるソフトだったりするんだよな
信頼度が同じなら解析が速いソフトのほうがいいけど、信頼度が違うなら、1棋譜の解析に1分遅くても信頼度が高いソフトを選ぶよ
0559名無し名人 (アウアウエー Sa3f-QxOT)
垢版 |
2018/08/21(火) 09:33:36.84ID:l3s+i7KKa
クレクレを隠さなくなってきたなw
0560名無し名人 (ワッチョイ 9fb3-mZ3i)
垢版 |
2018/08/21(火) 15:12:17.93ID:6w/H6oMz0
>>525
>>531
Ditto2添付のengine_optionsのPARENT_NODE_GAMMA2を150に修正したのを適用して以下floodgate
と同じ一手ごと加算方式で計測した、Ditto2で14秒あたり2330万ノード、自分の環境ではdolphin2の方が強みたい
dolphin2/illqha2 26-12-12 Ditto2/illqha2 対局数50 勝率64%
持ち時間7分 一手ごとの加算14秒 定跡なし 2スレ Hash1024 投了値1000
0564名無し名人 (ワッチョイ ebb3-ipLS)
垢版 |
2018/08/21(火) 19:30:19.48ID:GmQXaXnY0
昨日やった0.1秒1500局と今日やった0.1秒1500局で、勝率結果が2%強違ったが
冷静に計算してみれば別に普通の事だった。
0565名無し名人 (ワッチョイ 9fb3-3boI)
垢版 |
2018/08/21(火) 20:04:54.53ID:CeOhpXje0
やらかしは評価がだいたい1000から2000の間で起きる
以前ほどではないが今でもときおり起きる
1000で切るとそういう情報はほとんど拾えない
0566名無し名人 (ワッチョイ 7baf-ipLS)
垢版 |
2018/08/21(火) 20:35:06.02ID:cF3Y8gfO0
あくまで目的がレーティング調査ということであれば、
そういった逆転劇は統計的に無視しても問題なくて、
その分浮いた時間を、対局数の多さに費やした方が、
統計的にはより信頼性の高い結果が得られるという主張ではないのか?
0567名無し名人 (ワッチョイ ebb3-ipLS)
垢版 |
2018/08/21(火) 20:53:52.24ID:GmQXaXnY0
まーもし序盤中盤強くて終盤だけボコボコのソフトがあったとしたら、
1000で投了させた場合と最後までやった場合で結果は違うだろう。

途中で投了させて結果に影響ないことを確認する術は俺にはないので、俺は最後までやらせてる。
0568名無し名人 (ワッチョイ 0fe9-JZs+)
垢版 |
2018/08/21(火) 20:57:44.31ID:qnBiVlod0
実際トップソフト同士だと1000からの逆転はマジでほぼない
0569名無し名人 (ワッチョイ 2bc3-Qgk0)
垢版 |
2018/08/21(火) 20:57:52.69ID:wTvFtyRm0
おーい。鍵かけてないでコメントしろよな。


333 名無し名人 sage 2018/08/21(火) 20:43:24.47 ID:+NcY+lso
2018.08.21
「コンピュータ発!現代将棋新定跡」についてのお詫び

将棋書籍編集部

2018年6月に発売しました「コンピュータ発!現代将棋新定跡」において、参考文献として挙げた千田翔太六段が作成した定跡(「C-book_2017」など)の手順と同一の部分がありました。
その他にも参考文献からの引用が多く、差別化が行われておらず、誠に申し訳ございませんでした。

同一部分は以下のとおりです。

「コンピュータ発!現代将棋新定跡」
第2章 角換わり▲4八金
第3節 ▲4八金・△6二金(▲2五歩型)
p.100〜p102、p.106〜p108の本手順
0571名無し名人 (ワッチョイ effb-j/Hs)
垢版 |
2018/08/21(火) 21:18:29.13ID:zW6cUgnC0
stockfishからコードを引っ張って来て再調整(末尾のtはテスト用の名前なので中身は同じ)
https://i.imgur.com/GdFaIBD.jpg
外出先のPCでのテスト対局

他の持ち時間では弱体化している可能性もあるので注意
https://1.bitsend.jp/download/c149b30d25d1fc6fe122e277a9ba431a.html

>>498
トーナメントエディションでしかコンパイルが通らない状態になっていました
単純な修正をしたらほんのり勝率が落ちたので(有意差は取れない程度)
こちらのDitto3の方をコンパイルしてみてください
0573名無し名人 (ワッチョイ ef1b-JoLF)
垢版 |
2018/08/21(火) 21:26:03.76ID:SiLbxMrG0
>>569
なにこれ?
スイモンは名前だけじゃなくてチダショーの定跡からパクッて書籍化したって事か?
0574名無し名人 (ワッチョイ cb91-iGBs)
垢版 |
2018/08/21(火) 21:29:32.38ID:myLsEzXu0
>>573
定跡や棋譜に著作権は無いのでおk
てか角換わり最新系なら他にも本出てたと思うし
0576名無し名人 (ワッチョイ ef1b-JoLF)
垢版 |
2018/08/21(火) 21:37:11.29ID:SiLbxMrG0
>>574
著作権云々はあえて議論しないけど編集部が謝罪だしたって事は不味いんじゃないの?
スイモンに興味はないからスレ覗いてまで知りたくもないけどフラゲのPVパクッて悦に入ってる
ソフト指しがスイモンだから4ねとしか思わん
0577名無し名人 (ワッチョイ 9fb3-mZ3i)
垢版 |
2018/08/21(火) 21:40:47.51ID:6w/H6oMz0
suimonの話はsuimonに興味がある人以外はどうでもいい話なので本スレでやってくれ
0578名無し名人 (ワッチョイ cb91-l28Z)
垢版 |
2018/08/21(火) 21:44:53.30ID:myLsEzXu0
>>576
棋書書くのに棋書パクってるのもあるし
その辺の将棋界のスタンスってテキトーなのよね

渡辺明ブログ
https://blog.goo.ne.jp/kishi-akira/e/d666fafdee8261f0d73f0ce7ca68328c
2017-11-18
浅川書房から2005年に出した「四間飛車破り」が数年に1回、増刷になるので送ってもらうんですが、
あれ以来、定跡書は書いてないので執筆当時のことを思い出すと懐かしいです。
今と違って強いソフトが無い時代なので定跡書に書く検討は自力で行わないといけないので
大変で【急戦編】では藤井九段の「四間飛車の急所」がとにかく参考になりました。
あれはすごい本だと思います。
0580名無し名人 (ワッチョイ ab61-5lJU)
垢版 |
2018/08/21(火) 21:49:49.01ID:gDHPjpTQ0
こっちの方がこのスレ的には大ニュース

Ryoto_Sawada@Qhapaq@Qhapaq_49
レーティングサイト。後継者募集中なら引き継ぎますよ(ただし私のdjango歴は一日ですが
0581名無し名人 (ワッチョイ ebb3-83+p)
垢版 |
2018/08/21(火) 21:50:56.39ID:QSnvCUJY0
>>579
手の数が尋常じゃないからそんなことしたら1冊10万とかになりそう
そもそも解説付け終わる前に定跡事情がそこそこ変わりそうかな、NNUE出てきたし
0588名無し名人 (ワッチョイ ef1b-JoLF)
垢版 |
2018/08/22(水) 21:00:36.23ID:6VMhs3/10
訳の分からん調整したエンジンありがたがるアホって何なの?
実践から(検討)かけ離れた短時間に調整したり計測範囲で優位を出したいだけ
少し前のキメラと同じでろくに検証もしない物を適当な使い方でありがたがるアホ多すぎ
0589名無し名人 (ワッチョイ 1f2e-JZs+)
垢版 |
2018/08/22(水) 21:20:01.59ID:94cRLa8+0
>>588
有り難がると言うより、作者が検証しきれない点も検証されるから、興味のある人には公開は良いんじゃないかな
興味ないなら無視すれば良いのだし
できが悪いと思うのなら自ら検証すれば良いだけ
0593名無し名人 (ブーイモ MM8e-/VvO)
垢版 |
2018/08/23(木) 10:21:10.61ID:r/TXJHH3M
今のソフトからコマ割りの値を算出する方法ってある?
NNUEになってからどうなったか見てみたいんだけど
できれば局面Aの評価値と局面Bの評価値の比較みたいな感じで出せるとより嬉しい
0594名無し名人 (ワッチョイ e91e-iYUX)
垢版 |
2018/08/23(木) 10:30:52.66ID:2AKhOec00
評価値を元にコマ割りだけでパラメータ調整するとかかな
コマ割りだけでの評価関数を作るって感じで
こういうのじゃない?
0596名無し名人 (アウアウカー Sad5-QvVY)
垢版 |
2018/08/23(木) 12:24:33.61ID:mDUWn7HIa
そもそも駒割なんてものはない
0597名無し名人 (ワッチョイ 91cc-4tvA)
垢版 |
2018/08/23(木) 15:15:19.58ID:s9syW4Bp0
>>593
https://github.com/yaneurao/YaneuraOu/blob/master/source/evaluate.h

駒割りは89行目からの数値で固定だと思うんだけど
PawnValue = 90,
LanceValue = 315,
KnightValue = 405,
SilverValue = 495,
GoldValue = 540,
BishopValue = 855,
RookValue = 990,
ProPawnValue = 540,
ProLanceValue = 540,
ProKnightValue = 540,
ProSilverValue = 540,
HorseValue = 945,
DragonValue = 1395,
KingValue = 15000,
0601名無し名人 (ワッチョイ 91cc-4tvA)
垢版 |
2018/08/23(木) 17:37:44.60ID:s9syW4Bp0
>>597
変えた数字の分だけ評価値も変わるだろうけど、変えた後に学習やった場合は、変える前の評価値に近付くように収束すると思う。
学習せずに駒割りのみのソフト作るなら、bonanzaみたいに金より成金の数字を大きくした方が良いんだろうね。
bonanzaはやねうら王と違って学習で駒割りも変動するけど、特に「と金」の価値が自動的に大きくなっている。
0603名無し名人 (ワッチョイ a6e9-K3Wk)
垢版 |
2018/08/23(木) 18:29:00.78ID:VTxKqTYv0
それはただただスケールを変えればすぐかと
0604名無し名人 (ワッチョイ 35b3-PcWx)
垢版 |
2018/08/23(木) 19:04:59.86ID:qxLZUtSs0
>>549の勝率がノード数に依存しすぎなのをみて、時々回してたものの途中報告
(この後0.5秒,1秒もやるつもりだったけどこの結果だと途中で投げ出しそう)

エンジン:>>258を落としたまま使った(=およそDolphin2のengine_optionsだが一部間違っているらしい(>>269))
評価関数:NNUEkai5(>>279)

エンジン:GodwhaleChild-5.0.5(選手権あたりからあるもの)
評価関数:QQR

・4T 0.1秒(ノード30-50万程度?)
3071局 1796勝 1275敗
勝率: 0.5848257896450667
標準誤差: 0.008893948764004796
95% 信頼区間 [0.5672419407359166, 0.602084011722566]
相対イロレーティング: 59.51845902452462
標準誤差: 6.363294768915171
95% 信頼区間 [47.00926789156493, 71.94628210105508]

4T 0.2秒(ノード60-100万程度?)
3111局 1784勝 1327敗
勝率: 0.5734490517518482
標準誤差: 0.008869264257160205
95% 信頼区間 [0.5560912889746062, 0.5908068145290903]
相対イロレーティング: 51.409570870267466
標準誤差: 6.298920784965844
95% 信頼区間 [39.14096982006567, 63.80684135857484]

感覚を裏切らず、ノードが2倍になった程度では3000局やっても勝率に差があるとまでは言えず。
しかもQQRとの差が縮まる方向だが、uuunuuunさんの4T5秒相当でR差30ちょいなんだから縮んでいいのか。
0605名無し名人 (アウアウカー Sad5-Tr/F)
垢版 |
2018/08/23(木) 19:56:14.46ID:ITxRXsDZa
>>604
つ深度
0607名無し名人 (ワッチョイ 2ab3-EM0A)
垢版 |
2018/08/23(木) 21:53:07.10ID:DUhxOo7M0
100万ノード以下の計測って統計数は取れるけど実際にそのノード数で使うことは検討などでもあまりないし
ソフトを選ぶ参考にはならないと思うが
0609名無し名人 (ワッチョイ 8a2e-PcWx)
垢版 |
2018/08/23(木) 23:06:31.78ID:DwvjXg+V0
>>554

5000は時間がかかるので3000〜3500万でテスト対局してみました

対局数300 先手勝ち165(58%) 後手勝ち117(41%) 引き分け18
GW+QQR
勝ち121(42%) 先手勝ち75(51%) 後手勝ち46(33%)
dolphin+illqha1.1
勝ち161(57%) 先手勝ち90(66%) 後手勝ち71(48%)

1500万とほぼおなじです
1500万は悪くないノード数の気がします
先の300〜350万と1500万の間を少し埋めてみます
0610名無し名人 (ワッチョイ de1b-axIE)
垢版 |
2018/08/23(木) 23:21:35.19ID:Mn8wLBiZ0
>>609
棋譜は?
0611名無し名人 (ワッチョイ 8a2e-K3Wk)
垢版 |
2018/08/23(木) 23:47:40.44ID:DwvjXg+V0
>>610
需要が有ればupしても良いのですが、需要は無いのでは
今回はタイプの違うエンジンを使って、ノード数での勝率変化をテストしてみる物なので
0612名無し名人 (オッペケ Sr3d-7i4e)
垢版 |
2018/08/23(木) 23:58:16.67ID:MatBM0y4r
1500万ノードは、棋譜の検討で終盤の指し手が悪手なのか最善手なのかを確定させるノード数としては足りない
よって、1500万ノードの勝率テストでは、どのソフトが検討用に一番適したソフトかまでは分からない
0613名無し名人 (ブーイモ MM8e-dbsI)
垢版 |
2018/08/24(金) 00:40:45.49ID:FS742IH8M
1500万ノードというのも中途半端
一般人ならノートPCでの1秒解析での80万ノード辺りが1番使われているだろうし
ガチ勢なら億単位のノードは必須だから橋にも棒にも掛からない
0614名無し名人 (ワッチョイ 8a2e-K3Wk)
垢版 |
2018/08/24(金) 00:46:59.56ID:ge+s/MCN0
>>613
勝率の安定度の問題と思います
ある程度勝率が安定するのが1500万はいると言うことでは

億単位なら異なると言うのなら、億単位で検証してみるべきですね
0615名無し名人 (ブーイモ MM8e-dbsI)
垢版 |
2018/08/24(金) 01:08:02.37ID:FS742IH8M
>>614
1500万ノードで勝率が安定すると言い切れるためには
3000万ノードや1億ノードとの比較データが必要なんだが?
それにその論法で
1500万と1億ノードで勝率が仮に変わらないとして
それ。1500万ノードの根拠にしたのなら

今度は1500万ノードと100万ノードで勝率が変わらなかった場合には
計測は100万ノードから安定するからそれで十分と言ってもいいという話にも繋がる
0617名無し名人 (ワッチョイ 35b3-PcWx)
垢版 |
2018/08/24(金) 02:46:56.26ID:Da10vlJU0
勝率の安定度ってひどいパワーワードなのでは?

短時間であろうとなんであろうと、一回の試行の勝率がpであればそりゃ期待される分布は二項分布だとは思わんかね?
やってる最中に次第にPCが重くなりNPSがでなくなって、
だんだん試行の条件が変わっていくというなら分からなくもないが
0618名無し名人 (ワッチョイ 2ab3-EM0A)
垢版 |
2018/08/24(金) 04:57:27.06ID:t61VVRjH0
前にaperypaqとのキメラを50種類くらい作って100万ノードから200万ノード程度でaperypaqとの計測に数か月もかけた
ことがあるけど、それで勝率55~60%のものが8種類くらいできたが1500万ノードで計測したらaperypaqにほとんど負け
越したので100万ノード程度の計測は無意味なことが分かった
0620名無し名人 (ブーイモ MM8e-dbsI)
垢版 |
2018/08/24(金) 06:15:06.55ID:iyFTGpIFM
>>618
50回も計測していれば
kai5のように逆側を引くこともあるだろう
100万ノードで安定してaperypaqよりも強いキメラが公開されたことはない
0621名無し名人 (オッペケ Sr3d-7i4e)
垢版 |
2018/08/24(金) 07:02:12.87ID:AqYZ11GSr
>>614
終盤に強いタイプのソフトはあるんじゃないかな
だから終盤力だけのテストみたいなこともやれたらいいのにな
終盤のありがちな互角局面を自動で作り出すアプレの開発が先になるけど
0623名無し名人 (オッペケ Sr3d-7i4e)
垢版 |
2018/08/24(金) 10:04:30.13ID:AqYZ11GSr
>>621
過去のソフト同士の終盤から互角局面を500くらい拾ってきて
そこからテスト対局させればノード数の違いでどう勝率が変わるか分かるだろうな
過去の棋譜から互角局面集を作ってくれるアプレがあればいいんだな
0624名無し名人 (ワッチョイ b623-cUst)
垢版 |
2018/08/24(金) 10:38:29.57ID:HuQQeQ0n0
実際にR15の変化があったとしても
1500局指して有意差が出る確率は半々といったところ
学習をさせるなら想定されるレーティングの変化から
必要な対局数の逆算をしておかなきゃ
0626名無し名人 (ワッチョイ 2561-4M2L)
垢版 |
2018/08/24(金) 11:19:13.87ID:gXRDloo70
仮に小さく見積もって1手10通りだとして100手まで完全解析するのに1秒間に1京ノードで計算しても"無量大数"年以上かかる
宇宙ができてからまだ150億年足らず
0628名無し名人 (アウアウカー Sad5-Tr/F)
垢版 |
2018/08/24(金) 12:20:27.31ID:T5cww8YMa
注意:tanuki-2018年版はCPUを酷使するプログラムになっているため、他の4つの思考エンジンを動作させる場合に比べてCPU温度が上がりやすいです。
また、他の4つのエンジンについても、スレッド数を上限に設定した場合、CPU負荷率は100%になります。PCの冷却には十分ご注意ください。
0629名無し名人 (アウーイモ MMa1-K3Wk)
垢版 |
2018/08/24(金) 12:51:53.60ID:N0n2qo+bM
>>626
変な手を省きまくってもっと効率的にできないかな
0630名無し名人 (ワッチョイ de51-PcWx)
垢版 |
2018/08/24(金) 12:53:06.36ID:l8sx4RPW0
変な手を省いたら完全解析じゃないじゃん
0632名無し名人 (ワッチョイ 6a23-vl9i)
垢版 |
2018/08/24(金) 13:19:08.27ID:j2e37V230
まあ、手数よりもまずは「合法局面の完全解析」からではないのか
それをしないと末端終局図もわからないからな
0633名無し名人 (ワッチョイ 6a23-vl9i)
垢版 |
2018/08/24(金) 13:24:18.79ID:j2e37V230
TCEC 13の2部リーグ4回戦総当たり28回戦が終了
3部を無敗優勝したEtherealが2部でも11勝17分と無敗で優勝
2位は10勝2敗16分のChessBrainVB、2ソフトが1部に昇格した

現在1部リーグ開幕までの場繋ぎで、1部参加8ソフトとStockfish 8の
5分+3秒でのお好み対局が開催中
0634名無し名人 (ワッチョイ eab3-vl9i)
垢版 |
2018/08/24(金) 16:24:37.26ID:mslhHZi70
完全解析など必要ない。 むしろプロ厨の罠だろw

必勝手順の発見で事足りる。

・初期配置から合法手の応酬によってできる局面のみを調べればよい
(詰将棋のような仮想局面は必要なし)
・詰み・必至を見逃した後の(膨大な)変化も一切必要ない
・将棋のルールで一手パスはできない
・必勝手順は偶然発見されることもある

詰み・必至の局面から逆算していき、
(一手パスできないので)どう指しても悪くなる局面を見つけて行く、
そのような局面のデータを蓄積していけばいいだけ。

そこから先は、一切読む必要、時間を使う必要はなくなる。

よく指される戦型からの変化を最優先で潰していけば、効率もよく、
プロ将棋に与える影響も極めて大きい。
0635名無し名人 (ワッチョイ 6a23-vl9i)
垢版 |
2018/08/24(金) 16:29:52.82ID:j2e37V230
>>634
だから末端局面を発見するには結局合法局面の総当たりが必要なわけだ
詰み必至だけじゃなく持将棋の局面も必要なんだからな

というわけで、10^68の世界へようこそ
0638名無し名人 (ワッチョイ 2ab3-EM0A)
垢版 |
2018/08/24(金) 18:08:29.59ID:t61VVRjH0
NNUEkaiの作者って弁護士の先生なんだね、Twitterで知ったけど、法律に詳しそうなのでもしかしたらと思っていたけど
0639名無し名人 (スップ Sdea-ruUQ)
垢版 |
2018/08/24(金) 18:14:40.36ID:kluQsEa/d
技巧の開発者だったりして
0640名無し名人 (ワッチョイ ed91-Tr/F)
垢版 |
2018/08/24(金) 18:24:11.61ID:B1INWWp80
>>637
やねうら定跡・・・
0641名無し名人 (ワッチョイ 6660-PcWx)
垢版 |
2018/08/24(金) 18:25:56.44ID:GbpeDNRK0
>>634
終盤の詰みや必至からさかのぼって定跡を形成してゆく。

逆算定跡

という。


1.候補手には最も候補手範囲が広いAI将棋を使う。
2.5000点で切り上げる。
3.候補手によっては一進一退があるがすべて調べる。
4.充分に浅くなったら2000点で切り上げる。
5.定跡形成には激指の空の定跡を使う。
6.中盤になったら500点で切り上げる。
7.中盤の1手が悪手かどうか分かる。

自動化すれば、かなりの精度の定跡が早く形成される。
0643名無し名人 (ワッチョイ 2523-WQAu)
垢版 |
2018/08/24(金) 20:26:41.32ID:WVVhavKV0
>>637
それは結局実際に指された手しかたどらないのだから
単に時間をかけて1局指すのと同じでしょ
ガンジス川の砂ひと粒にもならない
0646名無し名人 (ワッチョイ 2523-WQAu)
垢版 |
2018/08/24(金) 21:00:23.05ID:WVVhavKV0
>>645
ある手が悪手であることをいうには相手の応手の中に1つ好手があればいい
ある手が好手であることをいうには相手の応手のすべてが好手でない手でなくてはならない
>>637のやり方でできるのはせいぜい敗着発見器じゃないの
0648名無し名人 (ワッチョイ 3a7e-bxSC)
垢版 |
2018/08/24(金) 21:07:30.20ID:eStMu2qR0
illqha2.1とkai6は25日-27日位にリリース?
0649名無し名人 (ワッチョイ 2561-4M2L)
垢版 |
2018/08/24(金) 21:46:29.78ID:gXRDloo70
めきっと@鵺日々成長中@_illqha
やや過学習ぎみな仕上がりな気がします。
遊んでみたいという要望があれば番外編として公開しようかと思っています。
きちんとしたものの公開はもう10日程かかりそうです。


NNUEkaiの人は学習をしばらく取りやめて他の環境とで差が出る原因の究明をするみたいなこと言ってたから当分きそうになさそう
0650名無し名人 (ワッチョイ 6660-PcWx)
垢版 |
2018/08/24(金) 21:51:02.26ID:GbpeDNRK0
>>646
自動化すれば、中盤の終わりぐらいまでは解析できます。

誰かソフトで自動化アプリを作って下さい。

コツはえ?こんな手?という候補手も取り込むことです。

終盤でも再逆転がありました。
0651名無し名人 (アウアウエー Sa52-wF79)
垢版 |
2018/08/24(金) 23:36:31.03ID:6iLSwkAza
どこかのクレクレかと思ったらまふさんか
0652名無し名人 (JP 0Hfe-cUst)
垢版 |
2018/08/24(金) 23:59:06.54ID:LPBZC2FKH
また自称「○○に強い評価関数」が量産されたyaselmo時代を繰り返すの?
0653名無し名人 (ワッチョイ eab3-vl9i)
垢版 |
2018/08/25(土) 00:02:44.19ID:/9Acs9b+0
>>635-636
残念ながらチェスはそうではないんだよなw

あれあれ?

・初期配置から可能な局面
・詰み&必至の見逃し後の変化は不要

は都合が悪すぎてスルーですか?w
0659名無し名人 (スプッッ Sdea-CgQi)
垢版 |
2018/08/25(土) 07:10:49.62ID:65xPzTgCd
>>653
そのような制約によって所要局面数を「大幅に」減らしたとして、屁のツッパリにもならんのが最大の問題
(100分の1とか1000分の1に出来たとして10^60を越えていたのでは人間の手に負えるオーダーではない)
0660名無し名人 (ワッチョイ cae7-PcWx)
垢版 |
2018/08/25(土) 07:18:03.99ID:2OwMga8u0
# 勝ち数 対局数 %
01 50.5 90 56% dolphin2 illqha1.1
01 50.5 90 56% nnue-w7-ditto3 illqha2
03 50 90 55% dolphin illqha1.1
04 49 90 54% dolphin2 illqha2
05 48.5 90 53% dolphin Kai5
06 44.5 90 49% dolphin illqha2
07 42.5 90 47% nnue-w7-ditto3 Kai5
08 42 90 46% dolphin2 Kai5
09 39 90 43% nnue-w7-ditto3 Kai5
10 33.5 90 37% GodwhaleChild-5.0.5 KPPT 4.80 64SSE4.2/QQR
0661名無し名人 (ワッチョイ cae7-PcWx)
垢版 |
2018/08/25(土) 07:18:59.97ID:2OwMga8u0
■感想
これを実施する前に予想していた順位とはだいぶ違ってた。
予想通りなのはベンチマークとして使ったGW5.0.5 /QQRの成績のみです。
なんとillqha1.1の方がillqha2より若干成績がよかった。
nnue-w7-ditto3はillqha2以外とは相性が良くないみたいだ。

■その他

将棋所の最新バージョンをダウンロードしてリーグ戦で2秒設定で実施したが
将棋所はUSI_Ponder(相手番でも考慮)がデフォルトでTRUEとなっているのを知らなかった。
これだったら1秒設定で実施すれば半分で済んだのにと思った。

開始:8/22 20:52
終了:8/24 23:50
0663名無し名人 (ワッチョイ cae7-PcWx)
垢版 |
2018/08/25(土) 07:25:10.84ID:2OwMga8u0
■リーグ戦で戦わせてみた!

■URL
https://28.gigafile.nu/0901-bc7a84ab35ae64d8d25a2ef5304d9110d

# 勝ち数 対局数 %
01 50.5 90 56% dolphin2 illqha1.1
01 50.5 90 56% nnue-w7-ditto3 illqha2
03 50^^ 90 55% dolphin illqha1.1
04 49^^ 90 54% dolphin2 illqha2
05 48.5 90 53% dolphin Kai5
06 44.5 90 49% dolphin illqha2
07 42.5 90 47% nnue-w7-ditto3 Kai5
08 42^^ 90 46% dolphin2 Kai5
09 39^^ 90 43% nnue-w7-ditto3 Kai5
10 33.5 90 37% GodwhaleChild-5.0.5 KPPT 4.80 64SSE4.2/QQR

■感想
これを実施する前に予想していた順位とはだいぶ違ってた。
予想通りなのはベンチマークとして使ったGW5.0.5 /QQRの成績のみです。
なんとillqha1.1の方がillqha2より若干成績がよかった。
nnue-w7-ditto3はillqha2以外とは相性が良くないみたいだ。

■その他

将棋所の最新バージョンをダウンロードしてリーグ戦で2秒設定で実施したが
将棋所はUSI_Ponder(相手番でも考慮)がデフォルトでTRUEとなっているのを知らなかった。
これだったら1秒設定で実施すれば半分で済んだのにと思った。

開始:8/22 20:52
終了:8/24 23:50
0664名無し名人 (ワッチョイ cae7-PcWx)
垢版 |
2018/08/25(土) 07:40:02.92ID:2OwMga8u0
7位の評価関数が間違ってました。
nnue-w7-ditto3 Kai5 ⇒ nnue-w7-ditto3 illqha1.1
# 勝ち数 対局数 %
01 50.5 90 56% dolphin2 illqha1.1
01 50.5 90 56% nnue-w7-ditto3 illqha2
03 50^^ 90 55% dolphin illqha1.1
04 49^^ 90 54% dolphin2 illqha2
05 48.5 90 53% dolphin Kai5
06 44.5 90 49% dolphin illqha2
07 42.5 90 47% nnue-w7-ditto3 illqha1.1
08 42^^ 90 46% dolphin2 Kai5
09 39^^ 90 43% nnue-w7-ditto3 Kai5
10 33.5 90 37% GodwhaleChild-5.0.5 KPPT 4.80 64SSE4.2/QQR
0669名無し名人 (ワッチョイ fdb3-s22w)
垢版 |
2018/08/25(土) 09:09:18.33ID:8qru8jay0
やねがクラウドファウンディングでオセロの完全解析やりたいって言ってるしその成果次第でいいんじゃない
0670名無し名人 (ワッチョイ fdb3-s22w)
垢版 |
2018/08/25(土) 09:19:44.50ID:8qru8jay0
ツイート読み返したがやりたいとは言ってなかったw
オセロ完全解析にかかる費用が分かれば
オセロと将棋のゲーム木のサイズの違いから、
将棋の完全解析にかかる費用も概算できそう
0671名無し名人 (ワッチョイ ed91-EckU)
垢版 |
2018/08/25(土) 09:23:30.47ID:xLWWRAu00
>>663

>将棋所はUSI_Ponder(相手番でも考慮)がデフォルトでTRUEとなっているのを知らなかった。
>これだったら1秒設定で実施すれば半分で済んだのにと思った。

うーんw
0673名無し名人 (スプッッ Sdea-CgQi)
垢版 |
2018/08/25(土) 09:34:21.91ID:65xPzTgCd
>>670
オセロくらいだと、有力定石を絞り込んだ上で、比較的手の狭そうな枝をセレクトしてから、その変化だけを完全解析というのなら割りとできそう
0675名無し名人 (ワッチョイ 3a7e-bxSC)
垢版 |
2018/08/25(土) 09:54:11.21ID:yuJj+2a20
>>664
なぜGodwhaleChild-5.0.5がSSE4.2なのか AVX2版より
強かったのならそのデータを併記してほしい
0676名無し名人 (スフッ Sd0a-r2Sg)
垢版 |
2018/08/25(土) 10:27:19.92ID:7Pf4R5S9d
ソフトで将棋の勉強ってどうすればいいの?
ソフト動かしててこれは自分では絶対に意図して動かせないって指し方見てもあんまり意味無くないか?
0677名無し名人 (ササクッテロル Sp3d-l5z4)
垢版 |
2018/08/25(土) 10:31:42.83ID:JkVF/xJWp
>>676
悪手を教えてくれるのがでかい
悪手を指したらどんな手順で悪くなるのか細かく教えてくれる

普通は対局後に棋譜解析してどう指すべきだったか検討していく感じじゃない?
0679名無し名人 (ワッチョイ eab3-vl9i)
垢版 |
2018/08/25(土) 10:56:11.15ID:/9Acs9b+0
>>673
今さらオセロてw お前は何年前で時間が止まってるんだよwwwww

オセロなんてとっくに実質的には解析できてるようなものだよ。

Wikiでも、すでに7年前に外部リンク先の最終更新が止まったり、ページ自体消えたりしていて
↓この状態なんだから、もうオセロは問題にならないステージに達している。

> 8×8盤
>
> 8×8盤オセロのゲーム木のサイズは10^54ノードと推定されており、
> 合法的なポジションの数は10^28と推定されている。数学的には未解決であるが、
> 速い並列ハードウェア上あるいは分散コンピューティングを通じたプログラムによる
> 徹底的な計算を行うことで解を見つけることは可能かもしれない。
>
> 一部の強豪プログラムは長年自身のデータベースを拡張してきた。
> 対角、垂直、平行の23つの主要なオープニングに関しては、対角オープニングと
> 垂直オープニングは引き分けの筋へ至る傾向にあり、一方で平行オープニングは
> 黒(先手)の勝ちとなる。引き分け木は、垂直オープニングの後よりも
> 対角オープニングの後の方が大きいようである[13]。平行オープニングは
> 黒(先手)に非常に有利であり、完璧に打った場合は常に勝つことができる[14]。
> 証明されてはいないが、実質的には双方のプレーヤーが完璧に打った場合は
> 試合は常に引き分けとなる。標準的ゲームでは、オープニングブックを使用することで、
> トッププログラムの勝率は99%を超える。
0680名無し名人 (ワッチョイ eab3-vl9i)
垢版 |
2018/08/25(土) 10:57:07.40ID:/9Acs9b+0
 
549 名前:名無し名人 (ワッチョイ 7fb3-sJj3)[sage] 投稿日:2017/11/13(月) 12:45:27.37 ID:QBnyEln60
今回の電王トーナメントでの収穫は、引退する山本一成から↓の発言が出た事だな。
以前から言われていた事ではあるが、将棋も暗記ゲーの時代に本格的に突入か。

30 名前:名無し名人[sage] 投稿日:2017/11/12(日) 16:30:03.16 ID:ILaYswGe [1/5]
定跡が進みすぎると、オセロのようになるのか
オセロは定跡だけになってるらしい

山本の話は興味深いな

256 名前:名無し名人[sage] 投稿日:2017/11/12(日) 17:10:11.32 ID:qYiaoJcH [4/5]

山本「定跡は弱者の戦略」

今日
山本「定跡で勝負が決まるとか将棋の終わりが近づいている」

551 名前:名無し名人 (ワッチョイ 7f1e-fv10)[sage] 投稿日:2017/11/13(月) 12:52:52.36 ID:dd1rb9En0
>>549
人間の間では暗記だけでは絶対に勝てないから影響はない
コンピュータは普通の初形からの対戦がなくなるってだけ

553 名前:名無し名人 (ワッチョイ 7fb3-sJj3)[sage] 投稿日:2017/11/13(月) 12:55:18.07 ID:QBnyEln60
>>551
ただの暗記だけではなく、
プラスでプロ棋士やアマ高段くらいの棋力があれば、影響は大アリでしょう。
0681名無し名人 (ワッチョイ eab3-vl9i)
垢版 |
2018/08/25(土) 10:58:35.65ID:/9Acs9b+0
 
554 名前:名無し名人 (ワッチョイ 7f1e-fv10)[sage] 投稿日:2017/11/13(月) 13:01:00.56 ID:dd1rb9En0
毎回相手に二つの選択肢があったとすると60手まで暗記しようとすると
10億の変化を記憶しておく必要があるんだけど

556 名前:名無し名人 (ワッチョイ 7f9d-VvNY)[] 投稿日:2017/11/13(月) 13:15:27.55 ID:vtxX7Gkw0
>>554
実際は優勢になる変化は覚えるのは途中までで良かったり、
手順前後の同一局面や
部分定跡とかも使えるから対人でも有効
0683名無し名人 (ワッチョイ cae7-PcWx)
垢版 |
2018/08/25(土) 11:09:04.15ID:2OwMga8u0
>>675
GW5.0.5の導入方法のページで「godwhale_child-evalmerge.exe」を選択しろと
なっていたからだけです。godwhale_child-tournament.exeに変えて、
すべてPonder Offの設定しなおして1秒設定でやり直してみます。
0684名無し名人 (ワッチョイ 2ab3-EM0A)
垢版 |
2018/08/25(土) 11:35:14.27ID:KBLdiP5q0
>>683
どうせやるならuuunuuunさん基準1500万〜2000万ノードでやったらいいのに、
数百万ノード以下の計測は1500万ノードとは逆の結果が多いので参考にならない
0685名無し名人 (ワッチョイ 35b3-c336)
垢版 |
2018/08/25(土) 11:40:06.91ID:LdrXfW8A0
せっかく1500万ノードでの膨大な対局データがあるんだからそれと比較もできるように同じ条件でやるのがいいよね

検討用途のことを考えて長時間でやるのももちろんいい、対局数が確保出来るくらいの余裕があればだけど
0686名無し名人 (ワッチョイ 2ab3-EM0A)
垢版 |
2018/08/25(土) 11:52:55.32ID:KBLdiP5q0
NNUEkaiの作者さんが1500万ノードと1億ノードの勝率の違いを検証していたので興味深い記事だと思う
詳細はTwitter見た方がいいかも

1手1億ノード500局が終了しました。
QQR/YO4.82 vs AperySDT5/YO4.82(1手1億ノード、投了値3000、引分け256手)
293-19-188(勝率60.5%、R差74.1)

uuunuuunさん(@uuunuuun1 )のレーティングサイト(1手約1500万ノード)によれば、
QQR/YO4.82=4234
AperySDT5/YO4.80=4162
AperySDT5/YO4.82=4137(ただし、対局数が322局と少なめ)
というレーティングになっており、上記1億ノード対局の結果と大差がないのではないでしょうか。

今回の結果から、現時点において、私は、ソフト間の強さを計測する際には、1手1500万ノードの計測で十分であると
考えています。また、1手何ノードが必要だと考えられるのかについては、いずれ計測しようと思います。
0688名無し名人 (ワッチョイ f9af-PcWx)
垢版 |
2018/08/25(土) 12:06:30.42ID:32yHtReP0
意味ない流れで低ノードで32時間くらい回してみたわ
こんな感じになった

R4260 dolphin2/NNUEkai5
R4230 dolphin2/illqha1.1
R4210 GW7/NNUEkai5
R4210 dolphin1/illqha1.1
(やねうら4.74/elmo27R3800、技巧2R3710の独自基準)
0689名無し名人 (ブーイモ MM8e-dbsI)
垢版 |
2018/08/25(土) 12:10:10.08ID:uYbaDcFoM
>>686
更に調査が進んで100万ノードでも十分という結果が出たらかなり楽になるね
0691名無し名人 (ワッチョイ 2ab3-EM0A)
垢版 |
2018/08/25(土) 12:24:52.03ID:KBLdiP5q0
>>689
100万~200万ノードと1500万ノードでは逆の結果になることが多いので、仮にソフトAが100万~200万ノードと1500万ノード
でほぼ同じ結果になったとしても、ソフトBでは逆の結果になることもあるので、100万~200万ノードの計測でOKということには
ならないよね
0693名無し名人 (ワッチョイ 9e9f-QvVY)
垢版 |
2018/08/25(土) 12:36:45.42ID:jP3L2vY60
100万だの1500万だの、勝手に決めた数字が一人歩きしすぎ
各ノード域で差が出たとして
・二項分布の揺らぎにすぎない
・そもそもエンジンの時間制御が不正確
・単なるノード間の相性問題
以上の点についてはどう解釈するつもりなんだ?
0695名無し名人 (ワッチョイ 2ab3-EM0A)
垢版 |
2018/08/25(土) 12:44:53.10ID:KBLdiP5q0
>>693
その考えだとソフトを選択する計測をどうすればいいのか基準が一切ないので次から次へと公開されるソフトを決められなくなるが
あなたがソフトを選ぶ計測方法を教えてくれないとただの批判者になるが
0696名無し名人 (ワッチョイ 9eac-PcWx)
垢版 |
2018/08/25(土) 12:45:34.50ID:BqfxbQ170
ノード数いくらで検証すべきか問題は個人に任せればいいと思っているが、
ノード数による各ソフトのR差の変化の件と、二項分布云々による対局数不足の件は一緒にして欲しくない
0699名無し名人 (ワッチョイ 2ab3-EM0A)
垢版 |
2018/08/25(土) 12:50:29.11ID:KBLdiP5q0
>>693
その考え方では細かく1000万1100万1200万・・・・1億1千万1億2千万・・・・10億1千万10億2千万って
細かく1000万単位くらいで各500局計測しろって受け取ればいいのかな?どう考えても無理じゃないの?
0700名無し名人 (ワッチョイ cae7-PcWx)
垢版 |
2018/08/25(土) 12:50:37.94ID:2OwMga8u0
>>684
ノートPCの人にそんなこと言いますか?
1手30秒かかるわけで・・・
1手1秒で対戦すると150手平均で2分半。
450局やるのに900+225=1125分=約20時間かかります。
これが30倍になると600時間ですよw
25日ぐらいかかってしまいます。
専用のデスクトップパソコンを持ってる方にお任せします。
0701名無し名人 (ワッチョイ 9eac-PcWx)
垢版 |
2018/08/25(土) 13:00:33.82ID:BqfxbQ170
なんでノートPCなのに計測しようと思ったんだ
買えばええやん
俺は去年キメラだらけになった時期にi7 7700KのPC買ったし>>604はそのPCで片手間に計測した
0702名無し名人 (ワッチョイ 35b3-c336)
垢版 |
2018/08/25(土) 13:00:54.62ID:LdrXfW8A0
>>700
結局そのスペックだと検証作業をするのは厳しいということだと思うよ
スキルがあるならより強くできる手法を探したり
スキルがなくても検討を重ねて新手を探したりした方が有意義なのでは
0703名無し名人 (ワッチョイ 9e9f-QvVY)
垢版 |
2018/08/25(土) 13:01:57.49ID:jP3L2vY60
>>695
そもそもノードにこだわってるのは100万だの1500万だの言ってる連中であって、
じゃあこだわるならノード間問題は、こういう点についてちゃんと解釈できなきゃ意味ないよと言ってる
個人的にはノードがいくらだろうとどうでもいい
0704名無し名人 (ワッチョイ cae7-PcWx)
垢版 |
2018/08/25(土) 13:07:06.16ID:2OwMga8u0
ソフトの強さをどのノード数で測るかとうことは計算機資源の問題があるので
なるべく少ないノードで決めてしまっても問題ないと私は思います。

もし1500万ノードで結果が違ってたら、1500万ノードでの強さということで
終わりだと思いますけど?

現実のソフトの選手権だとF1並にレギュレーションが出来てきたり
して単なるソフトの強さだけでなくトーナメントを勝つための戦略とか
が出てきたりするわけだからです。

ソフトに求めるものが何かによると思うのですが、私は以下の2つを必要としています。

1.プロの対局においてリアルタイムでどちらが有利か不利か互角なのか知りたい。
2.プロの棋譜をソフトで解析してどの手が悪手だったのか知りたい。

そして多くのコンピュータ同士の対戦を眺めていると自ずと差し手の特徴が
見えてきました。

基本的に数の攻めで相手の守りを攻略しようとします。
守る方も弱いところは数の攻めにまけないように守ります。

私自身はそこまで将棋が強くありません。30年前に道場で
初段でさしていたぐらいで藤井君のお陰で再び将棋に興味を持ちこのスレに
まで出没するようになったクチです。
0705名無し名人 (ワッチョイ 2ab3-EM0A)
垢版 |
2018/08/25(土) 13:08:48.41ID:KBLdiP5q0
>>703
その考えは結局秒読み計測はあてにならないのでソフトを選択する基準は存在しないから計測しても無駄で
適当に大体の計測をして適当にソフトを選択したらよいわけね、あなたの考えは分かったよ
0706名無し名人 (ブーイモ MM8e-dbsI)
垢版 |
2018/08/25(土) 13:26:09.98ID:uYbaDcFoM
1日制と2日制みたいなものだろう
1500万ノードと100万ノード、両方で強くないと真のチャンピオンとは言えない
0707名無し名人 (ワッチョイ f59f-tpXt)
垢版 |
2018/08/25(土) 13:27:51.95ID:FyrHgaJr0
ノートPCしかないならAWS使うといいよ
高NPSで熱や電気代も気にしなくていいし
0708名無し名人 (ワッチョイ fdb3-s22w)
垢版 |
2018/08/25(土) 13:28:40.01ID:8qru8jay0
短時間少ノードで検証するのはいいけど、
その場合NetworkDelay1、2とMinimumThinkingTimeの設定も明らかにしてくれや
前者はネットワーク遅延対策として、
残り秒数が指定のミリ秒を切ったら直ちに指すという設定
後者は一手の思考に少なくとも指定したミリ秒を費やすという設定
この設定がデフォルトのまま、
持ち時間1〜2秒で指させたらどうなるか分かるよな
0711名無し名人 (ワッチョイ 9e9f-QvVY)
垢版 |
2018/08/25(土) 13:54:50.45ID:jP3L2vY60
>>705
なんもわかってねぇな
0713名無し名人 (ワッチョイ 918a-axIE)
垢版 |
2018/08/25(土) 13:58:10.81ID:QE4vT0aR0
>>653
総当たり=初期配置から可能な局面のみを対象。

詰み&必至を発見するためには、見逃し後の変化も含めて探索が必要。
もちろん、詰み必至探索でもαβ的な後方枝刈ありで、探索範囲を狭めるのは常識。

君は自分でプログラム組んでみれば良い。
0714名無し名人 (ワッチョイ eab3-vl9i)
垢版 |
2018/08/25(土) 14:01:50.86ID:/9Acs9b+0
>>713
> 総当たり=初期配置から可能な局面のみを対象

チェスの終盤データベース(「残り駒数○個以下は完全解析済み)は
そういう作り方してねーからw

> 詰み&必至を発見するためには、見逃し後の変化も含めて探索が必要。

あれあれ? これ総当たりじゃないよね?w
0715名無し名人 (ワッチョイ 918a-axIE)
垢版 |
2018/08/25(土) 14:12:06.37ID:QE4vT0aR0
>>679
オセロの場合10年くらい前の状態で、残り40手(最初から20手は定石使用)に
ついて、いくつかの定石は完全読み切りができている。これをパブリックドローと
呼んで、最初の20手についてお互いに合意の上で特定の定石を採用すると、
40手目以後引分が確定するというだけの事。

>>673が言っているレベルの事は既にやっている人がいる。

そして、その前の20手にどういう変化があるのかはわかっていない。

F5F4(平行オープニング)が、黒有利なのは、コンピュータで解析するはるか以前
から知られていた事だし、8×8オセロがおそらく引分ゲームである事も、昔から
言われていて、あなたが上げた例は、これだけコンピュータで解析しても、昔から
言われている事を同じ程度のレベルで認識しただけで、いまだ答えは出ていない
という事に他ならないのよね。

ちなみに、4×4は1秒かからずに完全解析完了する。
6×6は、まだ解析完了したというニュースを聞いていない。
0717名無し名人 (アウアウカー Sad5-Tr/F)
垢版 |
2018/08/25(土) 14:13:39.00ID:Of4lEGpsa
>>714
チェスのエンドゲームのデータベースも合法局面のみでしょ?
0718名無し名人 (ワッチョイ 918a-axIE)
垢版 |
2018/08/25(土) 14:16:08.73ID:QE4vT0aR0
>>714
チェスの終盤データベースは、駒の数絞っているから。
コンピュータで把握可能な有限の数に収まる範囲のDBしかない。

チェスは、駒を打つ事が無いから、残り駒数が減ったら終盤近いとか、
そこまで行ったらチェックメイトが存在しないとかできる。

将棋は、持ち駒を打つ事ができるので、残り駒数は永遠に減らない。


>あれあれ? これ総当たりじゃないよね?w

意味がわからん。
恐らくだけど、君と僕とは、使っているテクニカルタームの種類が違うようだ。
だから、会話が成立しないんだな。
0719名無し名人 (ワッチョイ f9af-PcWx)
垢版 |
2018/08/25(土) 14:18:42.64ID:32yHtReP0
>>710
それがあるのは間違いない
どっちが偉いのかという議論

自分的には、自分の環境、検討に使う時間での強さ、信頼性が分かればいいって話だな
そういう意味では1500万ノードもあれば充分すぎる
もっと言えば過剰ですらある
0720名無し名人 (ワッチョイ de1b-axIE)
垢版 |
2018/08/25(土) 14:41:19.53ID:IX2ozPkk0
1500万ノードが絶対に正しいなんてuuunuuun氏も開発者も言ってないだろ
統計を取るのに現実的に出来る範囲のノード数で対局数を稼ぐために設定しているだけであって
将来いまのi9程度が家庭用になればそりゃノード数も見直されるわ
棋譜がないものは信用(証拠)しないし個人でやりはじめたのに誰からも信頼されるuuunuuun氏のやり方と
何もせずにグダグダ文句つける馬鹿と比較するまでもない
100万でも悪いわけじゃないし棋譜添付して統計つみかさねれば逆の統計になるかもしれない
100万と1500万もかわらないと文句つけてる馬鹿は自分の好きな方法で統計でしてみろ
0725名無し名人 (ワッチョイ cae7-PcWx)
垢版 |
2018/08/25(土) 16:59:03.61ID:2OwMga8u0
>>683
> >>675
> GW5.0.5の導入方法のページで「godwhale_child-evalmerge.exe」を選択しろと
> なっていたからだけです。godwhale_child-tournament.exeに変えて、
> すべてPonder Offの設定しなおして1秒設定でやり直してみます。

ちょっとだけ試したらGW5.0.5はAVX2でやると弱くなるみたいだ・・・
https://i.imgur.com/vzoRp5V.png
0726名無し名人 (ワッチョイ 2ab3-EM0A)
垢版 |
2018/08/25(土) 17:08:49.26ID:KBLdiP5q0
>>711
分からないこと言っているのはそっちじゃん
長時間検討でも使える優秀なソフトの選択に具体的な計測方法も明記出来ないでよく言えるわ
0729名無し名人 (ワッチョイ 35b3-c336)
垢版 |
2018/08/25(土) 17:40:53.05ID:LdrXfW8A0
>>725
RyzenならSSE4.2の方が強くても特に不思議はないけど多分違うだろうからサーマルスロットリングでクロックダウンかな
そもそもの対局数少ないからよくわからんけど
0730名無し名人 (ワッチョイ 9e9f-QvVY)
垢版 |
2018/08/25(土) 18:16:46.65ID:jP3L2vY60
>>726
長時間検討!1500万!ってこだわってるのが自己矛盾してるんだよ、あんた
◯◯ノードでは意味ないと言いながら、
△△ノードや複数ノード域の計測は現実的じゃないから1500万ノードで十分って
そんな論理が通用するとでも思ってんの?
0731名無し名人 (ワッチョイ 2ab3-EM0A)
垢版 |
2018/08/25(土) 18:51:15.38ID:KBLdiP5q0
>>730
誰も1500万ノードだけで十分っていっていないよ、これが現実的に統計数を取るには適している
100万単位づつノード数を変えて細かい間隔で計測し、なおかつ十分な統計数を取ることは現実的に
時間がかかり過ぎて誰も出来ないだろ、君の言い分は誰も実行不可能なことだらけだわ
0732名無し名人 (ササクッテロル Sp3d-l5z4)
垢版 |
2018/08/25(土) 19:01:22.25ID:/UzPByrLp
1500万が長時間みたいな言い方を見かけるけど1500万は短時間だよね?
もちろんスペック次第だけど一般的なイメージとして
じゃないと5000万くらいでも超超長時間みたいになるような
0733名無し名人 (ワッチョイ 2ab3-EM0A)
垢版 |
2018/08/25(土) 19:13:33.69ID:KBLdiP5q0
1500万ノードの結果はNNUEkaiの作者やロタ氏の計測で長時間の計測と大差ないことが分かっている
ロタ氏の計測や自分の数か月に及ぶ計測からも100万〜200万ノードは1500万ノードとは逆の結果になる
ことが多いことが分かっている
0734名無し名人 (ワッチョイ 9e9f-QvVY)
垢版 |
2018/08/25(土) 19:14:48.29ID:jP3L2vY60
>>731
1500万以下で一発測定でも何も問題ないわけだけど?
1500万にこだわってるのはあんたでしょ?
100万単位で区切って全部取れとなんて主張に仕立ててるのもあんたでしょ?
1500万以下ではおかしいというなら、それを証明しなさいよというだけ
0735名無し名人 (ワッチョイ 2ab3-EM0A)
垢版 |
2018/08/25(土) 19:20:42.85ID:KBLdiP5q0
>>734
だから100万〜200万ノードは1500万ノードとは逆の結果になることが多いから無駄だってさっきから言ってるだろ
0736名無し名人 (ワッチョイ 9e9f-QvVY)
垢版 |
2018/08/25(土) 19:25:32.40ID:jP3L2vY60
>>735
それを統計的かつ一般的な結論としてもっていけてないからいってるんだろ
0737名無し名人 (ワッチョイ 2ab3-EM0A)
垢版 |
2018/08/25(土) 19:25:54.20ID:KBLdiP5q0
1500万ノードではA>B  Aの勝率55%でも
100万〜200万ノードでA<B  Aの勝率45%
のように逆の結果になることもあるし、同じ結果の場合ももちろんある
だから100万〜200万ノードはどっちに転ぶか分からないから計測には適さない
0738名無し名人 (ワッチョイ 9e9f-QvVY)
垢版 |
2018/08/25(土) 19:28:56.89ID:jP3L2vY60
◯◯ノードではA>B  Aの勝率55%でも
1500万ノードでA<B  Aの勝率45%
のように逆の結果になることもあるし、同じ結果の場合ももちろんある
だから1500万ノードはどっちに転ぶか分からないから計測には適さない

なんとでも言える
0739名無し名人 (オッペケ Sr3d-841Z)
垢版 |
2018/08/25(土) 19:33:05.18ID:eivvV6Hrr
なんかつまらんスレになったな
0740名無し名人 (エムゾネ FF0a-CgQi)
垢版 |
2018/08/25(土) 19:33:39.78ID:Cj8VZty6F
そういうのを定量的に言うためには、
100/200/400/800/1600とプロットしていって、収束していくかどうかの傾向をみるしかない。
(100刻みは無駄なので、倍々で可能な範囲が妥当だろう)
0743名無し名人 (ワッチョイ ed91-EckU)
垢版 |
2018/08/25(土) 21:02:37.29ID:xLWWRAu00
>>742
書かれてる手順、棋譜や定石ファイル化したり
本の言うとこが正しいか確認したり
本で以下先手優勢で書かれてないその後の手順確認したり
0744名無し名人 (スップ Sdea-ruUQ)
垢版 |
2018/08/25(土) 21:13:29.67ID:6fyXriobd
>>735

>100万〜200万ノードは1500万ノードとは逆の結果になることが多いから無駄だってさっきから言ってるだろ

逆になること多いって自分で調べたの?
0745名無し名人 (スップ Sdea-ruUQ)
垢版 |
2018/08/25(土) 21:15:46.94ID:6fyXriobd
>>735
具体的には?
棋譜は?
0747名無し名人 (ワッチョイ 2561-7yA2)
垢版 |
2018/08/25(土) 22:07:44.28ID:WoSxBzjB0
1500万ノードより増やしたときAがBより強くなるとわかったところで
Cが1500万ノードより増やしたときに強くなるかどうかなんてわからないのだから
1500万ノードだから十分とか結論出るわけ無いだろ
0748名無し名人 (ワッチョイ 8a2e-K3Wk)
垢版 |
2018/08/25(土) 22:12:54.15ID:/RpvVTHp0
現時点では、1500万ノードあればそれ以上ノードが増えてもそう大きく対局結果は変わらないだろうと言う事じゃ無いかな
実験や経験則から来るものでしょうが、それに対して対局結果で否定する意見が無いような

其れなりのPCやAWSを借りられる予算のある人が集まれば詳しい検証は可能かもしれませんが、そこまでやる意味を感じない人がほとんどだと思います
0749名無し名人 (ワッチョイ 2ab3-EM0A)
垢版 |
2018/08/25(土) 22:29:56.98ID:KBLdiP5q0
>>745
一つだけピックアップしたけどノード数で逆の結果になったもの
去年公開されたaとbを18gouのコマンドでキメラにしたものを去年計測したもの

キメラab 266-19-215 aperypaq 一手100万ノード 定跡なし 対局数500局 勝率55%

キメラab 219-26-255 aperypaq 一手1500万ノード 定跡なし 対局数500局 勝率46%
0750名無し名人 (ワッチョイ 2ab3-EM0A)
垢版 |
2018/08/25(土) 22:31:45.72ID:KBLdiP5q0
>>749
棋譜は人に見せる目的で計測したわけではないので保存はしていない
0751名無し名人 (スフッ Sd0a-r2Sg)
垢版 |
2018/08/25(土) 22:38:16.00ID:FXTWjWXQd
>>743
本で以下先手優勢で書かれてないその後の手順確認したり

これは本当にあるあるだな
こっちが優勢と言われてもそこまで優勢に見えないという
0752名無し名人 (ワッチョイ 2ab3-EM0A)
垢版 |
2018/08/26(日) 00:24:08.18ID:VfSqXtsf0
>>749
勘違いしてた、大分前なので計測は去年の12月ごろかと思っていたら今年の2月ごろの事だった
0753名無し名人 (スップ Sdea-ruUQ)
垢版 |
2018/08/26(日) 03:58:36.00ID:VVwm5rvTd
>>749
対局設定や探索エンジン何使ってるか書かないと
0754名無し名人 (スップ Sdea-ruUQ)
垢版 |
2018/08/26(日) 04:00:40.36ID:VVwm5rvTd
>>749
あと、他にも逆の結果になったのは?
まさかそれだけじゃないよね?
0755名無し名人 (ワッチョイ cae7-PcWx)
垢版 |
2018/08/26(日) 08:45:20.79ID:GAixnyYH0
>>725
> >>683
> > >>675
> > GW5.0.5の導入方法のページで「godwhale_child-evalmerge.exe」を選択しろと
> > なっていたからだけです。godwhale_child-tournament.exeに変えて、
> > すべてPonder Offの設定しなおして1秒設定でやり直してみます。
>
> ちょっとだけ試したらGW5.0.5はAVX2でやると弱くなるみたいだ・・・
> https://i.imgur.com/vzoRp5V.png

2回戦だと少なすぎるかもということで4回戦版の実施しました。GWCはSSE4.2
に戻して実施しました。
https://imgur.com/gallery/tXBqk5E

今現在はGW505のSSE4.2版とAVX2版をリーグ戦に参加させて計測しています。
まだ始まったばかりですのでこれから出かけるのである程度結果が出たらまた
ポストします。
https://i.imgur.com/WRyszpF.png
0757名無し名人 (ワッチョイ ddb3-Ckc0)
垢版 |
2018/08/26(日) 11:17:22.83ID:DfUWnG/40
やねさんによると8×8のオセロの完全解析も現実の話になってきているようだ。
囲碁9路盤も近いうちには・・・
将棋はまだまだ無理だろう
0761名無し名人 (ササクッテロル Sp3d-l5z4)
垢版 |
2018/08/26(日) 12:46:10.87ID:QtRBxrH8p
新規で興味もってくれる人が増えるのはいいことだけどなんというか話題がな

NNUEは入力の特徴量を256×先後の512次元にしてるけど本当に512次元も必要なのか

隠れ層を1層増やすことと今のままニューロンだけ増やすことのメリットとデメリット

とかそういう話題で盛り上がっててほしい
0763名無し名人 (ワッチョイ 35b3-c336)
垢版 |
2018/08/26(日) 13:16:09.90ID:h17GnX6Q0
NNUEは素晴らしい発明なのにここではなぜかあまり話題にならないよな
SDTがあったらやねさんが∇評価関数を完全体にして出てきてNNUEと激闘を繰り広げるのをみたい
0764名無し名人 (ワッチョイ 2523-WQAu)
垢版 |
2018/08/26(日) 14:58:10.98ID:MhIGn1RW0
>>761
> 盛り上がっててほしい
他力本願だな、まず隗より…というより
常識的に考えて製作者より使用者のほうが何桁も多いのに
こんなところで製作者が議論してもすぐに薄まってもったいなくないか?
0765名無し名人 (ワッチョイ 35b3-c336)
垢版 |
2018/08/26(日) 15:26:31.44ID:h17GnX6Q0
最近はもう開発者がここに書き込むことはほとんど無いんじゃないかな
別に開発者じゃなくても好きに議論したらいいと思うけどね
0766名無し名人 (ササクッテロル Sp3d-l5z4)
垢版 |
2018/08/26(日) 16:09:59.55ID:QtRBxrH8p
>>763
そうそう、話題にならなさすぎて不自然なレベル
きっと学生が夏休みだからなんだろう

∇評価関数はメモリやばそうだから出てくるなら選手権?
0767名無し名人 (ワッチョイ 35b3-c336)
垢版 |
2018/08/26(日) 17:53:53.35ID:h17GnX6Q0
NNUEは本当ならNNのサイズは大きくして表現力マシマシにしたほうが検討するとき嬉しいけど
大会で勝ちたいならそこそこのサイズにしておいてNPS出したほうが勝てるんだろうな
0768名無し名人 (ワッチョイ 5efb-9EnR)
垢版 |
2018/08/26(日) 19:40:02.01ID:NdlQvAqS0
Ditto3/illqha1.1をDolphin1/illqha1.1と対局させたところ
400局で勝率44%台と、illqha2以外の評価関数との相性が悪そうだったので
評価関数との相性差が出にくいようにマイルド調整
https://i.imgur.com/6s9PidB.jpg
https://i.imgur.com/XOyVEzd.jpg
https://i.imgur.com/ekEMljM.jpg

godwhaleベースですとスマホ化がどうも上手く行かなかったので
土台部分をgodwhaleからYaneuraOuに移し替えています

スマホでoption.txtの入れ替えは無理があるので
android版のみパラメータの設定項目は選択式にしてあります
自分で数値を調整する場合には「手動調整」を選択してください
https://i.imgur.com/qMF4GJf.png

オプションファイルは設定項目の変更があって混乱するので
「ditto4_engine_options.txt」という名前に変更しています
上記の名前にしないと読み込まないので注意

PC版
https://1.bitsend.jp/download/2a484dc4a3eff42c3952a691fe0d93e1.html
スマホ版
https://1.bitsend.jp/download/1848c98105552feb1d36bd8298baa9fb.html
0769名無し名人 (ワッチョイ 3a7e-4saf)
垢版 |
2018/08/26(日) 20:47:07.47ID:0AAH73Wr0
>>767
参考データで計測に利用しているGAMMA2 の数値は150ですか
それとも157ですかはっきり明記してください 
どちらの数値でも支障をきたす事がないのならその旨を明記
してください
0770名無し名人 (ワッチョイ 3a7e-4saf)
垢版 |
2018/08/26(日) 20:51:15.68ID:0AAH73Wr0
767ではなく
>>768の間違い
0771名無し名人 (ワッチョイ 5efb-9EnR)
垢版 |
2018/08/26(日) 23:21:13.62ID:NdlQvAqS0
強さに関わる更新はしばらくないので
一応保存期間の長い斧にも>>768をアップロード
https://www.axfc.net/u/3932358

>>769
エンジンの実行ファイルと
同じフォルダに同梱したオプションファイルそのままで計測しています
つまりGAMMA2の数値は157の状態で計測しています
150との比較は有意差を出すのに必要と予想される対局数が多すぎるので未確認です

本家のやねうら王ではGAMMA2の数値は51になっているので
150と157の違いでは支障をきたす程の差は生まれないとは思いますが
測定結果と揃えたい場合には同梱したファイルそのまま(157)で利用してください
0774名無し名人 (ワッチョイ f925-F1oz)
垢版 |
2018/08/27(月) 00:23:05.46ID:ZhQ8657m0
Noviceの人とか海底の人とかQhapaqの人とか、
Twitter見る限りやる気ありそうだよ
0776名無し名人 (ワッチョイ f9af-PcWx)
垢版 |
2018/08/27(月) 00:31:53.22ID:b/xYtfx10
オワコンって言うより、昔の状態に戻ったってだけだな
人間超える前後はそりゃバブルになるのは当たり前
0777名無し名人 (ワッチョイ a6e9-K3Wk)
垢版 |
2018/08/27(月) 00:58:01.66ID:jem6Wy3s0
illqha2、強いんだけど評価値ぶれすぎ
0780名無し名人 (ワッチョイ f925-EM0A)
垢版 |
2018/08/27(月) 07:16:43.19ID:ZhQ8657m0
>>772
そういえば山本さんって引退後、次の分野で活躍するような進展あったの?
教化学習のための資金がなくponaを強くしてくれる有能なパートナーも失ってやむなく引退したと思ってた
引退表明時に「コンピュータ将棋卒業して次のジャンルへ進みます」
とか言っていたけどプログラミングやシンギュラリティがどうのとかのツイートと
将棋をベースにした人工知能の、毎回似たような内容の講演をあちこちでしているようにしか見えない
0782名無し名人 (アウアウエー Sa52-wF79)
垢版 |
2018/08/27(月) 11:08:29.03ID:0tFtvnc/a
大渡さんも彼はマネタイズの人って言ってたし
そういうことでは?
0783名無し名人 (ワッチョイ cae7-PcWx)
垢版 |
2018/08/27(月) 11:52:26.31ID:grNj84Xu0
対戦回数が少ないので一概には言えないが以下の感想を得た。
1.探索エンジンはnnue-w7-ditto3が良さそうだ。
  なおditto4については今追加して計測中です。

2.評価関数ではKai5が意外と強かったのは驚きだった。
  特にnnue-w7-ditto3との相性がよくトータルでの成績に貢献している。
  といってもillqha1.1とはほとんど差がないので次やればどうなるか・・・
  今回はillqha2の出来が悪く驚いた。
  これまでの自分の感触だとそこまで悪くないと思ってたから・・・

https://i.imgur.com/qeDXmyd.png

リーグ戦の条件設定:
1.秒読み1秒
2.相手手番中の先読み(USI_Ponder):なし
3.ハッシュメモリ(USI_Hash):1024MB
4.NetworkDelay:0
5.NetworkDelay2:0
6.MinimumThinkingTime:1000
7.BookFile:nobook
0784名無し名人 (ワッチョイ 2561-7yA2)
垢版 |
2018/08/27(月) 12:15:48.41ID:4ccxFTR90
本業がボンクラだから素人相手の電波芸者やってる評論家に似てるんだよな
引退してからの文章で勉強になるなと思ったことがない
0785名無し名人 (ワッチョイ f9af-PcWx)
垢版 |
2018/08/27(月) 12:19:27.85ID:b/xYtfx10
「将棋電王トーナメント」終了のお知らせ

株式会社ドワンゴ(本社:東京都中央区、代表取締役社長:荒木隆司 以下、ドワンゴ)は、同社が主催する最強コンピュータ将棋ソフトを決める大会「将棋電王トーナメント」を、第5回をもって終了することをお知らせします(2018年は開催なし)。
2019年からは、コンピュータ将棋協会(会長:瀧澤武信)が主催する「世界コンピュータ将棋選手権」に引き続き協賛するとともに、新たに「ドワンゴ賞」を設定し、1位から3位までの入賞者に賞金を贈呈することを決定しました。

http://dwango.co.jp/pi/ns/2018/0827/index.html
0790名無し名人 (ワッチョイ ea2d-7kIV)
垢版 |
2018/08/27(月) 12:26:13.51ID:8aOUXm630
ハード縛りなんて無意味なレギュレーションだからな
今は、計算機資源の殴り合いになってるもの
0795名無し名人 (オッペケ Sr3d-8Qc3)
垢版 |
2018/08/27(月) 12:36:20.58ID:yVtOIJCMr
予算が確保できないんじゃ仕方ない。
叡王戦も打ち切りとかにはならなければいいけど。
0796名無し名人 (ワッチョイ 3a7e-bxSC)
垢版 |
2018/08/27(月) 12:38:49.36ID:L27Uj8WD0
>>785
SDTを打ち切ったのでプロ棋士のネット対局の棋譜解析に使用するために
WCSCのTOP3に賞金を出すことにしたというのが本音か
0798名無し名人 (ワッチョイ 6a7c-b8G1)
垢版 |
2018/08/27(月) 12:45:14.44ID:KnOKChaL0
いまのソフト対戦は探索部や評価関数の優秀さを競うだけじゃなくて
定跡ファイル合戦になってきたせいも大きいな
優秀な検討用ソフトを採用するためにトーナメントする意味がない
結局いまもぽんぽこだけじゃなくてポナンザを併用して使ってる訳だし
0800名無し名人 (ワッチョイ 35b3-c336)
垢版 |
2018/08/27(月) 13:00:53.11ID:ySF2Jrdh0
統一ハードとハード無制限で半年毎がバランスよかったのにな
たっぷり開発期間とれたから来年はNNUEが霞むような超新星が出てくるか
0802名無し名人 (ワッチョイ 2561-4M2L)
垢版 |
2018/08/27(月) 13:20:54.91ID:DBbJ90yR0
abema将棋ソフトトーナメントはよ
abemaはニコ生以上に初心者向けの解説してるけど評価値見せたほうが将棋素人にはわかりやすいぞ
0803名無し名人 (ワッチョイ ddb3-vl9i)
垢版 |
2018/08/27(月) 13:30:12.11ID:1tB5TELZ0
将棋ブームが起こり過去最高レベルで将棋が盛り上がってる時期に終了するコンピューター将棋大会
これが人類を遥かに超えた強さを得たコンピューター将棋の現実である
ソフトが人類を超えてプロ棋界は終了、これからはソフトが将棋の中心となる
などと妄想を嬉々として語ってた人も現実を知るべき
0811名無し名人 (ワッチョイ ead2-7i4e)
垢版 |
2018/08/27(月) 14:13:07.94ID:iFe+Gt+K0
手前味噌と思うかもしれないが、ソフトがない頃はプロの将棋を観戦していてもモヤモヤすることが多かった
なんでここでこう指さないんだろうと

それがソフトで最善手がわかるようになってからは自分の読みと同じだからスッキリできるようになった

もっと早くソフトが出ていたらプロを目指していたかもしれない
0813名無し名人 (ワッチョイ 6a23-vl9i)
垢版 |
2018/08/27(月) 14:23:54.96ID:4UIu65XC0
>>810
囲碁は全然そんなことなさそうなのが興味深い

> インターネットの対局サイトには囲碁AIが常駐しており、日々トップ棋士との練習対局が公開されていて、
> 5000人以上の観戦者を集めている。さらに、深夜に盛り上がっている対局をのぞいてみると、
> それはAI対AIの対局だ。これも日々、数千人が観戦しており、中国の囲碁ブームの熱さは計り知れない。
> 中国企業が囲碁AIを開発するのは技術面だけではなく、宣伝効果も大きいのだろう。

https://diamond.jp/articles/-/178038?page=2
0814名無し名人 (ワッチョイ 2ab3-EM0A)
垢版 |
2018/08/27(月) 14:29:31.93ID:NM1N9RE80
1年に1回しかソフトの競技会を見れなくなるのは残念だな、半年ごとを楽しみにしていたのに、競技会で定跡使用
する場合10手くらいまでに短く手数を縛ったルールの方が探索や評価関数の性能勝負の比重が増えるので見ている
方は面白い、定跡勝負の将棋になるほどつまらないものはない
0816名無し名人 (JP 0H8e-wF79)
垢版 |
2018/08/27(月) 14:38:15.42ID:PMiSJlRnH
定跡疎かにするのって将棋弱いんだろうなぁって思うけどww
0817名無し名人 (アウーイモ MMa1-lPpP)
垢版 |
2018/08/27(月) 14:45:45.71ID:dHpHKoYfM
興味がなくなったらそれで終わりってのも薄情だな
チェスなんて有志が資金集めて長期間の測定兼大会を開いてるのに
日本人は文化や科学への投資が少なすぎるね
0819名無し名人 (ワッチョイ 5edc-wF79)
垢版 |
2018/08/27(月) 14:53:27.21ID:acNRo9WU0
今の日本はとにかく金がないみたいだから、投資できないんだろうね。
それでも今はぐっとこらえて未来のために金を使うってのをやらない限り、衰退は続く。
0820名無し名人 (ワッチョイ eaeb-PNam)
垢版 |
2018/08/27(月) 14:55:54.43ID:41R3uoOq0
>>817
まあコンピュータ選手権のほうにはスポンサーとして賞金出すみたいだし、単に電王トーナメントはニコニコの番組としては無価値だと判断しただけでしょ
0822名無し名人 (ワッチョイ eaeb-PNam)
垢版 |
2018/08/27(月) 15:09:24.43ID:41R3uoOq0
そんなん知るかよ
20年ぶりにコンピュータ選手権に賞金贈呈って記事があるのに、興味がなくなったらそれで終わりとか的はずれな指摘してるのが気になっただけだわ
0823名無し名人 (ワッチョイ ead2-7i4e)
垢版 |
2018/08/27(月) 15:09:29.26ID:iFe+Gt+K0
ソフト同士の対局は観戦していてもハラハラドキドキがないのが欠点だよね
大体が指し手が早すぎて手を吟味して観戦できないし

プロの将棋なら自分も気分が一緒になって考えられるし、いつ疑問手や悪手が飛び出すかわからないから面白い
勝勢ならどう勝負を決めるか、敗勢ならどうやって粘るか、いろいろなバリエーションを楽しめるのもいい
0825名無し名人 (スップ Sd0a-BxHP)
垢版 |
2018/08/27(月) 15:33:01.62ID:JOP4K43Jd
あと叡王戦本戦が去年の11月末開始から
今年は10月開始になって
電王トーナメントにさく
将棋運営のリソースが足りなくなったんじゃないか
0826名無し名人 (ワッチョイ ead2-7i4e)
垢版 |
2018/08/27(月) 15:42:08.37ID:iFe+Gt+K0
電王トーナメントやらないのなら統一ハードで「次の一手選手権」をやったらいい
過去の実戦から正解手を早く見つけるのが難しい50問を用意して採点する
点数が同じなら早く正解したほうが順位が上ということでどうだろう
問題は公募して決めてもいい
問題は試験開始と同時にネットにも上げてプロに解説してもらいながらの実況放送がいい
0827名無し名人 (ワッチョイ dd26-PcWx)
垢版 |
2018/08/27(月) 15:43:38.90ID:ob7i3qSt0
対人間用のソフトを選抜するのが当初の目的
目的がなくなった時点でソフトの大会は他でも行われているから
削り合うより一つの大会を盛り上げていくほうが良いという見方もある
0831名無し名人 (ワッチョイ b958-vl9i)
垢版 |
2018/08/27(月) 17:04:21.42ID:O3/gYzrN0
>>828
SDT5のルールだと第26条に
>本大会終了後、1 位から 5 位となったソフトは、ドワンゴが主催する将棋放送・イベントでの使用において、主催者ならびに主催者の認める者に対してソフトウェアの使用を許諾するものとする。

とあるから、使えるけどWCSCだとこういう文はないので個別に許諾とるのじゃないかな
それでもクラスタ専用ソフトとか特殊なハードを要求するものはニコニコでは手に負えないかもだけど
0832名無し名人 (アウーイモ MMa1-GM77)
垢版 |
2018/08/27(月) 17:09:08.74ID:krQ3oZa2M
>>813
囲碁はコンピュータが人間を上回ってまだ3年くらいだから、将棋でいえば電王戦真っ最中の目新しさで盛り上がってた時期では
この先も人気が持続するならすごいけど
0833名無し名人 (ワッチョイ 6a23-vl9i)
垢版 |
2018/08/27(月) 17:13:32.82ID:4UIu65XC0
>>832
コンピュータ囲碁は、布石において道策、呉清源に続く第三の革命ともいえるものを生み出したけど
(しかも鉱脈が尽きる気配が全然ない)
コンピュータ将棋は、定跡においてそこまでの革命を生み出したわけじゃないってのもありそう
0836名無し名人 (オイコラミネオ MM35-p7go)
垢版 |
2018/08/27(月) 17:26:42.61ID:Y46dJtmPM
>>835
見てきた
確かに「同一ハードで比較した場合の強さ」の情報は、レーティングサイトでしか得られなくなるから、今後はむしろ需要が増えるかもね
0837名無し名人 (ワッチョイ 5efb-9EnR)
垢版 |
2018/08/27(月) 17:31:35.03ID:DXVdsKii0
短時間対局に特化して設定ファイルを微調整しました
https://i.imgur.com/5MF5hbQ.jpg
https://i.imgur.com/ulo0U3C.jpg
https://i.imgur.com/AheiimO.jpg
https://1.bitsend.jp/download/6aa06bef5cc092e82cd19b3e2ce1d2f9.html

v1という名前で上記の設定項目を追加したAndroid版も制作したので
興味のある方は入れ替えて利用してください
https://1.bitsend.jp/download/8daeecbc982af42e20536ab91062cec5.html
出来合いのパラメータが増えているだけでエンジンの中身は同じです

他の持ち時間での強さは未確認です
0839名無し名人 (ワッチョイ f9af-PcWx)
垢版 |
2018/08/27(月) 17:40:03.08ID:b/xYtfx10
>>834
まあuuun氏が引退するっていうのと、ドワンゴが辞める理由ってのは、
根本では同じようなことじゃないのか
山本氏が引退したのも含めて
0841名無し名人 (ワッチョイ dd26-PcWx)
垢版 |
2018/08/27(月) 17:45:45.82ID:ob7i3qSt0
許諾より運用サポートが必要なのかなと思ったり
繋いで動かすところまでは開発者のサポート貰わないと
0846名無し名人 (ワッチョイ 25a0-iAyK)
垢版 |
2018/08/27(月) 18:49:23.31ID:0yNrwqjn0
GPLライセンス繋がりだけど
将棋神やねうら王に付属している
読み太とQhapaqの2018年版のソースコードってどこ?
保守の関係で評価関数だけ取り入れて探索部分はやねうら王って事なのかな?
0850名無し名人 (ワッチョイ fd8a-vl9i)
垢版 |
2018/08/27(月) 19:12:43.57ID:ffZ7Vpjm0
>>849
運営の高齢化や現在のコンピュータ将棋に対応しきれない所とか
今年みたく高手数長期戦が増えてもそれに対応できるよう開催日程や時間伸ばすのは難しいから
0851名無し名人 (ブーイモ MM49-dbsI)
垢版 |
2018/08/27(月) 19:17:35.06ID:y1AOocucM
floodgate風の特設サイトを作って
オンラインで殴り合えば経費も浮くだろうけど
開発者のオフ会みたいな面が削がれるから楽しくなさそう
0852名無し名人 (ワッチョイ bd9f-PcWx)
垢版 |
2018/08/27(月) 19:21:09.02ID:Mo8+A9kA0
WCSCが終了するのは運営側の問題もあるけど
参加ソフトがやねチルドレンばかりになって学術的な意義がなくなったからだろ
肝心のやねうらおは裏でニヤニヤして見てるだけだし
優勝ソフトはアンチコンピュータ戦略の優劣で決まるし
0856名無し名人 (ラクッペ MMed-UJYD)
垢版 |
2018/08/27(月) 19:40:10.41ID:6j8PLrHfM
WCSCは部外者としては日程を短縮するなりして続けてほしい
0860名無し名人 (ワッチョイ 9e61-vl9i)
垢版 |
2018/08/27(月) 21:00:26.35ID:bXw7MCT40
電王トーナメント終了か
楽しみにしていたのに残念
0862名無し名人 (ワッチョイ d9ff-PcWx)
垢版 |
2018/08/27(月) 21:30:54.93ID:Hb3C3xpr0
誰かやねうら王の詰将棋エンジンが公開されているのでビルドしてくれ
出来ればAVX使わないSSE4.2までのやつで
0863名無し名人 (ワッチョイ eabd-LowY)
垢版 |
2018/08/27(月) 21:33:49.03ID:ZeuVesWn0
SDTが終わるのは必然すぐる
PVで人類不在と言ってしまった以上、続けるとしたら
次は人類不要といわざるおえない
0864名無し名人 (ワッチョイ a6e9-Ktop)
垢版 |
2018/08/27(月) 22:09:37.22ID:Pc8dHr0x0
全体的にソフトの強さは頭打ち、SDT終了、将棋神やねうら王完成…
このまま、やねうらお氏も引退かと思っていたが、まだやる気あるんだな
0868名無し名人 (ワッチョイ fdb3-QcHd)
垢版 |
2018/08/27(月) 23:18:34.40ID:CLn4VvcO0
Webmasterより

Eternal Blue さんへ

こんにちは

将棋倶楽部24の席主です。
この倶楽部24は、下記「守ってね」にあるように、
https://www.shogidojo.net/info/rule/access/
どのような理由があっても不愉快Chatは厳禁です。

2度目のイエローカードです。
このままでは他の会員の方の迷惑となりますので
残念ですが、会員停止いたします。
ごめんなさい。

将棋倶楽部24 席主

・24の内情を他の人にばらされるのが怖いので、抹消しました。
(お客が少ないので普段は有段タブで棋譜並べしている、級タブには過小しかいなくて適当に緩めてる)
・将棋指しは、ばれなければどんな卑怯な事もします。
0869名無し名人 (ワッチョイ 2ab3-EM0A)
垢版 |
2018/08/27(月) 23:31:14.71ID:NM1N9RE80
>>868
スレ違いだろ
0873名無し名人 (ワッチョイ 35b3-PcWx)
垢版 |
2018/08/28(火) 01:13:27.80ID:dAEdnSNQ0
別に年収と賞金の割合でやる気が変わったりはしないだろう。
趣味の大会で、順位に応じてうまい棒最大10本くれるって言われたら、「よっしゃ次は10本ねらうぜ!」って感じにちょっとやる気出るでしょ?
0875名無し名人 (ワッチョイ 6a33-c68X)
垢版 |
2018/08/28(火) 08:06:40.25ID:QSgQzUsL0
>>850
むしろ256手引き分けが増えるのは、チェスと同じで「ゲームの幅」を増やす上では
歓迎なんだけどな個人的には
弱い者が強い者に引き分けに持ち込めるか、強い者が弱い者に引き分けを甘受するか
リスクを負って勝ちを取りに行くか、これがチェスでは醍醐味でもあるので
0879名無し名人 (ワッチョイ 3a7e-bxSC)
垢版 |
2018/08/28(火) 18:01:39.14ID:lJwUdpJv0
WCSCの運営スタッフ(ボランティア)を募集したら
優秀で元気な若いスタッフが集まるかもしれない
募集条件のひとつに”会場に電車バスで60分
以内で来られる人”という項目を入れて
有名大学を出てもヒマな奴が結構いるから
数人位集まるかも・・・

それと大会参加費を10万円ぐらい徴収したら
冷やかし参加が減ると思う
0882名無し名人 (ワッチョイ 25a0-iAyK)
垢版 |
2018/08/28(火) 19:24:52.25ID:APYxSGsU0
>>783の続きはまだか!!?
割と楽しみにしている
0888名無し名人 (ワッチョイ a5d2-841Z)
垢版 |
2018/08/28(火) 23:40:08.73ID:3+QRgpxM0
110.44sったショタコンさんさすがに損切りしてるよなww
0890名無し名人 (ワッチョイ 6a23-vl9i)
垢版 |
2018/08/29(水) 10:13:56.02ID:oOKujpoH0
>>887
stockfishみたいなコミュニティがあるから開発自体は延々続いてる
トッププレイヤーのトレーニング用に商業版の需要もあるから
stockfish以外も強くなるので
0892名無し名人 (ワッチョイ 2afb-XiPX)
垢版 |
2018/08/29(水) 11:41:14.07ID:ivT98z1N0
dolphin/illqha1.1又はdolphin2+illqha2で、CPUクロック(XEON)が最大まで上がらない(1割減)のは俺だけ?
ちな、他のエンジンは問題なくターボブースト全開。
0894892 (ワッチョイ 2afb-XiPX)
垢版 |
2018/08/29(水) 13:04:53.93ID:ivT98z1N0
893wに怒られたので今もっかい調べたけど、以下の組み合わせは問題なかった。
Godwhale5.0.5/QQR
Godwhale5.0.5/Qzilla9
YaneuraOu V482/Apery_SDT5
YaneuraOu V482/elmo

以下はクロック1割減。NNUEと俺の環境相性(XEON E5 V4)なのか・・・。
dolphin2/illqha2
dolphin1/illqha1.1
dolphin1/NNUEkai5
0897名無し名人 (ササクッテロル Sp3d-l5z4)
垢版 |
2018/08/29(水) 13:28:01.59ID:ijpylZqDp
NNUEはSIMD命令使いまくってCPUを酷使するから発熱が多い
発熱が多いからターボブーストが抑えられる

これだけの話だと思うんだが
0898名無し名人 (ワッチョイ 2afb-XiPX)
垢版 |
2018/08/29(水) 13:35:52.20ID:ivT98z1N0
>>895
スレッド数を減らすorコア数以上にしてもクロックダウン挙動は変わらず。
メモリは16GB、Hashは2048なんだけど減らしても同じ・・・。
CPU温度は全コアMaxブーストでぶん回して60度、クロックダウン状態だと50度安定なので冷え冷え。
頭に来て、同じXEON E5 V4でコア数違うCPUを試したけど、同じ・・・。

で、質問に来た今ココorz
0899名無し名人 (オッペケ Sr3d-841Z)
垢版 |
2018/08/29(水) 13:37:23.89ID:hQ30LedJr
>>895
1thred
Memory 256MB
Pentium4 3.06Ghz
0900名無し名人 (ワッチョイ 2afb-XiPX)
垢版 |
2018/08/29(水) 14:02:22.79ID:ivT98z1N0
分かったかも。AVXを連続使用するとクロックダウンするそうな。
CPUによって下げ幅が違うので、最新だと有利が拡大する可能性もあるという事か・・・。
0902名無し名人 (ワッチョイ 6696-5bcf)
垢版 |
2018/08/29(水) 14:51:53.19ID:hRiCcW3B0
32bitPCでは発売されたやねうら王が最強でいいのかな?
でも人間用の定跡は入ってないよなぁ。対局は激指で解析はやねうら王にしようかな
0903名無し名人 (ワッチョイ 6a23-vl9i)
垢版 |
2018/08/29(水) 15:44:14.54ID:oOKujpoH0
WCSCの賞金を、単純な順位順ではなくて、

・ライブラリ不使用者(自作ライブラリ使用者を含む)
・特定ライブラリを使用した者の中の最上位者

として過去3大会(大樹の枝解放後)の上位3つを出してみる

2018 Hefeweizen(1位)Apery(3位)nozomi(11位)
2017 elmo(1位)Ponanza(2位)技巧(3位)
2016 ponanza(1位)技巧(2位)大将軍(3位)

うん、やっぱり上位勢がみなライブラリ組ということを考えると
賞金に関してはライブラリ制限入れたほうが良さそうだ
順位にはライブラリ制限を入れないこととのバランスが取れる
0904名無し名人 (ササクッテロル Sp3d-l5z4)
垢版 |
2018/08/29(水) 16:21:19.67ID:ijpylZqDp
まあそこらへんはうまいこと考えるだろ
別にライブラリが悪だとは思わないけどフルスクラッチ勢を褒め称えたいのもわかる

ここ最近だとelmo絞りもNNUEもすごい発展をもたらしてると思うが
フルスクラッチしか認めない世の中だったら果たして生まれたかどうか

いいものがあるならありがたく使えばいいでしょ
0908名無し名人 (ブーイモ MM0a-dbsI)
垢版 |
2018/08/29(水) 17:23:05.95ID:eySNRNgYM
一般人に還元されるのはむしろライブラリ勢のアイデアの比率の方が高いけどね
elmoもnnueもqhapaqもライブラリ発だし
0910名無し名人 (ワッチョイ ed91-Tr/F)
垢版 |
2018/08/29(水) 18:03:26.20ID:2QfEL4E80
>>898
BIOSでAVX走らせると自動でクロックダウンする設定がある

Xeonならそもそも設定変えられない可能性もあるけど
0913名無し名人 (ワッチョイ 45c3-s22w)
垢版 |
2018/08/29(水) 19:48:19.11ID:KK0HL4Po0
>>898
この人suimonさんです
敬礼!
0914名無し名人 (ワッチョイ f925-EM0A)
垢版 |
2018/08/29(水) 20:47:16.34ID:BhJBqlk90
>>911
むしろ上位ソフトかつライブラリ不使用、または本家のうち
探索部がstockfishベースじゃないソフトってあるのかな
やねうら王、Apery、技巧、読み太、nozomi、・・・
全部stockfishを参考・流用にしている気がする
将棋ファンの間では神のような存在として崇められているponanzaも
ソースコード自体は非公開だけど過去の山本さんや平岡さんのツイートから判断するに
おそらくは結局stockfishベースだと思う
0916名無し名人 (スッップ Sd0a-l7Ss)
垢版 |
2018/08/29(水) 21:34:33.15ID:PReW68pRd
激指やYSSは?
0917名無し名人 (ワッチョイ f925-F1oz)
垢版 |
2018/08/29(水) 21:50:55.18ID:BhJBqlk90
電王戦が始まる前後まではトップをキープしていられたけど、
stockfish勢のオープンソース化が始まってからはWCSCでも2次予選敗退が目立つようになった
0918名無し名人 (ワッチョイ a5d2-841Z)
垢版 |
2018/08/29(水) 22:36:23.63ID:TX+NNN050
まぁうさぴょんですらR3000超えちゃったしな
0919名無し名人 (トンモー MM49-Ddyv)
垢版 |
2018/08/29(水) 23:05:04.45ID:n/53BGlVM
探索部はstockfishには勝てないだろう
chessで半端ない試行錯誤と莫大な検証で作られてるからな
将棋とchessは違うと思ったが結局一緒らしい

結局将棋独自といえるのは保木さんの3駒関係と学習だけだな
0920名無し名人 (アウアウウー Sa19-gakC)
垢版 |
2018/08/30(木) 00:42:23.19ID:27KPQugDa
カードゲームのAIってないの?
0921名無し名人 (ワッチョイ 0b96-z8f6)
垢版 |
2018/08/30(木) 01:05:36.48ID:/8nXgF+Q0
自分の実戦をいくつかのソフトで解析してみたけど、強さに差はあってもグラフの推移は大きな差はなかった
読み筋とか諸々の部分で技巧がいいと感じた
最新ソフトと500はレート違うはずなのにグラフの形がほとんど同じって不思議
0924名無し名人 (ワッチョイ 5b8f-tpL7)
垢版 |
2018/08/30(木) 03:46:01.92ID:pkmJeVZ70
技巧は公開当初は神かと思ったわ

人間の感覚に近く、あの圧倒的王者ポナンザに最も近づいていた感じだったしね
0925名無し名人 (ワッチョイ 63e7-tpL7)
垢版 |
2018/08/30(木) 06:11:29.00ID:qYT2DA/v0
>>837
> 短時間対局に特化して設定ファイルを微調整しました
> https://i.imgur.com/5MF5hbQ.jpg
> https://i.imgur.com/ulo0U3C.jpg
> https://i.imgur.com/AheiimO.jpg
> https://1.bitsend.jp/download/6aa06bef5cc092e82cd19b3e2ce1d2f9.html
>
> v1という名前で上記の設定項目を追加したAndroid版も制作したので
> 興味のある方は入れ替えて利用してください
> https://1.bitsend.jp/download/8daeecbc982af42e20536ab91062cec5.html
> 出来合いのパラメータが増えているだけでエンジンの中身は同じです
>
> 他の持ち時間での強さは未確認です


この設定で対戦させたらKai5だけは異常に強くなった・・・
https://i.imgur.com/kRaS2Vg.png
https://i.imgur.com/86uFjdH.png
甘利にも強いのでKai5と他の組み合わせとの対戦を企画したが
ほとんど勝ちなので途中で計測打ち切って別の対戦をスタートさせた。
https://i.imgur.com/SM7B0Hk.png
今日の夜に結果を報告します。
https://i.imgur.com/X2tmO6u.png
0931名無し名人 (アウアウカー Sa61-p3kD)
垢版 |
2018/08/30(木) 07:18:24.88ID:v7T/sEbJa
あなたの環境ではどうなるか試そうとは思わないの?(キリッ
0937名無し名人 (ブーイモ MM29-l4pP)
垢版 |
2018/08/30(木) 09:41:56.01ID:DqwPXFlQM
>>936
同じ強さで時間が短くなればdepth上げられるし
同じ時間&depthで強くなれば学習の質が上がる
どうせNNUEも計算資源投入して殴るルートに入るんだから
0941名無し名人 (ワッチョイ 2323-zBrR)
垢版 |
2018/08/30(木) 11:00:06.84ID:46pBleHD0
山口さんって産総研勤めからフリーになるのか
どこに勤めているかまではこれまで明言していなかったと思うが
0943名無し名人 (ブーイモ MM29-vBcp)
垢版 |
2018/08/30(木) 12:37:47.81ID:Af9jGThnM
将棋神やねうら王を購入すると
Qhapaqのソースコードの請求権が付いてくるはずだから
その内容次第ではKPPT勢の躍進もありえそう
0945名無し名人 (ワッチョイ a3b3-zJks)
垢版 |
2018/08/30(木) 14:03:26.36ID:SpilRqNz0
前にこのスレでuuunuuunさんの測定基準を自分の解釈で勝手に書いたことがあるので誤解がないように念のため
Twitterから転載しました、以下uuunuuunさんのツイートより

私のところの測定基準について、一部誤解があるようですが、Core i7 4スレで一手五秒程度、やねうら王&KPPT
評価関数の場合中盤で一手1500万ノード相当なのですが、ほかのソフトでも一手五秒で測定しています。
同じやねうら王でもNNUE型の場合NPSが小さくなりますが同じ時間で対局させるので一手当たりのノード数は下
がります。また、探索部がApery, nozomiなど異なる場合NPSはソフト毎に違いますが一手当たりの時間の方をそ
ろえています。あくまでも持ち時間を同じにしたときにどちらのソフトが強いかという判定法です。
0948名無し名人 (ワッチョイ 959f-tpL7)
垢版 |
2018/08/30(木) 18:56:03.40ID:MMxNF3b80
AVX512を多用するXeonPhiの発熱量は半端ないからな
Intel何か設計を間違ってないか
XeonPhiは開発終了になったが
0957名無し名人
垢版 |
2018/08/31(金) 10:27:14.44
最初から期日に間に合わないのに仕事を受ける手口
詐欺師のやり方
やねうら王のこと?
0958名無し名人 (ワッチョイ e59f-i/fa)
垢版 |
2018/08/31(金) 10:28:25.59ID:g2fGdFBj0
開発者にベータテスターになってもらうんだから無償ではないでしょ
0959名無し名人 (ワッチョイ 15b3-sQ2j)
垢版 |
2018/08/31(金) 15:00:19.20ID:O5t25J710
春はスペック無制限の大会
秋は同一ハードウェアの大会
両方があってちょうどいい感じだったのに無くなっちゃうのは残念(ただの視聴者だけど)

誰か藤田さんに同一ハードウェアの大会やってくれるように進言してきて

abemaがコンピュータの評価値導入して田村先生に番組中わんこ蕎麦でも食べてもらうくらいのバラエティ要素も取り入れてくれればニコニコプレミアムやめられるのに
0960名無し名人 (ブーイモ MMab-vBcp)
垢版 |
2018/08/31(金) 15:17:14.82ID:Q3/0zEfVM
コンピュータ将棋すら排除して
バラエティ要素のみの方が視聴者多そうな現実を突き付けられるからダメてす
0966名無し名人 (アウアウカー Sa61-p3kD)
垢版 |
2018/08/31(金) 18:59:31.87ID:a9lDXIHBa
それなんか意味あんの?
0969名無し名人 (アウアウカー Sa61-+cNh)
垢版 |
2018/08/31(金) 19:57:07.06ID:tMfNNI57a
終わるたびに下二つを脱落させて繰り返したら?
0970名無し名人 (ワッチョイ 15b3-tpL7)
垢版 |
2018/08/31(金) 19:57:56.37ID:dJz5MpXK0
今日の近藤−藤井戦の感想戦を見ていたら、この局面から後手の藤井聡太が秒殺で先手玉を詰ましちゃったよ。すげーーー

後手の持駒:角 銀 桂二 歩五
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・ ・ ・ ・v玉 ・ ・v香|一
| ・ ・ ・ ・ ・ ・ ・ ・ ・|二
| ・ ・v桂v金v歩v歩 龍 ・ ・|三
|v歩 ・v歩 ・v銀 ・ ・ ・ ・|四
| ・v飛 ・ ・ ・ 歩v歩 ・v歩|五
| 歩 ・ 歩 歩 銀 ・ ・ ・ ・|六
| ・vと ・ ・ 歩 金 ・ ・ ・|七
| ・ ・ 金 ・ ・ ・ ・ ・ ・|八
| 香 桂 玉 ・ ・ ・ ・ ・ 香|九
+---------------------------+
先手の持駒:角 金 銀 歩
後手番
0971名無し名人 (ワッチョイ 65b3-kfpE)
垢版 |
2018/08/31(金) 20:03:05.76ID:NbIWf1eX0
NNUE評価関数だと5000万ノードくらいで(詰み 51手)って出てくるんだな、すごい
そしてそれを読み切れる藤井は流石の詰将棋力ってとこか
0978名無し名人 (ワッチョイ a3b3-zJks)
垢版 |
2018/08/31(金) 20:59:59.90ID:cDtjAnsy0
>>970
スレ違いだろ
0979名無し名人 (ワッチョイ a3b3-zJks)
垢版 |
2018/08/31(金) 21:01:48.22ID:cDtjAnsy0
藤井の応援スレでやれ
0980名無し名人 (ワッチョイ 05d2-SJ35)
垢版 |
2018/08/31(金) 21:21:57.96ID:JLT2hTzY0
>>943
請求権ついてくるの?
0982名無し名人 (ワッチョイ a3b3-zJks)
垢版 |
2018/08/31(金) 21:36:27.37ID:cDtjAnsy0
藤井のファンで藤井の指し手の良さを承認要求したいんだろうけど、棋戦に関することは棋戦や棋士の本スレでやるのが当たり前だろ
0985名無し名人 (ワッチョイ 15b3-tpL7)
垢版 |
2018/08/31(金) 21:43:49.42ID:dJz5MpXK0
ここに上げると誰かが最新バージョンで解析してくれてコメントをくれると思ったのさ
971さんありがとう
0986名無し名人 (ワッチョイ 15b3-tpL7)
垢版 |
2018/08/31(金) 21:51:36.66ID:dJz5MpXK0
もっと言おうか
局面を貼っているぐらいだから、当然、自分でも解析したのだ
一昔前のソフトで先手優勢から動かない。脊尾詰でも答えがなかなか出ない
一方の人間は秒殺している
そこでこのスレに貼ったのだ
0989名無し名人 (ワッチョイ fd25-zJks)
垢版 |
2018/08/31(金) 23:34:09.79ID:HvCGHooO0
今日発売の将棋神やねうら王買った人いる?
0997名無し名人 (ワッチョイ 8bed-zBrR)
垢版 |
2018/09/01(土) 01:25:04.33ID:UhsMfrQ+0
でも33の龍を駒台に戻すと、詰みを見つけられなくなるけどな。
自玉が切羽詰ってないと詰みを見つけられないのは相変わらずか
0998名無し名人 (ワッチョイ db1b-ZtIo)
垢版 |
2018/09/01(土) 02:03:41.38ID:D0cIr8Il0
ワッチョイ 15b3-tpL7

FC2で配信規制くらって発狂している生ポ関数
10011001
垢版 |
Over 1000Thread
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 24日 0時間 54分 7秒
10021002
垢版 |
Over 1000Thread
5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。


───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────

会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。

▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/

▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
レス数が1000を超えています。これ以上書き込みはできません。

ニューススポーツなんでも実況