▲コンピュータ将棋スレッド140

**名無し名人** (ﾜｯﾁｮｲ 03d2-ju18) · 2018/07/01(日) 19:07:19.41

!extend:checked:vvvvv:1000:512
↑スレ立て時は1行目と2行目に「!extend:checked:vvvvv:1000:512」をコピペして立てて下さい
荒らし対策のために強制コテハン（ワッチョイ）を表示するコマンドです

第28回世界コンピュータ将棋選手権参加チーム
https://www.apply.computer-shogi.org/wcsc28/team.html
詰将棋メモコンピュータ将棋２０１８
http://toybox.tea-nifty.com/memo/2018/01/post-0205.html
世界コンピュータ将棋選手権参加ソフトリンク集
http://www.ne.jp/asahi/tetsu/toybox/soft/softlink.htm
floodgate 最新２週間レーティング
http://wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html
コンピュータ将棋協会
http://www.computer-shogi.org/
コンピュータ将棋
http://ja.wikipedia.org/wiki/%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E5%B0%86%E6%A3%8B
将棋フリーソフト rating on single machines(各ソフトのレーティング評価)
http://www.uuunuuun.com/

※前スレ
▲コンピュータ将棋スレッド139
https://mevius.5ch.net/test/read.cgi/bgame/1528687544/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured

**名無し名人** (ﾜｯﾁｮｲ 12eb-J6FL) · 2018/07/27(金) 14:28:04.04

探索部は結局1手にそこそこ時間をかけて読んだとき何が強いかよくわからないんだよね。
whale3よりgodwhaleのNNUE版のほうが強いって意見もあったし

**名無し名人** (ﾜｯﾁｮｲ 9e1b-kTp/) · 2018/07/27(金) 15:48:09.57

文句ばっか言ってるのに、俺の測定何千万ノードで、何対何とか棋譜もないのによう信用できるな。

気になった事があったから推理したが

まふ、嘘ついてる確信み～つけた。

あいつ引き分け全く無い＝自分のほうだけ定跡使用で、計測時間短縮して勝率を稼いでる。

だから、新手だらけと言い棋譜が出ないでFA

他にも嘘ついてるだろうけどな。

**名無し名人** (ﾜｯﾁｮｲ 679f-PVEq) · 2018/07/27(金) 16:23:45.18

初心者みたいな質問で申し訳ないんですが、スマホでillqha評価関数を使う場合、探索部はスマホ版やねうら王4.82で良いんでしょうか？
whale6やdolphinのスマホ版は無いんですかね？

**名無し名人** (ﾜｯﾁｮｲ c27e-LwZc) · 2018/07/27(金) 18:41:46.58

>>648
将棋所のページのUSIエンジンのリンクから
elmoをクリック>>elmo導入方法をクリック>>
４．elmoをダウンロードしますをクリック

**名無し名人** (ﾜｯﾁｮｲ 3761-kCGC) · 2018/07/27(金) 19:05:08.12

PC放置して100戦するまで待てばいいのになんで10や20で慌てるかね

**名無し名人** (ﾜｯﾁｮｲ d3c1-o5LP) · 2018/07/27(金) 20:48:20.96

計測することが目的なんじゃなくて自分に注目集めたいだけなんじゃない
「見て見てこんなことやったよ」みたいな感じ
まふとかもそういうタイプだよね

**名無し名人** (ﾜｯﾁｮｲ 32e7-53i4) · 2018/07/28(土) 02:14:09.63

>>647
俺がやったら5勝5敗だった。
これから寝るのでさらに20対戦の連続実行をセットして寝る。
2秒対戦結果

https://i.imgur.com/chvgceZ.png

**名無し名人** (ﾜｯﾁｮｲ d2b3-J6FL) · 2018/07/28(土) 03:45:00.32

大分前に初代NNUEkaiの公開直後にwhale3で計測してた
NNUEkaiの勝率61%でやや強いと思っていたので0611から変えてNNUEkaiを今まで使ってた
NNUEkai-whale3 11-2 -7 nn20180611-whale3
持ち時間5分一手ごとの加算20秒定跡なしスレッド2 Hash1024 投了値1000

**名無し名人** (ﾜｯﾁｮｲ d2b3-J6FL) · 2018/07/28(土) 04:14:03.87

同じく初代NNUEkaiの公開直後に計測していたやつ
NNUEkaiも0611(両方whale3使用)もelmoには10戦全勝出来なかった、出来たのはillqha1.1-dolphinだけだった

NNUEkai-whale3　11-2-7　nn20180608-whale3 勝率61%
持ち時間5分一手ごとの加算20秒定跡なしスレッド2 Hash1024 投了値1000

NNUEkai-whale3　12-2-5　QQR-GW5.0.5 勝率70%
持ち時間5分一手ごとの加算10秒定跡なしスレッド4 Hash256 投了値1000

NNUEkai-whale3　8-2　elmo_wcsc27_Y4.74_AVX2 勝率80%
持ち時間5分一手ごとの加算10秒定跡なしスレッド4 Hash512 投了値1000

nn20180611-whale3　15-4-12　nn20180608-whale3 勝率55%
持ち時間5分一手ごとの加算20秒定跡なしスレッド2 Hash1024 投了値1000

nn20180611-whale3　18-2　elmo_wcsc27_Y4.74_AVX2 勝率90%
持ち時間5分一手ごとの加算10秒定跡なしスレッド4 Hash1024 投了値1000

**名無し名人** (ｽｯｯﾌﾟ Sd32-Ci51) · 2018/07/28(土) 05:55:33.39

>>657
そんな少ない対戦数どうでもいいわ
200局以上やってから書き込めや

**名無し名人** (ﾜｯﾁｮｲ 32e7-53i4) · 2018/07/28(土) 07:09:53.45

>>658
そんな1５時間以上かかることをあなたはできるのですか？
２００局とは１局５分設定だと１０００分・・・１７時間ですよ。

そして経験すればわかるけど１０局でだいたい傾向は掴めるのです。
因みに0611はillqha1.1とは20局やっても互角にちかかったです。

細かいところで条件がいろいろ違った場合に大きく差が出るケースも
あるかもしれません。いろんな方がいろんな設定で10局程度やることで
傾向がつかめるんだから私は否定すべきではないと思います。

**名無し名人** (ﾜｯﾁｮｲ d69f-y25S) · 2018/07/28(土) 07:44:15.26

で、でた～www
勝率７割のソフトは１０戦で７勝３敗と考え奴～wwwww

**名無し名人** (ﾜｯﾁｮｲ 9223-53i4) · 2018/07/28(土) 08:17:42.08

それよりも２スレってのが気になる
化石PCでも使ってんのかね

**名無し名人** (ﾜｯﾁｮｲ 5e8a-AlM8) · 2018/07/28(土) 08:22:34.50

illpha1.1ですらelmoに3連敗することもある10局で傾向がつかめる訳がない

**名無し名人** (ﾜｯﾁｮｲ 1223-53i4) · 2018/07/28(土) 08:45:21.23

10局、勝率0.5のシミュレーションを経験すればわかるけど
10セットやれば8-2、2-8以上はよく出る
100セットやれば9-1、1-9以上はよく出る
それは感覚として覚えておくといいと思うぜ

100セットというのは10人が10個の評価関数を検証したとき
つまらない結果が出たときは黙殺して面白い結果が出たときに騒ぎ立てるとした時
誰かが騒ぐことは割とあるということだ

**名無し名人** (ﾜｯﾁｮｲ 32e7-53i4) · 2018/07/28(土) 08:50:32.48

>>662
あなたの物言いはおかしいですよ。
10局で傾向がつかめないという根拠として3連敗がありうるという
話になってますｗ

一体どんな頻度で3連敗が出てくるんでしょｗ
単純に2分の1の確率で3連敗は12.5％です。

勝率5割 0.125
勝率4割 0.64
勝率3割 0.027
勝率2割 0.008

**名無し名人** (ｱｳｱｳｴｰ Saaa-qs9D) · 2018/07/28(土) 09:00:53.15

なるほど
一人が100局やるよりも10人が10局やる方が効率的だし楽だな

**名無し名人** (ﾜｯﾁｮｲ 5e8a-AlM8) · 2018/07/28(土) 09:05:32.93

>>664
elmoに勝率9割程度のillqhaでも10局単位だと3連敗することがあったんですよ。
このときelmoに10局で勝率70%という結果が得られてどうやってillqhaは他のソフトより強いという傾向がつかめるんですか？
例えばAperySDT5とelmoを10局対局されて同じくelmoに勝率70%だったらどう判断するんですか？

**名無し名人** (ﾜｯﾁｮｲ de9f-H5nH) · 2018/07/28(土) 09:23:49.52

>>659
・真に強弱のあるソフトでの10戦で得た傾向は、未知のソフトの10戦について何も説明できません
・傾向なんて言葉は使わず、統計で定量的に説明しましょう
・p0.05とか0.01という有意水準に拘る必要はないですが、万人に納得してもらうにはフォーマットに従いましょう
・セットを繰り返し行う(もしくは結果を見て繰り返すか決める)のは、むしろ検定の信頼性を損なう行為です
・そもそも不特定多数が実施でき、組み合わせも多種多様な時点で、潜在的な検定の多重性を考慮しなければいけない案件です
・結果報告は任意なので、本当の実験であっても良い結果のみを恣意的に公表できる(=信頼されにくい)環境ということを認識しましょう

**名無し名人** (ﾜｯﾁｮｲ 32e7-53i4) · 2018/07/28(土) 09:27:36.40

>>663
EXCELでシミュレーションしたところ勝率０．５だと
おっしゃる通りだけど、勝率０．７でやると下記の
確率分布に従うよｗ

10局 7勝 3敗
勝率: 0.7
標準誤差: 0.15718104959867515
95% 信頼区間 [0.4, 0.9]　

10回戦単位で、勝ち数が4以下の出現数を調べました。

その作業を10回繰り返して負け越しの頻度は6回でした。
つまり勝率7割の棋士が10回戦毎に区切って負け越す
頻度は100回やって6回しかないということです！

勝ち 1 2 3 4 5 6 7 8 9 10
0 0 2 0 0 2 0 0 2 1

**名無し名人** (ﾜｯﾁｮｲ b293-SUwZ) · 2018/07/28(土) 09:36:04.63

Excelなんか使わなくても二項分布知ってれば一発なんだがこんな事も知らんのかな

**名無し名人** (ﾜｯﾁｮｲ 32e7-53i4) · 2018/07/28(土) 09:37:17.35

663の方がいいサジェスチョンをくれたのでエクセルでシミュレーションした
ら勝率7割と勝率8割では段違いに結果が違ってくるのが分かった。

藤井聡太君がこのまま勝率8割を維持できたらとんでもない結果が生じる
と思います。

勝率8割だと10連勝が良く出現しますｗ

**名無し名人** (ﾜｯﾁｮｲ 32e7-53i4) · 2018/07/28(土) 09:40:06.76

>>669
何が一発なんでしょうか？

負け越しの確率を一発で計算できるということですか？

**名無し名人** (ｱｳｱｳｶｰ Saef-H5nH) · 2018/07/28(土) 10:28:38.90

>>668
あんたは帰無仮説を理解ができていないんだなってのがよくわかった
実際には真の勝率は未知であり、試行を繰り返して得られるのはその推定値でしかない
その推定値の信頼性を定量化するのがt値等であって、
真の勝率が7割であると「わかっている」時、負け越す確率が何%かなんてのは意味がないんだよ

**名無し名人** (ﾜｯﾁｮｲ deac-53i4) · 2018/07/28(土) 10:39:12.59

10局とかで書き込むなよ。17時間ならすぐだろ。
それがつらいなら持ち時間減らせばいいし、もっといいPC買ってスレッド数増やせ。
計算能力が2倍になれば同じ計算は半分の時間で済む。

**名無し名人** (ﾜｯﾁｮｲ d69f-y25S) · 2018/07/28(土) 11:20:41.49

>>672
その考え方にたどり着く一歩ではあるのでは。

１０戦して７勝３敗だったとき、
真の勝率が１割、２割、……９割のソフトが
運良くまたは運悪くその結果になった
可能性があって、
７勝３敗はその重ね合わせを見ているとも言える。

ただ１割２割のソフトがめっちゃ運良くその結果を出すと言うことは滅多にないとは言えるだろうと。

しかし勝率４割のソフトが７勝３敗を気合いで出してくるのは少なからずあり得て、
７勝３敗はその結果をみている可能性が少なくなく、である以上はどっちが強いかわからんと。

**名無し名人** (ｱｳｱｳｶｰ Saef-aUZH) · 2018/07/28(土) 11:35:04.08

勝率2割が7-3は稀によくある
計測は自由にしたらいいじゃない。それをどう判断するかは人それぞれ

**名無し名人** (ﾜｯﾁｮｲ 3761-weGb) · 2018/07/28(土) 11:58:42.64

キメラが乱立した去年でも10戦で優劣つけようとした人なんて居なかったのに

**名無し名人** (ｵｯﾍﾟｹ Sr47-qs9D) · 2018/07/28(土) 12:30:46.33

ってかさ、1000局やっても定跡オフでランダムでも無い場合結構同一局面多いのでは？

**名無し名人** (ﾜｯﾁｮｲ deac-53i4) · 2018/07/28(土) 12:45:03.64

定跡オフでの検証は時代の流れに左右されない一つの答えだけどねぇ
ある時点のあるソフトで作成した定跡・互角局面集は本当に互角かという話になる

**名無し名人** (ﾜｯﾁｮｲ d275-weGb) · 2018/07/28(土) 12:55:14.44

定跡なしだと戦型はかなり固定されるのは事実だけど
全く同じ勝ちパターンを繰り返すってのは少ない印象

**名無し名人** (ﾜｯﾁｮｲ d275-weGb) · 2018/07/28(土) 13:02:11.16

むしろfloodgateの技巧２の定跡なんかの方が同一パターンの負けを繰り返しているのをよく見かけるから
あれなんとかしてほしい

**名無し名人** (ﾜｯﾁｮｲ c2e0-Q7PE) · 2018/07/28(土) 13:19:54.84

>>680
なんで検証の話してる時にfloodgateのgikou2_1cの話をしているの？

**名無し名人** (ﾜｯﾁｮｲ deac-53i4) · 2018/07/28(土) 13:52:12.70

下手な定跡つかってそれにハマり形含まれてたら嫌ということでは

**名無し名人** (ﾜｯﾁｮｲ 92af-53i4) · 2018/07/28(土) 14:27:06.24

ハマることもあるけど、
数を重ねれば基本的には定跡でトータルの勝率は上がってるイメージだけどね

**名無し名人** (ﾜｯﾁｮｲ c27e-3ouB) · 2018/07/28(土) 15:27:47.79

100局セットして50戦目まで33勝14敗3分だったソフトが100戦後には49勝45敗6分だったことがある
そのソフトは後半に9連敗と5連敗を経験していた
前半50戦で見れば勝率70%だが後半50戦では勝率30%だ
10戦やって9-1だったソフトが100戦後には有意差なしなんてこともままある

あと17時間でできる連続対局はまだ可愛いほうだろ
寝る前にセットして仕事から戻ってきたときには終わってる

**名無し名人** (ﾜｯﾁｮｲ 32e7-53i4) · 2018/07/28(土) 15:42:16.08

>>684
ホントに100局対決したくなるようなソフトの力量さ
がない時点ではその場で判断できる局数で十分と考える方が普通だよ。
普通のノートパソコンで連続対局してるとその間他のこと出来なくなるから。

そしてこれまで10局ぐらいで新しく出てきたソフトの強弱はすべてあたってたからねｗ

**名無し名人** (ﾜｯﾁｮｲ 4b8a-kTp/) · 2018/07/28(土) 15:55:05.73

他の事に使えないと困るのは、あなたの都合にすぎない。ただの言い訳。
その言い訳つけて、いい加減に計測した結果を得意げに語られても、
統計的には全く信用できないし、それに引っ張られて判断誤る事になる。

ただの自己満足で、他人に迷惑かけるなって事言われてるの、わかってる？

**名無し名人** (ﾜｯﾁｮｲ 3761-kCGC) · 2018/07/28(土) 15:57:25.10

統計を根本からわかってない人はいるんだよなあ

**名無し名人** (ﾜｯﾁｮｲ 5e8f-53i4) · 2018/07/28(土) 16:02:35.39

春も秋も一発勝負
そして強いソフトは一発勝負でもやはり結果を出していることが多い

細かいところはともかく１０局でだいたいわかるというのはあながち的外れじゃないかもね
１６年のポナ、１７年elmo、１８年pal,白ビールちょくちょく落としてはいたが全体的に強かった

**名無し名人** (ｱｳｰｲﾓ MM43-8Ssp) · 2018/07/28(土) 16:12:17.69

>>688
河童がレート高いのに順位振るわないことが多いぞ

**名無し名人** (ｱｳｱｳｳｰ Sa43-53i4) · 2018/07/28(土) 16:16:00.17

そんなに必死に否定しなくても
10局検証した人には「あっそ」
100局検証した人には「へー、そうなんだ」
500局検証した人には「マジかー、そうなると今度はアレvsアレもやってみるといいかも。俺はこっちを検証してみる」
みたいなレスをやってたら自然と淘汰されるだろう

**名無し名人** (ｻｻｸｯﾃﾛ Sp47-2ONs) · 2018/07/28(土) 16:21:31.87

>>690の言う通りで10局でどうのって人に真面目に返さなくていいと思うけど
ふーん、じゃあそのまま100局くらいやってねってなふうに

**名無し名人** (ﾜｯﾁｮｲ 2346-ILTU) · 2018/07/28(土) 16:26:13.04

10局の検証だってないよりはマシだしな
淘汰するより利用してやれ

**名無し名人** (ﾜｯﾁｮｲ d2b3-J6FL) · 2018/07/28(土) 16:30:02.15

>>689
河童はuuun氏基準の1500万ノードでは強いが、競技会では一手数億ノードも上がったりするので、
河童絞りが他の参加ソフトより高ノード(長時間)でやや弱いから順位が振るわないってことはないのかな
同じelmo絞りでも1500万ノード基準で検証している人と(河童さんがいくらのノード数で検証しているかは知らないが)、
elmoの瀧澤さんのように一手20秒(去年のTwitterで見た)で検証している人の差が出ているのかも

**名無し名人** (ﾜｯﾁｮｲ 4b8a-kTp/) · 2018/07/28(土) 16:42:56.06

条件がそろっていない１０局を幾ら集めても意味なし。

**名無し名人** (ｻｻｸｯﾃﾛ Sp47-2ONs) · 2018/07/28(土) 16:48:18.11

>>693
そういうことなんじゃないかな
あとは後手番引きすぎなのがね・・・

**名無し名人** (ﾜｯﾁｮｲ 3761-weGb) · 2018/07/28(土) 17:02:07.28

>>693
WCSC後にQhapaqの人も「河童絞りは長時間だと強くないのでは」と疑問抱いたけど
「長時間計測だと対河童系が一番結果悪かった」って白ビールの人がいってたから長時間弱い説は否定された

**名無し名人** (ﾜｯﾁｮｲ d2b3-J6FL) · 2018/07/28(土) 17:08:07.72

>>696
評価関数は相性問題があるので白ビールだけだと単に河童との相性が悪かっただけの可能性は否定できないんじゃないのかな
3つ４つの他のソフトとの検証がないと河童が本当に長時間も強いとは言えないんじゃないだろうか

**名無し名人** (ｱｳｰｲﾓ MM43-8Ssp) · 2018/07/28(土) 17:13:26.54

>>697
白ビールのチームは評価関数いくつも用意してたみたいだし、相性問題についても問題なさそうでは

**名無し名人** (ﾜｯﾁｮｲ deac-53i4) · 2018/07/28(土) 17:16:13.43

感覚的には「一発勝負の大会で成績振るわないから」を根拠に推論する方が筋悪く思う

**名無し名人** (ﾜｯﾁｮｲ 92af-53i4) · 2018/07/28(土) 17:17:27.04

>>693
それは有り得るね
昔、技巧2とか魔女の時代の頃、1手5秒10秒の対局アホみたいにやってたことあるけど、
uuunさんのところどころか、自分でやってた1手1秒の結果とはかなり違くて、
（R差が違うくらいじゃなくて、100差くらいだと逆転してたりもする）
結局、自分で計測すること自体やめたｗ

あと河童さんは大会だと定跡段階でやられたりしてた気がする

**名無し名人** (ﾜｯﾁｮｲ 3761-weGb) · 2018/07/28(土) 18:33:44.56

河童絞りは億単位のノードでも強い

https://twitter.com/uuunuuun1/status/948885553470042112
https://twitter.com/Rota_JP/status/945627242855407616
https://twitter.com/bleu48/status/993334360756502529

**名無し名人** (ﾜｯﾁｮｲ 32e7-53i4) · 2018/07/28(土) 19:18:05.73

なんでそんなに偉そうなこと言うのか理解できない。
コンピュータソフトのどれが一番強いのかを議論しているわけだから
10戦ぐらいで結論づけてまちがっているのなら他の人が逆の結果を
出せばいいことだけじゃないか。結局今回のillqha1.1は、ここで公開して
すぐに検証した結果強そうな結果が出たから最終的には
「uuunuuun」氏は採用せざるを得なくなったわけです。当初は素性の知れぬ
物は無視していましたがこのスレで次々と対戦実績が出てきたので無視
できなくなったんじゃないかな？
＝＝＝
686 名前：名無し名人 (ﾜｯﾁｮｲ 4b8a-kTp/)[sage] 投稿日：2018/07/28(土) 15:55:05.73 ID:JzHAJahw0 [1/2]
他の事に使えないと困るのは、あなたの都合にすぎない。ただの言い訳。
その言い訳つけて、いい加減に計測した結果を得意げに語られても、
統計的には全く信用できないし、それに引っ張られて判断誤る事になる。

ただの自己満足で、他人に迷惑かけるなって事言われてるの、わかってる？

⇒何が迷惑なのかさっぱりわからんｗ

687 名前：名無し名人 (ﾜｯﾁｮｲ 3761-kCGC)[sage] 投稿日：2018/07/28(土) 15:57:25.10 ID:xpwC+5oz0
統計を根本からわかってない人はいるんだよなあ

⇒統計を根本から分かってたらどういう判断になるんですか？
　すべて統計的にはデータ量が不足しているので判断はできませんですってか？
　つまんないやつだな！

**名無し名人** (ﾜｯﾁｮｲ 3761-weGb) · 2018/07/28(土) 19:40:45.55

キメラ乱立した時に対して強くないソフトが強いとされた時期があった
10局で判断できるというあなたの経験則よりもコンピュータ将棋の歴史と数学を大事にしたい

**名無し名人** (ﾜｯﾁｮｲ d275-weGb) · 2018/07/28(土) 19:55:45.46

もしもＸ手までまったく同じ棋譜があったらその棋譜はまとめて一つ扱いにするってのはあってもいいかな
Ｘをいくつにするかはどれくらい同一棋譜があるのか調査して決めて

**名無し名人** (ﾜｯﾁｮｲ c27e-3ouB) · 2018/07/28(土) 19:56:45.83

この雰囲気は中高生かな？

**名無し名人** (ﾜｯﾁｮｲ 3761-kCGC) · 2018/07/28(土) 19:56:53.81

グダグダ長文考えてる間に一手一秒でも100局回したほうが
話を聞いてもらえるだろうなあ

**名無し名人** (ﾜｯﾁｮｲ deac-53i4) · 2018/07/28(土) 20:03:31.83

10局で大丈夫みたいな学術的な理解とかけ離れた事言ってるもんだから
みんな自然と口調が偉そうになってしまうのよ

**名無し名人** (ｻｻｸｯﾃﾛﾙ Sp47-h18z) · 2018/07/28(土) 20:12:37.23

単純に公開した作者の立場に立てば良いのでは
10局では有難うございますレベルかな
数百局以上なら作者もそれなりに参考出来ると思う

**名無し名人** (ﾜｯﾁｮｲ 9223-53i4) · 2018/07/28(土) 20:13:52.97

恣意的に抽出した10局出されたりしたら無意味だしな
10局評価とかスルー安定

**名無し名人** (ﾜｯﾁｮｲ 32e7-53i4) · 2018/07/28(土) 20:15:37.48

>>706
ホントにこんなものいいしか言えないやつが多すぎていやになる。
少しはリアルな世界と同じような会話をできないのかね？

偉そうな話しぶりにはうんざりする。

なんだかハンドル握ると人格変わるようでがっかりです。
将棋のスレッドぐらいは普通のレスをしてほしいもんだ。

＝＝＝＝＝＝＝＝

706 名前：名無し名人 (ﾜｯﾁｮｲ 3761-kCGC)[sage] 投稿日：2018/07/28(土) 19:56:53.81 ID:xpwC+5oz0 [2/2]
グダグダ長文考えてる間に一手一秒でも100局回したほうが
話を聞いてもらえるだろうなあ

⇒　対戦数を1000回して結果に有意があるとか言いたい人だけが頑張って
　　　回したらどうですか？　普通の人はそこまで一生懸命にはならないですよ。

**名無し名人** (ﾜｯﾁｮｲ f2ab-H5nH) · 2018/07/28(土) 20:18:35.29

もうちょっとお勉強してから書き込んでは如何？

**名無し名人** (ﾜｯﾁｮｲ 12eb-sJpK) · 2018/07/28(土) 20:24:15.63

夏休みだろうし統計についてお勉強する良い機会やな
これでも読むと良いよ
http://lfics81.techblog.jp/archives/2982884.html

**名無し名人** (ﾜｯﾁｮｲ d69f-y25S) · 2018/07/28(土) 20:25:12.60

>>688
大会では解説聞きながら１手１手見るやん。
するとレーティングで200くらい差がある対局だと、
なんか手応えや力の差が見えてくることがあるやん。

そういう場合は、極端な話、１局でも見えるものがあると思うよ。

**名無し名人** (ﾜｯﾁｮｲ 9f7f-tjON) · 2018/07/28(土) 20:27:00.53

>>709
と言うかそれ目的でやってるんだと思ったわ
持ち上げたいソフトのいいとこ切り取ってやってるもんだと
そしたらまさか本気で１０局で足りると主張してくるとは

**名無し名人** (ﾜｯﾁｮｲ c27e-3ouB) · 2018/07/28(土) 20:29:42.04

>>710
ここには異常な人しかいないんですよ(将棋ソフトにおいて)

マナーとは共通意識のもとで成り立ちます
10局では少ないという意見が多いなら、それがこのスレ上のマナーです
10局で十分というのはあなたの主観でしかなく、集団上その意見に価値はありません
10局で十分だと言うのはあなたの勝手ですが、それに対する批判は受け止めるべきです

**名無し名人** (ﾜｯﾁｮｲ 4b8a-kTp/) · 2018/07/28(土) 20:30:01.89

俺の家族がみんなでこの番組見たから視聴率１００％（ｷﾘｯ

って感じなのわかってるのかね。

**名無し名人** (ﾜｯﾁｮｲ d275-weGb) · 2018/07/28(土) 20:31:19.11

長時間の１０局なら意味あると思うよ
棋譜の価値としての

**名無し名人** (ﾜｯﾁｮｲ 722e-h18z) · 2018/07/28(土) 20:34:56.63

結局大会は人がやる対局を模したものだからPCソフト大会としては不完全なんだろう
そう言う意味では公開されたソフトのレート順位の方が実力に近いのだろう

**名無し名人** (ﾜｯﾁｮｲ c2e0-Q7PE) · 2018/07/28(土) 20:36:00.32

SDT6は皆NNUE？
KPPTでQQRより強い評価関数出てこないかなｰ(ﾁﾗｯ)

**名無し名人** (ﾜｯﾁｮｲ d69f-y25S) · 2018/07/28(土) 20:42:32.08

>>710
確率の（独立）事象ってのはランダムで、
ランダムってのは試行回数が少ないとしばしば偏る。

偏らずに均等に結果がでるようなのは
むしろランダムでなく作意がある。
６回に１回だけ６が必ずでるサイコロは、
バランス良いイカサマ賽。

宇宙の星はランダムに配置されている…天の川を除き…といっていいだろうが、
格子点のように均等配置はされていない。
偏って変に配置されるから、我々はそれを星座と認識できる。

かように、ランダムはしばしば偏るという確信があるから、
１０回程度で偏った結果を見せられても、
意味のないランダムの偏りなのか、
真の勝率に差がある意味がある偏りなのか、さっぱり、まったく判断つかない。

**名無し名人** (ｱｰｸｾｰ Sx47-2QVD) · 2018/07/28(土) 21:01:09.86

高卒のバカにそんなことわかるわけないだろ

**名無し名人** (ﾜｯﾁｮｲ 27b3-kyvO) · 2018/07/28(土) 21:03:39.79

ttp://lfics81.techblog.jp/confidence_interval_ja.html

少ない対局数のとき、どのくらい幅があるのか一目でわかるので使ってみるといいかと

**名無し名人** (ﾜｯﾁｮｲ 32e7-53i4) · 2018/07/28(土) 21:20:47.81

>>712
この数式みて理解できたの？
そこまで数学専攻したとも思えないね。
なんでそんなにえらそうなのかね？？？

俺にとっては下記のURLのほうが統計学の読みものとしては
よくわかって興味深いものがあるよ。
https://shogi100.com/2018/02/23/012/

「デビューから」という条件を緩和してみます。比較対象として、２０１８年２月２１日現在、
羽生竜王の通算対局数は１９６２局、勝率71.17％です。この成績をもってしても、
「羽生竜王と同じ勝率の棋士が同じ対局数を戦い、どこかのタイミングで２９連勝以上
する確率」は9.6％しかありません。羽生竜王の実際の連勝記録は２２連勝です。
対象を全棋士に広げると、棋士数を３１２（新四段の古森四段の棋士番号）、
通算対局数を７３０局（全棋士平均）、期待勝率を平均50％及び標準偏差10％だと
仮定すると、「全棋士の中の誰かが、どこかのタイミングで２９連勝以上する確率」は
約70％です。
さすがに「全棋士の誰か」が「いつか」２９連勝を達成していた確率を考えると、統計学的には実現していてもおかしくはない記録、ということになるようです。やはり真の凄さは「デビューから」という点に集約されますね。

**名無し名人** (ﾜｯﾁｮｲ 3761-kCGC) · 2018/07/28(土) 21:44:29.91

知識不足を指摘され教えてもらっても自分のプライドを守ることにのみ必死な人はどの分野にもいる。
相手しても無駄なんことも明白なので程々に。

**名無し名人** (ﾜｯﾁｮｲ 03b6-x//5) · 2018/07/28(土) 21:59:32.89

統計がどうのって意見してる人で、
「はい、これが統計的に誰もが認めるものだよ」って、
具体的にサンプルを挙げている人がいないね。
建設的な意見をだしましょうよ。
ただくさしてるだけの「能書きは不要」です。
素人の私からしたら、10局だけだろうと、
具体的な物を出してる人の方が参考になるけどなぁ。

**名無し名人** (ﾜｯﾁｮｲ 27b3-kyvO) · 2018/07/28(土) 22:15:58.21

少ないノード数の計測でもこんな感じでデータを出せば多くの人が満足するんじゃないかと

対局数：500局
例A勝ち：293
例B勝ち：207
引分け：0

勝率: 0.586
標準誤差: 0.02206055312117165
99% 信頼区間 [0.53, 0.642]

相対イロレーティング: 60.35890995887666
標準誤差: 15.796568050416983
99% 信頼区間 [20.87120466602866, 101.46080056999158]

**名無し名人** (ﾜｯﾁｮｲ 1edc-2QVD) · 2018/07/28(土) 22:25:05.04

ここでの検証結果なんか10局であろうが1000局であろうがいくらでも盛れるんだから、信頼性はないと思うけどなぁ。
結局は自分でやるか、信頼に値する人がやった検証しか当てにならない。

**名無し名人** (ﾜｯﾁｮｲ 722e-h18z) · 2018/07/28(土) 22:30:42.13

>>726
例えば数十万の少ないノード数で対局数を稼ぐのは簡単だけど、ノード数が少ないと実際の強さと乖離があると言うので、あるレベルのノード数はいるよねと言うのが今の所かな

**名無し名人** (ﾜｯﾁｮｲ deac-53i4) · 2018/07/28(土) 22:33:39.99

素人がこのスレを見る必要あるのか
有名なソフトを使っておけば十分ではないのか

検証不十分なソフト同士の対局というマニアックな分野にわざわざ飛び込もうってんだから
ちょっとした数学知識くらい持ち合わせてほしいところ

**名無し名人** (ｵｯﾍﾟｹ Sr47-qs9D) · 2018/07/28(土) 22:40:27.24

>>705
失礼な
まだそんな年齢じゃないわ

**名無し名人** (ﾜｯﾁｮｲ d3c1-o5LP) · 2018/07/28(土) 22:55:33.30

自分の不得手な分野に突っ込んでいってこれだけツッコミのレスをもらったにもかかわらず
一向に自分の間違いを認めようとしないその姿勢はすごいと思う

**名無し名人** (ﾜｯﾁｮｲ 4b8a-kTp/) · 2018/07/28(土) 23:04:31.97

「いいね」がもらえると思ったら、ダメ出しされた。
なぜダメなのか理解できないし、ヒント貰っても理解に努めようともしない。

こういう人という事でしょ。

**名無し名人** (ﾜｯﾁｮｲ 6f5d-53i4) · 2018/07/28(土) 23:47:25.59

ここまで自己正当化が凄い人も珍しいな
それはそれで尊敬する。迷惑だけどｗ

**名無し名人** (ﾜｯﾁｮｲ e39d-53i4) · 2018/07/28(土) 23:56:17.41

えびふらいさんが久々に放送するみたいだけど、
最近彼は何か進展あったの？

**名無し名人** (ﾜｯﾁｮｲ c2e0-Q7PE) · 2018/07/29(日) 00:04:19.88

NNUEの計測ってPCがヤバそう(小学生並みの感想)
KPPTでQQRより強い評価関数出てこないかなｰ(ﾁﾗｯ)

**名無し名人** (ﾜｯﾁｮｲ 5fb3-KjeW) · 2018/07/29(日) 05:22:46.01

>>669
コンビネーションを暗算できるとか天才かな？
ホラ吹き乙

**名無し名人** (ﾜｯﾁｮｲ 03b6-x//5) · 2018/07/29(日) 06:25:06.28

>>726
だから、そんな感じなのはいいんだけど、
「具体的なデータ」じゃないですよね？それは。

あなたの意見よりも10局でも「具体的なデータ」の方が
建設的な意見だと言ってるんですが、
ここ最近で具体的なデータを挙げている人は、
１０局の人と２０局の人の二人だけじゃない？

さんざんくさされてるけど、私にとってはその二人の意見の方が
参考になります。
ありがとうございます。頑張ってくださいっていえないのかなぁ？

**名無し名人** (ｻｻｸｯﾃﾛ Sp47-2ONs) · 2018/07/29(日) 07:01:45.04

定期的に変なの湧くけどこの前のときも学生の夏休み時期だったような

**名無し名人** (ﾜｯﾁｮｲ e3a7-kIix) · 2018/07/29(日) 07:59:09.11

人が戻るまでスルーするしかないね

**名無し名人** (ﾜｯﾁｮｲ f2ab-H5nH) · 2018/07/29(日) 08:35:37.51

>>737
「コインを10回投げて7回表でした。経験則的に表が出やすいに違いない」
「7割表が出るコインなら、10回投げて裏が多い確率は6%しかないから検証は10回投げるだけで十分」
「コイン10回投げたデータは有意義。この結果を暫定的に採用して俺に感謝しろ」

頭悪すぎちゃう？

**名無し名人** (ﾜｯﾁｮｲ b293-SUwZ) · 2018/07/29(日) 08:55:48.63

>>712
初めて見たけど
単純に勝率pを確率変数とした確率分布から信頼区間出してるのかと思った

**名無し名人** (ﾜｯﾁｮｲ 6f81-53i4) · 2018/07/29(日) 09:40:14.58

やねうら王 NNUE型評価関数ビルド V4.82公開しました
投稿日時: 2018年7月29日

ｷﾀ――(ﾟ∀ﾟ)――!!

**名無し名人** (ﾜｯﾁｮｲ f3d2-TPJ3) · 2018/07/29(日) 10:00:51.23

やねうら王は従来のものを形式変換しただけでしょ？

えびふらい放送は仕事してて放送しなかったので近況報告のようなものでしょ

**名無し名人** (ﾜｯﾁｮｲ 32e7-53i4) · 2018/07/29(日) 10:10:05.44

>>740
あたまわるいのはあなたじゃない？
コインで例えるのが間違ってると思わないの？

コインの表裏の確率に偏りがあるとはだれも考えないし証明もできないでしょ。
だから確率０．５で10回投げてもその結果は二項分布の離散確率分布に従った
結果しか出てこないと思った方がいいんじゃないの？

**名無し名人** (ﾜｯﾁｮｲ 7feb-3ouB) · 2018/07/29(日) 10:17:37.63

コンピュータ将棋に関係ないことは他でやってくれないかな
頭が悪いと思うならその相手はスルーするのが大人なんだがな
ガキばっかになっちまったな

**名無し名人** (ｻｻｸｯﾃﾛ Sp47-2ONs) · 2018/07/29(日) 10:23:26.16

>>742
T.N.K.がそもそもYO4.82を改造して使って、それを少し変えてマージしただけじゃなかったっけ？

**名無し名人** (ﾜｯﾁｮｲ c2e0-Q7PE) · 2018/07/29(日) 10:30:57.52

無償で公開されたものに悪口言う奴らにはやねさんがゲンコツや！

**名無し名人** (ﾜｯﾁｮｲ f2ab-H5nH) · 2018/07/29(日) 10:37:23.56

>>744
誰もコインに偏りがあるとは考えないからこそコインで例えてるんだろ？何言ってんだお前
真の勝率がコインと同じように差はないかもしれないのに、それを勝率7割あればほぼ勝ち越すから10回で十分と言い張るのは、
コイン10回投げて7回表が出たから表が出やすいという馬鹿馬鹿しい主張とかわらん

あと非理想的なコインの偏りは統計的な答えを出せるし、
二項分布はp0.5に限った話じゃないので意味不明

**名無し名人** (ｽｯﾌﾟ Sd52-Ci51) · 2018/07/29(日) 10:42:15.63

俺素人だけど、 (ﾜｯﾁｮｲ 32e7-53i4) の言ってることは間違ってると思う。
過去スレにもいたけど、やねうらエンジンの比較で自己対戦して10局で充分とか言ってる奴いたけど、コイツと同一人物だったんだなって思った。