X



トップページ将棋・チェス
1002コメント365KB
▲コンピュータ将棋スレッド125
■ このスレッドは過去ログ倉庫に格納されています
0001名無し名人 (ワッチョイ 6672-Q7KS)
垢版 |
2017/10/19(木) 18:08:55.48ID:cFRAuRVL0
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512
叡王戦公式HP
http://www.eiou.jp/
第27回世界コンピュータ将棋選手権 参加チーム
http://www2.computer-shogi.org/wcsc27/team.html
詰将棋メモ コンピュータ将棋2017
http://toybox.tea-nifty.com/memo/2017/01/post-965e.html
世界コンピュータ将棋選手権参加ソフトリンク集
http://www.ne.jp/asahi/tetsu/toybox/soft/softlink.htm
floodgate 最新2週間レーティング
http://wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html
コンピュータ将棋協会
http://www.computer-shogi.org/
コンピュータ将棋
http://ja.wikipedia.org/wiki/%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E5%B0%86%E6%A3%8B
将棋フリーソフト rating on single machines(各ソフトのレーティング評価)
http://uuunuuun.wix.com/shogi-engines

前スレ
▲コンピュータ将棋スレッド124 [無断転載禁止]c2ch.net
https://mevius.5ch.net/test/read.cgi/bgame/1505704966/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured 👀
Rock54: Caution(BBR-MD5:0be15ced7fbdb9fdb4d0ce1929c1b82f)
0554名無し名人 (ワッチョイ 01f2-nE1B)
垢版 |
2017/10/29(日) 10:44:35.18ID:aTeJouib0
>>553
70%ってことはレート150くらいの差。
流石にrelmoにそこまで勝てない気がする
。手元のR表だと自ソフト2とrelmoの現R差159だけど、
直接対局だけではないので。
良くて対relmoは65%かな(予測)
時間ある時やってみます。
0555名無し名人 (アークセー Sx9d-7D0c)
垢版 |
2017/10/29(日) 10:48:46.16ID:ZRZxoq3Dx
信頼区間をつけないと相性とか7割とか言っても全く信用できない
0556名無し名人 (ワッチョイ 530f-nu9H)
垢版 |
2017/10/29(日) 10:55:57.93ID:NStkvD7d0
今月の数学セミナー、コンピュータ将棋・囲碁特集で、
Ponanzaの開発経緯とか数学的背景、千田の記事とか載ってるよ
0557名無し名人 (ワッチョイ ebc7-20SA)
垢版 |
2017/10/29(日) 11:02:02.88ID:0StAnWjY0
やっぱりそんなに甘くないよな
手軽な遊びだから、一時期夢中になってブリードしまくってたけど、
yaselmoより有意に強くなってるで!って思ったら、
技巧2に全然勝率上がらないとかよくある
0558名無し名人 (ワッチョイ 01f2-nE1B)
垢版 |
2017/10/29(日) 11:24:29.66ID:aTeJouib0
>>557
特定のソフトとの多対局-対戦成績からのレート計測がほぼ無意味と思ってる。
(開発者の方の強さ測定には必要だろうけど)
勿論それなりに正確なこともあるが
必ず557さんのようなことになる。
信頼区間?単なる趣味にそこまでしないよ

信用しなくてけっこうよ、公開はしないんだから ご自由に発言して。
ここおもしろいね すぐ「信用できない」 (笑)
0559名無し名人 (ワッチョイ 69ed-ORd8)
垢版 |
2017/10/29(日) 11:43:05.32ID:aJVcx+Yj0
連続対局回してて7割位勝ってる!と喜んで床について、
朝起きたら100局で五分五分だった、というのが今日もあった・・
0561名無し名人 (ワッチョイ 13bd-01LR)
垢版 |
2017/10/29(日) 11:54:37.60ID:javsP9ut0
>>559
ちゃんと観測していないからだろ;
自己対戦中もOSがバックグラウンドでやるI/O処理やら
推奨振動子のジッタやらでソフトはPC外部からの量子論的干渉を受け続けているんじゃ
0562名無し名人 (ワッチョイ 01f2-nE1B)
垢版 |
2017/10/29(日) 11:56:19.67ID:aTeJouib0
>>559
1手の秒数に限らず100局はやらないとダメかもですね。
本当に強いソフトに関しては最低100局までやってみようかな。
けど、それ以上はソフトを公開する方ならともかく必要ないかと。
自分のソフト1も2もそこそこ強いのに少なからずバグあるので・・・
こうやって測定して遊ぶ 悪趣味。
やねさんが最強で間違いない。
0563名無し名人 (ワッチョイ 69ed-ORd8)
垢版 |
2017/10/29(日) 12:37:55.24ID:aJVcx+Yj0
>>560
>>561
>>562
100局やると大体の誤差は5%前後以内くらいにはなるかなーと
95%信頼区間は前後10%だけど
80%信頼区間は前後5%くらい
5%以上は強くないとあんまり強くなった気がしないし、
100局で五分五分なら強くないと判断できる
5%未満を追い求めるなら別だし、グラフ見てイケそうと思うんなら追試も可能だし
0564名無し名人 (ワッチョイ 6b9f-MEJo)
垢版 |
2017/10/29(日) 13:38:45.41ID:YTFmbONP0
>>548
お前がな
0565名無し名人 (ワッチョイ 6b9f-MEJo)
垢版 |
2017/10/29(日) 13:44:48.05ID:YTFmbONP0
>>558
「信用できない」は、お前さんが嘘を言ってるという意味じゃないよ。

ランダムの偏りにあまりに無防備な報告者が多いからね。

ランダムの定義からすると逆説的だが、偏らないことが保証されてるのはランダムではない。
サイコロは6回ごとに必ず6がでたりはしない。
0567名無し名人 (スッップ Sd33-xXVv)
垢版 |
2017/10/29(日) 13:53:51.58ID:spxYz0jmd
>>558
信用できないはまさに565が言った通りで、嘘をついてるとかじゃなくて
単なる偶然や勘違いとの区別がつかないって意味な
0568名無し名人 (ワッチョイ 01f2-nE1B)
垢版 |
2017/10/29(日) 14:10:14.83ID:aTeJouib0
あれれ 人間のtopプロがタイトル戦七番(先に4勝)で決着つけて信頼区間の話にはならないよね。
対 tamore 勝っても負けても載せるつもりだったけど、今のところ勝ってしまってるだけ。
なんでソフトだと結果に厳しく言われんのかな?別に公開(今後更に強いのできても)もしないし、
こっちが強いとは一言もいってない。今 tamoreに勝ち越せるソフトってどのくらいあるのかな。
0570名無し名人 (ワッチョイ 01f2-nE1B)
垢版 |
2017/10/29(日) 14:28:42.50ID:aTeJouib0
ここに対局結果掲載したのが馬鹿だったんでとりあえずやめます。
対局の結果は偶然や大勘違いでした。 お騒がせしました。
0571名無し名人 (ワッチョイ 9b1b-tN/E)
垢版 |
2017/10/29(日) 14:28:57.84ID:tLUVlUJd0
ご自慢のソフト(キメラしただけ)を公開しないって言ってるなら
ここで結果を言っても誰も何も思わないのにw
せめて棋譜でも貼ればいいのに承認欲求の塊で草
0572名無し名人 (ワッチョイ 9bdc-xXVv)
垢版 |
2017/10/29(日) 14:32:33.35ID:XFOF12MU0
まぁ、大人げなかった気もしないでもないな。
さらっと承認欲求を満たしてあげても別に何も困らないからそうしてあげてもよかったなw
0574名無し名人 (ワッチョイ 01f2-nE1B)
垢版 |
2017/10/29(日) 14:53:46.37ID:aTeJouib0
棋譜はらねーよボケ
0576名無し名人 (ワッチョイ 9bdc-xXVv)
垢版 |
2017/10/29(日) 14:57:58.26ID:XFOF12MU0
まぁ、キメラで承認欲求満たしたい人って少なからずいると思うんだよね。
uuuuuunさんあたりがキメラ大会開けばいいんでないかなぁと思ったりはする。
0580名無し名人 (スッップ Sd33-M8g6)
垢版 |
2017/10/29(日) 15:49:02.00ID:RT+g1B5Od
>>579
0585名無し名人 (ワッチョイ 891b-w1+s)
垢版 |
2017/10/29(日) 19:13:23.52ID:n9WOuQfu0
またソフトtamoreは羽生に負けてたぞ
49竜を悪手認定したのに
手を進めたら互角後手寄りになりやがった

これってソフトの欠陥なのかね?
0587名無し名人 (ワッチョイ 9bdc-xXVv)
垢版 |
2017/10/29(日) 19:24:20.22ID:XFOF12MU0
手を進めて評価が反転するところまで、49竜の局面で読ませたらどうなるの?
まぁ、枝狩りの関係でその深さまで読んだじゃ〜んってとこで評価値反転することはないことはないんだけど。
いっぺん限界まで深く読ませてみればよろし。
0588名無し名人 (ワッチョイ 9bdc-xXVv)
垢版 |
2017/10/29(日) 19:30:09.54ID:XFOF12MU0
5手進めてで10手読みで評価値の反転を検出したら、現局面からだと15手以上読みで評価値の反転が検出できてるか?ってことね。
0589名無し名人 (ワッチョイ 891b-20SA)
垢版 |
2017/10/29(日) 20:36:13.12ID:iYi1LiyS0
tamore評価値
https://i.imgur.com/3Org1JP.png

今日の竜王戦の80手目の羽生さんの49竜なんだけど
指されたときは候補の下の方で評価値が一気に800ぐらい下がって
竜王戦スレでも羽生さんの悪手とかファンタの大合唱だったんだが
今改めて40憶ノードぐらい読ませたら49竜が最善手になった
羽生さん凄すぎないか?
0592名無し名人 (ワッチョイ c99f-YJXN)
垢版 |
2017/10/29(日) 21:00:28.36ID:PydO+s6J0
そんなごくまれなケースを持ち出されてもな
羽生だけじゃなく、探せばそんなのたくさん見つかるだろ
そもそも評価値は絶対じゃないし
人間の感覚よりは大体強いってだけだ
一局指せばほぼコンピュータが勝つだろうが
0597名無し名人 (ワッチョイ 9bdc-xXVv)
垢版 |
2017/10/29(日) 21:26:44.54ID:XFOF12MU0
そもそも人間とコンピュータとでは「読み」の意味が少し違うから一概にどっちが優れてるとはいいづらい。
コンピュータはとにかく物量と数学、統計的理論で読むわけだけど、
人間は物量はコンピュータに劣るけど数学、統計的理論よりも優れた方法で効率的に読まなくてもいい局面を判断できるわけだ。
なので時と場合によって優劣が入れ替わるのは特に不思議じゃない。
ただ、コンピュータの物量が圧倒的なのと、最近評価関数の精度がどんどん上がってる、
つまり局面評価自体が人間よりもだいぶ優れてきてるから人間は勝ちにくくなってる。
0603名無し名人 (ワッチョイ 891b-2BLp)
垢版 |
2017/10/29(日) 21:47:04.47ID:n9WOuQfu0
>>602
まあ65桂でもよかったかも知れない
それに感想戦では65桂も読んでたみたい
重要なのは、ソフトは49竜を非常に低い評価値にしてたこと
65桂は最初から最善に出てたのに対して
49竜に関してはちゃんと読めてなかったこと
0604名無し名人 (ワッチョイ 9b1b-tN/E)
垢版 |
2017/10/29(日) 21:49:50.71ID:tLUVlUJd0
>>603
他に良い手があるんなら騒ぐほどじゃねえじゃん・・・
何かを上げるために下げる事でしか評価出来ないなら
一生踊らされるぞ
0606名無し名人 (ワッチョイ 9bdc-xXVv)
垢版 |
2017/10/29(日) 21:53:11.12ID:XFOF12MU0
ちなみに、今回の49竜みたいに深く読まないと間違う局面を効率よくたくさん(億単位)集める
方法があれば、それをつかってさらにソフトを強くできる可能性があるよ。
0608名無し名人 (ワッチョイ 1361-nu9H)
垢版 |
2017/10/29(日) 21:58:49.42ID:57fkqYv20
>>604
49龍だと先手玉にわかりづらい頓死筋が生じる
渡辺は49龍指されて長考を余儀なくさせた
実戦的にも(長時間読ませた)ソフト的にも最善手

>>606
去年の増田新人王の対局も後手玉が即詰みなのに長時間読ませないと先手敗勢だったからそういう局面結構ありそう
0610名無し名人 (ワッチョイ 9b1b-tN/E)
垢版 |
2017/10/29(日) 22:04:28.99ID:tLUVlUJd0
自分が読めてないのにソフト最善とかって・・・
65桂が悪手ならまだしも
ならyaselmoやmafuta2なら49龍が最善にすぐなるのか?
なんつうか踊らされてる奴はずかしいな
0611名無し名人 (ワッチョイ 13b3-Eec1)
垢版 |
2017/10/29(日) 22:06:06.05ID:x2WEhced0
>>589
まだこんなこと言ってる馬鹿がいるのかよw 救えない情弱、低脳。

もう羽生は、飛車落ちでも強豪ソフトに勝てないのにw
0615名無し名人 (ワッチョイ 1361-nu9H)
垢版 |
2017/10/29(日) 22:13:56.96ID:57fkqYv20
>>611
誰もソフトより羽生が優れてるなんて言ってないと思うが、文脈読めてるか?
>>589は長く読ませたソフトと羽生の手が一致して喜んでるただの羽生ファンボーイだろ

>>613
比較っていうのは実戦的にか、ソフトてきにかどっちの意味?
実戦的の意味なら>>608で書いたように渡辺に長考余儀なくさせたことが優れてる
ソフト的の意味なら長時間読ませた結果最善が49龍なんだから、"現時点でのソフト"では最善だろう
0617名無し名人 (ワッチョイ 137c-Eec1)
垢版 |
2017/10/29(日) 22:39:40.57ID:n2K6pvvm0
>>606
floodgateの頓死局面集や大逆転集を使った定跡で評価関数作ったりしたけどどうもいらない手まで読んで中盤までに差を付けられることが多いからそんなに単純な話じゃない
0618名無し名人 (ワッチョイ 6b9f-Ez76)
垢版 |
2017/10/29(日) 22:48:47.47ID:YTFmbONP0
>>606
詰め将棋ではしっこに玉方の桂馬が邪魔してるかどうかで
詰むか詰まないかが分かれるのがある。
そんな詰め将棋はなんぼでも作れる。
それを静的評価関数でもNNパターン認識でも検出するのは無理。

読まなきゃわからない問題は読まなきゃわからない。
0619名無し名人 (ワッチョイ 6b9f-Ez76)
垢版 |
2017/10/29(日) 22:54:58.93ID:YTFmbONP0
>>568
マジレスすると、人間の場合は再現実験で検証できんからな。
真の強さがどうあれ、タイトル戦で勝った方を、結果から強いと認定する。

まあ対局者同士には読み筋の交換等でどっちが強いか感覚でわかる場合が
大部分だろうが。
0620名無し名人 (ワッチョイ 9bdc-xXVv)
垢版 |
2017/10/29(日) 22:56:24.77ID:XFOF12MU0
>>617
どういうやり方でやったかはわからんけど、
そういう局面集が億単位で手に入ったとして、それを使って学習するなら
そうじゃない普通の局面も同じくらい用意してやらないときっと失敗するんじゃないかなぁっていう予想はなんとなく。
過学習しちゃうからね。

>>618
そういう考え方もあるだろうけど、そうじゃないかもしれない。
やってみなきゃわからんから可能性。
0621名無し名人 (ワッチョイ 137c-Eec1)
垢版 |
2017/10/29(日) 23:03:39.46ID:n2K6pvvm0
>>620
既に三駒関係では情報を収めきれないから微妙な違いを学習する前に上書きされてしまうのでは?
もっとリッチな評価関数じゃないと
0623名無し名人 (ワッチョイ 9bdc-xXVv)
垢版 |
2017/10/29(日) 23:06:23.77ID:XFOF12MU0
>>621
それも本当のところは「わからない」が正解だと思うんだよね。
去年から3駒に余力がないといわれてたけど、elmoの出現でそれが間違ってたことがわかった。
というか余力を測る方法があれば助かるんだけどねぇ。
0624名無し名人 (スッップ Sd33-s9Be)
垢版 |
2017/10/29(日) 23:10:56.27ID:+ElKdZIEd
>>615
こういう話はどうでもええわ
羽生さんのファンスレで悪手を指してないと主張するんならいいが・・・

言ってるように最終でソフトの評価が怪しい局面はある
んなことはみんな知ってるが、だから人間が勝てるわけじゃないし、ソフトのそういう局面の評価を改善させる方法についての提案なら有意義だ

あと、渡辺が長考したって前提が間違ってる
10分で指してる
0626名無し名人 (ワッチョイ 215d-nu9H)
垢版 |
2017/10/30(月) 01:02:22.25ID:R0rrevry0
検討とかで読み抜けが怖い場合は、MultiPV増やしてやろうね。
ソフトは探索効率を考えるので、49龍の筋を読むより別の筋を呼んだ方が総合的に有利と判断したらバッサリ切っちゃうから。
そういうのが嫌な時は、MultiPV=5とかで検討しよう。
勝率だけ考えたらMultiPV使わない方がいいというのが結論だけど、特定の一手を評価をするなら必須だと思う。
0627名無し名人 (ワッチョイ 93b3-nE1B)
垢版 |
2017/10/30(月) 01:57:03.86ID:9JCR7xyv0
ブレンドでtamoreとtamore_G,Kの両方に勝率54%以上になった人はいますか?自分は
片方だけなら簡単に出来たけど、両方は無理です。片方に強いのが出来ても、必ずもう
片方には負け越します。対局数は毎回400以上行いました。
0629名無し名人 (ワッチョイ 1b26-H4ak)
垢版 |
2017/10/30(月) 05:27:26.18ID:OvlS8jLT0
https://www.youtube.com/watch?v=imMngdPi91o

これみてもわかるとうりソフトだとまだまだ相当深くまで
読ませないと間違うこともまだまだ多いてことね

△49龍がちょいと読ませた程度なら悪手とでるがじつは
深くまで読ませると最善手だったとか

▲57銀じゃなくて▲56桂なら渡辺逆転かと思わせといて
じつは深く読んだら、普通に羽生が勝ってるとか


ソフトは相当深くまでよみこまないとまだまだ間違えることある
てことを忘れないほうがいいね。
0633名無し名人 (オッペケ Sr9d-w1+s)
垢版 |
2017/10/30(月) 09:14:42.18ID:OQOaVbN2r
以前の弱いソフトで判定された最善手や悪手と判定された手が今の最新のソフトでは結論が違うことはあるだろうね
もっと進化すればまた結論は変わるのかも知れないが
0635名無し名人 (ワッチョイ 41b3-2EVh)
垢版 |
2017/10/30(月) 12:09:46.70ID:7kDuusYN0
49龍は今後ソフトの性能を測る格好の局面として永遠に語り継がれるだろう
0637名無し名人 (ワッチョイ 11b3-20SA)
垢版 |
2017/10/30(月) 12:30:17.25ID:Rj1g9TA90
2八角は確かに打たないけど、2八角を金と交換して+300ぐらいの評価をする順を主に読んでいるから
飛車で馬をまる得する長期的な構想力(探索能力?)はまだまだ難しいみたいだ
ここで人間との差が出てくるかもしれない
0638名無し名人 (オッペケ Sr9d-MEJo)
垢版 |
2017/10/30(月) 12:35:49.56ID:zTod/dm6r
>>635
評価値は自玉の安全度と敵玉の安全度の二次元値であるべきだと
繰り返し提言してるんだが。
電王戦の誰ぞの評価値と分散というのも同じ趣旨か。

まあ、一次元の現状では、枝狩りを抑制して、とても広くとても深く読めば良いだけのこと。
すなわちメモリとCPUパワー。
Brute Force野蛮な力こそ正義!
0639名無し名人 (ワッチョイ 9bdc-xXVv)
垢版 |
2017/10/30(月) 12:46:28.31ID:kYvuIKgO0
>>638
2次元値をどう使って指し手を決めるのか?って気になるんだけど、そこんとこどうなの?
ただ加算、減算、比率での加算とかやるんであれば、
3駒に1段階要素をはさむだけで大して変わらない気がするんだけど。
NN風にいうなら、1層目3駒、2層目玉の安全度、3層目出力評価値、みたいな感じで
3駒とそれほど大差ないような気がする。
0644名無し名人 (オッペケ Sr9d-MEJo)
垢版 |
2017/10/30(月) 15:22:58.61ID:zTod/dm6r
>>639
有利なときは自玉の安全度を減らさずに敵玉安全度をちょっぴり減らす。
じわじわ真綿で首を絞めるように相手に逆転の可能性を見せない激辛流。

互角の時は先手番なら攻撃優先、後手番なら守備優先。

不利なときは自玉の安全度を多少犠牲にしても敵玉の安全度を大きくへらす。
一発逆転頓死を意識させて敵の考慮要素を増やす。泥沼勝負術。

…とか。

つうか、そこの最適戦略も機械学習すればいい。
0645名無し名人 (ワッチョイ 9bdc-xXVv)
垢版 |
2017/10/30(月) 15:31:23.34ID:kYvuIKgO0
>>644
面白いけどいろいろ難易度が高すぎる気がするなぁ。
まず玉の安全度の教師をどうするのかとか、
有利不利を判断するのに別の評価関数を学習しなきゃいけないなら若干本末転倒ではないかとか。

でも、まぁSDT5の評価値を確率分布にするってやつが一定の成果が出たら、
そういうのも可能になる道が見えてくるかもね。
0647名無し名人 (スッップ Sd33-7D0c)
垢版 |
2017/10/30(月) 16:09:47.51ID:DDzozPped
>>645
αβ枝刈り出来ないのが最大の欠点だと思う
二次元の値だとαβが出来ず、探索の深さは半分になる
もし出来るなら、評価値は一次元で表せるので、逆に二次元で表す意味もなくなる
0648名無し名人 (オッペケ Sr9d-MEJo)
垢版 |
2017/10/30(月) 16:12:52.74ID:zTod/dm6r
>>644
あと候補手を2次元でマップする事で見えるものがあるかもしれん。
星状分布の頂点は枝狩りしないほうが良いとか。
読んだ後の評価値分布の推移が台風の予測進路に似てるとか。
0650名無し名人 (ワッチョイ 211e-EOug)
垢版 |
2017/10/30(月) 16:20:21.95ID:i3tQNyAh0
そもそも枝刈りの前にどうやって探索するの
ちょっとコード書いてみてよ
普通のαβなら5行くらいで書けるんだし
0651名無し名人 (ワッチョイ 9bdc-xXVv)
垢版 |
2017/10/30(月) 16:21:33.35ID:kYvuIKgO0
>>649
まぁ、2次元値でのゲームツリー探索の枝狩りは、たぶん先行研究がないからかなり茨の道だよね。
でも、何か発見すれば論文書けるんじゃないかな。
興味がある人がんばれw
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況