X



トップページ将棋・チェス
1002コメント353KB
▲コンピュータ将棋スレッド136
■ このスレッドは過去ログ倉庫に格納されています
0001名無し名人 (ワッチョイ 17b3-a7mP)
垢版 |
2018/05/06(日) 16:07:27.57ID:yi6PO8Aw0
!extend:checked:vvvvv:1000:512
↑スレ立て時は1行目と2行目に「!extend:checked:vvvvv:1000:512」をコピペして立てて下さい
荒らし対策のために強制コテハン(ワッチョイ)を表示するコマンドです

第28回世界コンピュータ将棋選手権 参加チーム
https://www.apply.computer-shogi.org/wcsc28/team.html
詰将棋メモ コンピュータ将棋2018
http://toybox.tea-nifty.com/memo/2018/01/post-0205.html
世界コンピュータ将棋選手権参加ソフトリンク集
http://www.ne.jp/asahi/tetsu/toybox/soft/softlink.htm
floodgate 最新2週間レーティング
http://wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html
コンピュータ将棋協会
http://www.computer-shogi.org/
コンピュータ将棋
http://ja.wikipedia.org/wiki/%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E5%B0%86%E6%A3%8B
将棋フリーソフト rating on single machines(各ソフトのレーティング評価)
http://uuunuuun.wix.com/shogi-engines

※前スレ
https://mevius.5ch.net/test/read.cgi/bgame/1524826104/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured
0370名無し名人 (ワッチョイ 46dc-a7mP)
垢版 |
2018/05/08(火) 18:47:49.85ID:haOhnMJ00
>>368
なぜおかしな話だと思うのかkwsk
定跡ってのは前持って探索しておくこととほぼ同意だから、持ち時間が増えたこととだいたい同じ。
持ち時間が違えば強さは変化する。
当たり前のことだと思うけど。
0371名無し名人 (ワッチョイ 4ab3-NrvC)
垢版 |
2018/05/08(火) 19:08:26.31ID:QwgP567z0
複数のソフトと対局数が多くなると最初R4230程度あったQzillaもR4199に下がっている
aperypaqよりやや強いwakame1stでも複数のソフトと対局させると総合的なレートはaperypaqより下位になる
このことから一つのソフトと対局しただけでレートが決まらないことが分かる
uuunさんのレーティング表(2018/05/08)
Godwhale5.0.5/Qzilla9 R4199
YO4.82/aperypaq R4190
YO4.80/wakame1st R4184
0372名無し名人 (ワッチョイ 46dc-a7mP)
垢版 |
2018/05/08(火) 19:10:20.08ID:haOhnMJ00
たとえば白ビールの前身のshot gunはいろんなソフトと対局させて負けた棋譜から負けの原因となった指し手を特定して
再探索させて定跡を直す、ということを半自動でやってたらしい。
まふ定跡のように完全な人の手が入った定跡だとなんだかなーという気もするけど、それだってソフトでの解析の結果を参考にしてるらしいから、
結局はベースのソフトでのより長時間の探索での結果といってもいい。
定跡書をただ放り込んでるわけではないんだよ。
0376名無し名人 (ワッチョイ 46dc-a7mP)
垢版 |
2018/05/08(火) 19:19:25.73ID:haOhnMJ00
プロの将棋が今どうなってるかを見れば、定跡でやりはじめたからコンピュータ将棋なんて終わったなっていうのが間違ってるってのがわかると思うけど。
誰かが戦法を編み出して、それが定跡化されて、それを打ち破る戦法を誰かが作り出す、というサイクルで将棋の歴史ってのは進んできたわけだ。
今定跡を作る元になってるソフトよりも強いものを作って、定跡を打ち破るってのがこれからの面白いところだろう。
0377名無し名人 (ワッチョイ 469f-gryN)
垢版 |
2018/05/08(火) 19:21:35.33ID:tcCs5YBJ0
今後の進歩はたぬきのnnueを絞るなりして多少強くなるかどうかくらいかな?
将棋ソフトがこのまま強くなるとすれば
手順長くなる持将棋とかの
強さまで要求されて
人間の将棋とますます
離れていきそうだ
0378名無し名人 (ワッチョイ 868f-XJxX)
垢版 |
2018/05/08(火) 19:28:56.56ID:qa8C0o900
>>325
打倒Ponanzaの時期は技巧、ukamuse、elmoといったソフトがRを急上昇させてきた
今回は強さのインフレがある程度収まった形になったので、白ビールに再び盛り上げてほしい
0380名無し名人 (ワッチョイ 46dc-a7mP)
垢版 |
2018/05/08(火) 19:37:48.54ID:haOhnMJ00
逆にいえば強さの上昇が停滞してきた今こそ、新規参加者が新技術で一発を狙えるタイミングだとは思うけどね。
0381名無し名人 (ブーイモ MMaa-+8kc)
垢版 |
2018/05/08(火) 19:46:04.30ID:nv+uQ0vMM
PALとNNUEとQhapaq以外は
以前の学習部にそこまで手を加えた訳ではないから似たり寄ったりになるのは仕方ない
0382名無し名人 (スップ Sdaa-xH6l)
垢版 |
2018/05/08(火) 19:46:17.16ID:WtsrlPgJd
将棋界と同列に扱う時点で間違っている。
ソフトのレートが頭打ちになりアンチコンピューター戦略や定跡勝負で勝敗が決まることを考えると、
少なくともCSA的には我々が大会を開催する意味はなくなったと考えてもおかしくない。
もちろんherozやatcorderが大会を開催するなら歓迎するけど
0383名無し名人 (ワッチョイ 7f25-0kFI)
垢版 |
2018/05/08(火) 19:54:25.36ID:SFSU6fBm0
>>325
でもponaも結局本体のエンジン部分はstockfishベースで、
秘密の強さというよりはむしろ最適化が優れていたということなんでしょ?
以前山本さんは「みんなは最適化のさせ方が下手」とか言っていたし。
0385名無し名人 (ワッチョイ 0ad2-dEtt)
垢版 |
2018/05/08(火) 19:57:39.54ID:qCqyvJsE0
>>379
待て待て
クジラをAperypaq,wakame含めた色んなソフトと対戦させてみろよ
誤差ではない
明らかにAperypaqやwakameより上
0388名無し名人 (ワッチョイ 4ab3-NrvC)
垢版 |
2018/05/08(火) 20:05:56.28ID:QwgP567z0
今回の大会で3駒の限界が明確になった感は否めない、平岡さんも3駒は今回が最後みたいなことを言っているし
0389名無し名人 (ワッチョイ 069f-jACm)
垢版 |
2018/05/08(火) 20:10:03.92ID:DHFbd+ly0
たぬきの評価関数って自己対局からは学習してないのかな
0390名無し名人 (ワッチョイ 46dc-a7mP)
垢版 |
2018/05/08(火) 20:13:07.39ID:haOhnMJ00
>>384
違うよ。序盤で持ち時間を使わなかったことによって中盤以降の持ち時間が増えるから、定跡を使わなかったものとくらべて全体的に強くなる。
0391名無し名人 (ワッチョイ 4ab3-NrvC)
垢版 |
2018/05/08(火) 20:14:44.70ID:QwgP567z0
でもR4200もあれば正直、一般家庭で棋譜の検討や対局をするには十分満足出来る強さなのは間違いない
0392名無し名人 (スップ Sd4a-koIq)
垢版 |
2018/05/08(火) 20:17:08.95ID:k5MyzmwWd
DLを用い、先の手を読まずに指すソフトというのは、定跡で指しているのと原理的に似ていると考えてよろしいですか?
0393名無し名人 (ワッチョイ 46dc-a7mP)
垢版 |
2018/05/08(火) 20:20:32.44ID:haOhnMJ00
>>392
なんともいえない。
データベース型の定跡であれば、通常の思考に切り替えるタイミングはデータベース内にない局面になったときと明確だけど、DLの場合はそうはいかない。
通常思考に切り替えるタイミングがうまくできればDLでデータベース型定跡の代替とすることは可能だと思うけど、現状まだ誰も成功してないと思う。
0394名無し名人 (スップ Sd4a-koIq)
垢版 |
2018/05/08(火) 20:24:45.47ID:k5MyzmwWd
>>391
対局では満足できないと思います。強すぎるから。

満足できるソフトとは、対局中にユーザーの棋力を計測し、ギリギリ負ける棋力に自動で落ちてくれる接待将棋ソフトだと思います。HEROZなら精密解析機能を後少しいじれば実現できそうですよね。
0396名無し名人 (ワッチョイ 0bb3-RDlo)
垢版 |
2018/05/08(火) 20:33:34.17ID:H175NSwy0
序盤から探索させると石田流が最強になるって話があったけど、事前の研究でなく本番の探索でそういう戦型レベルの正確な評価が出来るようにならないと現状に風穴開けることはできない、という認識でおk?
0398名無し名人 (ワッチョイ 46dc-a7mP)
垢版 |
2018/05/08(火) 20:36:42.60ID:haOhnMJ00
>>396
そういう解法でもいいとは思うけど、もっとストレートに現状の大元になってる評価関数よりもだいぶ精度が高い評価関数を作って、
それを元に作った定跡をぶつけるってのがいいんでないかな。
0400名無し名人 (ワッチョイ a361-ALiW)
垢版 |
2018/05/08(火) 20:42:18.65ID:I4WQ6d+Z0
今の定跡も今の評価関数と探索で計算させたら出てきたもので
違う評価関数と探索が出てきたらどうなるかわからない。
0402名無し名人 (ワッチョイ 46dc-a7mP)
垢版 |
2018/05/08(火) 20:48:55.30ID:haOhnMJ00
>>401
それも違う。
指し手予測式のDLは教師の指し手を関数近似によって覚えてるだけ。
強化学習での評価関数がテーブル式と関数近似とがあるのんだけど、それくらいの違いでしかない。
別に大局観や感覚を覚えたわけではない。
0403名無し名人 (スップ Sd4a-K+v/)
垢版 |
2018/05/08(火) 20:49:06.12ID:qsnb4fItd
>>392
全然違う

定跡は予め深く読んだ結果良かった手を保存しておいてそれに実践がヒットしたらその通り指す
制限時間無しで読んだ手だからリアルタイムより全然いい手になる

DLはものすごい巨大な評価関数みたいなもので盤面の特徴点からから「いい形かどうか」を深く読まなくても高精度に判断できる
0404名無し名人 (ワッチョイ a3a0-o8Ky)
垢版 |
2018/05/08(火) 20:59:16.30ID:wMeCTDaL0
>>389
自己対戦だけで棋譜を作るなら
NNUEよりも一番強い評価関数を使ったほうが効率いいでしょ

・・・と思ったけど
試しに棋譜生成でよく使われるdepth8で
NNUEとqzilla9を戦わせたらNNUEが有意に勝ち越した
https://i.imgur.com/vvuRrwa.jpg
公平にする為にqzilla9もやねうら王4.82を使用

まあgodwhaleにしたら今度はqzilla9が八割勝ったから
探索部に依存し過ぎた意味のない比較だけど
0405名無し名人 (アウアウカー Saeb-Abm9)
垢版 |
2018/05/08(火) 21:00:43.14ID:Ldy9WJQPa
定跡ってそもそも最善の手順の集合体じゃない場合もある
悪い手順でも相手がハマるなら定跡としては有効
0406名無し名人 (ワッチョイ 46dc-a7mP)
垢版 |
2018/05/08(火) 21:06:38.08ID:haOhnMJ00
>>405
人間の定跡にそういうの結構あるよね。
「あなたはこの戦法の受け方を知ってますか?」
ってのを問うような指し方だよね。
0407名無し名人 (アウアウカー Saeb-Abm9)
垢版 |
2018/05/08(火) 21:13:07.06ID:Ldy9WJQPa
>>406
ソフトでもハマったりハメられたりするし
本当に事前に読んだ最善手だけを登録してる定跡を積んだソフトってないでしょ
0408名無し名人 (ワッチョイ 4ab3-NrvC)
垢版 |
2018/05/08(火) 21:17:03.18ID:QwgP567z0
>>394
なるほど、ごもっとも、そっちの意味ね
自分が言いたかった満足とは、ソフトと対局するときソフトが弱く不満でより強いソフトと対局したい場合
R4200もあれば十分だから、これ以上強いソフトは必要ないっていう意味の方ね
同じ満足でも意味が違うので、ああそっちの方かってなった
0409名無し名人 (ワッチョイ 27d2-K+v/)
垢版 |
2018/05/08(火) 21:19:06.08ID:LILeHEq60
>>402
定跡は同一局面でないと全く対応できない。
未知の局面において読みを入れずに指すという点において、人間の処理に対応するものとして大局観、感覚がある。
それを数値的に実現したものの内部処理がどうのこうのという話「しか」理解できないというのは、
「自分は実務者として知識と経験がある」と偉そうに言ってるだけで、その実自分のやっていることの基本概念も理解出来ていないただの実装屋
0411名無し名人 (アウアウカー Saeb-Abm9)
垢版 |
2018/05/08(火) 21:25:13.96ID:Ldy9WJQPa
>>409
人間の大局観や感覚っていうのは過去の知識や経験から来てるもので本質的には同じじゃない?
0412名無し名人 (ワッチョイ 46dc-a7mP)
垢版 |
2018/05/08(火) 21:31:43.35ID:haOhnMJ00
>>409
まぁ、文学的にどう表現しようがかまわんけど、人間が思う大局観みたいなものはDLでは実現できてないよ。
合ってるときは大局観だー!感覚だー!って思うんだけど、ものすごいひどい間違いするから。
実際に作ってみないと間違ってるときはあまり見れないだろうからわからんだろうけどね。
0414名無し名人 (ワッチョイ 46dc-a7mP)
垢版 |
2018/05/08(火) 21:49:47.64ID:haOhnMJ00
>>413
メモリを膨大に消費するってのと学習が遅いってのが問題点の大部分だったと思うから、NNUEが出てこなかったらDLよりか4駒のほうがましってことで4駒やる人が増えたかもしれないけど、今はNNUEやりたいでしょ、みんな。
0415名無し名人 (ワッチョイ 53b3-XJxX)
垢版 |
2018/05/08(火) 21:55:11.30ID:3x/zQC2J0
4駒が強くなってもうちのPCじゃメモリ的に動きそうにないから是非NNUEのような省メモリの方向で開発していただきたい。
0418名無し名人 (ワッチョイ 53b3-NrvC)
垢版 |
2018/05/08(火) 22:03:26.18ID:enFhOonn0
NNUEはKPPより消費電力が激しいというのは、
・計算効率がいい
・計算効率が悪い
のどちらを意味するのでしょうか?
0419名無し名人 (ワッチョイ 46dc-a7mP)
垢版 |
2018/05/08(火) 22:06:40.68ID:haOhnMJ00
よりCPUを酷使できるようになったってことで、よりCPUに最適化された≒計算効率があがった、なのかな?
単に計算量が増えただけなような気もしないでもないけど。
0420名無し名人 (ワッチョイ 278a-XJxX)
垢版 |
2018/05/08(火) 22:12:09.84ID:ACsPkgiz0
>>385
「明らかに」とまで言うなら、それ相応のデータを出せるんだよね?
もちろんuuunのサイトよりも信用に足るデータでね
あなたの言う「誤差ではない」「色んなソフトと対戦させ」たデータがあるなら、公開したらみんな納得してくれるだろうねー
0421名無し名人 (ワッチョイ 4ab3-NrvC)
垢版 |
2018/05/08(火) 22:15:39.85ID:QwgP567z0
うちのPCも非力なので4駒は使えない、一般家庭で使えないソフトはいくら強くても需要の面で存在価値が低いと思う
開発者にはNNUEのような軽量の方向で開発してほしい
0425名無し名人 (ワッチョイ bb16-xl1x)
垢版 |
2018/05/08(火) 22:23:37.86ID:kWSwOnHd0
>>394
そんなの簡単だよ。評価値が0か少しマイナスになる手を選ぶように少し変更するだけ。
実際、昔「接待ボナンザ」ってボナンザの改造版が出回ってた。指してて結構面白かったよ。
0426名無し名人 (ワッチョイ 0ad2-dEtt)
垢版 |
2018/05/08(火) 22:29:32.65ID:qCqyvJsE0
>>420
今将棋所でApery,Aperypaq,elmo,Qhapaq,Qzilla9,T.N.K,技巧2,初代wakameの計8ソフトによる総当たりリーグ戦してるわ
各ソフトと20戦ずつやらせて計140局
1番成績悪いelmo除外して残った7つでさらに10局ずつ計190局

uuunさんのサイトよりサンプル少ないからまったく当てにならないデータとか言われたらそれまでだがな
0427名無し名人 (ブーイモ MMb6-o8Ky)
垢版 |
2018/05/08(火) 22:32:17.01ID:F3O527sTM
>1番成績悪いelmo

技巧2の方がいいのか意外だな
0428名無し名人 (アウアウカー Saeb-Abm9)
垢版 |
2018/05/08(火) 22:34:33.12ID:Ldy9WJQPa
>>425
求めてるのは自然と弱い手がさせるソフトじゃない?
0431名無し名人 (ワッチョイ 0ad2-dEtt)
垢版 |
2018/05/08(火) 22:41:25.65ID:qCqyvJsE0
>>427
技巧2は意外と格上ソフトにも善戦することが多い印象
elmoは8つの中で明らかに一つ成績が悪かった

リーグ戦190ではなく200局になるな

一応200局データには取ろうとしてるが、くじらをやねうらエンジンに載せたりどれが1番いいか調整してる時にもAperypaqなどと戦わせてたけど、どのソフトに対しても優位にたってたし、負け越しは一度も見てないな
0434名無し名人 (アウアウカー Saeb-Abm9)
垢版 |
2018/05/08(火) 22:46:25.01ID:Ldy9WJQPa
>>433
それ定義するのが難しいから
自然と弱い将棋ソフト作るのが難しいんじゃないの?
0436名無し名人 (ワッチョイ 0beb-xH6l)
垢版 |
2018/05/08(火) 22:57:53.45ID:9wZnnLBI0
leela chessは、stockfishと比べて極めて自然な指し回しらしい。
alpha zeroとelmoとの対戦の棋譜くらいは公開してくれないかなぁ
0437名無し名人 (ワッチョイ 868f-XJxX)
垢版 |
2018/05/08(火) 22:58:37.65ID:qa8C0o900
>>423
使うにはユーザー登録とか必要だしそれにそこまで強いわけではないから
開発したい人には非常い興味深いものだろうけど普通のソフト将棋好きには話題にならないんだと思う

それはそうと今回は陰の強豪elmoと上位常連の読み太は公開ないのかね
0438名無し名人 (ワッチョイ 27d2-K+v/)
垢版 |
2018/05/08(火) 23:12:38.25ID:LILeHEq60
>>411
何と同じ?

もしかして棋理(経験則)の事を定跡と呼んでる?
ブックにヒットするかどうかの話を越えてるのかな?

>>428
人間らしい弱さを学習する必要があるだろうなぁ。
棋力別の棋譜から悪手の特徴を学習して、わざと悪手を指せるようにするのがいいのだろうが、DLとかで実装の負担が減れば誰か開発するだろう。そのうち
0439名無し名人 (ワッチョイ 8ab3-St6r)
垢版 |
2018/05/08(火) 23:20:28.79ID:oFWK64d30
minmaxで反復深化よりMCTSのほうが人間らしい弱さに近づけやすいかもしれないが
どうやって評価したもんだか
0441名無し名人 (ワッチョイ 1f7e-Mne9)
垢版 |
2018/05/08(火) 23:35:24.36ID:5QzgMHiw0
>>436
https://en.chessbase.com/post/leela-chess-zero-alphazero-for-the-pc
However, the engine’s play is quite different from anything
I have seen or tested before, and I am speaking from over 20 years experience.

What on earth was going on??

I never heard of an engine compensating
hundreds of Elo of tactical gaps with pure positional play.


もう一週間以上前だから今どうか分からないけど、普通のエンジンとはかなり違うようだ
0442名無し名人 (アウーイモ MMcf-8w/W)
垢版 |
2018/05/08(火) 23:37:30.16ID:wZ790uQRM
Bonanza 1.0とか当時は自然で人間らしいと言われてたし、案外古いソフト引っ張ってくるだけでなんとかなる説
0445名無し名人 (ワッチョイ de00-UBB+)
垢版 |
2018/05/08(火) 23:51:55.19ID:JcgV7ase0
>>443
見やすい
0449名無し名人 (ワッチョイ 0ad2-cyUG)
垢版 |
2018/05/09(水) 00:21:17.85ID:BBC1h69p0
>>444
すみません
確認したら2017年1月のものでした、

elmo.sdt5をインストール、調節して再度他7ソフトと30局ずつやらせます
エンジンはやねうら482載せてました、
他のソフトは公開されてる中で最新のものです

ApreyはWCSC28はエンジンはかなり優れてますが、評価関数はSDT5を載せた方が強いと思いますのでそのようにしました

Qhapaq公開は楽しみですね
0450名無し名人 (ワッチョイ cfd2-Jl51)
垢版 |
2018/05/09(水) 00:24:31.46ID:SZI4CADs0
30局は少ないが・・・・
0451名無し名人 (ワッチョイ 8abd-3xiy)
垢版 |
2018/05/09(水) 00:24:32.11ID:hM3zNhG80
しかし白ビールの人はあれで助教とか
教授とかはどんな化け物なんだよ
大学関係者デラオソロシス((((;゚Д゚))))ガクガク
0452名無し名人 (ワッチョイ 4ab3-NrvC)
垢版 |
2018/05/09(水) 00:27:35.43ID:3hgR6GoL0
>>443
さすがに各30局では少ないと思う
自分の経験ではノード数にもよるけど30局で勝率55~57%位までだと、100局やったらほぼ互角になる場合が結構あるよ
同じように30局で勝率60%位なら100局やっても勝ち越すことが多い
100局やって勝率55~57%位のものは500局位やったら互角になることがあるよ
0453名無し名人 (ワッチョイ 0ad2-cyUG)
垢版 |
2018/05/09(水) 00:37:00.38ID:BBC1h69p0
>>452
勿論序列を決める十分なサンプルと言えないのはわかっているのですが、このまま対局数を増やしてもくじらちゃんの1位は揺るぎないと思ってます。
しっかりデータ取ったわけじゃないですが、くじらちゃんにやねうら載せてAperypaqやwakameとやらせてもやはりくじらちゃんがハッキリ勝ち越しましたし、くじらちゃんはやねうらよりGodwhaleの方がハッキリ勝ち越したというのもありましたし
0459名無し名人 (ワッチョイ 1f7e-Mne9)
垢版 |
2018/05/09(水) 02:53:00.40ID:y3QyjYRo0
May 08, 2018
Memory-optimized machine types with up to 160 vCPUs and 3.75 TB of system memory
are now available in Beta. See the pricing page to learn how these machine types are billed.


Google I/Oに合わせて発表だったのね
これでそこそこ結果変わったな
0463名無し名人 (ワッチョイ 8ab3-MvdJ)
垢版 |
2018/05/09(水) 04:00:11.15ID:65qY7GOT0
大将軍、また四駒やらんかな
0465名無し名人 (スップ Sd4a-0Fxr)
垢版 |
2018/05/09(水) 05:22:10.72ID:j9LYIUPDd
floodgateのsinbo-6700k、最終盤だけめっぽう強いな
中身はタヌキかな
0467名無し名人 (ワッチョイ 0a33-B1Dm)
垢版 |
2018/05/09(水) 06:36:11.74ID:X1cIhYS50
uuunuuunさんのところでクジラのレートが下がったのはT.N.K.との相性が問題だったとのこと
クジラがaperypaqに対してR50差、aperypaqがT.N.K.に対してR50差なのに
クジラはT.N.K.にR10差しか出ないと

>>443 の人の環境でクジラ対T.N.Kを200局くらい1手1500万ノードで回したら
どういう結果になるかは興味あるな
0468名無し名人 (ワッチョイ 0a33-B1Dm)
垢版 |
2018/05/09(水) 06:45:06.35ID:X1cIhYS50
T.N.K.との相性問題が発生しているとして、こういうときはT.N.K.の自己対局の棋譜と、
クジラ対T.N.K.でクジラが負けた棋譜をそれぞれ大量に用意して絞るとよかったりするんだろうか。
そんな変な過学習は起きないような気もするが
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況