X



トップページ将棋・チェス
1002コメント365KB
▲コンピュータ将棋スレッド125
■ このスレッドは過去ログ倉庫に格納されています
0001名無し名人 (ワッチョイ 6672-Q7KS)
垢版 |
2017/10/19(木) 18:08:55.48ID:cFRAuRVL0
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512
叡王戦公式HP
http://www.eiou.jp/
第27回世界コンピュータ将棋選手権 参加チーム
http://www2.computer-shogi.org/wcsc27/team.html
詰将棋メモ コンピュータ将棋2017
http://toybox.tea-nifty.com/memo/2017/01/post-965e.html
世界コンピュータ将棋選手権参加ソフトリンク集
http://www.ne.jp/asahi/tetsu/toybox/soft/softlink.htm
floodgate 最新2週間レーティング
http://wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html
コンピュータ将棋協会
http://www.computer-shogi.org/
コンピュータ将棋
http://ja.wikipedia.org/wiki/%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E5%B0%86%E6%A3%8B
将棋フリーソフト rating on single machines(各ソフトのレーティング評価)
http://uuunuuun.wix.com/shogi-engines

前スレ
▲コンピュータ将棋スレッド124 [無断転載禁止]c2ch.net
https://mevius.5ch.net/test/read.cgi/bgame/1505704966/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured 👀
Rock54: Caution(BBR-MD5:0be15ced7fbdb9fdb4d0ce1929c1b82f)
0250名無し名人 (ワッチョイ ddb3-aYWJ)
垢版 |
2017/10/23(月) 17:42:46.34ID:T/rdbv8i0
tamoreの最新版、yaselmoに勝ちまくるんだけど俺んところだけ?
0254名無し名人 (アウーイモ MM89-ntwp)
垢版 |
2017/10/23(月) 19:04:00.98ID:GuQsKlq5M
>>242
文がわかりにくくてすまんな
互角なのはAlphaGo ZeroじゃなくてAlphaGo Zeroのベンチマークに使われて全敗した旧AlphaGoのほうだ
0259名無し名人 (ワッチョイ 719f-9PaC)
垢版 |
2017/10/23(月) 20:28:09.68ID:O1hdwuiq0
碁はニコニコのインチキルールだったら棋士にも勝機があるかもしれん
PC制限&アプデ禁止ならそぞり囲碁に持ち込める可能性がある
0261名無し名人 (ワッチョイ faf5-ijGe)
垢版 |
2017/10/23(月) 20:46:46.65ID:h/5/FUzp0
個人的には、tamoreより横歩取り評価関数の方が気になるので、検証中
0264名無し名人 (ワッチョイ 511b-WSSd)
垢版 |
2017/10/23(月) 21:31:07.59ID:7b2yB7rq0
この前の王座戦第四局の52手目の56飛の局面なんだけど
yaselmoでもなかなか後手有利の評価を出せないんだよな
65億局面読ませてやっと後手有利-430ぐらい
5億くらいだと互角評価になっちゃう
こういう局面を正確に読めるソフトってまだ出来ないのかな?
0265名無し名人 (ワッチョイ 51a2-iDVv)
垢版 |
2017/10/23(月) 21:46:21.58ID:n/+bhsaI0
>>242
こういう関係性

3008 樊麾(2016年1月1日付け)
3144 対樊麾戦バージョン(GPU176)
3520 イ・セドル(2016年3月16日、ランキング4位)
3670 柯潔(2017年10月23日、ランキング1位)
3739 対イ・セドル戦バージョン(TPU48)
4858 対柯潔戦バージョン(TPU4)
5185 アルファ碁ゼロ
0267名無し名人 (ワッチョイ ddb3-0GSP)
垢版 |
2017/10/23(月) 22:10:33.81ID:HtfJ17RM0
伸びやばない?
将棋は1年で200伸ばしてたところを、最近オープンソース流行で半年200伸びててスゲーって感じだろ?
なにさらっと1000とか上げてんの?
0275名無し名人 (ワッチョイ ba75-bcII)
垢版 |
2017/10/23(月) 23:01:55.90ID:Zl0vYZq00
honeywaffleは今回は定跡だけじゃなくて振り飛車専用に学習させるみたいだけど
相居飛車の勝率を犠牲にすれば対抗形の勝率だけは普通にやるよりよくなるってことは可能なの?
もし可能なら大会での勝率を最大化するには特定戦型を指すように学習させたほうがいいってことになるよね。
一般公開して検討用に使うには不向きだけど
0276名無し名人
垢版 |
2017/10/23(月) 23:51:20.65ID:E+lnev0c0
>>253
Error (429)
This link is temporarily disabled. The person who shared it hit their daily limit of traffic or downloads. Learn about traffic limits.
0278名無し名人 (ワッチョイ c5eb-HJ4h)
垢版 |
2017/10/24(火) 00:44:04.31ID:OqxGOYWu0
dropboxは帯域クソだからしゃあない。
tamore長時間だと凄い強いな。 長時間で自己対戦やるハードは持ってないけど
0282名無し名人 (ワッチョイ ba75-bcII)
垢版 |
2017/10/24(火) 06:12:01.69ID:paGhC3Q30
honeywaffleの振り飛車専用ってのは相手も振り飛車やってきたときに相振り飛車にするのか
大山のように居飛車側をもって対抗形にするのかどっちがいいのかな。人間だと振り飛車党同士だと
けん制しあって相居飛車になったりすることもあるがw
0287名無し名人 (JP 0He2-kA64)
垢版 |
2017/10/24(火) 09:08:25.86ID:vtWezqxxH
大会に参加するでもなく、公開するでもなく、floodgateに流すでもなく、方法を書くでもなく、
ただ強い評価関数ができました
0289名無し名人 (オッペケ Sr85-HuiB)
垢版 |
2017/10/24(火) 09:59:58.05ID:tdNZDHtqr
>>264
52手目で後手有利ってのは確定なのか?
そのレベルにくると検証困難では?

65億ノードでやっと出てくる結論の正確性信頼性は、1兆ノードくらい読んで結論が変わらないことを確認しないとわからんのでは?
0293名無し名人 (ワッチョイ 511b-gwTe)
垢版 |
2017/10/24(火) 12:41:08.36ID:E2roAkpp0
あの後、yaselmoの最善を続けるとあっという間に後手必勝の局面になる
互角評価のところからでも最善を続けて後手にばかり評価が傾いていくということは
その時点で実際は優劣がついてるということではないのでしょうか?
0294名無し名人 (ワッチョイ 7ab3-/wYC)
垢版 |
2017/10/24(火) 12:54:04.49ID:r76wKYBl0
>>293
私の環境は低スぺなので、参考までだけど、
58手目の棋譜解説の中で、控室の検討の中の順を見てたら、先手が優勢になるのがあった。
棋譜解説の文は、「・・・また▲8四角△7三歩▲3六銀△7一金という順は優劣不明のようだ。」
優勢になっていった順は、
▲8四角 △7三歩 ▲3六銀 △7一金
▲2二桂成 △同 金 ▲2三歩成 △6五桂 ▲6六銀 △1五角
▲5八玉 △3八銀 ▲2四飛 △同 角 ▲同 と △8三歩
▲7五角 △4九飛 ▲6五銀 △8九飛成 ▲7九飛 △同 龍
▲同 金 △2八飛 ▲4八桂 △3二金 ▲3四と △5七桂
▲6六歩 △2九飛成 ▲6八玉 △4七銀引成 ▲4四歩 △同 歩
▲同 と △6九桂成 ▲6七玉 △7九成桂 ▲5三と △6二金打
▲5二と △同 金 ▲5三金 △同 金 ▲同角成 △6二金打
▲5二金 △同 金 ▲7一馬 △4一玉 ▲7六玉
0295名無し名人 (ワッチョイ 511b-gwTe)
垢版 |
2017/10/24(火) 13:06:03.79ID:E2roAkpp0
>>294
その順もyaselmoで検討したけど
36銀、57銀、同角、37角、58玉、57銀成、同玉、48角
という順であっという間に先手敗勢になる
実際に進めてみるとよくわかる
0297名無し名人 (アウアウカー Sadd-q24n)
垢版 |
2017/10/24(火) 14:00:41.83ID:DjVKJF/La
要はtamore Xeon 40cっていつぞやのrereでいいんだよね?
もしそうならダブル燃橋どんだけ強いんだ
0298名無し名人 (オッペケ Sr85-HuiB)
垢版 |
2017/10/24(火) 16:47:08.90ID:5zRR8fwkr
>>293
いやいや、そのソフト最善というのがどこまで信用できるのかという話。
3コマの評価関数は大間違いが無いだけで、局面評価に細かい誤差が無いことは証明されてない。

だから深く読んで先々で大差が生じないかを見ているが、全幅探索できずに各局面2〜3手しか深く読んでない。そこで切り捨てられた手が最善でないとどうして言えるのか。

そういうちょっとした疑いが30手も40手も積み重なればもう結論の信用性なんて危うい。

>>292
もちろん人間はもっと信用できん。
まあ彼らの能力での暫定的な結論ではある。

とか言ってみる。
0307名無し名人 (ワッチョイ e5b3-gh9y)
垢版 |
2017/10/24(火) 21:46:07.05ID:uoHMCdrr0
>>305
やっぱリソースがキツいんだろうか?
まぁ、家庭用PCで動かんソフトは興味ないが。
0312名無し名人 (ブーイモ MM71-cI4C)
垢版 |
2017/10/24(火) 22:52:37.49ID:Vh9VtH5LM
AlphaGo Zeroの自己対戦って
合計で2900万局しかないから
局面数にすると重複込みでも合計で100億局面行かないんだよね
将棋は合計1兆局面絞りとかしてるから
まだまだ学習方法で改善の余地が残ってそう
0313名無し名人 (ワッチョイ 8edc-aYWJ)
垢版 |
2017/10/24(火) 23:12:34.45ID:235HPKdz0
AlphaGo Zeroは普通に探索能力が高いだけかもよ。
実戦時は1台といってもTPU4枚=GPU60枚分のパワーがあるから
相当ごり押しの探索ができるから。
0316名無し名人 (ワッチョイ 8edc-aYWJ)
垢版 |
2017/10/24(火) 23:26:32.88ID:235HPKdz0
使ってないのはモンテカルロ木探索内でのroll outで、モンテカルロ木探索自体は使ってると読み取れたけどなぁ。
まぁ、英語そんなに得意じゃないので正しいことは他の人に任せたw
0320名無し名人 (ワッチョイ a17e-wYkv)
垢版 |
2017/10/25(水) 00:30:32.74ID:K1RQWXmx0
>>312
Mini-batches of data (s, π, z) were sampled at
random from the KGS data-set,
setting πa = 1 for the human expert move a.
人間の棋譜からの学習は、次の手を100%として学習してるのに対し

maximise the similarity of
the neural network move probabilities p
to the search probabilities π.
Zeroの強化学習では盤面全体の着手確率を学習
これで最善手だけでなく探索も改善してる、読み抜けが減りそう

確率最大のpaが探索無しの最善手
確率最大のπaが探索した最善手
0323名無し名人 (ワッチョイ 3d2c-KJ5N)
垢版 |
2017/10/25(水) 02:17:37.08ID:Jsdf45xG0
ポナンザがゼロから自己対戦学習ででレート5500に達しました
前のバージョンに勝率100%です
論文と棋譜だけ公開します
今後ソフト同士の対戦はしません
人間とは大舞台で平手で超スペックで三番勝負ならやります

これで皆凄い、革命だって思うの?
0324名無し名人 (ワッチョイ ba75-bcII)
垢版 |
2017/10/25(水) 05:08:56.75ID:u4783QhQ0
sdt5はかなりの混戦になって定跡選択や千日手、256手ルール、入玉宣言あたりの
細かいところをきっちりやっているかが勝負の分かれ目になるだろうな
0326名無し名人 (ワッチョイ 51a2-iDVv)
垢版 |
2017/10/25(水) 08:14:02.41ID:WXQY3de50
>>267
今回ので個人的にすごいと思ったのは、4800まで上げたところから更に5100まで
300上げるのに19日間しかかかってないところだよね。
0327きふわらべ ◆WARAPtPOOU (ワッチョイ ddb3-aYWJ)
垢版 |
2017/10/25(水) 08:41:42.04ID:4tWbWc580
>> 323
(1)ポナンザは勝負をやっていて、 (2)やねうら王系は インフラの整備をやっていて、
その他には (3)開発者同士でどういう工夫をしたかという腕前を比べてたり、
(4)新しい理論が実用できることの実験の場にしていたり、 (5)ネタ勢だったり するんで、

1番でも 2番でも 予選落ちでも 小〜さくても、大きくても 技術革新は どこかで起こってるはずで、
半年毎に 新しい工夫を持ち寄って 見どころを作っているだけで、できすぎていて褒めていいぐらいじゃないか。

技術革命が起こるところだけでなく、その技術革命が起こる前の種を見つけてもいいし。
0329名無し名人 (スプッッ Sd7a-h+d9)
垢版 |
2017/10/25(水) 09:25:45.48ID:408pIlkjd
予言しておく。
今回のSDTはルール違反する奴が表れる。
0333きふわらべ ◆WARAPtPOOU (ワッチョイ ddb3-aYWJ)
垢版 |
2017/10/25(水) 11:56:57.33ID:4tWbWc580
>>328
ポナンザと素直にライブラリを使っている11名(親含む)が 決勝トーナメントに出るんじゃないかだぜ。
その理由は トラブルなく動くだけで1勝だぜ。

ディープラーニング勢はどれも強そうに聞こえるものの、WCSC27時点の ponanza chainer のチーム力と高火力に半年で及べるのか謎だぜ。
人間の棋譜を用いなくても強いリゼロ評価関数が出てきたんで、上位陣は将棋も強い、という近頃の傾向は 終わるんじゃないか。

4駒関係で強くすることに成功しているソフトがあれば、
3駒関係では 両方を覚えることができない、駒の位置が似ているけど違うケース が将棋には いくらでもあるはずで、
相手の評価値を ひっくり返して勝つなんてことは あると思うぜ。

他にも コンピューターが作った定跡を使ってはめる、時間管理をそのまま使ってるソフトを何かしらはめる、
といったメタ的な使い方が できるようになったのが、 みんなが同じライブラリを使っているという はめどころでもあるので、
ライブラリに何か弱点が1個でもあれば ライブラリ勢に メタを張って勝つこともあるかもしれないぜ。

あとは強化学習勢より強化学習で成功してる Selene が 探索部 も自作してるようなので
ストックフィッシュ系の探索部よりなんかいい探索があったら サイレントマジョリティーが出てきたときの例のように
頭一つ出るかもしれないし。

上位は どこでも互角にやりそうな気がするぜ。
0336名無し名人 (スッップ Sd9a-ZsrM)
垢版 |
2017/10/25(水) 14:16:07.90ID:s7PGrg72d
変人のふりやめたのか
0338名無し名人 (ワッチョイ 511b-WSSd)
垢版 |
2017/10/25(水) 14:23:56.86ID:C11dbPmy0
話題のtamoreで少し対戦させてみたけど
1秒だと凄く強くてyaselmoは全く勝てないな
elmo、yaselmoは1秒だと弱くてgikou2にも勝てない
今、20秒でyaselmoとtamoreを対戦させてるところ
0339名無し名人 (スッップ Sd9a-XRAt)
垢版 |
2017/10/25(水) 17:22:00.81ID:FJ+A1eLmd
やねうらお注目のwindfallはどうなん?
アピール文書に評価関数を確率分布で学習するとかあるけど
0341名無し名人 (ワッチョイ 8edc-aYWJ)
垢版 |
2017/10/25(水) 17:26:00.65ID:s8b5U2sS0
アピール文書どおりに実装されて、なおかつ効果が認められるとなると革新的。
ただ、そんなに簡単には成功しなさそう。
0343名無し名人 (ワッチョイ d6c9-T+VK)
垢版 |
2017/10/25(水) 17:31:29.28ID:mi3GzV+30
SDT5は接戦になりそうなのかな
宇宙関係のJAXAも飛行安全お守り用意したりするから、勝つ確率を少しでも上げたい出場者は、将棋関係かPC関係?やAI関係?の神社に行くべし!
0345名無し名人 (スッップ Sd9a-XRAt)
垢版 |
2017/10/25(水) 18:45:49.32ID:FJ+A1eLmd
>>341
次の一手を変化させる可能性の大小で探索って、αβ枝刈り全くできなさそうだしなあ……
0346名無し名人 (ワッチョイ 8edc-aYWJ)
垢版 |
2017/10/25(水) 19:35:23.51ID:s8b5U2sS0
イメージ的には評価値が中央値と分散に分かれる感じなんだけど実際そんな値でどうやって探索していいかさっぱりわからんよね。
評価値100±1000 とか言われてもお前評価放棄したな?みたいな感じだしw
0347名無し名人 (ワッチョイ ba75-bcII)
垢版 |
2017/10/25(水) 20:05:03.64ID:u4783QhQ0
評価値の分散がわかれば有利なときは誤差含めてもプラスの手を選んで安全勝ちとか
不利なときは誤差が大きめの勝負手を選べるって感じじゃね
0348名無し名人 (ワッチョイ 7abd-GnHq)
垢版 |
2017/10/25(水) 20:17:42.71ID:yLKDWYik0
学習時だと言うてはるで
精度に問題がある評価関数で探索時に小細工を弄しても弱くなるだけだが
学習時も込みで一貫してその規則でやるんならノイズ除去の効果が気体できるのかもしれん
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況