X



トップページ将棋・チェス
1002コメント365KB
▲コンピュータ将棋スレッド125
■ このスレッドは過去ログ倉庫に格納されています
0001名無し名人 (ワッチョイ 6672-Q7KS)
垢版 |
2017/10/19(木) 18:08:55.48ID:cFRAuRVL0
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512
叡王戦公式HP
http://www.eiou.jp/
第27回世界コンピュータ将棋選手権 参加チーム
http://www2.computer-shogi.org/wcsc27/team.html
詰将棋メモ コンピュータ将棋2017
http://toybox.tea-nifty.com/memo/2017/01/post-965e.html
世界コンピュータ将棋選手権参加ソフトリンク集
http://www.ne.jp/asahi/tetsu/toybox/soft/softlink.htm
floodgate 最新2週間レーティング
http://wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html
コンピュータ将棋協会
http://www.computer-shogi.org/
コンピュータ将棋
http://ja.wikipedia.org/wiki/%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E5%B0%86%E6%A3%8B
将棋フリーソフト rating on single machines(各ソフトのレーティング評価)
http://uuunuuun.wix.com/shogi-engines

前スレ
▲コンピュータ将棋スレッド124 [無断転載禁止]c2ch.net
https://mevius.5ch.net/test/read.cgi/bgame/1505704966/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured 👀
Rock54: Caution(BBR-MD5:0be15ced7fbdb9fdb4d0ce1929c1b82f)
0216名無し名人 (ワッチョイ 4da0-9Njj)
垢版 |
2017/10/22(日) 23:29:11.23ID:/1uQ1UTc0
>>214
AlphaGo Zeroの場合は
完全な自己対戦スタートにした事で
人間の棋譜スタートの旧Alpha Goよりも最終的に強くなった事に意義がある訳で・・・
rezeroは強さに対する利点を見出してないから、その点でも全く違う。
0217名無し名人 (ワッチョイ ce9f-XCQz)
垢版 |
2017/10/22(日) 23:35:03.78ID:haP8PUwh0
>>211
駒割ゼロならゼロっていう情報を意図的に与えてるとも取れるでしょ
0220名無し名人 (ワッチョイ 8edc-aYWJ)
垢版 |
2017/10/23(月) 00:34:23.79ID:7dOVjPqm0
>>219
そういうことらしいってのを質疑応答でハサビスさんが言ってたらしいよ。
AlphaGoにとっては人間の棋譜って足かせだったんじゃないかっていう説。
正しい学習を阻害していた可能性があるんだと。
0221名無し名人 (スップ Sd7a-PPE6)
垢版 |
2017/10/23(月) 00:56:29.21ID:QzJthLfkd
羽生が角落ちなら将棋の神に勝てるとか言っていた当時は、角落ちだと戦力不足でどんなに強くても名人には勝てないと力説している人がいた
0222名無し名人 (ワッチョイ d661-Jp9u)
垢版 |
2017/10/23(月) 01:41:52.76ID:qcTIrW5b0
駒割については他の評価関数の項目で吸収されるので実質的な
意味はない…という話は既にどっかで解説されていたのに
駒割にこだわる人は読んでないようだ。
0224名無し名人 (ワッチョイ 9578-pXkP)
垢版 |
2017/10/23(月) 01:52:56.05ID:L6KB9/bs0
>>215
恥知らずな奴だなあ
「ハンデ貰えばミスさえしなければ必ず勝つ」とかのたまってたじゃないか
これどう読んでも「勝率100%」以外の意味には取れないだろ
議論に負けそうになったからって嘘つくのはよくないよ

これで「数学的」とか言いながらマウント取ろうとするって………

203 名無し名人 (ワッチョイ c11e-0mKs) sage 2017/10/22(日) 20:41:01.90 ID:/R+3J9+c0
負けるっていうのは強い方がいい手を指して勝つわけじゃなくて
勝ち局面を持ってるにもかかわらず正解手を選べずにミスした瞬間に負けになるわけだから
ミスさえしなければハンデを貰ってるほうが必ず勝つしミスするなら強い相手には絶対負ける
0226名無し名人 (ワッチョイ cdee-jbpI)
垢版 |
2017/10/23(月) 04:29:50.16ID:/tF04nU+0
>>225
これ、かなり気になってた部分だから俺もソース欲しいわな。
学習方法や時間を変えた結果ではないのかなと思ってたけど
0227きふわらべ ◆WARAPtPOOU (ワッチョイ ddb3-aYWJ)
垢版 |
2017/10/23(月) 05:08:13.03ID:O3W8iDJT0
人間の棋譜から学習するという段階の時代ではなく、 
経験に基づいて選択肢を絞り込んでから ありそうなところを深く考える、という 人間の手法 を
機械的な手順に置き換えて さらに絞り込みの精度を上げていくという方法を コンピューターが使ってるので、

棋譜を並べて勉強するのではなく ゲーム盤で駒を動かしているだけで 勉強になってるんじゃないか。
0230名無し名人 (ワッチョイ ce9f-XCQz)
垢版 |
2017/10/23(月) 06:42:45.11ID:qJCql/1w0
>>222
擬似的に駒割を修正するようにKPPTパラメータが決定されてるのはそうだけど、
言われてるのは学習の開始時にゼロベースになってないことだよ
人力パラメータや棋譜を使おうが使わまいが最終的には自己対局て学習するし、どちらが強いってこともないと思うけどね
AlphaGoの使わない方が強いってのは、たまたまor学習の進行が上回った瞬間がキャプチャされただけと考えてる
0231名無し名人 (ワッチョイ 7abd-GnHq)
垢版 |
2017/10/23(月) 07:30:54.58ID:iYgTrBKk0
つか初期値依存で最終的な学習結果がガラッと変わるようでは学習方法に問題有りとしか言えぬ
結果が不出来なら叩かれるべきは初期値として与える駒割ではなくて学習方法、、、
0232名無し名人 (ワッチョイ 7abd-GnHq)
垢版 |
2017/10/23(月) 07:33:15.09ID:iYgTrBKk0
正規化項として歩の価値ぐらいは固定値で持たせて結果にバイアスが生じたならやっぱそれは
固定値で持たせたという学習方法の問題やし…
0235名無し名人 (ブーイモ MMe9-cI4C)
垢版 |
2017/10/23(月) 08:55:08.87ID:YXD80uFtM
駒割のみからスタートのrezeroよりも
既存評価関数スタートのまふ評価関数の方が
計算資源に乏しいにも関わらず強くなってるんだから
将棋に関してはゼロベースは何の利点も見出してないね今のところ
0237名無し名人 (アウアウウー Sa89-ntwp)
垢版 |
2017/10/23(月) 09:46:39.14ID:vnLvKUwpa
>>194
AlphaGo Zeroが100勝するバージョンはレート上トップ棋士よりやや強いか互角くらい
将棋でいうとGPSクラスタ相当だと思うけど、それくらいが相手なら最新のソフトに十分なマシンパワーを与えれば全勝でもおかしくないのでは
0238名無し名人 (オッペケ Sr85-o9zC)
垢版 |
2017/10/23(月) 10:48:34.59ID:l/AuR468r
Alpha GOはポリシーネットで相手の指し手を予想してたが、人間の指し手を読まなくなったとすると
対人戦で読み筋ズレまくって弱くなったり…しないか?

過学習の袋小路、ぐるぐるジャンケンにはまり込んで無いのかね?
0239名無し名人 (アウアウカー Sadd-DTsA)
垢版 |
2017/10/23(月) 10:54:17.32ID:CYdYqdxla
>>120
ベストなタイミングでコンピュータと戦って歴史に名を残したオセロ。将棋は…?


●負けたことで残せる「歴史」
――中でも印象に残った言葉はありますか?

 将棋ファンの同僚からの一言です。彼は慰めてはくれたのですが、他の場面で「まあ、将棋は味とか含みがあるからね」とも言われました。

 つまり「味や含みといった微妙な駆け引きのある将棋はオセロより複雑で、だからコンピュータに負けることはないだろう」という意味を言外に感じました。
もちろんオセロにも味や含みはあるし、将棋に劣らない複雑なゲームなのですが、その場で反論はしませんでした。

 囲碁将棋ファンが持つオセロへ対する誤解は根強く、1つも2つも下に思われていたので。それをその場で正すのは難しい。「いずれ時が来れば分かりますよ」と、
心の中でつぶやきました。20年を経て、それは全く予想通りになっていると思います。

 また、「チェスと同じ年にオセロが負ける」ことで、歴史に名が残ると思いました。「負けた」という歴史を刻むことは、
複雑な知的ゲームとしてのオセロの立場を守ることにつながると。

 例えば、これがチェスが負けた5年後であれば、オセロにおける人間とコンピュータの力の差がさらに広がり、誰の目にも明らかになって、チャンピオンとソフトの対戦は
そもそも企画されなかったでしょう。そういう意味ではギリギリで滑り込んだと思っています。

 あの年(1997年)しかなかった。現にいま、盤上ゲームにおけるAIとの歴史を語る際には、囲碁、将棋、チェスとセットで扱ってくれることも多いのです。あのつらい敗戦は、
4大頭脳ゲームの1つとしてオセロが認知されることに明らかに貢献していますね(笑)。
0240名無し名人 (ワッチョイ a17e-wYkv)
垢版 |
2017/10/23(月) 11:51:49.75ID:tktVYL/d0
>>231
elmo式は問題有りか


リゼロ評価関数のほう、ようやくepoch11にしてelmo(WCSC27)と並んだのだが、
穴熊に全然囲わない。穴熊超嫌い。どうやっても穴熊に囲わない。
もちろん、穴熊は優秀なので相手に一方的に穴熊を許すと作戦負けになる。

一方、まふ定跡のまふさんが定跡として四間飛車の定跡を教師局面の生成のときに用いて評価関数を
学習させると(その定跡の半分は穴熊に進行するので)、
居飛車穴熊を自然と指すようになったとこのブログのコメント欄で書かれている。
http://yaneuraou.yaneu.com/2017/06/26/
0242名無し名人 (ワッチョイ 71c3-REa2)
垢版 |
2017/10/23(月) 13:21:33.19ID:zbcWDVP80
>>237
アルファ碁zeroってトップ棋士と互角なの?
将棋はすでにその辺のソフトにトップ棋士がぜんぜん敵わないのに
碁のほうが簡単だと言われてたのに
0243名無し名人 (ワッチョイ 6d5d-IrI6)
垢版 |
2017/10/23(月) 14:13:20.84ID:j82Y2Y230
>>242
イ・セドル(少し衰えたがそれでも鬼強い)を4−1で降した初代Alpha碁。
世界の名だたるトップ棋士たちに60戦無敗のマスター。
そのマスターに勝率9割なのがAlpha碁ゼロ。

将棋で言えば、名人がゼロで、天彦が奨励会6級、清水上・稲葉兄・早咲のアマ強豪で道場初段くらい。
0245名無し名人 (ワッチョイ 2672-wYkv)
垢版 |
2017/10/23(月) 16:02:17.10ID:mZcofSp50
uuunuuun?さんが作ってるソフトの棋力レートでtamoreが今1位なんだけど
これって9/20に公開されたkkp_kkpt版の方を指してるんじゃなくて
昨日リリースされた従来の手番付き(kkp_KPPっていうんだっけ?)の方の事をさしてるんかな?
0246sage (JP 0He2-kA64)
垢版 |
2017/10/23(月) 17:01:05.49ID:0/JOs5/tH
裏でやり取りしてる最新のkkp_kkpt版じゃねぇの
0247きふわらべ ◆WARAPtPOOU (ワッチョイ ddb3-aYWJ)
垢版 |
2017/10/23(月) 17:07:45.46ID:O3W8iDJT0
>>238
サンプルとして与えられたデータに対応し過ぎると 未経験のデータが来た時に大きく外れた対応をしてしまうというのが 過学習の理屈なんだが、
対戦相手からあまり影響を受け過ぎないようにしつつ その機会損失を上回って余りある回数をぶんまわすことで 少しずつ修正することで 過学習を避けてると思うんだぜ。

アルファ碁ゼロは レーティングが上がったということより、
教師付き学習を止めて 自己対戦の強化学習をしたら 前のより強くなった、というところでペーパーを書いた、という感じに見えるぜ。
0250名無し名人 (ワッチョイ ddb3-aYWJ)
垢版 |
2017/10/23(月) 17:42:46.34ID:T/rdbv8i0
tamoreの最新版、yaselmoに勝ちまくるんだけど俺んところだけ?
0254名無し名人 (アウーイモ MM89-ntwp)
垢版 |
2017/10/23(月) 19:04:00.98ID:GuQsKlq5M
>>242
文がわかりにくくてすまんな
互角なのはAlphaGo ZeroじゃなくてAlphaGo Zeroのベンチマークに使われて全敗した旧AlphaGoのほうだ
0259名無し名人 (ワッチョイ 719f-9PaC)
垢版 |
2017/10/23(月) 20:28:09.68ID:O1hdwuiq0
碁はニコニコのインチキルールだったら棋士にも勝機があるかもしれん
PC制限&アプデ禁止ならそぞり囲碁に持ち込める可能性がある
0261名無し名人 (ワッチョイ faf5-ijGe)
垢版 |
2017/10/23(月) 20:46:46.65ID:h/5/FUzp0
個人的には、tamoreより横歩取り評価関数の方が気になるので、検証中
0264名無し名人 (ワッチョイ 511b-WSSd)
垢版 |
2017/10/23(月) 21:31:07.59ID:7b2yB7rq0
この前の王座戦第四局の52手目の56飛の局面なんだけど
yaselmoでもなかなか後手有利の評価を出せないんだよな
65億局面読ませてやっと後手有利-430ぐらい
5億くらいだと互角評価になっちゃう
こういう局面を正確に読めるソフトってまだ出来ないのかな?
0265名無し名人 (ワッチョイ 51a2-iDVv)
垢版 |
2017/10/23(月) 21:46:21.58ID:n/+bhsaI0
>>242
こういう関係性

3008 樊麾(2016年1月1日付け)
3144 対樊麾戦バージョン(GPU176)
3520 イ・セドル(2016年3月16日、ランキング4位)
3670 柯潔(2017年10月23日、ランキング1位)
3739 対イ・セドル戦バージョン(TPU48)
4858 対柯潔戦バージョン(TPU4)
5185 アルファ碁ゼロ
0267名無し名人 (ワッチョイ ddb3-0GSP)
垢版 |
2017/10/23(月) 22:10:33.81ID:HtfJ17RM0
伸びやばない?
将棋は1年で200伸ばしてたところを、最近オープンソース流行で半年200伸びててスゲーって感じだろ?
なにさらっと1000とか上げてんの?
0275名無し名人 (ワッチョイ ba75-bcII)
垢版 |
2017/10/23(月) 23:01:55.90ID:Zl0vYZq00
honeywaffleは今回は定跡だけじゃなくて振り飛車専用に学習させるみたいだけど
相居飛車の勝率を犠牲にすれば対抗形の勝率だけは普通にやるよりよくなるってことは可能なの?
もし可能なら大会での勝率を最大化するには特定戦型を指すように学習させたほうがいいってことになるよね。
一般公開して検討用に使うには不向きだけど
0276名無し名人
垢版 |
2017/10/23(月) 23:51:20.65ID:E+lnev0c0
>>253
Error (429)
This link is temporarily disabled. The person who shared it hit their daily limit of traffic or downloads. Learn about traffic limits.
0278名無し名人 (ワッチョイ c5eb-HJ4h)
垢版 |
2017/10/24(火) 00:44:04.31ID:OqxGOYWu0
dropboxは帯域クソだからしゃあない。
tamore長時間だと凄い強いな。 長時間で自己対戦やるハードは持ってないけど
0282名無し名人 (ワッチョイ ba75-bcII)
垢版 |
2017/10/24(火) 06:12:01.69ID:paGhC3Q30
honeywaffleの振り飛車専用ってのは相手も振り飛車やってきたときに相振り飛車にするのか
大山のように居飛車側をもって対抗形にするのかどっちがいいのかな。人間だと振り飛車党同士だと
けん制しあって相居飛車になったりすることもあるがw
0287名無し名人 (JP 0He2-kA64)
垢版 |
2017/10/24(火) 09:08:25.86ID:vtWezqxxH
大会に参加するでもなく、公開するでもなく、floodgateに流すでもなく、方法を書くでもなく、
ただ強い評価関数ができました
0289名無し名人 (オッペケ Sr85-HuiB)
垢版 |
2017/10/24(火) 09:59:58.05ID:tdNZDHtqr
>>264
52手目で後手有利ってのは確定なのか?
そのレベルにくると検証困難では?

65億ノードでやっと出てくる結論の正確性信頼性は、1兆ノードくらい読んで結論が変わらないことを確認しないとわからんのでは?
0293名無し名人 (ワッチョイ 511b-gwTe)
垢版 |
2017/10/24(火) 12:41:08.36ID:E2roAkpp0
あの後、yaselmoの最善を続けるとあっという間に後手必勝の局面になる
互角評価のところからでも最善を続けて後手にばかり評価が傾いていくということは
その時点で実際は優劣がついてるということではないのでしょうか?
0294名無し名人 (ワッチョイ 7ab3-/wYC)
垢版 |
2017/10/24(火) 12:54:04.49ID:r76wKYBl0
>>293
私の環境は低スぺなので、参考までだけど、
58手目の棋譜解説の中で、控室の検討の中の順を見てたら、先手が優勢になるのがあった。
棋譜解説の文は、「・・・また▲8四角△7三歩▲3六銀△7一金という順は優劣不明のようだ。」
優勢になっていった順は、
▲8四角 △7三歩 ▲3六銀 △7一金
▲2二桂成 △同 金 ▲2三歩成 △6五桂 ▲6六銀 △1五角
▲5八玉 △3八銀 ▲2四飛 △同 角 ▲同 と △8三歩
▲7五角 △4九飛 ▲6五銀 △8九飛成 ▲7九飛 △同 龍
▲同 金 △2八飛 ▲4八桂 △3二金 ▲3四と △5七桂
▲6六歩 △2九飛成 ▲6八玉 △4七銀引成 ▲4四歩 △同 歩
▲同 と △6九桂成 ▲6七玉 △7九成桂 ▲5三と △6二金打
▲5二と △同 金 ▲5三金 △同 金 ▲同角成 △6二金打
▲5二金 △同 金 ▲7一馬 △4一玉 ▲7六玉
0295名無し名人 (ワッチョイ 511b-gwTe)
垢版 |
2017/10/24(火) 13:06:03.79ID:E2roAkpp0
>>294
その順もyaselmoで検討したけど
36銀、57銀、同角、37角、58玉、57銀成、同玉、48角
という順であっという間に先手敗勢になる
実際に進めてみるとよくわかる
0297名無し名人 (アウアウカー Sadd-q24n)
垢版 |
2017/10/24(火) 14:00:41.83ID:DjVKJF/La
要はtamore Xeon 40cっていつぞやのrereでいいんだよね?
もしそうならダブル燃橋どんだけ強いんだ
0298名無し名人 (オッペケ Sr85-HuiB)
垢版 |
2017/10/24(火) 16:47:08.90ID:5zRR8fwkr
>>293
いやいや、そのソフト最善というのがどこまで信用できるのかという話。
3コマの評価関数は大間違いが無いだけで、局面評価に細かい誤差が無いことは証明されてない。

だから深く読んで先々で大差が生じないかを見ているが、全幅探索できずに各局面2〜3手しか深く読んでない。そこで切り捨てられた手が最善でないとどうして言えるのか。

そういうちょっとした疑いが30手も40手も積み重なればもう結論の信用性なんて危うい。

>>292
もちろん人間はもっと信用できん。
まあ彼らの能力での暫定的な結論ではある。

とか言ってみる。
0307名無し名人 (ワッチョイ e5b3-gh9y)
垢版 |
2017/10/24(火) 21:46:07.05ID:uoHMCdrr0
>>305
やっぱリソースがキツいんだろうか?
まぁ、家庭用PCで動かんソフトは興味ないが。
0312名無し名人 (ブーイモ MM71-cI4C)
垢版 |
2017/10/24(火) 22:52:37.49ID:Vh9VtH5LM
AlphaGo Zeroの自己対戦って
合計で2900万局しかないから
局面数にすると重複込みでも合計で100億局面行かないんだよね
将棋は合計1兆局面絞りとかしてるから
まだまだ学習方法で改善の余地が残ってそう
0313名無し名人 (ワッチョイ 8edc-aYWJ)
垢版 |
2017/10/24(火) 23:12:34.45ID:235HPKdz0
AlphaGo Zeroは普通に探索能力が高いだけかもよ。
実戦時は1台といってもTPU4枚=GPU60枚分のパワーがあるから
相当ごり押しの探索ができるから。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況