X



トップページ将棋・チェス
1002コメント365KB
▲コンピュータ将棋スレッド125
■ このスレッドは過去ログ倉庫に格納されています
0001名無し名人 (ワッチョイ 6672-Q7KS)
垢版 |
2017/10/19(木) 18:08:55.48ID:cFRAuRVL0
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512
叡王戦公式HP
http://www.eiou.jp/
第27回世界コンピュータ将棋選手権 参加チーム
http://www2.computer-shogi.org/wcsc27/team.html
詰将棋メモ コンピュータ将棋2017
http://toybox.tea-nifty.com/memo/2017/01/post-965e.html
世界コンピュータ将棋選手権参加ソフトリンク集
http://www.ne.jp/asahi/tetsu/toybox/soft/softlink.htm
floodgate 最新2週間レーティング
http://wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html
コンピュータ将棋協会
http://www.computer-shogi.org/
コンピュータ将棋
http://ja.wikipedia.org/wiki/%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E5%B0%86%E6%A3%8B
将棋フリーソフト rating on single machines(各ソフトのレーティング評価)
http://uuunuuun.wix.com/shogi-engines

前スレ
▲コンピュータ将棋スレッド124 [無断転載禁止]c2ch.net
https://mevius.5ch.net/test/read.cgi/bgame/1505704966/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured 👀
Rock54: Caution(BBR-MD5:0be15ced7fbdb9fdb4d0ce1929c1b82f)
0307名無し名人 (ワッチョイ e5b3-gh9y)
垢版 |
2017/10/24(火) 21:46:07.05ID:uoHMCdrr0
>>305
やっぱリソースがキツいんだろうか?
まぁ、家庭用PCで動かんソフトは興味ないが。
0312名無し名人 (ブーイモ MM71-cI4C)
垢版 |
2017/10/24(火) 22:52:37.49ID:Vh9VtH5LM
AlphaGo Zeroの自己対戦って
合計で2900万局しかないから
局面数にすると重複込みでも合計で100億局面行かないんだよね
将棋は合計1兆局面絞りとかしてるから
まだまだ学習方法で改善の余地が残ってそう
0313名無し名人 (ワッチョイ 8edc-aYWJ)
垢版 |
2017/10/24(火) 23:12:34.45ID:235HPKdz0
AlphaGo Zeroは普通に探索能力が高いだけかもよ。
実戦時は1台といってもTPU4枚=GPU60枚分のパワーがあるから
相当ごり押しの探索ができるから。
0316名無し名人 (ワッチョイ 8edc-aYWJ)
垢版 |
2017/10/24(火) 23:26:32.88ID:235HPKdz0
使ってないのはモンテカルロ木探索内でのroll outで、モンテカルロ木探索自体は使ってると読み取れたけどなぁ。
まぁ、英語そんなに得意じゃないので正しいことは他の人に任せたw
0320名無し名人 (ワッチョイ a17e-wYkv)
垢版 |
2017/10/25(水) 00:30:32.74ID:K1RQWXmx0
>>312
Mini-batches of data (s, π, z) were sampled at
random from the KGS data-set,
setting πa = 1 for the human expert move a.
人間の棋譜からの学習は、次の手を100%として学習してるのに対し

maximise the similarity of
the neural network move probabilities p
to the search probabilities π.
Zeroの強化学習では盤面全体の着手確率を学習
これで最善手だけでなく探索も改善してる、読み抜けが減りそう

確率最大のpaが探索無しの最善手
確率最大のπaが探索した最善手
0323名無し名人 (ワッチョイ 3d2c-KJ5N)
垢版 |
2017/10/25(水) 02:17:37.08ID:Jsdf45xG0
ポナンザがゼロから自己対戦学習ででレート5500に達しました
前のバージョンに勝率100%です
論文と棋譜だけ公開します
今後ソフト同士の対戦はしません
人間とは大舞台で平手で超スペックで三番勝負ならやります

これで皆凄い、革命だって思うの?
0324名無し名人 (ワッチョイ ba75-bcII)
垢版 |
2017/10/25(水) 05:08:56.75ID:u4783QhQ0
sdt5はかなりの混戦になって定跡選択や千日手、256手ルール、入玉宣言あたりの
細かいところをきっちりやっているかが勝負の分かれ目になるだろうな
0326名無し名人 (ワッチョイ 51a2-iDVv)
垢版 |
2017/10/25(水) 08:14:02.41ID:WXQY3de50
>>267
今回ので個人的にすごいと思ったのは、4800まで上げたところから更に5100まで
300上げるのに19日間しかかかってないところだよね。
0327きふわらべ ◆WARAPtPOOU (ワッチョイ ddb3-aYWJ)
垢版 |
2017/10/25(水) 08:41:42.04ID:4tWbWc580
>> 323
(1)ポナンザは勝負をやっていて、 (2)やねうら王系は インフラの整備をやっていて、
その他には (3)開発者同士でどういう工夫をしたかという腕前を比べてたり、
(4)新しい理論が実用できることの実験の場にしていたり、 (5)ネタ勢だったり するんで、

1番でも 2番でも 予選落ちでも 小〜さくても、大きくても 技術革新は どこかで起こってるはずで、
半年毎に 新しい工夫を持ち寄って 見どころを作っているだけで、できすぎていて褒めていいぐらいじゃないか。

技術革命が起こるところだけでなく、その技術革命が起こる前の種を見つけてもいいし。
0329名無し名人 (スプッッ Sd7a-h+d9)
垢版 |
2017/10/25(水) 09:25:45.48ID:408pIlkjd
予言しておく。
今回のSDTはルール違反する奴が表れる。
0333きふわらべ ◆WARAPtPOOU (ワッチョイ ddb3-aYWJ)
垢版 |
2017/10/25(水) 11:56:57.33ID:4tWbWc580
>>328
ポナンザと素直にライブラリを使っている11名(親含む)が 決勝トーナメントに出るんじゃないかだぜ。
その理由は トラブルなく動くだけで1勝だぜ。

ディープラーニング勢はどれも強そうに聞こえるものの、WCSC27時点の ponanza chainer のチーム力と高火力に半年で及べるのか謎だぜ。
人間の棋譜を用いなくても強いリゼロ評価関数が出てきたんで、上位陣は将棋も強い、という近頃の傾向は 終わるんじゃないか。

4駒関係で強くすることに成功しているソフトがあれば、
3駒関係では 両方を覚えることができない、駒の位置が似ているけど違うケース が将棋には いくらでもあるはずで、
相手の評価値を ひっくり返して勝つなんてことは あると思うぜ。

他にも コンピューターが作った定跡を使ってはめる、時間管理をそのまま使ってるソフトを何かしらはめる、
といったメタ的な使い方が できるようになったのが、 みんなが同じライブラリを使っているという はめどころでもあるので、
ライブラリに何か弱点が1個でもあれば ライブラリ勢に メタを張って勝つこともあるかもしれないぜ。

あとは強化学習勢より強化学習で成功してる Selene が 探索部 も自作してるようなので
ストックフィッシュ系の探索部よりなんかいい探索があったら サイレントマジョリティーが出てきたときの例のように
頭一つ出るかもしれないし。

上位は どこでも互角にやりそうな気がするぜ。
0336名無し名人 (スッップ Sd9a-ZsrM)
垢版 |
2017/10/25(水) 14:16:07.90ID:s7PGrg72d
変人のふりやめたのか
0338名無し名人 (ワッチョイ 511b-WSSd)
垢版 |
2017/10/25(水) 14:23:56.86ID:C11dbPmy0
話題のtamoreで少し対戦させてみたけど
1秒だと凄く強くてyaselmoは全く勝てないな
elmo、yaselmoは1秒だと弱くてgikou2にも勝てない
今、20秒でyaselmoとtamoreを対戦させてるところ
0339名無し名人 (スッップ Sd9a-XRAt)
垢版 |
2017/10/25(水) 17:22:00.81ID:FJ+A1eLmd
やねうらお注目のwindfallはどうなん?
アピール文書に評価関数を確率分布で学習するとかあるけど
0341名無し名人 (ワッチョイ 8edc-aYWJ)
垢版 |
2017/10/25(水) 17:26:00.65ID:s8b5U2sS0
アピール文書どおりに実装されて、なおかつ効果が認められるとなると革新的。
ただ、そんなに簡単には成功しなさそう。
0343名無し名人 (ワッチョイ d6c9-T+VK)
垢版 |
2017/10/25(水) 17:31:29.28ID:mi3GzV+30
SDT5は接戦になりそうなのかな
宇宙関係のJAXAも飛行安全お守り用意したりするから、勝つ確率を少しでも上げたい出場者は、将棋関係かPC関係?やAI関係?の神社に行くべし!
0345名無し名人 (スッップ Sd9a-XRAt)
垢版 |
2017/10/25(水) 18:45:49.32ID:FJ+A1eLmd
>>341
次の一手を変化させる可能性の大小で探索って、αβ枝刈り全くできなさそうだしなあ……
0346名無し名人 (ワッチョイ 8edc-aYWJ)
垢版 |
2017/10/25(水) 19:35:23.51ID:s8b5U2sS0
イメージ的には評価値が中央値と分散に分かれる感じなんだけど実際そんな値でどうやって探索していいかさっぱりわからんよね。
評価値100±1000 とか言われてもお前評価放棄したな?みたいな感じだしw
0347名無し名人 (ワッチョイ ba75-bcII)
垢版 |
2017/10/25(水) 20:05:03.64ID:u4783QhQ0
評価値の分散がわかれば有利なときは誤差含めてもプラスの手を選んで安全勝ちとか
不利なときは誤差が大きめの勝負手を選べるって感じじゃね
0348名無し名人 (ワッチョイ 7abd-GnHq)
垢版 |
2017/10/25(水) 20:17:42.71ID:yLKDWYik0
学習時だと言うてはるで
精度に問題がある評価関数で探索時に小細工を弄しても弱くなるだけだが
学習時も込みで一貫してその規則でやるんならノイズ除去の効果が気体できるのかもしれん
0349名無し名人 (ワッチョイ 31d2-CAZb)
垢版 |
2017/10/25(水) 20:50:14.13ID:6PyORwWG0
透@co2845229

少し早いですが
☆Happy Halloween☆
お菓子(評価関数)配ります

https://goo.gl/4sx3e7

tamoreGK
0353名無し名人 (ワッチョイ bab3-gcVe)
垢版 |
2017/10/25(水) 21:27:09.39ID:E62DcdF+0
tamoreの透さんも開発者の人と同じで惜しげもなく公開してくれるので、ほんとありがたいよね。
0355名無し名人
垢版 |
2017/10/25(水) 21:43:17.15ID:UTLxZJ6Y0
>>349
アイテムが存在しない可能性があります。または、使用できなくなっています。
アイテムが削除された、期限切れになっている、または表示するアクセス許可がない可能性があります。詳細については、このアイテムの所有者に問い合わせてください。
0358名無し名人 (ワッチョイ c181-PPE6)
垢版 |
2017/10/25(水) 22:00:03.50ID:ptdlT0520
ponanza予選落ちあるの?
0359名無し名人 (ワッチョイ 2672-wYkv)
垢版 |
2017/10/25(水) 22:09:40.33ID:DsfczZjn0
2つにあげるの面倒かもしれないけど、斧とクラウドの両方にあげるのが一番いいとおもうんだけどなぁー。

公開してからの最初の2,3日はどうしても制限こえちゃうだろうし。
0360名無し名人
垢版 |
2017/10/25(水) 22:10:42.28
アップローダーもすぐ削除しちゃうし
気が利かねーなー
0367名無し名人 (ワッチョイ c1dc-9EwV)
垢版 |
2017/10/25(水) 23:05:57.65ID:S/al+0Qc0
>>364
これ作者のアップロードなの?
そうじゃなかったら他人が勝手にアップロードするのは良くないんじゃないのか?
これの作者はちゃんと元の開発者に許可を貰ってアップロードしているわけだし
0374名無し名人 (ブーイモ MMc5-cYBd)
垢版 |
2017/10/26(木) 00:29:45.90ID:32Zh07//M
ロダならここがいいよ

BitSend: 無料容量無制限のファイル転送サービス
https://bitsend.jp/

保存期間が14日な代わりに
容量も転送量も無制限でダウンもアップも結構早い
0375名無し名人 (ワッチョイ 9b1b-tN/E)
垢版 |
2017/10/26(木) 00:49:54.04ID:DR+JNO+W0
>>364
これ作者じゃないだろ
リドミも読んでないのか?
あーあ、コイツのせいで公開してくれなくなったらどうすんだ
4ねガイジ
0378きふわらべ ◆WARAPtPOOU (ワッチョイ 41b3-xXVv)
垢版 |
2017/10/26(木) 03:06:57.84ID:0/FiitaD0
試算したぜ。

(0)000000000000000000000000000000000000000000000- <0>46
(1)111111111111111111111110000000000000000000000- <1>23 <0>23
(2)22222222222 11111111111 20 11111111111 0000000000- <2>12 <1>22 <0>12
(3)333333222222 2222211111 21 2222211111 11111100000- <3>6 <2>17 <1>17 <0>6
(4)444333 3333333322222222 31 2222222211111111 11100- <4>3 <3>12 <2>16 <1>12 <0>3
(5)54 544333 44443332 3333333322222221 222222111110 1- <5>2 <4>7 <3>14 <2>14 <1>7 <0>2
(6)65 555444 54444443333333 43333332222222 32221111 1- <6>1 <5>5 <4>10 <3>14 <2>10 <1>5 <0>1
(7)75 6655 5555544444 44444443333333 3333322222 2211 2- <7>1 <6>2 <5>8 <4>12 <3>12 <2>8 <1>2 <0>1
(8)86 76665555 65555554444443 444444333332 33332221 2- <8>1 <7>1 <6>5 <5>10 <4>12 <3>10 <2>5 <1>1 <0>1

8勝、7勝、6勝は勝ち抜け。5勝のうち 5つ勝ち抜け、5つ敗退。
6回戦の時点までに5分、7回戦の時点に勝ち越していれば、最後に勝てば くじ運で駆け込めるかも。
裏街道には 4回戦までには乗っておけだぜ。
4回戦時点での一着が 後半の強い当たりで 敗退することもありえる。
0381名無し名人 (ワッチョイ a160-m54f)
垢版 |
2017/10/26(木) 09:11:44.90ID:5RUNWuIS0
>>379
evalってフォルダあるだろ?
その中身と入れ替えるんだ
同じファイル名でサイズが違うだけだから分かるだろ
0386名無し名人 (ワッチョイ 891b-2BLp)
垢版 |
2017/10/26(木) 12:24:03.16ID:sB+Eb5dg0
対戦させるのって時間かかるなあ
10秒で50戦の設定でやってるけど
12時間たってもまだ33戦しかできてない
コンピューター将棋って一局が200手越えるのがやたら多い
0388名無し名人 (スププ Sd33-7D0c)
垢版 |
2017/10/26(木) 16:30:20.84ID:ifYmxjYAd
Burn_The_BrigeはBURNING_BRIGEのパクリ
パクリモン本当に気持ち悪いな
0390名無し名人 (ワッチョイ 33e0-7D0c)
垢版 |
2017/10/26(木) 17:05:47.30ID:MmUxKZzn0
yaselmoの導入記事のPV伸ばすためにfloodgateで八百長して印象操作しようとしたみたいだけど、開発者の人たちがみんなyaselmoよりtamoreの方が強いって事実をツイートしたから工作活動失敗したみたいだね。
PVの稼ぎ方がセコイんだよな。
0391名無し名人 (ワッチョイ 93f2-nE1B)
垢版 |
2017/10/26(木) 17:13:40.02ID:217cIYUG0
>>388
パクリしかできない脳なんでしょう。
正直気分悪い。
BURNING_BRIGEはあと数局だけ放流します。
0393名無し名人 (ワッチョイ 9984-OM28)
垢版 |
2017/10/26(木) 18:57:37.98ID:S9mqHndG0
試しに覗いてみたらやはりsuimonがいるなw
0394名無し名人 (スプッッ Sd73-Sj+i)
垢版 |
2017/10/26(木) 19:40:57.64ID:80AV2eSTd
結局、Burn_The_Brigeはスイモンの40コア?yaselmoだったの?
0395名無し名人 (ワッチョイ 891b-20SA)
垢版 |
2017/10/26(木) 20:02:24.49ID:cZV6TOno0
tamoreとyaselmoをcorei7-7700kのpcで対戦させた
tamoreの方が強いという評判だったが思ったより差がなかった

1秒で50局対戦の結果が

対局数50 先手勝ち34(69%) 後手勝ち15(30%) 引き分け1

tamore
勝ち20(40%) 先手勝ち15(60%) 後手勝ち5(20%)

yaselmo
勝ち29(59%) 先手勝ち19(79%) 後手勝ち10(40%)

10秒で50局対戦の結果が

対局数50 先手勝ち30(62%) 後手勝ち18(37%) 引き分け2

yaselmo
勝ち23(47%) 先手勝ち14(60%) 後手勝ち9(36%)

tamore
勝ち25(52%) 先手勝ち16(64%) 後手勝ち9(39%)

20秒で10局対戦の結果が

対局数10 先手勝ち6(60%) 後手勝ち4(40%) 引き分け0

tamore
勝ち5(50%) 先手勝ち3(60%) 後手勝ち2(40%)

yaselmo
勝ち5(50%) 先手勝ち3(60%) 後手勝ち2(40%)
0396名無し名人 (スプッッ Sd73-Sj+i)
垢版 |
2017/10/26(木) 20:08:45.40ID:80AV2eSTd
>>395
対局数が少なすぎるな。有意差も無いからせめて500局はやらないと。
0398名無し名人 (ワッチョイ 9bdc-xXVv)
垢版 |
2017/10/26(木) 20:15:13.14ID:86j/4W390
評価関数の優劣だけの評価だったら、探索深度1に固定して互角局面から開始でいいんじゃないの?
時間もかからんし。
0399名無し名人 (ワッチョイ 41b3-20SA)
垢版 |
2017/10/26(木) 20:19:45.76ID:18Uxcz/80
elmo以降、深く読ませて初めて強い評価関数というものばかりなのだ
そのせいで学習自体よりも強くなったかの確認のほうが時間がかかる事態に
0400名無し名人 (ワッチョイ 9bdc-xXVv)
垢版 |
2017/10/26(木) 20:31:04.42ID:86j/4W390
それ評価関数が強くなったというよりは探索との相性が向上したってことだよね、きっと。
まぁ、結果的には必ず探索とセットで使うわけだから強くなったことには変わりないだろうけど。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況