X



トップページ将棋・チェス
1002コメント373KB
▲コンピュータ将棋スレッド132
■ このスレッドは過去ログ倉庫に格納されています
0001
垢版 |
2018/01/31(水) 15:00:17.89
!extend:checked:vvvvv:1000:512

↑スレ立て時は1行目と2行目に「!extend:checked:vvvvv:1000:512」をコピペして立てて下さい
荒らし対策のために強制コテハン(ワッチョイ)を表示するコマンドです

叡王戦公式HP
http://www.eiou.jp/
第27回世界コンピュータ将棋選手権 参加チーム
http://www2.computer-shogi.org/wcsc27/team.html
詰将棋メモ コンピュータ将棋2017
http://toybox.tea-nifty.com/memo/2017/01/post-965e.html
世界コンピュータ将棋選手権参加ソフトリンク集
http://www.ne.jp/asahi/tetsu/toybox/soft/softlink.htm
floodgate 最新2週間レーティング
http://wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html
コンピュータ将棋協会
http://www.computer-shogi.org/
コンピュータ将棋
http://ja.wikipedia.org/wiki/%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E5%B0%86%E6%A3%8B
将棋フリーソフト rating on single machines(各ソフトのレーティング評価)
http://uuunuuun.wix.com/shogi-engines

※前スレ
▲コンピュータ将棋スレッド131
https://mevius.5ch.net/test/read.cgi/bgame/1514647679/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured
0149名無し名人 (ワッチョイ bfdc-VW3n)
垢版 |
2018/02/03(土) 22:33:05.02ID:WFL8HojI0
ポナ山さんは前言撤回することになんら躊躇をしない人間だから、
重箱の隅をつついても何も意味がないかもしれない。
0151名無し名人 (ワッチョイ 9fbd-CNA0)
垢版 |
2018/02/03(土) 23:08:10.05ID:2a+e19uu0
いやすまん>>148のは「エントリ」の用語の使い方が変だったが
やっぱ置換表サイズが64K * 32 Byteのとき、16 bitでしか識別されないんじゃ…

やねうら王の1エントリは10 Byteで、それが3エントリ束になったやつを32 Byteに収まるしくみ。よって、
>2. ハッシュキー下位log2(置換表のサイズ/32)ビットを使ってビンに振り分ける
というのは単に transp_tab[(64 bitのハッシュキー) % (置換表の一束3エントリの総数)]を参照する、と言っているに過ぎず、
これ自体はどんな置換表でもやることなので、>>148では局面の識別のうちに含めていない。(これが>>150との+16 bit分の食い違いと思われ

で、常識的な置換表なら、局面sのハッシュキーからエントリまで特定した後、そのエントリが本当に局面sの情報を記憶しているのか
確かめるためにハッシュキーの全ビットの等値判定をやるはずなんじゃ(つまり常識的には64 bitの等値判定が要る
そこが>>133では16 bitで済まされている、、
0152名無し名人 (ワッチョイ 97bd-VW3n)
垢版 |
2018/02/03(土) 23:21:04.28ID:zUxaZBnX0
>>151
キーは64bitだけど、
例だと置換表へのアクセスはキーの下位16bit(64K)がエントリの特定に使われて、
特定されたエントリ内でキーの上位16bitが合致するものがあるかどうかを見るから
例だとキー64bitの内、本当にキーとして使われるのは上位16bit+(使われない32bit)+下位16bit(エントリー数分)で
32bitになる所までは良い?

エントリー数は普通もっと大きいので、下位24+αbit位がエントリの特定に充てられて、
上位16bitと合わせれば40bit+α位は実際に使われるキーとして担保されると思うんだけど、
どこか間違ってる?
0154名無し名人 (ワッチョイ 9fbd-CNA0)
垢版 |
2018/02/04(日) 01:35:12.92ID:23gFbzJ50
>>152
ハッシュキーの有効ビット数が32 bitというのは見積もりが甘すぐる…

ビンの数が64 K個で、ハッシュは理想的
(現実に現れる局面が、64 bit(96 bitでも良いが)のハッシュキー空間に一様に分布 && 下位16 bitと上位に相関が無い
とすると、1個のビンは平均64 K回に1回参照される。
置換表サイズを大きくすることでビンの参照周期が伸びれば確かに参照回数(≒時間)当たりの衝突頻度は下がるが、
1個のビン特定後の事後確率としての衝突確率はなんら下がらない
そいつはハッシュキーの上位16 bitでしか比較しないのだから、やっぱ1/64 K程度になるであろう
0155名無し名人 (ワッチョイ 9fbd-CNA0)
垢版 |
2018/02/04(日) 01:40:57.76ID:23gFbzJ50
いやスマン参照するビンの中のエントリが先客で満杯ばかりだとすると、
 誤:参照回数(≒時間)当たりの衝突頻度は下がる
 正:参照回数(≒時間)当たりの衝突頻度は下がらない

よって>>133のしくみは長期間置換表をクリアせずにいるとかなりヤヴァげ
0156名無し名人 (ワッチョイ 9fbd-CNA0)
垢版 |
2018/02/04(日) 01:48:05.06ID:23gFbzJ50
で、衝突を避けるために1ビンの中に3エントリ設けているわけだが
ビンの中が満杯のとき、たまたまどれかのエントリの記憶する16 bitがハッシュキーの上位16 bit一致する確率は、p=1/(64 K)として
 P = 3_C_1 * p * (1-p)^2 + 3_C_2 * p^2 * (1-p) + 3_C_3 * p^3
だけあって、一致したのだけれどそれで正解という(一致後の事後)確率は1/(ハッシュキーの総数)でしかないから
 置換表を頻繁にクリアする(結果、ビンの中のエントリに大概空きがある)
という条件でも追加しない限り、
>>133の置換表は毎回だいたい確率Pで衝突を起こす
、、、
0159名無し名人 (ワッチョイ bfdc-VW3n)
垢版 |
2018/02/04(日) 02:19:33.32ID:cijW0OOR0
>>156
難しい説明ごくろうさま。
で、内容はさっぱり理解できないんだけど結局のところ野田さんと山本さんとどっちがあってるの?
0160名無し名人 (ワッチョイ 9fbd-CNA0)
垢版 |
2018/02/04(日) 02:25:08.50ID:23gFbzJ50
>>159
山本氏発言の
>ハッシュキーサイズは16bit(!)
というのは確かに筆が滑った感じで、正しくは
>置換表エントリのハッシュキーの記憶サイズは16bit(!)
なん
ジャマイカ

それ以外(驚愕した動機)はだいたいあってる
0163名無し名人 (ワッチョイ bf1b-j81/)
垢版 |
2018/02/04(日) 08:29:15.41ID:kythLk+C0
Rota_JP

Aperypaq対15gou 209-195-25
探索Yane4.80AVXT
1500万局面/手(一手0.75秒(35T))
定跡オフ,Ponderオフ,投了値3000,引き分け256手

だってさ
Aperypaqにすら勝ち越しできない
Raina_i3 mixE_i3 この人でしょ
定跡使って上位に一発入っただけなのを勘違いしちゃった恥ずかしい御仁
だいたい作成日がねぇ・・・
自分で計測したのを出さずに急ごしらえでキメラ()しただけのgm
0165名無し名人 (ワッチョイ 9776-FvYi)
垢版 |
2018/02/04(日) 09:35:15.05ID:ewLIAglm0
広い世界でponanzaと出逢ったことで
自由な序盤へ my destiny
永遠に変わらない独自性を感じてるよ
いくつもの季節 ponanza流で戦って行こう
0169名無し名人 (ワッチョイ 9ff2-phf3)
垢版 |
2018/02/04(日) 13:23:25.92ID:FehoM9nH0
15gou x 最高R
3500万ノード 200局 book無 局面集無
15gou の勝率 41% でした・・・
0170名無し名人 (ワッチョイ bf51-wbgk)
垢版 |
2018/02/04(日) 13:43:42.27ID:x/3HzSN90
みんな測定に付き合って優しいね
0171名無し名人 (ワッチョイ b70c-am6q)
垢版 |
2018/02/04(日) 13:47:38.69ID:AN+aS2Fa0
>>159
この内容が分からないというのは開発能力がないひまわりか
0172名無し名人 (ワッチョイ bfdc-VW3n)
垢版 |
2018/02/04(日) 14:25:12.76ID:cijW0OOR0
>>171
んじゃ、わかってるようだから追加で説明を頼むわ。
どうして>>154 - >>157の説明で山本さんがだいたいあってるといえるのか、
要点をかいつまんで解説してくれ。
まぁ、どうせわかってないんだろうけど。
0173名無し名人 (ワッチョイ 9f7f-YNSJ)
垢版 |
2018/02/04(日) 14:42:48.95ID:3LNvAP2m0
>>169

最高R凄いね、ぜひ公開を
0175名無し名人 (ワッチョイ b70c-am6q)
垢版 |
2018/02/04(日) 14:59:59.72ID:AN+aS2Fa0
149 名無し名人 (ワッチョイ bfdc-VW3n) sage 2018/02/03(土) 22:33:05.02 ID:WFL8HojI0
ポナ山さんは前言撤回することになんら躊躇をしない人間だから、
重箱の隅をつついても何も意味がないかもしれない。
0176名無し名人 (ワッチョイ 9fd4-R0UW)
垢版 |
2018/02/04(日) 15:17:21.28ID:M9vWvbOj0
https://www.axfc.net/u/3885896
https://www.axfc.net/u/3885897

評価関数を2つ公開します

どちらもまだ検証が不十分ですが、aperypaqにはやや勝ち越せるのではないかと思います
同じ局面でもaperypaqとかなり評価が異なることがしばしばあるので中々面白いです

興味のある方は検証や改造などして遊んでみてください
検証して下さる方がいれば期待できそうな方の評価関数を絞ろうと思います


※後手番で希にあっという間に不利になる手順に飛び込むことがあるのでご注意下さい
0180名無し名人 (ワッチョイ 9fbd-CNA0)
垢版 |
2018/02/04(日) 18:11:20.78ID:23gFbzJ50
>>156訂正;
 誤: P = 3_C_1 * p * (1-p)^2 + 3_C_2 * p^2 * (1-p) + 3_C_3 * p^3
 正: P = 3_P_1 * p * (1-p)^2 + 3_P_2 * p^2 * (1-p) + 3_P_3 * p^3
 誤: (一致後の事後)確率は1/(ハッシュキーの総数)
 正: (一致後の事後)確率は1/(ハッシュキーの総数/(2^16 * (置換表のビン数)))
(∵エントリの特定に至った時点でハッシュキーの最上位16 bitと置換表のビンの数にあたる下位bitは一致がもともと確定

■ 具体的数値
ハッシュキー64 bit(で局面の識別に十分と仮定)、
最上位16 bitのみ等値比較、ビンの中の3エントリがどこも満杯とする。
置換表サイズ(ビン数)   p       P       r     衝突頻度(=1/(P*r))
--------------------------------------------------------------------------------
64 K           1.53e-5      4.58e-5   1.00   2.18万回に1回
512 M           1.53e-5      4.58e-5   1.00   2.18万回に1回
※ pとPは置換表サイズに拠らない。(ビンの中に3エントリかつエントリ特定にハッシュキーの16 bit等値比較、で確定
※ rは上で訂正した「(一致後の事後)確率」の逆数で、エントリ特定済条件での衝突確率。置換表サイズ依存だが64 K v.s. 512 Mでは差が出ない。

→2.18万回に1回衝突とか使い物にならない。>>133の置換表は満杯になるような使い方をしてはいけない
 置換表サイズに対する勝率は、「どのビンにも空きエントリがある」が満たされた時点で頭打ちになる(そこから先はいくら置換表を大きくしても勝率が伸びない)と予想
0181名無し名人 (ワッチョイ 9ff2-phf3)
垢版 |
2018/02/04(日) 18:26:41.84ID:FehoM9nH0
>>173
もう少し対局追加してみているのですが、
今度は15gouが勝ち星リード(57%程度)しているので
対局数が500局くらいでないと結果でないかもです。
15gouが強いのは間違いなさそう。
この「最高R」に途中経過でも勝ち越せるソフトは過去いなかったので。
0182名無し名人 (ワッチョイ 9f61-kjSK)
垢版 |
2018/02/04(日) 18:27:39.60ID:aj9UJ/cp0
>>129
こちらの環境では1手1500ノードで有意差なさそうです
でも公開してくれてありがとうございました

>>163
Raina_i3 mixE_i3の人ではなさそう
あの人、一個も評価関数公開しなかったし

>>176
早速ダウンロードさせていただきました、ありがとうございます
0190名無し名人 (ワッチョイ 9f33-TMxv)
垢版 |
2018/02/04(日) 22:37:16.00ID:cLjH3Fxu0
>>188
2戦目は定跡抜けた後のがっぷり四つから、一手の読み勝ちでカカロットの勝ち。
(読み筋はどちらも同じで評価だけ違った)
まだ対局回数が少ないとは言え、R4400を狙える力はあるのかも。
0193名無し名人 (ワッチョイ 97b3-xIbb)
垢版 |
2018/02/05(月) 13:21:43.18ID:soyes9Kk0
今までのやり方でAlphaZeroに迫っているのを見ると、それだけ将棋は探索の効果がでかいということだろうか

それともこっそりDLが混じってるとか?
0194名無し名人 (ワッチョイ 57b3-wbgk)
垢版 |
2018/02/05(月) 14:12:26.36ID:zdGtM7Br0
そもそもAlphaZeroの結果が謎が多すぎる。
なんでそんな簡単にelmoのすぐ上に行けたのか、なんでそこで止まってしまったのか。
0195名無し名人 (ワッチョイ 9f61-kjSK)
垢版 |
2018/02/05(月) 15:25:15.79ID:/QmbCzK30
YSSの人がレーティングと実際の勝率について書いてたけど、コンピュータも人間もレーティング差が大きいとeloレーティングに基づく勝率よりも5割に近づく
実際のAlphaZeroはもっと強い可能性がある
0196名無し名人 (ワッチョイ 97b3-xIbb)
垢版 |
2018/02/05(月) 15:57:28.43ID:soyes9Kk0
レート自体は自己対戦から出してるとのことだから相対的に控えめに出てる可能性もある?

とりあえず多めにR4600と見つもっておこう。
0197名無し名人 (ブーイモ MMdb-ghwr)
垢版 |
2018/02/05(月) 16:16:03.93ID:IdqvXfybM
いっそ計測はelmo基準にすれば良くない?
対elmo特化の戦績だとしても
その方がAlphaZeroの棋風を擬似的に再現してる可能性という意味で需要あるし
0198名無し名人 (ワッチョイ 9f61-kjSK)
垢版 |
2018/02/05(月) 16:34:04.16ID:/QmbCzK30
>>196
AlphaZeroグラフ自体は自己対戦からだろうけど、縦軸の数値はuuunさんのサイトとelmoとの対局で当てはめたものだと推測
とはいえ30万ステップ以降のグラフの伸びがほぼ横ばいでそれでいて不安定なのは間違いないですね
0199名無し名人 (ワッチョイ f77e-j81/)
垢版 |
2018/02/05(月) 18:47:54.82ID:r0lbn83N0
混ぜると強くなる理由

https://github.com/gcp/leela-zero/issues/814#issuecomment-362931617

Averaging weights from nearby networks decreases noise from mini-batch gradient calculations.
If the network is very near the optimum then the weights don't change much during the training
and we can think that the network weights are the optimal weights plus
some noise caused by the stochastic gradient calculation.
Averaging the weights decreases the amount of noise in weights
and brings the network closer to the optimum.
Same effect can be had if learning rate is decreased.

だって
学習率下げた時の段差と関係あったのか
0200名無し名人 (ワッチョイ 9fd4-R0UW)
垢版 |
2018/02/05(月) 19:20:59.36ID:TaydH65C0
そもそも学習率はあまり大きくするべきではないんですよね、収束までは遅くなりますけど
elmo絞りをするならなおのこと学習率は小さくするべきだと思います
0201名無し名人 (ワッチョイ bfdc-VW3n)
垢版 |
2018/02/05(月) 21:02:32.38ID:0fgThXEN0
学習率をただ下げてもダメだそうだぞ。
線形評価関数ではないが、DeepLearningの世界では小さすぎる学習率は局所解に収束してしまう要因として挙げられている。
0202名無し名人 (ワッチョイ 1fb0-VW3n)
垢版 |
2018/02/05(月) 21:10:26.59ID:NSaultao0
>>119
機械学習の専門家はいつもこんなこと議論してるの?
コンピュータ将棋にもこういうコミュニティはないのかしら
0206名無し名人 (ワッチョイ 9fd4-R0UW)
垢版 |
2018/02/06(火) 20:56:16.81ID:r3l1yIaI0
先手勝率が上がって引き分けはさらに多くなるでしょうね
今の時点でも少し長めの時間で100局やれば10〜15局くらいは千日手になりますし
0207名無し名人 (ワッチョイ 97b3-xIbb)
垢版 |
2018/02/06(火) 21:02:38.83ID:jKt2sVsN0
AlphaZeroが本格的にそういう領域に入ってきてるとすると、数値以上に壁が高い

かもしれない。
自己対戦の先手後手の勝率も知りたいものだ
0208名無し名人 (ワッチョイ bf9d-ksqG)
垢版 |
2018/02/06(火) 22:07:27.33ID:mJblaAuW0
Stockfish 9が2月1日にリリースされた
SILENT_MAJORITY 1.26がでるかも?
0210名無し名人 (ワッチョイ 9f33-TMxv)
垢版 |
2018/02/07(水) 07:53:07.00ID:Jz1KOTci0
>>209
魔女は長いことアップデートされてないから、stockfishの
正規アップデートとは関係なしにそろそろあるんじゃねとは思うが
0211名無し名人 (ワッチョイ 9f07-am6q)
垢版 |
2018/02/07(水) 12:22:38.86ID:19LcPCVk0
かなり過疎ってるな
0212名無し名人 (ブーイモ MMbf-YO6I)
垢版 |
2018/02/07(水) 14:32:41.27ID:XeMJ4gu7M
開発者の側が開発に飽きてるから過疎るのも仕方ない
0218名無し名人 (ワッチョイ 9f61-kjSK)
垢版 |
2018/02/07(水) 18:03:27.27ID:1VBovYPy0
検証が必要なもの

>>129

>>176

48 @bleu48
YaneuraOuをWSL上でclang使ってビルドするだけで5%近く速くなるな。電王トーナメント前の比較だとほとんど変わらなかったんだけど
0222名無し名人 (ワッチョイ 9f33-kohO)
垢版 |
2018/02/07(水) 22:00:51.52ID:Jz1KOTci0
WCSC28のエントリーも出揃ったし、キャンセルが出たりテストが水門に出てこなければ
過疎はむしろ当然。
0223名無し名人 (ワッチョイ 97b3-VW3n)
垢版 |
2018/02/07(水) 22:18:29.99ID:cP//pLA+0
山本はなんで引退したの?
将棋プログラムしか組めない人なんでしょ?
0226名無し名人 (スププ Sd62-wLeo)
垢版 |
2018/02/08(木) 01:09:45.94ID:jV4b7Ybxd
コンピューター将棋はカツ丼将棋が全自動対局ツール作ったところでもうやれる事はいきついた気がする
0227名無し名人 (ワッチョイ c2e9-KAzQ)
垢版 |
2018/02/08(木) 06:06:38.68ID:rClelw7V0
カツ丼さんの全自動対局ツール、やねさんが貢献してるらしいね。やねさん、あまり時間もやる気もないみたいだけど、他の開発者に協力を惜しまない姿勢は素晴らしいね。
0228名無し名人 (ワッチョイ 81b3-+g9t)
垢版 |
2018/02/08(木) 07:55:18.57ID:8wL4mbQL0
下山さん切るなんて薄情な奴だな
0229名無し名人 (ワッチョイ 7961-XlCv)
垢版 |
2018/02/08(木) 09:12:34.79ID:rsgkeDNn0
今のエッセイは単純につまらん。どっかで聞いたような話しかしてない。
コードのアウトプットをしてるプログラマーならそれでも興味持てるが
専業ポエマーでは話にならん。
0231名無し名人 (ワッチョイ be99-eUPV)
垢版 |
2018/02/08(木) 15:05:40.09ID:XgLfrKcc0
あから2010の段階で羽生を上回ってなかったか?
情報処理学会が名人と互角以上って言ってるのに清水を出してきた
対局も、あれは清水がミスったというかフルボッコだった
0233名無し名人 (ワッチョイ 99b3-jA6l)
垢版 |
2018/02/08(木) 15:49:35.86ID:3BtSeSyI0
あからってレート2800くらいだから、勝率で羽生さん越えはないな。
だけどあの当時のコンピュータに対する舐めた考え方のままだと、初見は絶対勝てなかったとは思う。
0238名無し名人 (ブーイモ MMb6-3Hos)
垢版 |
2018/02/08(木) 17:38:55.07ID:2Yun+FXwM
対戦成績を見ると
対ソフトは棋力よりも若さが大事っぽい
30歳近くになると新しい将棋に対応するのは困難みたいだね
0239名無し名人 (ワッチョイ 99b3-jA6l)
垢版 |
2018/02/08(木) 17:40:36.07ID:3BtSeSyI0
クジラちゃんもそうだけど、勝ってるときの大規模クラスタはとんでもない位置から読み切っちゃってるから、実力以上に謎の絶望感がある。
なお負けるときはとんでもないポンコツ
0242名無し名人 (ワッチョイ c223-nHV3)
垢版 |
2018/02/08(木) 18:01:34.56ID:N9fM8VJk0
まふ定跡最新版については信頼はしているので、
ohgaさんがどこまで思考部を鍛えられるかじゃないかなあ。
先週水門に投入した(まふ関数?)のは普通に野良関数に読み負けてたし。
それに打倒ponanza・技巧が消えて、去年ほどの計算資源が提供されるかどうかも。
0243名無し名人 (ワッチョイ c223-nHV3)
垢版 |
2018/02/08(木) 18:04:25.59ID:N9fM8VJk0
>>239
去年のクジラちゃんレベルまで計算資源が集まると、負けもそこまでポンコツじゃない。
まふ定跡をきっちり2回メタられたelmoと、うかむ瀬評価関数の限界が出た2回のponanzaと、
だからね(技巧戦の負けはコインの裏表のような気がする)

keep alive?
0245名無し名人 (ワッチョイ c27c-Db5I)
垢版 |
2018/02/08(木) 23:56:06.91ID:oLgBNCv40
囲碁ソフトのオープンソースのプロジェクトでアルファ碁と同じ学習サイズのVN作った人がいるんだけども、300Mない。
恐らくAlphaGoのValuenetもそれくらいにおさまるんじゃないかと思う。
これに比べて将棋のKPPT評価関数はものすごくファイルサイズでかいよね?
表現力が飽和してると言われてるけれども、実はものすごく大雑把につじつま合わせをしてるだけで、細かくズームしていくとほとんど出鱈目なんじゃないだろうか?
0247名無し名人 (ブーイモ MM62-3Hos)
垢版 |
2018/02/09(金) 00:38:43.85ID:nwG+na0jM
時代はKPP_KKPTですぜ兄貴
合成なしでもAperyクラスに到達出来るようだし
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況