X



トップページ将棋・チェス
1002コメント373KB
▲コンピュータ将棋スレッド132
■ このスレッドは過去ログ倉庫に格納されています
0001
垢版 |
2018/01/31(水) 15:00:17.89
!extend:checked:vvvvv:1000:512

↑スレ立て時は1行目と2行目に「!extend:checked:vvvvv:1000:512」をコピペして立てて下さい
荒らし対策のために強制コテハン(ワッチョイ)を表示するコマンドです

叡王戦公式HP
http://www.eiou.jp/
第27回世界コンピュータ将棋選手権 参加チーム
http://www2.computer-shogi.org/wcsc27/team.html
詰将棋メモ コンピュータ将棋2017
http://toybox.tea-nifty.com/memo/2017/01/post-965e.html
世界コンピュータ将棋選手権参加ソフトリンク集
http://www.ne.jp/asahi/tetsu/toybox/soft/softlink.htm
floodgate 最新2週間レーティング
http://wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html
コンピュータ将棋協会
http://www.computer-shogi.org/
コンピュータ将棋
http://ja.wikipedia.org/wiki/%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E5%B0%86%E6%A3%8B
将棋フリーソフト rating on single machines(各ソフトのレーティング評価)
http://uuunuuun.wix.com/shogi-engines

※前スレ
▲コンピュータ将棋スレッド131
https://mevius.5ch.net/test/read.cgi/bgame/1514647679/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured
0122名無し名人 (ワッチョイ 9f61-kjSK)
垢版 |
2018/02/03(土) 15:39:56.31ID:/LBiStS60
>>119-120
ありがとうございます。手持ちの評価関数に1手1500万ノード以上、対aperypaqで有意差もって勝ち越せる評価関数はないので比較検証用にも助かります
0130名無し名人 (ワッチョイ bfdc-VW3n)
垢版 |
2018/02/03(土) 19:08:45.01ID:WFL8HojI0
>>114
王の駒の価値を勝敗を表す数値にして、いくら駒得しても評価値がその数値を超えることがないっていう設定にしたらどうなる?
具体的にいうと王の駒の価値を3万とかにして、他の駒価値の積算でもし3万を超えたらそれは3万ですってことにするっていう感じ。
そうすると、金とってから王とっても、王を先にとりにいっても同じ価値だからどっちを選ぶかは運しだいとかめんどくさいことになるかw
0131名無し名人 (ワッチョイ b781-36QX)
垢版 |
2018/02/03(土) 19:38:47.94ID:eU0nl1vO0
A級最終日はみんな見るのか?
0133名無し名人 (スプッッ Sd8b-sLXN)
垢版 |
2018/02/03(土) 19:59:33.95ID:lwbjfnBpd
聖人野田さんおこなの?

山本一成@Ponanza
@issei_y
なのでPonanzaは96bitのハッシュキーを使用している。でも最近の将棋・チェスプログラムじゃハッシュキーサイズは16bit(!)を使用しているみたいだ。
ハッシュキーのコンクリートよりもテーブルサイズの圧縮によるキャッシュ効率の向上をとっている。
正直ちょっとやばい(褒め言葉です)

nodchip@tanuki- @nodchip ・ 19:47:48
@issei_y 補足させていただきます。Stockfish/やねうら王の置換表の実装は
1. 局面を64bitに圧縮したハッシュキーを作る
2. ハッシュキー下位log2(置換表のサイズ/32)ビットを使ってビンに振り分ける
3. 一つのビンは最大3エントリ保存できる
(続く)

@issei_y (承前)
4. エントリに対応する局面の等値判定はハッシュキーの上位16ビットを使用する
となっております。後学のためにご教示願いたいのですが、参照された「最近の将棋・チェスプログラム」は何でしょうか?
Twitter Web Client

PEZYに関するフェイクニュースに対して怒りを露わにする @tanakh 先生の気持ちが少しだけわかった気がする
0134名無し名人 (ワッチョイ 979f-am6q)
垢版 |
2018/02/03(土) 20:06:55.68ID:BgX4yei50
>>133
これ将棋ブロガー?
0135名無し名人 (ワッチョイ f746-VgVe)
垢版 |
2018/02/03(土) 20:33:08.76ID:LmKzRSs10
山本はこのまま知識人を気取り続けるつもりなのか?
将棋ソフトの開発してたほうがよっぽど充実した人生になるんじゃないか
0137名無し名人 (ワッチョイ bf9d-wbgk)
垢版 |
2018/02/03(土) 20:41:10.11ID:XavuAZxN0
>>133
単純に興味からの質問と好意的な見方をしましょう^^;

>>135
AKB辞めたAKB元メン状態だなPona本。
Pona本からコンピューター将棋を取ったらただの人だが、
そもそも開発を進めてくれる共同開発者がいないからもうどうしようもない手詰まりの状態
0142名無し名人 (ワッチョイ 9f7c-C7gl)
垢版 |
2018/02/03(土) 21:31:30.46ID:q8MugN0/0
野田さんも一言多いな。間違ってるなら指摘するだけでいいのにフェイクニュースとか
レッテルを貼ってるのはどっちなんだろうか?
0143名無し名人 (ワッチョイ 97eb-phf3)
垢版 |
2018/02/03(土) 21:48:57.21ID:bZ+Pu6y10
"PEZYに関するフェイクニュースに対して怒りを露わにする @tanakh 先生の気持ち"が少しだけわかった気がする
どう読んでもフェイクニュースに対して怒っているのはtanakhさんで少しだけわかったって言ってるだけでしょ
0145名無し名人 (ブーイモ MMcf-YO6I)
垢版 |
2018/02/03(土) 22:12:31.75ID:T8rDsS5vM
後学のために〜以降は指し過ぎでしょう
将棋じゃないんだからキッチリ詰ませても遺恨が残るだけなのに
0146名無し名人 (ワッチョイ 9f61-kjSK)
垢版 |
2018/02/03(土) 22:15:02.47ID:/LBiStS60
山本一成@Ponanza @issei_y
Ponanzaは引退しない。
Ponanzaは世界コンピュータ将棋選手権の決勝に進出できないぐらいグチャグチャのボコボコに負けるまで引退しない。
だから安心して挑みかかってくるといいよ

今年の世界コンピュータ将棋選手権で、とうとう超強豪であるYSSと激指が決勝進出できなくなったことには意味がある。
一番いい時期で止めずに戦い続けたことに私は敬意を払いたい。
だからPonanzaも最後まで戦う。それこそがコンピュータ将棋への最大の恩返しだ。



これが一年ちょい前の発言
そしてここ半年の発言と行動考えると将棋ソフト開発者の心中察する
0147名無し名人 (ワッチョイ 9fdd-FFDM)
垢版 |
2018/02/03(土) 22:20:34.29ID:ef9DV1w10
AKBというより完全に盛りを過ぎたモー娘。
現、元メンバーがやりやってワイドショーで
小さく紹介されるみたいなショボい業界
0148名無し名人 (ワッチョイ 9fbd-CNA0)
垢版 |
2018/02/03(土) 22:26:44.87ID:2a+e19uu0
置換表のハッシュキーが64bittだったとしても
置換表のサイズが2のべき乗で例えば64K エントリ(16 bit)だったとしたら、
>>133なしくみでは全ての局面が16 bitでしか識別されていないということになって山本氏完全勝利
0149名無し名人 (ワッチョイ bfdc-VW3n)
垢版 |
2018/02/03(土) 22:33:05.02ID:WFL8HojI0
ポナ山さんは前言撤回することになんら躊躇をしない人間だから、
重箱の隅をつついても何も意味がないかもしれない。
0151名無し名人 (ワッチョイ 9fbd-CNA0)
垢版 |
2018/02/03(土) 23:08:10.05ID:2a+e19uu0
いやすまん>>148のは「エントリ」の用語の使い方が変だったが
やっぱ置換表サイズが64K * 32 Byteのとき、16 bitでしか識別されないんじゃ…

やねうら王の1エントリは10 Byteで、それが3エントリ束になったやつを32 Byteに収まるしくみ。よって、
>2. ハッシュキー下位log2(置換表のサイズ/32)ビットを使ってビンに振り分ける
というのは単に transp_tab[(64 bitのハッシュキー) % (置換表の一束3エントリの総数)]を参照する、と言っているに過ぎず、
これ自体はどんな置換表でもやることなので、>>148では局面の識別のうちに含めていない。(これが>>150との+16 bit分の食い違いと思われ

で、常識的な置換表なら、局面sのハッシュキーからエントリまで特定した後、そのエントリが本当に局面sの情報を記憶しているのか
確かめるためにハッシュキーの全ビットの等値判定をやるはずなんじゃ(つまり常識的には64 bitの等値判定が要る
そこが>>133では16 bitで済まされている、、
0152名無し名人 (ワッチョイ 97bd-VW3n)
垢版 |
2018/02/03(土) 23:21:04.28ID:zUxaZBnX0
>>151
キーは64bitだけど、
例だと置換表へのアクセスはキーの下位16bit(64K)がエントリの特定に使われて、
特定されたエントリ内でキーの上位16bitが合致するものがあるかどうかを見るから
例だとキー64bitの内、本当にキーとして使われるのは上位16bit+(使われない32bit)+下位16bit(エントリー数分)で
32bitになる所までは良い?

エントリー数は普通もっと大きいので、下位24+αbit位がエントリの特定に充てられて、
上位16bitと合わせれば40bit+α位は実際に使われるキーとして担保されると思うんだけど、
どこか間違ってる?
0154名無し名人 (ワッチョイ 9fbd-CNA0)
垢版 |
2018/02/04(日) 01:35:12.92ID:23gFbzJ50
>>152
ハッシュキーの有効ビット数が32 bitというのは見積もりが甘すぐる…

ビンの数が64 K個で、ハッシュは理想的
(現実に現れる局面が、64 bit(96 bitでも良いが)のハッシュキー空間に一様に分布 && 下位16 bitと上位に相関が無い
とすると、1個のビンは平均64 K回に1回参照される。
置換表サイズを大きくすることでビンの参照周期が伸びれば確かに参照回数(≒時間)当たりの衝突頻度は下がるが、
1個のビン特定後の事後確率としての衝突確率はなんら下がらない
そいつはハッシュキーの上位16 bitでしか比較しないのだから、やっぱ1/64 K程度になるであろう
0155名無し名人 (ワッチョイ 9fbd-CNA0)
垢版 |
2018/02/04(日) 01:40:57.76ID:23gFbzJ50
いやスマン参照するビンの中のエントリが先客で満杯ばかりだとすると、
 誤:参照回数(≒時間)当たりの衝突頻度は下がる
 正:参照回数(≒時間)当たりの衝突頻度は下がらない

よって>>133のしくみは長期間置換表をクリアせずにいるとかなりヤヴァげ
0156名無し名人 (ワッチョイ 9fbd-CNA0)
垢版 |
2018/02/04(日) 01:48:05.06ID:23gFbzJ50
で、衝突を避けるために1ビンの中に3エントリ設けているわけだが
ビンの中が満杯のとき、たまたまどれかのエントリの記憶する16 bitがハッシュキーの上位16 bit一致する確率は、p=1/(64 K)として
 P = 3_C_1 * p * (1-p)^2 + 3_C_2 * p^2 * (1-p) + 3_C_3 * p^3
だけあって、一致したのだけれどそれで正解という(一致後の事後)確率は1/(ハッシュキーの総数)でしかないから
 置換表を頻繁にクリアする(結果、ビンの中のエントリに大概空きがある)
という条件でも追加しない限り、
>>133の置換表は毎回だいたい確率Pで衝突を起こす
、、、
0159名無し名人 (ワッチョイ bfdc-VW3n)
垢版 |
2018/02/04(日) 02:19:33.32ID:cijW0OOR0
>>156
難しい説明ごくろうさま。
で、内容はさっぱり理解できないんだけど結局のところ野田さんと山本さんとどっちがあってるの?
0160名無し名人 (ワッチョイ 9fbd-CNA0)
垢版 |
2018/02/04(日) 02:25:08.50ID:23gFbzJ50
>>159
山本氏発言の
>ハッシュキーサイズは16bit(!)
というのは確かに筆が滑った感じで、正しくは
>置換表エントリのハッシュキーの記憶サイズは16bit(!)
なん
ジャマイカ

それ以外(驚愕した動機)はだいたいあってる
0163名無し名人 (ワッチョイ bf1b-j81/)
垢版 |
2018/02/04(日) 08:29:15.41ID:kythLk+C0
Rota_JP

Aperypaq対15gou 209-195-25
探索Yane4.80AVXT
1500万局面/手(一手0.75秒(35T))
定跡オフ,Ponderオフ,投了値3000,引き分け256手

だってさ
Aperypaqにすら勝ち越しできない
Raina_i3 mixE_i3 この人でしょ
定跡使って上位に一発入っただけなのを勘違いしちゃった恥ずかしい御仁
だいたい作成日がねぇ・・・
自分で計測したのを出さずに急ごしらえでキメラ()しただけのgm
0165名無し名人 (ワッチョイ 9776-FvYi)
垢版 |
2018/02/04(日) 09:35:15.05ID:ewLIAglm0
広い世界でponanzaと出逢ったことで
自由な序盤へ my destiny
永遠に変わらない独自性を感じてるよ
いくつもの季節 ponanza流で戦って行こう
0169名無し名人 (ワッチョイ 9ff2-phf3)
垢版 |
2018/02/04(日) 13:23:25.92ID:FehoM9nH0
15gou x 最高R
3500万ノード 200局 book無 局面集無
15gou の勝率 41% でした・・・
0170名無し名人 (ワッチョイ bf51-wbgk)
垢版 |
2018/02/04(日) 13:43:42.27ID:x/3HzSN90
みんな測定に付き合って優しいね
0171名無し名人 (ワッチョイ b70c-am6q)
垢版 |
2018/02/04(日) 13:47:38.69ID:AN+aS2Fa0
>>159
この内容が分からないというのは開発能力がないひまわりか
0172名無し名人 (ワッチョイ bfdc-VW3n)
垢版 |
2018/02/04(日) 14:25:12.76ID:cijW0OOR0
>>171
んじゃ、わかってるようだから追加で説明を頼むわ。
どうして>>154 - >>157の説明で山本さんがだいたいあってるといえるのか、
要点をかいつまんで解説してくれ。
まぁ、どうせわかってないんだろうけど。
0173名無し名人 (ワッチョイ 9f7f-YNSJ)
垢版 |
2018/02/04(日) 14:42:48.95ID:3LNvAP2m0
>>169

最高R凄いね、ぜひ公開を
0175名無し名人 (ワッチョイ b70c-am6q)
垢版 |
2018/02/04(日) 14:59:59.72ID:AN+aS2Fa0
149 名無し名人 (ワッチョイ bfdc-VW3n) sage 2018/02/03(土) 22:33:05.02 ID:WFL8HojI0
ポナ山さんは前言撤回することになんら躊躇をしない人間だから、
重箱の隅をつついても何も意味がないかもしれない。
0176名無し名人 (ワッチョイ 9fd4-R0UW)
垢版 |
2018/02/04(日) 15:17:21.28ID:M9vWvbOj0
https://www.axfc.net/u/3885896
https://www.axfc.net/u/3885897

評価関数を2つ公開します

どちらもまだ検証が不十分ですが、aperypaqにはやや勝ち越せるのではないかと思います
同じ局面でもaperypaqとかなり評価が異なることがしばしばあるので中々面白いです

興味のある方は検証や改造などして遊んでみてください
検証して下さる方がいれば期待できそうな方の評価関数を絞ろうと思います


※後手番で希にあっという間に不利になる手順に飛び込むことがあるのでご注意下さい
0180名無し名人 (ワッチョイ 9fbd-CNA0)
垢版 |
2018/02/04(日) 18:11:20.78ID:23gFbzJ50
>>156訂正;
 誤: P = 3_C_1 * p * (1-p)^2 + 3_C_2 * p^2 * (1-p) + 3_C_3 * p^3
 正: P = 3_P_1 * p * (1-p)^2 + 3_P_2 * p^2 * (1-p) + 3_P_3 * p^3
 誤: (一致後の事後)確率は1/(ハッシュキーの総数)
 正: (一致後の事後)確率は1/(ハッシュキーの総数/(2^16 * (置換表のビン数)))
(∵エントリの特定に至った時点でハッシュキーの最上位16 bitと置換表のビンの数にあたる下位bitは一致がもともと確定

■ 具体的数値
ハッシュキー64 bit(で局面の識別に十分と仮定)、
最上位16 bitのみ等値比較、ビンの中の3エントリがどこも満杯とする。
置換表サイズ(ビン数)   p       P       r     衝突頻度(=1/(P*r))
--------------------------------------------------------------------------------
64 K           1.53e-5      4.58e-5   1.00   2.18万回に1回
512 M           1.53e-5      4.58e-5   1.00   2.18万回に1回
※ pとPは置換表サイズに拠らない。(ビンの中に3エントリかつエントリ特定にハッシュキーの16 bit等値比較、で確定
※ rは上で訂正した「(一致後の事後)確率」の逆数で、エントリ特定済条件での衝突確率。置換表サイズ依存だが64 K v.s. 512 Mでは差が出ない。

→2.18万回に1回衝突とか使い物にならない。>>133の置換表は満杯になるような使い方をしてはいけない
 置換表サイズに対する勝率は、「どのビンにも空きエントリがある」が満たされた時点で頭打ちになる(そこから先はいくら置換表を大きくしても勝率が伸びない)と予想
0181名無し名人 (ワッチョイ 9ff2-phf3)
垢版 |
2018/02/04(日) 18:26:41.84ID:FehoM9nH0
>>173
もう少し対局追加してみているのですが、
今度は15gouが勝ち星リード(57%程度)しているので
対局数が500局くらいでないと結果でないかもです。
15gouが強いのは間違いなさそう。
この「最高R」に途中経過でも勝ち越せるソフトは過去いなかったので。
0182名無し名人 (ワッチョイ 9f61-kjSK)
垢版 |
2018/02/04(日) 18:27:39.60ID:aj9UJ/cp0
>>129
こちらの環境では1手1500ノードで有意差なさそうです
でも公開してくれてありがとうございました

>>163
Raina_i3 mixE_i3の人ではなさそう
あの人、一個も評価関数公開しなかったし

>>176
早速ダウンロードさせていただきました、ありがとうございます
0190名無し名人 (ワッチョイ 9f33-TMxv)
垢版 |
2018/02/04(日) 22:37:16.00ID:cLjH3Fxu0
>>188
2戦目は定跡抜けた後のがっぷり四つから、一手の読み勝ちでカカロットの勝ち。
(読み筋はどちらも同じで評価だけ違った)
まだ対局回数が少ないとは言え、R4400を狙える力はあるのかも。
0193名無し名人 (ワッチョイ 97b3-xIbb)
垢版 |
2018/02/05(月) 13:21:43.18ID:soyes9Kk0
今までのやり方でAlphaZeroに迫っているのを見ると、それだけ将棋は探索の効果がでかいということだろうか

それともこっそりDLが混じってるとか?
0194名無し名人 (ワッチョイ 57b3-wbgk)
垢版 |
2018/02/05(月) 14:12:26.36ID:zdGtM7Br0
そもそもAlphaZeroの結果が謎が多すぎる。
なんでそんな簡単にelmoのすぐ上に行けたのか、なんでそこで止まってしまったのか。
0195名無し名人 (ワッチョイ 9f61-kjSK)
垢版 |
2018/02/05(月) 15:25:15.79ID:/QmbCzK30
YSSの人がレーティングと実際の勝率について書いてたけど、コンピュータも人間もレーティング差が大きいとeloレーティングに基づく勝率よりも5割に近づく
実際のAlphaZeroはもっと強い可能性がある
0196名無し名人 (ワッチョイ 97b3-xIbb)
垢版 |
2018/02/05(月) 15:57:28.43ID:soyes9Kk0
レート自体は自己対戦から出してるとのことだから相対的に控えめに出てる可能性もある?

とりあえず多めにR4600と見つもっておこう。
0197名無し名人 (ブーイモ MMdb-ghwr)
垢版 |
2018/02/05(月) 16:16:03.93ID:IdqvXfybM
いっそ計測はelmo基準にすれば良くない?
対elmo特化の戦績だとしても
その方がAlphaZeroの棋風を擬似的に再現してる可能性という意味で需要あるし
0198名無し名人 (ワッチョイ 9f61-kjSK)
垢版 |
2018/02/05(月) 16:34:04.16ID:/QmbCzK30
>>196
AlphaZeroグラフ自体は自己対戦からだろうけど、縦軸の数値はuuunさんのサイトとelmoとの対局で当てはめたものだと推測
とはいえ30万ステップ以降のグラフの伸びがほぼ横ばいでそれでいて不安定なのは間違いないですね
0199名無し名人 (ワッチョイ f77e-j81/)
垢版 |
2018/02/05(月) 18:47:54.82ID:r0lbn83N0
混ぜると強くなる理由

https://github.com/gcp/leela-zero/issues/814#issuecomment-362931617

Averaging weights from nearby networks decreases noise from mini-batch gradient calculations.
If the network is very near the optimum then the weights don't change much during the training
and we can think that the network weights are the optimal weights plus
some noise caused by the stochastic gradient calculation.
Averaging the weights decreases the amount of noise in weights
and brings the network closer to the optimum.
Same effect can be had if learning rate is decreased.

だって
学習率下げた時の段差と関係あったのか
0200名無し名人 (ワッチョイ 9fd4-R0UW)
垢版 |
2018/02/05(月) 19:20:59.36ID:TaydH65C0
そもそも学習率はあまり大きくするべきではないんですよね、収束までは遅くなりますけど
elmo絞りをするならなおのこと学習率は小さくするべきだと思います
0201名無し名人 (ワッチョイ bfdc-VW3n)
垢版 |
2018/02/05(月) 21:02:32.38ID:0fgThXEN0
学習率をただ下げてもダメだそうだぞ。
線形評価関数ではないが、DeepLearningの世界では小さすぎる学習率は局所解に収束してしまう要因として挙げられている。
0202名無し名人 (ワッチョイ 1fb0-VW3n)
垢版 |
2018/02/05(月) 21:10:26.59ID:NSaultao0
>>119
機械学習の専門家はいつもこんなこと議論してるの?
コンピュータ将棋にもこういうコミュニティはないのかしら
0206名無し名人 (ワッチョイ 9fd4-R0UW)
垢版 |
2018/02/06(火) 20:56:16.81ID:r3l1yIaI0
先手勝率が上がって引き分けはさらに多くなるでしょうね
今の時点でも少し長めの時間で100局やれば10〜15局くらいは千日手になりますし
0207名無し名人 (ワッチョイ 97b3-xIbb)
垢版 |
2018/02/06(火) 21:02:38.83ID:jKt2sVsN0
AlphaZeroが本格的にそういう領域に入ってきてるとすると、数値以上に壁が高い

かもしれない。
自己対戦の先手後手の勝率も知りたいものだ
0208名無し名人 (ワッチョイ bf9d-ksqG)
垢版 |
2018/02/06(火) 22:07:27.33ID:mJblaAuW0
Stockfish 9が2月1日にリリースされた
SILENT_MAJORITY 1.26がでるかも?
0210名無し名人 (ワッチョイ 9f33-TMxv)
垢版 |
2018/02/07(水) 07:53:07.00ID:Jz1KOTci0
>>209
魔女は長いことアップデートされてないから、stockfishの
正規アップデートとは関係なしにそろそろあるんじゃねとは思うが
0211名無し名人 (ワッチョイ 9f07-am6q)
垢版 |
2018/02/07(水) 12:22:38.86ID:19LcPCVk0
かなり過疎ってるな
0212名無し名人 (ブーイモ MMbf-YO6I)
垢版 |
2018/02/07(水) 14:32:41.27ID:XeMJ4gu7M
開発者の側が開発に飽きてるから過疎るのも仕方ない
0218名無し名人 (ワッチョイ 9f61-kjSK)
垢版 |
2018/02/07(水) 18:03:27.27ID:1VBovYPy0
検証が必要なもの

>>129

>>176

48 @bleu48
YaneuraOuをWSL上でclang使ってビルドするだけで5%近く速くなるな。電王トーナメント前の比較だとほとんど変わらなかったんだけど
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況