X



トップページ将棋・チェス
1002コメント353KB
▲コンピュータ将棋スレッド136
■ このスレッドは過去ログ倉庫に格納されています
0001名無し名人 (ワッチョイ 17b3-a7mP)
垢版 |
2018/05/06(日) 16:07:27.57ID:yi6PO8Aw0
!extend:checked:vvvvv:1000:512
↑スレ立て時は1行目と2行目に「!extend:checked:vvvvv:1000:512」をコピペして立てて下さい
荒らし対策のために強制コテハン(ワッチョイ)を表示するコマンドです

第28回世界コンピュータ将棋選手権 参加チーム
https://www.apply.computer-shogi.org/wcsc28/team.html
詰将棋メモ コンピュータ将棋2018
http://toybox.tea-nifty.com/memo/2018/01/post-0205.html
世界コンピュータ将棋選手権参加ソフトリンク集
http://www.ne.jp/asahi/tetsu/toybox/soft/softlink.htm
floodgate 最新2週間レーティング
http://wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html
コンピュータ将棋協会
http://www.computer-shogi.org/
コンピュータ将棋
http://ja.wikipedia.org/wiki/%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E5%B0%86%E6%A3%8B
将棋フリーソフト rating on single machines(各ソフトのレーティング評価)
http://uuunuuun.wix.com/shogi-engines

※前スレ
https://mevius.5ch.net/test/read.cgi/bgame/1524826104/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured
0548名無し名人 (ワッチョイ 05b6-A5aB)
垢版 |
2018/05/10(木) 07:59:29.15ID:V63K0vvT0
>>547
ご返事ありがとうございます。
双方、ponderはオフになっています。
0553名無し名人 (ワッチョイ 85b3-k37M)
垢版 |
2018/05/10(木) 10:10:22.59ID:gciWVM880
900っていうのはコンピュータチェスの話ではなかったのか
チェスはエンドゲームが全然違う感覚らしいし
そもそも駒損は優劣に決定的だろうし
0554名無し名人 (ワッチョイ f5a0-9xIv)
垢版 |
2018/05/10(木) 10:39:58.15ID:bUakbI8c0
実際問題、研究用途で大事なのは序盤の正確性だから
序盤最強の評価関数があったならそれ一択になるよ
100や200ならともかく900まで押し切れるなら不満はないし
0555名無し名人 (ワッチョイ a375-8lMK)
垢版 |
2018/05/10(木) 10:49:29.76ID:7flGK+NK0
最初から序中盤で評価値上の作戦勝ちすることに特化したソフト作ったらどうなるんだろ?
今よりうまくなるの?
0557名無し名人 (ワッチョイ 2323-bFqk)
垢版 |
2018/05/10(木) 11:15:32.78ID:0TpJbgz70
TCECだと650センチポーン差が続いた時点で判定勝ちになるからな
その感覚だと900センチポーン差は「挽回不可能な大差」と誤認しても仕方ないところはある
0561名無し名人 (スフッ Sd43-BfQJ)
垢版 |
2018/05/10(木) 13:07:29.96ID:oqafRK0md
Googleが第3世代のTPUを発表
1年前のと比べて性能が8倍以上か
流石Googleだわ

Google@Google
Today we're announcing our third generation of TPUs. Our latest liquid-cooled TPU Pod is more than 8X more powerful than last year's, delivering more than 100 petaflops of ML hardware acceleration. #io18
午前2:22 · 2018年5月9日
0562名無し名人 (ワキゲー MM2b-D1Nt)
垢版 |
2018/05/10(木) 13:31:06.81ID:uOGS2u+HM
クジラは互いに入玉可能な局面での評価がやや弱いように思えます。

サンプルは後手が勝った投了図です。後手大駒3枚で投了やむなし
クジラqzilla9の評価は後手持ちの-300以下の互角。
なおApery系では-600以上の後手有利で投了も妥当。
駒点数は先手:22点後手:32点

2018-05-09_王座戦谷川浩司_九段_vs_渡辺 明_棋王

後手の持駒:桂 香 歩三
9 8 7 6 5 4 3 2 1
+---------------------------+
| 龍v金 ・ ・ ・ ・v金 ・v香|一
| ・ ・v角 ・ ・ ・v金 ・v玉|二
| と 銀 ・ ・ ・ ・ ・v歩v桂|三
| 玉 ・ 歩v歩v桂v銀v歩 ・ 桂|四
| ・v歩 銀 ・ ・ ・ 香 ・ ・|五
| ・ ・ ・ ・ ・ ・v龍 ・ ・|六
| ・ 歩 ・ 歩 歩 ・ ・ ・ ・|七
| ・ ・vとv馬 ・ ・ ・ ・ ・|八
| 香 ・ ・ ・ ・ ・ ・ ・ ・|九
+---------------------------+
先手の持駒:金 銀 歩五
先手:谷川浩司
後手:渡辺 明
手数=112 △8一金 まで

ただし低スペックPCのエンジンYO82で短時間計測なので
図面を張り付けて いろいろな環境とソフト試行すれば結果が異なるかも
0564名無し名人 (ワッチョイ 2323-bFqk)
垢版 |
2018/05/10(木) 13:36:24.43ID:0TpJbgz70
クジラがまたaperypaqに対して誤差圏内を脱したか
しかし入玉周りの弱さは、評価関数と言うより探索の方の問題なのかねこれは
0566名無し名人 (マクド FF91-A5aB)
垢版 |
2018/05/10(木) 13:50:33.21ID:YKbTkGU1F
序盤特化の流れだったから
超適当に枝刈りの処理を大幅に省いたGodwhaleを作ってみた
処理が減った分だけNPSが上昇してる
https://www.axfc.net/u/3909839.zip

雑な調整だし劇弱かと思ったら
投了値1000くらいでは配布されているGodwhaleよりも少し強かったので投下
棋風も変わっているから別ソフトという感じ
0567名無し名人 (ワッチョイ c5b3-p5BG)
垢版 |
2018/05/10(木) 14:04:28.64ID:uX2qwuu70
>>561
早速将棋なりチェスなりに採用してなにか発表されるんだろうか。
なんかグラフ見てるとこれ以上強くなるんだろうかって感じがあるし、ボードゲームで強くなってもそろそろ世間から飽きられそうだし
もともと強いゲームAI開発することが目的だったわけでもないし
0569名無し名人 (スップ Sd03-TaKj)
垢版 |
2018/05/10(木) 14:26:20.23ID:Tzu4HyCgd
>>566
早速使わせてもらいましたが序中盤は確かに強そうな印象です。終盤は深く読めば素鯨と同じ手を読めるので、総合的に強いと思います。
0571名無し名人 (ワッチョイ d59f-EHe9)
垢版 |
2018/05/10(木) 14:45:23.54ID:GdCPcSTI0
芝先生が改造した技巧2の評価関数って元のより強いの?
0575名無し名人 (ワッチョイ 9b7f-yVdD)
垢版 |
2018/05/10(木) 15:18:22.37ID:DsJEStIl0
>>566
sse42も頼みます
0578名無し名人 (ワッチョイ a3b3-iSle)
垢版 |
2018/05/10(木) 16:09:53.00ID:tKIBHPFn0
>>571
魔改造の方が惨敗だった、あまり勝てないので技巧1を改造したのかと思った、24局位して魔改造の勝率2割程度だった
0579名無し名人 (ワッチョイ 2323-bFqk)
垢版 |
2018/05/10(木) 16:10:16.93ID:0TpJbgz70
uuunuuun @uuunuuun1
技巧はレートが低い相手には勝率が想定より良く、高い相手には想定より悪い。
レーティングを引き延ばす役割をしたけど、T.N.K.は逆でレーティングを縮める役割を果たしている。

T.N.K.はすべての相手のレートをひきつけるブラックホールのようなもの、
技巧はいうなればホワイトホールみたいなものか。
0580名無し名人 (スップ Sd03-TaKj)
垢版 |
2018/05/10(木) 16:15:44.57ID:Tzu4HyCgd
芝先生の改造版技巧2、floodgateに現れる
0581名無し名人 (ワッチョイ 23d2-BsV1)
垢版 |
2018/05/10(木) 16:51:07.77ID:9uhPMvOC0
>>566
sse42あると助かります
0582名無し名人 (ワッチョイ 239d-muuU)
垢版 |
2018/05/10(木) 16:58:54.66ID:Weh0qvkU0
>>566
godwhale_child EAで登録した
0584名無し名人 (ワッチョイ 239d-muuU)
垢版 |
2018/05/10(木) 17:40:41.62ID:Weh0qvkU0
>>576
Aprey_wcsc28の弱い探索部を使用しないで221の平岡さん提供の変換ソフトを利用して
elmoやaperypaqみたいにやねうら王を探索に使用して再チェックしてもらえますか
0587名無し名人 (ワッチョイ 2323-bFqk)
垢版 |
2018/05/10(木) 18:18:38.14ID:0TpJbgz70
>>583
それがえびクオリティ

真面目な話すれば、千日手を読んだのが全部無駄
(相手も千日手が最善と思ってくれないと結局費やした時間×クラスタの台数分
 戦闘力を空費する)
プラス入玉周り

これだけで拾えた星が2つは増えたはず
0590名無し名人 (ワッチョイ 1bdc-uwJI)
垢版 |
2018/05/10(木) 19:06:37.11ID:Y8RcgwNp0
マシンパワーが潤沢にあるんだったら、それこそαβカット以外の全ての枝狩りをなくしてもよかったのかもね。
0593名無し名人 (ワッチョイ 1b1b-yBh5)
垢版 |
2018/05/10(木) 19:27:11.53ID:3lKqQiDa0
どう考えても何の役にも立たずに先手で優位すら保てなかったgm定跡だろ
0594名無し名人
垢版 |
2018/05/10(木) 19:57:05.05
「やねうら王」の定跡を無効化する方法

定跡でいきなり序盤「角換わり」で「角不成り」したらどうなると思う?

しかし「やねうら定跡」は連続して定跡が外れると、
以降合流しても定跡選択しなくなくなりますよね。

なので、こちらのプログラムの除外を書き換え、
「角換わり」で「角不成り」を指す。
相手にその応手が定跡で登録されていない場合は定跡が切れます。
そして次に普通は「銀」を動かす所を「金」等を動かして、
連続して定跡を外せば以降相手は定跡選択しません。


「第28回世界コンピュータ将棋選手権」のクジラチームの後手で
「角換わり」を仕掛けて次に△3二金としてたのは、
この不具合動作の実験の名残りです。
大会中、変な定跡だな?って思った人もいたかと思いますが、
こんな理由がありました。


1年に1回のコンピュータ将棋の大会で
こんなことして勝ったとして「なんだこいつ?」ってなるでしょ。
だからやろうと思わなかったけど、
もし「電王トーナメント」のような賞金のかかった一発勝負だったらどうでしょうね?

一度このプログラムのままが良いのか考えてはどうでしょうか?
0595名無し名人 (ワッチョイ 4bbc-k37M)
垢版 |
2018/05/10(木) 20:04:04.09ID:aSNQWz980
上位ソフトを一手100億ノードで指すみたいな条件で
対戦させたら何が強いんだ?

実際のプロ棋戦の検討するときに
一番いいソフトがわかると思うんだけど
0596名無し名人 (ワッチョイ 2333-RZDq)
垢版 |
2018/05/10(木) 20:05:20.92ID:w/qWlZGB0
Twitterから

―――――
ドラえもんを観て、心から思うこと。
これだけ強烈な人生経験をしているのび太がなんの反省もない点、
やはりすごい人物なんだと思う。たとえば、のび太と恐竜の最後で、
ピー助との別れ際に「ぼくもがんばるからね!」って涙ながらに
叫びけども学びと成長がないな。
―――――

これ見てえびちゃんのことを思い出した
0597名無し名人 (ワッチョイ 1b1b-yBh5)
垢版 |
2018/05/10(木) 20:09:28.35ID:3lKqQiDa0
メタゲーだけして将棋そのものやプログラムを開発するでもない大会に勝つだけの勘違い馬鹿のおかげで興ざめ
芝とまふの罪は大きい
0598名無し名人 (アウアウカー Sa11-JS3c)
垢版 |
2018/05/10(木) 20:21:57.12ID:mQ8IoirNa
>>594
同一局面からの定跡検索は面倒なうえリソース食う
0600名無し名人 (ワッチョイ a375-8lMK)
垢版 |
2018/05/10(木) 21:49:00.15ID:7flGK+NK0
自分がやらないなら相手がやってきたときに大駒と歩の不成と成を区別しないオプションが
あってもいい気が
0601名無し名人 (ワンミングク MMa3-quQn)
垢版 |
2018/05/10(木) 22:39:22.53ID:JwJVn4aiM
やねうら王の定跡検索ってsfen文字列でやってるから、
同一局面に合流した時点で定跡にヒットするのでは?
まふさんの書いてること、本当に正しいの?
0602名無し名人 (ワッチョイ 237c-k37M)
垢版 |
2018/05/10(木) 22:57:54.40ID:O+JpvI/t0
やねうら王の定跡は手数が入っているから局面が同じでも手数が違うと定跡ヒットしないんだけど、
定跡にある局面、手数が同じなら一度定跡はずれても合流すれば定跡ヒットするよね
0604名無し名人 (ワッチョイ e31d-G9Hr)
垢版 |
2018/05/10(木) 23:55:46.81ID:V9RC4gx90
ID:awve6uJXd
0605名無し名人 (ワッチョイ 3d8a-C4gG)
垢版 |
2018/05/11(金) 00:01:23.17ID:dtOtlHQF0
方法論を新しくなにかを作ってってのを目指すわけじゃないし
実装レベルで最適化して今でも将棋を強くしてますってのが実に日本的と言うか
0606名無し名人 (ワッチョイ 23b3-UETc)
垢版 |
2018/05/11(金) 00:11:26.22ID:jajazr6C0
本格派居飛車党たぬきの重厚な指しまわし
序盤は定跡重視?
角換わり、雁木の中盤
すごい参考・勉強になるう

たぬきちゃん、かわいいよ、たぬきちゃん
0608名無し名人 (ワッチョイ cb81-k37M)
垢版 |
2018/05/11(金) 00:25:29.87ID:NQWT2Ehn0
パンピーはゴッドホエールとか言うの入れとけばええんか?
0610名無し名人 (アウアウカー Sa11-JS3c)
垢版 |
2018/05/11(金) 00:33:12.30ID:hJCsZQ7da
上背道場4で良くない?
0611名無し名人 (ワッチョイ cb81-k37M)
垢版 |
2018/05/11(金) 00:41:58.56ID:NQWT2Ehn0
>>609-610
さんくす。くじらちゃん入れるわ
0616名無し名人 (ワッチョイ f580-uwJI)
垢版 |
2018/05/11(金) 05:30:44.85ID:IIU8Zfgr0
m5.24xlarge
YaneuraOu 2018 Otafuku KPPT 4.82 64AVX2 TOURNAMENT
qzilla9
bench 4096 96 19 # ハッシュ4096なのは96threadsだとハッシュがすぐに埋まるため
===========================
Total time (ms) : 23154
Nodes searched : 1248471943
Nodes/second : 53920356
Nodes searched(main thread) : 13546466
Nodes/second (main thread) : 585059
0619名無し名人 (ワッチョイ cb23-Iyo3)
垢版 |
2018/05/11(金) 08:54:52.53ID:EZED5nn/0
>>597
仮にも「学会」とついてる所で出すものかは疑問符がつくな
商品開発とかエンターテイメントとしては正しいと思うんだ
(要はパッケージングだけするSIみたいなもんでしょあれ)
だから電王トーナメントとかなら俺も賛同してたと思うわ
0621名無し名人 (ワッチョイ 2323-bFqk)
垢版 |
2018/05/11(金) 09:23:55.37ID:e5unkNgQ0
>>517,619
あれやらないと、コンピュータの穴だらけの序盤がプロにも伝播しちゃう恐れがあっただろ
だから選手権だろうが電王トナメだろうが、あれでいいんだよ
0623名無し名人 (ワッチョイ 2323-bFqk)
垢版 |
2018/05/11(金) 10:38:03.10ID:e5unkNgQ0
不屈の棋士で西尾だったか千田だったかが
「ソフトの示した序盤の穴を検証せずに採用してハマる人もいる」
みたいな話ししてなかった?
0627名無し名人 (スップ Sd03-HF5e)
垢版 |
2018/05/11(金) 12:22:48.01ID:MX8YKhfnd
>>626
プロの使ってるPCスペックも手法もソフト開発者のそれに全然及ばないのでは?
0628名無し名人 (ワッチョイ a3b3-iSle)
垢版 |
2018/05/11(金) 12:36:22.61ID:FfvEo9W20
>>626
その統計データの根拠ってどこにあるの?プロ棋士の価値を高るための宣伝にしか思えないが
0629名無し名人 (ワッチョイ a3b3-iSle)
垢版 |
2018/05/11(金) 12:39:54.33ID:FfvEo9W20
クジラ9などからR1400程度も弱いプロ棋士の序盤は明らかに弱い
0633名無し名人 (ワッチョイ 23b3-8E5a)
垢版 |
2018/05/11(金) 13:21:26.34ID:67PF9Hem0
勝てないのにプロの序盤研究云々とかまったくワロえんよ
去年の天彦の無様さ加減にはほとほと呆れ返ったわ
0634名無し名人 (ワッチョイ 2323-bFqk)
垢版 |
2018/05/11(金) 13:23:50.96ID:e5unkNgQ0
そんな中西尾はさすが

西尾明 @nishio1979
以前は定跡はどちらかといえば棋士中心のコンソーシアム型ブロックチェーンでしたが、
現在はコンピュータ将棋の台頭もあり、
バリデーターが不特定多数のパブリック型に変化しつつある気がします。
0635名無し名人 (ワッチョイ a375-8lMK)
垢版 |
2018/05/11(金) 13:32:09.68ID:OMp37Oi+0
>>624 追加した定跡でタヌキにやられちゃったのか。。

- 二次予選で Hefeweizen 相手に 80 手近くまで一方的に定跡で指されて非常に苦しかったので、
決勝では、一次、二次予選で elmo, the end of genesis T.N.K.evolution turbo type D, Hefeweizen
が勝った時の手を全て登録するという安直な定跡を追加し、2戦目から使用しました。
(初戦の名人コブラ戦には定跡作成が間に合いませんでした。)
https://www.apply.computer-shogi.org/wcsc28/appeal/Apery/appeal_wcsc28.txt
0636名無し名人 (ワッチョイ 2323-bFqk)
垢版 |
2018/05/11(金) 13:44:15.30ID:e5unkNgQ0
ドクター・ゲロのTweetが面白かった

-----------------------------
深いdepthで生成した教師局面でelmo絞りすると、短時間対局だと
その力を発揮しないのはずっと言われて来た。elmo絞りは先の方まで
考えて指した手の勝敗を手前のほうの手にまで反映させていくから、
本来なら短時間しか読まなくても深い手を指せるので強いはず。
でも、以前のそんなに深くない教師で学習させて作られた評価関数にコロッと負ける。なんでか?

深い教師のほう(Aとしよう)は、近くでは一旦悪くなっても、
その先で良くなる手があるとプラスの評価になるため、短時間でもその手を指す。
で、浅い教師のほう(Bとしよう)は、その手は悪い手と認識して、これ幸いとその筋に飛び込む。
Bの指し手がAのPonderの第一候補ならその先まで読めているので無事にその筋に誘導できるのだが、
Bの手が次善手だったりすると、またそこから考えはじめ、狙った筋とは違う筋に入ってしまうことがある。
違う筋だと逆転する筋が見つからなくて、そこで大反省してしまうことが往々にしてあるのだ。

Hefeweizenの評価関数はこのことを逆用し、学習時に最善だと習った手を次善手に格下げして、
そんなに評価値の変わらない次善手を最善として指させるようにした。
こちらはMulti Ponderで、どんな手が飛んできても先までお見通しの状態で待ち受けているので、
大抵の変化にも問題なく対応できるため、相手のPonderを外しながらどんどん悪い筋に誘導していくことができるのだ。

depth12で学習させた評価関数が異常に弱くなったので、その原因を分析している時にこの手法を思いつき、
18号の新コマンドでチョチョイといじったら、狙い通りの手を指してくれるようになった。

HefeweizenはMulti Ponderと最善手外しの複合技で戦っていたというお話でした。
0637名無し名人 (ワッチョイ 55b3-TVdY)
垢版 |
2018/05/11(金) 13:53:24.17ID:1Z3eqG5A0
勝てそうな筋に入ったはずなのに途中で道を間違えてるって感じなのかな

PonderはもうMulti Ponder 2くらいをデフォルトにしてもいいのではって思うけどやねうら王ではやらないのかな
0638名無し名人 (ワッチョイ a375-8lMK)
垢版 |
2018/05/11(金) 13:58:55.61ID:OMp37Oi+0
評価はあってるけど有利なほうが間違えた場合と
実は評価が間違っていて不利と思われていたほうが好手(新手)を出してる場合
の区別をつけないとまずい。
0640名無し名人 (ワッチョイ 6d7e-yBh5)
垢版 |
2018/05/11(金) 14:19:57.09ID:2XBIrjr70
>>636
AlphaZeroみたいに探索後のルートの全ての手を学習できれば、そんな無駄なことしなくて済むんだけどな
最善手しか学習させないから効率が悪い
0641名無し名人 (ワッチョイ cbb1-yBh5)
垢版 |
2018/05/11(金) 14:40:08.31ID:pj0v2va60
Alpha Zeroの中身知らんけど、Alpha碁と変わらんのなら、彼らの持っている評価値は
勝率に準じたもので、歩1個100点とかの評価値とは根本的に違う事柄を表現している
と思うんだけどね。
0642名無し名人 (ワッチョイ cbb1-yBh5)
垢版 |
2018/05/11(金) 14:43:19.85ID:pj0v2va60
つか、探索後のルート全ての手を学習するって、もっともらしい書き方しているみたい
だけど、具体的に何をどうするのか、まったく想像できない件。
0645名無し名人 (ワッチョイ 4b9f-obfm)
垢版 |
2018/05/11(金) 15:25:35.42ID:ZZDuz7dB0
>>636
次善手を使って悪い筋に誘うっていう部分は眉唾物だなあ。
基本的にはMulti PonderとPonder外しによる時間責めっていうのが白ビールの戦略だと思う
0646名無し名人 (オッペケ Sr21-gWFD)
垢版 |
2018/05/11(金) 15:26:11.14ID:8Dfft4sjr
>>602
sfen文字列って局面だけじゃなくて
初手からの指し手が入ってなかったっけ?

定跡合流を許すように
やね定跡に局面ハッシュ入れるように提案したが
rejectされた覚えが。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況