X



トップページ将棋・チェス
1002コメント358KB
▲コンピュータ将棋スレッド121 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
0001名無し名人 転載ダメ©2ch.net (ワッチョイ df11-XsCQ)
垢版 |
2017/06/13(火) 10:02:41.69ID:xUUTRUkx0
!extend:checked:vvvvv:1000:512
叡王戦公式HP
http://www.eiou.jp/
第27回世界コンピュータ将棋選手権 参加チーム
http://www2.computer-shogi.org/wcsc27/team.html
詰将棋メモ コンピュータ将棋2017
http://toybox.tea-nifty.com/memo/2017/01/post-965e.html
世界コンピュータ将棋選手権参加ソフトリンク集
http://www.ne.jp/asahi/tetsu/toybox/soft/softlink.htm
floodgate 最新2週間レーティング
http://wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html
コンピュータ将棋協会
http://www.computer-shogi.org/
コンピュータ将棋
http://ja.wikipedia.org/wiki/%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E5%B0%86%E6%A3%8B
将棋フリーソフト rating on single machines(各ソフトのレーティング評価)
http://uuunuuun.wix.com/shogi-engines

前前スレ
▲コンピュータ将棋スレッド119
http://echo.2ch.net/test/read.cgi/bgame/1494640642/

ゴミ溜め
http://mevius.2ch.net/test/read.cgi/bgame/1495704998/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured
0573名無し名人 (ワッチョイ 1613-Xm5V)
垢版 |
2017/07/13(木) 21:30:49.72ID:EYXGAyGu0
>>569
かっけーーーー
次も同じソフトで挑んでほしいね
0574名無し名人 (ワッチョイ 1306-hB9w)
垢版 |
2017/07/13(木) 21:31:09.47ID:L/xYdH+h0
透。‏ @co2845229 3時間
yasetamafu70 VS yasetamafu70+ 200局計測結果
一手2秒 yasetamafu70+は一晩追加学習したもの
長時間での結果も気になり一手10秒計測しながら眺めていると
1勝-8勝-1分けで長時間だと更に強くなりそう
https://pbs.twimg.com/media/DEmvDNeUwAA0r2P.jpg

またR100伸びたのか!!
雑巾カチカチとは何だったのか・・・
0579名無し名人 (ワッチョイ d091-WLQd)
垢版 |
2017/07/13(木) 21:56:12.20ID:VCLRIqCu0
yasetamafu70+凄いね。これでR4100は越えたかな。
非公開だけどアノニマス+やねさんでelmoからR100以上上がったのは快挙
0580名無し名人 (ワッチョイ e61a-z+eH)
垢版 |
2017/07/13(木) 22:16:59.47ID:7dC57Gg50
今現在elomoにこの成績と同等以上になりそうなソフトはどれくらいあるの?
>Ponanza173勝 elomo89勝 4引分 勝率65.8%でした。(対局条件は10秒秒読み・Xeon24core ・定跡なし・クラスタなし・Deep Learning未使用)
0583名無し名人 (ワッチョイ 97db-Xm5V)
垢版 |
2017/07/13(木) 22:44:41.25ID:oA3FCV0u0
>>581
実際にelmoと300以上対戦すればわかるけど65%以上の勝率はないよ
elmoに+60の評価関数に対して+60の評価関数作っても+120の勝率が出ずに+50前後だったりもする。
相性の問題が出ているだけで真のレートは選手権ポナの少し下あたりで伸び悩んでる。
0585名無し名人 (ワッチョイ 1306-hB9w)
垢版 |
2017/07/13(木) 22:59:13.06ID:L/xYdH+h0
yasema10は300局以上指してelmoに勝率66%超えだし
複数ソフトとの対局で算出したレート差でもelmo+R100超えてるから
探索部の強化も含めたら当時のponanzaは超えていそう
http://ii.ttlv.jp/20170711/
蟲毒で検証されていない評価関数はデータがイマイチ信頼できないから
検討用にはyasema10を使っておくのが確実な気がする
0586名無し名人 (スッップ Sd70-4IX2)
垢版 |
2017/07/13(木) 23:10:38.78ID:6Ehb82tGd
長時間になるほどelmoと他の評価関数は互角に近付くらしい。
0588名無し名人 (ワッチョイ 8a33-peTA)
垢版 |
2017/07/13(木) 23:49:04.29ID:/hJ5h85O0
yasetamafu70に升田幸三の勝局集を追加学習させたのを見たいね
それらしい棋譜ができるのじゃないかと
0590名無し名人 (ワッチョイ 8a33-peTA)
垢版 |
2017/07/14(金) 00:08:15.72ID:uHaM40ON0
シャッフルしたのを幾重にも重ねて学習させるのは駄目ですかね?
0591kei (ワッチョイ 6b11-6eVw)
垢版 |
2017/07/14(金) 03:07:51.72ID:+vFFiKH40
546さんへ 配布されている評価関数は、著作権の関係で配布主に無断で勝手に再配布してはいけないと思うので、申し訳けないです。ごめんなさい。
ブレンド出来る人用に書いたつもりです。でも、すぐにより強いのが、まふ先生などから公開されるので大丈夫ですよ。
0593名無し名人 (ワッチョイ 1306-hB9w)
垢版 |
2017/07/14(金) 04:28:29.26ID:+g0BwhMq0
抜けた評価関数が出来ても
すぐにそのブレンド評価関数が乱立するから同じこと
ブレンド無しだとmafu.7zが強いからそれを使えばよい
0595名無し名人 (ワッチョイ 9111-UmNz)
垢版 |
2017/07/14(金) 06:26:53.09ID:ORdUFXkp0
現状だとmafu10、mafuta2、野生の読み太2の組み合わせが最強
これにリゼロ8を混ぜると強いと書いてる方がいたが、うちだとどうやっても弱くなっちゃう
0597名無し名人 (アウアウカー Sa11-YgBE)
垢版 |
2017/07/14(金) 07:09:48.07ID:KR0DVtuya
>>591
評価関数に著作権はない
0598名無し名人 (ワッチョイ f348-NvYO)
垢版 |
2017/07/14(金) 07:29:53.01ID:LzqUWuyS0
>>510
>技巧の序盤の穴埋めとソフトメタドーピングで強くできること

いや、それ自体がすでに十分すぎるくらい立派な知見だし、
新しい技術のきっかけになってると思うのだが。
0599名無し名人 (ワッチョイ f348-NvYO)
垢版 |
2017/07/14(金) 07:31:48.73ID:LzqUWuyS0
>>564
やねの意見を敢えて過激にまとめるなら、Bonanzaからelmoまでの12年間は
チェス由来のStockfish探索の導入を除いてすべて結果的には無駄な努力だった、
ってことだし。
0602名無し名人 (アウアウカー Sa11-YgBE)
垢版 |
2017/07/14(金) 08:10:16.46ID:UB/NAe0Da
>>598
定跡の効能とデメリットについては初めからわかってたことでしょ
定跡という概念を新しく持ち込んだわけでもないし
0603名無し名人 (ワッチョイ a75d-X5vM)
垢版 |
2017/07/14(金) 08:15:20.79ID:2qk9q+Gv0
>>599
強化学習(Bonanzaの機械学習とはまた違う)をソフトが導入し始めたのはPonanzaでも数年前くらいだし、現在の主流はBonanzaの全幅探索と正反対だ
流石にそれは吹かしすぎ
0604名無し名人 (ワッチョイ a4ea-+Ma1)
垢版 |
2017/07/14(金) 08:30:13.86ID:4FrCrF0H0
yasema10はmafuta3に勝ててない、それでいて勝手な推測レートが4200など評価関数として不完全であるね
0605名無し名人 (アウアウカー Sa11-YgBE)
垢版 |
2017/07/14(金) 08:35:31.55ID:UB/NAe0Da
>>603
だから探索についてはStockfish由来の〜と言及してるんでしょ
んで、次元下げとか学習手法については全部無駄で、
KPPTに単純なelmo式で事足りたと
0606名無し名人 (ワッチョイ 1306-10zQ)
垢版 |
2017/07/14(金) 08:46:57.93ID:+g0BwhMq0
蟲毒の棋譜はNPS3000万で4秒対局だからかなり貴重だな
家庭用PC換算だと1手30秒くらいの上質な棋譜が1500種類近く手に入るとは贅沢な話だ
0607名無し名人 (アウアウカー Sa18-vrrZ)
垢版 |
2017/07/14(金) 09:36:47.29ID:Cbp+1za8a
>>540
ライブラリ使用とはポケモンやダビスタのようなプラットフォーム上で勝負をするという意味とイコールなんだから
独自性なんてないと思ったらいい

6Vポケモン作ったら勝ち
0608名無し名人 (ワッチョイ e223-UmNz)
垢版 |
2017/07/14(金) 09:56:07.12ID:Im/m/AsE0
4スレッド1秒定跡なし
よっちゃん、まふ系統の全ての組み合わせを
100回ずつ対戦させ、総勝数で順位をつけた

mafuta3 406-383-11
yasema10 405-387-8
yasetamafu70 402-388-10
mafu10 398-391-11
よっちゃん9 395-398-7
mafu 394-401-5
mafuta2 392-402-6
mafuta1 391-403-6
よっちゃん10 382-412-6

結果はこうなった(見辛くてすまん)
マシンスペックや対戦条件によって全然違った
結果になると思うが、参考までに。
0610名無し名人 (アウアウカー Sa0a-Omx7)
垢版 |
2017/07/14(金) 10:10:19.18ID:6Y1SMKMla
やねうら未来探索をぶち上げた時は
従来のいかなる将棋ソフトの流れも汲まない
とか言ってたけどな
まあネタだけどw
0612名無し名人 (ワッチョイ a4ea-+Ma1)
垢版 |
2017/07/14(金) 10:29:56.84ID:4FrCrF0H0
まふさんへ質問

ソフトの対戦見てると横歩取り指さないのは何故でしょうか?
0613名無し名人 (ワッチョイ df32-S4qQ)
垢版 |
2017/07/14(金) 10:33:02.03ID:z5GBxISM0
>>574
キメラではそんなに強くならないみたいですし、大合神シボレーだれか作らないかな。
例えば、クライアントを起動しているだけで、大合神パワーでまふさんが絞った評価関数を作成、公開。
それを、対戦させて結果報告するとか
ちなみに、私はプログラムの能力0です
0614名無し名人 (ワッチョイ 9c11-63ne)
垢版 |
2017/07/14(金) 10:37:08.32ID:gQaLJd1R0
>>602横からだが
実験で検証されないアイデアなんかただの妄想じゃん?
その証拠にwcsc27でまふ定跡の有用性が確かめられるまでは定跡スナイプ戦略なんか全然なかった。そんなに既知であると言うなら、まふ定跡より前の例を示してくれませんか。
0617名無し名人 (アウアウカー Sa18-vrrZ)
垢版 |
2017/07/14(金) 10:57:41.04ID:XT6j0HBDa
将棋ソフトのため"だけ"にPCを買ったりハイパフォーマンスモデルを選ぶのは無駄
AWS借りて使ったほうがいい方がいい

やねみたいな富豪かつケチ臭い人は別
0620名無し名人 (ワッチョイ 0f11-tPLV)
垢版 |
2017/07/14(金) 12:07:21.74ID:zNLCp6yG0
>614
人間の世界で有用性は分かっていたけれど、コンピュータの世界では昔は質の
いい定跡が作れなかった、ってことかいな
0622名無し名人 (ワッチョイ a4ea-Gx9Q)
垢版 |
2017/07/14(金) 12:20:02.84ID:4FrCrF0H0
ソフトは横歩取りは不利と見てるのか
0623名無し名人 (ササクッテロル Sp88-UmNz)
垢版 |
2017/07/14(金) 12:25:48.73ID:/i0p1r/hp
>>622
読みの浅い段階では▲3四飛を読んでいるけど、深くなってくると途端に「これあかんヤツや」ってなる
そんなに悪い手なのかね?w
0624名無し名人 (ワッチョイ 469d-QjT/)
垢版 |
2017/07/14(金) 12:37:08.23ID:bdHthB4S0
>>608
残念ながら誤差の範囲だよね
0625名無し名人 (アウアウアー Sac2-OEix)
垢版 |
2017/07/14(金) 12:37:11.25ID:HJvR7cOda
学習時の定跡で棋風が変わるなら、リゼロ方式でも学習初期のランダムムーブの手数、割合で棋風が変わるんだろうか
0626名無し名人 (ワッチョイ 1d37-Rqte)
垢版 |
2017/07/14(金) 13:23:49.21ID:qcPa4Pna0
>>608
mafuta3 406-383-11 .514
yasema10 405-387-8 .511
yasetamafu70 402-388-10 .508
mafu10 398-391-11 .504
よっちゃん9 395-398-7 .498
mafu 394-401-5 .495
mafuta2 392-402-6 .493
mafuta1 391-403-6 .492
よっちゃん10 382-412-6 .481


よく途中で嫌になって止めなかったなw
0627名無し名人 (ワッチョイ e223-UmNz)
垢版 |
2017/07/14(金) 13:39:15.67ID:Im/m/AsE0
>>626
丸1日半かかったw
好奇心だけで頑張ったが結果が平凡すぎて
こんなもんかと脱力したわw
0630名無し名人 (ワッチョイ b9c1-ryt/)
垢版 |
2017/07/14(金) 13:52:10.16ID:EgP4zWwz0
これじゃあまり強くなってないと言われても仕方ない。これ以上の棋力の向上にはブレンド前の強化学習 でもっと強くするしかないのかな
0631名無し名人 (ワッチョイ 469d-QjT/)
垢版 |
2017/07/14(金) 13:54:28.37ID:bdHthB4S0
大会で勝ちたければここに出ているような話を一つ突き抜けた
発想をひねり出さなきゃ無理か。当たり前だが。
0632名無し名人 (スププ Sd94-SbbE)
垢版 |
2017/07/14(金) 14:00:54.34ID:BJqJYBvmd
自分はちょっと違う実験してるんだけど、完成した評価関数にrezeroのepoch0混ぜてどれだけ棋力が維持できるのか調べてる
mafu10に半分epoch0混ぜても大樹の枝には勝てたりするんだよ、これはどういう風に考えたらいいか?
あと伸びない評価関数にepoch0極少量混ぜたら伸び代が出来ないかなと期待している
0633名無し名人 (アウアウウー Sa30-bL4e)
垢版 |
2017/07/14(金) 14:22:32.16ID:+zv7DViua
駄馬から駿馬は生まれないんやで
0635名無し名人 (ワッチョイ b693-ibwz)
垢版 |
2017/07/14(金) 14:38:04.23ID:5HqEZ6LV0
>>608
これぐらいじゃ誤差の範囲だよな
たぶんもう一回同じ対戦させたら
全く順位が変わると思うわ

あとelmoは基準だから絶対入れてほしいね
0637名無し名人 (ワッチョイ e223-UmNz)
垢版 |
2017/07/14(金) 14:45:58.53ID:Im/m/AsE0
>>635
今からやってみます
0640名無し名人 (ササクッテロル Sp88-UmNz)
垢版 |
2017/07/14(金) 15:10:09.64ID:/i0p1r/hp
>>632
epoch0って評価値0のファイルじゃなかったっけ?
だとしたら、50%でブレンドすると単純に元の評価値が半分になるだけな気がする
ということは、自分の中では全部半分の評価値の中からいいもんを選ぶだけだから、指し手は変わらんのでは?
0645名無し名人 (ワッチョイ d936-z+eH)
垢版 |
2017/07/14(金) 16:42:42.88ID:+o+AYlAt0
>>631
次回の電王トナメは同じくらいのレーティングの団子レースになるから
正直勝ち抜けに一番必要なものは当日の運やで
0650名無し名人 (ワッチョイ 469d-QjT/)
垢版 |
2017/07/14(金) 18:35:51.90ID:bdHthB4S0
>>648
玉以外100とか適等に割り振ってもいいぐらいコマ割りはどうでもよい
0651名無し名人 (ワッチョイ 97db-jig2)
垢版 |
2017/07/14(金) 19:33:57.03ID:BDZWJq5T0
yasema10対elmoで2秒6スレで300対局の結果
yasema10から見て128-28-144と何故か負け越し。

一方でmafu10ではなくmafuとの混合だとelmoに99-16-85と勝ち越し。

まふ氏のところで上がってる勝率66%のデータは5秒4スレだけどここまで変わるものかな?
それとも互角局面開始(24手?)だとmaf10が定跡強化しているからそちらのほうが効いているのか?
0652名無し名人 (ワッチョイ 1d37-Rqte)
垢版 |
2017/07/14(金) 19:37:47.40ID:qcPa4Pna0
駒割りは意外と重要だけど大きく違わなければ差は出てこないと思う
ponanzaはaperyと違って飛車より馬の価値が高いから、そういうのは影響でそう
0654名無し名人 (ワッチョイ 9623-S4qQ)
垢版 |
2017/07/14(金) 19:52:56.90ID:Fqol1Vun0
コンピュータ将棋とプロ棋界の歩み
http://qiita.com/tibigame/items/c3566aca81ada69d2c71

elmo以降に何が起こったのか
・Qhapaqがelmo絞りを行いエロ河童となりelmoと互角の力を得た。
・やねうら王がelmo絞りによる評価関数学習用のルーチンを洗練させて野良評価関数が多数育成される。
・ゼロベクトルからの学習をループさせることでelmoと同等以上になることが示される。
・ゼロベクトルから定跡を食わせて学習させることで少ない局面で浮かむ瀬級にできることが示される。
・複数の評価関数を合成させる技術:キメラ合成が解禁されelmoより+100となる合成法が発見される。
・洗練された定跡を用いて遥かに少ない局面でelmo+200以上の領域に到達できることが示される。(この間選手権からわずか2ヶ月)
0655名無し名人 (ワッチョイ d8e3-MRQN)
垢版 |
2017/07/14(金) 19:55:53.91ID:E3QtjWU+0
激指定跡道場4クッソ強いな
yasema10に87-13で勝ち越しだわ
0656名無し名人 (ワッチョイ e223-UmNz)
垢版 |
2017/07/14(金) 19:56:40.19ID:Im/m/AsE0
改正版(勝率順)

yasema10 463-429-8
mafuta3 461-428-11
elmo 459-438-3
yasetamafu70 450-438-12
mafu10 449-440-11
よっちゃん9 450-443-7
mafu 438-457-5
mafuta2 435-459-6
mafuta1 434-459-7
よっちゃん10 425-469-6

elmoに勝ち越した評価関数

yasema10 elmo 58-42
mafuta3 elmo 55-45
よっちゃん9 elmo 55-45

最も勝敗差が大きかった対戦

yasetamafu70 mafuta2 62-35-3

以上です。
0658名無し名人 (スッップ Sd70-WLQd)
垢版 |
2017/07/14(金) 20:01:51.59ID:HwltO6wzd
けっきょくelmoに勝っててレートも高いのはyasema10 mafuta3の2つだけかな。
自己対戦ベースで強くなってても他と戦わせるとそうでもないって言うのはあるあるらしいからね。
0660名無し名人 (スッップ Sd70-WLQd)
垢版 |
2017/07/14(金) 20:06:34.37ID:HwltO6wzd
前にnodchip互角局面を使って6スレ2秒で戦わせたけどもう少し差が出たよ。
それだとelmoのレートが下がると思う。たぶん4スレ1秒だとどの評価関数も精度が高くて差がでない。
0661名無し名人 (ワッチョイ 1d37-Rqte)
垢版 |
2017/07/14(金) 20:14:29.04ID:qcPa4Pna0
>>653
ゼロフィルのepoch0評価関数にランダム値の評価関数から作った棋譜を学習させると
値が付けばつくほど弱くなる、値の付いてない局面は駒割りだけで評価してて、そっちの方が強いから
駒割りが無効化されるほど評価関数の学習が進むまでは駒割りは効いてくる
0663名無し名人 (ワッチョイ e223-UmNz)
垢版 |
2017/07/14(金) 20:23:07.74ID:Im/m/AsE0
>>660
あくまで参考程度にして下さいw
ただ、個人的に互角局面から指させるのは反対です
0665名無し名人 (ワッチョイ b223-YgBE)
垢版 |
2017/07/14(金) 22:40:14.61ID:PfYxTVM60
まふ関数が思ったより定跡チックに指さない
と言っても交配が進むともっと歪な序盤になるけどね
今更ながらポナって最序盤は変な手だけど、銀冠穴熊組んだり銀矢倉狙ったり構想は手堅くて人間好みな気がする
0667名無し名人 (ワッチョイ 76c2-S4qQ)
垢版 |
2017/07/14(金) 22:55:16.94ID:MHlwir1V0
>>653を解説
例えば、歩の駒割りを;-1して、「KK歩」を全て+1、「KKv歩」を全て-1すれば評価値は変らない。
同様に、歩の駒割りを;-1して、「K歩PT」を全て+1/37、「Kv歩PT」を全て-1/37すれば評価値は変らない。
取り合いの評価で駒割りだけを使うようなロジックが入っている場合は挙動が違ってくるけどおおまかな
所は上のように、学習していけば駒割りの値は評価値に組込まれるので大丈夫ってこと。
逆に、KKPやKPPTのうち駒割り成分を、例えば最大最小が同じになるようなルールで取り出せば、
その評価関数における駒割りがどのように評価されているかの傾向もわかるね。
0668名無し名人 (ワッチョイ b052-10zQ)
垢版 |
2017/07/14(金) 22:57:42.67ID:iIh9KScw0
それなら駒割りって元々いらなくない?
計算資源の無駄な気もするけど何かメリットあるの?
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況