▲コンピュータ将棋スレッド127
■ このスレッドは過去ログ倉庫に格納されています
透が作ったのって本当にyaselmo超えてたのか?
どうせ統計誤差の範囲だろ >>288
> 現在は入玉後は駒を相手陣地に埋めていき、点数勝ちを目指すようになってきました。
これは他のソフトも是非実現して欲しいな。256手超えの引き分けが減るのは望ましい >>357
やねうら王はUSH_Hashは使ってない
Hashの方を変更しないと駄目 >>361
yaselmoより強いね。わりとシボレーと合成でyaselmoより強いやつはいける。
ただR4150あたりで頭打ちになる。それ以上は非プログラマだと何をどうやっても強くならない。 tanuki sdt5は、uuunuuunさんの計測では「R4081」です。
一方tanukiさん個人の計測では、以下のようになっています。
elmo wcsc27に対してR+180、
tanuki wcsc27に対してR+190、
tanuki sdt4に対してR+280、
Apery sdt5に対してR-50
計測の仕方については、
uuunuuunさん:4スレッド5秒
tanukiさん:1スレッド5秒
という違いが有りますがかなりズレが大きいです。なぜなのでしょうか?
https://i.imgur.com/Qr5LWMM.jpg やねさんが言うとおり、AWSにジャブジャブお金をつぎ込めば
一般人でもR4500くらいの評価関数を作ることは可能なんだよな実は >>364
uuunuuunさんの計測だと、YO4.79/Apery_sdt5がR4128です。
Ponanzaこそもう少し強そうですが、プログラマの最高レベルでさえR4150程度だとするとシボラーもプログラマも強さの限界が変わらないということは無いでしょうか? 測定されるうちにトップのソフトはレーティングが下がってくる傾向があるから、R4150のソフトも今計測したら4100越えてないと思う >>368
結局オープンなんだからほぼほぼ同じ学習部で学習するわけで、開発者とか非開発者とか何か関係あるの? あと大会参加者の大会に出す評価関数を選ぶ基準がおそらく単純なレートの高さじゃなく万遍なく勝てる、できるだけ相性問題が出ないものを選択していると思われる >>358
うちのPCでは六割の制限はなさげですね。
>>363
ありがとうございます。HASHをいじるとメモリ消費が変わりました。強さは全然変わってないっぽいのですが、なぜでしょうか? >>359 >>360
rereをuuunuuunが計測してるんだから文句あるなら優位性やお前が絞ればいいだろ?
お前のために公開してくれてるんじゃないのに勝手に妄想膨らますなガイジ
計測すらしない、ましてや似たようなとか河童作者が内包している情報が全然違うって言ってるだろ
急に現れる単発と合わせてsuimonやFC2の乞食と一緒 >>358
値を2の累乗にしてないからでは
>>372
長い時間での思考にしか影響ないよ >>365
tanukiさんのは互角局面集を使っての計測です 探索部がやねうらでエルモのソックリさんばっかりなんだからレートも大して変わらんだろ 長らくこのスレのテンプレにすら入っていなかったやねうら王ブログが
いまや教典代わりとは、、、時代が変わったもんだなw エイプリーと18号のキメラが強くて歯が立たないよー;; ?
やねうら王に関する質問で、全部ブログに書いてあることなんだから、
このスレに余計な質問する前にブログ読めは普通だろ? >>376
評価関数マージするならelmoはあんまり使えない印象を受けますね
elmoマージするくらいならelmoより弱くてもいいので他の奴をマージすることをお勧めします
今年の選手権に出場したtanukiやカパックが個人的にお勧め
1:1でマージしてるわけではないので悪しからず
何故かapreyとelmoをマージしたよ時よりもはるかに強い評価関数が出来上がった
レートは測り方知らないけど、勝率で見る限りapreyよりかなり強い評価関数が出来ますよ。 >>379
もし、お猿の18号のことを言っているのであれば、KKだけ18号を移植して、その後割とガッツリとtamore教師で学習させたから、tamoreの影響かもしれません。
Dr.ゲロ また大して強くなってもないキメラにスレ民が翻弄される流れになるのか
くだらない >>381
配分率は分かんない
今floodgateで対戦して終始劣勢だった
TVTにも一発はいったりウエスタンラリアットに勝ち越してるけどエイプリー18号キメラには勝てない
けど、放流しているソフトより格下のソフトがそれに勝ってるの見ると相性なのかな?とも思う >>383
Dr.ゲロさんaperyとの勝率おねしゃす >>384
ごめんね
絞る資源が無いんです
資源があったらシボラー透みたいな事やってみたいとは思っているんです。 人造棋士の人はノートPCで絞ったり調整してるんじゃなかった? >>382
自分もブレンドしたらaperyより強いのが出来た。
設定 4スレ 秒読み1秒 定跡なし
対局数400 先手勝ち192(49%) 後手勝ち194(50%) 引き分け14
ソフトA(yane4.79)
勝ち216(55%) 先手勝ち109(55%) 後手勝ち107(56%)
Apery_sdt5(yane4.79)
勝ち170(44%) 先手勝ち83(43%) 後手勝ち87(44%)
対局数400 先手勝ち198(50%) 後手勝ち192(49%) 引き分け10
ソフトA(yane4.79)
勝ち237(60%) 先手勝ち120(61%) 後手勝ち117(60%)
yaselmo(yane4.79)
勝ち153(39%) 先手勝ち78(40%) 後手勝ち75(38%)
対局数100
ソフトA(yane4.79) 勝ち54(56%) vs tamore(yane4.79)勝ち42(43%) 引き分け4 >>386
>>388 の方の仰るように、うちにはまともに計測できる環境がないので、皆さんのリソース頼みで公開した次第です。
おんぶに抱っこですみません。
Dr.ゲロ レート差と持ち時間(思考時間)についての研究ってなされていない?かもしくは実験結果とか
レート差200は思考時間2倍に相当する、とか >>391
お猿のAperyと埴輪棋士18号については、お遊びで作っただけなので、全く計測する気はなかったです。作成方法と元の評価関数の分布を見て、弱いわけがないと思っていましたから。
計測のためのリソースは、今作っている18号(改)(仮)に充てていますので、それらに充てられなかったのです。
Dr.ゲロ >>389
さすがにsuimonさんはxeon持ってるだけあって自己対戦はえーな hashは強さは変わらなくても
PV出力に関わるから検討用途で使う一般人はある程度確保した方がいいよ >>392
一日目に語ってた評価関数のゲイン調整の話聞きたいのでどこかに書いてくれませんか? Aperyに定跡入れたら
Mate+1とmate-1が交互に表示されるんだけど何これ >>396
終盤によく出るよね
仕様かバグかわからないけど 500点以上の評価値を減らして500点以下に収める謎ハックをすると(枝刈りのマージンに上手くひっかからなくなって)矢倉が復活するとかいう話? VS で、やねうら王をなんとかコンパイル出来るものです。
青空将棋(本将棋の初期画面から歩を全てとっぱらった以外は普通の将棋と同じルールです)の解析をしてみたいのですが
これが可能なソフトは公開されていますか?
あるいは、ソースをこうすると良いってヒントを頂けないでしょうか?
教えて下さい。エロい人 >>151,236
まだ最後の1局やってるけど、上位争いは決着したので
1 Houdini 6.02 3184 18.5 28 231.00 ・・・・ =01= ==== ==1= 111= 1=1= =1== 1=1=
2 Komodo 1959.00 3232 18.5 28 226.25 =10= ・・・・ ==0= ==1= =1=1 11== 1=11 =1=1
3 Stockfish 051117 3228 18.0 28 233.00 ==== ==1= ・・・・ =1=1 ==== =11= 1=== =1=1
Stockfishは0.5pts及ばずSuperfinalを逃す。
Game 108のHoudini対Stockfish、Game 109のKomodo対Houdiniがドローになった時点で確定したみたいだ。
3強間の対戦成績は
Houdini vs Comodo 1勝1敗2分
Komodo vs Stockfish 0勝1敗3分
Stockfish vs Houdini 4分
で4位のFireに2勝したのもStockfishだけなんだが、5位Chironとの4分が響いた感じ。
まあ、レーティングが示すとおりで3強に差なんてほぼないよね。 >>152
でもponanzaにはまだギリギリ届いてないみたいだな。 >>229
そうなったらなったで魔女の人が復活しそうな気がする WCSC27時点でPonanzaとelmoのレート差は100
今回やねうら王+Apery評価関数でWCSC27 elmoとレート差は180
GPU使ってないPonanzaはほとんど強くなってないことを考えると、
GPU使ってやっと同じ位と見るけどね
探索部分や3駒の評価関数部分ではやねうら王 + Aperyの方が上 未上場で成長を続けるスタートアップ企業の存在感が増している。
日本経済新聞社が実施した「NEXTユニコーン調査」によると国内22社が企業価値(推計)で100億円を超えた。
人工知能(AI)やネット関連が上位にきた。独自技術に着目する大手企業も有力スタートアップ企業の取り込みに動く。
新興企業の台頭は産業構造の変化に対応し、日本経済を活性化する役割を果たしている。
調査は日本ベンチャーキャピタル協会の協力を得て実施した。
創業おおむね20年以内で特徴的な技術や事業モデルを持つ108社から回答を得た。各社やベンチャーキャピタルへの取材を基に企業価値を推計した。
企業価値10億ドル(約1120億円)以上の未上場企業が「ユニコーン」とされ、その予備軍の有力スタートアップを含めて「NEXTユニコーン」とした。
企業価値首位のプリファード・ネットワークス(東京・千代田)はAIの一種である深層学習で制御技術を開発する。
西川徹社長は「深層学習を導入することで製造業に変革の波を起こしたい」と期待を寄せる。
8月にはトヨタ自動車が約105億円を出資した。両社は認証や車の情報を解析する技術で提携する。 90年代ごろまではショップ店員に
ああいう無限問答してるのがいたわw
果てはソフトのピーコを要求したり >>391
根拠のある研究は知らないけど、印象論ではかなり個体差があるような気がする
少ノードでもスパッと良い手を出せて、時間掛けても手があまり変わらないのもあれば、
早見えは無いけど、時間さえ掛ければかなり精密に読めてるみたいのもあるので、
全体として相関を見出すのって難しそうな気がする
uuunさんが昔、統計出すほどまでやれなかったはずだが、
似通ったR±200前後くらいのソフト同士なら、
思考時間差での逆転はいくらでもあるみたいな仮説やってたはず ハイスペPC余してるやつは>>269検証してやれよ >>391
やねブログ読めば?
後、技巧のdepth毎のレートと。
が、1分と2分の差は1時間と2時間の差とは異なるのが見えてる。
(下手の考え休むに似たり効果とでも名付けるか)
そんな一次関数で単純近似はできまい。
ある程度の強さのソフト同士がこのくらいの時間使うとき、という限定区間の近似になるだろう。 >>411
これ検討かけてみたけど97手目の▲3三龍がaperyでもヤセルモでも読めないな >>411
駒割りは飛車と銀銀桂の三枚換えだけど角以外全部自陣に投入して攻め駒不足で駒の補充も難しいってやつか。
ここまで駒を自陣に投入するのはかなり珍しいな。 一方的に攻め立ててウエスタンラリアットで仕留めようとしたらカウンターで腕を取られ脇固めを食らった感じか!
いやすまんw >>412
激指しは33飛成りも42飛打ちも読めたぞ
エイプリーも10億ノードくらいで読めた。 TCEC、次からは1年に4シーズン回すリーグ戦になるんだな。
TCEC3部リーグ
・持ち時間30分+10秒加算(1局約1時間)。CPU22コア
・初期参加メンバー:招待者全ソフト、2期目からは2部からの降格2ソフト+招待ソフト6
・上位2ソフトは2部昇格、下位6ソフトは参加枠から脱落
・4回戦総当りで総ゲーム数112
TCEC2部リーグ
・持ち時間45分+10秒加算(1局約1時間半)。CPU22コア
・初期参加メンバー:TCEC10の13位〜18位+第1回3部の上位2ソフト
・2期目からは3位〜6位+1部からの降格2ソフト+3部からの昇格2ソフト
・上位2ソフトは1部昇格、下位2ソフトは3部降格
・4回戦総当りで総ゲーム数112
TCEC1部リーグ
・持ち時間60分+10秒加算(1局約2時間)。CPU44コア
・初期参加メンバー:TCEC10の7位〜12位+第1回2部の上位2ソフト
・2期目からは3位〜6位+プレミアからの降格2ソフト+2部からの昇格2ソフト
・上位2ソフトはプレミア昇格、下位2ソフトは2部降格
・8回戦総当りで総ゲーム数224
TCECプレミアリーグ
・持ち時間90分+10秒加算(1局約3時間)。CPU44コア
・初期参加メンバー:TCEC10の1位〜6位+第1回1部の上位2ソフト
・2期目からは1位〜6位+1部からの昇格2ソフト
・上位2ソフトはSuperfinal進出、下位2ソフトは1部降格
・12回戦総当りで総ゲーム数336
Superfinal
・持ち時間120分+10秒加算(1局約4時間)。CPU44コア
・全100回戦 >>417
3部リーグは次回も3部リーグに残留するソフトが一つもないんだな
将棋界的に考えたら一番下のグループはトーナメントにして、優勝と準優勝ソフトが2部昇格で良さそうなもんだが
1年間に24のソフトを取っ替え引っ替えしながら継続できると踏んでるわけだ
コンピュータチェスは裾野広いね >>420
もちろん前回の下位6ソフトがそのまま次回も招待ということもあるとは思う。
(箱根駅伝でも前回予選会落ちのチームが全て次回の予選会を通過したこともある。
結果的に2大会連続で全出場校が同一になった) >>391
もうずいぶん昔の話だが
https://web.archive.org/web/20120721023021/http://www.sgtpepper.net:80/kaneko/diary/201103.html ↑これ分かりやすく時間2倍で2勝1敗なのでレーティングが正しくはかれる範囲と仮定して
時間10倍で10勝1敗でR400差になる USIエンジンでgo送ってエンジンが思考中にCtrl+Cでキャンセルしてもプログラム自体は止まらず対話モード(?)に戻れるのってどういう仕組みなん? >>424
SIGINTもらったときの動作をstop相当にすればそうなるんじゃね ぽんぽこからelmowcsc27を抜いてから(evalmergeで200%で合成)、elmosdt5を合成したら、apery+YO4.79に勝ち越すようになった気がする。
まだ300戦くらいの調査だから不正確かもしれないが >>310
後手の持駒:飛 角 金二 銀二 桂四 香三 歩十五
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・ ・ 飛 ・ ・ ・ ・ ・|一
| ・v玉v金 ・ ・ ・ ・ ・ ・|二
| ・v銀 ・ ・ ・ ・ ・ ・ ・|三
|v歩v歩 ・ ・ ・ ・ ・ ・ ・|四
| ・ ・ ・ ・ ・ ・ ・ ・ ・|五
| ・ ・vと ・ ・ ・ ・ ・ ・|六
| ・ ・ ・ ・ ・ ・ ・ ・ ・|七
| ・ ・ ・ ・ ・ ・ ・ ・ ・|八
| ・ ・ ・ ・ ・ ・ ・ ・ ・|九
+---------------------------+
先手の持駒:角 金 銀 elmo.sdt5とApery_sdt5を合成したのと比べてどっちが強そう? >>428
と金がなければ▲73銀から7手詰
この図は不詰 >>427
あれ、elmo抜くなら150%で合成じゃないのか?勘違いしてたらすまんが ぽんぽことelmoを150%で合成ってことは
配合順を逆にしたらelmoとぽんぽこを50%で合成ってことになるから
elmo成分が残っちゃいそうな気がするんだけど 要素を抜くのは自分も150%かと思ってた。
ぽんぽこ+150パーセントで elmoは -50パーセントになるから ぽんぽこを150%にしたら、元が1:1なんだから75%+75%=150%になってるから、計算合わなくね? >>433
よく考えたらその通りでした。ありがとう 公開するのは、この教師局面が必ずしもベストのものじゃないからとわかったからでもあるんだろう。
それに、100GBのファイルを3つも落とせる人は開発者だけだろうし。 >>441
返信先: @yaneuraouさん
それからすると「ソースコードをいじって5%速くなりました」っていうのは十分な独自性のように思える。
少なくともMagic Bitboardのような数%すら速くなるか怪しい高速化技術をPR文書に毎年書いていたPonanzaの山本君が「高速化は独自性なんですか?」
だなんて、どの口で言うのか、みたいな思いはある。
これ爽快だよね >>443
あれは「高速化は独自性です」と言わせるための主尋問でしょ。 高速化の内容にもよるでしょ。
アルゴリズムの見直しで高速化することもあれば、
単にメモリー配置とかループ外してべた書きしたりで高速化することもある。
前者は独自性だし、後者は独自性皆無。
数%程度だと後者の可能性高い。
アルゴリズムでの高速化だと数桁レベルの高速化もありうる。 >>445
こういう知ったか馬鹿が独自性審査とかしたら悲惨なことになるな 改善だって、十分評価に値すると思うので、独自性だけを取り上げるのは反対。 公開されないソフトの改善よりは、いまメインストリームである
やねうら王に対する改善は、使う側としてもありがたいしな さすがにきふわらべに失礼やぞ
95桂馬が14に跳ねたり、金が成って反則負けする凄い独自性があるんやぞ やねうら王は探索がよく取り上げられますが、
やねうら王自身のSDT5や最新の評価関数はどれになるんでしょうか? 後手の持駒:飛 香 歩二
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 杏 ・ ・ 馬 ・ ・ ・ ・|一
|v飛 ・ ・ ・ ・ ・v金 ・ ・|二
| ・ ・ ・ ・ ・ ・ ・ ・ ・|三
|v歩v歩 馬 ・ ・v歩 歩 ・ ・|四
| ・ ・ ・ ・v歩 ・ ・v桂 ・|五
| ・ ・ 歩 歩 ・ ・v金 ・ ・|六
| 歩 歩 ・ 金 ・ ・v歩v銀 ・|七
| ・ 玉 金 銀 ・ ・ ・v玉vと|八
| 香 桂 ・ ・ ・ ・ ・v全 ・|九
+---------------------------+
先手の持駒:銀 桂二 歩五
先手番
こういう入玉系の将棋だと評価関数によって随分評価変わるんだね
この局面をうちの低スペックPCで1分検討させたらこんな感じだった
GPSFish 1177
YO4.79/Apery_sdt5 546
Gikou2 182
激指定跡道場4 -639
YO4.79/elmo_sdt5 -960
YO4.79/tanuki-sdt5 -1362
18gou_sdt5 -2761
YaneuraOuKPP_KKPT4.76 -3198
ここからAperyとtanukiで対戦させるとAperyが勝つんで
おそらくAperyの評価のほうが正しいんだろうけど Aperyは先に入玉されても後から入玉点数勝負で勝てるかどうかまで評価出来てる。 入玉系の将棋の評価値グラフはシンクロ度見ればだいたい同一ソフトかどうかがわかるよね
まだまだ伸びシロはいくらでもある世界でしょ 200%でも抜いたことになってない説
@mm_Tamachan_mmさん
てか、抜けないよね? A,Bの配合比率を7:3とする
CをマージしてBと同じ比率にする
結果的には7:3:3で100%を分け合う
100掛ける13分の3がマージする%になる
CがマイナスBなら打ち消し合う
ではないのか? あ、抜けるのか。
仮にAの評価値が100、Bの評価値が10として、
1:1ブレンドすると、50 + 5 = 55
200%でブレンドすると、55 × 2 + 10 × -1 = 100
抜けますね。失礼しました。
わざわざコマンド作らなくてもよくなってホッとしました。w
Dr.ゲロ >>457
ちなみに作ろうとしてたコマンドは、指定%分を単純に抜いた後、100%になるように数字を持ち上げるというものです。
これはこれで便利そうなんですけどね。 ■ このスレッドは過去ログ倉庫に格納されています