▲コンピュータ将棋スレッド128
■ このスレッドは過去ログ倉庫に格納されています
ぶっちゃけソフト開発を競技(ゲーム)にすること自体に無理がある
企業のコンペと似たような構造なのに、求められるのが実利ではなく競技性という矛盾
みんな巨人の肩に乗ってるのに、下駄を生産するやつ、それを履くやつ、草履自作するやつの区別に必死になってる なるほど最初から無理があるというのは分かる。
カパックチームの伊藤さんもトーナメント制な時点でエンターテイメントって言ってるし
厳密に強さを決める大会を行うなら、独自のプロトコルを策定、ソフトを提出させてサーバーで何千局と対戦を行えばいい やねさんがyorkieの高速化を取り入れてバージョンアップするってツイートしていなかったけか? 賞金を出す理由が放送で使うソフトの選定なんだから技術力で競えって言うのもおかしいような 激指や東大、AIやボナンザが切磋琢磨してる時代が一番面白かった
今は同じ家系ラーメンの中で一番うまいラーメンを決めるだけみたいなつまらん大会 世界コンピュータ将棋選手権の大幅ルール改定がメーリングリストで流れてきましたな
えびふらいとかが大きく影響ありそうだ これはwww
きふわらべの方にもついに規制が入ったかwww クジラちゃんは参加できるのかな。
彼が参加しないと予選の放送がなくなるし一気にWCSCがオワコンになるのだが >>124
4月のニコニコ動画(く)の発表で10月には「画質重さ完全解決」と謳っておきながら11月末ほ発表で「その点に関しては何にもできてません」とユーザーを苛つかせるのがニコニコ動画の独自性だからしょうがないね >>127
ライブラリ規定を厳しくしたせいで、
世界コンピュータ将棋選手権決勝進出ソフト(素人のブレンド評価関数にはかてません)
みたいなことになったりしてな。 >>132
なっていいでしょ
げんにそうだったし
tamoreGとか超えられてないでしょ クラスタ技術に関してはクジラちゃんは独自性かなりあると思うんだけどな >>133
上のほうで比較的色んな対戦させてた人いたけどrereが4120(当時のRで)あるみたいだし
平岡さんが大会前の強烈な相性が出たから差し替えたって言ってたけど
時期的にrereしかないし評判高い Twitterでuuunuuun氏がレート出してるyaselmoって、エルモのほうはSDT5のやつ?
それともWCSC27? >>137
そうなんですか、今までSDT5のほうだと思ってました >>138
yaselmoができて評価されている経緯が「WCSC27直後の雨後の筍評価関数の中で一歩抜けていてかつ早期に出てきたもの」だからね
この早期に登場したってのがポイントで技巧2のように検証者も多いし対局数も多いんだよ
だから一つのマイルストーンみたいになってる elmoSDT5と野生の読み太ブレンドしたらどうなるんだろ もう試したけど強くなんないよ。
素人があれこれブレンドしてもaperypaqより強いものは作れなかった。 sdt5以前の評価関数にはyasei2(7月公開)やrezero8などが合成ネタに有効だったけど、
sdt5以降の評価関数では棋力に差が付きすぎて使えない。単独で大体レート4050以上
はないと合成ネタには適さなくなったと思う。でも今思えばyasei2やrezero8は合成ネ
タとしてはひときわ優秀だったな。 野生の読み太の作者は本当に凄い人だよね。
将棋ソフトのソースコードが公開されてから魔女を代表するようにアノニマスの開発者や集合知がレートの向上に貢献するようになった。
賞金大会には向かなくなったかもしれないが そういやaperyってGPL3だけど評価関数もGPLなんだろうか >>144
GPLではないけど改変、再配布は自由ってreadme.txtには書いてるね uuunuuun? @uuunuuun1
さんのTwitterより
Aperypaq、私の方でも簡単なチェックはしています。
私のサイトの時間規定でY/Aperypaq 160-20-120 Y/Apery (R差46)でした。
ただ、他の評価関数も色々出てくるかな、と様子見中。
今はSDT5の計測が一段落つきつつある時期ですので、
年明けくらいあたりから新規評価関数の測定は始めます。 apery_sdt5とqhapaq-SDT5の50%キメラの報告ラスト
週末にaperypaqと戦わせた。
思考時間2秒・定跡なし・NPSは中盤で4Mくらい(ukamuseはもっと低い)
対aperypaq
249-27-273
前回は145-12-141
aperyそのままよりはこの単純キメラのほうが強いかもしれないけど普通にaperypaqでいいんじゃないかな WCSC29の変更点
○大会ルールの主な変更点
・一次予選の対局数を7局から8局に増やしました。(第19条第一項)←良変更
・これまで、どのプログラムの後継となるか、あるいはならないか(シード権に影響します)は参加者が選択
できるようになっていましたが、参加者の申告を参考にしつつ運営委員会が決定することとしました。(第14条)
↑これ、後継でこういう変更しなきゃいけないような事情あったっけ?
・また、これまでシード権の放棄を認める運用としていましたが、それを認めないこととしました。←クジラちゃん強制2日目送りw
・これまで、定跡データは「開発部」(第1条で定義)に含まないこととしていましたが、それを「一般に流布している定跡データ」
に限定し、非公開で改良した定跡データは開発部に独自の工夫を加えたものとみなすこととしました。
・これまで、評価関数を学習するための局面とその評価値のセットは「思考部」の一部である「学習部」と
みなしていましたが(第1条で定義)、一般に流布しているものは思考部から除くこととし、floodgate等の
評価値や読み筋を学習データとして使えるようにしました。
ただし、CSA利用可能ライブラリに含まれている局面とその評価値のセットを使う場合は、そのライブラリを
使っていると宣言することを推奨します。
○運用に関する主な変更点
・アピール文書について、A4サイズで25ページを上限とします。
・一般に流布している定跡データを組み込んだ場合や、評価関数の学習に一般に流布している局面と
評価値のセット、読み筋等を使った場合は、アピール文書に記載することを推奨することとします。
・ライブラリ使用者のアピール文書について、ライブラリの選定理由の記載を求めることとします。 別にきふわらべのアピール文書を排除しなくちゃならんほどCSAのサーバが
容量逼迫してるとも思えないのだが、独創賞とか出す手前、運営委員は全参加者の
アピール文書全文に目を通さないといけないとかそういう事情なんだろうか。 アピール文書が500ページぐらいあったらたまらんからな クジラちゃんは強制2日目送りだけど、1日目に会場来て1日中テスト対局やってても
別にいいんでしょ? 定跡はこの決まりなら前回みたいにまふさんが大会30分前公開したものは使えるな。
クジラちゃんが予選から参加できなくなって、事実上予選の放送は消滅した。 >>150
これって定跡だけでも出られるって事か? >>155
つまりハニーワッフルWCSC27みたいなのは28回から明確にシロになるということ >>156
ハニワってそんなにグレーな存在だったっけ? >>150
> 後継でこういう変更しなきゃいけないような事情あったっけ?
シード権の放棄を認めない、が影響してんじゃね? アピール文にフォントサイズ指定とかあったか?
ページ数制限とかイミフ
なら文字数制限にしろよ 電王トーナメントもあれだが、CSAの無能感も凄いよな。 >>154
非公開で改良された定跡データは開発部と見なされるので、まふさんは開発者の中に入ってしまうのでは?
となると複数にあげることはできなくなるのでは?
というか、開発者でもないマフ氏が人力で編集した定跡が暗躍し勝敗に大いに関わる事態を排除するためのルール変更ではなかったのか?
なぜ明確にしないのか理解に苦しむ >>161
一般に公開されてればOKだから、昨年のやねうら王と同じように大会の当日に更新しまくれば問題ない。 きふわらべ『よし! 今までの1/10の大きさにすれば250ページ相当いけるな』 画像データの解像度を物凄く高くして拡大したら大量の文字が書かれてるA4サイズPR文書を25ページとかでもいいのだろうか ブレンド評価関数(aaa)を検証したらaperypaqよりちょっと強いのが出来たみたい。
設定 4スレ秒読み1秒 定跡なし
対局数100 aaa 53勝 aperypaq 43勝 引分4 勝率55%
対局数100 aaa 54勝 apery_sdt5 43勝 引分3 勝率55.5%
対局数100 aaa 62勝 yaselmo 37勝 引分1 勝率62.5% >>168
対局数は置いておいて、たぶんちょっとノード数足りなくないかい? >>163
えっそんなんでいいの。そんなライブラリじみた扱いでいいの?
マフ定跡は非公開ではない。非公開ではないが、それが当日特定の人にのみ利用できるタイミングで更新され公開版ともはや別物になっていない事を保証するものではない…みたいな。
そんな利根川理論でええんか? >>169
aaa vs aperypaqをfloodgate放流用には、たぶん最適設定の持ち時間10分 秒読み10秒
tanuki互角局面集使用の設定で現在 対局数24 aaa 12勝 aperypaq 9勝 引分3 勝率57%
の途中経過だけど、100局になったら、また結果を書き込むね。誰も興味ないと思うけど。 やねエンジン+野良評価関数+まふ定跡でほぼ最強ソフトが出来上がる
それをどこまで変えれば独自性が認められるかだろうけど抜け穴は大きそうだね >>158
あー、山本さんが芝浦卒業したあと、ひまわりと芝浦Jrのどっちも芝浦の後継
否定してシード権実質放棄になったもんな。 シード権放棄不可については、開発者名義を毎回増加減して、前回とは別ソフトですと主張すれば抜け道にならんかな 今回のルール変更で明確に不利になっったのは
「くじらちゃん」のみ!!! >>160
電王トーナメントのグダグダな規則の立案に比べたら、
CSAのルールメイキングは比較にならんほど明確よ。
法律とか契約の条文作成とプログラミングはかなり似ているところがあるけど、
WCSCのルールメイクはさすがプログラマだわと思うところがある。 >>174
それを許さないためにも、何が後継かは実行委員が決める、という一文が効果を持つ >>157
単に振り飛車定跡入れたうかむ瀬やんけ!って声はあった。 Bonanzaと文殊が連合してBonanzaFelizになったときはBonanzaの後継だったけど、
仮に芝先生がshotgunで選手権に出て、ハードウェアはえびふらいのクラスタが担当します、
芝先生は都合があって岡山から出てこれないので定跡だけえびふらいにわたして
現地のオペレーションは全部えびふらいがやります、だったら、これ、shotgunとして
初出場を実行委員は認めてくれるだろうか。 平岡さん+クジラちゃん+芝先生の合同チームの可能性もなくはないもんな
まぁえびふらいは1次予選からテスト対局兼放送でいるだろうけど
それとgitの仕組みとかけ離れた時代遅れのルールは直ったの? まふ定石は穴だらけだよ。現に73%(R差170くらい)勝ってる・・・
登録手が多いのでアマチュアの研究(練習)対局には向いていると思う。
どのチームも同じ定石使うようになったら、単なる定石披露会になってしまう。
個人的に今回のSDT5の(公開されている)bookではQhapaqが一番優れていると思う。
河童パーク定石に対しては今のところ55%までしかいってない・・・
河童パーク定石、先手番やたら強いね。 初手38銀はあると思います。 >>179
シードを設けた趣旨からすれば認めない方向だろうが…
実績ある強豪が2年ぶり参戦もあり得るので、
どっちが主体なのかで判断するのでは。 Qhapaqの人は自己対戦で1手8スレ1秒でやってたけど、ノード数ってそんな大事ですかね?
個人的には長時間の100局200局とかより、0.1秒とかでも数千局とかやったほうがいいような気がするのですが。 >>185
2〜3年前、技巧が超短時間多数対局の戦略で学習後の検証回して、やねうら王他も採用してた。
しかしelmo以降、短時間で差がでないが長時間で逆転するタイプの評価関数が現れた。
なぜそうなるのかを理論的に詰めた人は居ないはず。 >>185
SDT5より前/WCSC27の後くらいに、シボレー&キメラでelmoに対して
測定したのだが、0.1〜1秒とかだと対elmo 85%とかの評価関数ができた。
当然超強とおもっていたが、念のため3秒 5秒 10秒とかで確認してみた。
すると60〜70%程度しか勝てないことが判明。
その評価関数yaselmoとも対戦させてが、負け越し。
ノード数低いとソフトの真の力がでてないのでは。
個人的にはノード数は最低でも3000万を目安に計測するようにした。
局数多ければいいってものではない気がするが。 定跡って同じものを使うと盾と矛の戦いになるタイプと
後手に穴があって先手勝ちまくりってタイプがあるのかな
後手の定跡が先手より圧倒的に大切だと思うんだが 評価値自体は探索でごまかされるし、ランダム性も多少はある動的な値だけど
bookは固定値だからしゃーない
しばらくは評価関数作るより、どれだけ効率的に計算資源を前借りするかが的になるんじゃないかな
結局何が言いたいかというと評価関数更新で定跡作り直しは無駄がでかい >>183
まふ定跡をメタるのはそもそも選手権で滝澤さんがやってたし、その方法で決着でしょう。
ただ、そうすると定跡の搭載手順が異常に少なくなるので一般公開向けにならなくなるだけで。 そろそろコンピューター将棋も共通オープニングブックを大会主催者が用意した方がいい。
一成さんの言う通りソフトが強くなりすぎて定跡の優劣で勝敗が決まってしまう >>187
>>188
そうなんですね。自分は以前、磯崎氏が自己対戦で短時間対局をたくさんこなしてるのを見て、それで充分だと思ってました。
floodgateに流してた自分のYapata_Lも、8スレ1秒で200局ほどやってAperypaqに57%程度の勝率だったので、8スレ10秒でどう変わるかやってみようと思います。 >>192
スイスドローで共通オープニングブックはなかなか厳しいぞ
TCECのように、同一対局で双方が先手後手最低1回ずつ持つのならありだけど。
(そうでないと先手と後手で勝率差の少ないオープニングを選び出すのが大変
それでなくても、将棋の定跡はチェスのオープニングに比べて穴だらけなのに) >>192
その時代がやってきてから対策を立てれば良い気はするけどな
定跡の発展なんて即座に将棋界へのフィードバックが見込める部分だし フィッシャーランダムチェス(チェス960)みたいに一段目をランダムにして先後対称にした初期局面から
レート測定したらどれくらい普通のレートと変化するのかな?ほとんど同じくらいなら面白いけど >>195
いま現状、定跡はアマやプロからフィードバック受けてる状態・・・ チェスはBook使うと引き分けにしかならない事情があるからであって
将棋で取り入れる意味はない >>198
それは違うんでは?互角局面用意した今の方が引き分け多いと思う。8、9割引き分けだよ >>167
そうだぜ☆
アピール文書が25ページになってもそれに見合った面白い文書を書くだけだぜ☆(^〜^) >>198
戦型選択というメタゲームが除外されるから意味あるでしょ
単純にノータイム指しっていうインチキ効果もついてるし スッップ Sd0a-SfGS
コイツのレスを見てみよう
https://imgur.com/a/cDu3F
ご覧の通りに貶す場合と取り入られたい場合の
二面性のレスの仕方をする典型的な
※双極性障害
※統合失調症
※演技性パーソナリティ障害
などである
さして強くもないのに優位性の証拠も提示できずに他者には押し付ける
バグッたRで勘違いをしているのに我慢できずに自己主張したくなる
病気の持ち主=Yapata系の自称キメラ屋(笑) >>193
評価関数にもよると思うが、特にシボレーやキメラの評価関数は
例として1秒で200局、3〜5秒で100局、両方計測したほうがいいと思う。
あまり勝率がズレている場合は1秒計測のほうは信用しないほうがいいです。
ノード数多い場合100局から150局くらいも計測すれば、そこそこ正確なデータといえます。
ふつうは長い時間の計測のほうが勝率少し落ちる。
すでにAperypaqに勝つのがあるんだあ。 >>191
自分は元のオリジナルbookから差し手を減らさないで、差し手選択肢を増やして勝率あげました。
対まふだけ考えるのならあと5%は上がるとおもう。
だが他のbookに対してあきらかに弱くなるのでそれはしない。
戦形によっては狙い撃ち的な部分も多少はあるのは否めないが、
その方法では使えないものになるので、違うコンセプトで作成してる。
自分のは完全に大会向けのbookですかね(大会とは無関係) >>185
去年まではそれでよかった(?)
しかしelmo以降はなくなった >>120
ソフトの将棋に魅力がないから仕方ないじゃん
マシンパワーで名人倒して何なの?産業としてもゴミだしまじで哀れ >>206
マシンパワーには全く頼っていないわけだが
(教師局面の自動生成のことまで言うとマシンパワーの問題だが
それを問題にする人はいないよな) >>206
名人は低スペックに負けたんだけど。
囲碁と真逆のルール設定。
最高峰の戦いであのスペックはいかがなものか。
ドワンゴ&連盟らしいルール設定。
電王戦対局用PC
OS:Windows 10 Home 64bit(Linuxに換装することも可)
CPU:Core i7-6700 *(実買四万円程度)
メモリ:32GB DDR4 *(実買二万円程度) え?事前の強化学習はマシンパワーじゃなかったら何なんだ?
評価関数アルゴリズムの最適化などをして論文になるレベルのことでもしたんか(笑)w >>208
事前に何千時間も強化学習しておいて、定跡的に指し手を登録するなり評価関数を強化してたわけで
それって結局はマシンパワーゴリ押しな手法であると認定されても何も言えないじゃんw >>197
なので定跡勝負になっていいんじゃね?と思う
個人の知識やノウハウではなく
体系的に有用な定跡を作る方法が確立されていないのであれば
それを元により強力な定跡を作っていく中で効率的に定跡が作られたほうが良い
山本も定跡勝負がくだらないと思うなら持ち前の物量で定跡作ってデファクトスタンダード築けばいいのにな
ちなみにチェスの定跡ってどうなってるんやろね 名人に勝ったのは一言で言えば、
ソフト側の事前カンニング行為があったからということですな 定跡はむしろ
ライブラリ勢が一番独自性を発揮出来る部分でしょ。
そういう意味では評価関数よりも重要。 なるほど。ソフトが勝ったとか言う話も専門的に見れば胡散臭い部分が満載なんですね ID ワッチョイ 無しの奴にかまうなよw
誰だかすぐ分かるのに yaselmoがなんでこんなに強くなったかはまだ分かってないんだっけ? >>217
それ、途中からelmoの仕組みの考察だけになってて、
問題提起の長時間での逆転現象の説明がどこなのかわかりにくいな。
elmoは遠い局面の勝率と評価値を、現局面の教師にしている、という辺りか。 ■ このスレッドは過去ログ倉庫に格納されています