▲コンピュータ将棋スレッド136
■ このスレッドは過去ログ倉庫に格納されています
相性問題はあるからな
それでもaperypaqとwakame1stに対して有意差出てれば十分でしょ
あとはクジラのカッパ巻きに期待 256手ルールの対応って
・先手番なら256手目の局面の評価値を0
・後手番なら257手目の局面の評価値を0
に設定しておけばいいのかな 河童さんの参戦記読んだら、やっぱりCrazyShogiは一局ごとに別バージョン入れてたんだな
レミさんに矢倉を組んだことの衝撃が伝わらなかったのは残念 評価関数には相性があるから対局相手の種類を増やすほどレートが下がるもの、
uuunuuunさんのレーティング表では複数と対局させた結果でyaselmoはramuよりレートが少し高いが、
yaselmoとramuを対局させるとramuの方が強いので、相性問題があることが分かる そういえばAlphaZeroの正式な論文まだ出てない? 強豪将棋ソフトの手数がかかる団子状態の対局を普段から見慣れていると、プロ棋士の将棋が、ボナンザ6.0程度の将棋に見える >>345
出てない。海外じゃfacebookが汎用AIの発表を行うから焦って大急ぎで発表したのがalpha zeroなんじゃないかって説がある。 藤井聡太は人間界では強いが棋譜を見る限りボナンザ6.0程度の将棋 >>341
257手目に詰まされた時負けになる可能性があるから、それも考慮しないとダメだぞw >>328
価値があるプロは観る将相手の芸人棋士ぐらいでしょ。
ガチな連中からすると、人間の指す将棋の価値は落ちる一方。俺も羽生の通算100期を見届けたら、プロ棋士で興味あるものが無くなってしまう… 棋譜の価値がレートに基づくものではなくてコストに基づくからだよ >>351
将棋人気はむしろ上がってるしお前みたいなガイジが消えて新規ファンが増えるなら喜ばしいことじゃないか >>351
こういう奴はさっさといなくなってかまわん
羽生や藤井の将棋は私達を魅了するし、それはソフトがいくら強くなろうとかわらん qzilla9が振り飛車好きと聞いたので振り飛車定跡積んでTNKと当ててみた
一手1秒 512手で持将棋 投了値は指定せず
godwhale+qzilla9+振り飛車定跡(16手目まで) 47-153 nnue+デフォルト定跡
序盤で定跡抜けても自力で振り飛車することも多いので振り飛車が好きなのは本当っぽい
ただ中盤あたりの-100〜-200ほどの局面で居飛車側の仕掛けを軽視しているように見える
俺の感覚では対抗系の局面においてはtnkの評価のほうが正確に見える 振り飛車定跡は将棋GUIのHPで公開されてる物と埴輪の定跡を合わせて居飛車側の手やおかしな手順の採用率を0にしたもの qzilla9が振り飛車を評価するのは数千万ノード読んだ時点からだし
63銀から右に雁木を組むような陣形を示すから定跡使うにしても
qzilla9で改めて作った定跡じゃないと意味がない k_ohgaさんがSF9で魔女を書き換える可能性もあったんだな、そっちも見てみたかった ものは試しでメモリ2Gのarm環境でnnたぬきの学習をチャレンジしてみた
どうせのろいから実用的な意味はないがとりあえず動くことは動くようだ クソみたいな質問で申し訳ないんだけど、tnk-wcsc28の定跡って使うのに何か設定必要?
定跡が動いてないみたいなのよ 定跡ファイルはyaneura_book4.dbだからそれを選ばないと動かないんじゃね >>360
BookMoves(何手まで定跡を使用するか)
BookDepthLimit 0(必ず0にする)
ConsiderBookMoveCount チェックを入れる
yaneura_book4.dbだとうまく動作しないみたいだから
user_book1.dbみたいに名前を変えて指定すれば動きますぜ >yaneura_book4.dbだとうまく動作しないみたい
そうなん? ShogiGUIでだとyaneura_book4.dbで動いているが >>360
Narrowbookにチェックいれてたら動かんよ 360だけど、将棋所ではいくら設定いじってもダメだった
shogiGUIだと問題なく動作した
なんでかはわからんが、とりあえず動いたので良しとするしかないのかな
みんなありがとね ソフトのレートについては、周りが皆強くなってしまったら、当然下がる。
今はベンチマークが3300の技巧だからな。
確率的には、100回に1回負けるくらいの強さだと、
その時点で4100程度に落ち着いてしまう。 あともう一つ言うと、
本来ならば、定跡のonoffで強さが変わるのはおかしな話。
ソフトがもっともっと弱かった時代に、人間の使っていた定跡を丸暗記させたのと大して変わらん。
そりゃ、強くならないよね。 >>368
なぜおかしな話だと思うのかkwsk
定跡ってのは前持って探索しておくこととほぼ同意だから、持ち時間が増えたこととだいたい同じ。
持ち時間が違えば強さは変化する。
当たり前のことだと思うけど。 複数のソフトと対局数が多くなると最初R4230程度あったQzillaもR4199に下がっている
aperypaqよりやや強いwakame1stでも複数のソフトと対局させると総合的なレートはaperypaqより下位になる
このことから一つのソフトと対局しただけでレートが決まらないことが分かる
uuunさんのレーティング表(2018/05/08)
Godwhale5.0.5/Qzilla9 R4199
YO4.82/aperypaq R4190
YO4.80/wakame1st R4184 たとえば白ビールの前身のshot gunはいろんなソフトと対局させて負けた棋譜から負けの原因となった指し手を特定して
再探索させて定跡を直す、ということを半自動でやってたらしい。
まふ定跡のように完全な人の手が入った定跡だとなんだかなーという気もするけど、それだってソフトでの解析の結果を参考にしてるらしいから、
結局はベースのソフトでのより長時間の探索での結果といってもいい。
定跡書をただ放り込んでるわけではないんだよ。 aperypaqはyaselmoの時代を思い出す強さだな もう定跡勝負の時代だし
WCSCとSDTが終わるタイミングとしてはちょうどいいな。 プロの将棋が今どうなってるかを見れば、定跡でやりはじめたからコンピュータ将棋なんて終わったなっていうのが間違ってるってのがわかると思うけど。
誰かが戦法を編み出して、それが定跡化されて、それを打ち破る戦法を誰かが作り出す、というサイクルで将棋の歴史ってのは進んできたわけだ。
今定跡を作る元になってるソフトよりも強いものを作って、定跡を打ち破るってのがこれからの面白いところだろう。 今後の進歩はたぬきのnnueを絞るなりして多少強くなるかどうかくらいかな?
将棋ソフトがこのまま強くなるとすれば
手順長くなる持将棋とかの
強さまで要求されて
人間の将棋とますます
離れていきそうだ >>325
打倒Ponanzaの時期は技巧、ukamuse、elmoといったソフトがRを急上昇させてきた
今回は強さのインフレがある程度収まった形になったので、白ビールに再び盛り上げてほしい クジラちゃんも結局aperypaqやwakameとは誤差程度の差しかなかったというのは
ちょっとしょんぼりするな 逆にいえば強さの上昇が停滞してきた今こそ、新規参加者が新技術で一発を狙えるタイミングだとは思うけどね。 PALとNNUEとQhapaq以外は
以前の学習部にそこまで手を加えた訳ではないから似たり寄ったりになるのは仕方ない 将棋界と同列に扱う時点で間違っている。
ソフトのレートが頭打ちになりアンチコンピューター戦略や定跡勝負で勝敗が決まることを考えると、
少なくともCSA的には我々が大会を開催する意味はなくなったと考えてもおかしくない。
もちろんherozやatcorderが大会を開催するなら歓迎するけど >>325
でもponaも結局本体のエンジン部分はstockfishベースで、
秘密の強さというよりはむしろ最適化が優れていたということなんでしょ?
以前山本さんは「みんなは最適化のさせ方が下手」とか言っていたし。 >>370
それって、強くなってるの序盤だけだよね。 >>379
待て待て
クジラをAperypaq,wakame含めた色んなソフトと対戦させてみろよ
誤差ではない
明らかにAperypaqやwakameより上 R9に50万使うぐらいだったらNNUEやAlphaZero方式に使った方が夢がある >>385
同感。家のPCではaperypaqとR150くらい違うかと思わせる強さだった。本当になぜ? 今回の大会で3駒の限界が明確になった感は否めない、平岡さんも3駒は今回が最後みたいなことを言っているし たぬきの評価関数って自己対局からは学習してないのかな >>384
違うよ。序盤で持ち時間を使わなかったことによって中盤以降の持ち時間が増えるから、定跡を使わなかったものとくらべて全体的に強くなる。 でもR4200もあれば正直、一般家庭で棋譜の検討や対局をするには十分満足出来る強さなのは間違いない DLを用い、先の手を読まずに指すソフトというのは、定跡で指しているのと原理的に似ていると考えてよろしいですか? >>392
なんともいえない。
データベース型の定跡であれば、通常の思考に切り替えるタイミングはデータベース内にない局面になったときと明確だけど、DLの場合はそうはいかない。
通常思考に切り替えるタイミングがうまくできればDLでデータベース型定跡の代替とすることは可能だと思うけど、現状まだ誰も成功してないと思う。 >>391
対局では満足できないと思います。強すぎるから。
満足できるソフトとは、対局中にユーザーの棋力を計測し、ギリギリ負ける棋力に自動で落ちてくれる接待将棋ソフトだと思います。HEROZなら精密解析機能を後少しいじれば実現できそうですよね。 >>374
昔、定跡将棋がトレンドだった時代ってありませんかね? 序盤から探索させると石田流が最強になるって話があったけど、事前の研究でなく本番の探索でそういう戦型レベルの正確な評価が出来るようにならないと現状に風穴開けることはできない、という認識でおk? >>396
評価関数が石田流を指したがるなんて、現在のトップレベルソフトではPALだけですよね? >>396
そういう解法でもいいとは思うけど、もっとストレートに現状の大元になってる評価関数よりもだいぶ精度が高い評価関数を作って、
それを元に作った定跡をぶつけるってのがいいんでないかな。 >>367
DBならインフレじゃないでしょうか?
R530000の敵と戦っているうちに自分がR100000000に到達してしまう。。。 今の定跡も今の評価関数と探索で計算させたら出てきたもので
違う評価関数と探索が出てきたらどうなるかわからない。 >>392
全然違う。
「読みを入れずに感覚で浮かんだ手」を指すのだから、定跡進行に従うのとは別物 >>401
それも違う。
指し手予測式のDLは教師の指し手を関数近似によって覚えてるだけ。
強化学習での評価関数がテーブル式と関数近似とがあるのんだけど、それくらいの違いでしかない。
別に大局観や感覚を覚えたわけではない。 >>392
全然違う
定跡は予め深く読んだ結果良かった手を保存しておいてそれに実践がヒットしたらその通り指す
制限時間無しで読んだ手だからリアルタイムより全然いい手になる
DLはものすごい巨大な評価関数みたいなもので盤面の特徴点からから「いい形かどうか」を深く読まなくても高精度に判断できる >>389
自己対戦だけで棋譜を作るなら
NNUEよりも一番強い評価関数を使ったほうが効率いいでしょ
・・・と思ったけど
試しに棋譜生成でよく使われるdepth8で
NNUEとqzilla9を戦わせたらNNUEが有意に勝ち越した
https://i.imgur.com/vvuRrwa.jpg
公平にする為にqzilla9もやねうら王4.82を使用
まあgodwhaleにしたら今度はqzilla9が八割勝ったから
探索部に依存し過ぎた意味のない比較だけど 定跡ってそもそも最善の手順の集合体じゃない場合もある
悪い手順でも相手がハマるなら定跡としては有効 >>405
人間の定跡にそういうの結構あるよね。
「あなたはこの戦法の受け方を知ってますか?」
ってのを問うような指し方だよね。 >>406
ソフトでもハマったりハメられたりするし
本当に事前に読んだ最善手だけを登録してる定跡を積んだソフトってないでしょ >>394
なるほど、ごもっとも、そっちの意味ね
自分が言いたかった満足とは、ソフトと対局するときソフトが弱く不満でより強いソフトと対局したい場合
R4200もあれば十分だから、これ以上強いソフトは必要ないっていう意味の方ね
同じ満足でも意味が違うので、ああそっちの方かってなった >>402
定跡は同一局面でないと全く対応できない。
未知の局面において読みを入れずに指すという点において、人間の処理に対応するものとして大局観、感覚がある。
それを数値的に実現したものの内部処理がどうのこうのという話「しか」理解できないというのは、
「自分は実務者として知識と経験がある」と偉そうに言ってるだけで、その実自分のやっていることの基本概念も理解出来ていないただの実装屋 検討するのに満足っていうならR3500もあれば十分よね
プロよりはっきり強いんだし >>409
人間の大局観や感覚っていうのは過去の知識や経験から来てるもので本質的には同じじゃない? >>409
まぁ、文学的にどう表現しようがかまわんけど、人間が思う大局観みたいなものはDLでは実現できてないよ。
合ってるときは大局観だー!感覚だー!って思うんだけど、ものすごいひどい間違いするから。
実際に作ってみないと間違ってるときはあまり見れないだろうからわからんだろうけどね。 こんだけ頭打ち感があってもやっぱり4駒は絶望的なんだよね? >>413
メモリを膨大に消費するってのと学習が遅いってのが問題点の大部分だったと思うから、NNUEが出てこなかったらDLよりか4駒のほうがましってことで4駒やる人が増えたかもしれないけど、今はNNUEやりたいでしょ、みんな。 4駒が強くなってもうちのPCじゃメモリ的に動きそうにないから是非NNUEのような省メモリの方向で開発していただきたい。 4駒は3駒の誤差を修正することはできるが汎化のほうでは期待できない
細分化されすぎる 四駒は学習に軽く1000億局面くらい必要でしょうなあ NNUEはKPPより消費電力が激しいというのは、
・計算効率がいい
・計算効率が悪い
のどちらを意味するのでしょうか? よりCPUを酷使できるようになったってことで、よりCPUに最適化された≒計算効率があがった、なのかな?
単に計算量が増えただけなような気もしないでもないけど。 >>385
「明らかに」とまで言うなら、それ相応のデータを出せるんだよね?
もちろんuuunのサイトよりも信用に足るデータでね
あなたの言う「誤差ではない」「色んなソフトと対戦させ」たデータがあるなら、公開したらみんな納得してくれるだろうねー うちのPCも非力なので4駒は使えない、一般家庭で使えないソフトはいくら強くても需要の面で存在価値が低いと思う
開発者にはNNUEのような軽量の方向で開発してほしい まぁdlshogiの話題が一切ないしな
ここのPC環境は意外に貧弱な人が多そう >>394
そんなの簡単だよ。評価値が0か少しマイナスになる手を選ぶように少し変更するだけ。
実際、昔「接待ボナンザ」ってボナンザの改造版が出回ってた。指してて結構面白かったよ。 >>420
今将棋所でApery,Aperypaq,elmo,Qhapaq,Qzilla9,T.N.K,技巧2,初代wakameの計8ソフトによる総当たりリーグ戦してるわ
各ソフトと20戦ずつやらせて計140局
1番成績悪いelmo除外して残った7つでさらに10局ずつ計190局
uuunさんのサイトよりサンプル少ないからまったく当てにならないデータとか言われたらそれまでだがな >1番成績悪いelmo
技巧2の方がいいのか意外だな >>425
求めてるのは自然と弱い手がさせるソフトじゃない? それなら素直に人間と指そうよ
感想戦だって出来るんだし >>427
技巧2は意外と格上ソフトにも善戦することが多い印象
elmoは8つの中で明らかに一つ成績が悪かった
リーグ戦190ではなく200局になるな
一応200局データには取ろうとしてるが、くじらをやねうらエンジンに載せたりどれが1番いいか調整してる時にもAperypaqなどと戦わせてたけど、どのソフトに対しても優位にたってたし、負け越しは一度も見てないな >>428
自然の定義は?
ちなみに人間と指すと、ビックリする悪手がよく出るよ >>433
それ定義するのが難しいから
自然と弱い将棋ソフト作るのが難しいんじゃないの? leela chessは、stockfishと比べて極めて自然な指し回しらしい。
alpha zeroとelmoとの対戦の棋譜くらいは公開してくれないかなぁ >>423
使うにはユーザー登録とか必要だしそれにそこまで強いわけではないから
開発したい人には非常い興味深いものだろうけど普通のソフト将棋好きには話題にならないんだと思う
それはそうと今回は陰の強豪elmoと上位常連の読み太は公開ないのかね >>411
何と同じ?
もしかして棋理(経験則)の事を定跡と呼んでる?
ブックにヒットするかどうかの話を越えてるのかな?
>>428
人間らしい弱さを学習する必要があるだろうなぁ。
棋力別の棋譜から悪手の特徴を学習して、わざと悪手を指せるようにするのがいいのだろうが、DLとかで実装の負担が減れば誰か開発するだろう。そのうち minmaxで反復深化よりMCTSのほうが人間らしい弱さに近づけやすいかもしれないが
どうやって評価したもんだか ■ このスレッドは過去ログ倉庫に格納されています