▲コンピュータ将棋スレッド136
■ このスレッドは過去ログ倉庫に格納されています
定跡ファイルはyaneura_book4.dbだからそれを選ばないと動かないんじゃね >>360 BookMoves(何手まで定跡を使用するか) BookDepthLimit 0(必ず0にする) ConsiderBookMoveCount チェックを入れる yaneura_book4.dbだとうまく動作しないみたいだから user_book1.dbみたいに名前を変えて指定すれば動きますぜ >yaneura_book4.dbだとうまく動作しないみたい そうなん? ShogiGUIでだとyaneura_book4.dbで動いているが >>360 Narrowbookにチェックいれてたら動かんよ 360だけど、将棋所ではいくら設定いじってもダメだった shogiGUIだと問題なく動作した なんでかはわからんが、とりあえず動いたので良しとするしかないのかな みんなありがとね ソフトのレートについては、周りが皆強くなってしまったら、当然下がる。 今はベンチマークが3300の技巧だからな。 確率的には、100回に1回負けるくらいの強さだと、 その時点で4100程度に落ち着いてしまう。 あともう一つ言うと、 本来ならば、定跡のonoffで強さが変わるのはおかしな話。 ソフトがもっともっと弱かった時代に、人間の使っていた定跡を丸暗記させたのと大して変わらん。 そりゃ、強くならないよね。 >>368 なぜおかしな話だと思うのかkwsk 定跡ってのは前持って探索しておくこととほぼ同意だから、持ち時間が増えたこととだいたい同じ。 持ち時間が違えば強さは変化する。 当たり前のことだと思うけど。 複数のソフトと対局数が多くなると最初R4230程度あったQzillaもR4199に下がっている aperypaqよりやや強いwakame1stでも複数のソフトと対局させると総合的なレートはaperypaqより下位になる このことから一つのソフトと対局しただけでレートが決まらないことが分かる uuunさんのレーティング表(2018/05/08) Godwhale5.0.5/Qzilla9 R4199 YO4.82/aperypaq R4190 YO4.80/wakame1st R4184 たとえば白ビールの前身のshot gunはいろんなソフトと対局させて負けた棋譜から負けの原因となった指し手を特定して 再探索させて定跡を直す、ということを半自動でやってたらしい。 まふ定跡のように完全な人の手が入った定跡だとなんだかなーという気もするけど、それだってソフトでの解析の結果を参考にしてるらしいから、 結局はベースのソフトでのより長時間の探索での結果といってもいい。 定跡書をただ放り込んでるわけではないんだよ。 aperypaqはyaselmoの時代を思い出す強さだな もう定跡勝負の時代だし WCSCとSDTが終わるタイミングとしてはちょうどいいな。 プロの将棋が今どうなってるかを見れば、定跡でやりはじめたからコンピュータ将棋なんて終わったなっていうのが間違ってるってのがわかると思うけど。 誰かが戦法を編み出して、それが定跡化されて、それを打ち破る戦法を誰かが作り出す、というサイクルで将棋の歴史ってのは進んできたわけだ。 今定跡を作る元になってるソフトよりも強いものを作って、定跡を打ち破るってのがこれからの面白いところだろう。 今後の進歩はたぬきのnnueを絞るなりして多少強くなるかどうかくらいかな? 将棋ソフトがこのまま強くなるとすれば 手順長くなる持将棋とかの 強さまで要求されて 人間の将棋とますます 離れていきそうだ >>325 打倒Ponanzaの時期は技巧、ukamuse、elmoといったソフトがRを急上昇させてきた 今回は強さのインフレがある程度収まった形になったので、白ビールに再び盛り上げてほしい クジラちゃんも結局aperypaqやwakameとは誤差程度の差しかなかったというのは ちょっとしょんぼりするな 逆にいえば強さの上昇が停滞してきた今こそ、新規参加者が新技術で一発を狙えるタイミングだとは思うけどね。 PALとNNUEとQhapaq以外は 以前の学習部にそこまで手を加えた訳ではないから似たり寄ったりになるのは仕方ない 将棋界と同列に扱う時点で間違っている。 ソフトのレートが頭打ちになりアンチコンピューター戦略や定跡勝負で勝敗が決まることを考えると、 少なくともCSA的には我々が大会を開催する意味はなくなったと考えてもおかしくない。 もちろんherozやatcorderが大会を開催するなら歓迎するけど >>325 でもponaも結局本体のエンジン部分はstockfishベースで、 秘密の強さというよりはむしろ最適化が優れていたということなんでしょ? 以前山本さんは「みんなは最適化のさせ方が下手」とか言っていたし。 >>370 それって、強くなってるの序盤だけだよね。 >>379 待て待て クジラをAperypaq,wakame含めた色んなソフトと対戦させてみろよ 誤差ではない 明らかにAperypaqやwakameより上 R9に50万使うぐらいだったらNNUEやAlphaZero方式に使った方が夢がある >>385 同感。家のPCではaperypaqとR150くらい違うかと思わせる強さだった。本当になぜ? 今回の大会で3駒の限界が明確になった感は否めない、平岡さんも3駒は今回が最後みたいなことを言っているし たぬきの評価関数って自己対局からは学習してないのかな >>384 違うよ。序盤で持ち時間を使わなかったことによって中盤以降の持ち時間が増えるから、定跡を使わなかったものとくらべて全体的に強くなる。 でもR4200もあれば正直、一般家庭で棋譜の検討や対局をするには十分満足出来る強さなのは間違いない DLを用い、先の手を読まずに指すソフトというのは、定跡で指しているのと原理的に似ていると考えてよろしいですか? >>392 なんともいえない。 データベース型の定跡であれば、通常の思考に切り替えるタイミングはデータベース内にない局面になったときと明確だけど、DLの場合はそうはいかない。 通常思考に切り替えるタイミングがうまくできればDLでデータベース型定跡の代替とすることは可能だと思うけど、現状まだ誰も成功してないと思う。 >>391 対局では満足できないと思います。強すぎるから。 満足できるソフトとは、対局中にユーザーの棋力を計測し、ギリギリ負ける棋力に自動で落ちてくれる接待将棋ソフトだと思います。HEROZなら精密解析機能を後少しいじれば実現できそうですよね。 >>374 昔、定跡将棋がトレンドだった時代ってありませんかね? 序盤から探索させると石田流が最強になるって話があったけど、事前の研究でなく本番の探索でそういう戦型レベルの正確な評価が出来るようにならないと現状に風穴開けることはできない、という認識でおk? >>396 評価関数が石田流を指したがるなんて、現在のトップレベルソフトではPALだけですよね? >>396 そういう解法でもいいとは思うけど、もっとストレートに現状の大元になってる評価関数よりもだいぶ精度が高い評価関数を作って、 それを元に作った定跡をぶつけるってのがいいんでないかな。 >>367 DBならインフレじゃないでしょうか? R530000の敵と戦っているうちに自分がR100000000に到達してしまう。。。 今の定跡も今の評価関数と探索で計算させたら出てきたもので 違う評価関数と探索が出てきたらどうなるかわからない。 >>392 全然違う。 「読みを入れずに感覚で浮かんだ手」を指すのだから、定跡進行に従うのとは別物 >>401 それも違う。 指し手予測式のDLは教師の指し手を関数近似によって覚えてるだけ。 強化学習での評価関数がテーブル式と関数近似とがあるのんだけど、それくらいの違いでしかない。 別に大局観や感覚を覚えたわけではない。 >>392 全然違う 定跡は予め深く読んだ結果良かった手を保存しておいてそれに実践がヒットしたらその通り指す 制限時間無しで読んだ手だからリアルタイムより全然いい手になる DLはものすごい巨大な評価関数みたいなもので盤面の特徴点からから「いい形かどうか」を深く読まなくても高精度に判断できる >>389 自己対戦だけで棋譜を作るなら NNUEよりも一番強い評価関数を使ったほうが効率いいでしょ ・・・と思ったけど 試しに棋譜生成でよく使われるdepth8で NNUEとqzilla9を戦わせたらNNUEが有意に勝ち越した https://i.imgur.com/vvuRrwa.jpg 公平にする為にqzilla9もやねうら王4.82を使用 まあgodwhaleにしたら今度はqzilla9が八割勝ったから 探索部に依存し過ぎた意味のない比較だけど 定跡ってそもそも最善の手順の集合体じゃない場合もある 悪い手順でも相手がハマるなら定跡としては有効 >>405 人間の定跡にそういうの結構あるよね。 「あなたはこの戦法の受け方を知ってますか?」 ってのを問うような指し方だよね。 >>406 ソフトでもハマったりハメられたりするし 本当に事前に読んだ最善手だけを登録してる定跡を積んだソフトってないでしょ >>394 なるほど、ごもっとも、そっちの意味ね 自分が言いたかった満足とは、ソフトと対局するときソフトが弱く不満でより強いソフトと対局したい場合 R4200もあれば十分だから、これ以上強いソフトは必要ないっていう意味の方ね 同じ満足でも意味が違うので、ああそっちの方かってなった >>402 定跡は同一局面でないと全く対応できない。 未知の局面において読みを入れずに指すという点において、人間の処理に対応するものとして大局観、感覚がある。 それを数値的に実現したものの内部処理がどうのこうのという話「しか」理解できないというのは、 「自分は実務者として知識と経験がある」と偉そうに言ってるだけで、その実自分のやっていることの基本概念も理解出来ていないただの実装屋 検討するのに満足っていうならR3500もあれば十分よね プロよりはっきり強いんだし >>409 人間の大局観や感覚っていうのは過去の知識や経験から来てるもので本質的には同じじゃない? >>409 まぁ、文学的にどう表現しようがかまわんけど、人間が思う大局観みたいなものはDLでは実現できてないよ。 合ってるときは大局観だー!感覚だー!って思うんだけど、ものすごいひどい間違いするから。 実際に作ってみないと間違ってるときはあまり見れないだろうからわからんだろうけどね。 こんだけ頭打ち感があってもやっぱり4駒は絶望的なんだよね? >>413 メモリを膨大に消費するってのと学習が遅いってのが問題点の大部分だったと思うから、NNUEが出てこなかったらDLよりか4駒のほうがましってことで4駒やる人が増えたかもしれないけど、今はNNUEやりたいでしょ、みんな。 4駒が強くなってもうちのPCじゃメモリ的に動きそうにないから是非NNUEのような省メモリの方向で開発していただきたい。 4駒は3駒の誤差を修正することはできるが汎化のほうでは期待できない 細分化されすぎる 四駒は学習に軽く1000億局面くらい必要でしょうなあ NNUEはKPPより消費電力が激しいというのは、 ・計算効率がいい ・計算効率が悪い のどちらを意味するのでしょうか? よりCPUを酷使できるようになったってことで、よりCPUに最適化された≒計算効率があがった、なのかな? 単に計算量が増えただけなような気もしないでもないけど。 >>385 「明らかに」とまで言うなら、それ相応のデータを出せるんだよね? もちろんuuunのサイトよりも信用に足るデータでね あなたの言う「誤差ではない」「色んなソフトと対戦させ」たデータがあるなら、公開したらみんな納得してくれるだろうねー うちのPCも非力なので4駒は使えない、一般家庭で使えないソフトはいくら強くても需要の面で存在価値が低いと思う 開発者にはNNUEのような軽量の方向で開発してほしい まぁdlshogiの話題が一切ないしな ここのPC環境は意外に貧弱な人が多そう >>394 そんなの簡単だよ。評価値が0か少しマイナスになる手を選ぶように少し変更するだけ。 実際、昔「接待ボナンザ」ってボナンザの改造版が出回ってた。指してて結構面白かったよ。 >>420 今将棋所でApery,Aperypaq,elmo,Qhapaq,Qzilla9,T.N.K,技巧2,初代wakameの計8ソフトによる総当たりリーグ戦してるわ 各ソフトと20戦ずつやらせて計140局 1番成績悪いelmo除外して残った7つでさらに10局ずつ計190局 uuunさんのサイトよりサンプル少ないからまったく当てにならないデータとか言われたらそれまでだがな >1番成績悪いelmo 技巧2の方がいいのか意外だな >>425 求めてるのは自然と弱い手がさせるソフトじゃない? それなら素直に人間と指そうよ 感想戦だって出来るんだし >>427 技巧2は意外と格上ソフトにも善戦することが多い印象 elmoは8つの中で明らかに一つ成績が悪かった リーグ戦190ではなく200局になるな 一応200局データには取ろうとしてるが、くじらをやねうらエンジンに載せたりどれが1番いいか調整してる時にもAperypaqなどと戦わせてたけど、どのソフトに対しても優位にたってたし、負け越しは一度も見てないな >>428 自然の定義は? ちなみに人間と指すと、ビックリする悪手がよく出るよ >>433 それ定義するのが難しいから 自然と弱い将棋ソフト作るのが難しいんじゃないの? leela chessは、stockfishと比べて極めて自然な指し回しらしい。 alpha zeroとelmoとの対戦の棋譜くらいは公開してくれないかなぁ >>423 使うにはユーザー登録とか必要だしそれにそこまで強いわけではないから 開発したい人には非常い興味深いものだろうけど普通のソフト将棋好きには話題にならないんだと思う それはそうと今回は陰の強豪elmoと上位常連の読み太は公開ないのかね >>411 何と同じ? もしかして棋理(経験則)の事を定跡と呼んでる? ブックにヒットするかどうかの話を越えてるのかな? >>428 人間らしい弱さを学習する必要があるだろうなぁ。 棋力別の棋譜から悪手の特徴を学習して、わざと悪手を指せるようにするのがいいのだろうが、DLとかで実装の負担が減れば誰か開発するだろう。そのうち minmaxで反復深化よりMCTSのほうが人間らしい弱さに近づけやすいかもしれないが どうやって評価したもんだか >>431 20戦づつってことは結構なノード数でやってる感じ? >>436 https://en.chessbase.com/post/leela-chess-zero-alphazero-for-the-pc However, the engine’s play is quite different from anything I have seen or tested before, and I am speaking from over 20 years experience. What on earth was going on?? I never heard of an engine compensating hundreds of Elo of tactical gaps with pure positional play. もう一週間以上前だから今どうか分からないけど、普通のエンジンとはかなり違うようだ Bonanza 1.0とか当時は自然で人間らしいと言われてたし、案外古いソフト引っ張ってくるだけでなんとかなる説 https://i.imgur.com/FOdlwue.jpg とりあえずリーグ戦こんな結果になった 見にくくてすまんな くじらちゃんの圧勝と言っていいだろう >>443 elmoというのはWCSC27でポナを倒した時の評価関数とやねverのものですか? >>431 やっぱりaperypaq安定して強いな >>443 技巧2が異常に強いのは何故? elmoに対しても勝率30%程度になるはず >>444 すみません 確認したら2017年1月のものでした、 elmo.sdt5をインストール、調節して再度他7ソフトと30局ずつやらせます エンジンはやねうら482載せてました、 他のソフトは公開されてる中で最新のものです ApreyはWCSC28はエンジンはかなり優れてますが、評価関数はSDT5を載せた方が強いと思いますのでそのようにしました Qhapaq公開は楽しみですね しかし白ビールの人はあれで助教とか 教授とかはどんな化け物なんだよ 大学関係者デラオソロシス((((;゚Д゚))))ガクガク >>443 さすがに各30局では少ないと思う 自分の経験ではノード数にもよるけど30局で勝率55~57%位までだと、100局やったらほぼ互角になる場合が結構あるよ 同じように30局で勝率60%位なら100局やっても勝ち越すことが多い 100局やって勝率55~57%位のものは500局位やったら互角になることがあるよ >>452 勿論序列を決める十分なサンプルと言えないのはわかっているのですが、このまま対局数を増やしてもくじらちゃんの1位は揺るぎないと思ってます。 しっかりデータ取ったわけじゃないですが、くじらちゃんにやねうら載せてAperypaqやwakameとやらせてもやはりくじらちゃんがハッキリ勝ち越しましたし、くじらちゃんはやねうらよりGodwhaleの方がハッキリ勝ち越したというのもありましたし 1手1秒かそれ以下だよね? 思考時間を伸ばすと、クジラちゃんの勝率は落ちるよ >>449 2017年1月にelmo は公開されていないのですが。。。 >>455 WCSC27のelmoの作成日は20170103 >>443 面白いデータだけど、流石に対局数が少なくてなんとも言えんなー… May 08, 2018 Memory-optimized machine types with up to 160 vCPUs and 3.75 TB of system memory are now available in Beta. See the pricing page to learn how these machine types are billed. Google I/Oに合わせて発表だったのね これでそこそこ結果変わったな ARM cotex-a53だとNNたぬき遅いわ g++ pgoコンパイルでnpsが三駒評価の三割弱 ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.4 2024/05/19 Walang Kapalit ★ | Donguri System Team 5ちゃんねる