コンピュータ将棋スレッド 160
■ このスレッドは過去ログ倉庫に格納されています
AbemaTVでも将棋チャンネルはあるよ。生放送の回数は少ないみたいだけど。 アベマは頑張ってると思うが今どきYouTubeライブがないのは致命的
将棋はe-sportsに比べて遅れ過ぎだよw 4Gが普及しすぎて5Gが遅れた日本みたいな現象だな
Abemaニコ生を先行した事でYouTubeライブが未だに浸透せず >>479
>>480
自分の勘違いだった。ゴメン。ググって確認すればよかったわ。
でも、たった81マスなのに奥が深い。面白い競技だよね。 優勝した水匠の探索でyunyun0419さんの改造版をマージしたものが現在お二人から配布されているので
どっちが強いか計測したら短時間だけどMizarさんの方がやや強いかも、同じものをマージされているのに
差が付くのはなぜだろう、clangでビルドしているしていないの違いかな
1手0.2秒 評価関数はsuisho2を使用 定跡なし Hash1024 投了値3000 引分500
対局数300 Mizar_m (勝率52.5%) 151-13-136 YaneuraOu_m
Mizar_m=v4.89-test20200505のYaneuraOu_NNUE-tournament-clang++-avx2
YaneuraOu_m=YaneuraOu_m-TOURNAMENT(このスレで公開されたものでsuisho2の探索と同じもの)
1手0.2秒 評価関数はQhapaq_WCSOC2020を使用 定跡なし Hash1024 投了値3000 引分500
Mizar_m_KPE9 (勝率56.5%) 108-10-82 YaneuraOu_m_HalfKPE9
Mizar_m_KPE9= v4.89-test20200505のYaneuraOu_NNUE-tournament-clang++-avx2
YaneuraOu_m_HalfKPE9=YaneuraOu_m-TOURNAMENT(このスレで公開されたもの) >>507
KPE9の方を訂正
× YaneuraOu_m-TOURNAMENT
〇 YaneuraOu_m_HalfKPE9-TOURNAMENT >>507
KPE9の方を再訂正
× YaneuraOu_NNUE-tournament-clang++-avx2
〇 YaneuraOu_NNUE_KPE9-tournament-clang++-avx2 計測の環境や設定の違いで逆転しているのでどちらが強いのか分からないね
ロタさんの計測では探索部共通YO4.89mの1手36T0.8秒で
302局 Suisho2 (勝率52.81%) 141-37-124 elmo2020
あふろんさんの計測では探索部共通YO4.89mの1500万ノード固定で
300局 Suisho2 (勝率44.33%) 104-58-138 elmo2020
>>510
どちらも引き分けが余りにも多いな
手数での引き分けを無効に設定してデスマッチさせないと正確な差が計測出来なさそう >>507
技巧が始めた一手0.1秒の連続対局はやねうらを含む多くの開発者が取り入れた結果無駄だったらしいが、一手0.2秒はどうなんでしょう
正確に計測できてると良いですね >>510
あのあふろんさんの計測ってノード固定っぽくない?
探索同じだからってノード固定にすると局面によってnps変わるからかなり左右されそうなんだけど >>495
>第70回NHK杯将棋トーナメント「出場女流棋士決定戦」ってテレビ番組作っても視聴率0%だよ
普段は囲碁しか見ないが、これは観たよ。 >>513
それと、ResignValueや引き分け手数の設定も影響ありそう コンピュータ将棋オンライン大会情報のまとめ
yahooニュース
ネタ勢からガチ勢まで勢揃い!
世界コンピュータ将棋オンライン大会は
杉村達也弁護士開発の水匠が優勝 yahooニュース
弁護士にして最強将棋ソフト「水匠」開発者、杉村達也さん(33)インタビュー 水匠2を使って、
過去の電王戦とかトーナメントとかコンピュータ将棋選手権とか検討して遊んでるが、
なかなか面白い。
水匠2が全く読み筋に上げていない手でも、いざ指されると
「あ、すまんそっちの方が良い手だね」とか言い出したりする。
指してるのは、水匠のレートを4500と仮定すると、
800点以上低いソフトのはずなのに。
将棋は終わったと言ってる人もいるが、
まだまだ可能性の海が広がっているぞ。 yahooニュース
ヤバいぐらい強いコンピュータ将棋ソフトに大駒落ちで勝ち越せる人類は
何人存在するか? >>515
いつも業界標準とか強調してるからそこは大丈夫なはず
ただ1500万を探索固定だからとノード固定でやってる可能性高そう >>518
可能性は否定しないけど、あなたのパソコンスペックが低いのでは >>521
スペックは決して高くないけど、1億5千万ノードは読ませてるので、
大会スペックの3秒指しくらいにはなってるはず。 単にyunyun0419を使った人だけが強かった可能性ががが 河童の評価関数 Qhapaq from Neo-Saitamaの
qns-halfkpe9.7z のリンクが見つからないような...
わかる人いらっしゃったら教えてください ここから以下の順に進めばQhapaq_WCSOC2020の評価関数を保存出来るよ
https://github.com/qhapaq-49/qhapaq-bin/releases/tag/tagtest
一番下の Assets 7が開いていない場合はクリックして開きqns-halfkpe9.7z 177 MBがそう
Mizarさんのv4.89-test20200505の中にある探索がyunyun0419さんの改造版をマージされている
clangでビルドされているせいかこのスレで公開されたものより強そう Qhapaqは短時間だと力を発揮できてないなさそうだな
水匠2に勝率1割だったから検証を打ち切ったわ
ガッツリfloodgateに流すくらいじゃないと計測出来なさそう floodgateに低スペのカパック流れてるからそれで判断すべし >>527
あ、一番下ですか 気づきませんでした
ありがとうございました >>520
俺が言いたいのは、ロタとあふろんで計測設定のやり方が違うから、違ったデータになると言いたいだけ >>528
ロタさんのmマージ探索同士の計測途中だけどQhapaq2020は強そうだよ
suisho2 107-16-109 Qhapaq2020 あふろんさんやロタさんの計測結果を見る限りsuisho2、elmo2020、Qhapaq2020
あたりはmマージ探索同一だと強さはほぼ横並びかも知れないね 前にイルカが中盤が強いみたいな話があったけど、そこも気になる
プロの課題局面からだと特に強いソフトがあるとかわかれば一般ファンが検討に使いやすいし 囲碁ではDeepMindが絶対的で、その亜流ソフト以外は話にならないレベルだと思っているので
将棋で絶対的になれない理由が分からなかった。
このスレを読むと、DeepMindの自己学習は実は大したことは無いってことですか。 ゲーム性からいったら囲碁よりチェスの方が参考になるでしょ
lc0のプロジェクトがあそこまで組織的で大規模でなければまだstockfish超えてたかどうかわからないし、既にlc0はalpha zeroを超えているのかもしれない 評価関数の種類が増えてエンジン入れ替えるの面倒だな
そろそろ自動判別機能が欲しいわ ただQhapaq2020は序盤を定跡でばらけた状態からだとQhapaqの澤田さんやめきっとさん
によると勝率が大分落ちるようなので検討用には向いてなさそうだね floodgateの結果が一番信用できるから
elmoと水匠2の二択かないまのところは >>538
音楽的に飛角玉で展開動くのも面白いし後手最初からグダってるように見えて狙いあるし面白いよねぇ >>536
将棋でもDL勢が3駒を駆逐できるだけの力をすでにもってるだろうし、これからさらに差をつけられるだろう。
NNUEは知らん AobaZeroがAlphaZeroの追試じゃなくて、dlshogiみたいに強い将棋ソフトを作る方針になってくれれば短期間でAlphaZeroを超えられると思う アルファゼロみたいにベンチマークテストしたいなら大将棋とか無限将棋とかしてりゃいいんだよね
ていうかビットコインほってりゃ良い 正直プログラマーにとっては強さはもうどうでもいいんだよ
方法論を確立する方が大事 >>541
水匠は逆にハイスペックなスリッパにしては意外と負けてるなという印象なんだが
elmoのほうがスペック低いはずなので評価関数はelmoのほうが少し強いんじゃない? グーグルのGPUだか量子コンピュータに中小企業が勝てるかよっていう dlshogiがこのまま強くなったら来年にはもうdl勢以外の従来のソフトは太刀打ちできなくなるのかね
将棋界がdlの技術を使ってソフト作り始めてから数年、早いもんだな
dl勢のソフトが圧倒的に強くなってやねうらチルドレンがもはや1勝もできなくなっても、家庭用の検討ソフトとして残っていくのだろうか(一時期の激指のように) めきっとさんの今までの探索改良経験からyunyun0419マージのやねうら王はある程度までノード数が行き着くと
本家より勝率が下がる結果になると考えられおり、やはり本家のチューニングを超えるのは困難みたい、以下はめきっと
さんのツイートから
>(yunyun0419マージのやねうら王は)そこそこ長時間でも強さが持続する。時間が伸びると勝率は落ちていく系だと
>思われるが、数億ノードくらいまでは強そう。でもさらに長時間になってくると本家が良さそう。散々色々なパラメータ
>を試した経験からの勝手な予想です。 や、最新stockfishをマージしたものらしいから、眉唾な意見だと思うけどね >>552
めきっとさんはそのマージも確認した上で判断されているそうだよ ちなみに最新stockfishをマージしたものとしてもそれが数十億ノードでも本家と並行して強さが持続する
とは限らないからね それは流石にやねうら本家を神格化しすぎでは?予想ではなくデータで根拠が欲しいわ データはさすがに厳しいね、10億ノード対局は誰もやらないからね 一つ言えるのは1500万ノードの勝率が70%で1億ノードの勝率が55%になっていると
さらに高ノードになるほど勝率が下がり逆転する可能性が高いと思う、1億ノードでも勝率が同じ
70%でないとやがて逆転する可能性が高いのではないかな 漸近しているだけの可能性もあるのでは…?
まあともかく、本家やねさんの意見を待ちたいですね、おこらくこの流れは見てるだろうし 共有の制限で落とせない水匠2、別の場所にアップロードしてよw QRL基準の計測でこの差なので6000万ノードとかだと高ノードで強いKPE9がSOTAになる可能性があるね
ロタさんのRRate20200506から上位3強
suisho2/YO4.89_m R4574
Qhapaq2020/YO4.89_m R4563
elmo2020/YO4.89_m R4552 ロタさんの計測はありがたいんだけど多スレの0.8秒とかなんだよね
どうしても検討ソフト決めの指標にするには弱い ぶっちゃけ水匠の評価関数自体は、たいして強くない
floodgateもハイスペのおかげで高レート維持できてる なんでこの人煽ってんの?
煽る方より煽らりゃいいなんてウソかな ああ
566 名無し名人 (スップ Sd2a-VC/+) 2020/05/06(水) 16:29:12.52 ID:fMTK+6bEd
ぶっちゃけ水匠の評価関数自体は、たいして強くない
floodgateもハイスペのおかげで高レート維持できてる >>566
水匠だけじゃなくデフォのNNUEの限界が近いんだろう 最近は強くなったと思ったら過学習というパターンが多い。
DLとMCTSの組み合わせも元来めちゃくちゃ過学習しやすいと思うけど
そこはノイズやら初期局面ばらけさせるやらで頑張ってるかいな
表現力に余裕があっていい 水匠2とelmo 50戦8000万少々でやったら
20-26だったからelmoの方が強いかもね
誤差の範囲だと思うけど。 上のソフト同士を戦わせて測るのもいいんだけど、相性とかもあるからシンデレラとかgrampusFのような振り飛車ソフトとも対局して測ってもほしいな
まえにロタさんが対XFとかはやってたからそんな感じで やねさん大会終わったらなんか出すかも〜とブログのコメント欄にあったけどなんだろ
期待してやーーーす alphazeroもう超えてる気がするけどどう?
あの時のelmoに100回やって8回も負けないと思うんだが… >>550
チェスを見てるとそうはならんやろと思う
数年は並走だと思うけどな
NNは致命的な見落とし率が高い dlshogiかQhapaq-deepでelmo_wcsc27とやらせてみればいいんじゃない。可能ならあの凄い測定条件で 探索部の改良で駒落ちが飛躍的に強くなるとはなあ
二枚落ちでどのくらい強くなるのかも知りたいです >>577
1手1秒の短時間だけどsuisho2-Mizar_m_clangとaperypaq-YO4.79Tと対局中で
現在34-1-2と勝率93%と明らかにsuisho2-Mizar_mは強いのでalphazeroを
超えてそう、alphazeroはaperypaq-YO4.79Tに100局で勝率87.9%だったからね https://twitter.com/naonza0/status/1257742637227892736
>対Aobazero戦でDLの恐ろしさを見たのが以下の局面
>Noviceは65桂で+1000としたがその後大反省。
これ、151手目3一馬から即詰みがあるけど、ここのことかな
どっちも見落としてたのか
捨て駒連発する手順だしStockfishだと枝刈りされそうだけど
MCTSも長手数の詰みには課題を抱えてるのかな
https://twitter.com/5chan_nel (5ch newer account) >>582
1手2秒だった短時間に変わりはないけど >>583
最新の探索が昔の探索に及ばない部分もあるし難しいよな
それこそ機関投資家のシステム開発に入るような数学の天才クラスが設計したら
全然違うものが出てきそうなんだけどな >>579
これとか怪しいな
序盤の怪しげな14...Ng3!? のsacrificeで作ったwedge pawn失敗の巻
alpha zeroが好きそうなwedge pawnとlong tarm maneuverだったが
https://www.chess.com/computer-chess-championship#event=final-notbullet-test&game=77 神サービスKENTO、やはり赤字で大盤振る舞いだったか
早く課金してあげないと存続が危うい 検討結果を保存して無料ユーザーには
過去の検討結果を返せばいいのでは?とか思ったけど
実装が複雑になって難しいんだろうな >>588
こういう仕組み実装しないとパワーが足りないのだろう
コンピュータ将棋の開発者は思考部の改良ばかりでプレイヤー向けの開発者がかなり少ないからね
https://lichess.org/get-fishnet 前のたややんさんの16コアでも相当強いはずだったけどさすがに128スレッドで
1手29秒弱だと18億ノードくらいで駒落ち特化ソフトだし相当棋力が上がってるので
現役奨励会三段が負けても全然おかしくないよね floodgateでQhapaqのレートがR4068だけど、ゴミスペックPCで走ってた割には健闘した方かな?
Sylwi_WCSOC2020_TR3970X、Extremeに土つけてるし
水匠2と長時間で対局したら勝ち越すかも
QhapaqをハイスペックPCで流してくれる人来ないかなー >>592
suimon@西村文登さんに頼めば?
壊れてなければ40coreのDualXeonだし
昔はドヤリングしてたんだけどね 57歩の意味が分からんかったけど57歩を打たないでいきなり詰ましに行くと最後△2四角の逆王手があるから不詰なのか
ーー
Chida Shota ?@chidanza 1時間
最後の57歩が見えにくい? (76飛はmate23)
position sfen l3r2nl/1P+N3g1k/p5sP1/2p2+Bppp/Pp1g5/2P1P1N1P/2nP1P1R1/2GK2+p2/Lg6L w B2SPs2p 1 moves 5a5f B*4c 3h4h 3f2d 3c2d P*5g >>583
それは単に数手後の▲5二と△同角▲5五歩が詰めろになってることの見落としでは 長時間で本家がdolphinより強いのは、ただ早く深く掘れるから
yunyunが本家より早く深く掘れて、同じ深さで本家より強いことが証明できればいいのだ
他力本願 >>595
そっちか、なるほどね
本譜に現れない局面だったから気づかなかった
やねうら王で検討してみたら、
▲5五歩以下、△6六歩打▲6八玉△5六龍
まで進んで、▲5三馬〜▲3一馬の詰み手順に合流するから読み抜けの理屈は同じかも
AobaZeroも本当に読めてたか気になるね そろそろ真面目に初期局面ばらけさせて計測したほうがいいのかも
長時間特化とか相性問題とかややこしくてAlphaZero超えたかどうかも一概に言い切れないこんな世の中じゃポイズン >>588
もう水匠2とYOm実装済みか
なんとか維持してほしいなあ ■ このスレッドは過去ログ倉庫に格納されています