▲コンピュータ将棋スレッド134
■ このスレッドは過去ログ倉庫に格納されています
深層学習+MCTSでいい感じの成績出ているプログラムはいる?選手権では上位に入りそう? AlphaZeroはelmoとの対局ではTPU(第二世代)4個だけど、学習にはTPU(第一世代)5,000個使ってるからな〜 >>449
それ書いたの俺だけど、こんな感じで基地外に使われるのはがっかりだよ
いつからこのスレはまふ氏なりすましガイジと透。氏なりすましガイジが
お互いに相手を本人だと根拠ない妄想で罵り合うクソスレに堕したんだ 技巧2で検討しながら見てた人が、いつまでたっても名人戦の第一局が
定跡から抜けないので驚いてたみたいね 100億ノードで逆転
601 名前:名無し名人 (ワッチョイ 8380-Mqc2)[] 投稿日:2018/04/12(木) 18:56:25.85 ID:4vDQa2ib0 [5/8]
盤面行方不明なってたわ
https://imgur.com/UDO5DLG.png
https://imgur.com/18iQ2LW.png
691 名前:名無し名人 (ワッチョイ 8380-Mqc2)[] 投稿日:2018/04/12(木) 19:00:23.32 ID:4vDQa2ib0 [7/8]
https://imgur.com/rjuvTjT.png
784 名前:名無し名人 (ワッチョイ 8380-Mqc2)[] 投稿日:2018/04/12(木) 19:05:04.12 ID:4vDQa2ib0 [8/8]
https://imgur.com/LhtOnpP.png
横歩取りは序盤も終盤もソフトでさえ難しいんやねぇ 竜王戦の41竜とかも含め、こういう局面を一年後のソフトがどれだけ早く評価できるか気になる ソフトに局面を8時間検討させるとして、該当局面から500戦戦わせて勝率を測るのと、同一局面でずっと探索させるのはどちらが精度があるだろう? WCSC終わった後に今日の対局を検討するのが楽しみだ 8時間で500戦やると、開始局面から100手で終局すると仮定すると1手あたり0.5秒。
0.5秒対局を500戦での勝率よりも、1局面8時間探索のほうが精度がよさそうな気はする。 >>466
こういう局面でもDLのほうが早く収束するんだろうか? 100億ともなるともう局面評価の正確さとかあまり関係なくなってくるような
知らんけど >>472
収束というか深度30以上は意味ないし
時間効率も悪いからある局面で長時間読ませるよりかは、
一直線の変化とかある場合は局面進めた方が効率はいい >>466
multiPV1ではいくらハイスペでも精度出ないよ。 >>474
それよりもHashの値とか評価関数何使ってるか気になる
あのNPSだと速攻で何十GBも食うだろうし 将棋ソフトにもチェスソフトにも、ソフトが
勝ちを読み切った時に灯るランプみたいな
ものが欲しいね。
これがあれば、終盤問題の検証が非常に
楽になる。 勝ち確で「ヲタヲタしい音楽」を流すソフトならあったぞw >>477
それは一体何リンタスさんなんだろうか^^; PC弱すぎ
羽生銀の形勢判断最後まで悪いとかワロス >>474
この局面に関しては広さより深さだからmultiPV1のほうがイイ 昨日はソフトにとって未だに難解だったようで
まだまだソフトの向上の余地はあるんだなあ 最終的にはどの局面をみても勝ちか負けか引き分けかを瞬時に判断してくれるまでになるわけだからな ▲51金とか▲18玉
みたいな手を相当前から読むのが相当難しんだろ
そういうほんとうに紙一重みたいなスレスレの手を
直前ならともかく30手前から読むとか1000億ノードでどうかみたいな感じなんじゃね?
きのうみたいな本当に互角で30手先の51金 18玉でなんとか勝ちみたいなのまでは
読みきれないのかもねえいまの家庭曜パソコンとソフトのレベルじゃ
だから形勢判断が揺らぐんだり間違えるだと思う 昨日はそのへんの家庭用のパソコンじゃ判別できないほどの互角で
しょうじきソフトを超えてたねえ
家庭用パソコンで読んだ評価値は相当揺らいでかなり間違えてた
たぶん最後の方の羽生の▲51金と捨てた手や▲18玉みたいな手を
直前ならともかく、20手前30手前から読むのがそうとう難しく
読みぬけしていたソフトが多かったと思う
だからソフトの評価値がかなりの部分で間違って判断していた
きのうの将棋はソフト超えてた >>485
読みの深さとノード数の問題だって判明しただけ
ようはリソースの問題であってソフトの問題ではない >>486
それはそうなんだけど、そればかり言っていても虚しいというか
もちろん時代が解決するものなんだけどね 逆に、電王戦でみんなが横歩に活路を見出したのはわかる
まふ定跡が横歩中心になったのも、結論そこに穴が多くあったってことだろうし >>487
効率的にリソースを使えるようなアルゴリズムを作るか
メニーコアサーバーがもっと安価で借りられるようになれば良いんだけどね ソフトの問題じゃないこともない。
評価関数の問題だから。
ただ、ソフト全体としてみれば十分なリソースを与えれば解決できる問題だから、致命的とはいえない。 羽生が勝つたびに(最近は藤井も)
ソフト超えたなんて書き込みが沸くのは逃避行動だよな
棋士がソフトと対局しても勝てなくなってしまったという現実からの逃避 この流れ多いな
対局に使用するハード次第だと何度言えば ハード次第とは言うがスマホまで落としたとしても勝ち越すのは無理じゃないか? >>490
ファミコンでも一億年読ませればみたいな話で
理論的な話と実用性を混同するのは良くない >>493
横歩だとスマホ相手ならなんとかなる気もする
定跡で対策されたらきついかもしれんが >>494
しらみつぶしにすべての手を読むならともかく、どんなに時間をかけても最善でないある手に落ち着く、
あるいはまったく収束しないとかはないの?
ファミコン時代のソフトが何考えてるのかは知らんが あるソフトを長時間(年単位)動かした場合、どれくらいの時間やるのが一番効率いいの? >>491
むしろ羽生や藤井の棋譜も取り込んで対戦繰り返して、
益々ソフトの醸成が加速する
優れた棋士や棋譜が出てくれば出てきただけ、その分、ソフトも益々強くなる 評価値の基準は手番、駒得、玉の固さ、駒の働きと言われてるけど、効果的に指せる場所の有無も必要な気がするな。
昨日の羽生さんの玉は固くないけど、天彦さんに効果的な攻撃手段が無いように見えた。
例えばゆるゆるの囲いで桂4枚相手に取られれば、駒損で評価値は変わるだろうが実質的に怖くない事も。
さらにプラスして角2枚が相手に有っても怖くない場合も有り得る。でも評価値は凄いマイナスだろう。
他にもガチガチに進んで互いに持ち駒無しで、動いた方が不利になる場合なんかはどうなるんだろう。
好き放題書いたけど、こういう研究を真面目にしてる人は大変なんだろうなぁ。 >>496
モンテカルロツリー探索で、収束条件何それ?みたいな絞った(偏った)探索を
すると最善でない手に落ち着く事はある。
けど、将棋のプログラムでモンテカルロツリー探索を行っているソフトは無い。
通常のしらみつぶし探索は、いつかは終局条件(千日手・持将棋を含む)を満たす
ので、理論上は全ての終局条件がそろった段階で導き出された答えに間違い
は起こりえない。しかしながら、この手の問題はべき乗問題であり、1手深く読む
毎に、探索時間が100倍とか必要になってくるため、終局間近でもない限り、
文字通り太陽が燃え尽きる前に探索が終了する保証はない。
探索ノード数を100倍にしたところで、読む深さは数手変わるかどうか。 >>499
今のソフトは人間の棋譜から学んで強くなってるわけではないので、強い棋士が出てきても強くなることはない 学習をdepth=11でやるのに資金面の問題がー、と言ってるだけで
アラブの石油王がカネさえ出してくれればdepth=20くらいで
十分な数の学習局面を作れるわけだからな 詰む詰まないのきわどい終盤になると、評価関数のような統計的な評価って意味を成す上限が極端に低くなる感じ
将棋って囲碁やチェスに比べるとそういう局面が多い? べき乗で増えていくんなら
単純に言えばdepth=11で100万なら12で1000万
20なら1000兆円か?
無理じゃね? まあ、学習の時は、読む手を思いっきり絞り込むという方法もあるけどね。 どうせ柿の木なら即効読むとかそういう類の問題じゃないの? >>500
評価値の基準は任意の三駒で構成される三角形だよ 基礎的な確認なんだけど、評価関数の生成については
elmo絞りおよびその発展形のlambda混合絞りが基本で、
教師局面のdepthを上げたデータを多く揃えるところからは基本はみ出ていない、
ってことでいいんだっけ? leelaチェスはどれぐらい強くなったんだろう
http://lczero.org/ >>511
基本的にはそうだけど割引率導入したり色々工夫されてる
Qhapaqの学習機がたぶん一番優秀 そんなことよりあいちゃんが不可解な負け方してるのが気になる floodgateのぞいたらSunfish4-AWS12 R2930 91勝133敗ってなってるけど
AWSってアマゾンウェブサービス? uuunuuunさんのサイトで評価関数として最高Rとなりました
(ロタ@Rota_JP様 いつも計測ありがとうございます)
私としては野良関数がトップなのは思うところがあるのと
aperypaqと差がほとんどない上
キメラとして使用しているので私の力ではありません
(少しでも不快に思う人がいたら申し訳ありません)
waqwaq,wakame1styはQhapaqさんに公開するかを一任していただきましたし
大会前で公開しないだけでQhapaqさんは少なくとも
強い評価関数を既に作成しておられます
(wakame1st以上はwaqwaq,wakame1sty,名前のない評価関数R4250)
他の開発者の方々も同様かと思います
WCSC28以降は素人が何かを手を加えられる事はなくなると思われますので
最後の一か月弱ほどプレゼントを頂けたのかなっと感じております
(もし出来る事があるとすればKPP_KKPT型のR向上くらい) https://github.com/ohga/USIEngineOnAWS
これAWSで簡単に動かせるフロントエンドだけど作ったのクジラちゃんの評価関数を作っている人じゃん
クジラちゃんの評価関数自動的に落としてクラスタに繋ぐことができるようになればクリックだけでm5.xlarge使えるようになるんじゃね? 誤差レベルに強くてもねぇ・・・
yaselmoみたいな革命的な強さでないと乗り換える気にならない ポーンは歩とは違うからな
ちなみにKPPTのTは手番な
o wcsc28 決勝リーグ予想(残るソフトであり、順位ではない)
1.elmo
2.読み太
3.クジラ
4.qhapaq
5.タヌキ
6.crazy shogi
7.PAL
8.ハイネケン
NDFとaperyとヨーキーが後はぎりぎり来るかどうか
優勝は意外と6.〜8.の伏兵が混戦を刺しそう おんなじソフトばっかじゃん
つまらん大会になったな >>526
最多出場ソフト数なのに、どこをどう見たら同じソフトばっかりに見えるんだよ^^; >>527
ノータイム指しで負けてるヤン。。一局しか指してないから正体不明やけどもしdeep learning系ならびっくり タヌキの新型DLの可能性も微アリ?
ノータイムでR4000のソフトを負かすのはマグレじゃできんからな >>526
俺も最近AKBとかみんな同じに見えるからな
気持ちはわかるゾ >>528
そうじゃなくてみな同じ系統だって言ってんの 系統が同じでもアイデアで旧来より一気に強くしたものは別だと思う
去年のelmoみたいに
少し工夫を加えて誤差レベルだったら微妙だが 今回はディープラーニングやらモンテカルロやら出てきてるやん
例年よりずっと挑戦的にみえる 例年よりはね。
ただ、DL組もほとんどがAlphaZeroコピーだからなぁ。コピーさえしきれず爆死続出の予感。
たぬきの2駒DLもどきが若干面白いか。ただ、そこ以外はやねうら王だからなぁ。 爆死続出するならいいことやん。新しいことに手を出して失敗しているということ
同じ系統に見える、とか、つまらん大会、とかそう見えてしまうのはどうかなぁと まぁ、例年上位陣だけを見れば同じ系統なんだけど、下位陣は毎回爆死上等の多彩なソフトがいるんだけどね。 ぽんぽこ作者、やねうら王の千日手の不具合発覚して修正て、今更・・・ これ以上ソフト強くなっても、家庭用平均パソコンレベルじゃ起動しないとか出てくるんでしょ?
起動しても大会と同じ強さを実現出来ないでしょうしね nodchip@tanuki-@nodchip·15h
やねうら王詰将棋ルーチンにバグがあることが分かった…。
連続王手の千日手のチェックが出来てないっぽい…。
Windowsだと再現しなくて、Linuxだと起きる。
選手権2週間前に見つかってよかった…。 #コンピュータ将棋 >>542
大会と同じ強さが出ないのは当たり前だろ
昔も今も未来も同じ
無探索DLで指し手のみ生成するようなソフトならハードで強さは変わらんだろうけど 今はAWSもあるし、知識がそんなにない一般人でもちょっと金出せば満足に将棋ソフト動かせるだけの環境は作れるでしょうに >>546
無探索DLで家庭用PCでは指し手予測1手10分かかる、みたいな未来があるかもしれない。
意味わからんほど馬鹿でかいネットワークを使うものであればw 囲碁なんかに比べれば十分多様性はあるし
興味ない文句言いたいだけの人はどんな違いがあったってそれを認識できないからな >>517
これ動かないけどなんかAWSの仕様が変わった?
セキュリティグループのエラーでインスタンス作ろうとしてもはねられる AWSを同じ場所から大量に使うことになるのは大丈夫なのかな。
事故が起きるリスクも一応考えておかないといけない気がするけど スポットインスタンスでも余裕をもって入札価格を設定すれば大丈夫でしょ ■ このスレッドは過去ログ倉庫に格納されています