▲コンピュータ将棋スレッド125
■ このスレッドは過去ログ倉庫に格納されています
使ってないのはモンテカルロ木探索内でのroll outで、モンテカルロ木探索自体は使ってると読み取れたけどなぁ。 まぁ、英語そんなに得意じゃないので正しいことは他の人に任せたw AIの議論してるのにアルファ碁の検討しないでどうするんだ tamoreとyaselmoで対戦してたら評価値は千日手じゃないのに、shogiguiが千日手判定した。なんだこれ おかしいのはshogiGUI?やねうら王?それとも仕様? https://ux.getuploader.com/ishogisalon/download/36 👀 Rock54: Caution(BBR-MD5:669e095291445c5e5f700f06dfd84fd2) >>312 Mini-batches of data (s, π, z) were sampled at random from the KGS data-set, setting πa = 1 for the human expert move a. 人間の棋譜からの学習は、次の手を100%として学習してるのに対し maximise the similarity of the neural network move probabilities p to the search probabilities π. Zeroの強化学習では盤面全体の着手確率を学習 これで最善手だけでなく探索も改善してる、読み抜けが減りそう 確率最大のpaが探索無しの最善手 確率最大のπaが探索した最善手 はやりのtamoreやってる サブマシンしょぼいのでなかなか終わらん http://f.xup.cc/xup6uabcokw.jpg 昨日も30戦やって少し勝ってた希ガス ポナンザがゼロから自己対戦学習ででレート5500に達しました 前のバージョンに勝率100%です 論文と棋譜だけ公開します 今後ソフト同士の対戦はしません 人間とは大舞台で平手で超スペックで三番勝負ならやります これで皆凄い、革命だって思うの? sdt5はかなりの混戦になって定跡選択や千日手、256手ルール、入玉宣言あたりの 細かいところをきっちりやっているかが勝負の分かれ目になるだろうな >>267 今回ので個人的にすごいと思ったのは、4800まで上げたところから更に5100まで 300上げるのに19日間しかかかってないところだよね。 >> 323 (1)ポナンザは勝負をやっていて、 (2)やねうら王系は インフラの整備をやっていて、 その他には (3)開発者同士でどういう工夫をしたかという腕前を比べてたり、 (4)新しい理論が実用できることの実験の場にしていたり、 (5)ネタ勢だったり するんで、 1番でも 2番でも 予選落ちでも 小〜さくても、大きくても 技術革新は どこかで起こってるはずで、 半年毎に 新しい工夫を持ち寄って 見どころを作っているだけで、できすぎていて褒めていいぐらいじゃないか。 技術革命が起こるところだけでなく、その技術革命が起こる前の種を見つけてもいいし。 >>327 確かにそうですね ちなみにですが今年の予想とか聞かせてもらえないでしょうか? 開発者目線が気になります 予言しておく。 今回のSDTはルール違反する奴が表れる。 >>328 ポナンザと素直にライブラリを使っている11名(親含む)が 決勝トーナメントに出るんじゃないかだぜ。 その理由は トラブルなく動くだけで1勝だぜ。 ディープラーニング勢はどれも強そうに聞こえるものの、WCSC27時点の ponanza chainer のチーム力と高火力に半年で及べるのか謎だぜ。 人間の棋譜を用いなくても強いリゼロ評価関数が出てきたんで、上位陣は将棋も強い、という近頃の傾向は 終わるんじゃないか。 4駒関係で強くすることに成功しているソフトがあれば、 3駒関係では 両方を覚えることができない、駒の位置が似ているけど違うケース が将棋には いくらでもあるはずで、 相手の評価値を ひっくり返して勝つなんてことは あると思うぜ。 他にも コンピューターが作った定跡を使ってはめる、時間管理をそのまま使ってるソフトを何かしらはめる、 といったメタ的な使い方が できるようになったのが、 みんなが同じライブラリを使っているという はめどころでもあるので、 ライブラリに何か弱点が1個でもあれば ライブラリ勢に メタを張って勝つこともあるかもしれないぜ。 あとは強化学習勢より強化学習で成功してる Selene が 探索部 も自作してるようなので ストックフィッシュ系の探索部よりなんかいい探索があったら サイレントマジョリティーが出てきたときの例のように 頭一つ出るかもしれないし。 上位は どこでも互角にやりそうな気がするぜ。 まるでちゃんとした開発者みたいな真っ当な意見なんだぜ 話題のtamoreで少し対戦させてみたけど 1秒だと凄く強くてyaselmoは全く勝てないな elmo、yaselmoは1秒だと弱くてgikou2にも勝てない 今、20秒でyaselmoとtamoreを対戦させてるところ やねうらお注目のwindfallはどうなん? アピール文書に評価関数を確率分布で学習するとかあるけど >>319 やねうら王4.77なのに連続王手の千日手になってる。 探索部バグってるんじゃね。 アピール文書どおりに実装されて、なおかつ効果が認められるとなると革新的。 ただ、そんなに簡単には成功しなさそう。 SDT5は接戦になりそうなのかな 宇宙関係のJAXAも飛行安全お守り用意したりするから、勝つ確率を少しでも上げたい出場者は、将棋関係かPC関係?やAI関係?の神社に行くべし! 今から機械学習させるよりもお祓い行っといた方が勝率上がるからな >>341 次の一手を変化させる可能性の大小で探索って、αβ枝刈り全くできなさそうだしなあ…… イメージ的には評価値が中央値と分散に分かれる感じなんだけど実際そんな値でどうやって探索していいかさっぱりわからんよね。 評価値100±1000 とか言われてもお前評価放棄したな?みたいな感じだしw 評価値の分散がわかれば有利なときは誤差含めてもプラスの手を選んで安全勝ちとか 不利なときは誤差が大きめの勝負手を選べるって感じじゃね 学習時だと言うてはるで 精度に問題がある評価関数で探索時に小細工を弄しても弱くなるだけだが 学習時も込みで一貫してその規則でやるんならノイズ除去の効果が気体できるのかもしれん 透@co2845229 少し早いですが ☆Happy Halloween☆ お菓子(評価関数)配ります https://goo.gl/4sx3e7 tamoreGK tamoreの透さんも開発者の人と同じで惜しげもなく公開してくれるので、ほんとありがたいよね。 >>349 アイテムが存在しない可能性があります。または、使用できなくなっています。 アイテムが削除された、期限切れになっている、または表示するアクセス許可がない可能性があります。詳細については、このアイテムの所有者に問い合わせてください。 >>355 共有の制限を超えています 後でもう一度やり直してください とでるな 2つにあげるの面倒かもしれないけど、斧とクラウドの両方にあげるのが一番いいとおもうんだけどなぁー。 公開してからの最初の2,3日はどうしても制限こえちゃうだろうし。 アップローダーもすぐ削除しちゃうし 気が利かねーなー >>357 どうぶつしょうぎは先手/後手どっちか忘れたけど、どっちが必勝ってでてるよ。 >>360 お前みたいなガイジがいると二度と出してくれなくならかもな >>364 これ作者のアップロードなの? そうじゃなかったら他人が勝手にアップロードするのは良くないんじゃないのか? これの作者はちゃんと元の開発者に許可を貰ってアップロードしているわけだし >>361 ,363 あ〜解析されちゃってるのね スマホゲーにして連盟に儲けてもらいたいと思ったけど どうぶつしょうぎのスマホゲーなんて山ほどあるよw 完全解析のアプリもあるみたいだし >>368 どうぶつしょうぎウォーズがある 将棋ウォーズとアカウント共通 >>364 ありがとうございます。 いただきま〜す。 >>333 wcsc27のエビちゃんの放送で言ってたナントカを使って微分(積分?)した話興味あるので動画上げてください ロダならここがいいよ BitSend: 無料容量無制限のファイル転送サービス https://bitsend.jp/ 保存期間が14日な代わりに 容量も転送量も無制限でダウンもアップも結構早い >>364 これ作者じゃないだろ リドミも読んでないのか? あーあ、コイツのせいで公開してくれなくなったらどうすんだ 4ねガイジ 二次配布してもいいけど勝手に他のソフトに添付や商用利用しないでねってReadmeじゃないの? 試算したぜ。 (0)000000000000000000000000000000000000000000000- <0>46 (1)111111111111111111111110000000000000000000000- <1>23 <0>23 (2)22222222222 11111111111 20 11111111111 0000000000- <2>12 <1>22 <0>12 (3)333333222222 2222211111 21 2222211111 11111100000- <3>6 <2>17 <1>17 <0>6 (4)444333 3333333322222222 31 2222222211111111 11100- <4>3 <3>12 <2>16 <1>12 <0>3 (5)54 544333 44443332 3333333322222221 222222111110 1- <5>2 <4>7 <3>14 <2>14 <1>7 <0>2 (6)65 555444 54444443333333 43333332222222 32221111 1- <6>1 <5>5 <4>10 <3>14 <2>10 <1>5 <0>1 (7)75 6655 5555544444 44444443333333 3333322222 2211 2- <7>1 <6>2 <5>8 <4>12 <3>12 <2>8 <1>2 <0>1 (8)86 76665555 65555554444443 444444333332 33332221 2- <8>1 <7>1 <6>5 <5>10 <4>12 <3>10 <2>5 <1>1 <0>1 8勝、7勝、6勝は勝ち抜け。5勝のうち 5つ勝ち抜け、5つ敗退。 6回戦の時点までに5分、7回戦の時点に勝ち越していれば、最後に勝てば くじ運で駆け込めるかも。 裏街道には 4回戦までには乗っておけだぜ。 4回戦時点での一着が 後半の強い当たりで 敗退することもありえる。 >>364 すまん、この評価関数ってどう使えばいいの? Elmoしか持ってない俺にはわからない >>378 このスレを乗っ取るんじゃねーよ 自分のブログにでも書いとけアホ >>379 evalってフォルダあるだろ? その中身と入れ替えるんだ 同じファイル名でサイズが違うだけだから分かるだろ >>381 サイズが違ったらまともに読み込めないだろが。 >>382 サイズは同じだ 読み込めないなら実行ファイルがkpp_kkptに対応してないだけだろ 文句言ってる暇あったら調べろ 対戦させるのって時間かかるなあ 10秒で50戦の設定でやってるけど 12時間たってもまだ33戦しかできてない コンピューター将棋って一局が200手越えるのがやたら多い Burn_The_BrigeはBURNING_BRIGEのパクリ パクリモン本当に気持ち悪いな yaselmoの導入記事のPV伸ばすためにfloodgateで八百長して印象操作しようとしたみたいだけど、開発者の人たちがみんなyaselmoよりtamoreの方が強いって事実をツイートしたから工作活動失敗したみたいだね。 PVの稼ぎ方がセコイんだよな。 >>388 パクリしかできない脳なんでしょう。 正直気分悪い。 BURNING_BRIGEはあと数局だけ放流します。 結局、Burn_The_Brigeはスイモンの40コア?yaselmoだったの? tamoreとyaselmoをcorei7-7700kのpcで対戦させた tamoreの方が強いという評判だったが思ったより差がなかった 1秒で50局対戦の結果が ↓ 対局数50 先手勝ち34(69%) 後手勝ち15(30%) 引き分け1 tamore 勝ち20(40%) 先手勝ち15(60%) 後手勝ち5(20%) yaselmo 勝ち29(59%) 先手勝ち19(79%) 後手勝ち10(40%) 10秒で50局対戦の結果が ↓ 対局数50 先手勝ち30(62%) 後手勝ち18(37%) 引き分け2 yaselmo 勝ち23(47%) 先手勝ち14(60%) 後手勝ち9(36%) tamore 勝ち25(52%) 先手勝ち16(64%) 後手勝ち9(39%) 20秒で10局対戦の結果が ↓ 対局数10 先手勝ち6(60%) 後手勝ち4(40%) 引き分け0 tamore 勝ち5(50%) 先手勝ち3(60%) 後手勝ち2(40%) yaselmo 勝ち5(50%) 先手勝ち3(60%) 後手勝ち2(40%) >>395 対局数が少なすぎるな。有意差も無いからせめて500局はやらないと。 評価関数の優劣だけの評価だったら、探索深度1に固定して互角局面から開始でいいんじゃないの? 時間もかからんし。 elmo以降、深く読ませて初めて強い評価関数というものばかりなのだ そのせいで学習自体よりも強くなったかの確認のほうが時間がかかる事態に それ評価関数が強くなったというよりは探索との相性が向上したってことだよね、きっと。 まぁ、結果的には必ず探索とセットで使うわけだから強くなったことには変わりないだろうけど。 >>395 サンプルが足りない。少なくとも5倍やって出直してきて >>394 suimon @floodgate_fan · 4h 【floodgateのBurn_The_Bridgeに関して】 中身に関しては、yaselmo_Xeon_E5_2698_v4_40cとなります。 探索はyaneuraou_V4.77。 評価関数はyaselmoです。 (続く) Burn_The_Bridgeって名前パクって高スペでぶん回したyaselmoだったのかよ なんだそれ もともと雑巾絞りは6手前後の浅い探索の結果を学習させたに過ぎなかったので当時は0.1秒でテスト対局させても支障は無かったんだろう。 elmo絞りの勝敗項は終局まで探索させたのと同じ事なので、lambdaを小さくするほど長時間読めば読むほどどんどん強くなるんだと思う。 だからlambdaを小さくして学習させて弱くなって失敗だったと思っていたら長時間の思考でめちゃくちゃ強いという事も十分あり得る。 >>402 うわ〜ないわ・・・ パクリ名前使ってる挙句に開発者でもないのに スペック伏せてハードで勝つだけの賑やかしのksじゃねえか そらこのスレで叩かれもしゃあねぇ 透さんの爪のアカでも煎じて飲んどけ tamoreGKとyaselmoを10秒で戦わせてるけど 今のところ4勝1敗でyaselmoが押してる 普通のtamoreの方が強いんじゃないか? 5局w しかもどんなハードかも書かなければ何の意味もナス >>411 だから作者に許可とってんのか? お飴みたいな奴のせいで他のを公開してくれなくなったらどうすんだよ ワッチョイ 49d2-n802 コイツはわざとやってるんだな 4ねよマジで パラメータファイルに著作権等々が適用できるか?ってのはもう先例があるんだっけ? まぁ、やねうら王で作ったものならGPLが適用される、つまり2次配布していいんでね? 手に入れられない人のために 行き渡ったほうが発展が早いと思う ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.5 2024/06/08 Walang Kapalit ★ | Donguri System Team 5ちゃんねる