▲コンピュータ将棋スレッド131
■ このスレッドは過去ログ倉庫に格納されています
iPhoneユーザーはガキばかりだから出さなくていいよ 面倒な要望が増えるだけだし iPhoneアプリは公開のハードルが高いんだろ 不正ソフトが出回らないように作者を厳しく管理している だから安全が保たれているけど、一部の尖ったソフトは出られない >>610 ブログで公開してたはず ってかこれ以上増えたら逆に面倒とか書いてたような AppStoreに出すのに必要なもの ・Mac ・iPhone ・年会費1万2千円 個人開発者だと林檎信者ないとやってられんよ >>623 ちょっと極端だが言いたい事は分かる 人間の本質的な部分を理解して貴方のいうように忖度なら それこそ安易な行動(ここのキメラ程度云々より、まふ、たまのような) 許される縛られてない権利だけ主張して当然のような言い回しはそれこそな 少しでも強いのがほしければ自分で努力する術を公開されてるのに 甘えてるのはどっちかね 忖度という言葉が好きなら開発者にするべきなのを勘違いしてないかい? >590 邪悪な方法として、「サンプル数を減らせば優位差が出ることがある」と囁く悪魔の統計本が… >>626 なるほど、勉強になりました >>629 ほほう なぜ面倒なんだろう? >>620 お前みたいな嫌な奴のためには作らないんだよ >>631 将棋プログラマーに元ってつけておいてほしい もう随分改良してなかったんだし >>590 増やして有意差有りであってもさらにもっと増やすと有意差なしになったりもするよ 上側検定やるとして500回やってみて危険率5%で有意だったとする(引き分けは無視) 例えば=CRITBINOM(500,0.5,0.95)+1=269だから269勝で有意差ありとなったと仮定する いま次にもう500回やって合計1000サンプルとした場合に有意とならないケースの見積もりを考えるとすると 1000回やった場合は=CRITBINOM(1000,0.5,0.95)で526勝以下なら有意とならないので 次の500回で差の257勝以下の場合、=BINOMDIST(526-269,500,0.5,1)だから75%の高確率で有意にならない >>639 それ誤検出の場合だろ。 500回で257勝以下の確率が75%のサンプルが 最初の500回で269勝する確率を考えたら言ってる事のおかしさが分かる。 >>639 有意差検定なんてやっても意味ないぞ R100以上強い検定とか Rの区間推定なら意味あるが >>640 そうだよ誤検出の話だよ >>641 そうだね みんなで追試するかどうかの基準が有意差なんだから いちいち細かく突っかかるなよ。 95%なら公開するには十分、後は各自で再計測という話。 Rの推定は気になる人が自分でやればいいんだよ。 有意差検定が意味ないという意見はふざけすぎ。 uuunとかいう開発者でもない糞雑魚が24で開発者気取りしてる件 1000局やって勝率55%とか ほとんど変わらんよ どつかれさんとしか言えないだろ それで有意差あるんだと騒がれても なので有意差検定云々の前にせめて勝率60%とか65%の 検定するまでもなく強いレベルでないと この掲示板でボクの作った最強の評価関数ドヤと 自慢するには値しにってこった leela0は新しいネットワークが強くなったか確かめるのに400戦くらいしかしないな わかりやすい差を出すために 僅かな差を積み重ねることを否定するとか原始人かな? あれから検証を続けて300局の結果、有意差がありました。 softAはaperypaqよりR+43程度高いと言えそうです。 勝率別 ・・・ 有意に強いと言える対局数 56% 188局 【softA vs aperypaq】一手10秒 ノード数2000万 定跡なし 対局数300 softA 162勝 aperypaq 125勝 引分13 勝率56.17% R+43.07 >>645 意味も趣旨もわからない やねさんの計測資料見ればわかるけど、勝率51%の積み重ねだよ 勝率56%ではジャンケン効果(相性問題)で消えそう >>645 1000局で55%ってむしろ十分に素晴らしい差だと思うんだが 勝率60%ないと強くないっていうけど aperypaq対Aperyで勝率55%前後なのわかってるんかな そこからさらに学習して強くなっていくなら多少の相性とかあっても確実に強くなっていくんだけど現状そうじゃないからなあ 60%くんは少し前からしつこいんだよな 開発したことないんだろ >>640 >それ誤検出の場合だろ。 そりゃそうだ サンプル大きくても誤検出はあるよって返したレスなので 1000局で55%って2000局でも55%かなあ。 >>658 クエストで負けたあとに5chとは そんなんじゃ仕事で褒められないぞ aperypaqに200局で55%なら凄いと思うけど 公開するかレシピ出すか棋譜出せば証明は簡単だけどね 前のxeq?だったかは計測やったけど あとはロタだんが1000局くらいやったでしょtestevalと両方 sageない人に反応してしまった・・・以後気をつけます >>660 実は自分、tsumita_i3-2cと後継のRaina_i3-2cのログイン名で現在floodgateで時々対 局しているんだけど、もしsoftAを公開したら、自分と全く同じソフトと対局することに なり全然面白みに欠けるから、本音をいうと公開したくないんですよ。なんとなく分か ってもらえますか。floodgateで遊ばなければ公開しない理由は全然ないんですが。ちな みにおとといの16日からfloodgateでsoftAをずっと使っています。棋風に興味があれば 棋譜を見てみて下さい。 >>664 昔からいる強豪ソフトですね 公開は無理にしないほうが気が楽なのは分かります ただ、ここでどれくらいの優位がと自分で言うのは少し控えたほうがいいかもしれません 自慢だけのやっかみだと思われかねないですし できたらbookなしでDB2で対戦してみたいですけど floodgateの欠点はハイスペで回せば評価関数が一ランク下がっても一位になれてしまうところ burn the bridge越えのソフトがなかなか表れないしな コンピュータチェスは一定手数ごとに時間を制限してるけど将棋も 256手を超えたらそこから1分切れ負けルールで決着つけて欲しい。 ずっとずっとponanzaを 好きで…好きで…仕方なかった やっとやっと今夜は 打ち明けることになりました ずっとずっとponanzaを 好きで…好きで…仕方なかった やっとやっと今夜は 打ち明けるからね >>669 おう、どーんと来いや! ∧__∧ (´∀` ) (⊃⌒*⌒⊂) /__ノωヽ__) GeheimnisとR4000超えが当たればいいのにね 近い将来 ソフト同士の対局は千日手だらけになるだろうな! その先まで見てみたいなら 千日手強制回避でやるしかないやろ >>674 見てきたけど普通に負けてたわ 環境から考えてもキメラのみだろうし 俺すげぇしてえだけだったのがガッカリ Remi Coulom @Remi_Coulom I have just booked my plane tickets to participate in the World Computer Shogi Championship in May! I am looking forward to visiting Japan again. Crazy StoneならぬCrazy Shogiですか >>681 Remi Coulom @Remi_Coulom 5月に世界コンピュータ将棋選手権に参加する飛行機のチケットを予約しました! 私は再び日本を訪れることを楽しみにしています。 参加するのか オープンソース覗いても日本語理解できないとつらそうだけど、そこらへんは機械翻訳で大まかにわかるか これはえびちゃん、レミさんを番組に呼べたらいろいろチャンスだぞ それとももしかしてピンチか? レミさんの通訳できる人、誰かいそう? AlphaGo vs イ・セドルでAlphaGoの代打ちしてた人の博士課程での指導教官でもあるんだな DMも来いよ! 俺が小学生のころ通っていた将棋教室の先生のいとこの弟子のライバルの赤の他人でもある これはDMも来る流れだな "世界"コンピュータ将棋選手権って 英語のルール説明あるの? モンテカルロ木探索を作った人、が一番インパクトがある説明じゃないか? Remiとか山下氏とか20年以上ゲームAI作ってるのに 10年でやり尽くした気になってる奴w でも一生をボードゲーム開発に捧げられるって選ばれた者にしかできない人生だな >>691 将棋をMCTS探索で作ってきたらなかなか興奮する。 実際には一次予選でどこまでやれるかなんだろうけど、今から アピール文書読むの楽しみ。 でも>>681 はさすがにこのくらいの英語は読めんとあかんよ。 中卒でも読める。 ポナンザなき今似たようなチルドレンが多く心が動かされる将棋が少ない。 DL勢がポナンザのようにどれだけ研究に値する将棋がすく指せるか見もの >>697 やっぱメディア露出が多い方が信者増えるよね さすが一昨年の電王 なぜかこのスレで紹介されていなかったので 将棋世界アーカイブス 『羽生善治が敗れる日』対談 山下宏 × 棚瀬寧 〜将棋世界2009年1月号より https://book.mynavi.jp/shogi/detail/id=88216 https://book.mynavi.jp/shogi/detail/id=88266 https://book.mynavi.jp/shogi/detail/id=88274 ――――――― ――おとなりのコンピュータ囲碁界では近年、モンテカルロ法という手法が有力視され、爆発的に強くなっていると聞きます。 将棋のほうでも、これまでモンテカルロ法に匹敵するような発見はあったんですか? 棚瀬 いやー、あれに類するものはゲーム史上ないのでは。機械学習は考え方としてはすごいけど、それで他のチームが 勝てなくなったわけではない。棋力自体はそれほど上がったわけではないんですよ。 ――将棋でもこれからモンテカルロ法に匹敵するようなものが見つかると思いますか? 山下 あると思います。現在使われている方法は、コンピュータ・チェスで50年前に発見されたやり方をそのまま使っているだけですから。 棚瀬 もちろん、あるに決まってます。ないわけがない。 ――――――― で、結局9年経ってあったんだろうか。 将棋ではstockfish取り入れたのBonanzaとGPS将棋が最初? >>700 BonanzaはCraftyベースであってStockfishベースじゃない GPSチームが一時モンテカルロをfloodgateで動かしていたような気がする レートは2000くらい >>705 ひよこ関連はもうダウンロードできない。 DLの将棋ソフトってalpha zeroクラスの強さにできても 民製品のグラボ1枚だと弱いんだっけ? 大樹の枝くらいの強さなのかな 居飛車ソフトだけだと面白くないので、定跡なしで好んで積極的に振り飛車を指すyase lmoといい勝負をする評価関数が欲しくて作り終え、ここで公開しようと思うんだけど、 需要はありますかね。需要がなければ止めとこうかとも思っていますが、ただ必ず振り 飛車にする訳ではなく、時々居飛車も指すので、必ず振り飛車じゃないとダメという人 は振り飛車の定跡を入れた方がいいと思う。この評価関数の棋風は昔DB2で話題のあっ たRindaに少し似ている気がする。 あと、まだ対局数が全然少ないので参考にならないけど期待できるかも。 【softB vs yaselmo】一手10秒 ノード数2000万 定跡なし 対局数11 softB 6勝 yaselmo 5勝 人が攻撃的になる瞬間です 665 名前:名無し名人 (ワッチョイ db1b-+0qy)[sage] 投稿日:2018/01/18(木) 17:30:34.68 ID:lT+DH39O0 >>664 昔からいる強豪ソフトですね 公開は無理にしないほうが気が楽なのは分かります ただ、ここでどれくらいの優位がと自分で言うのは少し控えたほうがいいかもしれません 自慢だけのやっかみだと思われかねないですし できたらbookなしでDB2で対戦してみたいですけど 676 名前:名無し名人 (ワッチョイ db1b-+0qy)[sage] 投稿日:2018/01/19(金) 10:06:43.75 ID:VUzVT1pe0 >>674 見てきたけど普通に負けてたわ 環境から考えてもキメラのみだろうし 俺すげぇしてえだけだったのがガッカリ 716 名前:名無し名人 (ワッチョイ db1b-+0qy)[sage] 投稿日:2018/01/21(日) 14:55:39.17 ID:QdR6NOvr0 >>714 キメラだけのゴミソフトはいらんわ >>717 さんざん偉そうな事言ってて結果がアレだからね そのうえ自慢だけで公開もしないのにキメラのみだから 振り飛車云々も上の振り飛車関数か18号の既出コマンド使っただけだろ 二番煎じで工夫もしない雑魚には用もない floodgateの強豪ソフト大会前くらいしかそろわんな AlphaZeroにいいよこいよ言っても今はなあ >>714 一手10秒とか最初から検証する気ないだろ? 500局に何時間掛かるか解って始めてるのか? 思考時間で勝率変わらんの? 短時間で強いソフトとか長時間で強いソフトとか 思考時間というかノード数な suimonがやれば1秒で2500万ノードだけどパパに電気代怒られるみたいで顕彰出来ない 厳密にいえば思考時間の長さで強さが逆転することは普通にありうる。 なのでuuuunさんも含めて計測値は参考に過ぎない。 厳密にどっちが強いかを知りたいなら、大会レギュレーションでの思考時間とか、 自分が検討するときに与える思考時間とか、そういうので測らないといけない。 でもまぁコンピュータ将棋ソフトマニアでなければざっくりな情報で十分だから 計測に時間がかからない短い思考時間を使うことが多い。 長時間だろうが短時間だろうが 有意差を出すのに必要な対局数は同じ 長時間で数十局だけなんてのはデータですらない。 何時間までパソコンを回せるのかと 何局までに有意差が出なければ諦めるのかを 事前に設定して それに見合った持ち時間で検証するべき。 公開する気のない評価関数の測定結果なんて いちいち貼られても反応のしようが・・・ ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる