▲コンピュータ将棋スレッド131
■ このスレッドは過去ログ倉庫に格納されています
>>537
医者で一番将棋の強いのは、多分元三段の立石先生でも、女流棋士の伊奈川先生でも
なさそう、みたいな話? >>549
>元々レーティングには期待勝率と実際に乖離がある
引退間際のひふみんと羽生ではひふみんの期待勝率は1%よりは高かったけど、
実際にはなあ、みたいな話。
とはいえ、1手1秒未満なら、20年前の金沢将棋でもelmoに一発入った、
みたいな話もあるからおもしろい。 uuunさんは4.79と4.80のレーティング差測ったりしないのかな
信用できるかわからないけど、まふさん曰く評価関数との相性差が激しくなる可能性があるみたいだし
>>550
SDT5の局面数はわからないけど、depth8
今回はdepth10だけどそれだけじゃ厳しいだろうね
ところでalphazeroのレーティングは自己対局でalphazeroのグラフ作って
あとでelmoとの対局結果から縦軸 (数値)とelmoのグラフ入力したっぽいので実際は4400よりもっと高い可能性もありそう >>549
uuunuuunさんのとこのレートと比較したいならノード数あわせないと その条件だと期待勝率との乖離が実力差のあるソフトとの対局が少ないことなのかノード数の違いによるものなのかがわからない elmoが超短時間では浮かむ瀬と互角って話もあるくらいなんだから wikiにdeep blueは一秒に2億局面読めたって書いてあるけど凄すぎないか
評価関数も相手の棋譜を元に作ってたとか >>555
三浦が対戦したGHPもそのくらい読めたんじゃなかった いやdeep blueは1996年時点でそこまで読めたのが凄いと言う意味です
三浦の対局は15年以上も後ですから チェスって駒の数少ないし同スペックならNPS高く出そうじゃね >>562
TCECだと44コアのXeonぶん回してだいたい6000万〜7000万NPSくらいだな。
将棋に比べて滅茶苦茶多いってことはないんじゃない?
去年クジラちゃんに参加してうかむ瀬をc4.8xlargeで回したときは3000万NPSくらいだったような記憶。 >>562
3駒評価関数の負荷は全体の3割程度だから、評価関数の負荷0にしてもNPSは5割増まで。 aperypaqに優位に強いと言える評価関数の作成にやっと成功しました。勝率56%だと
188局は必要なのでクリア出来ました。後半から予想に反して大分勝率が上がりました。
unnn氏のaperypaqのレートから足すとsoftAはR4193になります。
【softA vs aperypaq】一手10秒 ノード数2000万 定跡なし
対局数190 softA 103勝 aperypaq 80勝 引分7 勝率56.05% R+42.27 >>565
その文章だとたぶん「優位」よりも「有意」だと思う KKP_KPPTでaperypaqより強い評価関数希望
理想を言えば技巧2の評価関数でaperypaq超えだけど 現在レート
1位
wakame
透。作成
2位
testeval
5ちゃんねるスレッドで公開
3位
aperypaq
Qhapaq作者が追加学習したもの
4位
野生の魔女 選手権に出る人間はそれより強いのを作っていると思うよ
本番まで公開しないだけで wakameがaperypaqより有意に強いエビデンスって出てたっけ? ShogiDroidの開発者様へ
お願いです
iOS版を出してください(>人<;) >>570
透さんは公開してるwakameは失敗作のような言い回しだけど
言ってた通りに五分なんだよね
野生の人の計測 http://ii.ttlv.jp/20180115/
いま一番最初のwakame準備してるんでしょ?
それより強いwaqwaqとさらに強いのがaperypaqにR60くらいいってるのがあるみたいだし あちこちで将棋ソフトのレートを見かけるものの、基本的に比較する基準は統一されていると見なしていいんだろうか
AlphaZeroの強さの見積もりが4300だったり4600だったり、
とりあえずelmoに9割ていっときゃ確実か testevalを色々な方にお試しいただきありがとうございました。
そこまでの強さは発揮できなかった点は残念でした。
公開してから時間も経ったので、以下、レシピを記します。
18gou.exe test evalmerge tanuki elmowcsc27 tanuki0 200
18gou.exe test evalmerge mafu110 tanuki0 mafub 100 bl2
18gou.exe test evalmerge tanuki0 mafub tama 60 bl2
18gou.exe test evalmerge tama aperypaq tamab 100 bl2
18gou.exe test evalmerge aperypaq tamab testeval 50 bl2
ぽんぽこからelmo分を抜いた関数をキメラの素材に使っていること、
bl2コマンドを若干使っていることの2点が工夫でしょうか。
上述のとおり、4つの評価関数を使わせていただいております。作者には多大なる感謝を。 >>578
30万は高性能のデスクトップPCが買えるから冗談として
2万ぐらいなら本気で出しますよ?😎 apery-qhapaq ってエイプリー・カパックと読むんだと思ってたら、エイプリー・パークと読むんだな
インカ王国の初代国王 Manqu Qhapaq (マンコ・カパック)から取ったんだと勘違いしてたわ >>565
そっからもう500局以上やってみ。
有意差が変わるから 誰かが評価関数を出した後にキメラでごちゃまぜにしただけで
認めてもらおうとする承認欲求マン多すぎない?
たまもまふほど糞ではないが、やね更新の度に本家で十分ものを
そそくさと更新して我が物顔にしてるし
文句言われながら更新してる開発者が嫌気がさして何も出したくなくなる心情に
なるかもしれん危惧を感じ取れないやつばっか
特に野良関数はキメラしただけで計測もまともにせず
ここの連中に投げるだけで確かな優位さもだせてないのがねぇ 野良関数に手を出すかどうかは本人次第だからどうでもいいのでは 最初に対局数を決めないと正しい結果にならんよ
運よく勝ちが偏ったから打ち切って有意というのは正しくない 有意差が無かった場合には
試行回数を増やせば増やすほど50%に近付くから
増やしても偏りがある時点で有意差があるって事なんだが?
最近は分かってない人の書き込みが多すぎる。 Androidでしか書けないカス開発者なんだろ
iOSで出した方が売れるのに出さないのはコードが書けないから xamarinで作ってるからコードはほぼ共有出来るはずだよ GUIぐらい自分で書こうよ
なんならCUIでもいいからさ >>593
じゃあiOSで出せよカス
出せないんだろ? >>595
みんなお前みたいにパソコンオタクで暇じゃないの^^; >>597
PC使わず、お前が手に持ってるスマホでプログラム書けるぞ
iPhone使ってるならPCはMACなんだろうけど、あんなプログラマー御用達みたいなPC使っててパソコンオタクとか言ってんのか? PC買ってもらえない子供が学校から必死に書き込んでるの想像すると泣けてくるんだよなw コンピュータ将棋ソフトってもっとも需要があるのは奨励会員の子供ってことか。 iOSでGUIを出さないパソコンの大先生は頭悪いな
稀代のビジネスチャンスなのに >>600
ノーパソのHDD寿命来たから
代用としてパッド使いたいんだよなあ >>602
せっかくのios&macなんだから自分でコード書こうよ >>596
やっぱり欲しいよな?
俺と同じこと考えてる人いるよ、ほら てかコードってなに?
プログラミングの話かな
プログラミングの知識は全くないよ、俺 てか、ひとつのアプリ作ってもらう報酬が2万円ってふざけてんのか? 素人だからよくわからないけど
プログラミングでGUIを拵えるのって職業プログラマーじゃないと無理なんじゃない?
そこまでオタク力高くないよw >>608
なんで怒ってんの?
ShogiDroidの利益知ってるのかよ >>610
2万で行けると思うのなら、普通にソフトウェア開発してる会社に依頼したほうが早くない?
将棋ソフトが使えるGUIがほしいのであって、ShogiDroidじゃないとダメってことじゃないんだろ?
寧ろ使いやすく依頼できるからおすすめよ >>611
違うよ
ShogiDroidの利益を知ってないとその論法は通用しないよ
頭つかって >>612
ShogiDroidの利益とアプリ作ってもらう代金は関係ないでしょ
利益に準じた金額じゃないとダメってルールあったっけ? >>613
誰も俺が作る話はしてないよ
利益が出るなら作れば
利益が出ないなら仕方ないねって話
会話の流れわかってないね スマホしか無い、でも将棋ソフト使いたいならAWS辺りにサーバ立てて、リモートで動かせば良いんじゃない?
それだと機種依存はないし、下手なPCなんかよりよっぽど性能いいしね >>615
AWSは契約金が掛かるんだよ
ShogiDroidは無料だよ
ん〜? >>616
それじゃあ、持ってるPCをサーバにしたら?
初期投資ゼロ円で出来るよ >>594でコード出てる。
探索部がやねうら王より遥かに優れてるんだろうな。 さすがポナンザ ShogiDroidの開発者はShogiGUIと同じだよね?
いつまで経っても頑なにiOSでリリースされないのには何か理由があると思うよ
どこか公開規約に引っかかってるとかじゃないかな >>586
あたり前のことだが、世の中すべての人は承認欲求で動いている
開発者だろうがこのスレの住人だろうがすべての人は承認欲求で行動している
気が萎える萎えないはただの忖度
本人に聞いたの?本当に嫌ならそう言ったりそう仕向けるだろう
そもそも本質的に不特定多数の大勢の行動を縛ることはできない
大事なのは誰かにとって生産的かどうか
キメラ情報だろうと失敗情報だろうと誰かにとって得ならそれは生産的
そして何が誰にとって得かは誰にも決めることはできない
>>586の批判は誰に対して生産的なの?
誰も得しない
もし誰かが得するとすれば唯一>>586の承認欲求が満たされるかもしれないことだけ >>621
そんな些細な理由な訳ないでしょ
私書箱にでも会社を登記すれば月数千円で運用できる
これだけの素晴らしいソフトを開発できる開発者なんだからその程度の智慧は回るでしょう
ダウンロード数からいっても広告収入だけでもdroid君は金の成る木、iOSで公開するとなればライバルがいないから単純計算して2倍以上の利益増になるし、なにより格好のプロモーションになる
広告を付けてる以上この開発者が金に全く興味がないとは思えないんだよ
俺がしつこい理由はあまりにも不自然だからだよ
なにかもっともらしい理由があるはずだよ
ん〜? >>618
じゃあAWS一択じゃない?
何かをしようとしたらお金かかるのは当たり前だし、お金出すだけで使えるって考えたら安いもんでしょ >>624
iosはストアから落とす以外の方法で実行ファイルのダウンロードやインストールは出来ないはずだよ
だから将棋ソフトをインストールして使うGUIは規約上無理なんじゃないかな
自分でコード書けるなら、Xcode経由で行けそうだけど iPhoneユーザーはガキばかりだから出さなくていいよ
面倒な要望が増えるだけだし iPhoneアプリは公開のハードルが高いんだろ
不正ソフトが出回らないように作者を厳しく管理している
だから安全が保たれているけど、一部の尖ったソフトは出られない >>610
ブログで公開してたはず
ってかこれ以上増えたら逆に面倒とか書いてたような AppStoreに出すのに必要なもの
・Mac
・iPhone
・年会費1万2千円
個人開発者だと林檎信者ないとやってられんよ >>623
ちょっと極端だが言いたい事は分かる
人間の本質的な部分を理解して貴方のいうように忖度なら
それこそ安易な行動(ここのキメラ程度云々より、まふ、たまのような)
許される縛られてない権利だけ主張して当然のような言い回しはそれこそな
少しでも強いのがほしければ自分で努力する術を公開されてるのに
甘えてるのはどっちかね
忖度という言葉が好きなら開発者にするべきなのを勘違いしてないかい? >590
邪悪な方法として、「サンプル数を減らせば優位差が出ることがある」と囁く悪魔の統計本が… >>626
なるほど、勉強になりました
>>629
ほほう
なぜ面倒なんだろう? >>620
お前みたいな嫌な奴のためには作らないんだよ >>631
将棋プログラマーに元ってつけておいてほしい
もう随分改良してなかったんだし >>590
増やして有意差有りであってもさらにもっと増やすと有意差なしになったりもするよ
上側検定やるとして500回やってみて危険率5%で有意だったとする(引き分けは無視)
例えば=CRITBINOM(500,0.5,0.95)+1=269だから269勝で有意差ありとなったと仮定する
いま次にもう500回やって合計1000サンプルとした場合に有意とならないケースの見積もりを考えるとすると
1000回やった場合は=CRITBINOM(1000,0.5,0.95)で526勝以下なら有意とならないので
次の500回で差の257勝以下の場合、=BINOMDIST(526-269,500,0.5,1)だから75%の高確率で有意にならない >>639
それ誤検出の場合だろ。
500回で257勝以下の確率が75%のサンプルが
最初の500回で269勝する確率を考えたら言ってる事のおかしさが分かる。 >>639
有意差検定なんてやっても意味ないぞ
R100以上強い検定とか
Rの区間推定なら意味あるが >>640
そうだよ誤検出の話だよ
>>641
そうだね みんなで追試するかどうかの基準が有意差なんだから
いちいち細かく突っかかるなよ。
95%なら公開するには十分、後は各自で再計測という話。
Rの推定は気になる人が自分でやればいいんだよ。
有意差検定が意味ないという意見はふざけすぎ。 uuunとかいう開発者でもない糞雑魚が24で開発者気取りしてる件 1000局やって勝率55%とか
ほとんど変わらんよ
どつかれさんとしか言えないだろ
それで有意差あるんだと騒がれても
なので有意差検定云々の前にせめて勝率60%とか65%の
検定するまでもなく強いレベルでないと
この掲示板でボクの作った最強の評価関数ドヤと
自慢するには値しにってこった leela0は新しいネットワークが強くなったか確かめるのに400戦くらいしかしないな わかりやすい差を出すために
僅かな差を積み重ねることを否定するとか原始人かな? あれから検証を続けて300局の結果、有意差がありました。
softAはaperypaqよりR+43程度高いと言えそうです。
勝率別 ・・・ 有意に強いと言える対局数 56% 188局
【softA vs aperypaq】一手10秒 ノード数2000万 定跡なし
対局数300 softA 162勝 aperypaq 125勝 引分13 勝率56.17% R+43.07 >>645
意味も趣旨もわからない
やねさんの計測資料見ればわかるけど、勝率51%の積み重ねだよ ■ このスレッドは過去ログ倉庫に格納されています