▲コンピュータ将棋スレッド122 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
>>411,413
勝率の下と上を使っているから両側検定では
しかも陽関数ではなく陰関数のような定義になっているので何を言っているのかわからんよ
あと正規分布ではなくベータ分布を使わないといけない
これを踏まえて
x勝y敗の結果が出たときに勝率の95%区間はどうなるのかと陽に記述するとこうなる
20-10 -19.56 (47.19%) 〜 +271.94 (82.71%)
27-14 -4.13 (49.41%) 〜 +239.92 (79.92%)
42-26 -5.72 (49.18%) 〜 +175.38 (73.29%)
59-39 -1.27 (49.82%) 〜 +146.84 (69.96%)
151-119 -1.52 (49.78%) 〜 +84.59 (61.94%)
216-177 -0.74 (49.89%) 〜 +70.11 (59.95%)
つまり勝率の下限が50%を下回る=有意に強いとはいえないときに
勝率の上限が80%を下回るには41回必要
勝率の上限が70%を下回るには98回必要
勝率の上限が60%を下回るには393回必要 8スレ10秒 対局数100
ramu vs mafuzero
66-1-33 4.「ramu」対局結果
過去の教師局面と「mafuta」で生成した教師局面をシャッフルし再学習した評価関数群を「REMU」で解析し、
やね氏ツイートのイケメン顔理論を採用した
・3筋の歩を取らせて端歩を突くとかPonanza臭いのが出来たな
・強いけど人間は「yasema10」のほうが参考になりそう
・4スレ10秒相当だと「yasema10」は200点ほど傾くとズルズル負けるが、「ramu」はおよそ2割程度盛り返す。
この辺が勝率に大きく差が出ていると思われる。(4スレ5秒相当だと差が無い感じなので長時間の伸び率が高い)
・これも7七金の評価が高いな。どう見ても悪形なのだが「yasema10」もプラス評価だし本当に良いのか?
・「yasema10」が8二角のハメ手を使ってきて、それにハマることがある。
4スレ10秒相当、定跡無し ramu 60-9-44 yasema10※勝率57.1%(113局)
(今回は200局までやる。あと2日かかりそう)
簡易早見表(優位差)
55% 271局
56% 188局
57% 139局
58% 106局
59% 84局
60% 68局 まふ自称一番強くできたという評価関数でハメ手くらう評価関数という出来栄え
穴だらけの自称最強評価関数で現在も計測中と >>415
自動翻訳の校生、自動作曲の編曲には著作権があるから
生成した評価関数に直接手を加えれば著作権を主張できるかもね
配合割合では無理だろう。レシピに著作権はない >>415
レシピは単なる事実の羅列だろ
事実の羅列に著作権はないよ 今朝の読売にAIのブラックボックスの話があったな
将棋で言えばソフトは強いけどなぜその手を指したか人間が理解できないから真似できない
羽生も同じようなことを言っていたが >>423
理解できるでしょ。
先の読み筋まで表示してくれるんだから。 リゼロやレルモが混ざっている評価関数は早指し1秒などでも強いですね >>421
色を混ぜても著作権は発生しないけど、RGB値をいじれば著作権が発生する?するわけないでしょ
評価関数そのものに著作権がないんだから、何やろうが著作権は発生しない >>417
違う
おれのは勝率の下は使っておらず上しか使ってないから片側検定だよ
だから1.64使ったわけで両側検定したいなら1.96を使うことになる
あと正規近似してはいけないと言われても困る 途中経過です。
6スレ1秒に指し直しました。
scissors対ramu
78-12-72 >>429
片側なら勝率が高い方は100%以下としか言えないのでは
二項分布を正規分布に近似するのは精度が悪い
5割から離れれば離れるほどそれは顕著になる
より正確な方法が簡単にできるんだからそっち使えばいいじゃん
ちなみに二項分布を正規分布で近似すると現実よりやや甘めの判定になります >>431
ホントに差が出るまでやるのか?
まぁなんだ・・・がんばれ 難解とされる次の一手局面を解かせてみると
ramuよりYasema10の方が正解手を早く見つけるな やっぱり中退します。改良し直してから、また対戦させます。 >>383
少なくともアルゴリズム(有限ステップで終わる)の翻訳に関してコンパイラの仕事は明確であり、
最適化で入力と出力の関係が変わったらそれはコンパイラのバグ
不用意に書かれたマルチスレッド構成のプログラムが最適化により挙動が変わってしまう現象のは
スレッド間の同期手順をソースコード上に適切に表現しなかった人間側のバグ
どちらにせよ商用クラスの完成度のコンパイラは翻訳に関しては素直
コンパイラの生成物で著作権の問題があるのはランタイム(組み込み関数集)で、これは人間が書いている 評価関数同士の一致率が分かるようになったってことは浮かむ瀬とやねの20161010の一致率もわかるってこと? >>432
>片側なら勝率が高い方は100%以下としか言えないのでは
xについて上片側検定した統計量がzだというだけで区間推定はしていないよ
z<1.64,t<-1.64がいまやった片側検定だが|z|<1.96,|t|>1.96なら両側検定になる
他にもz<1.64,t<-1.282とか|z|<2.33,|t|>1.96とかでも簡単に求まるのが良さだね
>二項分布を正規分布に近似するのは精度が悪い
どのくらい精度が良ければ近似することが許されるんだ?
精度が気に入らないと思うなら自分で厳密なやり方でやればいいと思うよ >>437
まさかここで高校数学の教科書開き直すことになるとはね。 >>209
お里が知れるってやつだな
朝鮮人が関与する不快になるという実例 高校数学の教科書とかもってるのか。
実家すみいいな。 正確なPDFが分からない以上、
正規分布だろうがベータ分布だろうが
それを使った時点で近似なんだから
世の中的によく使われてる正規分布以上の精度を求めるのに
どこまで意味があるのやら 正規分布は最悪の場合の逃げ手であって中心極限定理しか根拠が無い
具体的問題が与えられており分布に目星が付いているのなら
カイ2乗検定でどっちの分布が当てはまりがよいか確かめてから選ぶと良い(適当 山本さんが、もうすっかり開発意欲を失っている可能性。 elmoに6割から7割しか勝てないんだっけ?
思ったより弱いよね。それにまふさんという素人にあっという間に追い付かれたというね。 800億絞りはまさかの弱体化か
学習パラメータ工夫すれば強くなりそうな気もするけど
そう単純な話でもないのかな elmoに7割「しか」勝てないってのもよく考えると凄い話だな
将棋ソフト開発者はいったい何と戦っているのか
まさか本気で将棋星人の侵略に備えているとでもいうのか >>440
>>有意差なしとなったときに期待勝率が80%はないと言えれば満足なら30回でいい
>>70%はないと言えればいいなら68回
>>60%はないと言えればいいなら270回
この3行で区間推定やってる件 というか不正確で甘めな正規分布近似使って
さらにかなり甘えた片側使うなら95%とかいらなくね?
両側検定で30%ぐらいの狭い区間でいいと思うがどうか 暇があれば正規分布近似がどれだけ精度が落ちるのかの論文書いてもいいけど
残念ながら暇じゃないからなぁ
正規分布ではなくより正確に勝率を推定するコードも既にあるし
劣化コードを書いて検証するのも何だかなぁ >>444
ちなみに現時点では勝敗はコイントスと同等と見るような二項分布が採用されているね
つまり過程に関係なく任意の時点で確率pで勝利してpは一定であるというモデルね まぁこんな下らん検証する暇があったら
棋譜を上げた方がよっぽど計算資源の有効活用になると思うよ >将棋ソフトの評価関数のうち、GitHubや大会アピール文章で作成の過程が分かるもの。
>人間が創作的な寄与をしていることが証明可能な状態の生成物には著作権が有るので、
>極一部に該当する例外を主に語られる書込みで勘違いし、問題にならないように気を付けて下さい。 >>454
不正確といってもN=100くらいやれば
大体近似できるものじゃないの
50%近辺を確認する場合はどっちみち2σでN=数百必要なんだし
馬鹿真面目に二項分布とか使うのって
極端に確率が片寄ったものを出来るだけ数少なく確度高く確認したい限られた場合だけな気がする >>452
なんでそれが区間推定なのか良くわからん >>452
対立仮説(期待勝率60%)が真であるときに帰無仮説(期待勝率50%)が採択される確率が5%であるなら、
検定を行い仮説が棄却できないとき対立仮説を積極的に否定できて期待勝率は60%もないと言える
対立仮説が真である下で帰無仮説が採択される確率をコントロールし検出力を定めることにより
サンプルサイズを決めるこのやり方を区間推定と言うのは聞いたことないよ 数式書かない反論とか見たことないぞ
>>417で計算式を示さない時点で釣りでしょ
そもそもベータ分布なんか使わないし
計算式が間違えてるなら誤差が大きいのは当たり前の話 >>424
評価関数を使うタイプはそうだけど
ディープラーニングだと読み筋の出力はできないね やねうら王ってmultipv=2にしたときの将棋所での棋譜コメントに入る読み筋がmultipv 2のときのものになってるんだが
これは設定で変えることが可能なんだろうか >>463
将棋所がmultipvに対応してないから・・ >>457
これまふの意見だね。評価関数はプラグインと同じだから著作権があると言っているが、
機能の追加をもたらす小プログラムと、フォーマットにしたがって書かれたパラメータデータでは性質が違う
あと既存の創作物に対する機械生成物の著作権問題を、将棋の棋譜や評価関数にすり替えてミスリードしてるのは感心しないな
そういう創作物と違い元々棋譜や評価関数に著作権はないけれど、機械生成物ならなおのこと著作物には当たらないよねって話なのに
アピール文章等で創作性が示せるもの〜というのは、逆に著作権を軽視した発言だね
仮に評価関数が著作物であるならば、創作性を示せなくても著作権は認められるんだから(機械生成物であるかわからないからパクって良いとはならな い)
というかGithubとかアピール文章程度じゃ再現性をとれるでもなし、その実何やってるかなんてわからないでしょ
そういう性質のものならば特許でやってよって話
◯◯という使い方や配布はやめて欲しいと思うならば、作者がそう主張すればよいのであって、
法があればそれをバックアップしてくれるし、ないなら大衆の権利としてユーザーに判断を任されるだけ(あえて良識という言い方はしない)
それを著作権が〜(でも本当に法的に正しいかは知らない)とか、モラルが〜と誤魔化すのは悪辣
本来大衆に権利があるものを言葉巧みに無いように思わせたり、使う人が悪のように思わせてる
最近あった朝日新聞の棋譜配信圧力問題とかもまさにそんな感じ >>454
>>411と>>417の違いについては近似の影響ではなく両側検定と片側検定の混同による所がデカい
両側検定の場合、t=z-2p√nで、|z|<1.96でも|t|>1.96が成り立つ条件を考えればいい
z-2p√n=t<-1.96または1.96<t=2p√n-zがzによらず成り立つには1.96-2p√n<-1.96または1.96<2p√n-1.96
つまり1.96<p√n、1.96<np^2であればいいのでnは3.84/p^2あればいい
p=0.3、0.2、0.1をそれぞれ代入すると43、96、384を得るので>>417の結果とほとんど変わらないだろ?
この程度のズレすら許せんなら厳密なやり方でやってくれとしか言えんな 著作権の話はやねさんのブログでも、あるかもしれないしないかもしれないって話に落ち着いてた
どこかの暇人が訴えるまで結論は出ない。 >>466
滅茶苦茶なこじつけで著作権が自明であるかのような主張だけど
結局のところまふ関数に著作権が無いなんて信じたくないんだよw
まあ気持ちは分かる まふさんの評価関数をちょっと弄っただけで自作ソフトなんて言う人はコンピュータ将棋界に1人しかいないし
そこまで、気にしなくてもいいと思うけどね。
それとmafuta2は取り下げられたんだな。有志の調査だとyasema10より強そうなのに まふさんはちょっと神経質過ぎると思う
定跡作りには神経質じゃないとだめなんだろうけど 絞りも入れないで自作ソフトとして配布するゲスが出現したら神経質にもなるわな 低スペックでエルモ等は使えないので、
サーバ上で動く形でエルモや技巧などの有力ソフトを使えるサイトを作ってくれないかな。
対戦、棋譜検討、ソフト同士の対戦観戦ができるものを。 ramu強くないんですけど
既存の評価関数色んなのと対戦させてるけど きのあとかそんなサイト作ってるよね。
彼は大富豪か運営の天才なの。 >>477
対戦結果を書くとみんなが追試してくれるかも E「ramu」はelmo以上の評価関数を徹底的に平均化した
平均化すると定跡無しでとても強くなった。
具体的には相手に合わせる棋風という初めて見るタイプになった。
「yasema10」が盤面を広く使うときは駒の連結を固めたり、逆に駒を固めている場合には盤面を広く使うといった感じ。
なので互角局面等使用するとレートが落ちるし、生半可な定跡なら使わないほうがマシ。
長時間でレートが伸びるというより、平均化したため候補手が多く探索に時間がかかる感じ。
その分しっかり読めば相手に合わせて好形を組み立てる。(特に局面が飽和したときの指し手は上手い)
ある意味コンピュータ将棋とはこういったソフトなんだろうなと思う。
1秒以外は追試したくないですね 盗作問題の対策で早々に「ramu」をリリースしている。これは非公開の再学習評価関数やrezero8よりも強い非公開rezero9相当を平均化したものであるため、いままで配布している評価関数をキメラ配合しただけでは超えれない仕様にしているし、非公開評価関数群なので盗作はすぐに分かる。
よって少し何か混ぜただけの評価関数や中途半端に再絞りを行っても弱くなるだけです。
適当に混ぜたらramuに勝てる評価関数出来ましたよ ramu1秒対戦においては数百回試行していますが適当に作った評価関数にイーブンだったり負け越したりします。
長時間では強いと書いてありますが、それは試していません。 ramuってRAMUにかけるとyasema10が63%、mafuta3が37%って出るね mafu系列はみんな同じような強さ、elmoに勝率7割弱のところに壁がある。
ポナンザもそのあたりで停滞。これ以上はやねさんみたいに評価関数の拡張が必要なのかな。 まふさんマナー違反者について足りない知識で法律論を唱えて理論武装に走ったのは悪手だったかもね
単純に心情を書き出したほうがまだ共感を得られたかもしれない そもそもFC2のアレな人だけでしょ? よっちゃんとか訳の分からないことやってたの
言葉が通じそうにないし、FC2の彼へのメッセージでも書いたほうが良かったな >>486
マナーに「違反」はないし、マナーやモラルとして間違ってるって前提もおかしい
心情を訴えるのはわかるけど、それが許されるのはせいぜい自作の定跡で学習回した素の評価関数についてのみくらいだろう
それこそ人の関数に追加学習とか混ぜ物で、偉そうにしてるのはまふ自身じゃないかと思ってしまう
ブリード元の作者を代弁してとか言ってるけど、何様なんかな
関数乱造してレート測定に協力してね、でも好き勝手使うのは嫌ってのは虫がよすぎる
自分が開発者とのコネクション持ってるのを鼻にかけて、仕切りたがってる感が滲み出てる >>487
今FC2やってるからチャットに書いてよ まだ判例がないことに関して作者が堂々と著作権を主張することは全く間違ってはいないよ。
そして裁判歓迎とばかりに勝手に流用するのも間違ってない。 uuunuuunさん 野良評価関数のレーティング表 7/23 公開
ソフト名 レーティング 誤差 対局数
YO4.73/mafuta2* 4102 +13/-13 398
YO4.73/yasema10* 4066 +15/-11 434
YO4.70/relmo* 3995 +8/-9 885
YO4.70/YaseiYomita1.1* 3979 +12/-16 800
YO4.53/elmoQhapaq* 3977 +6/-8 1487
YO4.53/elmo-wcsc27* 3960 +0/-0 1610
SM1.25/elmo-wcsc27* 3877 +9/-6 1180
YO4.70/rezero8* 3860 +10/-8 1000 みんな流石に飽きてきたのか、ようやくスレの勢いがなくなったな 追記 Ponanza-wcsc27のレーティングを追加してみました。
ソフト名 レーティング 誤差 対局数
YO4.73/mafuta2* 4102 +13/-13 398
Ponanza-wcsc27* 4093 +25/-18 266
YO4.73/yasema10* 4066 +15/-11 434
YO4.70/relmo* 3995 +8/-9 885
YO4.70/YaseiYomita1.1* 3979 +12/-16 800
YO4.53/elmoQhapaq* 3977 +6/-8 1487
YO4.53/elmo-wcsc27* 3960 +0/-0 1610
SM1.25/elmo-wcsc27* 3877 +9/-6 1180
YO4.70/rezero8* 3860 +10/-8 1000 >>493 4スレ一手5秒で検証したけど、mafuta2よりramuの方が強いよ。しかし今の所、elmoに
4スレ一手5秒ではyasema10、ramuでもなくmafuta2が一番勝率が高い。だから、レーティング
ではmafuta2が一番数値が高くなる。相性があって、全ての評価関数に均等に強いのは難しい。
4スレ一手5秒以外は検証していないので分かりませんが。 >>492
色々ブレンドしたはいいが、検証が大変すぎてもうやめたわw
本当の強さとやらを求めて、10秒将棋じゃ強いけど
タブレットでの1秒将棋で弱かったらおれにとってはクソだし。
今の所は悪手が少なく、読み抜けがなくて(大反省しない)、1秒将棋でエルモに8割勝てたらそれでいい。 >>490
今回の件はまふさんがまふさん自身の権利を主張してるわけじゃなく、他人(元の評価関数の作者)に権利があると主張してる構図なので少し違う ブレンド検証してて初めて相矢倉を見た。組む時は組むんだな wcsc27から2か月位で、あのPonanzaと同等以上の評価関数を配布した、まふさんに感謝しま
しょう。やっぱり、自分が手間ひまかけて作ったものを、パクられたら作った本人は腹が立つのは
当然。私もYouTubeに動画を投稿して、動画を丸ごとパクられた経験があるので気持ちは分かる。
パクる行為は、他人の獲物を横取りするハイエナと同じ。 俺は自分の作ったものがパクられたらものすごく嬉しいし、
ソフトウェアは再利用されるべきだという考えなので、
権利だの主張するやつには吐き気がする
そういう考え方もあるので、みんな一緒にするな >>499
動画には著作権はあるけど評価関数にはないと言うだけの話 色んな意見があるけど、パクられたくないなら公開しないのが一番じゃないのw
公開してくれる開発者には感謝してるけど、公開することで感謝されたい認められたいってのが少なからずあるから公開してるんだろ
ブレンドで手軽に亜種が作れるようになってしまった今、ソフトの公開について
開発者が考え直す良い機会かもな ぶっちゃけFC2の人みたいにパクリを我が物顔で使うとかそんな異常な人は1人しかいないんだからそこまで問題にする必要はないな 作者がやる気失せて公開しなくなるなんてことになったら誰も得しないしそこらへんは配慮していくべきでしょう 現に、まふさんは、より強い評価関数を持っていても、今の所は公開しないといっており、一部の
パクる人のせいで、私たちが実際により強い評価関数を手に入れられなくなってしまっている。
はっきり言って、パクる人のせいで、こちらが迷惑しているのが現状だ。 別にそんなのどうでもいいよ
まふなんかいなくたって誰かがもっと強い評価関数作るだろ 今のどんぐりの背比べみたいな評価関数の乱立なんて正直どうでもいいよ
これからまともな開発者が今よりはっきり強くした評価関数作るだろうし、そのとき利用されたくなきゃ非公開にするというだけ
まふとかよけいなお世話だろ 今回の電王トーナメントがどうなるかだなぁ
賞金取ったソフトが野良評価関数流用を疑われたりしたら非常にもめそう 権利とか主張するやつにろくなやつはいない
人類の英知を集結してみんなが利用して強くしていけばいいんだよ
著作権法とか、パクられて怒るやつとか、100害あって一利なし >パクる人のせいで、私たちが実際により強い評価関数を手に入れられなくなってしまっている。
この手に入るのが当たり前って思想はパクってる連中と何も変わらんな パクるってことは本来素晴らしいことなんだよ
つうか、今までの考え方をみんなパクってるし、
オリジナルなんてありえない
そう思ってるやつは思い上がりだ
お前のアイディアなんて誰かがすでに考えてるんだよ >>505
それな。逆に考えれば特定の一人以外、まふさんの評価関数をちょっと弄っただけで自作ソフトを開発したって言う人はいないわけだしね。
カパックさんの分解ツールもあるし ■ このスレッドは過去ログ倉庫に格納されています