▲コンピュータ将棋スレッド122 [無断転載禁止]©2ch.net
レス数が1000を超えています。これ以上書き込みはできません。
>>933
中盤の手の広い局面では90万NPSぐらいしか読めず、エクリプスやダイレクトモテ光にそこで逆転食らってました。w >>925
まふは著作権に関してはおかしなこと言ってるから問題ないのだが
狂った奴に絡まれるウザさが消えるわけではないからな。 人造棋士18号と自分のブレンドTumitaを4スレ一手5秒定跡なしで対局して10局時点で
人造棋士18号 1勝 Tumita 9勝でTumitaの方が強いようです。 >>940
はい。一手10秒でも負けると思います。
上でも書いた通り、読みが浅いとelmoにすら負けます。w
15分切れ負けとかだといい勝負してくれると思います。そういうヤツです。w >>941 そうですか、人造棋士18号は強いイメージがあったので、elmoより弱く少し驚きました。 中盤一手5秒で2000万ノード読めるマシンがほしい…。 USIshogiって人間指せないじゃん
検討しながら局面を進められないと意味ないわ 縛ると弱くなる理由を説明してw
シボレで絞って学習すると弱くなってます >>921
公開ありがとうございます
やりかたどおりに作ってみたのですがMD5はこれであってますか
KPP_synthesized.bin 503B6FECDA76519EED74721CA66D5DB0
KKP_synthesized.bin 96370DDE3EC9B814F30E56FD2EAFEF7A
KK_synthesized.bin 5B27B4B3BF9F358C1545D98DBBF998B8 東大の floodgate って落ちてる? もうやってないの?
アクセスできないんだが。 >>950
今は落ちてる。この先どうなるかはわからない。 >>951
ありがとうございます
棋譜の検討に使っています >>952
ああ、やっぱりそうか。
情報サンクス。 習甦の竹内の奥さんと写ってる写真の笑顔が最高すぎる yaselmoなどR4100位あると思われるソフトが本当にそのレートにあるのか、
技巧やnozomiあたりとの対局を始める。
@uuunuuun1
有能 yaselmoが入玉に弱いなら、玉位置指定ブレンドで玉が上の方に行ったときだけ100%elmoとかするとどうなるだろうかとふと思ったり >>959
もしかしたら
yaselmoに関しては進行度加えた方が強かったりするかもね 絞り・ブレンドを取り入れたソフトは短時間と長時間とじゃ強さは変わるのだろうか >>961
元にした素材の素性と、教師局面の深度と量で全然変わる 思考時間によるレーティング上昇にノード数の閾値のようなものはあるかという問答をしてみたい。
一手10秒と一手1秒で測定されたRのずれは、
一手1秒と一手0.1秒で測定されたRのずれと同じなのか?という話。
思考時間によるレーティングの向上は経験則だと
上昇レーティング = 500 log(t/t0) くらいで、
つまり持ち時間10倍で500くらい上がるっていうのはまぁよくある話だった。
だが、近年の評価関数は持ち時間によって有利不利が変わる。
おそらくelmoなんかは思考時間10倍で600とか上がってしまうのだろう。
あの経験則は「10倍になると」という相対的な事しか言っていないので、
「elmoが600 log(t/t0)で、他のソフトは500 log(t/t0)です。」のように言い切れるならば
最初に書いたように10秒と1秒を比較する必要はなく、
1秒と0.1秒を比較し、そのまま直線を引いて10秒でのR差を出せば良いことになる。
今回の問題は、経験式のようにどこまでもまっすぐ線が引けるかだが、
「ある深さ、ある探索ノード数まで読みが進むとある評価関数は急に強くなる」
みたいな事が起こっているならば残念ながら直線は引けない。
レーティング上昇ぶりに変化が出るノード数の閾値みたいなものがあるのかって問答 自己対戦で有意差が出る直前で一気に引き戻された時の絶望感ったらないな
開発者の人は毎回こんな絶望を味わっているのか ちょっとコード追加して、新たなブレンドモードを作ったら、面白い評価関数ができた。
なんだかしらないけど強い。どうして強いのかもわからない。w その最低限5%の足切りすら突破出来ない評価関数が多すぎるんだなこれが 細かい改良を100回テストしたら4回はずれるんだから当然
僅かな改善 (R20 程度) を無数に重ねあわせて、少しずつレーティングを改善している。とてもつらい。
http://denou.jp/tournament2016/img/PR/Ponanza.pdf
これは99.7%信頼区間3000局の誤差上限52.7%以上の事だった
山本氏はそれぞれ違うバージョンのポナンザ同士に3000回程度の対局をさせ、
この対局統計を分析しより良いポナンザのプログラムを採択する方式でポナンザを改良した。
採択されたポナンザはそうでないポナンザより平均2%ポイント程度勝率が高かったという。
対局で52%の勝率を上げたポナンザが生き残り、このポナンザがもう一つのポナンザと対局を行う。
http://japanese.joins.com/article/737/231737.html 信頼区間を乱数でテストするとこんな感じ
擬似1000局勝率50% 100万セット
95%信頼区間 46.9〜53.1%
532勝以上 23269 回 2.3%
468勝以下 23089 回 2.3%
範囲内 953642 回 95.4% >>974
強いかどうかなら勝率50.05%以上を仮定しておくと
(勝率50%だと弱くはない=互角も可能なのでわずかに勝率を50%より上げておく)
95%だと526勝474敗で達成
>>972
細かい改良を積み重ねる方式なら別にいい
最悪マイナスの改良でなければいいのだから
だがどこの馬の骨かわからんものが100個あったときに
最強のものを決めるという問題の場合にはそれは使えない
0.95^100=0.59%
つまり実力ではなくたまたま運が良かっただけという可能性が99.41%になるから
0.9995^100=95%になるから
100個のものの検定を95%の信頼区間で行うときには
1個あたりでは99.95%の信頼区間を最低限取る必要がある 短時間の勝率と長時間の勝率が一致しないって話が出てきている時代に
統計の「厳密」な議論がどこまで意味があるのだろうか それに完全互角でも先手勝率55%と予想されてるからな
勝率52%とかなってくると先後の差ですら影響するよな >>969
新しいブレンドモードをぜひやねうら王さんに送って
使えるようにお願いします 開発は改良の積み重ねだからごくわずかなレート向上が重要だけど、
ユーザーが有意水準を考えなければならないレベルのどんぐり関数を比較すること自体が馬鹿馬鹿しい
あくまで将棋スレなのに、将棋である必要がない議論しかなされてないよね
まあ一時期はスマホのスペックの話題ばっかだったし、そういうのは求められてないんかね いやstockfishもR20とかそれ以下の改良の積み重ねだけどね 要は将棋なんて興味ないんだよ
他人をなぎ倒せりゃそれでいいw >>976
難癖を付けるのが目的だからね
日本の保守(笑)なおっさん、ジジイには良くあること ENGINE_VERSIONどこにあるんだっけ?と思ったら
extra/config.hじゃなくてshogi.hにあったのね
直観的にあると見当をつける場所ではないような気もするが >>981
少し前まで将棋の内容について触れると湧いてくる荒らしが常駐してた影響もあるだろうね >>985
Bonanzaもshogi.hにBNZ_VERがある。 >>983
これが真理だな。
去年の真やねうら王をスマホで動かしてウォーズ40連勝くらいできるし、もはや人間には理解できないレベル。 >>988
それはお前にとっての真理だろ。
開発者の中には将棋の神にどれだけ近づけるかや、完全解析の究明を目指したりしてる人だっているんだから。 今の少しずつようするに「棋力」を上げるアプローチから完全解析ってできるの?
全く別の方向から考えないとダメなんじゃ? まずはどうぶつしょうぎに自己対戦学習させて初期局面の後手評価値がかなり大きくなるかどうか
やってみてほしい。 完全解析はとにかくスピード命だろ
どんなに頑張っても終わらんだろうけどw 完全解析したら棋士は廃業。棋士は開発者を殺してでも阻止する 量子コンピュータはD−Wave社が実用化してるからそれ借りてきて来年の選手権に出れば余裕で優勝できるよ。 このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。
life time: 16日 12時間 38分 13秒 レス数が1000を超えています。これ以上書き込みはできません。