▲コンピュータ将棋スレッド121 [無断転載禁止]©2ch.net
レス数が950を超えています。1000を超えると書き込みができなくなります。
混ぜ方では強くなる配合はたくさんある
試さないといけないから時間がかかる スマホのCPUは最先端だが?
NPSでしか判断ができないのかな?
suimon @floodgate_fan
意外にスマホのCPUの性能向上は進んでいない模様。
最新のもので平均1200kN/sほどだと思います。
午前7:42 · 2017年7月17日 floodgateは事業仕分けにより廃止で良くないか。東大が金を出す意味がない。 混ぜるので強くするのは限界あるんじゃないかな
探索部分や評価関数強いの作る方がいい
作って混ぜて作って混ぜる 検証の仕方がバラバラすぎて意味がないという展開だからなぁ。
ダビスタで言うと自分の得意距離で強さ自慢しているようなものだから。 >>867
そうなのです
このソフトには対戦して強くなった、でもこのソフトには弱い
などそういう関係が出来るのでたくさん作っても同じようなレートになりますしね まふのやっていること
1 何かを思いつく問題提起
2 検証
3 結果 強い評価関数が出来ました
4 後日 弱かったので削除します
この繰り返しで評価関数だけ増えてゆく
これぞまふ定跡 所詮プログラミングができない素人がイキがってるだけだからな まふさん、また新しいの作ったら今度はR4500かも!とか言いそうだな(笑) >>872
まふさんの功績は認めてますので、レートのウソを書くのだけはやめて下さいね 「mafuta3」60%+「rezero8」40%
自前の KKP_synthesized.bin は、以下のハッシュ値なんだが、合ってるかな?
CRC32: 39B1DF5A
MD5: 406146B52B3C1615DBECB5C6AA071D1B
SHA-1: 1D7135A9FB34F57A60F51D4A2F8C31432D146966 雑魚ンザが最近だんまりなのは、やはりキメラエルモに追い抜かれてて焦ってるからか(笑) >>809
これでもmafuとmafu10のレート差は29か。 >>857-858
律儀に全部測る必要なんてないやん。
強いと評判のものは噂になるんだから、気になったやつを気の向いたときに測ればいい >>854
せっかくのDLをメタな方法に使う事自体がDLである必要性を薄れさせている気がするのだが
当然学習時にも大量のコストをかけて、本番にも大量のサーバーで計算せざるを得なかったPonanzaがWCSC27で負けたんだから、電王戦で勝てるとは思えないけどなぁ(個人の感想)。隠し玉持ってそうな屋根裏優勝を予想する
なんにせよ電王戦の勝者が、この黒魔術じみた状況から脱するヒントを示してくれることを楽しみにしている まふさんも楽しいおもちゃを与えられてよかったね
評価関数作りで時間過ごせる
そしてその研究結果がやねうら王に吸い取られる
やねうら王優勝だーー まふさん、remutama40.7zもらった
検証は参加出来ないけど
これと他の既存の評価関数配合してみるよ >>809
elmoに勝率7割りで頭打ちか。
これ以上はdepth深くして学習を行わないと棋力延びなそうだけど、将棋ダビスタでどこまで行けるかな。 実験対戦
4スレ1秒定跡なし100回対戦
remutama40 yasetamafu70 49-51
同じ感じですかね… >>887
それ差し替え前の間違ったバージョンじゃないの?
remutama48も同封されてるのが新しいのです >>880
何をどう考えても無理すぎるだろ
んじゃ自分でやってみ?
メチャハードルは下げて、今強そうな関数をお前の好みで9ほど選択してそれに生elmoを加えて10関数でリーグ戦、1手1000万ノード、リーグ戦は各関数毎に300対局、合計1500対局くらいでいいわ
で1位〜10位までのRを発表してくれ
対局数が少なすぎんだろ!とか
んなノード数で何が分かるんだよ?とか
選択基準がメチャクチャ・・・だとか
不満もガンガン出ると思うけど、それくらいやれば感心してくれたり提案してくれる者も山ほど出てくるわ
で、その後は「この関数が強いぜー」って教えてくれる人が続々出るから、その中から自分で相応に見える物があれば、その度に10関数とそれぞれ30対局合計300対局やって生エルモ以外の最下位を削って常にTOP10を残す作業をする
これでもメチャクチャハードル下げてるから、本来はこんなもんじゃ全然足りてないからな
そんな薄っぺらい検証・計測ですら、お前、自分でそれが出来ると思う? まぁ、似たような評価関数作ったって、どうせみんなponanzaより雑魚なんだから 最強の評価関数は何か!?
多種ある評価関数がルール無しで戦った時…
スポーツではなく早指し長時間ありの『将棋』で戦った時
最強の評価関数は何か!?
今現在 最強の評価関数は決まっていない 「最強」の定義を決めておかないからバカみたいな結果報告が増えるんだよな。
自己満最強評価関数はツイッターで報告すりゃいい。 mafuとmafuta2にR差35もあるわけがない
http://i.imgur.com/DBZSKHp.jpg
実際には2000局指しても
mafuta2 1015-16-969 mafu.7z で有意差は出ない
(当然evalshareは切ってる)
定跡オフ nodestime100 3スレ1秒 Contempt30 投了値2000 >>897
そんなゴミスペックでドヤ顔されてもな。
Xeon二枚買って出直してこい。 >>897
直接対決ではほぼ五分だけど
mafuta2 mafu 50-49-1 てか>>847をみて言ってるのかもしれんが、>>847は計算も順位も変だぞ
>>809がほんとの勝率順だし
実際に計算するとあの検証のmafu.7zからmafu10までR30弱しか差がない上にR±25の信頼区間
つまり全く順位は分かっていないってことだ 実験対決2
4スレ1秒定跡なし100回対戦
remutama48 yasetamafu70 39-61
長時間じゃないと、評価関数の持ち味が発揮されないのもしれないので、作成してくれた方にも失礼ですし投稿はこれで最後にします Program Elo + - Games Score Av.Op. Draws
1 mafu : 130 26 26 700 53.7 % 104 1.1 %
2 mafuta2 : 128 26 26 700 53.3 % 105 0.6 %
3 mafuta3 : 124 26 26 700 52.8 % 105 0.4 %
4 mafuta1 : 124 26 26 700 52.7 % 105 0.3 %
5 yasema10 : 123 26 26 700 52.5 % 105 0.4 %
6 yasetamafu70 : 122 26 26 700 52.4 % 105 1.0 %
7 mafu10 : 105 26 26 700 49.6 % 108 0.4 %
8 elmo : 0 27 28 700 33.0 % 123 0.3 %
>>901
君が BayesElo
elostat計測 途中で書き込まれちゃった
>>901
君がBayesEloを分かってないだけ
elostatなら>>903の結果になる たくさん似たような強さの関数作って混乱させたいの? githubに載っているDeveloper用のcode勝手に拾っておいて「混乱させたいの?」はないだろwww
おろしろすぎる冗談だな。激指使ったら? 激指定跡道場4強いな。
remutama48に勝ち越し 全く知らんかったからBayesian Eloについて勉強してきた。
が、やっぱり>>847では正確ではないと俺は思う。
なにより初期値決めてから少しずつ動かしていく方式だから計算の順番で有利不利がある。
>>847は>>824の対戦成績の順番に打ち込んだと思われるが
とびぬけて弱いelmoとの試合の後に試合をたくさんこなすとRが下がる傾向になってしまう。
>>824の書き込みの順番が
yasetamafu70→mafu10→mafuta2→yasema10→mafuta3→mafuta1→mafu
>>847の順位を下から並べると
mafu10→yasetamafu70→mafuta2→yasema10→mafuta3→mafuta1→mafu
elmo以外が団子だからほとんど入力順が計算順位と等しくなっている
まぁとにかくmafuとmafu10の間に70の差があるのはおかしい。 Googleみたいなすごいのがどかっと来てくれないかなあ
「定跡とか配合とか無駄な努力ご苦労さんw」
みたいなやつ期待 >>909
じゃあ、elmo抜いてまふ系統の評価関数だけで総当たりやりましょうか
それと、申し訳無さすぎるんですが設定上のミスをまた一つ発見してしまいました
evalshare程の大ミスではないので、二つ目のデータはそこまで悪くはないと思うのですが、やはり自分でも正確ではないと感じます
もう一回だけチャンスを頂けませんか?
終わるのはいつになるのかわかりませんが いろいろブレンドしては対戦させてきたけど、素材(elmo、rezero8、mafu10、mafuta3、野生の読み太2)を全部ブレンドすると、ほとんど有意差なしで強い評価関数になる
突然変異的に強いのはできないはず
突然変異を狙うには、絞りに絞ってアウトブリードを作るしかない 検証した人がおるんか
わたしは>>847が直感と反するな〜と思っただけで>>824の結果自体はさほど違和感ないし、
elmoを抜いて計算するとか、計算の順番を変えるとかはデータを扱う側の問題だと思う。
むしろ団子だって分かったからそれで十分じゃないのかねぇ
最強という単語に惹かれるものなのか >>911
いや、やっぱりやめておこう
時間がかかり過ぎてしまうし、自分より正確に測定できる人がやった方がいいし
これで本当に最後の投稿にします >>914
おつかれ
evalshareとかのフィードバックもあったしよかった
なにをミスったかはもやもやするけど 配合じゃなく新しい評価関数作ったとか教育学習して評価関数強くしたとかの時には協力します relmoが奇跡的に伸びただけで
まふ評価関数以降は配合してもそう大きな伸びは期待出来なさそうだな
電王Tまではこの辺りで頭打ちになりそう ダビスタの距離別大会のように条件をしっかり決めないとこのもやもや感は消えないだろうね。
ぶっちゃけ、ウォーズやクエストでソフト指しする層に好まれる10分切れまけや5分切れまけ最強の評価関数が最強と呼ばれるだろうな。
プロ棋士以外には長時間向けは歓迎されないだろう… >>911
EvalShareオフの他に、NetworkDelay,NetworkDelay2を0にしていないだとか・・
いい加減、公式にあるドキュメントぐらい読めよ >>911
技巧2もいれていただけるとありがたいです 短距離血統は手が広いほうが有利だな。相手の読み筋にないから。
学習を補完しあうような形の多種ブレンドが有利。 10切れに合わせると一手10秒程度だから自分の棋譜解析にもちょうどいいし、いいと思うけどね。
悪用されるのは避ける方法が思い浮かばない。 >>918
とはいいつつelmoに勝率7割、relmoに100戦行いギリ有意差出るくらいに強いのは凄いと思う。 >>911
もう意味ないだろ
総当りなんて
五十歩百歩で大差ないで結論出てるよ みなさんの対局設定をみてたら、どれも一手1秒や2秒の短時間が多いけど、最低でも5秒
で対局しないと本当の強さは出ない。だから、uuunuuunさんの基準は5秒にしている。
だから一手1秒や2秒の対局結果を見せられても、あてにならないので全く参考にして
いない。 本当の強さってなんだよこのメルアドキチガイ
5秒なら信用できるって意味不明だわ >>891
それでハードル下げてるとか言うなよw
もっともっと低いハードルを想定してるんだが。
というか、そんなこと言い始めたらそもそもレートの計測自体が成立しないわな。 秒数ではなくノード数だよな
例えば同程度のCPUで1スレッド5秒と128スレッド1秒なら後者が遥かに上でしょ
あとCPU自体のIPCと動作周波数もそれぞれ違うわけだし ノード数はずっと提案してるけど聞く耳持たれないよ。
なぜなら時間がかかるから我先にと対戦成績を報告したい人には都合が悪いからさ。 >>927
君は5秒だと、どのスペックのPCでもみんな同じノード数になると思ってるお子ちゃまかな? まふという人間の評価関数
パソコン安いのしかないようだし
失業中の孤独な人で
アパート一人暮らし、もしくは親と同居
虚言癖レート4300とか言い出す
精神に欠落があり社会に出れない人
まふ定跡を作るあたりの細々とした長期作業をする執念深さで評価関数作る 以上よっちゃんとかいう盗作評価関数の作者さんの有難いポエムでした。 ★将棋の棋士はメガネ障害者ばかり ・普段コンタクトを使用してる棋士
佐々木勇気は普段はコンタクトかカラーコンタクトをしています。
カラコンをすると目玉が黒くなり大きく見えます。
目つきが鋭い人、目がモデルや芸能人のような人はカラコンをしてる可能性が高いです。
記憶力が異常にある直観像記憶(映像記憶)ができる人はメガネ障害者の人が多いです。
東大生や記憶力のチャンピオンはメガネ障害者ばかりです。
東大医学部はアスペばかりです。
佐々木勇気 五段
http://i.imgur.com/K★iBZMLR.jpg
http://i.imgur.com/S★fDFbYJ.jpg
http://i.imgur.com/Y★6F7uy4.jpg
三浦弘行 九段 A型
http://i.imgur.com/L★tTioZz.jpg
佐藤紳哉 七段
http://i.imgur.com/W★UGvq4p.jpg
先崎学 九段
http://i.imgur.com/c★F2xnnF.jpg
メガネなし
http://i.imgur.com/3★PJ57Lc.jpg
行方尚史 八段
http://i.imgur.com/n★jCcI44.jpg
メガネなし
http://i.imgur.com/9★srW23h.jpg
橋本崇載 八段
http://i.imgur.com/6★9d12cl.jpg
メガネなし
http://i.imgur.com/u★dmCfFJ.jpg
久保利明 九段
http://i.imgur.com/y★qTE4YU.jpg
メガネなし
http://i.imgur.com/a★T9yGcQ.jpg
★メガネはメガネ障害者です
将棋の棋士はメガネ障害者ばかりなので、将棋はパラリンピックです
障害者のパラリンピック将棋が好きな人はセンスがない凡人たちです くだらないことばかり書いてないで序盤に穴のないソフト作ってよ 今度のSDTは、探索部はやねうら王が8割とかなるのかね?w コンビニで雑誌立ち読みしてたら、女流棋士のヘアヌードが見れたぜ ponanzaは入玉に弱いから、対策しなきゃ負けまくるだろうなぁ テンプレに追加で入れるべきものがあったら整理し始めてほしい 大会はやねうら王ライブラリ使用のやねうら王仕様が標準でelmo派生でほとんどになるんでしょう >>762も入れておきなよ
誤差レベルの勝敗差で
○○の方が強いと言い切ってしまう報告が後を絶たないし ちょっと配合変えただけの評価関数検討とかうざいから別スレに分けようぜ 評価関数と検索部とやねうらデバックスレでわけようぜ 自分の計算資源を使って自分で満足してる人のほうが
他人の計算資源を当てにして勝手に不満になってる人より
将棋ソフトもスレも有効活用してると思うけど
他人の計算資源を使いたいなら浮かむ瀬やクジラちゃんぐらいパッケージングしないとだめなんじゃない?
あとよくもわるくも本人の魅力も >>762って有意水準10%で両側検定した場合を想定したのか5%で片側検定なのかわからんね
実験してから棄却域を設定するのはおかしいから前者を前提してるのかね? NHK BSスペシャルの話題はスルーなんか?
やね先生も登場していたのに 配合繰り返すだけでレートが10ずつでも上がり続ければ楽なんですけどね >>955
有意検定を知ってて書いた感じではなさそうだしuuunuuunさんとその仲間たちがレート表をより充実させてくれるんじゃない? 河童さんのREMUのおかげで、どうブレンドするとどれがスポイルされるのかとかがわかるようになって、すごく助かってます
河童さん、ありがとう!
いろいろ混ぜると、完全に殺されちゃう血統が出るというのは驚きでした
あと、短距離血統のブレンドを始めましたが、まふ評価関数は短距離からクラシックディスタンス(笑)まで満遍なく強いです
短距離ならelmoや野生の読み太のほうがイケるかなと踏んでいたのですが、敵いませんでした
浅い読みでも細かな穴をバシバシ突いて逆転するので、棋譜を見ていても楽しいです
対局条件は4スレ1秒、Ponder、定跡、ネットワークディレイ関係、eval share全てOFFです
勝敗はあえて載せませんw 絞り方教えてくれー。そして探索部ってなんなんだよおー。絞ったら若干弱くなってる気がするょおー。バッチサイズ、バラバラで教師局面作ったからラーンするときエラー出まくりなんじゃー レス数が950を超えています。1000を超えると書き込みができなくなります。