▲コンピュータ将棋スレッド122 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
現在募集している配合組み合わせと対局結果
キメラ配合のやり方が分からない人もいるかもしれないので、配合済み評価関数を添付
※新規評価関数の対局は4スレ5秒相当が終わってから長時間にします。
1)「remutama40」 = (「mafuta3」60%+「rezero8」40%)
4スレ5秒相当
2)「remutama48」 = (「mafuta3」52%+「野生の読み太2」48%)
得意、不得意の局面が偏りすぎ。専用定跡を作れば強そうだけど「yasema10」使うほうが無難。
検証は個人的にやった結果でお願いするかも。
3)「yasema10」 = (「mafu10」50%+「野生読み太2」50%)
検証募集終了(個人的に続けます。もちろん追加でやって頂いた結果があれば報告下さい) 調査報告テンプレート
【エンジン】
【勝敗】
【持ち時間】
【CPU】
【OS】
【メモリー】
【思考条件】
【特記事項】
例:
【エンジン】技巧2、やねうら王4.55(elmo-qhapaq評価関数)
【勝敗】40-5-55
【持ち時間】1手5秒
【CPU】Intel Core i7-6950X 定格 (HT ON)
【OS】Windows10 64bit
【メモリー】16GB
【思考条件】Threads=20、NarrowBook=ON、USI_Hash=256,USI_Ponder=OFF など
【特記事項】使用定跡や感想とかなんでも
対戦させる場合でよく間違っている人のケース
※Ponder=OFFにすること
ここを忘れてる人多い
定跡のONOFFも忘れずに まーたsuimonがスレ立てたのか
前スレは書き込めなかったから、ここぞとばかりにスレ立てしたのかな? floodgateはいつになったら復旧するんだろか… 調査報告テンプレート
【エンジン】
【勝敗】
【持ち時間】
【CPU】
【OS】
【メモリー】
【思考条件】
【特記事項】
例:
【エンジン】技巧2、やねうら王4.55(elmo-qhapaq評価関数)
【勝敗】40-5-55
【持ち時間】1手5秒
【CPU】Intel Core i7-6950X 定格 (HT ON)
【OS】Windows10 64bit
【メモリー】16GB
【思考条件】Threads=20、NarrowBook=ON、USI_Hash=256,USI_Ponder=OFF など
【特記事項】使用定跡や感想とかなんでも
対戦させる場合でよく間違っている人のケース
※Ponder=OFFにすること
ここを忘れてる人多い
定跡のONOFFも忘れずに 調査報告テンプレート
【エンジン】
【勝敗】
【持ち時間】
【CPU】
【OS】
【メモリー】
【思考条件】
【特記事項】
例:
【エンジン】技巧2、やねうら王4.55(elmo-qhapaq評価関数)
【勝敗】40-5-55
【持ち時間】1手5秒
【CPU】Intel Core i7-6950X 定格 (HT ON)
【OS】Windows10 64bit
【メモリー】16GB
【思考条件】Threads=20、NarrowBook=ON、USI_Hash=256,USI_Ponder=OFF など
【特記事項】使用定跡や感想とかなんでも
対戦させる場合でよく間違っている人のケース
※Ponder=OFFにすること
ここを忘れてる人多い
定跡のONOFFも忘れずに 調査報告テンプレート
【エンジン】
【勝敗】
【持ち時間】
【CPU】
【OS】
【メモリー】
【思考条件】
【特記事項】
例:
【エンジン】技巧2、やねうら王4.55(elmo-qhapaq評価関数)
【勝敗】40-5-55
【持ち時間】1手5秒
【CPU】Intel Core i7-6950X 定格 (HT ON)
【OS】Windows10 64bit
【メモリー】16GB
【思考条件】Threads=20、NarrowBook=ON、USI_Hash=256,USI_Ponder=OFF など
【特記事項】使用定跡や感想とかなんでも
対戦させる場合でよく間違っている人のケース
※Ponder=OFFにすること
ここを忘れてる人多い
定跡のONOFFも忘れずに 調査報告テンプレート
【エンジン】
【勝敗】
【持ち時間】
【CPU】
【OS】
【メモリー】
【思考条件】
【特記事項】
例:
【エンジン】技巧2、やねうら王4.55(elmo-qhapaq評価関数)
【勝敗】40-5-55
【持ち時間】1手5秒
【CPU】Intel Core i7-6950X 定格 (HT ON)
【OS】Windows10 64bit
【メモリー】16GB
【思考条件】Threads=20、NarrowBook=ON、USI_Hash=256,USI_Ponder=OFF など
【特記事項】使用定跡や感想とかなんでも
対戦させる場合でよく間違っている人のケース
※Ponder=OFFにすること
ここを忘れてる人多い
定跡のONOFFも忘れずに 調査報告テンプレート
【エンジン】
【勝敗】
【持ち時間】
【CPU】
【OS】
【メモリー】
【思考条件】
【特記事項】
例:
【エンジン】技巧2、やねうら王4.55(elmo-qhapaq評価関数)
【勝敗】40-5-55
【持ち時間】1手5秒
【CPU】Intel Core i7-6950X 定格 (HT ON)
【OS】Windows10 64bit
【メモリー】16GB
【思考条件】Threads=20、NarrowBook=ON、USI_Hash=256,USI_Ponder=OFF など
【特記事項】使用定跡や感想とかなんでも
対戦させる場合でよく間違っている人のケース
※Ponder=OFFにすること
ここを忘れてる人多い
定跡のONOFFも忘れずに まさか手動書き込みで荒らしたのかな?驚くんだよな。 >>10に対してわざわざJPで反応。
過去スレでもJPはそれっぽいと思っていたが…
テンプレから仲間はずれにされた恨みだろうか?
スレ主と>>10は気をつけておけよ。 foreach_eval_param()がおかしいような mafuta2と、まふさんの新作remutama40を4スレ一手5秒、nodchip互角局面集で100局
対戦させて、mafuta2側の48勝45敗 引分7(勝率51.61%) R差11で、ほぼ互角でした。
次にremutama40とelmoを定跡切りで対局させて30局時点で、ほぼ互角で相性が悪い
ので対局を中止しました。もう配合だけでは、mafuta2を超えるものは難しいのかも
知れません。 将棋DB2にいるリンダちゃん、すごく妖しい指し回しでどんどん時間を吸い取られていく
手順前後をうまく使って、ポンダー外して時間を食わされる
どういう関数なんだ? オリジナル配合が
勝率維持してあと10局過ごせば有意に強いと言える所から
ガタガタと連敗して、残り1600局が必要な勝率にまで落ちて泣いた
今見たら勝率50%になっていて更に泣いた
書き込みボタンを押す寸前に見たら負け越していてもっと泣いた 次は3駒を+αさせた評価関数をゼロから学習させてどうなるかを試行錯誤する段階かな 有意とか言ってるけど、5%の確率を偶然引いたらどうするの?
こんな数字で有意有意と、まるで有意という言葉が紋所だとか、免罪符だかのように
科学気取りで勝ち誇るやつらがほんと滑稽 現在検証してほしい評価関数「mafuzero」※対局結果求む
手持ち最高レートを「REMU」で解析し、似ている特長を抽出した評価関数「mafuzero」を添付した。
入玉が本当に有効か調べるために「KK」をepoch0の評価値0で上書きしている。(相手陣へ入玉した位置配点が評価値0となる)
連絡先は私の連絡用Twitterを誰からでもDM受付しています。コンピュータ将棋スレッドへの書き込みでもOKです。 -「remutama40」は素で勘違いしていたので取り下げます。(Qhapaq新ツールREMUで「mafuta3」を解析すると「elmo41%近似」と出たなら、配合する関係上40%ではなく半分の20%じゃないと過剰でした) 3.「mafuzero」対局結果
現在4スレ10秒相当検証中1件
手持ち最高レートを「REMU」で解析し、似ている特長を抽出した評価関数「mafuzero」を添付した。
入玉が本当に有効か調べるために「KK」をepoch0の評価値0で上書きしている。 速攻で天井にぶつかっててワロタ
どれも大して強くなってねーじゃんw 「remutama40」は素で勘違いしていたので取り下げます。 二つの評価関数を補間しただけで強くなるなら誰も苦労しないわな
頭を使えって ■issueに来ていた質問について「要望というか必要事項」
>まふさん作成の評価関数で定跡オフで初手から対戦させていると横歩取りを指しませんが、プロの実戦で横歩取りがよく指されているので、
>横歩取り指すような評価関数を作る必要があるのではないでしょうか?
私が作成したかったのは「学習用定跡」であり、評価関数はたんなる副産物でしかありません。
それを一般配布しているだけなので、ご自身で作成されると良いのではないでしょうか?
■私が何故「評価関数」を配布しているのか
大会目前にして自分の「評価関数」を見せびらかす開発者は普通いないと思います。
3ヶ月後には私の作成した評価関数以上のものが配布されるでしょうから、その時までのつなぎで使ってみたい人だけ使用されればと思っております。
(使用されるのであれば検証のご協力頂ければと思います)
私がやりたかった「学習用定跡」の有効性は示せたと思っております。
現在は「やねうら王」開発者が提供した新ツール「キメラ配合」、「Qhapaq」開発者が提供した新ツール「REMU」、
これらのツールを使用した感想や使い方を私なりに試した結果を書き散らしているだけです。
私のような開発者でもない人間が極少の開発環境の中、失敗等いろいろやっている様子を見て、自分でも出来そうと思える程度に
心理的ハードルを下げる一助なればと思っております。 >>61
そうだな、隕石に当たって死ぬかも知れないからな
製品抜き取り検査なんてもっての他
常に全品検査しておくのが当然だな
↑が正しいと思うのなら良いと思うよ すぐ頭打ちになるのは当たり前だよ
ブレンドでちょっとでも強くなる方が意外なくらいで まふさんは、たまに配布したものを取り下げたりすることがあり、気になる部分も
あるけど、結果だんだん強いものが配布されており、実際にwcsc27のponanzaをやや
超えたものが出て来ている。2か月前までは、誰も想像していなかったwcsc27の
ponanzaと同等以上のものが、無料で手に入る時代になったのは、まふさんの、おか
げである。だから皆さんも、まふさんに感謝しましょう。 元々定跡によって棋風が〜って話だったのに、ただただ無意味に大差ない評価関数を乱立してるようにしか見えない
振り飛車指すわけでも穴熊にするわけでもなし 同じ強さならそれはそれでいいけどなw
ブレンドではmafuta2より強いものが生まれないとわかれば
開発者にとってはそれはそれで収穫だろうし >>68
p値が5%と6%の違いで舞い上がったり絶望したりする奴見ると滑稽だとはおれも思うな
あと期待勝率の検定や推定は無限母集団を考えるので全数調査は有り得ない 99.9%にしたければ手元で勝手に再調査すればいい話でしょう
スレに報告するかどうかの最初のフィルタが95%という事よ まふ評価関数達は
各binファイルのハッシュ値も書いて欲しいな
ハッシュ値の情報があれば
手元で作ったキメラが
正しいレシピで作っているのか確認できて便利 そんな確実なのがポイポイ出せたら苦労しないっつのw mafuta2と、まふさんの新作mafuzeroを4スレ一手5秒、nodchip互角局面集で100局予定で
対戦させて、10局時点でmafuta2側の10勝2敗で、あまりにもmafuzeroが弱いので、対局
を中止しました。まふさん、配布して下さるのは有難いですが、ある程度強さを確認して
から配布されるように、お願いします。 >>80
横からだが資料として意味があるから100局ぐらい回してくれ >>80
文句あるなら、テメーでやればいいだろうが 評価関数が手軽に作れるようになって喜んでいたら、今度は評価関数自体の『評価』に悩む事態になるとはなw まふさん評価関数作りが面白くてやめれなくなっている
一人だけでやるんじゃなく協力を呼びかけている
まふさんのパソコンてセレロンかペンティアムなのかな 某将棋ブロガーはデュアルXeonで80スレ一手10秒ぐらいでやればかなり価値のある調査なのになぜやらないんだろう。電気代が払えないんだろうか。
テンプレに記載されなかったからって発狂して荒らす暇があったら少しは開発に貢献しろ。 ゲーマーやってると、サイコロの目が当てにならんことは身にしみてるんだが。
6のみ命中で10個振って6ヒットとか珍しくもない。
一般人はサイコロは確率通りでると思ってんのかね?
数百回振れば確かにそうで、そこで偏りがあればサイコロの歪みかイカサマを疑うとこだが…
たった12個振った結果でなにがわかるんだ? ウェブマーケティングの本を読む暇があったら統計学の本を読め。
炎上系アフィブログの見すぎでどんどん頭が悪くなってるぞ。 >>89
こういうのを理解してれば12局の結果書き込むようなバカにはならないだろうw まふの虚言症には付き合えません
得意げに検証もせず成果を発表し取り下げる
これじゃ協力者が減っていくよ
レート4300だとかは叩かれて言わなくなったね これは苦言か
uuunuuun? @uuunuuun1 1 時間1 時間前
その他
まふ評価関数群についてはある程度強さが似通っている、お互いの間に相性問題がある、対局結果がネットに出ているので、そのあたりを少しつついてみたい。今はmafuta2を調べているが、elmo, eloqhappaとの対局結果はややyasema10と違うようだ。 まふさん
特定の評価関数にだけ強い評価関数は簡単に作れるのですよ?
ただし、特定の評価関数にだけ強いのは意味が無いのですよ? なるほど、ワッチョイが切り替わる数日前になると荒らし始めるのか。
ツイッターかブログかnoteで苦言を呈したら? 黒い瞳の奥底は四面楚歌
ただでさえいろいろあるのにgithubくらい好きに使いたい。 >>87
イカサマを疑っていいレベルで出た目が偏ってるのが分かる
サイコロを12回振ってで10回以上偶数が出る確率は
(12C0+12C1+12C2)/4096=(1+12+66)/4096=79/4096=0.019 最終的に負け越す方のソフトが開幕9連勝なら経験しました(怒) まふって高齢者だろ
Twitterやったことなかったとか・・・
安いパソコンしか持ってないとか・・・・・・ まふ関数は偏った評価関数なんだけどelmoよりは強いという 朝イチから顔真っ赤にして怒ってどうしたんだ?
個人の趣味の実験だぞ? 非プログラマでelmoに7割勝つなら凄いと思うけど >>96
なるほど。しかし2%は出ても何らおかしくない確率。
サイコロ3つで17以上。
出たからと言って即疑うかねえ?
17以上がでないサイコロは逆におかしいぜ?
社会学や医学の統計調査とか
おいそれと繰り返せない長時間調査の結果を5%水準で判定するのはやむをえん。
しかし5%水準で必要十分として簡単にできる追加調査を打ち切るのは違うだろう。 ■ このスレッドは過去ログ倉庫に格納されています