▲コンピュータ将棋スレッド140
レス数が1000を超えています。これ以上書き込みはできません。
https://dotup.org/uploda/dotup.org1586654.jpg.html
1手2秒6スレッド200戦
探索やねうら王統一で対QQR勝率53%
たぶんNNUE kai kai2と同じくらいの強さ >>356
YaneuraOu-NNUE-dolphinを使用したnnue_illqha1.1
1秒対戦でNNUEkai+GW3に勝ち越しました
次の公開待ってます 遅くとも7/14に開始予定とアナウンスされていたTCEC 13はまだ開幕せず
噂によるとGPUの導入のために遅れているとか
そんななか、LeelaChessZeroは世界コンピュータチェス選手権に参加中
ところで、世界コンピュータチェス選手権と世界チェスソフトウェア選手権って併催だったのね
初めて知った(前者がハードウェア制限なし、後者が統一ハード) KPPTならQQR、Qhapaq
NNUEならkai2、illqha1.1 >>365
>>366
計測ありがとうございます、多少は強くなっていそうですね
同エンジンでの計測もいいですが、せっかくエンジンもつけてみたので使って頂けると嬉しいです NNUE系は先手で角換わりばかり指すけどQQRやqhapaqは横歩取りばかりなのが興味深い 戦型の志向って割とどうでもいいところだと思う
評価値に差があれば、それが意味のある差かどうかに関わらず片方しか選ばないんだから >>356
> https://21.gigafile.nu/0723-c181030ec8e9314bbd6439835ce3d9ca1
>
> おまけ3を公開します
> わかりやすく強くはなっていないかもしれませんが、弱くはなっていないと思います
> なんとなくコツがつかめてきた気がするので、また2~3週間後になったら公開します
> 例によって計測等はほどほどにしておいてください(またすぐ次が出来るので)
早速試してみましたが明らかに前回より強くなってると感じました。
お仕着せ探索エンジン:YaneuraOu-NNUE-dolphin-by-clang-tournament-avx2.exe
illqha1.1 vs GW505 QQR 1秒 3勝3敗
illqha1.1 vs GW505 QQR 2秒 6勝0敗
GW3バージョン:YaneuraOu-TNK-NNUE-whale6_Ditto-AVX2.exe
illqha1.1 vs GW505 QQR 1秒 6勝0敗
illqha1.1 vs GW505 QQR 2秒 6勝0敗
illqha1.1GW3 vs illqha1.1DOL 4勝2敗
illqha1.1GW3 vs illqha1.1DOL 3勝3敗
特にQQRに1秒、2秒対戦とも6勝0敗には魂消ました。
見ていた感じでは途中で劣勢になっても最後に逆転で詰めている
ケースが2度ほどありました。 >>372
計測ありがとうございます
対局数少ないので統計的にはなんともいえないですが、終盤強い感が出ているなら良かったです
終盤強いのはNNUEの特徴ですが、前回より終盤を少し多めに学習させてみたのでその傾向を生かせましたかね >>373
棋譜を確認したのですが1秒探索ぐらいではいくら強いソフトでも自玉の詰み
を発見できるとこまで探索できてない気がします。その局面で検討させたら
10秒かければすべてのソフトで最善手を発見してました。何秒ぐらいで発見
出来てたのかはわかりませんがコンピュータソフトの探索数を制限する限定
大会でも開催すると優勝まちがいなしなのかもしれませんね。 illqha1.1illqha1.1+おまけエンジンとGW-QQRを対局させてみました
対局数は各100局と少ないですが一手5秒です
illqha1.1illqha1.1からみて
E5-1660 6スレ
67勝32敗分け2
Ryzen1700 8スレ
65勝31敗分け4
X5670*2 12スレ
60勝36敗分け4
でした >>375
自分も一手2000万ノードで検証したら同程度の結果になった
なぜか同じやねうら王エンジンで両者を対局している人がいるけど探索と評価関数のセットで一つのソフトなので、あえて同じやねうら王エンジンにする必要はないと思うんだが 一番強さが出る探索を使用して検証するのが理想だが、あえて勝率が落ちる探索を使用して検証して意味があるんだろうか おまけエンジンDittoで再現するにはどんな数値にすればいいの? >>375
随分時間がかかる計測ありがとうございます
思ったより勝ち越しますね
dolphinが中程度の時間でも中々いいパラメーターだったんじゃないかと思いますが嬉しい誤算ですね
まふさんはもっと時間をかけて細かく調整したと思われるのであの勝率もやっぱり不思議ではないですね
というかそれだけ計算資源があれば学習に挑戦すれば私よりはるかに早く強くできますのでいかがでしょう
>>378
付属のソースのengineの中のparamを見ていただけば丸わかりです
gccでビルドしたDittoでは付属のものより5%以上NPSが落ちるかもしれません illqhaの開発者の方、ぜひTwitterなどで発信して頂きたいです illqhaの開発者の方、もうTwitterアカウントをお持ちなのですね
Twitterの方でもソフトへのリンクを発信して頂きたいです QQR+GW5でR4244なので、それに勝率65%ということは(自分の検証でも一手2000万ノードで同程度)、ほかの評価関数との
相性を考えなければillaha1.1+dolphinでR4352になっている、いくらなんでもレートが上がりすぎだろ
elmo_wcsc27+yane_v4.74_avx2に対しても10局やって10-0だった、他の強豪ソフトはどう組み合わせても最高で9-1が限界だった 自己解決
Diitoでおまけ3エンジン
NNUEWhaleVersion = 6
FUTILITY_MARGIN_ALPHA1 = 145
FUTILITY_MARGIN_BETA = 220
FUTILITY_RETURN_DEPTH = 6
FUTILITY_AT_PARENT_NODE_GAMMA1 = 141
FUTILITY_AT_PARENT_NODE_GAMMA2 = 187
SINGULAR_EXTENSION_DEPTH = 6
PRUNING_BY_MOVE_COUNT_DEPTH = 14
REDUCTION_BY_HISTORY = 2000
FUTILITY_MOVE_COUNT_ALPHA0 = 230
FUTILITY_MOVE_COUNT_ALPHA1 = 480
FUTILITY_MOVE_COUNT_BETA0 = 720
FUTILITY_MOVE_COUNT_BETA1 = 950
ASPIRATION_SEARCH_DELTA = 12
3ではなく6ベースなのが意外だった 上にすでにリンクが張られててちょっとびっくりしましたがTwitterアカウント作りました。
これからちょっとしたことはTwitterで発言していくと思います。
>>385
whale6っぽいところがあるのは教師作成のために浅いdepthで強いパラメータが理想だったからです。 深く探索させたときやねうら王4.82が弱いって話があったけど
ここに張られてるやつはどうなの? illahaの人がTwitterアカウントをつくり改良した評価関数と探索をおおやけに公開したので、uuunuuunさんなどが検証する可能性が出てきたが、探索は相変わらず勝率が大分落ちる純正のやね4.82で検証するんだろうか 評価関数だけでどれだけ差があるのかとかこだわりがあるみたいだからね 正直レートが低い探索をあえて使ってレーティング結果が出ても誰も使わない組み合わせなので存在価値はないと思う 純正やねは、枝刈り云々よりもNPSが出ないところが最大の弱点だから、NNUE評価関数では高レートは出ないよね まふさんがillqha1.1の計測するみたいだけどなんで自分の評価関数じゃなくてkai2に追加したやつなんだろ kai2も元はまふさんのを追加学習したやつなので、お互いさまでいいんじゃないの
個人的には評価関数の使いまわしは簡単に強くなりやすいため計算資源を節約できるし
結果的に早い時間で公開される場合があり恩恵を受けるのでいいと思うけど まふしかり短ノードで強いエンジン使っただけじゃなくて?
磯崎や大賀のように調整したんじゃなくて棋譜もあがらない低ノードを信じるのは流石に? >>394
いやいや、どうせなら自慢のR+200を使ってほしかったってだけよ 今朝仕事前に10回戦のVS GW5.0.5 QQRとの対戦を10秒でセットして
先ほど帰宅してみたら8勝2敗だった。10秒ぐらいまでは相当強いんでは
なかろうか?
中盤〜終盤、最終的には詰めエンジンを駆使した凄い探索エンジンのソフトが
できてきたらGW5.0.5 QQRにほとんど勝てるソフトが出来そうだね。
来年の今頃そうなってくるといいね。私は駒落ちでソフトと対戦してるけど
4枚落ちでソフトの切れ負けに誘導するぐらいじゃないとどうしても攻め合い
負けしてしまう。ソフトは細い攻めをつなぐのが上手いのでへぼの自分には
凄い勉強になる。 まふさんは最近までは1500万ノードで計測していたのにillqha1.1に限って3000万ノード以上で計測しているということは
少し計測して1500万ノードだとまふ評価関数が互角以下だったので3000万ノード以上に変えた可能性がある
QQRに対してまふ評価関数はR+100らしいがillaha1.1+dolphinは+107程度なので仕方ないだろう 久しぶりにきたが今将棋ソフトどのぐらい強くなってる?
名人が2枚落ちしてもらって互角ぐらいと予想してるが。 有意差なんて人が決めた境目であってどんな結果も起こりうるさ
開幕9連勝からの負け越しも経験したさ >>405
さすがにそこまでは行ってない
というかレートはどんどん上がってるけど、
R4200クラスでも駒落ちの指し方はいまだにおかしくて、
二枚落ちならアマ三段くらいあればまだ普通に勝てる感じ >>405
どんなにレイトが上がっても名人が2枚落ちで互角はありえない
それどころかアマでも飛車落ちは5分角落ちでも勝つことがある
前スレに飛車落ちと2枚落ち全駒勝ちの棋譜があるよ アマ三段の二枚落ちって棋士相手でも勝率5割を下回るよ
将棋ソフトが駒落ち苦手でも流石にそこまで弱くは無いから
それこそ30回に1回勝つを普通に勝つの範囲に含めるかアマ三段(24三段の事)ならそうですねとしか言えないけど >>410
前スレの2枚落ち全駒の棋譜をコピペしてみれば良く分かると思うが
ソフトは駒落ち苦手平手特化これは明らか
ソフトに駒落ちで鍛えてもらえば飛車落ちでも5分になる
もっともアマ4段以上の棋力は必要だが(特に正確な序盤の理解力) 確かにソフトは駒落ちの序盤はあまり強くない駒落ちの初期局面から学習していないので仕方ない >>405
プロ棋士は負けるのが怖いので駒落ちでは対局しない
だから駒落ちでの対局を避けて、ソフトを借りての穴探しやハードの制限で勝とうとした
少し前には、角落ちだと戦力不足で将棋の神(最後の一手まで完全に読み切るソフト)でも名人には勝てないのが常識だった
現状で飛車落ちで名人と互角
近い将来、二枚落ちで名人に勝ち越すソフトが登場する
名人は駒落ちで対局しないので証明はできないが ×ソフトは
○平手で学習させたソフトは
だろ、駒落ちで学習させれば良いだけだ
もっとも、それをやることに意義を見いだせる人間がどれほど居るのという問題はある illqha1.1強いです
連休を使ってdepth12で1億局面を作成したので、NNUEkai3を作って公開じゃー、と思ってましたが、
普通にillqha1.1に負け越す(両者dolphin使用、500局1500万ノード勝率46%)ので、顔を洗って出直します ロタ氏がillqha1.1+dolphinとnn20180608と計測してたけどnnueに対してはR+30程度と以外に差が小さいね、QQR+GW5.0.5にはR+107程度もあるのに
nnue同士は追加学習しても差が小さく、KPPTには差が大きいってことなのかな ツイ垢も出来たし、uuunuuunさんのレート表に載るのも時間の問題かな。 エンジンは2018-otafuku-search.cpp等のベースがGW6っぽいけど
uuunuuun氏が自前のPCで計測し始めていたらウケるな
パソコンが壊れたらillqha氏のせいにするのだけはやめて欲しいね >>356
今回は学習部は付属なしですか?
前回から学習初めてみたのですが強くならなかったので違う学習エンジンも試してみたいです
可能なら宜しくお願いします >>425
あんまり人気がなかったようなので付けなかったのですが、学習をやる気がある人がいるのなら上げましょうかね
前回の学習用の実行ファイルを使っていただいてもそれほど問題はない気もしますが 次回はエンジンの探索パラメータをもう少し時間をかけて細かく設定したものを用意できればと思うのでそれまで待って頂いたほうがいいかもしれません 振り飛車NNUEを5年前に投入できたらプロの先生たちが続々と振り飛車党に入党してたかと思うと 今からでも遅くはない、最強の評価関数が振り飛車を指すのであれば…! >>426
チマチマやっているのですが強さを感じるまでには至らず・・・
また良かったら学習エンジンもお願いします >>430
学習はいろいろ工夫するところはあると思いますが、最も効くのは教師の数です
depth10で5億用意すればまず強くならないことはないと思います(たぶん)
次回までにいいパラメータが見つかれば次は学習用の実行ファイルをつけてみますね ロタ氏の計測と自分が計測したのとは勝率が13%程度違うので、同程度のノード数でもPC環境で勝率は大分変わるんだな 駒落ちはいまのソフトが適応してないのもあるけど研究されたら差がさらに広がるのが痛い
二枚落ち特化の最強ソフトも研究されて対策が出回ればアマでも楽に勝てるようになると思う 貸し出しで手も足も出てないのに、対策練ればって何言ってるんですかね
駒落ちの話はもううんざり 駒落ちとか特化させたり強くなればなるほどやけくそな適当な手を指すようになったりしないのか?
どうやっても勝てないよってことから そもそもαβ探索が駒落ちというか形勢が大きく離れた局面に向いていないという線もありそう illqha1.1+dolphinがQQR+GW5.0.5に勝率65%程度でR+100程度の根拠を表にしてみた
1. まふさんが計測して「QQRよりR+100程度になると思う。」のコメントが出ている
2. >>375の人も合計300局で勝率65%程度の結果が出ている
3. illqhaの人も勝率65%程度の結果が出ている
4. 自分の計測でも65%程度の結果が出ている
したがってロタ氏だけ誤差範囲の勝率52%の結果は明らかにおかしいと言わざるを得ないだろう >>438
rota氏の計測はQQRじゃないですよ >>439
>>365の書き込みのことを言っているのなら探索部はともかく
評価関数はQQRと明記している >>439
ロタ氏がnn20180608の次にQQRとが計測しているんだがTwitterの大分下の方をみてないの?
QQR_GW5.0.5vs illqha1.1_dolphin 138-9-155 >>440
illqha1.1 の話しじゃないの? >>439
Twitterの大分下の方なのでURLを貼っとく
QQR_GW5.0.5vs illqha1.1_dolphin 138-9-155
https://twitter.com/Rota_JP/status/1019862776536227840 >>443
あ、すいません
一番上が固定のツイートでしたね >>405
プロが飛車落ちで、アマ強豪が飛香落ちで楽しめるレベル ここまでのロタ氏の計測だとillqha1.1-dolphinの総合的なレートは4277なので
現在R4244でトップのQQR_GW5.0.5や20180608mafuよりR+33でついに1位を更新したね
vs QQR_YO4.82 勝率59.5% R4293.82
vs QQR_GW5.0.5 勝率52.8% R4263.58
vs 20180608mafu 勝率54.3% R4274.1
平均R4277 プロがソフトの駒落ちでやるのは、やる前からすでにハンディキャップをもらっているので屈辱だと思うけど、そう思うのは自分だけかな QQR_GW5.0.5vs illqha1.1_dolphinの対戦結果について
将棋所では拮抗しているがShogiGUIではillqha1.1が
差をつけて勝ち越すパターンが多い感じがする
今までGUIの違いでの差はほとんどなかった
最近導入した将棋所の最新版4_1_0 のせいか? ハイパースレティングまわりやAVX2の関係でCPUの世代でも結果が変わるらしい https://twitter.com/HiraokaTakuya/status/1020268715474997249
平岡 拓也??\(´・_・` )/??
?@HiraokaTakuya
反社会的勢力に資金を流す事に繋がるので、鰻を買う事は反社会的行為と言えそうだけれど、いっそ絶滅させてしまえば資金源の1つを断つ事になるので、絶滅させるのが正解かも知れない(´・_・`)僕はお金がないのでみんな頑張って(´・_・`)
19:26 - 2018年7月20日
なんでやおめー、HEROSの株売っぱらって手に入れた大金どーしたってんだよ 婚活資金と猫ちゃん購入代金に消えたんだろう(察し) uuunuuun氏がレーティング表を更新してた
dorphin/nn_illqha1.1 R4292
T.N.K./nn20180608mafu R4257
Godwhale5.0.5/QQR R4253
YO4.82/QQR R4235 uuunuuun氏のサイトの対局ログを見たらdorphin-illqha1.1がaperypaqに
勝率76.8%, R+208だった
それにしてもnnueの登場でかなりレートが上がったね これはいよいよ対elmo勝率9割超えをしそうですね しかし、イルカさんは、後手番の横歩を避けない、先手番の横歩で青野流を使わないといった点で、
序盤巧者とはいえないから、ちょっとだけ定跡を搭載しただけで、勝率はより高くなると思われますね 反社会的って言葉を使う平岡さんにちょっとがっかり。
この複雑な社会で"社会性"とは何かを厳密に決めるのは不可能。
単なる制度的な不備を治療の必要がある人格とするならばそれこそ人間そのものの排除につながる。 反社会ど真ん中の暴力団が反社会か厳密には決められないってアホかな 意味わからなかったかな?
暴力団は反社会的な団体だけど、うなぎを買うことは反社会的行為には繋がりません。
行動障害でもパーソナリティ障害にも該当しないよ。
社会的不備を人格のせいにして自分の気に入らないことを排除したいだけ。
うなぎの保護活動や完全養殖の研究者に寄付すればいい >>461
ウナギの稚魚の捕獲がヤクザのシノギになっているという噂を指してるんだよ >>461
平岡は人格がどうだとかなんて言ってないよね
反社会勢力の利益になることをしてるのに、反社会的行為と言わないのは不思議だねと言ってるだけで
これがサンゴやら象牙やら毛皮やらの悪趣味な収集なら批判されるのにね それは反社会的行為の定義として普通は人格障害やパーソナリティ障害のことを指すので
間接的に反社会的団体の資金源となりうる行為とは別ですよ。
不思議もなにも批判されないのはマスコミや大手企業の影響力でしょう >>467
93に銀を打ち込むあたりですら84に逃げられる展開を読めていないとなると良くないですね
ただ、こちらの環境だとどうしても93銀から詰むと判断しないので調べるのが大変そうです TACOSとかAI19とか東大無双とか古いやつダウンロード版で安く再販してくれんかな
500円くらいなら出すよ 1080円だけど柿木将棋ダウンロード版
最低のレベル1でやって角換りの熱戦末、勝った。
昔の柿木より筋がいいし
人間がまだ勝負できるし、楽しめる。レベル1はアマ3段くらいか
詰将棋余詰め発見機能もあるし、まあ満足してます スマホでNNUE使いたいんですけど、一番強い実行ファイルってなんですか? まふは公開せず自分の強いって自慢するだけの人だが、またなんか嘘くさい内容の話を持ち出しているけど、公開しない評価関数などどうでもいいんだが、
とにかく自分の手持ちのソフトが誰よりも強くないと気が済まない承認欲求の塊だね まふは自分がパラメータ調整した自慢の探索よりdolphinが強いとなると自分のを使わずにすぐdolphinを使っているし
それで自分のが一番強いって話なのでやることが汚ないよね 公開していない話は何とでも書けるからね、公開しないことには誰も信用しない
嘘をついて自分が優秀な人物だと認めてもらいたい人間は世の中いくらでもいる 個人への誹謗中傷はともかく、批判はあってもいいと思う
じゃあ、お前はプロの棋士より強いんかとか言われたら、何も言えなくなるw まふの最新評価関数→存在価値ゼロ(誰も使えないし第三者による検証がされていない) 公開ソフトのパラメータ調整弄って強くなったとかどうでもいいわ
それで汎用的な知見が得られるならともかく、日々陳腐化してるソフトの最適化してどうすんの >>475
作れたよwww公開しないけどwww
って返されるだけだろそれ >>472
現時点では>>356だと思うが2週間ぐらい待つ手もある まふの将棋ソフト開発作業メモをみてもらえれば分かるがillaha1.1よりまふ評価関数は弱いので一番勝率が高くなるノード数を探って検証しているのが分かると思う
やれ設定ミスって負け越したとかいろいろ時間稼ぎをして言い訳しているが、結局まふ評価関数がillaha1.1より強くないことが見て取れる まふ評価関数がkai2より数千万程度の追加学習程度なので強くてもせいぜいnn20180803mafuよりR+20〜30程度だろう × nn20180803mafu
〇 nn20180608mafu 誰かに迷惑かけてるってことでもないし、好きにやってもらったらいいんじゃないの
しかしillqhaの人にコンタクト取ったのはさすがに草 まふさんって、その時の目立ってる誰かにすり寄って嫌わてる印象がある
こないだの大会後も大賀さんに苦言されてたし
でもnnueを強くさせたのも事実だから人間性に難あるほうが開発者らしいとも言えるけど >>476
Googleさんの誹謗中傷は止めて下さい ソースコード1行も書かない開発者気取り
ソースコード1行も書かない協力者気取り
ここの人達とと似たようなもん 1位 絶芸(中) (Tencent)
2位 星陣囲碁(中) (???)
3位 ELFOpenGo(米) (Facebook)
4位 AQ(日) (山口 祐)
パル山さん準決5番勝負進出おめでとー 棋神は日本でやってるトップソフトじゃない大会でも優勝できなかった >>495
大資本に個人で挑み奮戦とかカッコよいな ところで、今度発売予定の『将棋神 やねうら王』って、
コンピュータ同士、たとえば、やねうら王vstanuki-SDT5版の対局をさせること可能なの?
紹介ページにはその点に触れてないけど、『激指14』や『将棋所』では当たり前の機能だったので、
ちょっと気になってる。
自分としては、強すぎるプログラムと対局するよりも、コンピュータ同士の対局、駒落ち戦などをじっくり
観戦して楽しみたい!! やねさんのブログで質問したら100%返答してくれるので、そっちで質問したらいい 中将 @C4i1ooxS0yeReRF
4スレッド1手15秒で illqha 1.1対QQRの対戦中衝撃的な逆転勝ち。
脊尾詰によると49手詰 終盤強いのが魅力的
https://pbs.twimg.com/media/Din6XPLUwAAYhzQ.jpg
設定ミスじゃなかったらこのグラフは凄いな
でもソフトの終盤力を自分の力にすり込むのはトッププロでも難しい上にアマじゃお手上げ〜 >>504
8T/Hash4GBで画像の局面YO4.82/QQRに読ませてみたら、8億ノードくらいまでは先手よしだけど、そこから急転直下で後手勝ちになった
再現性ある結果かは知らん 局面的には詰みがあるから長く読ませれば後手勝ちに変わるは、、、ず
個人的に気になる点は
・QQRがかなり良しと見てる場面でillqhaはそれほど悲観してない
・illqhaのグラフはガタガタしててillqhaも結構勘違いしている? illqha1.1のレートが4300を超えてた
dolphin/illqha1.1 4305
T.N.K./nn20180608mafu 4255
Godwhale5.0.5/QQR 4254 illqha動かんと思ったらEvalDir変えんといかんかったか、初歩的すぎて気づかなかった ようやく、illqha1.1といい勝負ができる評価関数(200局1500万ノード勝率55%)ができたので、
NNUEkai3としてfloodgateに流します
特に違和感のない勝率・差し回しであれば、後ほど公開します もうAperypaqに+100〜150くらいとか進歩早すぎて草生える floodgateみたら普通にdolphinって書いてあった
失礼しました プラス100なら勝率6割くらいだからたいしたことないぞ。
プラス300くらいが当たり前の時期とかあったしなー。 +300が当たり前だったか?
過去ログから転載
SDT2 Apery 3047(5位)
WCSC25 Apery 3154(4位) +107
SDT3 大樹の枝 3250(3位) +96
WCSC26 技巧 3514(2位) +264
SDT4 浮かむ瀬 3654(2位) +140
WCSC27 elmo 3938(1位) +284
SDT5 ぽんぽこ 4071(1位) +133
番外
WCSC27〜SDT5
yaselmo 4051
SDT5
Apery 4117
SDT5〜WCSC28
aperypaq 4181
賞金が出るSDTよりもWCSCの方が伸びてるのは正月休み+冬でパソコンフル回転かな @uuunuuun1
Dolphin/illqha1.1 相当強いのでelmo_wcsc27と対局させてみる。
第一局elmoが勝ったのでどうなるかと思ったけどその後圧倒して59-6。
勝率9割。ついに幻のAlpha zeroの領域に到達。
15:10 - 2018年7月23日 更新しといた
SDT2 Apery 3041(5位)
WCSC25 Apery 3151(4位) +110
SDT3 大樹の枝 3250(3位) +99
WCSC26 技巧 3513(2位) +263
SDT4 浮かむ瀬 3656(2位) +143
WCSC27 elmo 3938(1位) +282
SDT5 ぽんぽこ 4074(1位) +109
WCSC28 Apery 4161(3位) +87
番外
WCSC27〜SDT5
yaselmo 4049
SDT5
Apery 4142
SDT5〜WCSC28
aperypaq 4181
WCSC28
Qzilla9 4199
WCSC28〜
QQR 4254
illqha1.1 4305
出典uuunさんのサイト AlphaZeroと対局したelmoはたしか一手約21億ノード
それを100局となるとAWS使っても再現するのは厳しい >>495
> 2位 星陣囲碁(中) (???)
星陣囲碁(Golaxy)=精華大学(中国の工学系トップ)らしい >>518
5年でR1100以上伸びてるってことか
2000年代後半はもう伸び代そんななさそうな感じだったのに何があったんだ
まあこの伸びじゃあ激指やYSSは置いてかれるわな >510
俺のPC古いから動かないと思ってたら本当に初歩的すぎたわ。thx >>521
いうて00年代後半もYSSの24のレート(2005年に2478、2007年に2765)と、2011年のponanzaのレート(3211)をみると、当時も順調に伸びてたようには見えるけども
http://www.yss-aya.com/24rating.html nnueのkaiシリーズとillqhaシリーズのライバル競争が楽しみ
KPPT等 他の評価関数は置いて行かれたかな?
絵に描いた餅のまふ新評価関数やAlphaZeroは忘れよう NNUEkaiの開発者の方もぜひTwitterでの発信をお願いしたいです >>523
2005〜2007って正にBonanza公開された時で、その時期は学習を見習った他ソフトは伸びただろう
それ以外の時期は激指陣営が言ってたように、年間でR50〜100ずつ順調に伸びてると
年間50〜100では付いて行けないわな >絵に描いた餅のまふ新評価関数やAlphaZero
絵に描いた餅の表現が言い当てていて、ちょっと面白かった SDTトーナメントでチーム5ch ソフト名:名無し名人として
NNUEkaiとillqhaの作者がタッグを組んだら上位ワンちゃんありそう。 NNUEkaiとillqhaって同じ人だと思ってたわ
illqha/dolphinって何がベースの進化形なんでしょうか? まぁ、シボラーでも参加資格があるってことが去年の18号で明らかになったから、
賞金ほしいやつはどんどん参加すればいいんでね? もうプロも解説出来ない領域だよな
激指対ツツカナの解説とか面白かったが 今後もしソフトの競技会があれば例えソフトのレートが5000になっても今まで通りプロの解説はやってほしい
本当に局面を理解して解説出来るかは別としてプロがソフト対局の解説をするのが好きなの人は多いと思う uuunのサイトより
>ソフトレートR3966のJKishi18gouは現在24に参入中ですが、24R4000以上になってもおかしくないのですが、R3100程度のレートにとどまっています。
>1%程度ですがJKishi18gouに勝つユーザーが居るのも不思議です。ある種の攻略法が知られているのでしょうか。
R4000に勝つ人って何?
ソフト指し? ponaがやってたときもソフト指しいたからそうじゃねーの
まあでもあのときはponaがソフトでも圧倒的だったんだっけか >>535
http://www.uuunuuun.com/single-post/2018/03/24/JKishi18gou%E3%81%AE%E3%83%AC%E3%83%BC%E3%83%88%E6%8E%A8%E5%AE%9A
>#加筆訂正
>その後、18号が負けた7局のうち4局の対局相手はソフト指しとして将棋倶楽部24から登録抹消されていることがわかりました。その分を差し引くと18号のレートはR3370からR3530に上昇します。なお、残る3敗のうち1局は対ソフトです。 >>537
7局のうち3局がソフト指しってどんだけだよ
残り2局も怪しいもんだが、ソフト指しじゃなかったら人間もR4000に勝つこともあるのか AlphaZeroとelmoの対戦はノードが増えれば差は開く一方とのことだったが 透の最新作がillqhaに58%
NNUEkai3は公開される前に上回られてしまったw >>541
elmo側のHashがノード数に対して少なすぎるのが原因の可能性とかもあるかも? illqhaの人が成功した学習値などの情報を公開したので早速ハイスぺ陣に追い抜かれ差が広がっているようだね 透は基本一番強い手持ちの評価関数は絶対に公開しないので(過去に公開したものは最新ではなくややレートの低いものばかりだった)、まふと同じで絵に描いた餅だが、
基本一番強いのが出来たらすぐに公開してくれるnnuekaiやillqhaの人に頑張ってもらいたい >>545
そう、口で強い言ってばかりで公開しないですからね
公開してくれる人のが協力してあげたくもなりますしね 透がaperypaqに勝率54%って言ってたwakame1stもuuunuuun氏の計測では総合的なレートはaperypaqと全くの互角だったし、
yaselmoに勝率56%とか言ってたtamoreも有意差がなく互角だったので、ブログに書いてあることはあてにならない 絵に描いた餅評価関数群は結局最後まで世に出ないパターンも多いし
illqhaの作者さんとNNUEkaiの作者さんを応援したい 透はいつも100局しか計測しないで勝率何%で強いのが出来たと自慢しているが、100局で勝率58%でも500局やったらほぼ互角になることも普通にある
対局数を増やしても勝ち越す可能性の方がが高いっていうだけに過ぎない、だから透の計測はやや強いかもっていうレベルでしかない だから実際にuuunuuun氏のレート表と透が計測したレートが一致したことが一度もない
透が事前に計測した方がいつもレートが高く出ている 透さんについての疑問はなんでハイスペなのに100局しかやってないのかということ
100局だと勝率60%は越えないと有意差でない
100局を何セットもしていい成績のデータ出してるんじゃないかと思ってしまうね
ハイスペなんだから500局ぐらいすればいいのにいつも100局 最近ソフト導入したんですが評価値って原局面の評価? >>234
序盤戦型や戦術がコンピュータ将棋の影響を受けて変わっています。 >>242
チェスのエンドゲームや囲碁のヨセは収束しますが、
将棋の終盤は発散しますので
ディープラーニングの効果が効きにくいかもしれません。 >>553
現局面の評価といっていいがどちらが手番かという情報も必要。
そのうちみてればわかるがソフト最善手を指しても評価値は
下がることはしょっちゅうあるよ。 ロクに計測もしないで公開するまふさんよりは大分マシ
でもまあ100局は少なすぎ あと2週間位したらillqha2が公開されるようなので
作者が言っているようにillqha1.1の計測等は
ほどほどにしておいたほうがいいと思う なんか怖いわ
透さんが急に出てきたわけでもなく地道にブログで作業書いてきたのに結果が出たら貶す発言ばっかり
uuunuuunさんがレートのっけない時はびびってるとか口汚く罵ってたしNNUEkaiの人でしょ
illqhさんもTwitterでリツイートしまくってたのにダンマリ
結局自分が一番で他は認めないのはまふさんと一緒なんだなあ 有意差のない評価関数ばかり公開してきた透はもう不要だろ、過去に有意差があるのが公開されたことが一度もないんだが
100局の計測では有意差のあるものを作るのは無理だろ >>560
uuunさんはなんらかのアカウント持ってる人じゃないと測らないと言ってる
NNUEkaiの人は強い評価関数ができたらtwitterのアカウント作って測ってもらうといっているのになんでNNUEkaiの人が「uuunさんをびびってる」って言ったなんて勘違いした?
NNUEkaiの人は納得する評価関数ができてないから、測ってもらおうという気がまだないからなのに 透が作ったものは強くないものばかりなんだが(uuunuuun氏のレート表より)
YO4.82/aperypaq R4176
YO4.82/wakame1st R4176 ワッチョイ bf1b-zNEp = 透
たまらず自演 俺まったくのど素人だが、透の作った評価関数と同程度のものなんてたくさん作れたわ 公開もせず自慢するのが好きな透の評価関数はどうでもいい、誰も使えないものがいくらレートが上がろうが皆興味ないだろ
今後は公開主義のnnuekaiやillqhaの人に期待している 実際にブログで自慢しているほどレートが上がっていたことは過去に一度もないが × 実際にブログで自慢しているほどレートが上がっていたことは過去に一度もないが
〇 透は実際にブログで自慢しているほどレートが上がっていたことは過去に一度もないが NNUEkai3をアップロードします。お暇な方は使ってみてください
https://www.axfc.net/u/3923889
今回、depth12で教師を作成しましたが、思ったより芳しくなかったです
生成コマンドは
GW3.exe threads 32 , BookMoves 0 , BookDepthLimit 0 , BookFile user_book1.db , evaldir eval , gensfen depth 12
loop 100000000 random_move_count 4 random_move_minply 8 random_move_maxply 15 random_multi_pv 7 write_minply 16 write_maxply 200 eval_limit 5000
のとおりでしたが、ランダムムーブを入れたのが良くなかった可能性があります 公開主義って意味が分からないけど身内には配布してるみたいだし開発者でもない個人のブログをわざわざ見て文句つけてるのおかしいと思わないの?
uuunuuunさんが検証してるんだから見てくればいいのに
あとyaselmoより強いってrereでしょ
よく分からないマウントの取り合い怖いよ >>570
この評価関数?はなにのエンジン使用が一番最適ですか?
やねうら王エンジンとか色々ありますよね? ワッチョイ bf1b-zNEp はやっぱ透の自演だな
必ず食いついてくるからな 透の評価関数がillqha1.1に勝率何%とか公開もせず自慢しているから目障りでしかないわ
早く消えてくれ >>573
自分はdolphinでfloodgateに流してましたが、どの探索が一番よいのかはわかりません >>570
ちょっと試してみたけど前回のkai2より強くなっている
と実感できなかった。
https://i.imgur.com/ynHildS.png >>579
illqha1.1付属のDolphinを使わないのはなぜ? 最低で100戦 できれば300 400ないと判断できない 100回以上で、Dolphin勝ち越してます
1秒対戦ですが >>581
DolphinとGW3で対戦させたらGW3の方が勝ち越したからですw うーむ、強くなっていないという報告が多いですか
学習実験→対局を何度も繰り返していると、時々統計的な神引きをしてしまい、
勝率が高い関数が出来たと勘違いしてしまうことがありますが、今回はそれだったのかもしれません
(交差エントロピーとmove accuracyの値の推移はとても良かったのですが…残念)
今後、関数を公開する際は、必ず、300局以上の結果について、棋譜を添付して公開することとします、失礼いたしました >>582
あなたが試した実績からの発言ですか?
私は10戦ぐらいで判断可能とみています。
7勝3敗とかの数値が出れば明らかに力の差があると
思わざるを得ません。 10局 7勝 3敗
相対イロレーティング: 147.19071411783773
標準誤差: 130.0245000008875
95% 信頼区間 [-70.43650362227247, 381.69700377572997] >>585
人間の棋譜を学習してた頃は弱かったが、今は自己学習だから格段に強くなった >>586
Kai2とKai3との対戦はやったのでしょうか?
なおGW505 QQRとillqha1.1との対戦結果からみると
Kai2はillqha1.1より若干落ちるという評価です。
Kai2はillqhaとの直接対決は互角だがQQRとの対決
はillqhaは10勝0敗とかいうとんでもない結果を出したので。
Kai2は7勝3敗でした。 10局で7勝3敗なんて、下手すれば次の10局で並ぶかひっくり返るよ。
自分は基本的に2秒で100局。場合によっては片方が55勝以上した時点で打ち切りも。
そのうえで勝率が55%とか60%を超えていれば有意差があると思っている。
あくまでも自分のところの低CPUの貧環境だけど。 >>587
統計学上、7勝3敗がどのような意味を持つかは、>>407のサイトで見てみるといいですよ
信頼区間95%の最低勝率が0.5を超えている場合に、有意に強いと判断するのが一般的でしょうか
10局7勝3敗だと、
95% 信頼区間 [0.4, 0.9]となり、最低勝率が0.4となっているので、統計学上、有意に強いとはいえません
ちなみに、100局70勝30敗だと、
95% 信頼区間 [0.61, 0.78]となり、有意に強いといえると考えるのが一般的です >>586
「強いのができたかも」ってレベルで気楽に公開したらいいと思うよ
みんながこぞって検証してくれるんだし、自分だけで検証してるよりいいでしょ
ただ「強いのができた」って言ってるだけより、よっぽど良い Kai3をillqha1.1とdolphinで対局させてる
今は空いてるPCが一台なので、5秒(ノード2000〜2500万)で対局です
で、流石に10局で判断は難しいかな
それなら当方では6-5でKai3が勝ち越してるし >>596
私が言っているのは10局の勝敗で7勝以上勝ったとしたら
最終的に互角以上の可能性が高いということです。 >>597
> >>596
> 私が言っているのは10局の勝敗で7勝以上勝ったとしたら
> 最終的に互角以上の可能性が高いということです。
今ちょっと統計学的なことを調べたら10局だと間違いの可能性はあるみたいですね。
20局だとほぼなさそうです。
100局 70勝 30敗
勝率: 0.7
標準誤差: 0.04617336564981453
95% 信頼区間 [0.61, 0.78]
-----------------------------------------
50局 35勝 15敗
勝率: 0.7
標準誤差: 0.06580195215353793
95% 信頼区間 [0.58, 0.82]
----------------------
20局 14勝 6敗
勝率: 0.7
標準誤差: 0.10654272078068662
95% 信頼区間 [0.5, 0.9]
----------------
10局 7勝 3敗
勝率: 0.7
標準誤差: 0.15718104959867515
95% 信頼区間 [0.4, 0.9] ← まれに勝率0.4のケースが生じるということみたいだ・・・ >>591
ちなみにKai2とKai3との対戦結果はKai3の方が若干上でした!
https://i.imgur.com/2Aq7QDr.png >>597
経験上との事ですが当方の経験上では>>593の感じですね
100局でも少なく感じてます
後、ソフト初期の頃は一手1秒(数百万ノード)でやる場合も多かったのですが、測定サイトの基準での1500万ノード以上は納得はできます(多いに越したことはないですけど)
今は各種データが集まってから判断する事が大切かなと 95%信頼区間ですら5%で裏切られるってことだぞ。色々なソフトを20回戦わせたら1回くらい裏切られる。
95%で有意差と論ずる風潮すら疑問だわ。
やねのテストとかみれば1000以上を基本にしてると分かる たくさんやっても長時間対決だとわからんのは同じだから適当でいいやろ エンジンと評価関数の相性が大事
新しい評価関数が出来上がったらDittoで毎回最適値を探り直した方がいい >>602
95%を有意水準とするのは一般的だし、そういう人が多いのもまあわかる
もちろん分野によっては99%だったりする
コンピュータ将棋みたいな、誰でも何セットでも実施可能なものについて95%を使う意味はないね。検定の多重性問題を無視してる
ただソフト開発する上では有意水準はそんな重要じゃないと思うわ。開発効率のが重要 >>594
>>595
半年ぐらい前にそれやって混乱起こったのもう忘れたのか >>584
対GW505 QQRとの対戦成績の比較もした? このスレに10戦で優劣つけようとしてる人がいることにびっくり
ツイッター見てても最近あきらかにコンピュータ将棋はじめましての人がまた増えてきた印象
高校数学の「確率分布と統計的な推測」おさわりしたほうがいい
大学入試でもあんまり重要視されてこなかった単元のため、理系大卒でもほとんどさわらずに社会人になってる人いるから 1.96と2.58にピンッとこなかったら数学学び直ししてください 二戦二勝した名人に100回やって100回勝つって発言をしておきながら
二戦二敗したelmoに本来起こりえない僅かな確率の事象が起こったって話すのは
統計的にどうですか? >>606
nnueはKPPTと違ってキメラができない以上、あの時ほどの乱立はないでしょ >>539
この間県大会準優勝の高校生アマがソフト指ししてないのに認定されてbanされてたな
そろそろソフト指し認定法も限界なんじゃないか?
だからプロ棋士には連絡してくれって言ってるわけで。 nnueは終盤強いと思うけど、mate読み切るのは比較的遅い気がする
まあmate読み切れなくても大優勢だから勝敗にはほぼ関係ないんだけど >>615
将棋のGUIの表示 +mateとか+詰は詰将棋の詰ではなく
寄り筋とか必勝の意味なので表示を変えるべき nnueが終盤強いのは単にKPPTに比べてノード数の落ち込みが少ないってことじゃないのかな
自分のPC環境ではKPPTが序盤から終盤に7000万ノード下がるのに対して、nnueが4千万ノードしか下がっていない
終盤で3000万ノードも差がついたらnnueの逆転勝ちも当然ではないだろうか すまぬ一桁間違っていた
× 7000万ノード下がる
〇 700万ノード下がる 一応kai3とillqha1.1の対局が100局程になったので結果報告です
エンジンはdolphinで一手のノード数は約2000〜2500万
Kai3から見て39勝46敗分け15でした >>619
引き分け15って凄いな
将棋ももうそういう領域なわけ?
そう言えば山下さんだかはR4500くらいが限界点だって言ってたな
アルファゼロもそのくらいだし 過去にはevalShareで実質同じ評価関数同士の対局になってたケースもあったな
評価関数が近いと引き分けが多くなる elmoに対してはNNUEkai3よりillqha1.1の方が強かった
一手12秒 定跡なし 2スレ Hash512 投了値1000
illqha1.1-dolphin 10-0 elmo_wcsc27_Y4.74_AVX2
NNUEkai3-dolphin 8-2 elmo_wcsc27_Y4.74_AVX2 elmoに対する勝率から総合的なレートはnnuekai3よりillqha1.1の方が上だと思う >>620
やねはレーティング20000くらいが将棋の神様だって言ってたけどね 1手3秒 6スレッド 200戦 探索部 dolphin
illqha 1.1 NNUE kai3
103 - 12 - 85 約15万ノードのNNUEにやっと勝った
低ノードだと無謀な角打ち込みで必勝になるからあんまり勝った気がしない このスレにNNUEkai3とillqha1.1の対局結果を投稿した人の情報をまとめてみた
有意差は勝率53% 752局、勝率54% 423局必要で以下有意差は出てないけど、
illqha1.1の方が勝ち越していてやや強い感じがする
>>619 の人の計測
>エンジンはdolphinで一手のノード数は約2000〜2500万
>Kai3から見て39勝46敗分け15でした
illqha1.1の勝率53.5% R+24
>>626 の人の計測
>1手3秒 6スレッド 200戦 探索部 dolphin
>illqha 1.1 NNUE kai3 103 - 12 - 85
illqha1.1の勝率54.5% R+31
>>622 の計測
>一手12秒 定跡なし 2スレ Hash512 投了値1000
>illqha1.1-dolphin 10-0 elmo_wcsc27_Y4.74_AVX2
>NNUEkai3-dolphin 8-2 elmo_wcsc27_Y4.74_AVX2 SDTはレーティングはあまり関係ないんだな
勝敗はアンチコンピュータ戦略の出来で決まる >アンチコンピュータ戦略
って定跡+時間攻めのことか?だとしたらその言い方はおかしいだろ
強くなればなるほど序盤定跡が大切になるのは人間もコンピュータも同じ
手を抜くほうがおかしい やねチルばっかだから似通った探索と評価関数なんで
同系ソフトに対して勝率上げてる対策いれたらSDTは勝ちやすいけど
別系統のソフトをまぜたレーティングは変わらないってことでしょ ドルフィンは振り飛車にしてもそこまでマイナス評価にならんね 今までは自戦記用にマイボナで検討してkifu for winで保存してってやってたが、
将棋GUIは1枚でこの2役できて便利だな……
今までありがとうございましたマイボナとKfW >>587
こういう人が真面目に話してて且つ中高生以上だったら戦慄する >>630
>強くなればなるほど序盤定跡が大切になるのは人間もコンピュータも同じ
>手を抜くほうがおかしい
別に強くなろうが序盤定跡がどうだとかかわらん
そんなもんに手をかける方がおかしい 単純に言えば25回やって75%以上勝率があれば誤差20%だから強いと言えそうだが 相変わらず検証検証頑張ってるな
俺も一時期だけハマってたけどあんまり意味ないぞ。開発者以外が検証に注力するのは時間の無駄
大会数日後には「これ使っとけば大体最先端だな」ってソフトが判明してるじゃん?
ずっと検証ばっかしてる暇があったら、その時間でまぁまぁ最先端ソフトを使って将棋自体を楽しんだ方が遥かに有意義
WCSC26だったら技巧、SDT4は浮かむ瀬、WCSC27は検討用だったら魔女エンジンelmoが良さそうだったかな
SDT5はやねエンジンApery、WCSC28は鯨エンジンの鯨
それくらいで充分トップクラスだし、ソフト採用の為にほぼ無意味な検証に時間を使うよりもよほど将棋を楽しめる >>637
そうとも限らんぞ
将棋自体を楽しむ気はなくて検証が趣味なのかもしれんし 何一つスキルを持ってない人間でもダウンロード→ポチポチクリックするだけで
なんとなく気分だけ将棋界最高峰気取り
こういう事に充実感を覚える人は多いからね 楽しいんだからいいじゃない
出てこないソフトよりずっといい illqha1.1-dolphin よりも Kai3-dolphin よりも、
0611-whale3 が強いんだが、
誰か詳しい人、有意差がでるまで検証してくれまいか? >>642
自分が検証した結果を出して頼むべき話だ‼ 言い出しっぺの法則に従い検証してみました。
先手:0611-whale3 後手:KAI3-dolphin 6-4-0
先手:KAI3-dolphin 後手:0611-whale3 2-7-1
合計:13-6-1
ぎりぎり有意差無しになるのかな? >>645
>>622と同じ様な設定でelmoに10戦全勝出来たら
強さを認めてもいいと思う 検証続き
先手:0611-whale3 後手:illqha1.1-dolphin 7-3-0
先手:illqha1.1-dolphin 後手:0611-whale3 3-7-0
これは有意差でてる。
>>599 によると、20戦 7割 で信頼できるはず? 探索部は結局1手にそこそこ時間をかけて読んだとき何が強いかよくわからないんだよね。
whale3よりgodwhaleのNNUE版のほうが強いって意見もあったし 文句ばっか言ってるのに、俺の測定何千万ノードで、何対何とか棋譜もないのによう信用できるな。
気になった事があったから推理したが
まふ、嘘ついてる確信み〜つけた。
あいつ引き分け全く無い=自分のほうだけ定跡使用で、計測時間短縮して勝率を稼いでる。
だから、新手だらけと言い棋譜が出ないでFA
他にも嘘ついてるだろうけどな。 初心者みたいな質問で申し訳ないんですが、スマホでillqha評価関数を使う場合、探索部はスマホ版やねうら王4.82で良いんでしょうか?
whale6やdolphinのスマホ版は無いんですかね? >>648
将棋所のページのUSIエンジンのリンクから
elmoをクリック>>elmo導入方法をクリック>>
4.elmoをダウンロードしますをクリック PC放置して100戦するまで待てばいいのになんで10や20で慌てるかね 計測することが目的なんじゃなくて自分に注目集めたいだけなんじゃない
「見て見てこんなことやったよ」みたいな感じ
まふとかもそういうタイプだよね >>647
俺がやったら5勝5敗だった。
これから寝るのでさらに20対戦の連続実行をセットして寝る。
2秒対戦結果
https://i.imgur.com/chvgceZ.png 大分前に初代NNUEkaiの公開直後にwhale3で計測してた
NNUEkaiの勝率61%でやや強いと思っていたので0611から変えてNNUEkaiを今まで使ってた
NNUEkai-whale3 11-2 -7 nn20180611-whale3
持ち時間5分 一手ごとの加算20秒 定跡なし スレッド2 Hash1024 投了値1000 同じく初代NNUEkaiの公開直後に計測していたやつ
NNUEkaiも0611(両方whale3使用)もelmoには10戦全勝出来なかった、出来たのはillqha1.1-dolphinだけだった
NNUEkai-whale3 11-2-7 nn20180608-whale3 勝率61%
持ち時間5分 一手ごとの加算20秒 定跡なし スレッド2 Hash1024 投了値1000
NNUEkai-whale3 12-2-5 QQR-GW5.0.5 勝率70%
持ち時間5分 一手ごとの加算10秒 定跡なし スレッド4 Hash256 投了値1000
NNUEkai-whale3 8-2 elmo_wcsc27_Y4.74_AVX2 勝率80%
持ち時間5分 一手ごとの加算10秒 定跡なし スレッド4 Hash512 投了値1000
nn20180611-whale3 15-4-12 nn20180608-whale3 勝率55%
持ち時間5分 一手ごとの加算20秒 定跡なし スレッド2 Hash1024 投了値1000
nn20180611-whale3 18-2 elmo_wcsc27_Y4.74_AVX2 勝率90%
持ち時間5分 一手ごとの加算10秒 定跡なし スレッド4 Hash1024 投了値1000 >>657
そんな少ない対戦数どうでもいいわ
200局以上やってから書き込めや >>658
そんな15時間以上かかることをあなたはできるのですか?
200局とは1局5分設定だと1000分・・・17時間ですよ。
そして経験すればわかるけど10局でだいたい傾向は掴めるのです。
因みに0611はillqha1.1とは20局やっても互角にちかかったです。
細かいところで条件がいろいろ違った場合に大きく差が出るケースも
あるかもしれません。いろんな方がいろんな設定で10局程度やることで
傾向がつかめるんだから私は否定すべきではないと思います。 で、でた〜www
勝率7割のソフトは10戦で7勝3敗と考え奴〜wwwww それよりも2スレってのが気になる
化石PCでも使ってんのかね illpha1.1ですらelmoに3連敗することもある10局で傾向がつかめる訳がない 10局、勝率0.5のシミュレーションを経験すればわかるけど
10セットやれば8-2、2-8以上はよく出る
100セットやれば9-1、1-9以上はよく出る
それは感覚として覚えておくといいと思うぜ
100セットというのは10人が10個の評価関数を検証したとき
つまらない結果が出たときは黙殺して面白い結果が出たときに騒ぎ立てるとした時
誰かが騒ぐことは割とあるということだ >>662
あなたの物言いはおかしいですよ。
10局で傾向がつかめないという根拠として3連敗がありうるという
話になってますw
一体どんな頻度で3連敗が出てくるんでしょw
単純に2分の1の確率で3連敗は12.5%です。
勝率5割 0.125
勝率4割 0.64
勝率3割 0.027
勝率2割 0.008 なるほど
一人が100局やるよりも10人が10局やる方が効率的だし楽だな >>664
elmoに勝率9割程度のillqhaでも10局単位だと3連敗することがあったんですよ。
このときelmoに10局で勝率70%という結果が得られてどうやってillqhaは他のソフトより強いという傾向がつかめるんですか?
例えばAperySDT5とelmoを10局対局されて同じくelmoに勝率70%だったらどう判断するんですか? >>659
・真に強弱のあるソフトでの10戦で得た傾向は、未知のソフトの10戦について何も説明できません
・傾向なんて言葉は使わず、統計で定量的に説明しましょう
・p0.05とか0.01という有意水準に拘る必要はないですが、万人に納得してもらうにはフォーマットに従いましょう
・セットを繰り返し行う(もしくは結果を見て繰り返すか決める)のは、むしろ検定の信頼性を損なう行為です
・そもそも不特定多数が実施でき、組み合わせも多種多様な時点で、潜在的な検定の多重性を考慮しなければいけない案件です
・結果報告は任意なので、本当の実験であっても良い結果のみを恣意的に公表できる(=信頼されにくい)環境ということを認識しましょう >>663
EXCELでシミュレーションしたところ勝率0.5だと
おっしゃる通りだけど、勝率0.7でやると下記の
確率分布に従うよw
10局 7勝 3敗
勝率: 0.7
標準誤差: 0.15718104959867515
95% 信頼区間 [0.4, 0.9]
10回戦単位で、勝ち数が4以下の出現数を調べました。
その作業を10回繰り返して負け越しの頻度は6回でした。
つまり勝率7割の棋士が10回戦毎に区切って負け越す
頻度は100回やって6回しかないということです!
勝ち 1 2 3 4 5 6 7 8 9 10
0 0 2 0 0 2 0 0 2 1 Excelなんか使わなくても二項分布知ってれば一発なんだがこんな事も知らんのかな 663の方がいいサジェスチョンをくれたのでエクセルでシミュレーションした
ら勝率7割と勝率8割では段違いに結果が違ってくるのが分かった。
藤井聡太君がこのまま勝率8割を維持できたらとんでもない結果が生じる
と思います。
勝率8割だと10連勝が良く出現しますw >>669
何が一発なんでしょうか?
負け越しの確率を一発で計算できるということですか? >>668
あんたは帰無仮説を理解ができていないんだなってのがよくわかった
実際には真の勝率は未知であり、試行を繰り返して得られるのはその推定値でしかない
その推定値の信頼性を定量化するのがt値等であって、
真の勝率が7割であると「わかっている」時、負け越す確率が何%かなんてのは意味がないんだよ 10局とかで書き込むなよ。17時間ならすぐだろ。
それがつらいなら持ち時間減らせばいいし、もっといいPC買ってスレッド数増やせ。
計算能力が2倍になれば同じ計算は半分の時間で済む。 >>672
その考え方にたどり着く一歩ではあるのでは。
10戦して7勝3敗だったとき、
真の勝率が1割、2割、……9割のソフトが
運良くまたは運悪くその結果になった
可能性があって、
7勝3敗はその重ね合わせを見ているとも言える。
ただ1割2割のソフトがめっちゃ運良くその結果を出すと言うことは滅多にないとは言えるだろうと。
しかし勝率4割のソフトが7勝3敗を気合いで出してくるのは少なからずあり得て、
7勝3敗はその結果をみている可能性が少なくなく、である以上はどっちが強いかわからんと。 勝率2割が7-3は稀によくある
計測は自由にしたらいいじゃない。それをどう判断するかは人それぞれ キメラが乱立した去年でも10戦で優劣つけようとした人なんて居なかったのに ってかさ、1000局やっても定跡オフでランダムでも無い場合結構同一局面多いのでは? 定跡オフでの検証は時代の流れに左右されない一つの答えだけどねぇ
ある時点のあるソフトで作成した定跡・互角局面集は本当に互角かという話になる 定跡なしだと戦型はかなり固定されるのは事実だけど
全く同じ勝ちパターンを繰り返すってのは少ない印象 むしろfloodgateの技巧2の定跡なんかの方が同一パターンの負けを繰り返しているのをよく見かけるから
あれなんとかしてほしい >>680
なんで検証の話してる時にfloodgateのgikou2_1cの話をしているの? 下手な定跡つかってそれにハマり形含まれてたら嫌ということでは ハマることもあるけど、
数を重ねれば基本的には定跡でトータルの勝率は上がってるイメージだけどね 100局セットして50戦目まで33勝14敗3分だったソフトが100戦後には49勝45敗6分だったことがある
そのソフトは後半に9連敗と5連敗を経験していた
前半50戦で見れば勝率70%だが後半50戦では勝率30%だ
10戦やって9-1だったソフトが100戦後には有意差なしなんてこともままある
あと17時間でできる連続対局はまだ可愛いほうだろ
寝る前にセットして仕事から戻ってきたときには終わってる >>684
ホントに100局対決したくなるようなソフトの力量さ
がない時点ではその場で判断できる局数で十分と考える方が普通だよ。
普通のノートパソコンで連続対局してるとその間他のこと出来なくなるから。
そしてこれまで10局ぐらいで新しく出てきたソフトの強弱はすべてあたってたからねw 他の事に使えないと困るのは、あなたの都合にすぎない。ただの言い訳。
その言い訳つけて、いい加減に計測した結果を得意げに語られても、
統計的には全く信用できないし、それに引っ張られて判断誤る事になる。
ただの自己満足で、他人に迷惑かけるなって事言われてるの、わかってる? 春も秋も一発勝負
そして強いソフトは一発勝負でもやはり結果を出していることが多い
細かいところはともかく10局でだいたいわかるというのはあながち的外れじゃないかもね
16年のポナ、17年elmo、18年pal,白ビールちょくちょく落としてはいたが全体的に強かった >>688
河童がレート高いのに順位振るわないことが多いぞ そんなに必死に否定しなくても
10局検証した人には「あっそ」
100局検証した人には「へー、そうなんだ」
500局検証した人には「マジかー、そうなると今度はアレvsアレもやってみるといいかも。俺はこっちを検証してみる」
みたいなレスをやってたら自然と淘汰されるだろう >>690の言う通りで10局でどうのって人に真面目に返さなくていいと思うけど
ふーん、じゃあそのまま100局くらいやってねってなふうに 10局の検証だってないよりはマシだしな
淘汰するより利用してやれ >>689
河童はuuun氏基準の1500万ノードでは強いが、競技会では一手数億ノードも上がったりするので、
河童絞りが他の参加ソフトより高ノード(長時間)でやや弱いから順位が振るわないってことはないのかな
同じelmo絞りでも1500万ノード基準で検証している人と(河童さんがいくらのノード数で検証しているかは知らないが)、
elmoの瀧澤さんのように一手20秒(去年のTwitterで見た)で検証している人の差が出ているのかも 条件がそろっていない10局を幾ら集めても意味なし。 >>693
そういうことなんじゃないかな
あとは後手番引きすぎなのがね・・・ >>693
WCSC後にQhapaqの人も「河童絞りは長時間だと強くないのでは」と疑問抱いたけど
「長時間計測だと対河童系が一番結果悪かった」って白ビールの人がいってたから長時間弱い説は否定された >>696
評価関数は相性問題があるので白ビールだけだと単に河童との相性が悪かっただけの可能性は否定できないんじゃないのかな
3つ4つの他のソフトとの検証がないと河童が本当に長時間も強いとは言えないんじゃないだろうか >>697
白ビールのチームは評価関数いくつも用意してたみたいだし、相性問題についても問題なさそうでは 感覚的には「一発勝負の大会で成績振るわないから」を根拠に推論する方が筋悪く思う >>693
それは有り得るね
昔、技巧2とか魔女の時代の頃、1手5秒10秒の対局アホみたいにやってたことあるけど、
uuunさんのところどころか、自分でやってた1手1秒の結果とはかなり違くて、
(R差が違うくらいじゃなくて、100差くらいだと逆転してたりもする)
結局、自分で計測すること自体やめたw
あと河童さんは大会だと定跡段階でやられたりしてた気がする なんでそんなに偉そうなこと言うのか理解できない。
コンピュータソフトのどれが一番強いのかを議論しているわけだから
10戦ぐらいで結論づけてまちがっているのなら他の人が逆の結果を
出せばいいことだけじゃないか。結局今回のillqha1.1は、ここで公開して
すぐに検証した結果強そうな結果が出たから最終的には
「uuunuuun」氏は採用せざるを得なくなったわけです。当初は素性の知れぬ
物は無視していましたがこのスレで次々と対戦実績が出てきたので無視
できなくなったんじゃないかな?
===
686 名前:名無し名人 (ワッチョイ 4b8a-kTp/)[sage] 投稿日:2018/07/28(土) 15:55:05.73 ID:JzHAJahw0 [1/2]
他の事に使えないと困るのは、あなたの都合にすぎない。ただの言い訳。
その言い訳つけて、いい加減に計測した結果を得意げに語られても、
統計的には全く信用できないし、それに引っ張られて判断誤る事になる。
ただの自己満足で、他人に迷惑かけるなって事言われてるの、わかってる?
⇒何が迷惑なのかさっぱりわからんw
687 名前:名無し名人 (ワッチョイ 3761-kCGC)[sage] 投稿日:2018/07/28(土) 15:57:25.10 ID:xpwC+5oz0
統計を根本からわかってない人はいるんだよなあ
⇒統計を根本から分かってたらどういう判断になるんですか?
すべて統計的にはデータ量が不足しているので判断はできませんですってか?
つまんないやつだな! キメラ乱立した時に対して強くないソフトが強いとされた時期があった
10局で判断できるというあなたの経験則よりもコンピュータ将棋の歴史と数学を大事にしたい もしもX手までまったく同じ棋譜があったらその棋譜はまとめて一つ扱いにするってのはあってもいいかな
Xをいくつにするかはどれくらい同一棋譜があるのか調査して決めて グダグダ長文考えてる間に一手一秒でも100局回したほうが
話を聞いてもらえるだろうなあ 10局で大丈夫みたいな学術的な理解とかけ離れた事言ってるもんだから
みんな自然と口調が偉そうになってしまうのよ 単純に公開した作者の立場に立てば良いのでは
10局では有難うございますレベルかな
数百局以上なら作者もそれなりに参考出来ると思う 恣意的に抽出した10局出されたりしたら無意味だしな
10局評価とかスルー安定 >>706
ホントにこんなものいいしか言えないやつが多すぎていやになる。
少しはリアルな世界と同じような会話をできないのかね?
偉そうな話しぶりにはうんざりする。
なんだかハンドル握ると人格変わるようでがっかりです。
将棋のスレッドぐらいは普通のレスをしてほしいもんだ。
========
706 名前:名無し名人 (ワッチョイ 3761-kCGC)[sage] 投稿日:2018/07/28(土) 19:56:53.81 ID:xpwC+5oz0 [2/2]
グダグダ長文考えてる間に一手一秒でも100局回したほうが
話を聞いてもらえるだろうなあ
⇒ 対戦数を1000回して結果に有意があるとか言いたい人だけが頑張って
回したらどうですか? 普通の人はそこまで一生懸命にはならないですよ。 >>688
大会では解説聞きながら1手1手見るやん。
するとレーティングで200くらい差がある対局だと、
なんか手応えや力の差が見えてくることがあるやん。
そういう場合は、極端な話、1局でも見えるものがあると思うよ。 >>709
と言うかそれ目的でやってるんだと思ったわ
持ち上げたいソフトのいいとこ切り取ってやってるもんだと
そしたらまさか本気で10局で足りると主張してくるとは >>710
ここには異常な人しかいないんですよ(将棋ソフトにおいて)
マナーとは共通意識のもとで成り立ちます
10局では少ないという意見が多いなら、それがこのスレ上のマナーです
10局で十分というのはあなたの主観でしかなく、集団上その意見に価値はありません
10局で十分だと言うのはあなたの勝手ですが、それに対する批判は受け止めるべきです 俺の家族がみんなでこの番組見たから視聴率100%(キリッ
って感じなのわかってるのかね。 長時間の10局なら意味あると思うよ
棋譜の価値としての 結局大会は人がやる対局を模したものだからPCソフト大会としては不完全なんだろう
そう言う意味では公開されたソフトのレート順位の方が実力に近いのだろう SDT6は皆NNUE?
KPPTでQQRより強い評価関数出てこないかなー(チラッ) >>710
確率の(独立)事象ってのはランダムで、
ランダムってのは試行回数が少ないとしばしば偏る。
偏らずに均等に結果がでるようなのは
むしろランダムでなく作意がある。
6回に1回だけ6が必ずでるサイコロは、
バランス良いイカサマ賽。
宇宙の星はランダムに配置されている…天の川を除き…といっていいだろうが、
格子点のように均等配置はされていない。
偏って変に配置されるから、我々はそれを星座と認識できる。
かように、ランダムはしばしば偏るという確信があるから、
10回程度で偏った結果を見せられても、
意味のないランダムの偏りなのか、
真の勝率に差がある意味がある偏りなのか、さっぱり、まったく判断つかない。 ttp://lfics81.techblog.jp/confidence_interval_ja.html
少ない対局数のとき、どのくらい幅があるのか一目でわかるので使ってみるといいかと >>712
この数式みて理解できたの?
そこまで数学専攻したとも思えないね。
なんでそんなにえらそうなのかね???
俺にとっては下記のURLのほうが統計学の読みものとしては
よくわかって興味深いものがあるよ。
https://shogi100.com/2018/02/23/012/
「デビューから」という条件を緩和してみます。比較対象として、2018年2月21日現在、
羽生竜王の通算対局数は1962局、勝率71.17%です。この成績をもってしても、
「羽生竜王と同じ勝率の棋士が同じ対局数を戦い、どこかのタイミングで29連勝以上
する確率」は9.6%しかありません。羽生竜王の実際の連勝記録は22連勝です。
対象を全棋士に広げると、棋士数を312(新四段の古森四段の棋士番号)、
通算対局数を730局(全棋士平均)、期待勝率を平均50%及び標準偏差10%だと
仮定すると、「全棋士の中の誰かが、どこかのタイミングで29連勝以上する確率」は
約70%です。
さすがに「全棋士の誰か」が「いつか」29連勝を達成していた確率を考えると、統計学的には実現していてもおかしくはない記録、ということになるようです。やはり真の凄さは「デビューから」という点に集約されますね。 知識不足を指摘され教えてもらっても自分のプライドを守ることにのみ必死な人はどの分野にもいる。
相手しても無駄なんことも明白なので程々に。 統計がどうのって意見してる人で、
「はい、これが統計的に誰もが認めるものだよ」って、
具体的にサンプルを挙げている人がいないね。
建設的な意見をだしましょうよ。
ただくさしてるだけの「能書きは不要」です。
素人の私からしたら、10局だけだろうと、
具体的な物を出してる人の方が参考になるけどなぁ。 少ないノード数の計測でもこんな感じでデータを出せば多くの人が満足するんじゃないかと
対局数:500局
例A勝ち:293
例B勝ち:207
引分け:0
勝率: 0.586
標準誤差: 0.02206055312117165
99% 信頼区間 [0.53, 0.642]
相対イロレーティング: 60.35890995887666
標準誤差: 15.796568050416983
99% 信頼区間 [20.87120466602866, 101.46080056999158] ここでの検証結果なんか10局であろうが1000局であろうがいくらでも盛れるんだから、信頼性はないと思うけどなぁ。
結局は自分でやるか、信頼に値する人がやった検証しか当てにならない。 >>726
例えば数十万の少ないノード数で対局数を稼ぐのは簡単だけど、ノード数が少ないと実際の強さと乖離があると言うので、あるレベルのノード数はいるよねと言うのが今の所かな 素人がこのスレを見る必要あるのか
有名なソフトを使っておけば十分ではないのか
検証不十分なソフト同士の対局というマニアックな分野にわざわざ飛び込もうってんだから
ちょっとした数学知識くらい持ち合わせてほしいところ 自分の不得手な分野に突っ込んでいってこれだけツッコミのレスをもらったにもかかわらず
一向に自分の間違いを認めようとしないその姿勢はすごいと思う 「いいね」がもらえると思ったら、ダメ出しされた。
なぜダメなのか理解できないし、ヒント貰っても理解に努めようともしない。
こういう人という事でしょ。 ここまで自己正当化が凄い人も珍しいな
それはそれで尊敬する。迷惑だけどw えびふらいさんが久々に放送するみたいだけど、
最近彼は何か進展あったの? NNUEの計測ってPCがヤバそう(小学生並みの感想)
KPPTでQQRより強い評価関数出てこないかなー(チラッ) >>669
コンビネーションを暗算できるとか天才かな?
ホラ吹き乙 >>726
だから、そんな感じなのはいいんだけど、
「具体的なデータ」じゃないですよね?それは。
あなたの意見よりも10局でも「具体的なデータ」の方が
建設的な意見だと言ってるんですが、
ここ最近で具体的なデータを挙げている人は、
10局の人と20局の人の二人だけじゃない?
さんざんくさされてるけど、私にとってはその二人の意見の方が
参考になります。
ありがとうございます。頑張ってくださいっていえないのかなぁ? 定期的に変なの湧くけどこの前のときも学生の夏休み時期だったような >>737
「コインを10回投げて7回表でした。経験則的に表が出やすいに違いない」
「7割表が出るコインなら、10回投げて裏が多い確率は6%しかないから検証は10回投げるだけで十分」
「コイン10回投げたデータは有意義。この結果を暫定的に採用して俺に感謝しろ」
頭悪すぎちゃう? >>712
初めて見たけど
単純に勝率pを確率変数とした確率分布から信頼区間出してるのかと思った やねうら王 NNUE型評価関数ビルド V4.82公開しました
投稿日時: 2018年7月29日
キタ――(゚∀゚)――!! やねうら王は従来のものを形式変換しただけでしょ?
えびふらい放送は仕事してて放送しなかったので近況報告のようなものでしょ >>740
あたまわるいのはあなたじゃない?
コインで例えるのが間違ってると思わないの?
コインの表裏の確率に偏りがあるとはだれも考えないし証明もできないでしょ。
だから確率0.5で10回投げてもその結果は二項分布の離散確率分布に従った
結果しか出てこないと思った方がいいんじゃないの? コンピュータ将棋に関係ないことは他でやってくれないかな
頭が悪いと思うならその相手はスルーするのが大人なんだがな
ガキばっかになっちまったな >>742
T.N.K.がそもそもYO4.82を改造して使って、それを少し変えてマージしただけじゃなかったっけ? 無償で公開されたものに悪口言う奴らにはやねさんがゲンコツや! >>744
誰もコインに偏りがあるとは考えないからこそコインで例えてるんだろ?何言ってんだお前
真の勝率がコインと同じように差はないかもしれないのに、それを勝率7割あればほぼ勝ち越すから10回で十分と言い張るのは、
コイン10回投げて7回表が出たから表が出やすいという馬鹿馬鹿しい主張とかわらん
あと非理想的なコインの偏りは統計的な答えを出せるし、
二項分布はp0.5に限った話じゃないので意味不明 俺素人だけど、 (ワッチョイ 32e7-53i4) の言ってることは間違ってると思う。
過去スレにもいたけど、やねうらエンジンの比較で自己対戦して10局で充分とか言ってる奴いたけど、コイツと同一人物だったんだなって思った。 >>749
話を正確にしたいんだけど
俺が主張した内容は以下の通り。
新しく出たソフトに対して10回程度の結果でも7勝3敗という結果が
でれば7勝した方がその時点で強いと決めつけても、そうそう間違いがないということ。
その結果に異議があるのなら違った結果になった人が俺の場合は逆だったよとか
互角だったよとか書き込めばいいだけの話になる。
そうすることによって最初に主張した人ももう一度対戦させて自分の対戦結果が
間違ってたかどうか検証するだけの話になる。
100回以上対戦させた結果じゃないと意味がないという主張こそおかしいといいたい。 >>750
8勝2敗から、200局越えたら勝率50%切ったことあるよ >>748
非理想的なコインの偏りとは何?
回数が増えれば信頼区間の幅が小さくなり統計学的に
有意だという話だけじゃないの?
10回の対戦で95%の信頼区間は0.4−0.9であり、
実際にEXCELでシミュレーションすると実感できるが
10回対戦結果を100回繰り返して負け越すケースは
6、7回しかないんだよw
10局 7勝 3敗
勝率: 0.7
標準誤差: 0.15718104959867515
95% 信頼区間 [0.4, 0.9] >>751
統計学的には95%の信頼区間外の現象が生じたということじゃないの?
8 wins / 10 games
WP: 0.8
SE: 0.13719886811400706
95% CI [0.6, 1]
ELO: 240.823996531185
SE: 148.96177836321317
95% CI [70.43650362227247, 1e+308] 10局ガイジに構うのはもうやめとけって
なに言っても聞くきがないんだからさ まあ10っていうのは普通の人にとってみればかなり大きい数字だからね
確率だかなんか難しい学問やってこなかった場合それで十分と思うのは無理もないと思う キメラが大量発生した時は開幕9連勝から負け越しは俺も経験した。
ずっと検証してりゃそれくらいはあるんだよ。
普通じゃない主張をしてるという自覚は持ってほしい 順位戦だってたった10戦だしタイトル戦の結果だって全く意味ないよな ドサクサに紛れて経験上どうだとか嘘つくやつが多いな 少ない対局数だったり極端に短時間だったりする結果から強そう弱そうと予測するのは個人の自由
他人にそれを強要するからおかしくなる
10局やって全勝したら強そうと思うのは普通の感覚
じゃあ8勝2敗の他の結果と比べて全勝の結果が圧倒的に優れているかとなると謎、だから対局数を増やす 誰も定量的に議論してなくて草
俺の計算だと10局中7勝の場合
7勝側の真の勝率が50%切る確率は11%くらい モンティ・ホールとか条件付き確率の問題苦手そう。
https://bellcurve.jp/statistics/course/6448.html
事前確率がわかってないので、条件付き確率よりさらにわかりにくい問題ではある。 「髪の毛が一本もない人はハゲである」(前提1)「ハゲの人に髪の毛を一本足してもハゲである」(前提2)
ここで前提1に前提2を繰り返し適用していく(つまりツルッパゲの人に髪の毛を一本ずつ足していく)。そして次の結論を得る。
「よって全ての人はハゲである」(結論) >>763
逆にやったら
全ての人はふっさふさである。 >>759
誰も強要してませんよ。
一つの見解と受け取ればいいだけじゃないですか?
私の経験測では10局やって7勝3敗以上の結果が出れば
強いという判断をするということだけです。もちろん例外は
1割以上あるでしょうけどw
お手軽に新しい評価関数を評価できる方がいいと思ってるだけです。
100局やるとなったらその間ノートパソコンで他の事が出来なくなるから
より少ない対局数で判断したいと思ってるだけです。 一発勝負の大会でも頭抜けて強いソフトはだいたい強かったからな
今回はそういう気配があった白ビールとPALが非公開だから確かめられないけど
技巧、ukamuseとそのパクリの真やねうら王、elmoははっきり強かった 「10局やってそんな結果が出たとは興味深いですね。すごいすごい」
これでOKか? >>742
試してみたけど以前のと変わってないような気がする。
かれこれ3回ぐらいやってるけど一回も勝ち越してないよ。
https://i.imgur.com/OKEzF3A.png >>768
だからそんな風な反応なんか期待してないから!
じゃ自分もやってみてほんとかどうか試してみるってのが期待するレスだよ。 10戦では「どのくらい」強いかはまるでわからない、だから皆価値がないと言うんだと思うよ >>770
「10戦の結果がそんなだったんですね!(統計的にはゴミクズなので)自分で検証してみたいですね!!」
これで大満足だな。 >>769
あれ?イルカの中に入ってるのってそもそもやねうらおうだよな?
ドルフィンとは別なんだっけ? dolphinはソースコードを読めば分かるけど
LMRの条件分岐のコードも細かくチューニングされている
パラメータだけと見せかけて実は結構大掛かりな改造が施してあるね やはりたった10回でどちらがより強いかと言い出すのは早計すぎる
大数の法則だよ、少しでも試行回数が多い方がデータとしての信頼度は高い
たとえ100回やっても大まかな勝率しかわからないと思う
1%単位まで勝率を求めるなら最低でも1000回は必要かな >>766
>一つの見解と受け取ればいいだけじゃないですか?
なら100局は必要という意見も一つの見解と受け取ればいいじゃない
100局必要という人に対して、10局で十分と反論するからより批判されてるのにそれが分かってないのか? >>774
ファイルがやねうらおになってたからてっきりドルフィンの中にやねうらおがそのままはいってるのかと思ったわ >>776
こんなスレを開発者の皆さんが見てるかと思うと恥ずかしいです 10局君はまだまだやな
漏れくらいになると、その10分の1の試行数で十分
しかも5割以上の確率で正しく判断できるw
でも友達は試行すらせずサイコロ振って決めてるから
それに比べればまだまだやけど >>775
実際に1000回やったエビデンスを出せば良いんじゃね? 前にもここに書いたけど、shogi sparkの開発者はアマ強豪の奥村だったんだな。
ソースは朝日杯の中継 ほう
>奥村アマはスマホアプリ「Shogi Spark!」の開発者でもある。将棋ソフト「技巧」を用いて、次の一手問題を自動で生成する。
>奥村アマ自身も日々の練習で使用し、朝日アマのベスト8入りの原動力になったと語っている。 そのアプリ、どれ指しても大差ないような問題とか、取る一手の成と不成が片方だけ正解とかあって、微妙な面はある
アマ強豪の方は文系だと思ってたから同姓同名の別人と思ってた >>778
追加で調べたらdolphinのLMR周りのコード変更はwhale6と同一だった
というかSDT6でのwhaleシリーズのコードの取り扱いハッキリさせないと後で揉めそう
改造箇所からしてStockfish系列ならどんなエンジンにでも流用可能だし べつにやねうら王って改変・再配布って条件付だけど自由じゃなかったっけ?
誰がどう弄って公開しても、それを改変されたくないとか再配布されたくないとかできないんじゃね? >>785
随分とアマ強豪に詳しいんすね
suimonさんですか? >>787
ソフトのライセンスとは別の大会独自のライブラリルールに
引っかかる話だと思われる >>789
あーなるほど
使いたければ皆等しく使えるってほうが面白いと思うけどどうなんだろうね
まあwhale6のコードで長時間でも強くなるのかそもそも謎だけど whaleシリーズは低ノードで強くなるようにパラメータ調整している感じなので、WCSCなどの億単位のノード数ではあまり強くないかも >>785
すーぐ大差無いとか言い出す
だから細かい形や手順の違いが分からずに研究もアバウトなんだよなw アンチsuimonは基地外しかいないな
多分アプリの何も分かってないんだろうけど一応言っておくわ。
とある局面(プロ公式戦?)で候補4つの4択問題で、技巧の評価値が一番いいのが正解。100と99なら100が正解だし、問題の局面によってはどれ指しても-1000とかがあるから、そういう意味で微妙と言った スマホアプリ「Shogi Spark!」が使える使えないの話は別のスレでやってくれ 定跡や差し手の研究家のsuimonさん関連の話題は専門スレのこっちでやってくれ
「suimonユキ_feat.mztn7応援スレッド16」
https://mevius.5ch.net/test/read.cgi/bgame/1530536517/ suimonさんは将棋ソフト開発とは関係ないし、将棋ソフトを使って定跡や差し手の研究をしている立場でしかない
定跡や差し手の研究をしていない一般の将棋ソフト愛好家から見たら興味ないだろ そもそも、ろくに研究できてないし中途半端なただのアマチュアなんだよなw >>793
すぐ開発者の素性を調べてここにレスしてしまうお前も酷いぞw >>791
こういうような短時間と長時間で得手不得手があるなどというのは
理論的な分析はあるんだろうか? >>800
最適な枝刈り方法はどれだけの時間をかけて読むかで変わるという話は随分前からある
極論無限に時間をかけて読めるなら枝刈りなんてなくてもかまわないわけだし >>786
dolphin/whale6のLMR改造部分のうち
「&& type_of(pos.piece_on(to_sq(move))) == ROOK_DRAGON」
ROOK_DRAGONは値としては18なので、必ずfalseになってしまうような気がします。
position.hのvaluable_capture()の「return ( cp == BISHOP_HORSE || cp == ROOK_DRAGON);」は
「return ( cp == W_PAWN || cp == W_LANCE);」と等価なので、意図した動作ではないような気がします。
修正して強くなるか弱くなるかは分かりませんが...
もし間違っていましたらすいません。 >>801
探索変えるのならわからんでもないが
評価関数バイナリ変えたら時間により変わるというのが理屈が謎なんだよなあ >>803
時間が変われば探索で提示される局面が変わって、
局面が変われば当然その評価関数の得手不得手かも変わるからね
でも言えるのは違ってもおかしくないってことだけで、
この評価関数はこういう傾向にあって〜みたいなのは立証できないと思うわ 一手読みに特化した評価関数と普通に何手も先読みさせて使う評価関数では
最適なものはまずそれぞれ違うものになるだろうから
探索深さによっても違って来るんじゃないの 序盤を深く読めば中盤に、中盤を深く読めば終盤になる。
序盤、中盤、終盤で駒の価値や位置関係の価値が変わるのであれば、
読みの深さで向き不向きが出てくる。
技巧2は進行度で評価関数テーブルを切り替えてるので、そこを重視しているようだ。
やね氏は、序盤、中盤、終盤で駒の位置が変わっているので、
(つまりテーブルの違う位置を使うので)1つのテーブルに重ね合わせてもさほど問題ないだろう、
とお考えのようだ。 >>734
就職面接ではいくつか進展があったらしく
未納だった国民年金も1ヶ月分は払ったらしく
めすあざらしと一緒にアイナナのコンサートに行ってるらしく
まあ順調に進捗してるのでは? 生主雇うのって怖いなあ。
仕事の話は禁止にしないと。 えびふらい無職って、親のすねかじって生きてたのか? >>798
大会ではアマ竜王戦の県代表になってるし、本は増刷もかかってるし、
それはそれで過小評価しすぎだろう
なんでこう極端なんだ将棋板は >>809
無職じゃないよw
国民年金の対象、つまりフリーランスで、囲碁・将棋チャンネルとかは嘱託 スレ違い、suimonさんの専門スレがあるので、こっちでやってくれ
「suimonユキ_feat.mztn7応援スレッド16」
https://mevius.5ch.net/test/read.cgi/bgame/1530536517/ 今度の電王トーナメントは探索部がカギになりそうだな
評価関数と探索部はワンセットが最新のトレンドだし 山口 祐 / Yu Yamaguchi @ymg_aq
産総研のABCI。Tesla V100 x4基のノードが180円/時間で借りられます。
AWSで同等のインスタンス(p3.8xlarge)を借りようとすると2300円/時間とかするので爆安すぎます。
安すぎて税金によるダンピングとか民業圧迫とか言われそうですが、普通に私も借りたいですね
https://abci.ai/jp/how_to_use/tariffs.html 山口 祐 / Yu Yamaguchi @ymg_aq
産総研のABCI、どのくらいヤバいかというと、
ユーザーあたりMAXの32ノードを借りられた場合、
AlphaZero(将棋)の学習が70万円と5日で完了する計算です
↑これは借りられた奴が勝つってやつだな ディープラーニング勢が言い訳出来なくなるから辛いなこれ
計算資源がないから弱くても許された感があったのに 山口 祐 / Yu Yamaguchi @ymg_aq
さてここにAI囲碁世界選手権で稼いだ150万円があります ちなみに来年辺りメスアザラシとの結婚を考えている模様 >>821
アザラシのペニスはクソでけえんだぞ
満足させられるか? 囲碁のDL勢ってのはどれも市販されてないんだよね?
もし将棋もDLが主流になったら今みたいに手軽に使えなくなるんだろうか? >>812
アマ竜王戦もレーティング選手権も予選落ちで全国大会で通用していないし、本はAmazonランキング圏外で全然売れてないし、適性な評価なんだよなぁ。 >>825
加藤さんの判断で、市販版はグラボを使えない仕様になってる
囲碁ソフトの主要なユーザー層でゲーミングPCなんて持ってる人はほぼいないから >>826
まあ、お前は県大会も突破できなきゃ単著も出せないわけだが >>825
天頂の囲碁はDLバージョン未搭載 ユーザーのハードが千差万別なので
問い合わせに対応しきれない https://abci.ai/jp/about_abci/computing_resource.html
□計算ノード
各計算ノードには2基のIntel Xeon Gold 6148と、SXM2で接続されたNvidia Tesla V100が4基、NVMeで接続された1.6TBのSSD、384GiBメモリが搭載されています。
計算ノードの単体性能は、506 AI-TFLOPSで、人工知能研究の機械学習に必要とされる半精度浮動小数点の演算を1秒間に506兆回行う能力を有します。
工学的な科学技術計算で必要とされる倍精度浮動小数点演算おいては、計算ノード単体で34.2 TFLOPSの性能を有します。 >>828
俺A級の立命館戦で勝ったことあるけど、おまえ勝ったことあるの?w よっわw
将棋クエスト【2分】棋譜(garnet_crow[2343] 対 kamokamoo[2459]) http://questgames.net/shogi2/game/s88df9yp4dpj #将棋クエスト #ShogiQuest >>832
>>833
お前らいい加減にしろ
将棋ソフト開発とsuimonの話と何の関係があるんだ
このスレを荒らすなや suimonの話ならこっちに書き込めや、suimonの話など誰も興味ないわ
「suimonユキ_feat.mztn7応援スレッド16」
https://mevius.5ch.net/test/read.cgi/bgame/1530536517/ そら、世界コンピュータ将棋選手権の真っ最中にレーティング選手権に参加なんかしてたら外野扱いされるわな(笑) >>816,817,820
パル山さん本気出しちゃうかー!
でもSDTの規定スペックは最高でもGTX 1080だろうし、AlphaZeroレベルの学習してもKPPTにすら負けそう 【悲報】 日本政府さん、焦る 「すまんこれからIT奴隷が30万人不足するんだが…これどうすんの?」 [437931475]
https://leia.5ch.net/test/read.cgi/poverty/1532915265/
お前らもコンピュータ将棋なんてどーでもいいもん作ってないで
ちっとはもっと役に立つ物作る事に精出せよ 異様に専門的に成ってきたなこのスレ(w。開発者も参入か(w。 むしろ開発者の書き込みは見なくなったろ
いろんな人が流入して幾分専門性は落ちたと感じる >>839
suimonことsuiseihuman
早く自分のスレに帰れよ >>822
えー、平岡さんまで山本組の仲間入りなの
それは地味にショックだ😵 >>846
HEROZの株持ってる平岡さんならともかく、
自営業という名の半ニートえびちゃんでさえ婚約しているというのに
おまえらときたら 言っとくけどコン将界は意外と割と妻帯者や彼女持ち比率高いと思うわ💑 suimonさんはイオンさんの残り香をまだ探しているかどうか >>851 はsuimonさん本人だろうがスレ違いだろ、自分の本スレに帰りなよ 自分の本スレがあるのになんでわざわざこのスレに来るのだろうか
「suimonユキ_feat.mztn7応援スレッド16」
https://mevius.5ch.net/test/read.cgi/bgame/1530536517/ マジレスするとえびちゃんでも業界では上位のスキルだぞ
レッドコーダーがわんさかいる強豪将棋ソフト界隈がおかしいだけで さすがにレッド経験あるのって野田さんくらいかと思ってた さすがにレッドコーダーがわんさかはいないんじゃね?
stockfishとかGPS shogiのコードを理解できる時点でかなり実力あるプログラマが揃ってると思うけど イルカちゃんの最新版まであと少し!
最強のヌエと探索セットとか胸熱 http://www.chessdom.com/tcec-season-13-the-advance-of-the-nns/
TCECシーズン13は現地時間8/3に4部リーグから開幕
今回はLeela Chess 0とDeus Xという2つのNNエンジンが参戦。
これに伴って、NNエンジンにはGTX 1080 Ti × 2 の環境が用意された
TCECのチャット欄における専門家の発言では、AlphaZero対Stockfishにおいて
AlphaZeroが用いたパワーのほぼ35%に当たるだろうという推測
このパワーで多すぎるということはないだろうとのことで、過小かどうかは
今回の大会結果を見て判断するとのこと
αβ探索のエンジンは従来どおりXeon44コアのCPUで稼働し、
CPUとGPUを対局サーバで通信させる
万一通信エラーが起こった時は初手から指し直しとのこと
しかし、AlphaZeroに対しては
「Stockfishの設定めちゃくちゃだったよね」
「Stockfishもスパコンで動かさねーと結果に何の意味もねーだろ(ヒカル・ナカムラ談)」
とまあ、当然のそっけなさですな >>859
イルカちゃん公開なの?
教師局面増やし続ける方法ならばパソコン資源の勝負になります >>860
将棋はelmoの設定が疑問視されてたけどチェスも突っ込まれてるのか それこそ最初のalphagoの論文からして伊藤さんからZenとCrazyStoneの設定突っ込まれてたもんな
Deepmindがなぜ対局においてあそこまで対戦相手の設定をぞんざいにしたのかは謎 将棋ではNNが苦手と思われる終盤を全く指さずに投了するような設定にしてたからな
結果が出るようにわざとそのパラメータ―選んだと疑われても仕方ないレベル 異種格闘技に完全な公平なんて存在しないから
どんな設定でやってもイチャモンが消えることはないだろ 公平とかじゃなかて雑、手抜き或いはわざとが
疑われるレベルなんでちょっと違う TCEC12、今にして思うとなんでLC0エントリーしちゃったんだろうね
GPUなしのCPUオンリー環境だったのに >>868
こっちでしょ
めきっと@鵺日々成長中 @_illqha
評価関数固定対局。
https://drive.google.com/file/d/1JudYdmqAIDCwASeWQRHqyErFBbsBpnte/
dolphinシリーズは教師作成用に探索パラメータを設定したエンジンなので、dolphin2(予定)では対局条件をdepth10固定にした場合に限ってYO4.82に9割ほどの勝率です。
来週末くらいに評価関数と一緒に公開しますので、教師を作る方はぜひどうぞ。
めきっと@鵺日々成長中 @_illqha
※depth10で強いからといって、作成した教師から学習した場合強くなるのかどうかは未確認です。わたしが勝手にそう思っているだけです、ご注意ください。 真やねうら王がお咎め無しの前例により
SDTでは教師局面はどのソフト・評価関数で作ってもセーフ扱いだからありがたいね 今年の将棋電王Tは本当にあるのかな、未だに何の知らせもないので疑わしい
開催があるのかないのか分からないで開発している人の身にもなってほしいが いつもこの時期ぐらいには開催告知はあったはずだから今年は無いのかもね そもそもドワンゴからすればニコニコはプレミアム会員数はピークを終えて激減中だわ
賞金やらゲストや解説呼んだり設備機材費用膨大にかかるだわ
ponanza引退して名人も敗れて目新しさ全然無くなったわ
でそもそも開催するメリットほぼ無いからな。
契約あって続けなくちゃいけない叡王戦と違い
何のしがらみのない電王トーナメントはむしろ今年開催されたら奇跡の部類。
どこかスペシャルスポンサーが現れたりしらまた別だけどさ 持ち時間12時間、時間切れ60秒の設定で
illqha1.1(dolphin) VS NNUEkai3(dolphin)をやってるのです。
思考時間が長くなれば、強い評価関数が勝つ確率が高くなるだろうという目論見は、
今のところ分からぬ。
CORE i7-2700k(4.3GHz)
8スレッド
ハッシュ4096MByte
城跡未使用。
後手角換わり後、22銀じゃなくて42銀とか謎の手多し。
終わったらきふうぷするから見てみて。
いまきふうぷする?_ ああ、明日またこのスレ見るからその時判断するね>棋譜 10試合すんだら問答無用で、棋譜うぷするので、よろしく。・
たたかれてもうpするし。今2試合終わって3試合目の中盤だぞ。 だれかアイデアある?
>かなしさ@neco_tank
> 1000点で楽勝な将棋と1000点でもずっと怖い将棋に差をつけるためにもう一つ指標の軸がほしいな。 最近プロ棋戦の検討で貼られてる、探索木の色の濃さとか そんだけ長時間なら棋譜は見たい奴いるんじゃないかな
勝率についてはなんとも言えんが
持ち時間変えた時の勝率を傾向だけでも確かめたいなら
極端に持ち時間設定を増やしたものわずかにやるよりも
0.1秒、0.2秒、0.5秒、1秒の対局を1000局ずつやって直線的に勝率が変わるか?とか見た方がよほど現実的で意味があると思う A級あたりの人が棋譜見見ればどっちが強いか、
どこに弱点があるかはわかるんじゃね?
俺には全くわからんだろうけど。 >>880
>>881の言っている探索木と同じことなんだが
3手先までの最善・次善・次々善それぞれの評価値27個の単純平均だとどうだろう。
分散でもいいかもしれない。 と思ったら最近貼られてる探索木は1手目は3候補で以降は最善と次善だけで4手先まで見てるな。
3*2*2*2で24か。こっちの方がいいかもしれない。 >>876
後手側から角換わりを仕掛けたのなら22銀より42銀の方が形が良いって事じゃね
22銀は矢倉模様に形を決めすぎだけど、42銀なら雁木にももっていけるわけだし 持ち時間12時間のillqha1.1 VS NNUEkai3の棋譜が4つ出来た!
以前やったQQR(やねうら王) VS illqha1.1(dolphin)の棋譜が1つあるのでそれも混ぜてうpするよ。
ttp://www.axfc.net/u/3926240
僕は将棋の内容に明るくないので、良く分からないけど
見てみてね。
0.1秒対決とかいろいろやって直線性を見るの、やってみたいね
持ち時間1日1局っておもってエイヤ!って決めたところあるから、適当なのよね
42銀あり得るのね!やはり将棋の内容に明るい人が見るべき棋譜 とりあえずうpしてみたの。
10試合終わったら改めてうpするよ。
では1週間後! >>887
2五歩決められたら結局33銀上がるわけやし、42の銀が邪魔で42玉が遅れる分45桂速攻へ対応しにくくなるやろなあ。 i7で8スレ一局1日対局はかつて誰もやったのを見たことがないので棋譜は観る価値が高いと思うよ
一手あたりのノード数がここまで高いとプロ棋士の人でも興味はあるんじゃないの 888が10人いれば100局分の対戦結果を出せるな。これにさらにいつもの3倍の回転を加えることで >>884
例えば探索の際に、「評価値の変化」をチェックしている。
良いと思っていたらじわじわ評価値が下がるのはよくない兆候だから延長する。とか。
あと、浅い探索でよかったのに深く読むと極端に変わったりする。
こういうのを読み抜けないようにコントロールするという方法でこれまでコンピュータはやって来た訳だが、それがヒントになるかもしれない。
対人間で言えば浅さより、うっかり抜けのほうだが。
例えばDLで強いソフトを作った上で、一手読み候補値を出させてそれが悪手の手を狙うとか >>880
怖い将棋なんて主観でしかないじゃん
級位者にとっちゃ角交換の時点でどこに打ち込まれるかわからないから怖いし、
駒がぶつかって取る一の局面でも、とっていいかわからない人にとっては怖い局面だし 人の主観を客観化するのは難しいな
何指しても必勝の1000よりは間違えばすぐ敗勢の2000の方が、人間的には勝率高い。それも主観だけど 必勝の1000って必勝なんだから勝率100%なんだろ?
そりゃ必勝じゃない2000、かつ間違ったら敗勢よりも勝率高くて当然
自分で意味不明な条件設定をしておいて勝率高いも低いもないだろう
他の考え事、よそ見ばかりして今日は将棋やる気0の三段と
今日は特に将棋に全身全霊、この日ばかりは何が何でも勝ちに行ってる初段が居た
そういう時は初段の方が勝率が高かった
「だから将棋は三段よりも初段のほうが強い」
こんな条件での結論に何か意味ある? 細かい言葉で揚げ足取られるとは。このスレも変わったな
↓訂正
何指しても大優勢の1000よりは間違えばすぐ敗勢の2000の方が、人間的には勝率低い
評価値だけじゃなくて上みたいなときの差別化をどうするかってことだろう Daigorillaの作者(24たまに参戦中 ?) @tanadai56
@warsminamin ウォーズで調子が悪くてついついソフト指しを最近してしまったのだがそれが運営がひどく
偽計業務妨害の罪で訴えると言う。しかし返信メールには「外部ソフトを用いているから」という理由で罰が重くさせられ端末と大事なアカウントが永久的に停止させられた。
Daigorillaの作者(24たまに参戦中 ?)@tanadai56
@warsminamin しかしながら不正ツールは一切使っていなく、自作エンジン、思考部を使用しての不正である。
Daigorillaの作者(24たまに参戦中 ?)@tanadai56
@warsminamin 検証が不十分な上、開発者に失礼すぎで、かなりキレそう
Daigorillaの作者(24たまに参戦中 ?)@tanadai56
@warsminamin あともう1つ、MYアカウントが3つあり、ソフト指しはそれ以外のアカウントでした。それはもちろん牢獄行きになったが、
関係のない3つのアカウントのうち、かなりやりこんだアカウントだけを永久的に停止させられたのはなぜだ。一番大切なアカウントだけを消すのは運営の悪意しか思えない 非公開のソフト(絞っただけにしろ)を副垢ごとBANできるウォーズ運営有能だな >>880
今のソフトは最善手を指す様に仕向けているけど、
弱くなってもいいから、プロの差し手を指す様にすれば、最善手との乖離で表現できるようにならないかな。
(プロが好む指し手だと評価値が大きくマイナスになるときに危険とするとか。) >>901
自作エンジン、思考部って、ライブラリ不使用ってこと? >>907
Twitterみたらやねうら王使用、WCSC基準の独自性あり(自称)、教師局面生成時の定跡・学習開始手数以外の工夫は秘密 Gold_daigorillaが牢獄アバターになっているな 3切れ用に画像を高速で認識する自動ソフト指しソフト作った人だっけ めきっと@鵺日々成長中 @_illqha
illqhaの新評価関数ですが、予想以上に強くならないので今週末の公開は無理そうです・・・。
来週中には公開しますのでもう少々お待ちください。
めきっと@鵺日々成長中 @_illqha
ここにきて少しづつ教師の質と量を要求し始めた感がありますね。 >>912
焦る必要はないと思う。
試行錯誤の世界だからいろいろ仮説を立てて
検証していけばいいと思う。
極端な話10ぐらいの試行錯誤で1発当てれば
レーティング+50ぐらいは軽いんじゃないだろうか?
実際に棋譜解析をいろいろなソフトで比較することで
特徴とかがわかる可能性がある。
狙った通りの教師効果が出ているかは対戦するのが
一番手っ取り早いけど一方目視で狙った値が出ているか
サンプリングすることであらたなパラメータのインスピレーションも
湧くんじゃないかと思う。 雑巾絞り以降にR上昇ペースが加速して
それでも年間400、半年で200程度
そんなメキメキ強くなっても怖い NNUE型評価関数は、探索部との相性も含めてレート向上の余地はまだまだありそう >>901
こんなアホが就活中の大学4年なのか……この文章からして、他者とまともにコミュニケーションできない方なのは間違いないが、
それでも「他者とコミュニケーションがうまくいかない」「そもそも論理的な思考ができない」という自覚さえあれば、わざわざtwitterにこんな文章投下することもなかっただろうに >>912
強くならないのか
最適な探索パラメータが変化しているのかは議論の余地があるぞ
評価関数だけが強くなる時代はもう終わっているし やはり山下さんが言うようにR4500くらいが限界なんじゃね R4500が限界でもまだ全然到達してないし、神のレーティングがR4500なわけないからまだまだ将棋は奥が深いってことだろうな >>880
パスしたときの評価値の下がり具合も使える情報かな
指し手の難易度は他の弱いソフトや浅い探索でその正解手を指せるかどうかってので判断できそう 後手番で超速75歩から評価値が後手に傾いたまま勝ったのは印象的 suimonの話はスレ違いだろ本スレでやってくれ、コンピュータとは何の関係もないだろ
「suimonユキ_feat.mztn7応援スレッド16」
https://mevius.5ch.net/test/read.cgi/bgame/1530536517/ スレ違いだったらすいません。質問させてください。
ShogiguiにApreyを導入しているのですが、棋譜解析を行う際、どのような設定にしていますか。@プロの対局を解析、A24で対局さした自分の棋譜を解析が主な用途です。よろしくお願いします。 形勢グラフと棋譜解析なしかよ
アップデートが本当にされるまで保留だな
ってかそもそもいらんけどw suimon
@floodgate_fan
「将棋神やねうら王」のβテスター、はじめの段階から参加させていただいてましたが、
テスターの方の意見がどんどん反映されていき、最後はかなり強力な検討ツールになっていて、やねさんの力に驚きました。
最後のβ版では、実際に私が指した将棋を検討モードで検討もしましたが、有用性バッチリです。 将棋情報局編集部
@mynavi_shogi
「将棋神 やねうら王」マスター入稿完了! 最強クラスの5つの思考エンジンを選択して対局&検討。
見やすく、かつ使いやすいGUI。ものすごいソフトが完成してしまいました。
8月31日発売決定、DL版は将棋情報局にて先行販売する予定です。
https://pbs.twimg.com/media/Dj45iw8U8AAcpbo.jpg
「将棋神 やねうら王」の強さは10級〜九段、将棋神、カスタムから選べます!
https://pbs.twimg.com/media/Dj6PjnpUUAEx2gK.jpg 弱いのも選べるようになったのか
どうやってレベル調整したんやろか GUI本体はgithubから入手できるんだよね
でも駒等の画像を用意しないと実際には使えない? 将棋神 やねうら王は結局最終的に級位者の層も取り込んだ仕様になったのか、前は有段者以上限定の仕様だったが ponaXはGUIとエンジンのやりとりが無茶苦茶だったからな
GUIをまったく知らない人の作り
山本もGUIを作ったことがないからそれが通ったんだろうが
やねうら王はベータテストもやっているからトラブルがあっても小さくて解決可能 intel Core i9-7980XE 1999$
18core(36thread) 2.6 GHz(3.4/4.2GHz 4.4 GHz)
CineBench Score 3400
AMD Ryzen Threadripper 2990WX 1799$ 来週発売
32core(64thread) 3.0Hz(4.2GHz)
CineBench Score 5100 やねうら王は大丈夫だろう。
プログラマーとしての能力が段違い。 NNUEkai4をアップロードします
https://www.axfc.net/u/3927181
今回は、前回の反省を踏まえ、対illqha1.1に対して、1500万ノード、投了値3000、引き分け256手の設定で1500局対局しました
https://i.imgur.com/MlE6VFf.jpg
https://i.imgur.com/CkaNqbL.jpg
勝率は53.5%とほとんど強くなっておらず、透。さんなどと比べると残念な結果ですが、
有意確率0.2なので流石に有意差はあるのではないかと思ってます
上記評価関数には500局分の棋譜も添付しました
お暇な方はまた遊んでください 透は俺の強いって自慢したいだけなんだよな、今まで総合的なレートで有意差があるものは公開されたことがないので、
信用出来ないだろ、100局で勝率64%だとしても1000局で勝率53%に落ちることも普通にある >>951
透の自演
透は攻撃性があるので気持ちは分かるわ NNUEkaiやillqhaの人が惜しげもなく公開されるので、絵に描いた餅評価関数を自慢する透の存在価値はないだろ ID:2l65S3FE0
まふっていつも都合悪くなると透のせいにするのな
お前が一番承認欲求の塊
全部ブーメラン刺さってて草 たまらず何度もレスするところも
誰かを持ち上げて自分を保とうとするところもバレバレ >>948
kai4にやねうら王4.82入れてdolphin/illqha1.1に61-8-31でした。1秒4スレッド、互角局面使用
ところで探索部はdolphinとwhale6_Dittoどちらが優秀なんだろう。 透はずぼしを突かれてまた発狂しているな、前のスレでも発狂していたんだよな
今や何の存在価値もない、ただの俺の強えっの自慢屋だしな、誰もお前の絵に描いた餅評価関数
などどうでもいいわ >>957
1500局で53.5%なのにそんなに差がついたのか
やはり将棋は初手からのもので、互角局面を使った検証は使えないな 透は時の強い評価関数が出れば他のソフトとの相性問題はほったらかしにして、勝率何%って自慢した挙句、
公開したのはいいが、どれも総合的なレートで有意差なく強いのが無かったゴミ評価関数ばがりだったしな
せいぜい100局から200局しか計測しないので総合的なレートが高いものが作れるはずないだろ 20〜30手の範囲のどれか選んで先後入れ替えで計測するのが一番正確だろ 無罪の証明を求められているのだけれど、証明する度胸があるかどうか。
@anti_suimon
よって千田六段にはこれらの変化に対して、C-bookや将棋世界誌上で解説してほしいのだけれど、いかがだろうか。
@anti_softzashi
返信先: @anti_suimonさん
anti_suimonという名前の割にはsuimon氏への批判がありませんがanti_suimon=suimonという認識でよろしいですか?
@anti_suimon
anti_suimonというアカウント名だからといってsuimonさんのアンチであるとは限らないし、私がsuimonさんを批判しないからといってsuimonさんの複垢だとも限らないんだよな。あなただってソフト指しのアンチだとは限らないでしょう。おかしいって。
@anti_softzashi
私はソフト指しのアンチです。
suimon氏の序盤の浅い見解を全く批判せずにsuimon氏以外の研究を批判しているのはなぜですか?客観的には不自然ですが。位置情報や伊勢市在住のsuimon氏が撮影不可能な写真などをツイートしてsuimon≠anti_suimonである証明をしてください。 将棋神やねうら王、この発売のおかげで
詰将棋エンジンとかが洗練されていくのは感謝しかないわ
全力で応援はする(ソフトは買わないけど) >>961
あまり期待できない。
1秒で試したが私のillqha1.1 GW3より弱い
GW5.0.5 QQR に対しては55%の勝率だった。 透、Twitterアカウント鍵付きにしたんだっけ?
アカウント消したんだっけ?
性格に難ありか
まふと透は性格に難ありと思いますね
公開しないものを・・・ TCEC13の4部リーグは折り返し地点の14回戦終了
LC0が独走するかと思いきや、WASPとLC0が9.5点で並びNN勢のDeusXが8.5点で追う展開。
LC0はいきなりプレミアリーグまで上がるかとも思われていただけに、意外と苦労している印象
レートで300差ある現在最下位のTucanoに2戦して2ドローと、これがチェスの面白く難しいところでもある
>>966
意味不明の2ちゃんねらに粘着されたら性格がまともな人でも鍵垢にすると思います たぬきって評価値ブレブレな気がするのは気のせい?
+50→(少しノード数増やしたら)+300→(もう少しノード数増やしたら)+100とか、そんなのがよくある
技巧なんかは安定してるイメージ たぬきはニコ生で評価値が大きく動くから演出効果があります
そりゃあ、プロ棋士(笑)は飛車落ちでも最新の強豪ソフトに勝てんわなぁw
最新の将棋ソフトだとノートパソコンでも九段が即指しな件
http://yaneuraou.yaneu.com/2018/08/07/
この段位は、将棋倶楽部24換算になっているので、
町道場の段位よりかなりシビアな段位です。九段=R3200(R3100?R3300)、
八段=R3000、…、初段=R1600、1級=R1500、2級=R1400、…。
この九段は平均的なプロと同じぐらい(それ以上?)の棋力ではないかと思います。
いまどきの将棋ソフトで、九段にするには、NodesLimit = 315,754。
ちなみに初段は、NodesLimit = 3,450だということがわかりました。
(わりと少ない数字なので驚いています。)
いまどき、3万円のノートパソコンでも1秒間に50万局面は読めるわけで、
九段に設定してもノートパソコンですら即指し(1手、1秒未満)という結果になりました。
普通の(10万円ぐらいの)デスクトップ機なら、
九段に設定していても0.1秒未満で指してきます。
また、「初段」の棋力でよければ、人間側が1手1秒で指すとしても
3万円のノートパソコンで100面指し出来てしまうということですね。いやはや。 これ、五段設定くらいで、人間っぽく時間使った上で24でソフト指ししたら
実際にどのくらいのところまで行けるか、ソフト指しとバレるかは
試してみたい気がする やねうら王が人間将棋界にトドメを刺すかw
ブログ記事を読んでいる限りでは、
プロ・アマ問わず、甚大な影響が出るのは不可避だね。
それくらいすごい。 初段だったら10手読めればいい方
ソフトの300分の1しか読んでないのにいい勝負ってことは、初段って意外と強いのな 9段のノード315000てcore i5積んでるパソコンなら0.1秒でプロ中位と互角てこと?
うーん。ほんとかね ほぼ即指しに勝てない的なことは千田がニコ生で出てたときに何度か言ってた気がするし
山崎も似たようなこと言ってたし特に違和感はないかな >>948
検証に1500局すごすぎ
すでに150件近くダウンロードされてるけど、このスレ監視してる人そんなに多いんだな
>>959
コムの大会にしても、人同士の対局にしても定跡使うから互角局面を検証に使うのは間違いではないのかもしれない >>948
相性問題調べましたか?
illqha1.1だけに強く他の上位ソフトに負け越すようじゃ意味ありませんよね? 相性問題は住民が調べればいい
illqhaに有意差有りで勝ち越すだけですごいこと
https://twitter.com/uuunuuun1/status/1026482734267424773
uuunuuun @uuunuuun1
MyShogiお手伝いして無事完成を見れたのがとても嬉しかった。
今気になっているのは最高位の九段の設定がほぼ即指しで、
その上の将棋神との棋力差がR1000以上あること。
細かく刻めば需要はあると思うがどう呼べばよいのだろう。
23:58 - 2018年8月6日
https://twitter.com/5chan_nel (5ch newer account) >>1
ちなみに、去年、やねうら王は
「平均的なプロ棋士」について、↓すでにこのような記事をアップしていた。
もう新聞棋戦のカンニング対策は急務と言える。
(なし崩しで元の木阿弥、検査が緩くなってるらしい)
今のままではやったもの勝ち、スマホで一瞬でカンニングできるし、
他分野の事例から見ても、かならずやろうとする棋士は出てくる。
もはや緊急事態だ。
プロ棋士と最新のソフトとの適切な手合は?
http://yaneuraou.yaneu.com/2017/07/19/%E3%83%97%E3%83%AD%E6%A3%8B%E5%A3%AB%E3%81%A8%E6%9C%80%E6%96%B0%E3%81%AE%E3%82%BD%E3%83%95%E3%83%88%E3%81%A8%E3%81%AE%E9%81%A9%E5%88%87%E3%81%AA%E6%89%8B%E5%90%88%E3%81%AF%EF%BC%9F/
> 投稿日時: 2017年7月19日
> これからすると、平均的なプロ棋士だと角落ちでは
> 最新のPC+最新のソフトに勝ち越すのは(対策なしなら)非常に厳しいという
> 結論になりそうだ。飛車落ちの手合が妥当なのかどうかはこの後の検証が待たれる。
平均的なプロ棋士 << (R138差) << 斎藤慎太郎六段(2015年当時)
<< 家庭用PC(4コア)Apery(2014) << (R200差)
<< 家庭用PC(4コア)大樹の枝 ← 角落ち → 家庭用PC(4コア) elmo
<< (R100差) << 家庭用PC(4コア)relmo8 << (R200?400ぐらいの差) << 最新のPC(48コア) relmo8 >>959
探索も違うしサンプルもそんなに多くはないしで、互角局面が原因と断定するにはまだ早いのでは よく分かってないんだけど
将棋神やねうら王ってのさillqhaやkai4より強そうなの? >>984
強くてもすぐ抜かされる、フリーソフトによって
更新がないからね >>983
957だけど、kai4の人はdolphin同士で対局させているんだよね。
dolphin >やねうら4.82だとは思うから、自分でやっといてなんだけど、勝率に差が開くのはちょっと腑に落ちない部分ではある。
まあ対局数とノード数の問題かなー? >>982
スマホ、カンニング、、、、数年前の話をいまさら緊急事態?日暮熟睡男さん? >>981
3200〜4000以上のRを区切ってなんか意味あるのか? R3200でも現在の人間トップの棋力をR100ちょっと上回っているので、検討用などに将棋神一つあればいいのでは
R3400,R3600,R3800,R4000みたいなレベル設定があってもあまり使い道がないのでは >>987
「喉元すぎれば熱さ忘れる」で、今の連盟は非常に危うい状態なんだよ。
スマホ検査も、ユルユル・ガバガバでなしくずしで緩くなってきている。
第2の事件が起きかねない。
やはり将棋脳の中卒・高卒棋士は、
かつてのプロ棋士神話にも、まだ未練があるんだろうねぇ。 illqha dolphinてAWSとかでそのまま使えますか?
それとも自分でビルドしないといけないですか? >>965
情報ありがとうございます
>>985
なるほど >>970
私がやった結果ではGW3の方がGW6より若干強い。
まだ1000局まで到達してないけど若干illqha1.1 GW3がKai4のDolphinに勝ってるよ。
https://i.imgur.com/8jZbSHi.png 駒の動きと合法手と終了条件だけ教えたら1秒で人間のトップを超える時代とか来そうだな 評価関数が正確ならノード数は100もあれば十分。
現実には無理だけど。 このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 37日 6時間 34分 36秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。