▲コンピュータ将棋スレッド140
レス数が1000を超えています。これ以上書き込みはできません。
>>1おつです
全スレ>>993
強くなっているようでなによりです
2週間ごとくらいに順次最新版を公開していこうと思っています テンプレートに
「まふ氏はじゅうぶん検証してから公開するように」と付け加えておくべきでしたか? 将棋ソフトよりいい手を指せる藤井聡太君の現実
【衝撃映像】藤井聡太七段 あわやの反則負け? "待った"の瞬間をスローで確認してみた
https://www.youtube.com/watch?v=9YP9kJh5Zms
藤井聡太七段の竜王戦、増田康宏六段戦における待った疑惑と予想される処分について
https://www.youtube.com/watch?v=4LFXpFNTUDA 基本匿名のスレ住人が、テンプレレベルでプログラマ相手に指導的発言するのもどうかと思うぞ。公開して、それが次回の大会で験されるワケで。 別にこのスレ上でやってるわけじゃないし、さすがにそこまではいいのでは >>7
Twitterなどやってませんか?
対戦結果などをダイレクトメッセージで画像付きでお送りしたいので それ専用の新規アカウントでもいいのでtwitterアカウントあるといいかもね。
もちろんスレに評価関数あげてくれるのは嬉しいけど いや対局結果はスレに貼って共有でしょ
何でダイレクトメッセージで内輪のデータにするん? Twitterなどを持ってしまうと定期的にちょくちょく更新しなければいけない気がしてくるので悩みますね
そのうちそうするくらいどっぷりNNUEで遊び始めるかもしれませんが、
しばらくはこのスレ内でひっそりとくらいにさせておいてください
対局などしていただいた場合はスレに書いていただければと思います
(べつに画像が無くてもよっぽど変な結果じゃ無い限り無条件で信用しますので) あまり言うと自演とか言われるのでアレだが、今回まふは従来のまふにしては
強くさせられてるげな感じしないか? 公開もせずツイッターで自慢だけする人がいるなか公開してくれるのはありがたいわな まふ氏は要はDittoを使ってDepth10で最強になるパラメータを探して棋譜生成
学習後には長時間で最強になるパラメータに変更をして対局したという事だろう
棋譜生成もDittoならUSIオプションでパラメータを指定可能だから再コンパイルすら要らない 長時間で強いパラメータ探すのってかなり大変だから公開してくれないかなー shogidroidの、ver1より前、ver 0.9.0.4とか持ってる人いない?
よければupしてもらいたい >>17
自分も前スレのはじめの方でIDを貼られて、自分がまふさんの自演って書かれたわ、書いたやつアホやな >>24
こいつもアホやな
さんざんまふが公開しないのを皮肉ってきたのに ほんま白黒の判別が出来ない自演って書き込むアホが定期的に出てくるな
わしほどまふをインチキくさいって書き込んでいるのもおらんやろ しかしまふさんの中途半端な学習パラメータの公開で成果も出ずに時間も費やしたあげく翻弄された人は気の毒だな 探索部が違うという最重要情報を隠していたんだから二度と信用されないだろうね 急に口調変えて罵るあたりがまさに自演王「まふ」w
めっちゃ早口で言ってそうで草 >>28
探索に関しても不明だし誰にでも再現できないと教師や学習で手間かけただけで迷惑でしかないな
もうまふさんは信用度ゼロだろ >>29
こいつ俺のことまふって思っているのか(笑い)
自分のことを信用度ゼロとか勝率を設定変えて捏造しているとかスクショだけでは信用できないとか書き込む馬鹿がいるわけないだろうが(笑い) しかし世の中>>29みたいなアホってやっぱいるんだな
前スレからまふを皮肉っている俺をまふって思っているんだからな
こいつはどうしようもないアホだな 自分を貶す事で自演バレを隠そうとし、他の人からの批判を受けないようする
完全なるガイジで草 お前らって人には厳しいよな
何もそこまで言わんでもいいのに 普通は自分を絶賛したり好かれる要素を書き込んでいるのを見て自演って考えるのはあり得ると思うが
自分の値打ちや評価が下がることを書き込んでいるのを見て自演って思うあたりがびっくりだわ
どっから俺をまふって思えるのか不思議だわ、まふをいいように書きこんだ記憶はないんだが >>33
だから俺は前スレからただの一度もまふをいいように書き込んだこともないんだが、俺をまふだっていう根拠がどこにある
勝手にきめつけるなアホ こいつまふを皮肉っていることしか書き込んでないものを、勝手にまふと思っているアホ
(ワッチョイ c61b-97rh) ID:CnHRtiSU0 山口恵梨子が聞き手は嫌だなあ。解説者に被せるように話すし、自分の予想手ばっかり話して解説者の詳しい解説が聞けなくなるんだよな。 ID:HjUeD+C60
まふと呼び捨てしたりさんつけたり、口調をかえて燃え上がるまふ
精神に異常があるのは明白だしバレてないと思ってるお前だけじゃね?w まふ氏とは思わないが
連投癖といい、7級おじさんとイメージが被る >>39
こいつ前スレからの藤井オタ、故意にまふの自演って嫌がらせしている基地外 ID:CnHRtiSU0
他人を何の根拠もなくまふって嫌がらせをする基地外 ID:CnHRtiSU0
こいつ、あかの他人をまふの自演って根拠もなく書き込む基地外
単なる嫌がらせなのは分かっているわアホ >>39
残念だがお前の言っていることには何の根拠もないんだよガイジ まふと同一人物認定されたら切れるやろ
俺だって切れる もうやめれば?一個人を貶めるのもかわいそうだと思うし、このまま喧嘩続けるのも日本人として見苦しいぞ 公開してくれる人は素晴らしいけど公開する義務もくそもないし攻められんだろ
ただ、開発者にこっそりいい発見を伝えたりもしてないならくそ まふさんR+200の強い強い評価関数まだ公開しないんですか? 誰がまふさんかなんてどうでもいい
それより このスレをチェックしている
まふさんへ伝言します 新評価関数を
いつ公開しますか?進捗状況を自分の
ページに載せてください
もし公開しないというのならその理由を
自分のページに載せてください きのう知ったんだが、有名な「せお詰」がフリーで使えるようになったんだね。
さっそくダウンロードしてミクロコスモスやらせたらたった5分で解いた。信じられんw
指し将棋はAperyの最新、詰将棋はせお詰を使えば最強コンビじゃない。すごいことだ。 おまけ2を公開します
https://1.bitsend.jp/download/c1dc1c97cd496ed536090eeadb9ea380.html
評価関数と学習方法のパラーメーターなどが入っています
今回の評価関数の学習時に使用した教師局面はwhale6で作製しました
次からは全く異なったパラメーターにしたものでやってみようと思います
おそらくまふさんのように普通とは違う強くなりかたをすると思います
↑
計測結果です
600回対戦で計測 計測条件1秒2スレッド(おまけのほうはwhale6の設定)投了値MAX
NNUEkai 278勝 おまけ2 263勝 59回
NNUEkaiが少し勝ち越します >>52
600回対戦で計測 計測条件1秒2スレッド(おまけのほうはwhale6の設定)投了値MAX
NNUEkai 278勝 おまけ2 263勝 引き分け59回
NNUEkaiが少し勝ち越します illqhaとQQRは探索をやねうら王に統一して対戦させたところ
200戦やってillqhaの勝率52パーセントでした。 >>51
一瞬 1年前のスレッドを間違えてチェックしたかなと思った まふ評価関数は探索を1500万ノードに特化したパラメータに設定しただけで評価関数はほとんど強くなってない説が有力 >>57
人の歓心引きたいから、そのような行いを? まふさんには前科があるからね
SDT5前にR4250以上の評価関数作った吹聴してたけど、実際はyaselmo以下の評価関数しか作れてなかった
まふさんが+R200を証明したいなら公開するか、第三者に計測してもらうなど方法はあるけど、何一つしようとしない上に指摘があってからはスクショからエンジンも隠すようにしてる
開発者の方々だけでなく千田さんも最近はまふさんのツイートにいいねを押してない
ほとんどの人が信じてない illqha、色々計測していただけたようでありがとうございます
QQRよりはやや強いくらいかなと思っていたので大体予想通りですかね
公開するたびにR20~30くらい上げていければいいなと思っているので少しお待ちください
探索なのですが、NNUE用のgodwhale_childを使って頂くのが超低ノード数以外では安定して強いと思います
(前スレの後半にリンクがあった気がします)
現在のまふさんの評価関数はおそらくnn20180608mafu+50~100程度のレートだと思われます
まふさんのほうがだいぶ計算資源が豊富なはずなので、追いつけるかは謎ですが頑張ってみたいと思います まふさんのnn20180611って、multiPVで候補手に面白い手が出てくるってだけで、
もしかしてレート的には弱くなってますか? >>56
わははは、自分はなんにも知らんかったよ。
SNSなんかで相当拡散してたんだろうねw 発狂しすぎてレス一つにまちめる事も出来なくなって顔真っ赤やがw
あげくに「藤井オタ」ってどこからの発想?
あ・・・虚言妄想癖のまふ本人だから致し方なし
そんな時には水でも飲んで落ち着いて愚行を見直してみてねwwwwwww ×まちめる
〇まとめる
基地外はこんなところしか食いついてこないからなw レート的にはnn20180608かNNUE KAIかな ダウンロードできる最強のソフトって結局何なの?
ググったらQQR(カパックとクジラちゃんの融合)が最強って書いてたけど dlshogiは(対局ができるところまで色々設定が大変なのが)最強 「カパックとクジラちゃんの融合」というなんか間違った表現が気になってぐぐって記事見つけたが、
QQRをキメラと書いていてそこは明らかな間違いじゃなー
まぁでも5月時点だとQQRが最強だったのは合ってるだろな 「AlphaGoZeroを超えだァ!」とかで鼻息を荒くする事は出来るけど、
コンピュータ将棋と棋界の関係ってレーティングの高低関係だけじゃそろそろ物足りない。
コンピュータ将棋を使って如何に効率的に、アマも含めた人間全体を底上げして強くするか、そういう指導対局機能の充実が焦点になってくるんじゃないかな。
Rが上がり続けるのも大事だが、駒の動かし方しか知らない超初心者を底上げするソフトとか。
ぴよ将棋みたいな無味乾燥な感想戦じゃ人の心は動かせないし、強くならない。
人工知能で失業した人が、人工知能によって職業訓練して、もう一度社会で自立できるという証明にもなるし。 >>73
AIに対して夢見すぎ。
数学的に答えが出せるもの以外は基本的に無理なんよ。 kai落としそびれて終わった
長期保存用に斧にも上げて欲しかった >>74
数学的じゃないモノって定義次第じゃない?
原子だって数学的に記述しようとしていて、脳だって原子で出来ているんじゃない?
確かに今は難しいけど、それは40年前のコンピュータ将棋の立ち位置みたいなもんで、冷笑されるかも知れないけど、可能性はあるよ。 >>76
言葉足らずだった。
現状で数式として表せて、解法があるもの、という感じだな。
なので、感想戦の会話を数式に起こせて、それをよりよくするための解法ってのを考えださないといけないわけなのよ。
将来的にはできるかもしれないけど、まだまだ全然遠い。
AI研究者というより数学者にがんばってもらわないといけないのかもしれない。 >>77
なるほど。
数学者は大事かもしれないね。 >>77
正攻法でいくならそうかもしれないけど
なんか適当に近似して解ける問題に帰着できれば
80%くらいはできるんじゃないの >>81
近似でもなんでもいいよ、解く方法があれば。
それよりもまず数式にすることが難しいんだけどね。
コンピュータ将棋に使われてる強化学習なんて理論的には数十年前からあるし、
もともと数式で表せる方法がわかっていて、解く方法がわかっていたことさえ実用レベルにするのに数十年かかってるわけだ。
まだ数式にできてもないものなんていつできるかさっぱりわからん。 >>82
GPSメンバーが解説自動生成とかしてたから、
なんらかの定式化はされてるんじゃないの
精度は低いのかもしれんが
後はそれをどう使うかはビジネスセンスとかの話で
数学の範疇じゃなさそう >>83
解説AIの要素は使えるかもしれないけど、感想戦は人間の相手と会話せにゃならんという厄介な要素があるからなぁ。
解説AIの詳しいことは知らないからなんともいえんけど、もしかしたらその技術の応用でなんとかなってしまうかもしれんね。 >>84
解説は大変だね
両取りヘップバーンとキリマンジャロの判定が難しいとのこと
匙加減の問題ではあるけど シェイクスピアやプラトンと同じハードウェアである「ホモサピエンス」という、いわば超高級な強いAIに該当するプロ棋士との感想戦を、21世紀前期レベルの人工知能で代替出来る可能性は極めて小さいと思う。
現代の人工無脳(chatbot)はシンボルグラウンディング問題を乗り越えられていないし、自然言語処理もお粗末なので、生身のような感想戦は30年は難しいだろうなぁ。 日本2-0ベルギーならwcsc29でR6000超え 残念 後半途中まで日本2-0ベルギーだったが... フレーム問題とかシンボルグラウンディング問題とかな問題の捉え方は甘え 言語やシンボルといったデジタルデータの情報量は(少なくともそのデータを受信した場合としなかった場合の差という意味では)確定的に見積もれる
24時間休むことなく毎秒1 KBの文字情報(400字詰め原稿用紙1枚ぐらい)を吸収しつづけたとして、
70年間それを続けても2 TBにしかならない
ということはシェイクスピアやプラトンと同じハードウェアである「ホモサピエンス」というハードウェアを
今日日の市販されているHDD 1個より偉大なものたら占めているのは、後天的に得る文字情報なんぞではなく、
1. 先天的に獲得されている回路網(メンタルオーガンとか
2. 五感という本来アナログ量であるセンシングデータをすんげー高い分解能で量子化(またはパルス変調)したもの
に他ならないんである
2の処理は今日日はDeep Learningが担当する
AI批判厨がフレーム問題やシンボルグラウンディング問題を持ち出して、知性のシンボル化の1側面だけを切り取って語るのは単に言って見ただけレヴェルにすぎない >>90
いろいろ指摘ありがと。
確かに言ってみたレベルかも知れないが、そもそも現代AIの諸課題について理路整然と並べ立てるのを主眼とした書き込みでは無かった。
現状のコンピュータ将棋そのものが既にある種の知性のシンボル化の1側面だけを取り扱った段階だと思うので、今後の展開に期待したいけど、素人が思いつくだけでも課題山積だねっていう意図で書き込んだ。
なんにせよ、今後のプログラマと数学者の奮闘に期待。 >>92
そう煽りなさんな。
例えるなら、やはぶさ2のミッションを応援しているようなもんだよ。 ゲームを強くするのと解説やら会話するのとでは、
明確によくなったのがわかるかどうかっていう違いもあるので、
そういうところでも難易度はあがってるよね。 AlphaZero日本の将棋"プログラム"なんて小一時間の学習で叩き潰せるよ その発言はネタで言ってるのか本気で言ってるのか
あれか?金の力でさらにTPUの数を数百倍にするのか? いいじゃないか、金の力でも。強ければ。
それに限られた野球選手を奪い合っているのではなく、工場に発注すればいくらでも用意できるモノなんだし。フェアだと思うよ。
F1のフォーミュラカー開発レギュレーションみたいに、風洞実験のスパコン演算量にまで規制かけるのもオカシイ。 >>95
>>52のおまけ2に入っているillqhaというNNUE評価関数+NNUE対応探索部が
現在入手できる最強のエンジンです プログラムサイズも小さいのでスマホや
ノートパソコンでも使いやすい 探索部は検索してください どれも大同小異です
但し2週間以内にもっと強いエンジンがupされる見込みです 「コンピューターの」という議論なんだから、>>96が正義。
スマホアプリだの家庭用PCゲームソフトだのでどれが最強だのという次元の低い話はどうでもいい。 カネ持ってるチームがスタート直後から
延々ぶっちぎってもつまらんからや AlphaZeroみたいな蜃気楼ソフトの話題はもうやめよう
公開対局でもすれば別だが >>102
手も足も出なかった囲碁であれだけの実績があるのだし、蜃気楼よりかはマシかと。 >>103
将棋の実績はZeroに等しい
人知れず静かに撤退したのでは >>99
illqhaがNNUEkaiより強い結果は出なかったんだが
超短時間だとNNUEkaiが強い
NNUEkai+GW3-avx2 260-11-229 illqha+GW3-avx2 一手0.1秒 定跡なし スレッド2 投了値2000
NNUEkai+GW3-avx2 24-4-22 illqha+GW3-avx2 持ち時間5分 秒読み10秒 定跡なし スレッド4 投了値1000 訂正
×持ち時間5分 秒読み10秒
〇持ち時間5分 一手ごとの加算10秒 >>103
クリロナが「野球で安打300本打てたよ」って言ってどこまで信じれるか >>107
そうかも知れんが、コンピュータ将棋をしている日本のプログラマは(少なくとも資金力は)例えるなら社会人野球レベルが大半だからなぁ。 Alpha先生を弱いと思うのは
太平洋戦争での日本海軍連戦連勝と同義。 AlphaZeroが強いのは間違いないだろう
学習にTPU 5000基使ってるんだから >>110
やる気がなければどんなスーパーコンピューターを
持っていても宝の持ち腐れです ビッグプレイヤー達は、社内の最先端技術をおいそれと公開しないし、そもそもジャパニーズチェスというガラパゴスなカテゴリにリソースを投射する動機が見当たらない。
コンピュータ将棋も、力技でスパコン級をガンガン投入していたら、もっと早い段階でトッププロに勝てていた可能性は大いにあった。ディープラーニングもそうだが、演算資源が安くなって来たからこそR上げが出来てきたワケで、結局カネが最大のボトルネックという事だ。 まふさんのページ未だ更新されてない
壁にぶち当たっているのかな 本当にやりたいこと、証明したいことならGoogleだって本気出す。
つまりはそういうことだ。 前回のソフト同士の飛車落ちでは下手を右四間飛車基本図で上手もその基本図から開始したが、今回は基本図からではなく、実際に右四間飛車の基本図になるように駒組みをしていったが上手が角交換を仕掛けたり7筋の歩を突いてきたりして
基本図の局面にさせてもらえなかった、強豪ソフトは下手が右四間飛車基本図の形になると上手が不利になるのが分かっているので右四間飛車基本図の形にはさせてもらえなかった。やはり強豪ソフトには飛車落ちで有効な定跡はないんだろうか
ちなみに今回上手に使用したソフトはNNUEkai+GW3で一手6000万ノードでやった >>113
どうかな
今スパコンを与えられたら有効活用できるだろうけど当時なら豚に真珠ならまだマシで
ソフト成長を阻害する足枷になっていた可能性もある
特に並列計算機界隈で幅を利かせていた連中は人間的にクズな奴が多くて印象悪い
その点ではカネ=人材とみなしてボトルネックを解消したのはドワンゴ川上
歴史を振り返ればスパコンが潤沢に開発者に与えられる環境なんて無くてよかったんだ 計算機リソースで勝ってもいいんじゃないか。
大量投入して負けるのも一興。 >>118
ソフトの成長といっても、大枠ではハードウェアと二人三脚の印象が強い。
例えるならば、ドット絵はファミコンの演算資源を節約するワザだが、PS4が最初から有ったなら、ドット絵の習熟にかかるクリエイターの人的コストはスキップ出来た。それと同じで、プログラマは有限なのだから、演算資源が多くて困るなんて事は考えにくいよ。 NNUEkai2のテストをしています
1500万ノードでNNUEkaiに勝率62%(200戦)
https://i.imgur.com/EUhrm8K.jpg
結構強くなったかな、と思いどんな序盤を指すのかも知りたかったので定跡オフでfloodgateに流すと、絶不調
悪い確率を引いただけなのか、定跡を搭載しないとレートがかなり下がるのか、単に評価関数が弱いのかは不明ですが絶不調
テストを継続します(テスト後、公開する価値があれば公開します)
対戦相手が少ないので、floodgateで遊んでくださいね NNUEは定跡で落とし穴を回避しないとハマって星を落としてレートが伸びないのでは >>122
レート計測とか表にのっける事前提にしてるなら
寄付も添付すれば色んな人が協力してくれるよ tttakさんの評価関数でも互角局面使うとQQRより強く定跡なしで戦うとQQRより弱いって現象が起きてたよね。
序盤KPPTより下手なのかな NNUEkai2_GW_i9_7960Xの負けた棋譜見ると駒組みは結構普通にこなしてる
でもグラフ見るとたまにちょこちょこ勘違いしてる
持ち時間が先に削られてるのが原因かな mitsuya @snooze1mitsuya
QQR vs NNUE Kai 45-6-49 持ち時間1時間 切れたら一手20秒 8スレッド
ハッシュ2G ノード数1分で3億位
51〜100局の棋譜です
https://2.gigafile.nu/0726-c337349371da8aef7b08995b10afd0955 出先ですので、ワッチョイ異なります
NNUEkai2の弱かった(というか勘違いが酷かった)理由は、探索部(との相性)が原因だったと現在は考えています
今回のテストにあたって、事前にどの探索部が一番強いのかを計測したところ、k_ohga氏作成のGodwhale-nnueが一番強かった(対whale3勝率57%300戦1500万ノード)ので、採用させていただいていたのですが、
評価関数との相性またはslowmoverもしくは持ち時間処理関係の不具合(他の評価関数でも勘違いが生じたので、こっちの可能性が高いかなと思ってますが、めちゃくちゃ失礼なことを書いてるかもしれません)によって、評価値に勘違いが起きていたと思っています
現在は比較のため、whale3で流しています >>128
floodgateのNNUEkai2流してる人?
あれ初手から指してるけど設定間違いとか大丈夫? NNUEkaiは定跡使ってたみたいだけど 定跡オフって時間的にきつすぎるからなかなか勝ちまくるのは無理だと思うわ 時間もきついですが、先手の横歩定跡にはまって、序盤で不利になるのが厳しいですね…でも結構逆転勝ちしてるようなので、静観してます 序盤は特に横歩取りなどは10手までは定跡ありなしに関わらず指してが決まってたりするので
定跡なしだと序盤で時間を使うのでfloodgateのような持ち時間制では不利だと思う スペックがスペックなだけにそんなに不利にならないんじゃね?
他のソフトのハードは知らんが スペック制限のないWCSCでも上位ソフト全てが定跡を使用しているのを見ると持ち時間制での定跡なしが
不利なのは開発者一同一致するところではないだろうか Google、Quake IIIのチーム対戦で人間を超えるAIを開発 >>139
当然だったらニュースにならねえだろ
頭悪いな
DeepMindは将棋はもちろんのことチンケな盤ゲームごときにはもう興味ないだろうな
これからはさらに高次元なレベル、RTSゲームに移っていくだろうね
実際スタクラは以前からやってるみたいだし
しっかしチェス、将棋、囲碁、協調型FPS、RTSとまできたらもう完全に戦争だな
知性の本質は生存競争での勝利を考えれば当然か
現実世界への投入が楽しみで仕方ないわ 菅井の棋譜をみてると
人間的に優勢でもソフトはあまり評価値上げないんだよな。
序盤だけじゃなく中盤でゴリゴリ、圧殺体勢に入って相手が苦しんでても
ソフトの評価値は差がついてないみたいなのが多い。 NNUEkai2は定跡なしだから中盤で不利なるが
R4000相手に終盤力でねじ伏せてて凄い 将棋世界のニコニコの広告に10月に将棋電王トーナメントと掲載されてるぞ。
どうやら今年も電王トーナメントあるみたい^^b ソフトのレーティングが10000になるまでは競技会を続けてもらいたい SDT6が開催されるということは賞金目当てで
PONA山本がしれっと・・・ SDT6開催なんですね、楽しみです
NNUEkai2は、定跡オフなこともあり、40手目くらいに時間を使い果たし、
かつ形勢も不利になっているところから、NNUE特有の中終盤力でぎりぎり勝っているという感じでしょうか
もう少しfloodgateで対局を重ねたら対QQRとの1秒将棋(1手2000万ノード相当)を試そうと思います 平岡さんて猫飼い始めたのか。
何となくだが平岡さんの性格からメス猫と予想 >>146
そのレベルになると、別の次元見ていそう。 チェスのトップソフト対決の引き分けが今回はだいぶ減ったみたいだね
力の差なのかなんなのかわからんけど
TCEC Season 8 + 9 = 89 - 2
TCEC Season 9 + 17 = 75 - 8
TCEC Season 10 + 15 = 76 - 9
TCEC Season 11 + 20 = 78 - 2
TCEC Season 12 + 29 = 62 - 9 >>147
開発追いつくには金がかかるし、予選敗退とか惨敗したら会社のほうの評判も下がるし99.999パーセントでないわ
株だけで資産1億5千万こえてるイッセーさんが数百万のためにリスク負って出るなんてね >>157
まあ復帰はないだろうけど
もともとボロボロにやられるまでは続けると豪語してたわけで、ボロボロにやられるのはリスクではないと思うぞ Ponanzaは下山さんがいなきゃ話にならないのは、引退後の山本さんと下山さんの活躍を見ればあきらかじゃないか。
下山さんは機械学習コンテスト入賞。
山本さんはずっと変な文章書いてる。 アキエモンと組んでからはもっぱら口をうごかす人
パーツは用意したがPCすら自分では組み上げられない男一人で何ができるというのか >>162
AlphaZeroはまず出ないからCrazy Shogi先生に期待しろ 万が一、SDTにAlphaZeroを始めとした海外ビッグプレイヤーが参戦するとして、では日本代表はどの辺りになるんだろ。ニコニコは資金力からして心許ない…トヨタの人工知能研究所あたりが酔狂で参戦して来ない限り、勝ち目なさそう。 NNUEに一千万くらい入れるだけでめちゃくちゃ強くなると思うしそれだけで優勝できるんじゃないか TCEC12は上にある通り、StockfishがKomodoを29勝9敗62分けで破って
Houdiniに並ぶ最多タイ4回目の優勝。
Superfinalが100回戦になってからの20ポイント差は、前回11回のStockfishの
19ポイント差を抜いて最大差
また引き分け62回は100回戦になってから最小
決着のついた38局のうち後手番の勝ちは9局(うちStockfish6勝Komodo3勝)
こっちはMCTSがどう成長していくかが関心だな SDT6のPCスペックはどうなる? まさかまた昨年のマシンか? SDTはドスパラの在庫処分品と相場が決まってるからi7 8700と1080じゃないか
賞金は大幅に減額しそう >>168
STD5提供のマウスコンピュータを忘れないでください >>165
Googleが現行NNUEをベンチマークとして使うならまだしも、1年後の仮想敵に今のNNUEをそのまま流用するとは思えないしなぁ。
「日本なら1年でこれくらい強化してくるだろう」と逆算して来る。
クジラちゃんの某生放送によれば、囲碁の方は億単位の札束の殴り合いらしいし…。 ドスパラからマウスにかわったんだった。忘れてた。
>>170
2017年の大会なのに6700使う辺り 冷静に考えてハードが統一されている(それもショボいやつ)SDTに
Googleが出場する訳がない NNUEkai2をアップします。
https://www.axfc.net/u/3919570
QQRとの1秒対局(1手2000万ノードくらい)を250局行ったので、棋譜が添付されています
なお、勝率は55%、正直期待以下でしたが、こんなものでしょうか。
https://i.imgur.com/Xz6wQcw.jpg
ちなみに、ohga氏作成のGodwhale-nnueとの相性が悪いようで、floodgate対局だと、調子がよくなかったです 有意確率5.2%で、確かに有意差はないので、酔狂な方は追加で検証いただき、
有意差がないと考える方はスルーください まふさん評価関数upはまだ?
もしかして探索同じだとQQRと有意差なしだったりして >>175
公開ありがとう
こっちでもいろいろ検証してみます >>175
ダウンロードトラブルの少ないギガファイル便かBitSendにup希望
QQRに比較的相性が良いillqha2(おまけ3)に期待 >>175
だから棋譜も添付しような〜
2000万ノードだろうが口だけでは見向きもされんよ
uuunuuunがビビッてるとか大口叩くなら棋譜添付するの問題ないでしょ uuunさんがまたとんちんかんなこと言ってる
開催期間一ヶ月って誰が見るんだよ
ニコ生で放送する前提の大会ってことわかってるか
大会ルールに文句あるなら自分で大会開催しろよ まぁ、放送コンテンツ用の大会という面もあるけど、
将棋放送用の検討ソフトの選抜大会という側面もあるからねぇ。
SDT5入賞ソフトたちがあまりにも放送で評判悪かったってのを受けてのことだろう。 平岡 拓也??\(´・_・` )/?? @HiraokaTakuya
まあ僕くらいになるとずっと検討のソフトが変わらない時点で次の大会がある事は分かっていました(後出しドヤァ)
https://twitter.com/HiraokaTakuya/status/1015239963158253574
キャーヒラオカサンカッコイー >>181
SDT6が開催されるので、出場予定者を混乱させないため、今後はレシピを出しません
評価関数自体は、強くなれば公開します 全ての対局にプロ棋士の解説が付けば
1ヶ月の開催期間だろうと視聴者はつくよ
逆に現行ルールでもプロ棋士が一切派遣されなければ
放送では閑古鳥が鳴く事になる 放送視聴者がポナンザの幻影追ってるだけじゃん
ぽんぽこは優秀なソフトだよ まぁ、1か月の開催期間は普通に考えれば開発者に負担がかかりすぎて誰も参加しないよw 定跡や対ソフト戦術特化のソフトが優勝して
結局リスナーがポナンザ、ポナンザ言い出す流れ SDTって別に最高レーティングのソフトを探す大会じゃないでしょ
その目的はまさに自分のサイトでやればいいことじゃないの 視聴者はまだしも、解説の棋士が何度もチェンジ要請したのが痛いよね。 実際、ぽんぽこの評価値は他の評価関数に比較して大きめに出るけど、
それ以上に、ニコ運営がちゃんとハッシュサイズとかその他の設定をしっかりしているのかが気になる 検討用ソフト選考としてはSDTは機能するわけがない
あの程度の試行回数で意味のある結果がえられるとかありえんわ
所詮はおまけだな >>198
例えるなら運転初心者が最新鋭のスポーツカーを
乗りこなせないのと同じ様に感じる すごい見解
suimon@floodgate_fan
詳しくは動画を見てほしいけれど、
ヒカルさん曰く
才能×努力×時流
だそうです。
午前8:23 · 2018年7月7日
suimon@floodgate_fan
嫌われながら好きなことで、生きていく「起業家-ヒカル」 (link: https://youtu.be/OcsN5iD7C-s) youtu.be/OcsN5iD7C-s @YouTubeより まふさん夏なのにフローズン(氷結)していないで
ページ更新してください 少し期待しています >>175 棋譜ちょっと見たら
後手:NNUEkai2/GW3はほぼ全部横歩取り
後手:QQR/GWはほぼ全部角換わり
だね. >>198
少なくともFailHigh・Lowしたときの読み筋表示はやめてほしいよね
1手か2手先までしか表示されないからぽんぽこの候補手の意図がわからない nnue kai2は後手横歩を避けるだけで勝率上がりそう そろそろデータサイズの大きいKPP_KKPT型とKPPT型の評価関数を
整理してHDDとSSDの空き容量を増やそうかな >>205
公開してないものは信用できない、あと公開しないってことは強いのが出来ていないか相性問題がある可能性がある
探索もnnuekaiとnewevalの対局でnnuekaiと相性の良いGW3を使っていないのとnewevalと相性が良い可能性がある探索でnnuekaiと検証しているのも公平でない
現時点でまふさんのnewevalがnnuekaiより強いっていう根拠はない、QQRもY4.82よりGW5.0.5の方が相性がいいように他の評価関数も探索は相性がある 今年のSDTはヨーキー作戦を何チームが使うのかな。 48がNNUE手元で学習させただけで独自性とか言っててびっくりしたわ
そんなのこのスレだけでも何人いるんだよ 独自性:探索パラメータを極微小値変更するという新しい試み。0.00001単位でグリッドサーチを行い最適な探索パラメータ値を探した。
その結果、元との勝率52%を実現。
みたいな。 そんな感じでいいならこのスレの人間で連合軍組んでSDT6出れるな
非難の嵐だろうけども
素人がどこまで強く出来るのかは気になる GSP将棋を将棋所でエンジン一覧から追加しようとしてるんですが、
「要求された操作には管理者特権が必要です」と表示されて、
エンジンを追加できません。どうしたらいいでしょうか?
よろしくお願いします。 NNUEkaiとNNUEkai2は今のところほぼ互角で千日手が3分の1以上と多すぎる
NNUEkai-GW3 9-9-8 NNUEkai2-GW3 持ち時間5分 一手ごとの加算20秒 定跡なし スレッド2 Hash1024 投了値1000
対局数は全然少ないが、ここまで対局を見てきた印象ではNNUEkai2が強くなっている感じはなかった
超短時間だとNNUEkaiが強い
NNUEkai-GW3 255-15-230 NNUEkai2-GW3 一手0.1秒 定跡なし スレッド2 投了値2000 対局30局で終了、千日手が多すぎる
NNUEkai-GW3 11-10-9 NNUEkai2-GW3 持ち時間5分 一手ごとの加算20秒 定跡なし スレッド2 Hash1024 投了値1000 超素人にとっては、NNUEインストールするだけでもヒーヒー言いながらやってるし、
そういうレベルの人でもマシンと電気代だけは協力してくれるだろう。
だからダウンロードしてダブルクリックしてインストールするだけでNNUEガチャを回してくれるソフトほしいぞ…。 NNUEならR+200なんて楽勝!
NNUEこそ次世代を担うもの!
そして、2か月が経過しました。 昔の知り合いが今この分野にいるらしい
時代の最先端なのか? チェスでいったらこれ?ポンダーがどうたら言っているってことは
> the Chess Engine Communication Protocol protocol is preferred by some
> because it allows greater flexibility for the engine (for instance, in pondering).
https://chessprogramming.wikispaces.com/Chess%20Engine%20Communication%20Protocol >>227
【波紋】波紋を描く・起こす・及ぼす・生ずる・広げる・呼ぶ 河童さんと野田さんが動くなら本格的にUSIの後継プロトコルが出来るかも。期待してる ステートマシンとして見ると未定義状態があるというとんでもないプロトコルだったからな(なので実装側でなんとなく埋めてた) 人間より遥かに強くなった将棋ソフトの登場で結局「どうすれば勝ちやすいのか」みたいな法則って解ったの? >>234
将棋素人だけど、高度な作戦に対しては「どうすれば負けにくいのか」も同時に発明されるから、結局棋力次第になってしまうのでは。 >>234
PCではかなり強くなったが、iPhone/iPad用将棋アプリではあまり強くなっていない
iPhoneで六枚落ち対局が楽しめるアプリが登場しないものかと思っている >>237
選手権放送でのレミさんの発言だとゲーム会社のアンバランスが関係してたみたいだし、そう簡単にはやめないんじゃない? 1手2秒 6スレッド 200戦 探索部はやねうら王に統一
NNUE KAI2対QQR
107-4-89
NNUE kai2から見えて勝率54% 95% 信頼区間 [0.475, 0.61]
200戦じゃ有意差は出なかった。 推測だが終盤になるほど手が狭くなる囲碁等他のテーブルゲームに比べ
将棋は反対に終盤になるほど手が広くなるのでDLに不向きなのでは?
持ち駒という概念は他のテーブルゲームには無いと思う
囲碁やチェス等と同じやり方をしてもあまり強く出来なかったのではないか
GoogleやPONA山本が早々に壁にぶち当たって撤退した理由はこれかも
まふさんのページに”将棋を「ディープラーニング」してみた”と書いてあるが... >>239
CSAプロトコルで許されざるのは、
反則手を送りつけてから
次の行で#ILLEGAL_MOVEと通知してくることだ
これがために開発者は次の2者択一を迫られる
1. サーバから送られてきた指し手をいちいち合法手かチェックする
2. 次の行で#ILLEGAL_MOVEが送られてこないか、適当なタイムアウト時間を設けて待つ
どっちにせよ指し手を受け取ってすぐに思考を開始するということができない DCNNとNNUEでは速度も層数も全然違うから同じDLでも別物と考えるほうがよくない? AI将棋やってる人も将棋に興味あるわけじゃなくて、
AIとかプログラミングって所から流れてきてる人も多いんだろうな
上のほうでも出てたけど、別に将棋に思い入れのない人は
次はRTSの自動化とかするわけ?まぁもともとあれcom相手だけど 将棋にも特にDLが有効って感じはしないが、ほかにずば抜けた手法があるわけでもなくて、従来のKPPTとごっちゃになって開発が続いてるイメージだったが、最近はNNUE一択? 相変わらずゴチャゴチャやってんな
elmoの時にあーだこーだやって、これは凄いと思ってたけど、SDT5のAperyでアホらしく思ったもんな
同じくSDT5であーだこーだやっててもWCSC28クジラちゃんでサクッと屠殺
WCSC28素材でチマチマやってても、どうせSDT6でその3倍くらい強くなってるのがサクッとフリー公開されるんだろ? MCTSを取り入れるところでチャンスはありそうだけどね >>253
モータースポーツに近いって誰か言ってなかった? >>254
Googleアルファ碁が名前つけてくれなかったけど、あのツリーサーチ手法は、
実はモンテカルロしないで評価関数を使うところが肝だったりする。
個人的にはnon-MonteCarlo Tree Searchと呼んでる。 結局手法もそうだけど資金力が大事なんだよね
その手法の限界の強さにいくまでかなりの時間か金がかかるから>>253みたいに思う人がいる >>257
>257
マジでそれ。原爆設計のマンハッタン計画を人類の本気モード100%としたら、コンピュータ将棋は0.1%くらいじゃないか。
兆円単位の資金だけじゃダメで、世界の学術的進歩を数年間停滞させるレベルで超一級の人材を世界中から吸い上げてる必要が有るから、
そうしたエリート達が協力してくれる大義名分としてはコンピュータ将棋はショボすぎるので、まず無理だろうが。侵略してきた宇宙人と何故か将棋で戦うなら別。 >>248
いくつかのタイプがあるようだ
・将棋好きなプログラマ
・AI研究者が手頃なゲームとして将棋を選択
・チェスや囲碁のソフト開発者が将棋にも手を出した >>243
なるほど、やはりこちらにも欠陥があるのか
USIを捨ててCSAプロトコルを標準入出力ですれば良いのでは、とか素人考えで思ったけど
そう簡単ではないね 将棋とはどういうゲーム?
と聞かれたらプログラマ的な回答はどんなん? >>262
よく聞くのは
二人零和有限確定完全情報ゲーム
とかだけと、プログラマとかだと記号で表記できそう。ヒルベルト・プログラム的な考え方だとどういう記号で表すんだろ。 間もなく始まるTCEC13では、運営ディレクターから「少なくともGTX1080Ti1枚」を環境に入れ、
または「複数枚のグラボを入れるか、さもなくばTitan V1枚」の可能性も検討しているらしい。
TCEC13に参戦するLeela Chessにとってこれは朗報だが、
その他にもNNベースのソフトの参戦の可能性があると運営が示唆しているとのこと。
https://www.reddit.com/r/chess/comments/8vxswz/tcec_is_getting_a_gpu_setup_for_season_13_for/ よく考えてみたら、公開してるライブラリを使ったソフトを乗っけて売っても何も問題無い訳なん!? スーパー行くとFラン学生がいてマジキモイ
たたずまいや内面がキモイ
AI将棋界隈もキモメンは多いが、頭はいいから R4000すげーってなってこのレベルの強さにも非があるというのが実感湧かなかったけど、いまこのレベルのソフトがぼこぼこにされてる棋譜や読み筋や評価値をみるとまだまだ粗があったんだなってわかって気持ちになる >>262
ゲーマー的に解答してみる
・ミス/悪手を指した方が不利になる。
・双方最善手を指すと有利な方が少しずつ有利を拡大する。
・一般的には悪手率の低いプレイヤーが強い。
・悪手率の低いプレイヤー同士が対局すると手数が伸びる。
・持ち駒制のため、持ち駒制の無いゲームに比べて駒得は2倍有利。
・持ち駒制のため、中盤以降は双方の攻撃力が上がり、一手の価値が上がる。
・攻撃側は終盤、駒損でも手番/イニシアチブを重視する。
・王手、詰めろ、大駒への当たり等によりイニシアチブを奪うことができる。
・駒損の攻めが切れてイニシアチブを失うと一気に不利に働き逆転しやすい。これは終盤で起きやすい。 小売店や飲食店ぐらいしか行かない生活なんだが、
そういう所で働いてる人間とかに大した人間はいないと悟ったよ
道理で外へ出ても大した人間がいないわけだ
その辺で会える人で俺の立場や感性に近いのは銀行員か
スーパーへよく行ってると嫌なバイト店員と顔見知りで
対等な立場の気がしてくるが、そいつが銀行へ行ったら馬鹿だし
銀行員とは話は合わんだろう >>271
anti_suimonはどこからどう見てもsuimonの複垢なんだよなあ。
https://mobile.twitter.com/anti_suimon/status/1016675809187094530
対四間飛車mztn流は始まりました
@anti_suimon
日頃からfloodgateにびっちり張り付いていればびっくりなんてしないんだよな。
西尾明
@nishio1979
今日の棋聖戦の将棋、floodgateに▲2二歩までの実戦例があってちょっとびっくり。
埋め込み
午後10:29 · 2018年7月10日 >>262
古いけどやねうらおさんの「将棋方程式を発見した!」って記事おすすめ ルールだけの状態から数日?で無双になる
まで言われたらAlpha先生の棋譜が見たく
なるのが人情ってものじゃないか! 世界的IT企業が出てる囲碁AI大会から逃げてるせいでリジェクトされちゃったんじゃないですか 散々既出かもしれないんですけども、elmoを圧倒したAlpha zeroを使ったcrazy shogiが手も足も出ず一次敗退ってどういう結論になったんですか?
googleのフカシだったのかcrazy shogiが全く生かせてなかったのか他が無茶苦茶強かったのか >>281
残念ながら、個人の投資できるハードウェアでは、google の再現を行うところまで行けないため、強くなるのか実は弱いのかの検証すらできない状態です >>281
あれについてはCrazy Shogiの学習期間不足
Googleほどのマシンパワーが用意できない以上、大会直前から学習開始では遅すぎた
あと初参加で一時予選勢の白ビールとPALがelmo_WCSC27を圧倒できる強さだったから「他がめちゃくちゃ強かった」っていうのも当てはまるかも Googleの演算は数千万円かかるらしいけど、
あと何年で日本のプログラマのポケットマネーで出来るように安くなるんだろ…
スパコンは10年で約100倍の性能になるのだから、10年後くらいか? >>281
AlphaZero将棋はありまぁす
オボちゃんは底抜けのアホだけど、
クソミソに叩かれるのは理不尽だったと思う
Googleのこれも似たようなもんだろ 棋譜は出さないソフト実物どころか手法の詳細すら説明しないだけど強さだけは強調と
やってることだけはどこかの人と同じ uuunuuunさんが2016年に行った「ソフトR、プロRとの比較」の記事を参考に表にしてみた
4CPUで同じ持ち時間でコンピュータを動かした場合の比較
プロ棋士 現在該当なし(R1951)レベル・Apery_WCSC25(R3151)
豊島将之 1位(R1870)レベル・?
プロ棋士 4位(R1830)レベル・Apery_20150327(R3041)
藤井聡太 6位(R1820)レベル・?
プロ棋士 83位(R1542)レベル・Bonanza6(R2765)
プロ棋士157位(R1346)レベル・Bonanza4.1.3(R2608)
里見香奈 女流1位(R1181)レベル・? >>281
レミさんがちょくちょくサボってたのが祟って1〜2ヶ月学習させないといけない所を1週間しかやらなかったからね再現とかそれ以前の問題だよ 結局まふ評価関数(new eval)の再現できた人いなかったな。 今は対elmoの成績だけ見てみるとAlphaZero最強とも言い切れなくなってきた感じ
特別将棋にも有効って感じはしないが向こうからしたら別に将棋を究めたいわけではないだろうし、ぶっちゃけある程度の結果がだせたらあとはわりとどうでもいいのでは チェスや囲碁と比べると訴求力も低いし
わりとどうでもいいというのは当たってると思う まふ評価関数は探索パラメータを有利に設定してあるだけで実際はR100も伸びてなさそう >>289
里見は奨励会員レートを考慮すればR1400-1450の間くらいの実力はある まふは将棋界には関わらないで欲しいですね
自己顕示欲強く出てくるのだが迷惑です
将棋ソフト開発者にすり寄るのはやめて下さい 自作評価関数はQQRに勝率8割近いとか言ってたのになぜかNNUEkai2に興味津々 公開出来ないのは探索パラメータ依存だからと考えると全ての辻褄が合う いうてもレート10上げるのもヒーヒー言うくらい大変なんだから30上げた事に免じて多少は大目にねっ?
虚言妄想癖があって自分以外の物を貶して持ち上げるしかない異常者だけれどもw まふさんは開発者の人より強いの作れてるのがすごいな まふさんも開発者の人もどっちも公開してないのに何を言ってるんだ?エスパーか? sdt6まではnnuekai、illqhaの人の公開に期待、まふさんは自慢が好きなので公開はしないだろう
評価関数の使いまわしはいろんな要素が加わって強くなりやすいので賛成なんだが 個別のプログラマの挙動を云々する野も良いが、
次の大会あたりまでに本当に新しい手法が飛び出すのに期待。 趣味が高じて…っていうパターンもありそうだけども… NNUEkaiの人が褒められる
Ryoto_Sawada@Qhapaq @Qhapaq_49
なんとかchに潜むnnue関数。
学習パラメタがほぼ復元可能な形で書かれていますがパラメタから「コヤツ出来るな」感が漂っています。
なお、私は未だに基礎解析を終わらせていないので偉そうなことをいうほどの成果を出していません(キリッ
illqhaの人も褒められる
Ryoto_Sawada@Qhapaq@Qhapaq_49
illqhaっていいネーミングじゃ(某掲示板を見ながら で、常識を覆す新手を連発し他ソフトを角落ちで負かしレート+200は堅いNNUE最新版はいつ公開されるの? ヤバすぎで棋譜すら公開できないらしい。
いまの常識を覆す手を連発するってことかな まふさん作成のは既にR4400あるからNNUEkaiより強いんだな depth10の1億の教師でR200を上昇させるDLに界隈で頂点を極めた「まふ関数」
友達のグーグル社長に引き抜きかけられちゃう可能性が高い稀代の大天才 qhapaq wcsc28に勝率89%なんだよなぁ。 >>99
> >>95
>
> >>52のおまけ2に入っているillqhaというNNUE評価関数+NNUE対応探索部が
> 現在入手できる最強のエンジンです プログラムサイズも小さいのでスマホや
> ノートパソコンでも使いやすい 探索部は検索してください どれも大同小異です
>
> 但し2週間以内にもっと強いエンジンがupされる見込みです
期待してます。
昨日illqhaを登録してGW3に設定してGW5.0.5 QQRと1秒、2秒、3秒、10秒で4回対戦してすべて3勝1敗でした。
Kai2とも対戦しました。こちらは6回戦(2秒)で4勝2敗と優秀です。
2週間後さらに強化されるのを楽しみにしています! 駒落ちで試したらとんでもない結果が生じたw
上手のillqhaは5秒で下手のGW505 QQRは1秒で対戦させてみた。
https://i.imgur.com/oqveL5G.png
開始日時:2018/07/14 21:39:03
手合割:二枚落ち
下手:GW505 QQR
上手:illqha
手数----指手---------消費時間--
1 2二銀(31) ( 0:03/00:00:03)
2 1六歩(17) ( 0:00/00:00:00)
3 3二金(41) ( 0:04/00:00:07)
4 7六歩(77) ( 0:00/00:00:00)
5 3四歩(33) ( 0:04/00:00:11)
6 9六歩(97) ( 0:00/00:00:00)
7 3三銀(22) ( 0:04/00:00:15)
8 7八銀(79) ( 0:00/00:00:00)
9 5四歩(53) ( 0:04/00:00:19)
10 4八銀(39) ( 0:00/00:00:00)
11 6二玉(51) ( 0:04/00:00:23)
12 4六歩(47) ( 0:00/00:00:00)
13 9四歩(93) ( 0:04/00:00:27)
14 6八玉(59) ( 0:01/00:00:01)
15 7二玉(62) ( 0:04/00:00:31)
16 5八金(49) ( 0:00/00:00:01)
17 6二銀(71) ( 0:04/00:00:35)
18 2六歩(27) ( 0:00/00:00:01)
19 5三銀(62) ( 0:04/00:00:39)
20 2五歩(26) ( 0:00/00:00:01) 21 4四歩(43) ( 0:04/00:00:43)
22 7九玉(68) ( 0:00/00:00:01)
23 6四銀(53) ( 0:03/00:00:46)
24 6六歩(67) ( 0:00/00:00:01)
25 5二金(61) ( 0:04/00:00:50)
26 4七銀(48) ( 0:00/00:00:01)
27 5三銀(64) ( 0:04/00:00:54)
28 6五歩(66) ( 0:00/00:00:01)
29 3五歩(34) ( 0:04/00:00:58)
30 5六銀(47) ( 0:01/00:00:02)
31 1四歩(13) ( 0:04/00:01:02)
32 4五歩(46) ( 0:00/00:00:02)
33 同 歩(44) ( 0:04/00:01:06)
34 同 銀(56) ( 0:00/00:00:02)
35 4四歩打 ( 0:04/00:01:10)
36 5六銀(45) ( 0:00/00:00:02)
37 4三金(52) ( 0:04/00:01:14)
38 7七角(88) ( 0:00/00:00:02)
39 3四銀(33) ( 0:04/00:01:18)
40 4五歩打 ( 0:00/00:00:02)
41 3三桂(21) ( 0:04/00:01:22)
42 4四歩(45) ( 0:00/00:00:02)
43 同 銀(53) ( 0:04/00:01:26)
44 6七金(58) ( 0:01/00:00:03)
45 2五銀(34) ( 0:03/00:01:29)
46 4五歩打 ( 0:00/00:00:03)
47 5三銀(44) ( 0:04/00:01:33)
48 8八玉(79) ( 0:00/00:00:03)
49 3四銀(25) ( 0:04/00:01:37)
50 8六歩(87) ( 0:00/00:00:03) 51 4二金(43) ( 0:04/00:01:41)
52 8七銀(78) ( 0:00/00:00:03)
53 6二玉(72) ( 0:04/00:01:45)
54 4四歩(45) ( 0:00/00:00:03)
55 4三歩打 ( 0:04/00:01:49)
56 同 歩成(44) ( 0:00/00:00:03)
57 同 金(42) ( 0:04/00:01:53)
58 4五歩打 ( 0:00/00:00:03)
59 4四歩打 ( 0:04/00:01:57)
60 同 歩(45) ( 0:01/00:00:04)
61 同 銀(53) ( 0:04/00:02:01)
62 9八玉(88) ( 0:00/00:00:04)
63 5二玉(62) ( 0:04/00:02:05)
64 7八金(69) ( 0:00/00:00:04)
65 7四歩(73) ( 0:04/00:02:09)
66 6四歩(65) ( 0:00/00:00:04)
67 同 歩(63) ( 0:03/00:02:12)
68 6五歩打 ( 0:00/00:00:04)
69 同 歩(64) ( 0:04/00:02:16)
70 同 銀(56) ( 0:00/00:00:04)
71 4六歩打 ( 0:04/00:02:20)
72 2四歩打 ( 0:00/00:00:04)
73 同 歩(23) ( 0:04/00:02:24)
74 同 飛(28) ( 0:01/00:00:05)
75 2三歩打 ( 0:04/00:02:28)
76 3四飛(24) ( 0:00/00:00:05)
77 同 金(43) ( 0:04/00:02:32)
78 2四歩打 ( 0:00/00:00:05)
79 4三玉(52) ( 0:04/00:02:36)
80 5六金(67) ( 0:00/00:00:05) 81 2八飛打 ( 0:04/00:02:40)
82 6三銀打 ( 0:00/00:00:05)
83 5三銀(44) ( 0:04/00:02:44)
84 3六歩(37) ( 0:00/00:00:05)
85 9五歩(94) ( 0:04/00:02:48)
86 3五歩(36) ( 0:00/00:00:05)
87 同 金(34) ( 0:04/00:02:52)
88 5四銀(63) ( 0:01/00:00:06)
89 同 銀(53) ( 0:03/00:02:55)
90 同 銀(65) ( 0:00/00:00:06)
91 同 玉(43) ( 0:04/00:02:59)
92 5五金(56) ( 0:00/00:00:06)
93 6三玉(54) ( 0:04/00:03:03)
94 6四歩打 ( 0:00/00:00:06)
95 7二玉(63) ( 0:04/00:03:07)
96 5四金(55) ( 0:00/00:00:06)
97 6二歩打 ( 0:04/00:03:11)
98 6三歩成(64) ( 0:00/00:00:06)
99 同 歩(62) ( 0:04/00:03:15)
100 5二銀打 ( 0:00/00:00:06)
101 8二玉(72) ( 0:04/00:03:19)
102 6三銀成(52) ( 0:01/00:00:07)
103 6六歩打 ( 0:04/00:03:23)
104 6八歩打 ( 0:00/00:00:07)
105 9六歩(95) ( 0:04/00:03:27)
106 8八玉(98) ( 0:00/00:00:07)
107 2九飛成(28) ( 0:04/00:03:31)
108 6六角(77) ( 0:00/00:00:07)
109 4五金(35) ( 0:04/00:03:35)
110 9四歩打 ( 0:00/00:00:07) 111 6五歩打 ( 0:03/00:03:38)
112 9三角成(66) ( 0:00/00:00:07)
113 同 桂(81) ( 0:04/00:03:42)
114 4九歩打 ( 0:00/00:00:07)
115 同 龍(29) ( 0:04/00:03:46)
116 9六香(99) ( 0:01/00:00:08)
117 6六角打 ( 0:04/00:03:50)
118 7七桂(89) ( 0:00/00:00:08)
119 9九銀打 ( 0:04/00:03:54)
120 9七玉(88) ( 0:00/00:00:08)
121 8九龍(49) ( 0:04/00:03:58)
122 9三歩成(94) ( 0:00/00:00:08)
123 同 香(91) ( 0:04/00:04:02)
124 同 香成(96) ( 0:00/00:00:08)
125 同 玉(82) ( 0:04/00:04:06)
126 9五歩打 ( 0:00/00:00:08)
127 8四桂打 ( 0:04/00:04:10)
128 8八桂打 ( 0:00/00:00:08)
129 7七角成(66) ( 0:04/00:04:14)
130 9四香打 ( 0:01/00:00:09)
131 8二玉(93) ( 0:00/00:04:14)
132 9三香成(94) ( 0:00/00:00:09)
133 7一玉(82) ( 0:00/00:04:14)
134 8二成香(93) ( 0:00/00:00:09)
135 同 玉(71) ( 0:00/00:04:14)
136 7二成銀(63) ( 0:00/00:00:09)
137 同 玉(82) ( 0:00/00:04:14)
138 6三金(54) ( 0:00/00:00:09)
139 同 玉(72) ( 0:00/00:04:14)
140 1五歩(16) ( 0:00/00:00:09) 141 8八銀(99) ( 0:00/00:04:14)
142 同 金(78) ( 0:00/00:00:09)
143 同 龍(89) ( 0:00/00:04:14)
144 投了 ( 0:00/00:00:09)
まで143手で上手の勝ち 4回とか6回じゃ優劣判断できないよ。
6戦全勝でも有為差はない >>328
ガイジという5ちゃん用語を条件反射のように使うやつは
相当5ちゃんの世界に毒されていると言える。
棋譜をまともに貼れないのなら貼る方法を教えてくださいよw
行数オーバーで晴れないことぐらいわかれよ。 開始日時:2018/07/14 21:39:03
手合割:二枚落ち
下手:GW505 QQR
上手:illqha
△2二銀 ▲1六歩 △3二金 ▲7六歩 △3四歩 ▲9六歩 △3三銀 ▲7八銀
△5四歩 ▲4八銀 △6二玉 ▲4六歩 △9四歩 ▲6八玉 △7二玉 ▲5八金右
△6二銀 ▲2六歩 △5三銀 ▲2五歩 △4四歩 ▲7九玉 △6四銀 ▲6六歩
△5二金 ▲4七銀 △5三銀 ▲6五歩 △3五歩 ▲5六銀 △1四歩 ▲4五歩
△同 歩 ▲同 銀 △4四歩 ▲5六銀 △4三金右 ▲7七角 △3四銀 ▲4五歩
△3三桂 ▲4四歩 △同 銀 ▲6七金 △2五銀 ▲4五歩 △5三銀 ▲8八玉
△3四銀 ▲8六歩 △4二金引 ▲8七銀 △6二玉 ▲4四歩 △4三歩 ▲同歩成
△同金直 ▲4五歩 △4四歩 ▲同 歩 △同 銀 ▲9八玉 △5二玉 ▲7八金
△7四歩 ▲6四歩 △同 歩 ▲6五歩 △同 歩 ▲同 銀 △4六歩 ▲2四歩
△同 歩 ▲同 飛 △2三歩 ▲3四飛 △同 金 ▲2四歩 △4三玉 ▲5六金
△2八飛 ▲6三銀 △5三銀 ▲3六歩 △9五歩 ▲3五歩 △同 金 ▲5四銀引
△同 銀 ▲同 銀 △同 玉 ▲5五金 △6三玉 ▲6四歩 △7二玉 ▲5四金
△6二歩 ▲6三歩成 △同 歩 ▲5二銀 △8二玉 ▲6三銀成 △6六歩 ▲6八歩
△9六歩 ▲8八玉 △2九飛成 ▲6六角 △4五金 ▲9四歩 △6五歩 ▲9三角成
△同 桂 ▲4九歩 △同 龍 ▲9六香 △6六角 ▲7七桂 △9九銀 ▲9七玉
△8九龍 ▲9三歩成 △同 香 ▲同香成 △同 玉 ▲9五歩 △8四桂 ▲8八桂
△7七角成 ▲9四香 △8二玉 ▲9三香成 △7一玉 ▲8二成香 △同 玉 ▲7二成銀
△同 玉 ▲6三金 △同 玉 ▲1五歩 △8八銀 ▲同 金 △同 龍
まで143手で上手の勝ち >>330
>>332を使って、プラスKI2で出力すると>>333のようになる
すぐガイジと言い出すのもどうかと思うけど、まずは棋譜の貼り方を覚えよう >>322
時間消費みる限りNetworkDlayが0になってなくて時間フルに使えてないことない? ・ただ上手が勝っただけの結果を、とんでもない結果が生じたw という煽り文で表現。具体的な主張はなし
・サポートされていない駒落ちの話自体が無意味
・というか、そもそも>>335
・棋譜の貼り方わからないから教えろと逆ギレ
・行数オーバーで張れないから、フル行連レスでスレ汚してもいいという性根 >>334
ありがとう!
KI2で出力すればいいとは知らなかったw QQRとNNUEkai2を一手3秒でPC3台使って対局させてたが、暑さでリタイアしたw
性能のバラツキでNPSは200から600万位
途中結果ですが合計でkai2から見て191勝171敗引き分け(256)21でした
傾向としてNPSが早い方がkai2の勝率が良かった様でした >>322
KI2形式なら1レスにまとめて書き込めるから覚えててね 野田さんがCOMP飲んでるけど、ソイレントに比べて高すぎる上にソイレントと違って長期期間の実験してないからCOMPだけの生活してるならやめたほうがいいと思う 5秒と1秒は大分精度に差が出るからねー。
というか、1秒だと悪手率が一気に上がる。
別にとんでもない結果でもないね。 NetworkDelayらを0にしないで短時間対局させる奴がいるのか、まさに恐怖だな
掲示板に貼られる対戦結果にどれだけの信憑性があるのか 人間より強い将棋ソフト出てきてから大分経つのに将棋は基本こういう風に指せば有利ですよ勝ちやすいですよみたいな法則が出てきてないのは面白いな
人間にはその法則を理解出来ないだけでソフトはもう掴めてるのかもしれないけど >>344
>基本こういう風に指せば有利ですよ勝ちやすいですよみたいな法則
→居飛車。 ShogiDroidのNNUE、1手5秒で設定してて先読みオフにしてるのに、こっちが指すとノータイムで返してくる。
でも見たらノード数2000とかしか出てないから明らかなバグ
対処方法ありますか? >>347
試したけど普通に1手5秒で指して来るよ
エンジンの設定を変にいじったんじゃないの? RYZEN買おうか悩んでるけど
NNUEでNPSどれだけ出る? >>348
再起動したら治った
1000くらいハンデもらったのに普通に負けてしまったのが悲しい >>350
その頃はIntel買うから・・・
2700XでもAVX系のベンチだと、8700Kに負けてたりするから
NNUEだとどうなのかなと NNUE動かすなら今年後半出るって噂のインテル8コアでええやん 9900k >>352
そうか
3800X(?)が16コアで定格4.0GHzくらいかなと予想して良さそうだと思ってるんだけど微妙かな? https://21.gigafile.nu/0723-c181030ec8e9314bbd6439835ce3d9ca1
おまけ3を公開します
わかりやすく強くはなっていないかもしれませんが、弱くはなっていないと思います
なんとなくコツがつかめてきた気がするので、また2~3週間後になったら公開します
例によって計測等はほどほどにしておいてください(またすぐ次が出来るので) 1700で開発してるのか。さすがに厳しいな
AMD派なら8月リリースの32コア64スレッド 2990Xがええんちゃう suimonさんの最近のプロ棋士に対する失礼な言動をまとめてみた^^
対四間飛車mztn流は始まりました
@anti_suimon
. @chidanza
6h_humanさんがfloodgateに現れましたね。tenukiが相手とはいえ、さすがの勝ちっぷりです。
(link: http://wdoor.c.u-tokyo.ac.jp/shogi/view/2018/07/12/wdoor+floodgate-300-10F+6h_human+tenuki+20180712150000.csa) wdoor.c.u-tokyo.ac.jp/shogi/view/201…
午後6:53 · 2018年7月12日
対四間飛車mztn流は始まりました
@anti_suimon
日頃からfloodgateにびっちり張り付いていればびっくりなんてしないんだよな。
西尾明
@nishio1979
今日の棋聖戦の将棋、floodgateに▲2二歩までの実戦例があってちょっとびっくり。
午後10:29 · 2018年7月10日
390 名無し名人[] 2018/07/16(月) 12:02:30.22 ID:QhGvGjub
底辺プロに圧勝とはやるじゃん
391 名無し名人[] 2018/07/16(月) 14:10:31.51 ID:hfZFMFW/
プロ撃破!!
正直すごいと思う。 >>360
スレ違い、将棋ソフト愛好家からしたら定跡や指し手の研究家のsuimonさん関連は興味ないだろ
以下suimonさんに関するスレがあるんだが、こっちに行ってくれ
「suimonユキ_feat.mztn7応援スレッド16」
https://mevius.5ch.net/test/read.cgi/bgame/1530536517/ https://dotup.org/uploda/dotup.org1586654.jpg.html
1手2秒6スレッド200戦
探索やねうら王統一で対QQR勝率53%
たぶんNNUE kai kai2と同じくらいの強さ >>356
YaneuraOu-NNUE-dolphinを使用したnnue_illqha1.1
1秒対戦でNNUEkai+GW3に勝ち越しました
次の公開待ってます 遅くとも7/14に開始予定とアナウンスされていたTCEC 13はまだ開幕せず
噂によるとGPUの導入のために遅れているとか
そんななか、LeelaChessZeroは世界コンピュータチェス選手権に参加中
ところで、世界コンピュータチェス選手権と世界チェスソフトウェア選手権って併催だったのね
初めて知った(前者がハードウェア制限なし、後者が統一ハード) KPPTならQQR、Qhapaq
NNUEならkai2、illqha1.1 >>365
>>366
計測ありがとうございます、多少は強くなっていそうですね
同エンジンでの計測もいいですが、せっかくエンジンもつけてみたので使って頂けると嬉しいです NNUE系は先手で角換わりばかり指すけどQQRやqhapaqは横歩取りばかりなのが興味深い 戦型の志向って割とどうでもいいところだと思う
評価値に差があれば、それが意味のある差かどうかに関わらず片方しか選ばないんだから >>356
> https://21.gigafile.nu/0723-c181030ec8e9314bbd6439835ce3d9ca1
>
> おまけ3を公開します
> わかりやすく強くはなっていないかもしれませんが、弱くはなっていないと思います
> なんとなくコツがつかめてきた気がするので、また2~3週間後になったら公開します
> 例によって計測等はほどほどにしておいてください(またすぐ次が出来るので)
早速試してみましたが明らかに前回より強くなってると感じました。
お仕着せ探索エンジン:YaneuraOu-NNUE-dolphin-by-clang-tournament-avx2.exe
illqha1.1 vs GW505 QQR 1秒 3勝3敗
illqha1.1 vs GW505 QQR 2秒 6勝0敗
GW3バージョン:YaneuraOu-TNK-NNUE-whale6_Ditto-AVX2.exe
illqha1.1 vs GW505 QQR 1秒 6勝0敗
illqha1.1 vs GW505 QQR 2秒 6勝0敗
illqha1.1GW3 vs illqha1.1DOL 4勝2敗
illqha1.1GW3 vs illqha1.1DOL 3勝3敗
特にQQRに1秒、2秒対戦とも6勝0敗には魂消ました。
見ていた感じでは途中で劣勢になっても最後に逆転で詰めている
ケースが2度ほどありました。 >>372
計測ありがとうございます
対局数少ないので統計的にはなんともいえないですが、終盤強い感が出ているなら良かったです
終盤強いのはNNUEの特徴ですが、前回より終盤を少し多めに学習させてみたのでその傾向を生かせましたかね >>373
棋譜を確認したのですが1秒探索ぐらいではいくら強いソフトでも自玉の詰み
を発見できるとこまで探索できてない気がします。その局面で検討させたら
10秒かければすべてのソフトで最善手を発見してました。何秒ぐらいで発見
出来てたのかはわかりませんがコンピュータソフトの探索数を制限する限定
大会でも開催すると優勝まちがいなしなのかもしれませんね。 illqha1.1illqha1.1+おまけエンジンとGW-QQRを対局させてみました
対局数は各100局と少ないですが一手5秒です
illqha1.1illqha1.1からみて
E5-1660 6スレ
67勝32敗分け2
Ryzen1700 8スレ
65勝31敗分け4
X5670*2 12スレ
60勝36敗分け4
でした >>375
自分も一手2000万ノードで検証したら同程度の結果になった
なぜか同じやねうら王エンジンで両者を対局している人がいるけど探索と評価関数のセットで一つのソフトなので、あえて同じやねうら王エンジンにする必要はないと思うんだが 一番強さが出る探索を使用して検証するのが理想だが、あえて勝率が落ちる探索を使用して検証して意味があるんだろうか おまけエンジンDittoで再現するにはどんな数値にすればいいの? >>375
随分時間がかかる計測ありがとうございます
思ったより勝ち越しますね
dolphinが中程度の時間でも中々いいパラメーターだったんじゃないかと思いますが嬉しい誤算ですね
まふさんはもっと時間をかけて細かく調整したと思われるのであの勝率もやっぱり不思議ではないですね
というかそれだけ計算資源があれば学習に挑戦すれば私よりはるかに早く強くできますのでいかがでしょう
>>378
付属のソースのengineの中のparamを見ていただけば丸わかりです
gccでビルドしたDittoでは付属のものより5%以上NPSが落ちるかもしれません illqhaの開発者の方、ぜひTwitterなどで発信して頂きたいです illqhaの開発者の方、もうTwitterアカウントをお持ちなのですね
Twitterの方でもソフトへのリンクを発信して頂きたいです QQR+GW5でR4244なので、それに勝率65%ということは(自分の検証でも一手2000万ノードで同程度)、ほかの評価関数との
相性を考えなければillaha1.1+dolphinでR4352になっている、いくらなんでもレートが上がりすぎだろ
elmo_wcsc27+yane_v4.74_avx2に対しても10局やって10-0だった、他の強豪ソフトはどう組み合わせても最高で9-1が限界だった 自己解決
Diitoでおまけ3エンジン
NNUEWhaleVersion = 6
FUTILITY_MARGIN_ALPHA1 = 145
FUTILITY_MARGIN_BETA = 220
FUTILITY_RETURN_DEPTH = 6
FUTILITY_AT_PARENT_NODE_GAMMA1 = 141
FUTILITY_AT_PARENT_NODE_GAMMA2 = 187
SINGULAR_EXTENSION_DEPTH = 6
PRUNING_BY_MOVE_COUNT_DEPTH = 14
REDUCTION_BY_HISTORY = 2000
FUTILITY_MOVE_COUNT_ALPHA0 = 230
FUTILITY_MOVE_COUNT_ALPHA1 = 480
FUTILITY_MOVE_COUNT_BETA0 = 720
FUTILITY_MOVE_COUNT_BETA1 = 950
ASPIRATION_SEARCH_DELTA = 12
3ではなく6ベースなのが意外だった 上にすでにリンクが張られててちょっとびっくりしましたがTwitterアカウント作りました。
これからちょっとしたことはTwitterで発言していくと思います。
>>385
whale6っぽいところがあるのは教師作成のために浅いdepthで強いパラメータが理想だったからです。 深く探索させたときやねうら王4.82が弱いって話があったけど
ここに張られてるやつはどうなの? illahaの人がTwitterアカウントをつくり改良した評価関数と探索をおおやけに公開したので、uuunuuunさんなどが検証する可能性が出てきたが、探索は相変わらず勝率が大分落ちる純正のやね4.82で検証するんだろうか 評価関数だけでどれだけ差があるのかとかこだわりがあるみたいだからね 正直レートが低い探索をあえて使ってレーティング結果が出ても誰も使わない組み合わせなので存在価値はないと思う 純正やねは、枝刈り云々よりもNPSが出ないところが最大の弱点だから、NNUE評価関数では高レートは出ないよね まふさんがillqha1.1の計測するみたいだけどなんで自分の評価関数じゃなくてkai2に追加したやつなんだろ kai2も元はまふさんのを追加学習したやつなので、お互いさまでいいんじゃないの
個人的には評価関数の使いまわしは簡単に強くなりやすいため計算資源を節約できるし
結果的に早い時間で公開される場合があり恩恵を受けるのでいいと思うけど まふしかり短ノードで強いエンジン使っただけじゃなくて?
磯崎や大賀のように調整したんじゃなくて棋譜もあがらない低ノードを信じるのは流石に? >>394
いやいや、どうせなら自慢のR+200を使ってほしかったってだけよ 今朝仕事前に10回戦のVS GW5.0.5 QQRとの対戦を10秒でセットして
先ほど帰宅してみたら8勝2敗だった。10秒ぐらいまでは相当強いんでは
なかろうか?
中盤〜終盤、最終的には詰めエンジンを駆使した凄い探索エンジンのソフトが
できてきたらGW5.0.5 QQRにほとんど勝てるソフトが出来そうだね。
来年の今頃そうなってくるといいね。私は駒落ちでソフトと対戦してるけど
4枚落ちでソフトの切れ負けに誘導するぐらいじゃないとどうしても攻め合い
負けしてしまう。ソフトは細い攻めをつなぐのが上手いのでへぼの自分には
凄い勉強になる。 まふさんは最近までは1500万ノードで計測していたのにillqha1.1に限って3000万ノード以上で計測しているということは
少し計測して1500万ノードだとまふ評価関数が互角以下だったので3000万ノード以上に変えた可能性がある
QQRに対してまふ評価関数はR+100らしいがillaha1.1+dolphinは+107程度なので仕方ないだろう 久しぶりにきたが今将棋ソフトどのぐらい強くなってる?
名人が2枚落ちしてもらって互角ぐらいと予想してるが。 有意差なんて人が決めた境目であってどんな結果も起こりうるさ
開幕9連勝からの負け越しも経験したさ >>405
さすがにそこまでは行ってない
というかレートはどんどん上がってるけど、
R4200クラスでも駒落ちの指し方はいまだにおかしくて、
二枚落ちならアマ三段くらいあればまだ普通に勝てる感じ >>405
どんなにレイトが上がっても名人が2枚落ちで互角はありえない
それどころかアマでも飛車落ちは5分角落ちでも勝つことがある
前スレに飛車落ちと2枚落ち全駒勝ちの棋譜があるよ アマ三段の二枚落ちって棋士相手でも勝率5割を下回るよ
将棋ソフトが駒落ち苦手でも流石にそこまで弱くは無いから
それこそ30回に1回勝つを普通に勝つの範囲に含めるかアマ三段(24三段の事)ならそうですねとしか言えないけど >>410
前スレの2枚落ち全駒の棋譜をコピペしてみれば良く分かると思うが
ソフトは駒落ち苦手平手特化これは明らか
ソフトに駒落ちで鍛えてもらえば飛車落ちでも5分になる
もっともアマ4段以上の棋力は必要だが(特に正確な序盤の理解力) 確かにソフトは駒落ちの序盤はあまり強くない駒落ちの初期局面から学習していないので仕方ない >>405
プロ棋士は負けるのが怖いので駒落ちでは対局しない
だから駒落ちでの対局を避けて、ソフトを借りての穴探しやハードの制限で勝とうとした
少し前には、角落ちだと戦力不足で将棋の神(最後の一手まで完全に読み切るソフト)でも名人には勝てないのが常識だった
現状で飛車落ちで名人と互角
近い将来、二枚落ちで名人に勝ち越すソフトが登場する
名人は駒落ちで対局しないので証明はできないが ×ソフトは
○平手で学習させたソフトは
だろ、駒落ちで学習させれば良いだけだ
もっとも、それをやることに意義を見いだせる人間がどれほど居るのという問題はある illqha1.1強いです
連休を使ってdepth12で1億局面を作成したので、NNUEkai3を作って公開じゃー、と思ってましたが、
普通にillqha1.1に負け越す(両者dolphin使用、500局1500万ノード勝率46%)ので、顔を洗って出直します ロタ氏がillqha1.1+dolphinとnn20180608と計測してたけどnnueに対してはR+30程度と以外に差が小さいね、QQR+GW5.0.5にはR+107程度もあるのに
nnue同士は追加学習しても差が小さく、KPPTには差が大きいってことなのかな ツイ垢も出来たし、uuunuuunさんのレート表に載るのも時間の問題かな。 エンジンは2018-otafuku-search.cpp等のベースがGW6っぽいけど
uuunuuun氏が自前のPCで計測し始めていたらウケるな
パソコンが壊れたらillqha氏のせいにするのだけはやめて欲しいね >>356
今回は学習部は付属なしですか?
前回から学習初めてみたのですが強くならなかったので違う学習エンジンも試してみたいです
可能なら宜しくお願いします >>425
あんまり人気がなかったようなので付けなかったのですが、学習をやる気がある人がいるのなら上げましょうかね
前回の学習用の実行ファイルを使っていただいてもそれほど問題はない気もしますが 次回はエンジンの探索パラメータをもう少し時間をかけて細かく設定したものを用意できればと思うのでそれまで待って頂いたほうがいいかもしれません 振り飛車NNUEを5年前に投入できたらプロの先生たちが続々と振り飛車党に入党してたかと思うと 今からでも遅くはない、最強の評価関数が振り飛車を指すのであれば…! >>426
チマチマやっているのですが強さを感じるまでには至らず・・・
また良かったら学習エンジンもお願いします >>430
学習はいろいろ工夫するところはあると思いますが、最も効くのは教師の数です
depth10で5億用意すればまず強くならないことはないと思います(たぶん)
次回までにいいパラメータが見つかれば次は学習用の実行ファイルをつけてみますね ロタ氏の計測と自分が計測したのとは勝率が13%程度違うので、同程度のノード数でもPC環境で勝率は大分変わるんだな 駒落ちはいまのソフトが適応してないのもあるけど研究されたら差がさらに広がるのが痛い
二枚落ち特化の最強ソフトも研究されて対策が出回ればアマでも楽に勝てるようになると思う 貸し出しで手も足も出てないのに、対策練ればって何言ってるんですかね
駒落ちの話はもううんざり 駒落ちとか特化させたり強くなればなるほどやけくそな適当な手を指すようになったりしないのか?
どうやっても勝てないよってことから そもそもαβ探索が駒落ちというか形勢が大きく離れた局面に向いていないという線もありそう illqha1.1+dolphinがQQR+GW5.0.5に勝率65%程度でR+100程度の根拠を表にしてみた
1. まふさんが計測して「QQRよりR+100程度になると思う。」のコメントが出ている
2. >>375の人も合計300局で勝率65%程度の結果が出ている
3. illqhaの人も勝率65%程度の結果が出ている
4. 自分の計測でも65%程度の結果が出ている
したがってロタ氏だけ誤差範囲の勝率52%の結果は明らかにおかしいと言わざるを得ないだろう >>438
rota氏の計測はQQRじゃないですよ >>439
>>365の書き込みのことを言っているのなら探索部はともかく
評価関数はQQRと明記している >>439
ロタ氏がnn20180608の次にQQRとが計測しているんだがTwitterの大分下の方をみてないの?
QQR_GW5.0.5vs illqha1.1_dolphin 138-9-155 >>440
illqha1.1 の話しじゃないの? >>439
Twitterの大分下の方なのでURLを貼っとく
QQR_GW5.0.5vs illqha1.1_dolphin 138-9-155
https://twitter.com/Rota_JP/status/1019862776536227840 >>443
あ、すいません
一番上が固定のツイートでしたね >>405
プロが飛車落ちで、アマ強豪が飛香落ちで楽しめるレベル ここまでのロタ氏の計測だとillqha1.1-dolphinの総合的なレートは4277なので
現在R4244でトップのQQR_GW5.0.5や20180608mafuよりR+33でついに1位を更新したね
vs QQR_YO4.82 勝率59.5% R4293.82
vs QQR_GW5.0.5 勝率52.8% R4263.58
vs 20180608mafu 勝率54.3% R4274.1
平均R4277 プロがソフトの駒落ちでやるのは、やる前からすでにハンディキャップをもらっているので屈辱だと思うけど、そう思うのは自分だけかな QQR_GW5.0.5vs illqha1.1_dolphinの対戦結果について
将棋所では拮抗しているがShogiGUIではillqha1.1が
差をつけて勝ち越すパターンが多い感じがする
今までGUIの違いでの差はほとんどなかった
最近導入した将棋所の最新版4_1_0 のせいか? ハイパースレティングまわりやAVX2の関係でCPUの世代でも結果が変わるらしい https://twitter.com/HiraokaTakuya/status/1020268715474997249
平岡 拓也??\(´・_・` )/??
?@HiraokaTakuya
反社会的勢力に資金を流す事に繋がるので、鰻を買う事は反社会的行為と言えそうだけれど、いっそ絶滅させてしまえば資金源の1つを断つ事になるので、絶滅させるのが正解かも知れない(´・_・`)僕はお金がないのでみんな頑張って(´・_・`)
19:26 - 2018年7月20日
なんでやおめー、HEROSの株売っぱらって手に入れた大金どーしたってんだよ 婚活資金と猫ちゃん購入代金に消えたんだろう(察し) uuunuuun氏がレーティング表を更新してた
dorphin/nn_illqha1.1 R4292
T.N.K./nn20180608mafu R4257
Godwhale5.0.5/QQR R4253
YO4.82/QQR R4235 uuunuuun氏のサイトの対局ログを見たらdorphin-illqha1.1がaperypaqに
勝率76.8%, R+208だった
それにしてもnnueの登場でかなりレートが上がったね これはいよいよ対elmo勝率9割超えをしそうですね しかし、イルカさんは、後手番の横歩を避けない、先手番の横歩で青野流を使わないといった点で、
序盤巧者とはいえないから、ちょっとだけ定跡を搭載しただけで、勝率はより高くなると思われますね 反社会的って言葉を使う平岡さんにちょっとがっかり。
この複雑な社会で"社会性"とは何かを厳密に決めるのは不可能。
単なる制度的な不備を治療の必要がある人格とするならばそれこそ人間そのものの排除につながる。 反社会ど真ん中の暴力団が反社会か厳密には決められないってアホかな 意味わからなかったかな?
暴力団は反社会的な団体だけど、うなぎを買うことは反社会的行為には繋がりません。
行動障害でもパーソナリティ障害にも該当しないよ。
社会的不備を人格のせいにして自分の気に入らないことを排除したいだけ。
うなぎの保護活動や完全養殖の研究者に寄付すればいい >>461
ウナギの稚魚の捕獲がヤクザのシノギになっているという噂を指してるんだよ >>461
平岡は人格がどうだとかなんて言ってないよね
反社会勢力の利益になることをしてるのに、反社会的行為と言わないのは不思議だねと言ってるだけで
これがサンゴやら象牙やら毛皮やらの悪趣味な収集なら批判されるのにね それは反社会的行為の定義として普通は人格障害やパーソナリティ障害のことを指すので
間接的に反社会的団体の資金源となりうる行為とは別ですよ。
不思議もなにも批判されないのはマスコミや大手企業の影響力でしょう >>467
93に銀を打ち込むあたりですら84に逃げられる展開を読めていないとなると良くないですね
ただ、こちらの環境だとどうしても93銀から詰むと判断しないので調べるのが大変そうです TACOSとかAI19とか東大無双とか古いやつダウンロード版で安く再販してくれんかな
500円くらいなら出すよ 1080円だけど柿木将棋ダウンロード版
最低のレベル1でやって角換りの熱戦末、勝った。
昔の柿木より筋がいいし
人間がまだ勝負できるし、楽しめる。レベル1はアマ3段くらいか
詰将棋余詰め発見機能もあるし、まあ満足してます スマホでNNUE使いたいんですけど、一番強い実行ファイルってなんですか? まふは公開せず自分の強いって自慢するだけの人だが、またなんか嘘くさい内容の話を持ち出しているけど、公開しない評価関数などどうでもいいんだが、
とにかく自分の手持ちのソフトが誰よりも強くないと気が済まない承認欲求の塊だね まふは自分がパラメータ調整した自慢の探索よりdolphinが強いとなると自分のを使わずにすぐdolphinを使っているし
それで自分のが一番強いって話なのでやることが汚ないよね 公開していない話は何とでも書けるからね、公開しないことには誰も信用しない
嘘をついて自分が優秀な人物だと認めてもらいたい人間は世の中いくらでもいる 個人への誹謗中傷はともかく、批判はあってもいいと思う
じゃあ、お前はプロの棋士より強いんかとか言われたら、何も言えなくなるw まふの最新評価関数→存在価値ゼロ(誰も使えないし第三者による検証がされていない) 公開ソフトのパラメータ調整弄って強くなったとかどうでもいいわ
それで汎用的な知見が得られるならともかく、日々陳腐化してるソフトの最適化してどうすんの >>475
作れたよwww公開しないけどwww
って返されるだけだろそれ >>472
現時点では>>356だと思うが2週間ぐらい待つ手もある まふの将棋ソフト開発作業メモをみてもらえれば分かるがillaha1.1よりまふ評価関数は弱いので一番勝率が高くなるノード数を探って検証しているのが分かると思う
やれ設定ミスって負け越したとかいろいろ時間稼ぎをして言い訳しているが、結局まふ評価関数がillaha1.1より強くないことが見て取れる まふ評価関数がkai2より数千万程度の追加学習程度なので強くてもせいぜいnn20180803mafuよりR+20〜30程度だろう × nn20180803mafu
〇 nn20180608mafu 誰かに迷惑かけてるってことでもないし、好きにやってもらったらいいんじゃないの
しかしillqhaの人にコンタクト取ったのはさすがに草 まふさんって、その時の目立ってる誰かにすり寄って嫌わてる印象がある
こないだの大会後も大賀さんに苦言されてたし
でもnnueを強くさせたのも事実だから人間性に難あるほうが開発者らしいとも言えるけど >>476
Googleさんの誹謗中傷は止めて下さい ソースコード1行も書かない開発者気取り
ソースコード1行も書かない協力者気取り
ここの人達とと似たようなもん 1位 絶芸(中) (Tencent)
2位 星陣囲碁(中) (???)
3位 ELFOpenGo(米) (Facebook)
4位 AQ(日) (山口 祐)
パル山さん準決5番勝負進出おめでとー 棋神は日本でやってるトップソフトじゃない大会でも優勝できなかった >>495
大資本に個人で挑み奮戦とかカッコよいな ところで、今度発売予定の『将棋神 やねうら王』って、
コンピュータ同士、たとえば、やねうら王vstanuki-SDT5版の対局をさせること可能なの?
紹介ページにはその点に触れてないけど、『激指14』や『将棋所』では当たり前の機能だったので、
ちょっと気になってる。
自分としては、強すぎるプログラムと対局するよりも、コンピュータ同士の対局、駒落ち戦などをじっくり
観戦して楽しみたい!! やねさんのブログで質問したら100%返答してくれるので、そっちで質問したらいい 中将 @C4i1ooxS0yeReRF
4スレッド1手15秒で illqha 1.1対QQRの対戦中衝撃的な逆転勝ち。
脊尾詰によると49手詰 終盤強いのが魅力的
https://pbs.twimg.com/media/Din6XPLUwAAYhzQ.jpg
設定ミスじゃなかったらこのグラフは凄いな
でもソフトの終盤力を自分の力にすり込むのはトッププロでも難しい上にアマじゃお手上げ〜 >>504
8T/Hash4GBで画像の局面YO4.82/QQRに読ませてみたら、8億ノードくらいまでは先手よしだけど、そこから急転直下で後手勝ちになった
再現性ある結果かは知らん 局面的には詰みがあるから長く読ませれば後手勝ちに変わるは、、、ず
個人的に気になる点は
・QQRがかなり良しと見てる場面でillqhaはそれほど悲観してない
・illqhaのグラフはガタガタしててillqhaも結構勘違いしている? illqha1.1のレートが4300を超えてた
dolphin/illqha1.1 4305
T.N.K./nn20180608mafu 4255
Godwhale5.0.5/QQR 4254 illqha動かんと思ったらEvalDir変えんといかんかったか、初歩的すぎて気づかなかった ようやく、illqha1.1といい勝負ができる評価関数(200局1500万ノード勝率55%)ができたので、
NNUEkai3としてfloodgateに流します
特に違和感のない勝率・差し回しであれば、後ほど公開します もうAperypaqに+100〜150くらいとか進歩早すぎて草生える floodgateみたら普通にdolphinって書いてあった
失礼しました プラス100なら勝率6割くらいだからたいしたことないぞ。
プラス300くらいが当たり前の時期とかあったしなー。 +300が当たり前だったか?
過去ログから転載
SDT2 Apery 3047(5位)
WCSC25 Apery 3154(4位) +107
SDT3 大樹の枝 3250(3位) +96
WCSC26 技巧 3514(2位) +264
SDT4 浮かむ瀬 3654(2位) +140
WCSC27 elmo 3938(1位) +284
SDT5 ぽんぽこ 4071(1位) +133
番外
WCSC27〜SDT5
yaselmo 4051
SDT5
Apery 4117
SDT5〜WCSC28
aperypaq 4181
賞金が出るSDTよりもWCSCの方が伸びてるのは正月休み+冬でパソコンフル回転かな @uuunuuun1
Dolphin/illqha1.1 相当強いのでelmo_wcsc27と対局させてみる。
第一局elmoが勝ったのでどうなるかと思ったけどその後圧倒して59-6。
勝率9割。ついに幻のAlpha zeroの領域に到達。
15:10 - 2018年7月23日 更新しといた
SDT2 Apery 3041(5位)
WCSC25 Apery 3151(4位) +110
SDT3 大樹の枝 3250(3位) +99
WCSC26 技巧 3513(2位) +263
SDT4 浮かむ瀬 3656(2位) +143
WCSC27 elmo 3938(1位) +282
SDT5 ぽんぽこ 4074(1位) +109
WCSC28 Apery 4161(3位) +87
番外
WCSC27〜SDT5
yaselmo 4049
SDT5
Apery 4142
SDT5〜WCSC28
aperypaq 4181
WCSC28
Qzilla9 4199
WCSC28〜
QQR 4254
illqha1.1 4305
出典uuunさんのサイト AlphaZeroと対局したelmoはたしか一手約21億ノード
それを100局となるとAWS使っても再現するのは厳しい >>495
> 2位 星陣囲碁(中) (???)
星陣囲碁(Golaxy)=精華大学(中国の工学系トップ)らしい >>518
5年でR1100以上伸びてるってことか
2000年代後半はもう伸び代そんななさそうな感じだったのに何があったんだ
まあこの伸びじゃあ激指やYSSは置いてかれるわな >510
俺のPC古いから動かないと思ってたら本当に初歩的すぎたわ。thx >>521
いうて00年代後半もYSSの24のレート(2005年に2478、2007年に2765)と、2011年のponanzaのレート(3211)をみると、当時も順調に伸びてたようには見えるけども
http://www.yss-aya.com/24rating.html nnueのkaiシリーズとillqhaシリーズのライバル競争が楽しみ
KPPT等 他の評価関数は置いて行かれたかな?
絵に描いた餅のまふ新評価関数やAlphaZeroは忘れよう NNUEkaiの開発者の方もぜひTwitterでの発信をお願いしたいです >>523
2005〜2007って正にBonanza公開された時で、その時期は学習を見習った他ソフトは伸びただろう
それ以外の時期は激指陣営が言ってたように、年間でR50〜100ずつ順調に伸びてると
年間50〜100では付いて行けないわな >絵に描いた餅のまふ新評価関数やAlphaZero
絵に描いた餅の表現が言い当てていて、ちょっと面白かった SDTトーナメントでチーム5ch ソフト名:名無し名人として
NNUEkaiとillqhaの作者がタッグを組んだら上位ワンちゃんありそう。 NNUEkaiとillqhaって同じ人だと思ってたわ
illqha/dolphinって何がベースの進化形なんでしょうか? まぁ、シボラーでも参加資格があるってことが去年の18号で明らかになったから、
賞金ほしいやつはどんどん参加すればいいんでね? もうプロも解説出来ない領域だよな
激指対ツツカナの解説とか面白かったが 今後もしソフトの競技会があれば例えソフトのレートが5000になっても今まで通りプロの解説はやってほしい
本当に局面を理解して解説出来るかは別としてプロがソフト対局の解説をするのが好きなの人は多いと思う uuunのサイトより
>ソフトレートR3966のJKishi18gouは現在24に参入中ですが、24R4000以上になってもおかしくないのですが、R3100程度のレートにとどまっています。
>1%程度ですがJKishi18gouに勝つユーザーが居るのも不思議です。ある種の攻略法が知られているのでしょうか。
R4000に勝つ人って何?
ソフト指し? ponaがやってたときもソフト指しいたからそうじゃねーの
まあでもあのときはponaがソフトでも圧倒的だったんだっけか >>535
http://www.uuunuuun.com/single-post/2018/03/24/JKishi18gou%E3%81%AE%E3%83%AC%E3%83%BC%E3%83%88%E6%8E%A8%E5%AE%9A
>#加筆訂正
>その後、18号が負けた7局のうち4局の対局相手はソフト指しとして将棋倶楽部24から登録抹消されていることがわかりました。その分を差し引くと18号のレートはR3370からR3530に上昇します。なお、残る3敗のうち1局は対ソフトです。 >>537
7局のうち3局がソフト指しってどんだけだよ
残り2局も怪しいもんだが、ソフト指しじゃなかったら人間もR4000に勝つこともあるのか AlphaZeroとelmoの対戦はノードが増えれば差は開く一方とのことだったが 透の最新作がillqhaに58%
NNUEkai3は公開される前に上回られてしまったw >>541
elmo側のHashがノード数に対して少なすぎるのが原因の可能性とかもあるかも? illqhaの人が成功した学習値などの情報を公開したので早速ハイスぺ陣に追い抜かれ差が広がっているようだね 透は基本一番強い手持ちの評価関数は絶対に公開しないので(過去に公開したものは最新ではなくややレートの低いものばかりだった)、まふと同じで絵に描いた餅だが、
基本一番強いのが出来たらすぐに公開してくれるnnuekaiやillqhaの人に頑張ってもらいたい >>545
そう、口で強い言ってばかりで公開しないですからね
公開してくれる人のが協力してあげたくもなりますしね 透がaperypaqに勝率54%って言ってたwakame1stもuuunuuun氏の計測では総合的なレートはaperypaqと全くの互角だったし、
yaselmoに勝率56%とか言ってたtamoreも有意差がなく互角だったので、ブログに書いてあることはあてにならない 絵に描いた餅評価関数群は結局最後まで世に出ないパターンも多いし
illqhaの作者さんとNNUEkaiの作者さんを応援したい 透はいつも100局しか計測しないで勝率何%で強いのが出来たと自慢しているが、100局で勝率58%でも500局やったらほぼ互角になることも普通にある
対局数を増やしても勝ち越す可能性の方がが高いっていうだけに過ぎない、だから透の計測はやや強いかもっていうレベルでしかない だから実際にuuunuuun氏のレート表と透が計測したレートが一致したことが一度もない
透が事前に計測した方がいつもレートが高く出ている 透さんについての疑問はなんでハイスペなのに100局しかやってないのかということ
100局だと勝率60%は越えないと有意差でない
100局を何セットもしていい成績のデータ出してるんじゃないかと思ってしまうね
ハイスペなんだから500局ぐらいすればいいのにいつも100局 最近ソフト導入したんですが評価値って原局面の評価? >>234
序盤戦型や戦術がコンピュータ将棋の影響を受けて変わっています。 >>242
チェスのエンドゲームや囲碁のヨセは収束しますが、
将棋の終盤は発散しますので
ディープラーニングの効果が効きにくいかもしれません。 >>553
現局面の評価といっていいがどちらが手番かという情報も必要。
そのうちみてればわかるがソフト最善手を指しても評価値は
下がることはしょっちゅうあるよ。 ロクに計測もしないで公開するまふさんよりは大分マシ
でもまあ100局は少なすぎ あと2週間位したらillqha2が公開されるようなので
作者が言っているようにillqha1.1の計測等は
ほどほどにしておいたほうがいいと思う なんか怖いわ
透さんが急に出てきたわけでもなく地道にブログで作業書いてきたのに結果が出たら貶す発言ばっかり
uuunuuunさんがレートのっけない時はびびってるとか口汚く罵ってたしNNUEkaiの人でしょ
illqhさんもTwitterでリツイートしまくってたのにダンマリ
結局自分が一番で他は認めないのはまふさんと一緒なんだなあ 有意差のない評価関数ばかり公開してきた透はもう不要だろ、過去に有意差があるのが公開されたことが一度もないんだが
100局の計測では有意差のあるものを作るのは無理だろ >>560
uuunさんはなんらかのアカウント持ってる人じゃないと測らないと言ってる
NNUEkaiの人は強い評価関数ができたらtwitterのアカウント作って測ってもらうといっているのになんでNNUEkaiの人が「uuunさんをびびってる」って言ったなんて勘違いした?
NNUEkaiの人は納得する評価関数ができてないから、測ってもらおうという気がまだないからなのに 透が作ったものは強くないものばかりなんだが(uuunuuun氏のレート表より)
YO4.82/aperypaq R4176
YO4.82/wakame1st R4176 ワッチョイ bf1b-zNEp = 透
たまらず自演 俺まったくのど素人だが、透の作った評価関数と同程度のものなんてたくさん作れたわ 公開もせず自慢するのが好きな透の評価関数はどうでもいい、誰も使えないものがいくらレートが上がろうが皆興味ないだろ
今後は公開主義のnnuekaiやillqhaの人に期待している 実際にブログで自慢しているほどレートが上がっていたことは過去に一度もないが × 実際にブログで自慢しているほどレートが上がっていたことは過去に一度もないが
〇 透は実際にブログで自慢しているほどレートが上がっていたことは過去に一度もないが NNUEkai3をアップロードします。お暇な方は使ってみてください
https://www.axfc.net/u/3923889
今回、depth12で教師を作成しましたが、思ったより芳しくなかったです
生成コマンドは
GW3.exe threads 32 , BookMoves 0 , BookDepthLimit 0 , BookFile user_book1.db , evaldir eval , gensfen depth 12
loop 100000000 random_move_count 4 random_move_minply 8 random_move_maxply 15 random_multi_pv 7 write_minply 16 write_maxply 200 eval_limit 5000
のとおりでしたが、ランダムムーブを入れたのが良くなかった可能性があります 公開主義って意味が分からないけど身内には配布してるみたいだし開発者でもない個人のブログをわざわざ見て文句つけてるのおかしいと思わないの?
uuunuuunさんが検証してるんだから見てくればいいのに
あとyaselmoより強いってrereでしょ
よく分からないマウントの取り合い怖いよ >>570
この評価関数?はなにのエンジン使用が一番最適ですか?
やねうら王エンジンとか色々ありますよね? ワッチョイ bf1b-zNEp はやっぱ透の自演だな
必ず食いついてくるからな 透の評価関数がillqha1.1に勝率何%とか公開もせず自慢しているから目障りでしかないわ
早く消えてくれ >>573
自分はdolphinでfloodgateに流してましたが、どの探索が一番よいのかはわかりません >>570
ちょっと試してみたけど前回のkai2より強くなっている
と実感できなかった。
https://i.imgur.com/ynHildS.png >>579
illqha1.1付属のDolphinを使わないのはなぜ? 最低で100戦 できれば300 400ないと判断できない 100回以上で、Dolphin勝ち越してます
1秒対戦ですが >>581
DolphinとGW3で対戦させたらGW3の方が勝ち越したからですw うーむ、強くなっていないという報告が多いですか
学習実験→対局を何度も繰り返していると、時々統計的な神引きをしてしまい、
勝率が高い関数が出来たと勘違いしてしまうことがありますが、今回はそれだったのかもしれません
(交差エントロピーとmove accuracyの値の推移はとても良かったのですが…残念)
今後、関数を公開する際は、必ず、300局以上の結果について、棋譜を添付して公開することとします、失礼いたしました >>582
あなたが試した実績からの発言ですか?
私は10戦ぐらいで判断可能とみています。
7勝3敗とかの数値が出れば明らかに力の差があると
思わざるを得ません。 10局 7勝 3敗
相対イロレーティング: 147.19071411783773
標準誤差: 130.0245000008875
95% 信頼区間 [-70.43650362227247, 381.69700377572997] >>585
人間の棋譜を学習してた頃は弱かったが、今は自己学習だから格段に強くなった >>586
Kai2とKai3との対戦はやったのでしょうか?
なおGW505 QQRとillqha1.1との対戦結果からみると
Kai2はillqha1.1より若干落ちるという評価です。
Kai2はillqhaとの直接対決は互角だがQQRとの対決
はillqhaは10勝0敗とかいうとんでもない結果を出したので。
Kai2は7勝3敗でした。 10局で7勝3敗なんて、下手すれば次の10局で並ぶかひっくり返るよ。
自分は基本的に2秒で100局。場合によっては片方が55勝以上した時点で打ち切りも。
そのうえで勝率が55%とか60%を超えていれば有意差があると思っている。
あくまでも自分のところの低CPUの貧環境だけど。 >>587
統計学上、7勝3敗がどのような意味を持つかは、>>407のサイトで見てみるといいですよ
信頼区間95%の最低勝率が0.5を超えている場合に、有意に強いと判断するのが一般的でしょうか
10局7勝3敗だと、
95% 信頼区間 [0.4, 0.9]となり、最低勝率が0.4となっているので、統計学上、有意に強いとはいえません
ちなみに、100局70勝30敗だと、
95% 信頼区間 [0.61, 0.78]となり、有意に強いといえると考えるのが一般的です >>586
「強いのができたかも」ってレベルで気楽に公開したらいいと思うよ
みんながこぞって検証してくれるんだし、自分だけで検証してるよりいいでしょ
ただ「強いのができた」って言ってるだけより、よっぽど良い Kai3をillqha1.1とdolphinで対局させてる
今は空いてるPCが一台なので、5秒(ノード2000〜2500万)で対局です
で、流石に10局で判断は難しいかな
それなら当方では6-5でKai3が勝ち越してるし >>596
私が言っているのは10局の勝敗で7勝以上勝ったとしたら
最終的に互角以上の可能性が高いということです。 >>597
> >>596
> 私が言っているのは10局の勝敗で7勝以上勝ったとしたら
> 最終的に互角以上の可能性が高いということです。
今ちょっと統計学的なことを調べたら10局だと間違いの可能性はあるみたいですね。
20局だとほぼなさそうです。
100局 70勝 30敗
勝率: 0.7
標準誤差: 0.04617336564981453
95% 信頼区間 [0.61, 0.78]
-----------------------------------------
50局 35勝 15敗
勝率: 0.7
標準誤差: 0.06580195215353793
95% 信頼区間 [0.58, 0.82]
----------------------
20局 14勝 6敗
勝率: 0.7
標準誤差: 0.10654272078068662
95% 信頼区間 [0.5, 0.9]
----------------
10局 7勝 3敗
勝率: 0.7
標準誤差: 0.15718104959867515
95% 信頼区間 [0.4, 0.9] ← まれに勝率0.4のケースが生じるということみたいだ・・・ >>591
ちなみにKai2とKai3との対戦結果はKai3の方が若干上でした!
https://i.imgur.com/2Aq7QDr.png >>597
経験上との事ですが当方の経験上では>>593の感じですね
100局でも少なく感じてます
後、ソフト初期の頃は一手1秒(数百万ノード)でやる場合も多かったのですが、測定サイトの基準での1500万ノード以上は納得はできます(多いに越したことはないですけど)
今は各種データが集まってから判断する事が大切かなと 95%信頼区間ですら5%で裏切られるってことだぞ。色々なソフトを20回戦わせたら1回くらい裏切られる。
95%で有意差と論ずる風潮すら疑問だわ。
やねのテストとかみれば1000以上を基本にしてると分かる たくさんやっても長時間対決だとわからんのは同じだから適当でいいやろ エンジンと評価関数の相性が大事
新しい評価関数が出来上がったらDittoで毎回最適値を探り直した方がいい >>602
95%を有意水準とするのは一般的だし、そういう人が多いのもまあわかる
もちろん分野によっては99%だったりする
コンピュータ将棋みたいな、誰でも何セットでも実施可能なものについて95%を使う意味はないね。検定の多重性問題を無視してる
ただソフト開発する上では有意水準はそんな重要じゃないと思うわ。開発効率のが重要 >>594
>>595
半年ぐらい前にそれやって混乱起こったのもう忘れたのか >>584
対GW505 QQRとの対戦成績の比較もした? このスレに10戦で優劣つけようとしてる人がいることにびっくり
ツイッター見てても最近あきらかにコンピュータ将棋はじめましての人がまた増えてきた印象
高校数学の「確率分布と統計的な推測」おさわりしたほうがいい
大学入試でもあんまり重要視されてこなかった単元のため、理系大卒でもほとんどさわらずに社会人になってる人いるから 1.96と2.58にピンッとこなかったら数学学び直ししてください 二戦二勝した名人に100回やって100回勝つって発言をしておきながら
二戦二敗したelmoに本来起こりえない僅かな確率の事象が起こったって話すのは
統計的にどうですか? >>606
nnueはKPPTと違ってキメラができない以上、あの時ほどの乱立はないでしょ >>539
この間県大会準優勝の高校生アマがソフト指ししてないのに認定されてbanされてたな
そろそろソフト指し認定法も限界なんじゃないか?
だからプロ棋士には連絡してくれって言ってるわけで。 nnueは終盤強いと思うけど、mate読み切るのは比較的遅い気がする
まあmate読み切れなくても大優勢だから勝敗にはほぼ関係ないんだけど >>615
将棋のGUIの表示 +mateとか+詰は詰将棋の詰ではなく
寄り筋とか必勝の意味なので表示を変えるべき nnueが終盤強いのは単にKPPTに比べてノード数の落ち込みが少ないってことじゃないのかな
自分のPC環境ではKPPTが序盤から終盤に7000万ノード下がるのに対して、nnueが4千万ノードしか下がっていない
終盤で3000万ノードも差がついたらnnueの逆転勝ちも当然ではないだろうか すまぬ一桁間違っていた
× 7000万ノード下がる
〇 700万ノード下がる 一応kai3とillqha1.1の対局が100局程になったので結果報告です
エンジンはdolphinで一手のノード数は約2000〜2500万
Kai3から見て39勝46敗分け15でした >>619
引き分け15って凄いな
将棋ももうそういう領域なわけ?
そう言えば山下さんだかはR4500くらいが限界点だって言ってたな
アルファゼロもそのくらいだし 過去にはevalShareで実質同じ評価関数同士の対局になってたケースもあったな
評価関数が近いと引き分けが多くなる elmoに対してはNNUEkai3よりillqha1.1の方が強かった
一手12秒 定跡なし 2スレ Hash512 投了値1000
illqha1.1-dolphin 10-0 elmo_wcsc27_Y4.74_AVX2
NNUEkai3-dolphin 8-2 elmo_wcsc27_Y4.74_AVX2 elmoに対する勝率から総合的なレートはnnuekai3よりillqha1.1の方が上だと思う >>620
やねはレーティング20000くらいが将棋の神様だって言ってたけどね 1手3秒 6スレッド 200戦 探索部 dolphin
illqha 1.1 NNUE kai3
103 - 12 - 85 約15万ノードのNNUEにやっと勝った
低ノードだと無謀な角打ち込みで必勝になるからあんまり勝った気がしない このスレにNNUEkai3とillqha1.1の対局結果を投稿した人の情報をまとめてみた
有意差は勝率53% 752局、勝率54% 423局必要で以下有意差は出てないけど、
illqha1.1の方が勝ち越していてやや強い感じがする
>>619 の人の計測
>エンジンはdolphinで一手のノード数は約2000〜2500万
>Kai3から見て39勝46敗分け15でした
illqha1.1の勝率53.5% R+24
>>626 の人の計測
>1手3秒 6スレッド 200戦 探索部 dolphin
>illqha 1.1 NNUE kai3 103 - 12 - 85
illqha1.1の勝率54.5% R+31
>>622 の計測
>一手12秒 定跡なし 2スレ Hash512 投了値1000
>illqha1.1-dolphin 10-0 elmo_wcsc27_Y4.74_AVX2
>NNUEkai3-dolphin 8-2 elmo_wcsc27_Y4.74_AVX2 SDTはレーティングはあまり関係ないんだな
勝敗はアンチコンピュータ戦略の出来で決まる >アンチコンピュータ戦略
って定跡+時間攻めのことか?だとしたらその言い方はおかしいだろ
強くなればなるほど序盤定跡が大切になるのは人間もコンピュータも同じ
手を抜くほうがおかしい やねチルばっかだから似通った探索と評価関数なんで
同系ソフトに対して勝率上げてる対策いれたらSDTは勝ちやすいけど
別系統のソフトをまぜたレーティングは変わらないってことでしょ ドルフィンは振り飛車にしてもそこまでマイナス評価にならんね 今までは自戦記用にマイボナで検討してkifu for winで保存してってやってたが、
将棋GUIは1枚でこの2役できて便利だな……
今までありがとうございましたマイボナとKfW >>587
こういう人が真面目に話してて且つ中高生以上だったら戦慄する >>630
>強くなればなるほど序盤定跡が大切になるのは人間もコンピュータも同じ
>手を抜くほうがおかしい
別に強くなろうが序盤定跡がどうだとかかわらん
そんなもんに手をかける方がおかしい 単純に言えば25回やって75%以上勝率があれば誤差20%だから強いと言えそうだが 相変わらず検証検証頑張ってるな
俺も一時期だけハマってたけどあんまり意味ないぞ。開発者以外が検証に注力するのは時間の無駄
大会数日後には「これ使っとけば大体最先端だな」ってソフトが判明してるじゃん?
ずっと検証ばっかしてる暇があったら、その時間でまぁまぁ最先端ソフトを使って将棋自体を楽しんだ方が遥かに有意義
WCSC26だったら技巧、SDT4は浮かむ瀬、WCSC27は検討用だったら魔女エンジンelmoが良さそうだったかな
SDT5はやねエンジンApery、WCSC28は鯨エンジンの鯨
それくらいで充分トップクラスだし、ソフト採用の為にほぼ無意味な検証に時間を使うよりもよほど将棋を楽しめる >>637
そうとも限らんぞ
将棋自体を楽しむ気はなくて検証が趣味なのかもしれんし 何一つスキルを持ってない人間でもダウンロード→ポチポチクリックするだけで
なんとなく気分だけ将棋界最高峰気取り
こういう事に充実感を覚える人は多いからね 楽しいんだからいいじゃない
出てこないソフトよりずっといい illqha1.1-dolphin よりも Kai3-dolphin よりも、
0611-whale3 が強いんだが、
誰か詳しい人、有意差がでるまで検証してくれまいか? >>642
自分が検証した結果を出して頼むべき話だ‼ 言い出しっぺの法則に従い検証してみました。
先手:0611-whale3 後手:KAI3-dolphin 6-4-0
先手:KAI3-dolphin 後手:0611-whale3 2-7-1
合計:13-6-1
ぎりぎり有意差無しになるのかな? >>645
>>622と同じ様な設定でelmoに10戦全勝出来たら
強さを認めてもいいと思う 検証続き
先手:0611-whale3 後手:illqha1.1-dolphin 7-3-0
先手:illqha1.1-dolphin 後手:0611-whale3 3-7-0
これは有意差でてる。
>>599 によると、20戦 7割 で信頼できるはず? 探索部は結局1手にそこそこ時間をかけて読んだとき何が強いかよくわからないんだよね。
whale3よりgodwhaleのNNUE版のほうが強いって意見もあったし 文句ばっか言ってるのに、俺の測定何千万ノードで、何対何とか棋譜もないのによう信用できるな。
気になった事があったから推理したが
まふ、嘘ついてる確信み〜つけた。
あいつ引き分け全く無い=自分のほうだけ定跡使用で、計測時間短縮して勝率を稼いでる。
だから、新手だらけと言い棋譜が出ないでFA
他にも嘘ついてるだろうけどな。 初心者みたいな質問で申し訳ないんですが、スマホでillqha評価関数を使う場合、探索部はスマホ版やねうら王4.82で良いんでしょうか?
whale6やdolphinのスマホ版は無いんですかね? >>648
将棋所のページのUSIエンジンのリンクから
elmoをクリック>>elmo導入方法をクリック>>
4.elmoをダウンロードしますをクリック PC放置して100戦するまで待てばいいのになんで10や20で慌てるかね 計測することが目的なんじゃなくて自分に注目集めたいだけなんじゃない
「見て見てこんなことやったよ」みたいな感じ
まふとかもそういうタイプだよね >>647
俺がやったら5勝5敗だった。
これから寝るのでさらに20対戦の連続実行をセットして寝る。
2秒対戦結果
https://i.imgur.com/chvgceZ.png 大分前に初代NNUEkaiの公開直後にwhale3で計測してた
NNUEkaiの勝率61%でやや強いと思っていたので0611から変えてNNUEkaiを今まで使ってた
NNUEkai-whale3 11-2 -7 nn20180611-whale3
持ち時間5分 一手ごとの加算20秒 定跡なし スレッド2 Hash1024 投了値1000 同じく初代NNUEkaiの公開直後に計測していたやつ
NNUEkaiも0611(両方whale3使用)もelmoには10戦全勝出来なかった、出来たのはillqha1.1-dolphinだけだった
NNUEkai-whale3 11-2-7 nn20180608-whale3 勝率61%
持ち時間5分 一手ごとの加算20秒 定跡なし スレッド2 Hash1024 投了値1000
NNUEkai-whale3 12-2-5 QQR-GW5.0.5 勝率70%
持ち時間5分 一手ごとの加算10秒 定跡なし スレッド4 Hash256 投了値1000
NNUEkai-whale3 8-2 elmo_wcsc27_Y4.74_AVX2 勝率80%
持ち時間5分 一手ごとの加算10秒 定跡なし スレッド4 Hash512 投了値1000
nn20180611-whale3 15-4-12 nn20180608-whale3 勝率55%
持ち時間5分 一手ごとの加算20秒 定跡なし スレッド2 Hash1024 投了値1000
nn20180611-whale3 18-2 elmo_wcsc27_Y4.74_AVX2 勝率90%
持ち時間5分 一手ごとの加算10秒 定跡なし スレッド4 Hash1024 投了値1000 >>657
そんな少ない対戦数どうでもいいわ
200局以上やってから書き込めや >>658
そんな15時間以上かかることをあなたはできるのですか?
200局とは1局5分設定だと1000分・・・17時間ですよ。
そして経験すればわかるけど10局でだいたい傾向は掴めるのです。
因みに0611はillqha1.1とは20局やっても互角にちかかったです。
細かいところで条件がいろいろ違った場合に大きく差が出るケースも
あるかもしれません。いろんな方がいろんな設定で10局程度やることで
傾向がつかめるんだから私は否定すべきではないと思います。 で、でた〜www
勝率7割のソフトは10戦で7勝3敗と考え奴〜wwwww それよりも2スレってのが気になる
化石PCでも使ってんのかね illpha1.1ですらelmoに3連敗することもある10局で傾向がつかめる訳がない 10局、勝率0.5のシミュレーションを経験すればわかるけど
10セットやれば8-2、2-8以上はよく出る
100セットやれば9-1、1-9以上はよく出る
それは感覚として覚えておくといいと思うぜ
100セットというのは10人が10個の評価関数を検証したとき
つまらない結果が出たときは黙殺して面白い結果が出たときに騒ぎ立てるとした時
誰かが騒ぐことは割とあるということだ >>662
あなたの物言いはおかしいですよ。
10局で傾向がつかめないという根拠として3連敗がありうるという
話になってますw
一体どんな頻度で3連敗が出てくるんでしょw
単純に2分の1の確率で3連敗は12.5%です。
勝率5割 0.125
勝率4割 0.64
勝率3割 0.027
勝率2割 0.008 なるほど
一人が100局やるよりも10人が10局やる方が効率的だし楽だな >>664
elmoに勝率9割程度のillqhaでも10局単位だと3連敗することがあったんですよ。
このときelmoに10局で勝率70%という結果が得られてどうやってillqhaは他のソフトより強いという傾向がつかめるんですか?
例えばAperySDT5とelmoを10局対局されて同じくelmoに勝率70%だったらどう判断するんですか? >>659
・真に強弱のあるソフトでの10戦で得た傾向は、未知のソフトの10戦について何も説明できません
・傾向なんて言葉は使わず、統計で定量的に説明しましょう
・p0.05とか0.01という有意水準に拘る必要はないですが、万人に納得してもらうにはフォーマットに従いましょう
・セットを繰り返し行う(もしくは結果を見て繰り返すか決める)のは、むしろ検定の信頼性を損なう行為です
・そもそも不特定多数が実施でき、組み合わせも多種多様な時点で、潜在的な検定の多重性を考慮しなければいけない案件です
・結果報告は任意なので、本当の実験であっても良い結果のみを恣意的に公表できる(=信頼されにくい)環境ということを認識しましょう >>663
EXCELでシミュレーションしたところ勝率0.5だと
おっしゃる通りだけど、勝率0.7でやると下記の
確率分布に従うよw
10局 7勝 3敗
勝率: 0.7
標準誤差: 0.15718104959867515
95% 信頼区間 [0.4, 0.9]
10回戦単位で、勝ち数が4以下の出現数を調べました。
その作業を10回繰り返して負け越しの頻度は6回でした。
つまり勝率7割の棋士が10回戦毎に区切って負け越す
頻度は100回やって6回しかないということです!
勝ち 1 2 3 4 5 6 7 8 9 10
0 0 2 0 0 2 0 0 2 1 Excelなんか使わなくても二項分布知ってれば一発なんだがこんな事も知らんのかな 663の方がいいサジェスチョンをくれたのでエクセルでシミュレーションした
ら勝率7割と勝率8割では段違いに結果が違ってくるのが分かった。
藤井聡太君がこのまま勝率8割を維持できたらとんでもない結果が生じる
と思います。
勝率8割だと10連勝が良く出現しますw >>669
何が一発なんでしょうか?
負け越しの確率を一発で計算できるということですか? >>668
あんたは帰無仮説を理解ができていないんだなってのがよくわかった
実際には真の勝率は未知であり、試行を繰り返して得られるのはその推定値でしかない
その推定値の信頼性を定量化するのがt値等であって、
真の勝率が7割であると「わかっている」時、負け越す確率が何%かなんてのは意味がないんだよ 10局とかで書き込むなよ。17時間ならすぐだろ。
それがつらいなら持ち時間減らせばいいし、もっといいPC買ってスレッド数増やせ。
計算能力が2倍になれば同じ計算は半分の時間で済む。 >>672
その考え方にたどり着く一歩ではあるのでは。
10戦して7勝3敗だったとき、
真の勝率が1割、2割、……9割のソフトが
運良くまたは運悪くその結果になった
可能性があって、
7勝3敗はその重ね合わせを見ているとも言える。
ただ1割2割のソフトがめっちゃ運良くその結果を出すと言うことは滅多にないとは言えるだろうと。
しかし勝率4割のソフトが7勝3敗を気合いで出してくるのは少なからずあり得て、
7勝3敗はその結果をみている可能性が少なくなく、である以上はどっちが強いかわからんと。 勝率2割が7-3は稀によくある
計測は自由にしたらいいじゃない。それをどう判断するかは人それぞれ キメラが乱立した去年でも10戦で優劣つけようとした人なんて居なかったのに ってかさ、1000局やっても定跡オフでランダムでも無い場合結構同一局面多いのでは? 定跡オフでの検証は時代の流れに左右されない一つの答えだけどねぇ
ある時点のあるソフトで作成した定跡・互角局面集は本当に互角かという話になる 定跡なしだと戦型はかなり固定されるのは事実だけど
全く同じ勝ちパターンを繰り返すってのは少ない印象 むしろfloodgateの技巧2の定跡なんかの方が同一パターンの負けを繰り返しているのをよく見かけるから
あれなんとかしてほしい >>680
なんで検証の話してる時にfloodgateのgikou2_1cの話をしているの? 下手な定跡つかってそれにハマり形含まれてたら嫌ということでは ハマることもあるけど、
数を重ねれば基本的には定跡でトータルの勝率は上がってるイメージだけどね 100局セットして50戦目まで33勝14敗3分だったソフトが100戦後には49勝45敗6分だったことがある
そのソフトは後半に9連敗と5連敗を経験していた
前半50戦で見れば勝率70%だが後半50戦では勝率30%だ
10戦やって9-1だったソフトが100戦後には有意差なしなんてこともままある
あと17時間でできる連続対局はまだ可愛いほうだろ
寝る前にセットして仕事から戻ってきたときには終わってる >>684
ホントに100局対決したくなるようなソフトの力量さ
がない時点ではその場で判断できる局数で十分と考える方が普通だよ。
普通のノートパソコンで連続対局してるとその間他のこと出来なくなるから。
そしてこれまで10局ぐらいで新しく出てきたソフトの強弱はすべてあたってたからねw 他の事に使えないと困るのは、あなたの都合にすぎない。ただの言い訳。
その言い訳つけて、いい加減に計測した結果を得意げに語られても、
統計的には全く信用できないし、それに引っ張られて判断誤る事になる。
ただの自己満足で、他人に迷惑かけるなって事言われてるの、わかってる? 春も秋も一発勝負
そして強いソフトは一発勝負でもやはり結果を出していることが多い
細かいところはともかく10局でだいたいわかるというのはあながち的外れじゃないかもね
16年のポナ、17年elmo、18年pal,白ビールちょくちょく落としてはいたが全体的に強かった >>688
河童がレート高いのに順位振るわないことが多いぞ そんなに必死に否定しなくても
10局検証した人には「あっそ」
100局検証した人には「へー、そうなんだ」
500局検証した人には「マジかー、そうなると今度はアレvsアレもやってみるといいかも。俺はこっちを検証してみる」
みたいなレスをやってたら自然と淘汰されるだろう >>690の言う通りで10局でどうのって人に真面目に返さなくていいと思うけど
ふーん、じゃあそのまま100局くらいやってねってなふうに 10局の検証だってないよりはマシだしな
淘汰するより利用してやれ >>689
河童はuuun氏基準の1500万ノードでは強いが、競技会では一手数億ノードも上がったりするので、
河童絞りが他の参加ソフトより高ノード(長時間)でやや弱いから順位が振るわないってことはないのかな
同じelmo絞りでも1500万ノード基準で検証している人と(河童さんがいくらのノード数で検証しているかは知らないが)、
elmoの瀧澤さんのように一手20秒(去年のTwitterで見た)で検証している人の差が出ているのかも 条件がそろっていない10局を幾ら集めても意味なし。 >>693
そういうことなんじゃないかな
あとは後手番引きすぎなのがね・・・ >>693
WCSC後にQhapaqの人も「河童絞りは長時間だと強くないのでは」と疑問抱いたけど
「長時間計測だと対河童系が一番結果悪かった」って白ビールの人がいってたから長時間弱い説は否定された >>696
評価関数は相性問題があるので白ビールだけだと単に河童との相性が悪かっただけの可能性は否定できないんじゃないのかな
3つ4つの他のソフトとの検証がないと河童が本当に長時間も強いとは言えないんじゃないだろうか >>697
白ビールのチームは評価関数いくつも用意してたみたいだし、相性問題についても問題なさそうでは 感覚的には「一発勝負の大会で成績振るわないから」を根拠に推論する方が筋悪く思う >>693
それは有り得るね
昔、技巧2とか魔女の時代の頃、1手5秒10秒の対局アホみたいにやってたことあるけど、
uuunさんのところどころか、自分でやってた1手1秒の結果とはかなり違くて、
(R差が違うくらいじゃなくて、100差くらいだと逆転してたりもする)
結局、自分で計測すること自体やめたw
あと河童さんは大会だと定跡段階でやられたりしてた気がする なんでそんなに偉そうなこと言うのか理解できない。
コンピュータソフトのどれが一番強いのかを議論しているわけだから
10戦ぐらいで結論づけてまちがっているのなら他の人が逆の結果を
出せばいいことだけじゃないか。結局今回のillqha1.1は、ここで公開して
すぐに検証した結果強そうな結果が出たから最終的には
「uuunuuun」氏は採用せざるを得なくなったわけです。当初は素性の知れぬ
物は無視していましたがこのスレで次々と対戦実績が出てきたので無視
できなくなったんじゃないかな?
===
686 名前:名無し名人 (ワッチョイ 4b8a-kTp/)[sage] 投稿日:2018/07/28(土) 15:55:05.73 ID:JzHAJahw0 [1/2]
他の事に使えないと困るのは、あなたの都合にすぎない。ただの言い訳。
その言い訳つけて、いい加減に計測した結果を得意げに語られても、
統計的には全く信用できないし、それに引っ張られて判断誤る事になる。
ただの自己満足で、他人に迷惑かけるなって事言われてるの、わかってる?
⇒何が迷惑なのかさっぱりわからんw
687 名前:名無し名人 (ワッチョイ 3761-kCGC)[sage] 投稿日:2018/07/28(土) 15:57:25.10 ID:xpwC+5oz0
統計を根本からわかってない人はいるんだよなあ
⇒統計を根本から分かってたらどういう判断になるんですか?
すべて統計的にはデータ量が不足しているので判断はできませんですってか?
つまんないやつだな! キメラ乱立した時に対して強くないソフトが強いとされた時期があった
10局で判断できるというあなたの経験則よりもコンピュータ将棋の歴史と数学を大事にしたい もしもX手までまったく同じ棋譜があったらその棋譜はまとめて一つ扱いにするってのはあってもいいかな
Xをいくつにするかはどれくらい同一棋譜があるのか調査して決めて グダグダ長文考えてる間に一手一秒でも100局回したほうが
話を聞いてもらえるだろうなあ 10局で大丈夫みたいな学術的な理解とかけ離れた事言ってるもんだから
みんな自然と口調が偉そうになってしまうのよ 単純に公開した作者の立場に立てば良いのでは
10局では有難うございますレベルかな
数百局以上なら作者もそれなりに参考出来ると思う 恣意的に抽出した10局出されたりしたら無意味だしな
10局評価とかスルー安定 >>706
ホントにこんなものいいしか言えないやつが多すぎていやになる。
少しはリアルな世界と同じような会話をできないのかね?
偉そうな話しぶりにはうんざりする。
なんだかハンドル握ると人格変わるようでがっかりです。
将棋のスレッドぐらいは普通のレスをしてほしいもんだ。
========
706 名前:名無し名人 (ワッチョイ 3761-kCGC)[sage] 投稿日:2018/07/28(土) 19:56:53.81 ID:xpwC+5oz0 [2/2]
グダグダ長文考えてる間に一手一秒でも100局回したほうが
話を聞いてもらえるだろうなあ
⇒ 対戦数を1000回して結果に有意があるとか言いたい人だけが頑張って
回したらどうですか? 普通の人はそこまで一生懸命にはならないですよ。 >>688
大会では解説聞きながら1手1手見るやん。
するとレーティングで200くらい差がある対局だと、
なんか手応えや力の差が見えてくることがあるやん。
そういう場合は、極端な話、1局でも見えるものがあると思うよ。 >>709
と言うかそれ目的でやってるんだと思ったわ
持ち上げたいソフトのいいとこ切り取ってやってるもんだと
そしたらまさか本気で10局で足りると主張してくるとは >>710
ここには異常な人しかいないんですよ(将棋ソフトにおいて)
マナーとは共通意識のもとで成り立ちます
10局では少ないという意見が多いなら、それがこのスレ上のマナーです
10局で十分というのはあなたの主観でしかなく、集団上その意見に価値はありません
10局で十分だと言うのはあなたの勝手ですが、それに対する批判は受け止めるべきです 俺の家族がみんなでこの番組見たから視聴率100%(キリッ
って感じなのわかってるのかね。 長時間の10局なら意味あると思うよ
棋譜の価値としての 結局大会は人がやる対局を模したものだからPCソフト大会としては不完全なんだろう
そう言う意味では公開されたソフトのレート順位の方が実力に近いのだろう SDT6は皆NNUE?
KPPTでQQRより強い評価関数出てこないかなー(チラッ) >>710
確率の(独立)事象ってのはランダムで、
ランダムってのは試行回数が少ないとしばしば偏る。
偏らずに均等に結果がでるようなのは
むしろランダムでなく作意がある。
6回に1回だけ6が必ずでるサイコロは、
バランス良いイカサマ賽。
宇宙の星はランダムに配置されている…天の川を除き…といっていいだろうが、
格子点のように均等配置はされていない。
偏って変に配置されるから、我々はそれを星座と認識できる。
かように、ランダムはしばしば偏るという確信があるから、
10回程度で偏った結果を見せられても、
意味のないランダムの偏りなのか、
真の勝率に差がある意味がある偏りなのか、さっぱり、まったく判断つかない。 ttp://lfics81.techblog.jp/confidence_interval_ja.html
少ない対局数のとき、どのくらい幅があるのか一目でわかるので使ってみるといいかと >>712
この数式みて理解できたの?
そこまで数学専攻したとも思えないね。
なんでそんなにえらそうなのかね???
俺にとっては下記のURLのほうが統計学の読みものとしては
よくわかって興味深いものがあるよ。
https://shogi100.com/2018/02/23/012/
「デビューから」という条件を緩和してみます。比較対象として、2018年2月21日現在、
羽生竜王の通算対局数は1962局、勝率71.17%です。この成績をもってしても、
「羽生竜王と同じ勝率の棋士が同じ対局数を戦い、どこかのタイミングで29連勝以上
する確率」は9.6%しかありません。羽生竜王の実際の連勝記録は22連勝です。
対象を全棋士に広げると、棋士数を312(新四段の古森四段の棋士番号)、
通算対局数を730局(全棋士平均)、期待勝率を平均50%及び標準偏差10%だと
仮定すると、「全棋士の中の誰かが、どこかのタイミングで29連勝以上する確率」は
約70%です。
さすがに「全棋士の誰か」が「いつか」29連勝を達成していた確率を考えると、統計学的には実現していてもおかしくはない記録、ということになるようです。やはり真の凄さは「デビューから」という点に集約されますね。 知識不足を指摘され教えてもらっても自分のプライドを守ることにのみ必死な人はどの分野にもいる。
相手しても無駄なんことも明白なので程々に。 統計がどうのって意見してる人で、
「はい、これが統計的に誰もが認めるものだよ」って、
具体的にサンプルを挙げている人がいないね。
建設的な意見をだしましょうよ。
ただくさしてるだけの「能書きは不要」です。
素人の私からしたら、10局だけだろうと、
具体的な物を出してる人の方が参考になるけどなぁ。 少ないノード数の計測でもこんな感じでデータを出せば多くの人が満足するんじゃないかと
対局数:500局
例A勝ち:293
例B勝ち:207
引分け:0
勝率: 0.586
標準誤差: 0.02206055312117165
99% 信頼区間 [0.53, 0.642]
相対イロレーティング: 60.35890995887666
標準誤差: 15.796568050416983
99% 信頼区間 [20.87120466602866, 101.46080056999158] ここでの検証結果なんか10局であろうが1000局であろうがいくらでも盛れるんだから、信頼性はないと思うけどなぁ。
結局は自分でやるか、信頼に値する人がやった検証しか当てにならない。 >>726
例えば数十万の少ないノード数で対局数を稼ぐのは簡単だけど、ノード数が少ないと実際の強さと乖離があると言うので、あるレベルのノード数はいるよねと言うのが今の所かな 素人がこのスレを見る必要あるのか
有名なソフトを使っておけば十分ではないのか
検証不十分なソフト同士の対局というマニアックな分野にわざわざ飛び込もうってんだから
ちょっとした数学知識くらい持ち合わせてほしいところ 自分の不得手な分野に突っ込んでいってこれだけツッコミのレスをもらったにもかかわらず
一向に自分の間違いを認めようとしないその姿勢はすごいと思う 「いいね」がもらえると思ったら、ダメ出しされた。
なぜダメなのか理解できないし、ヒント貰っても理解に努めようともしない。
こういう人という事でしょ。 ここまで自己正当化が凄い人も珍しいな
それはそれで尊敬する。迷惑だけどw えびふらいさんが久々に放送するみたいだけど、
最近彼は何か進展あったの? NNUEの計測ってPCがヤバそう(小学生並みの感想)
KPPTでQQRより強い評価関数出てこないかなー(チラッ) >>669
コンビネーションを暗算できるとか天才かな?
ホラ吹き乙 >>726
だから、そんな感じなのはいいんだけど、
「具体的なデータ」じゃないですよね?それは。
あなたの意見よりも10局でも「具体的なデータ」の方が
建設的な意見だと言ってるんですが、
ここ最近で具体的なデータを挙げている人は、
10局の人と20局の人の二人だけじゃない?
さんざんくさされてるけど、私にとってはその二人の意見の方が
参考になります。
ありがとうございます。頑張ってくださいっていえないのかなぁ? 定期的に変なの湧くけどこの前のときも学生の夏休み時期だったような >>737
「コインを10回投げて7回表でした。経験則的に表が出やすいに違いない」
「7割表が出るコインなら、10回投げて裏が多い確率は6%しかないから検証は10回投げるだけで十分」
「コイン10回投げたデータは有意義。この結果を暫定的に採用して俺に感謝しろ」
頭悪すぎちゃう? >>712
初めて見たけど
単純に勝率pを確率変数とした確率分布から信頼区間出してるのかと思った やねうら王 NNUE型評価関数ビルド V4.82公開しました
投稿日時: 2018年7月29日
キタ――(゚∀゚)――!! やねうら王は従来のものを形式変換しただけでしょ?
えびふらい放送は仕事してて放送しなかったので近況報告のようなものでしょ >>740
あたまわるいのはあなたじゃない?
コインで例えるのが間違ってると思わないの?
コインの表裏の確率に偏りがあるとはだれも考えないし証明もできないでしょ。
だから確率0.5で10回投げてもその結果は二項分布の離散確率分布に従った
結果しか出てこないと思った方がいいんじゃないの? コンピュータ将棋に関係ないことは他でやってくれないかな
頭が悪いと思うならその相手はスルーするのが大人なんだがな
ガキばっかになっちまったな >>742
T.N.K.がそもそもYO4.82を改造して使って、それを少し変えてマージしただけじゃなかったっけ? 無償で公開されたものに悪口言う奴らにはやねさんがゲンコツや! >>744
誰もコインに偏りがあるとは考えないからこそコインで例えてるんだろ?何言ってんだお前
真の勝率がコインと同じように差はないかもしれないのに、それを勝率7割あればほぼ勝ち越すから10回で十分と言い張るのは、
コイン10回投げて7回表が出たから表が出やすいという馬鹿馬鹿しい主張とかわらん
あと非理想的なコインの偏りは統計的な答えを出せるし、
二項分布はp0.5に限った話じゃないので意味不明 俺素人だけど、 (ワッチョイ 32e7-53i4) の言ってることは間違ってると思う。
過去スレにもいたけど、やねうらエンジンの比較で自己対戦して10局で充分とか言ってる奴いたけど、コイツと同一人物だったんだなって思った。 >>749
話を正確にしたいんだけど
俺が主張した内容は以下の通り。
新しく出たソフトに対して10回程度の結果でも7勝3敗という結果が
でれば7勝した方がその時点で強いと決めつけても、そうそう間違いがないということ。
その結果に異議があるのなら違った結果になった人が俺の場合は逆だったよとか
互角だったよとか書き込めばいいだけの話になる。
そうすることによって最初に主張した人ももう一度対戦させて自分の対戦結果が
間違ってたかどうか検証するだけの話になる。
100回以上対戦させた結果じゃないと意味がないという主張こそおかしいといいたい。 >>750
8勝2敗から、200局越えたら勝率50%切ったことあるよ >>748
非理想的なコインの偏りとは何?
回数が増えれば信頼区間の幅が小さくなり統計学的に
有意だという話だけじゃないの?
10回の対戦で95%の信頼区間は0.4−0.9であり、
実際にEXCELでシミュレーションすると実感できるが
10回対戦結果を100回繰り返して負け越すケースは
6、7回しかないんだよw
10局 7勝 3敗
勝率: 0.7
標準誤差: 0.15718104959867515
95% 信頼区間 [0.4, 0.9] >>751
統計学的には95%の信頼区間外の現象が生じたということじゃないの?
8 wins / 10 games
WP: 0.8
SE: 0.13719886811400706
95% CI [0.6, 1]
ELO: 240.823996531185
SE: 148.96177836321317
95% CI [70.43650362227247, 1e+308] 10局ガイジに構うのはもうやめとけって
なに言っても聞くきがないんだからさ まあ10っていうのは普通の人にとってみればかなり大きい数字だからね
確率だかなんか難しい学問やってこなかった場合それで十分と思うのは無理もないと思う キメラが大量発生した時は開幕9連勝から負け越しは俺も経験した。
ずっと検証してりゃそれくらいはあるんだよ。
普通じゃない主張をしてるという自覚は持ってほしい 順位戦だってたった10戦だしタイトル戦の結果だって全く意味ないよな ドサクサに紛れて経験上どうだとか嘘つくやつが多いな 少ない対局数だったり極端に短時間だったりする結果から強そう弱そうと予測するのは個人の自由
他人にそれを強要するからおかしくなる
10局やって全勝したら強そうと思うのは普通の感覚
じゃあ8勝2敗の他の結果と比べて全勝の結果が圧倒的に優れているかとなると謎、だから対局数を増やす 誰も定量的に議論してなくて草
俺の計算だと10局中7勝の場合
7勝側の真の勝率が50%切る確率は11%くらい モンティ・ホールとか条件付き確率の問題苦手そう。
https://bellcurve.jp/statistics/course/6448.html
事前確率がわかってないので、条件付き確率よりさらにわかりにくい問題ではある。 「髪の毛が一本もない人はハゲである」(前提1)「ハゲの人に髪の毛を一本足してもハゲである」(前提2)
ここで前提1に前提2を繰り返し適用していく(つまりツルッパゲの人に髪の毛を一本ずつ足していく)。そして次の結論を得る。
「よって全ての人はハゲである」(結論) >>763
逆にやったら
全ての人はふっさふさである。 >>759
誰も強要してませんよ。
一つの見解と受け取ればいいだけじゃないですか?
私の経験測では10局やって7勝3敗以上の結果が出れば
強いという判断をするということだけです。もちろん例外は
1割以上あるでしょうけどw
お手軽に新しい評価関数を評価できる方がいいと思ってるだけです。
100局やるとなったらその間ノートパソコンで他の事が出来なくなるから
より少ない対局数で判断したいと思ってるだけです。 一発勝負の大会でも頭抜けて強いソフトはだいたい強かったからな
今回はそういう気配があった白ビールとPALが非公開だから確かめられないけど
技巧、ukamuseとそのパクリの真やねうら王、elmoははっきり強かった 「10局やってそんな結果が出たとは興味深いですね。すごいすごい」
これでOKか? >>742
試してみたけど以前のと変わってないような気がする。
かれこれ3回ぐらいやってるけど一回も勝ち越してないよ。
https://i.imgur.com/OKEzF3A.png >>768
だからそんな風な反応なんか期待してないから!
じゃ自分もやってみてほんとかどうか試してみるってのが期待するレスだよ。 10戦では「どのくらい」強いかはまるでわからない、だから皆価値がないと言うんだと思うよ >>770
「10戦の結果がそんなだったんですね!(統計的にはゴミクズなので)自分で検証してみたいですね!!」
これで大満足だな。 >>769
あれ?イルカの中に入ってるのってそもそもやねうらおうだよな?
ドルフィンとは別なんだっけ? dolphinはソースコードを読めば分かるけど
LMRの条件分岐のコードも細かくチューニングされている
パラメータだけと見せかけて実は結構大掛かりな改造が施してあるね やはりたった10回でどちらがより強いかと言い出すのは早計すぎる
大数の法則だよ、少しでも試行回数が多い方がデータとしての信頼度は高い
たとえ100回やっても大まかな勝率しかわからないと思う
1%単位まで勝率を求めるなら最低でも1000回は必要かな >>766
>一つの見解と受け取ればいいだけじゃないですか?
なら100局は必要という意見も一つの見解と受け取ればいいじゃない
100局必要という人に対して、10局で十分と反論するからより批判されてるのにそれが分かってないのか? >>774
ファイルがやねうらおになってたからてっきりドルフィンの中にやねうらおがそのままはいってるのかと思ったわ >>776
こんなスレを開発者の皆さんが見てるかと思うと恥ずかしいです 10局君はまだまだやな
漏れくらいになると、その10分の1の試行数で十分
しかも5割以上の確率で正しく判断できるw
でも友達は試行すらせずサイコロ振って決めてるから
それに比べればまだまだやけど >>775
実際に1000回やったエビデンスを出せば良いんじゃね? 前にもここに書いたけど、shogi sparkの開発者はアマ強豪の奥村だったんだな。
ソースは朝日杯の中継 ほう
>奥村アマはスマホアプリ「Shogi Spark!」の開発者でもある。将棋ソフト「技巧」を用いて、次の一手問題を自動で生成する。
>奥村アマ自身も日々の練習で使用し、朝日アマのベスト8入りの原動力になったと語っている。 そのアプリ、どれ指しても大差ないような問題とか、取る一手の成と不成が片方だけ正解とかあって、微妙な面はある
アマ強豪の方は文系だと思ってたから同姓同名の別人と思ってた >>778
追加で調べたらdolphinのLMR周りのコード変更はwhale6と同一だった
というかSDT6でのwhaleシリーズのコードの取り扱いハッキリさせないと後で揉めそう
改造箇所からしてStockfish系列ならどんなエンジンにでも流用可能だし べつにやねうら王って改変・再配布って条件付だけど自由じゃなかったっけ?
誰がどう弄って公開しても、それを改変されたくないとか再配布されたくないとかできないんじゃね? >>785
随分とアマ強豪に詳しいんすね
suimonさんですか? >>787
ソフトのライセンスとは別の大会独自のライブラリルールに
引っかかる話だと思われる >>789
あーなるほど
使いたければ皆等しく使えるってほうが面白いと思うけどどうなんだろうね
まあwhale6のコードで長時間でも強くなるのかそもそも謎だけど whaleシリーズは低ノードで強くなるようにパラメータ調整している感じなので、WCSCなどの億単位のノード数ではあまり強くないかも >>785
すーぐ大差無いとか言い出す
だから細かい形や手順の違いが分からずに研究もアバウトなんだよなw アンチsuimonは基地外しかいないな
多分アプリの何も分かってないんだろうけど一応言っておくわ。
とある局面(プロ公式戦?)で候補4つの4択問題で、技巧の評価値が一番いいのが正解。100と99なら100が正解だし、問題の局面によってはどれ指しても-1000とかがあるから、そういう意味で微妙と言った スマホアプリ「Shogi Spark!」が使える使えないの話は別のスレでやってくれ 定跡や差し手の研究家のsuimonさん関連の話題は専門スレのこっちでやってくれ
「suimonユキ_feat.mztn7応援スレッド16」
https://mevius.5ch.net/test/read.cgi/bgame/1530536517/ suimonさんは将棋ソフト開発とは関係ないし、将棋ソフトを使って定跡や差し手の研究をしている立場でしかない
定跡や差し手の研究をしていない一般の将棋ソフト愛好家から見たら興味ないだろ そもそも、ろくに研究できてないし中途半端なただのアマチュアなんだよなw >>793
すぐ開発者の素性を調べてここにレスしてしまうお前も酷いぞw >>791
こういうような短時間と長時間で得手不得手があるなどというのは
理論的な分析はあるんだろうか? >>800
最適な枝刈り方法はどれだけの時間をかけて読むかで変わるという話は随分前からある
極論無限に時間をかけて読めるなら枝刈りなんてなくてもかまわないわけだし >>786
dolphin/whale6のLMR改造部分のうち
「&& type_of(pos.piece_on(to_sq(move))) == ROOK_DRAGON」
ROOK_DRAGONは値としては18なので、必ずfalseになってしまうような気がします。
position.hのvaluable_capture()の「return ( cp == BISHOP_HORSE || cp == ROOK_DRAGON);」は
「return ( cp == W_PAWN || cp == W_LANCE);」と等価なので、意図した動作ではないような気がします。
修正して強くなるか弱くなるかは分かりませんが...
もし間違っていましたらすいません。 >>801
探索変えるのならわからんでもないが
評価関数バイナリ変えたら時間により変わるというのが理屈が謎なんだよなあ >>803
時間が変われば探索で提示される局面が変わって、
局面が変われば当然その評価関数の得手不得手かも変わるからね
でも言えるのは違ってもおかしくないってことだけで、
この評価関数はこういう傾向にあって〜みたいなのは立証できないと思うわ 一手読みに特化した評価関数と普通に何手も先読みさせて使う評価関数では
最適なものはまずそれぞれ違うものになるだろうから
探索深さによっても違って来るんじゃないの 序盤を深く読めば中盤に、中盤を深く読めば終盤になる。
序盤、中盤、終盤で駒の価値や位置関係の価値が変わるのであれば、
読みの深さで向き不向きが出てくる。
技巧2は進行度で評価関数テーブルを切り替えてるので、そこを重視しているようだ。
やね氏は、序盤、中盤、終盤で駒の位置が変わっているので、
(つまりテーブルの違う位置を使うので)1つのテーブルに重ね合わせてもさほど問題ないだろう、
とお考えのようだ。 >>734
就職面接ではいくつか進展があったらしく
未納だった国民年金も1ヶ月分は払ったらしく
めすあざらしと一緒にアイナナのコンサートに行ってるらしく
まあ順調に進捗してるのでは? 生主雇うのって怖いなあ。
仕事の話は禁止にしないと。 えびふらい無職って、親のすねかじって生きてたのか? >>798
大会ではアマ竜王戦の県代表になってるし、本は増刷もかかってるし、
それはそれで過小評価しすぎだろう
なんでこう極端なんだ将棋板は >>809
無職じゃないよw
国民年金の対象、つまりフリーランスで、囲碁・将棋チャンネルとかは嘱託 スレ違い、suimonさんの専門スレがあるので、こっちでやってくれ
「suimonユキ_feat.mztn7応援スレッド16」
https://mevius.5ch.net/test/read.cgi/bgame/1530536517/ 今度の電王トーナメントは探索部がカギになりそうだな
評価関数と探索部はワンセットが最新のトレンドだし 山口 祐 / Yu Yamaguchi @ymg_aq
産総研のABCI。Tesla V100 x4基のノードが180円/時間で借りられます。
AWSで同等のインスタンス(p3.8xlarge)を借りようとすると2300円/時間とかするので爆安すぎます。
安すぎて税金によるダンピングとか民業圧迫とか言われそうですが、普通に私も借りたいですね
https://abci.ai/jp/how_to_use/tariffs.html 山口 祐 / Yu Yamaguchi @ymg_aq
産総研のABCI、どのくらいヤバいかというと、
ユーザーあたりMAXの32ノードを借りられた場合、
AlphaZero(将棋)の学習が70万円と5日で完了する計算です
↑これは借りられた奴が勝つってやつだな ディープラーニング勢が言い訳出来なくなるから辛いなこれ
計算資源がないから弱くても許された感があったのに 山口 祐 / Yu Yamaguchi @ymg_aq
さてここにAI囲碁世界選手権で稼いだ150万円があります ちなみに来年辺りメスアザラシとの結婚を考えている模様 >>821
アザラシのペニスはクソでけえんだぞ
満足させられるか? 囲碁のDL勢ってのはどれも市販されてないんだよね?
もし将棋もDLが主流になったら今みたいに手軽に使えなくなるんだろうか? >>812
アマ竜王戦もレーティング選手権も予選落ちで全国大会で通用していないし、本はAmazonランキング圏外で全然売れてないし、適性な評価なんだよなぁ。 >>825
加藤さんの判断で、市販版はグラボを使えない仕様になってる
囲碁ソフトの主要なユーザー層でゲーミングPCなんて持ってる人はほぼいないから >>826
まあ、お前は県大会も突破できなきゃ単著も出せないわけだが >>825
天頂の囲碁はDLバージョン未搭載 ユーザーのハードが千差万別なので
問い合わせに対応しきれない https://abci.ai/jp/about_abci/computing_resource.html
□計算ノード
各計算ノードには2基のIntel Xeon Gold 6148と、SXM2で接続されたNvidia Tesla V100が4基、NVMeで接続された1.6TBのSSD、384GiBメモリが搭載されています。
計算ノードの単体性能は、506 AI-TFLOPSで、人工知能研究の機械学習に必要とされる半精度浮動小数点の演算を1秒間に506兆回行う能力を有します。
工学的な科学技術計算で必要とされる倍精度浮動小数点演算おいては、計算ノード単体で34.2 TFLOPSの性能を有します。 >>828
俺A級の立命館戦で勝ったことあるけど、おまえ勝ったことあるの?w よっわw
将棋クエスト【2分】棋譜(garnet_crow[2343] 対 kamokamoo[2459]) http://questgames.net/shogi2/game/s88df9yp4dpj #将棋クエスト #ShogiQuest >>832
>>833
お前らいい加減にしろ
将棋ソフト開発とsuimonの話と何の関係があるんだ
このスレを荒らすなや suimonの話ならこっちに書き込めや、suimonの話など誰も興味ないわ
「suimonユキ_feat.mztn7応援スレッド16」
https://mevius.5ch.net/test/read.cgi/bgame/1530536517/ そら、世界コンピュータ将棋選手権の真っ最中にレーティング選手権に参加なんかしてたら外野扱いされるわな(笑) >>816,817,820
パル山さん本気出しちゃうかー!
でもSDTの規定スペックは最高でもGTX 1080だろうし、AlphaZeroレベルの学習してもKPPTにすら負けそう 【悲報】 日本政府さん、焦る 「すまんこれからIT奴隷が30万人不足するんだが…これどうすんの?」 [437931475]
https://leia.5ch.net/test/read.cgi/poverty/1532915265/
お前らもコンピュータ将棋なんてどーでもいいもん作ってないで
ちっとはもっと役に立つ物作る事に精出せよ 異様に専門的に成ってきたなこのスレ(w。開発者も参入か(w。 むしろ開発者の書き込みは見なくなったろ
いろんな人が流入して幾分専門性は落ちたと感じる >>839
suimonことsuiseihuman
早く自分のスレに帰れよ >>822
えー、平岡さんまで山本組の仲間入りなの
それは地味にショックだ😵 >>846
HEROZの株持ってる平岡さんならともかく、
自営業という名の半ニートえびちゃんでさえ婚約しているというのに
おまえらときたら 言っとくけどコン将界は意外と割と妻帯者や彼女持ち比率高いと思うわ💑 suimonさんはイオンさんの残り香をまだ探しているかどうか >>851 はsuimonさん本人だろうがスレ違いだろ、自分の本スレに帰りなよ 自分の本スレがあるのになんでわざわざこのスレに来るのだろうか
「suimonユキ_feat.mztn7応援スレッド16」
https://mevius.5ch.net/test/read.cgi/bgame/1530536517/ マジレスするとえびちゃんでも業界では上位のスキルだぞ
レッドコーダーがわんさかいる強豪将棋ソフト界隈がおかしいだけで さすがにレッド経験あるのって野田さんくらいかと思ってた さすがにレッドコーダーがわんさかはいないんじゃね?
stockfishとかGPS shogiのコードを理解できる時点でかなり実力あるプログラマが揃ってると思うけど イルカちゃんの最新版まであと少し!
最強のヌエと探索セットとか胸熱 http://www.chessdom.com/tcec-season-13-the-advance-of-the-nns/
TCECシーズン13は現地時間8/3に4部リーグから開幕
今回はLeela Chess 0とDeus Xという2つのNNエンジンが参戦。
これに伴って、NNエンジンにはGTX 1080 Ti × 2 の環境が用意された
TCECのチャット欄における専門家の発言では、AlphaZero対Stockfishにおいて
AlphaZeroが用いたパワーのほぼ35%に当たるだろうという推測
このパワーで多すぎるということはないだろうとのことで、過小かどうかは
今回の大会結果を見て判断するとのこと
αβ探索のエンジンは従来どおりXeon44コアのCPUで稼働し、
CPUとGPUを対局サーバで通信させる
万一通信エラーが起こった時は初手から指し直しとのこと
しかし、AlphaZeroに対しては
「Stockfishの設定めちゃくちゃだったよね」
「Stockfishもスパコンで動かさねーと結果に何の意味もねーだろ(ヒカル・ナカムラ談)」
とまあ、当然のそっけなさですな >>859
イルカちゃん公開なの?
教師局面増やし続ける方法ならばパソコン資源の勝負になります >>860
将棋はelmoの設定が疑問視されてたけどチェスも突っ込まれてるのか それこそ最初のalphagoの論文からして伊藤さんからZenとCrazyStoneの設定突っ込まれてたもんな
Deepmindがなぜ対局においてあそこまで対戦相手の設定をぞんざいにしたのかは謎 将棋ではNNが苦手と思われる終盤を全く指さずに投了するような設定にしてたからな
結果が出るようにわざとそのパラメータ―選んだと疑われても仕方ないレベル 異種格闘技に完全な公平なんて存在しないから
どんな設定でやってもイチャモンが消えることはないだろ 公平とかじゃなかて雑、手抜き或いはわざとが
疑われるレベルなんでちょっと違う TCEC12、今にして思うとなんでLC0エントリーしちゃったんだろうね
GPUなしのCPUオンリー環境だったのに >>868
こっちでしょ
めきっと@鵺日々成長中 @_illqha
評価関数固定対局。
https://drive.google.com/file/d/1JudYdmqAIDCwASeWQRHqyErFBbsBpnte/
dolphinシリーズは教師作成用に探索パラメータを設定したエンジンなので、dolphin2(予定)では対局条件をdepth10固定にした場合に限ってYO4.82に9割ほどの勝率です。
来週末くらいに評価関数と一緒に公開しますので、教師を作る方はぜひどうぞ。
めきっと@鵺日々成長中 @_illqha
※depth10で強いからといって、作成した教師から学習した場合強くなるのかどうかは未確認です。わたしが勝手にそう思っているだけです、ご注意ください。 真やねうら王がお咎め無しの前例により
SDTでは教師局面はどのソフト・評価関数で作ってもセーフ扱いだからありがたいね 今年の将棋電王Tは本当にあるのかな、未だに何の知らせもないので疑わしい
開催があるのかないのか分からないで開発している人の身にもなってほしいが いつもこの時期ぐらいには開催告知はあったはずだから今年は無いのかもね そもそもドワンゴからすればニコニコはプレミアム会員数はピークを終えて激減中だわ
賞金やらゲストや解説呼んだり設備機材費用膨大にかかるだわ
ponanza引退して名人も敗れて目新しさ全然無くなったわ
でそもそも開催するメリットほぼ無いからな。
契約あって続けなくちゃいけない叡王戦と違い
何のしがらみのない電王トーナメントはむしろ今年開催されたら奇跡の部類。
どこかスペシャルスポンサーが現れたりしらまた別だけどさ 持ち時間12時間、時間切れ60秒の設定で
illqha1.1(dolphin) VS NNUEkai3(dolphin)をやってるのです。
思考時間が長くなれば、強い評価関数が勝つ確率が高くなるだろうという目論見は、
今のところ分からぬ。
CORE i7-2700k(4.3GHz)
8スレッド
ハッシュ4096MByte
城跡未使用。
後手角換わり後、22銀じゃなくて42銀とか謎の手多し。
終わったらきふうぷするから見てみて。
いまきふうぷする?_ ああ、明日またこのスレ見るからその時判断するね>棋譜 10試合すんだら問答無用で、棋譜うぷするので、よろしく。・
たたかれてもうpするし。今2試合終わって3試合目の中盤だぞ。 だれかアイデアある?
>かなしさ@neco_tank
> 1000点で楽勝な将棋と1000点でもずっと怖い将棋に差をつけるためにもう一つ指標の軸がほしいな。 最近プロ棋戦の検討で貼られてる、探索木の色の濃さとか そんだけ長時間なら棋譜は見たい奴いるんじゃないかな
勝率についてはなんとも言えんが
持ち時間変えた時の勝率を傾向だけでも確かめたいなら
極端に持ち時間設定を増やしたものわずかにやるよりも
0.1秒、0.2秒、0.5秒、1秒の対局を1000局ずつやって直線的に勝率が変わるか?とか見た方がよほど現実的で意味があると思う A級あたりの人が棋譜見見ればどっちが強いか、
どこに弱点があるかはわかるんじゃね?
俺には全くわからんだろうけど。 >>880
>>881の言っている探索木と同じことなんだが
3手先までの最善・次善・次々善それぞれの評価値27個の単純平均だとどうだろう。
分散でもいいかもしれない。 と思ったら最近貼られてる探索木は1手目は3候補で以降は最善と次善だけで4手先まで見てるな。
3*2*2*2で24か。こっちの方がいいかもしれない。 >>876
後手側から角換わりを仕掛けたのなら22銀より42銀の方が形が良いって事じゃね
22銀は矢倉模様に形を決めすぎだけど、42銀なら雁木にももっていけるわけだし 持ち時間12時間のillqha1.1 VS NNUEkai3の棋譜が4つ出来た!
以前やったQQR(やねうら王) VS illqha1.1(dolphin)の棋譜が1つあるのでそれも混ぜてうpするよ。
ttp://www.axfc.net/u/3926240
僕は将棋の内容に明るくないので、良く分からないけど
見てみてね。
0.1秒対決とかいろいろやって直線性を見るの、やってみたいね
持ち時間1日1局っておもってエイヤ!って決めたところあるから、適当なのよね
42銀あり得るのね!やはり将棋の内容に明るい人が見るべき棋譜 とりあえずうpしてみたの。
10試合終わったら改めてうpするよ。
では1週間後! >>887
2五歩決められたら結局33銀上がるわけやし、42の銀が邪魔で42玉が遅れる分45桂速攻へ対応しにくくなるやろなあ。 i7で8スレ一局1日対局はかつて誰もやったのを見たことがないので棋譜は観る価値が高いと思うよ
一手あたりのノード数がここまで高いとプロ棋士の人でも興味はあるんじゃないの 888が10人いれば100局分の対戦結果を出せるな。これにさらにいつもの3倍の回転を加えることで >>884
例えば探索の際に、「評価値の変化」をチェックしている。
良いと思っていたらじわじわ評価値が下がるのはよくない兆候だから延長する。とか。
あと、浅い探索でよかったのに深く読むと極端に変わったりする。
こういうのを読み抜けないようにコントロールするという方法でこれまでコンピュータはやって来た訳だが、それがヒントになるかもしれない。
対人間で言えば浅さより、うっかり抜けのほうだが。
例えばDLで強いソフトを作った上で、一手読み候補値を出させてそれが悪手の手を狙うとか >>880
怖い将棋なんて主観でしかないじゃん
級位者にとっちゃ角交換の時点でどこに打ち込まれるかわからないから怖いし、
駒がぶつかって取る一の局面でも、とっていいかわからない人にとっては怖い局面だし 人の主観を客観化するのは難しいな
何指しても必勝の1000よりは間違えばすぐ敗勢の2000の方が、人間的には勝率高い。それも主観だけど 必勝の1000って必勝なんだから勝率100%なんだろ?
そりゃ必勝じゃない2000、かつ間違ったら敗勢よりも勝率高くて当然
自分で意味不明な条件設定をしておいて勝率高いも低いもないだろう
他の考え事、よそ見ばかりして今日は将棋やる気0の三段と
今日は特に将棋に全身全霊、この日ばかりは何が何でも勝ちに行ってる初段が居た
そういう時は初段の方が勝率が高かった
「だから将棋は三段よりも初段のほうが強い」
こんな条件での結論に何か意味ある? 細かい言葉で揚げ足取られるとは。このスレも変わったな
↓訂正
何指しても大優勢の1000よりは間違えばすぐ敗勢の2000の方が、人間的には勝率低い
評価値だけじゃなくて上みたいなときの差別化をどうするかってことだろう Daigorillaの作者(24たまに参戦中 ?) @tanadai56
@warsminamin ウォーズで調子が悪くてついついソフト指しを最近してしまったのだがそれが運営がひどく
偽計業務妨害の罪で訴えると言う。しかし返信メールには「外部ソフトを用いているから」という理由で罰が重くさせられ端末と大事なアカウントが永久的に停止させられた。
Daigorillaの作者(24たまに参戦中 ?)@tanadai56
@warsminamin しかしながら不正ツールは一切使っていなく、自作エンジン、思考部を使用しての不正である。
Daigorillaの作者(24たまに参戦中 ?)@tanadai56
@warsminamin 検証が不十分な上、開発者に失礼すぎで、かなりキレそう
Daigorillaの作者(24たまに参戦中 ?)@tanadai56
@warsminamin あともう1つ、MYアカウントが3つあり、ソフト指しはそれ以外のアカウントでした。それはもちろん牢獄行きになったが、
関係のない3つのアカウントのうち、かなりやりこんだアカウントだけを永久的に停止させられたのはなぜだ。一番大切なアカウントだけを消すのは運営の悪意しか思えない 非公開のソフト(絞っただけにしろ)を副垢ごとBANできるウォーズ運営有能だな >>880
今のソフトは最善手を指す様に仕向けているけど、
弱くなってもいいから、プロの差し手を指す様にすれば、最善手との乖離で表現できるようにならないかな。
(プロが好む指し手だと評価値が大きくマイナスになるときに危険とするとか。) >>901
自作エンジン、思考部って、ライブラリ不使用ってこと? >>907
Twitterみたらやねうら王使用、WCSC基準の独自性あり(自称)、教師局面生成時の定跡・学習開始手数以外の工夫は秘密 Gold_daigorillaが牢獄アバターになっているな 3切れ用に画像を高速で認識する自動ソフト指しソフト作った人だっけ めきっと@鵺日々成長中 @_illqha
illqhaの新評価関数ですが、予想以上に強くならないので今週末の公開は無理そうです・・・。
来週中には公開しますのでもう少々お待ちください。
めきっと@鵺日々成長中 @_illqha
ここにきて少しづつ教師の質と量を要求し始めた感がありますね。 >>912
焦る必要はないと思う。
試行錯誤の世界だからいろいろ仮説を立てて
検証していけばいいと思う。
極端な話10ぐらいの試行錯誤で1発当てれば
レーティング+50ぐらいは軽いんじゃないだろうか?
実際に棋譜解析をいろいろなソフトで比較することで
特徴とかがわかる可能性がある。
狙った通りの教師効果が出ているかは対戦するのが
一番手っ取り早いけど一方目視で狙った値が出ているか
サンプリングすることであらたなパラメータのインスピレーションも
湧くんじゃないかと思う。 雑巾絞り以降にR上昇ペースが加速して
それでも年間400、半年で200程度
そんなメキメキ強くなっても怖い NNUE型評価関数は、探索部との相性も含めてレート向上の余地はまだまだありそう >>901
こんなアホが就活中の大学4年なのか……この文章からして、他者とまともにコミュニケーションできない方なのは間違いないが、
それでも「他者とコミュニケーションがうまくいかない」「そもそも論理的な思考ができない」という自覚さえあれば、わざわざtwitterにこんな文章投下することもなかっただろうに >>912
強くならないのか
最適な探索パラメータが変化しているのかは議論の余地があるぞ
評価関数だけが強くなる時代はもう終わっているし やはり山下さんが言うようにR4500くらいが限界なんじゃね R4500が限界でもまだ全然到達してないし、神のレーティングがR4500なわけないからまだまだ将棋は奥が深いってことだろうな >>880
パスしたときの評価値の下がり具合も使える情報かな
指し手の難易度は他の弱いソフトや浅い探索でその正解手を指せるかどうかってので判断できそう 後手番で超速75歩から評価値が後手に傾いたまま勝ったのは印象的 suimonの話はスレ違いだろ本スレでやってくれ、コンピュータとは何の関係もないだろ
「suimonユキ_feat.mztn7応援スレッド16」
https://mevius.5ch.net/test/read.cgi/bgame/1530536517/ スレ違いだったらすいません。質問させてください。
ShogiguiにApreyを導入しているのですが、棋譜解析を行う際、どのような設定にしていますか。@プロの対局を解析、A24で対局さした自分の棋譜を解析が主な用途です。よろしくお願いします。 形勢グラフと棋譜解析なしかよ
アップデートが本当にされるまで保留だな
ってかそもそもいらんけどw suimon
@floodgate_fan
「将棋神やねうら王」のβテスター、はじめの段階から参加させていただいてましたが、
テスターの方の意見がどんどん反映されていき、最後はかなり強力な検討ツールになっていて、やねさんの力に驚きました。
最後のβ版では、実際に私が指した将棋を検討モードで検討もしましたが、有用性バッチリです。 将棋情報局編集部
@mynavi_shogi
「将棋神 やねうら王」マスター入稿完了! 最強クラスの5つの思考エンジンを選択して対局&検討。
見やすく、かつ使いやすいGUI。ものすごいソフトが完成してしまいました。
8月31日発売決定、DL版は将棋情報局にて先行販売する予定です。
https://pbs.twimg.com/media/Dj45iw8U8AAcpbo.jpg
「将棋神 やねうら王」の強さは10級〜九段、将棋神、カスタムから選べます!
https://pbs.twimg.com/media/Dj6PjnpUUAEx2gK.jpg 弱いのも選べるようになったのか
どうやってレベル調整したんやろか GUI本体はgithubから入手できるんだよね
でも駒等の画像を用意しないと実際には使えない? 将棋神 やねうら王は結局最終的に級位者の層も取り込んだ仕様になったのか、前は有段者以上限定の仕様だったが ponaXはGUIとエンジンのやりとりが無茶苦茶だったからな
GUIをまったく知らない人の作り
山本もGUIを作ったことがないからそれが通ったんだろうが
やねうら王はベータテストもやっているからトラブルがあっても小さくて解決可能 intel Core i9-7980XE 1999$
18core(36thread) 2.6 GHz(3.4/4.2GHz 4.4 GHz)
CineBench Score 3400
AMD Ryzen Threadripper 2990WX 1799$ 来週発売
32core(64thread) 3.0Hz(4.2GHz)
CineBench Score 5100 やねうら王は大丈夫だろう。
プログラマーとしての能力が段違い。 NNUEkai4をアップロードします
https://www.axfc.net/u/3927181
今回は、前回の反省を踏まえ、対illqha1.1に対して、1500万ノード、投了値3000、引き分け256手の設定で1500局対局しました
https://i.imgur.com/MlE6VFf.jpg
https://i.imgur.com/CkaNqbL.jpg
勝率は53.5%とほとんど強くなっておらず、透。さんなどと比べると残念な結果ですが、
有意確率0.2なので流石に有意差はあるのではないかと思ってます
上記評価関数には500局分の棋譜も添付しました
お暇な方はまた遊んでください 透は俺の強いって自慢したいだけなんだよな、今まで総合的なレートで有意差があるものは公開されたことがないので、
信用出来ないだろ、100局で勝率64%だとしても1000局で勝率53%に落ちることも普通にある >>951
透の自演
透は攻撃性があるので気持ちは分かるわ NNUEkaiやillqhaの人が惜しげもなく公開されるので、絵に描いた餅評価関数を自慢する透の存在価値はないだろ ID:2l65S3FE0
まふっていつも都合悪くなると透のせいにするのな
お前が一番承認欲求の塊
全部ブーメラン刺さってて草 たまらず何度もレスするところも
誰かを持ち上げて自分を保とうとするところもバレバレ >>948
kai4にやねうら王4.82入れてdolphin/illqha1.1に61-8-31でした。1秒4スレッド、互角局面使用
ところで探索部はdolphinとwhale6_Dittoどちらが優秀なんだろう。 透はずぼしを突かれてまた発狂しているな、前のスレでも発狂していたんだよな
今や何の存在価値もない、ただの俺の強えっの自慢屋だしな、誰もお前の絵に描いた餅評価関数
などどうでもいいわ >>957
1500局で53.5%なのにそんなに差がついたのか
やはり将棋は初手からのもので、互角局面を使った検証は使えないな 透は時の強い評価関数が出れば他のソフトとの相性問題はほったらかしにして、勝率何%って自慢した挙句、
公開したのはいいが、どれも総合的なレートで有意差なく強いのが無かったゴミ評価関数ばがりだったしな
せいぜい100局から200局しか計測しないので総合的なレートが高いものが作れるはずないだろ 20〜30手の範囲のどれか選んで先後入れ替えで計測するのが一番正確だろ 無罪の証明を求められているのだけれど、証明する度胸があるかどうか。
@anti_suimon
よって千田六段にはこれらの変化に対して、C-bookや将棋世界誌上で解説してほしいのだけれど、いかがだろうか。
@anti_softzashi
返信先: @anti_suimonさん
anti_suimonという名前の割にはsuimon氏への批判がありませんがanti_suimon=suimonという認識でよろしいですか?
@anti_suimon
anti_suimonというアカウント名だからといってsuimonさんのアンチであるとは限らないし、私がsuimonさんを批判しないからといってsuimonさんの複垢だとも限らないんだよな。あなただってソフト指しのアンチだとは限らないでしょう。おかしいって。
@anti_softzashi
私はソフト指しのアンチです。
suimon氏の序盤の浅い見解を全く批判せずにsuimon氏以外の研究を批判しているのはなぜですか?客観的には不自然ですが。位置情報や伊勢市在住のsuimon氏が撮影不可能な写真などをツイートしてsuimon≠anti_suimonである証明をしてください。 将棋神やねうら王、この発売のおかげで
詰将棋エンジンとかが洗練されていくのは感謝しかないわ
全力で応援はする(ソフトは買わないけど) >>961
あまり期待できない。
1秒で試したが私のillqha1.1 GW3より弱い
GW5.0.5 QQR に対しては55%の勝率だった。 透、Twitterアカウント鍵付きにしたんだっけ?
アカウント消したんだっけ?
性格に難ありか
まふと透は性格に難ありと思いますね
公開しないものを・・・ TCEC13の4部リーグは折り返し地点の14回戦終了
LC0が独走するかと思いきや、WASPとLC0が9.5点で並びNN勢のDeusXが8.5点で追う展開。
LC0はいきなりプレミアリーグまで上がるかとも思われていただけに、意外と苦労している印象
レートで300差ある現在最下位のTucanoに2戦して2ドローと、これがチェスの面白く難しいところでもある
>>966
意味不明の2ちゃんねらに粘着されたら性格がまともな人でも鍵垢にすると思います たぬきって評価値ブレブレな気がするのは気のせい?
+50→(少しノード数増やしたら)+300→(もう少しノード数増やしたら)+100とか、そんなのがよくある
技巧なんかは安定してるイメージ たぬきはニコ生で評価値が大きく動くから演出効果があります
そりゃあ、プロ棋士(笑)は飛車落ちでも最新の強豪ソフトに勝てんわなぁw
最新の将棋ソフトだとノートパソコンでも九段が即指しな件
http://yaneuraou.yaneu.com/2018/08/07/
この段位は、将棋倶楽部24換算になっているので、
町道場の段位よりかなりシビアな段位です。九段=R3200(R3100?R3300)、
八段=R3000、…、初段=R1600、1級=R1500、2級=R1400、…。
この九段は平均的なプロと同じぐらい(それ以上?)の棋力ではないかと思います。
いまどきの将棋ソフトで、九段にするには、NodesLimit = 315,754。
ちなみに初段は、NodesLimit = 3,450だということがわかりました。
(わりと少ない数字なので驚いています。)
いまどき、3万円のノートパソコンでも1秒間に50万局面は読めるわけで、
九段に設定してもノートパソコンですら即指し(1手、1秒未満)という結果になりました。
普通の(10万円ぐらいの)デスクトップ機なら、
九段に設定していても0.1秒未満で指してきます。
また、「初段」の棋力でよければ、人間側が1手1秒で指すとしても
3万円のノートパソコンで100面指し出来てしまうということですね。いやはや。 これ、五段設定くらいで、人間っぽく時間使った上で24でソフト指ししたら
実際にどのくらいのところまで行けるか、ソフト指しとバレるかは
試してみたい気がする やねうら王が人間将棋界にトドメを刺すかw
ブログ記事を読んでいる限りでは、
プロ・アマ問わず、甚大な影響が出るのは不可避だね。
それくらいすごい。 初段だったら10手読めればいい方
ソフトの300分の1しか読んでないのにいい勝負ってことは、初段って意外と強いのな 9段のノード315000てcore i5積んでるパソコンなら0.1秒でプロ中位と互角てこと?
うーん。ほんとかね ほぼ即指しに勝てない的なことは千田がニコ生で出てたときに何度か言ってた気がするし
山崎も似たようなこと言ってたし特に違和感はないかな >>948
検証に1500局すごすぎ
すでに150件近くダウンロードされてるけど、このスレ監視してる人そんなに多いんだな
>>959
コムの大会にしても、人同士の対局にしても定跡使うから互角局面を検証に使うのは間違いではないのかもしれない >>948
相性問題調べましたか?
illqha1.1だけに強く他の上位ソフトに負け越すようじゃ意味ありませんよね? 相性問題は住民が調べればいい
illqhaに有意差有りで勝ち越すだけですごいこと
https://twitter.com/uuunuuun1/status/1026482734267424773
uuunuuun @uuunuuun1
MyShogiお手伝いして無事完成を見れたのがとても嬉しかった。
今気になっているのは最高位の九段の設定がほぼ即指しで、
その上の将棋神との棋力差がR1000以上あること。
細かく刻めば需要はあると思うがどう呼べばよいのだろう。
23:58 - 2018年8月6日
https://twitter.com/5chan_nel (5ch newer account) >>1
ちなみに、去年、やねうら王は
「平均的なプロ棋士」について、↓すでにこのような記事をアップしていた。
もう新聞棋戦のカンニング対策は急務と言える。
(なし崩しで元の木阿弥、検査が緩くなってるらしい)
今のままではやったもの勝ち、スマホで一瞬でカンニングできるし、
他分野の事例から見ても、かならずやろうとする棋士は出てくる。
もはや緊急事態だ。
プロ棋士と最新のソフトとの適切な手合は?
http://yaneuraou.yaneu.com/2017/07/19/%E3%83%97%E3%83%AD%E6%A3%8B%E5%A3%AB%E3%81%A8%E6%9C%80%E6%96%B0%E3%81%AE%E3%82%BD%E3%83%95%E3%83%88%E3%81%A8%E3%81%AE%E9%81%A9%E5%88%87%E3%81%AA%E6%89%8B%E5%90%88%E3%81%AF%EF%BC%9F/
> 投稿日時: 2017年7月19日
> これからすると、平均的なプロ棋士だと角落ちでは
> 最新のPC+最新のソフトに勝ち越すのは(対策なしなら)非常に厳しいという
> 結論になりそうだ。飛車落ちの手合が妥当なのかどうかはこの後の検証が待たれる。
平均的なプロ棋士 << (R138差) << 斎藤慎太郎六段(2015年当時)
<< 家庭用PC(4コア)Apery(2014) << (R200差)
<< 家庭用PC(4コア)大樹の枝 ← 角落ち → 家庭用PC(4コア) elmo
<< (R100差) << 家庭用PC(4コア)relmo8 << (R200?400ぐらいの差) << 最新のPC(48コア) relmo8 >>959
探索も違うしサンプルもそんなに多くはないしで、互角局面が原因と断定するにはまだ早いのでは よく分かってないんだけど
将棋神やねうら王ってのさillqhaやkai4より強そうなの? >>984
強くてもすぐ抜かされる、フリーソフトによって
更新がないからね >>983
957だけど、kai4の人はdolphin同士で対局させているんだよね。
dolphin >やねうら4.82だとは思うから、自分でやっといてなんだけど、勝率に差が開くのはちょっと腑に落ちない部分ではある。
まあ対局数とノード数の問題かなー? >>982
スマホ、カンニング、、、、数年前の話をいまさら緊急事態?日暮熟睡男さん? >>981
3200〜4000以上のRを区切ってなんか意味あるのか? R3200でも現在の人間トップの棋力をR100ちょっと上回っているので、検討用などに将棋神一つあればいいのでは
R3400,R3600,R3800,R4000みたいなレベル設定があってもあまり使い道がないのでは >>987
「喉元すぎれば熱さ忘れる」で、今の連盟は非常に危うい状態なんだよ。
スマホ検査も、ユルユル・ガバガバでなしくずしで緩くなってきている。
第2の事件が起きかねない。
やはり将棋脳の中卒・高卒棋士は、
かつてのプロ棋士神話にも、まだ未練があるんだろうねぇ。 illqha dolphinてAWSとかでそのまま使えますか?
それとも自分でビルドしないといけないですか? >>965
情報ありがとうございます
>>985
なるほど >>970
私がやった結果ではGW3の方がGW6より若干強い。
まだ1000局まで到達してないけど若干illqha1.1 GW3がKai4のDolphinに勝ってるよ。
https://i.imgur.com/8jZbSHi.png 駒の動きと合法手と終了条件だけ教えたら1秒で人間のトップを超える時代とか来そうだな 評価関数が正確ならノード数は100もあれば十分。
現実には無理だけど。 このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 37日 6時間 34分 36秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。