▲コンピュータ将棋スレッド137
レス数が1000を超えています。これ以上書き込みはできません。
>>3-4連投してしまいました。
スレ建てしたので前スレのソフトの古いPCで動くバージョン誰かお願いしますm(_ _)m いい加減、メンテされてないような将棋ソフトはテンプレから外したら? >>k_ohga
>>本家へのnnueのPRをインターセプト
>>なんとかちゃん情報みたいな事にはならんかった。だいぶ弱いかも。
>>向うのコードがいいのか、なんか失敗したか。。
NNUE-whaleの方、ぜひ連絡を 【コミュニティの一生】
面白い人が面白いことをする
↓
面白いから凡人が集まってくる
↓
住み着いた凡人が居場所を守るために主張し始める
↓←コンピュータ将棋界隈は今、この辺りの状態だね。
面白い人が見切りをつけて居なくなる
↓
残った凡人が面白くないことをする
↓
面白くないので皆居なくなる >>15
もし、その一つ下の段階だとしたら面白い人ってのは山本一成さんだね
彼がいたころは本当に盛り上がって面白かった
技巧やukamuseでレーティングも恐ろしい速度で上昇したし >>16
もうすぐだよ。
明確な目標が失われた状態では、
人間がモチベーションを長続きさせるのは難しい。
時間、お金、その他諸々を犠牲にするに相応しいと思えるだけの目標がなければね。
現状、どこにそれを見出せるだろうか。 山本はネタの人でヒール
エンタメとしては面白いのは認めるが明らかに「主張し始める」の枠 ヒールやるのはいいんだけど
ムキになんのがイタいんだよなw
ボンクラもそうだったけど メタゲーでイキる「48」「まふ」※まふは今回何も貢献できてないw
改変でイキる「たま」「まふ」ゴミ環境でキメラだけで成果を我が物顔にする恥ずかしいw 山本さんはひょうきんなキャラだったし、高学歴&将棋高段者のイケメンだった
手法を非公開にしていたのと他との差が圧倒的だったのが悪のイメージを作っただけだと思う
正義の技巧、力を合わせたApery、同じく正義のelmoが巨大な力に挑むストーリーは映画化してもいいくらい面白かった qhapaq惜しかった
https://i.imgur.com/kQYqO7e.jpg
https://i.imgur.com/nzdorO6.jpg
https://i.imgur.com/IHp7Efj.jpg
https://i.imgur.com/rESSRxw.jpg
https://i.imgur.com/cQU0rLy.jpg
AlphaZero 90 - 2 - 8 elmo_wcsc27 YaneuraOu 2017 Early KPPT 4.73 64AVX2
>>10
それは多分本家のやねうら王が
開発版でNNUE評価関数の読み込みをサポートしたという話だと思います
GPLライセンスなので元々取り込みは自由のはずですが
一応そのあたりを明言する形にして上げなおしました
https://www.axfc.net/u/3911420
whale3以降は思いつく変更は20パターン以上試して
最後の訳の分からない改変以外は全て有意差無しだったのでもうこれ以上の調整はないです
whale3が最終版、whale4は短時間かつTNK評価関数という特殊条件で強いだけな気がするので
他の評価関数に移植してもそれなりの棋力を発揮するwhale3の方が通常利用には向いていると思います >>26
うpあり、早速試させていただきます
画像の下の段、左の名前が使用したevalかな suimonブログを早くテンプレに
868 名無し名人 2018/05/16(水) 20:42:00.74 ID:fPU12wKs
西村さん県大会V、6月全国出場…アマ竜王戦
http://www.yomiuri.co.jp/local/mie/news/20180514-OYTNT50311.html >>15
コンピューター将棋は成績が出なけりゃ声が大きいだけでは
相手されないから凡人が居座る余地ないからその図式は微妙だなあ ライブラリとそれなりのマシン用意すりゃ好成績は取れるだろ
逆に面白いことやろうとしてライブラリに手を入れるほど弱くなる 最強の評価関数はwcsc28不参加の透氏が保有しているから
上のエンジンと合体させたら大会の有意義ゼロやん そろそろテンプレで「透」をNG推奨にしてもいいかもね 透さんが嘘つく理由もないから鯨よりも強い評価関数を作ってるのは確かだとは思うが、公開されてないものをあーだこーだ言っても仕方がないかと くじらより強くは結構簡単になるけど、そこそこ差がないと公開するほどでもないから色々やってるんでしょ 透氏の評価関数は
今公開したらアルファゼロを超えるんだから絶対に早く公開した方がいいよ
鯨ベーコンされてから公開しても栄誉全部持っていかれるぞ >>32
透さんはたまに公開してくれるのでありがたいけど、いろんな評価関数との検証が不十分なまま、すぐに一つのソフトだけの100局〜200局程度の対局数で強いのが出来たと言い出すのはどうかと思う、
wakame1stも結局いろんなソフトと対局した結果aperypaqより総合的なレートは下位になっており、今回のクジラ9との対局100局程度では最強評価関数を保持していることにはなるまい >>39
wakame1stとaperypaqの差は誤差の範囲内だから、下位とはいえない キメラなどはキメラ元には強くなることが多いが、キメラ元以外には相性でキメラ元より弱くなっていることが結構ある、
結局総合的なレートはwakame1stのようにキメラ元より若干下がっている可能性が十分ある 評価関数を配合して、配合元より勝率が上回り強い結果になっても総合的なレートが上がるどころか逆に下がっている可能背が十分ある
例えばクジラ9がたぬきwcsc28に勝率52%(ロタ氏計測)だし、yaselmoがramuより弱いように 初代elmo相手に強ければいいよ
鯨ベーコンでも誰かのタヌキ絞りでもいいから
早くアルファゼロを暫定王者の座から引きずり下ろして欲しい >>26
真面目?にインターセプトしてるっぽい
https://github.com/yaneurao/YaneuraOu/network
というか、やねベースにパラメータを合わせるパターンの方が筋がいいってことなんだろうね floodgate初参戦したいけどポート開放上手くいったのに転送接続にデータを書き込めない云々とか出てキレる 結局、やねうら王のソースコードがベストなのか、、。
やねうら王、出来が良すぎて技巧みたいな新しいソフトの登場を阻んでないか? フルスクラッチでやねうら王ライブラリ勢に勝つのは至難の業だよなもはや
よっぽどの才能か資金力が必要な気がする 現状のソフトに不満があるため、モンテカルロ法のような
一見変わった方法を手当たりしたい試す、もしくは提案するだけでも注目される土壌
ならともかく、現状でも何だかんだ言っても強さ自体がほぼ絶対の評価
になっているから、敢えて新規にやるようなモチベは持ちにくいでしょ。 あんなやる気のない奴がやってんのに勝てんのか
その割にはしっかり作ってあるけどw >>46
やねうら王が新しいソフトの登場を阻んでいると言うよりは、今のソフトが探索部も評価関数もガチガチにチューンナップされて改良の余地がほとんどなくなってるってだけじゃない? とりあえず再調整をして
3スレ0.1秒の条件付きではあるけどAlphaZeroは超えられたのでバージョンアップ
https://i.imgur.com/BENpXd3.jpg
https://i.imgur.com/HVXnWwG.jpg
NNUE-whal5 471(94%) - 29(5%) elmo_wcsc27
AlphaZero 90(92%) - 2 - 8(7%) elmo_wcsc27
長時間でも超えているかは自分のスペックでは測れないから頼んだぞ
googleの計測条件は64スレ1手1分(投了値900)らしい
https://www.axfc.net/u/3911555 >>51
さすがに3スレ0.1秒は駄目だろ。
ノード数が少なすぎて測定誤差が大きそう。 >>51
元々elmoは一手0.1秒で弱かったから捨てられそうになったんだしな だからマシンスペックに余裕がある人は良かったら確かめてくれってことなのでは
qhapaqさんがqzillaの改良評価関数だしたらNNUE WHALE 3と5を戦わせてみるよ >>52
ノード数が少ないと誤差が大きくなる根拠は? 3スレ0.1秒対局の勝率という意味では誤差は大きくならんだろう。ただ、超短時間の対局での勝率と長時間の対局での勝率は、相関性が高くないといわれている この手の話が出ると思うのは
現在の短時間対局は過去の長時間対局で
現在の長時間対局は未来の短時間対局であるわけだが
本質的な差異はどこにあるんだろうか エンジン名に日本語が入っていると
TanukiColiseum.exeを使用時に落ちることが発覚したから
>>51はエンジン名を変更して上げなおし
https://www.axfc.net/u/3911567
それと言い忘れたけど>>26のTNKは設定ミスで2スレになってたかもしれない
手元でqhapaqとTanukiColiseumで対戦させているけど
有意差は出なさそうだから互角3スレ0.1秒の強さではqhapaqとは互角みたい TanukiColiseumは開始手数8では差が出なかったけど
開始手数24にしたらTNKが有意に強かった
https://i.imgur.com/NufUBm2.jpg
自分の環境で計測できるのはここまでだね
あとはハイスペックPC環境の人の報告待ち そろそろ評価関数の分解能(歩の100分の1)が限界なんじゃないかな
10点〜20点で刺し合いしてるときに誤差0.5が50回も積み重なると吹き飛ぶわけだし >>57
その時代のハードでできるだけ長時間で対局させようってだけの話
未来になってハードが進化してもも無理のない範囲で長時間で対局させるべきでしょう 極限的には評価値は3値でいいわけだから、違う局面で同じ評価値ってのがあっても別にいいわけで、解像度は特に問題にならなくない? 一歩=100はあくまで表示の時の話だからエンジン内部はどんな値でもいいんだよ
実際Aperyと互換性のあるやねうら王系は内部で一歩=100ではないし 内部計算は整数で行われるがオーバーフローとの兼ね合いをみつつスケールされている 分解能は1より小さい
いわゆる固定小数点計算というやつだ なんもわからず分解能云々言うの、やねうらおブログのyakitoriって奴思い出す
ttp://yaneuraou.yaneu.com/2017/08/29/eta可変絞りについて/ >>59
whale3はTNK_v1.0より強いが、whale5はwhale3より弱くなっているので、whale5の再検証が必要では
設定 16万ノード 定跡なし
TNK_NNUE_whale3 vs TNK_v1.0
対局数200 whale3側の104勝89敗 引分7 勝率53%
TNK_NNUE_whale4 vs TNK_v1.0
対局数200 whale4側の108勝88敗 引分4 勝率55%
TNK_NNUE_whale3 vs TNK_NNUE_whale4
対局数300 whale3側の151勝137敗 引分12 勝率52%
TNK_NNUE_whale3 vs TNK_NNUE_whale5
対局数200 whale3側の104勝85敗 引分11 勝率55% 3スレ1手1秒にしたけど
他ソフトへの勝率が大きく落ちる様子はなかった
現状測定されている中では一番レーティングの高い
qhapaq + やねうら王オリジナル4.82の組み合わせを相手に計測
PCが使えなくなるのでギリギリで有意差がありそうな付近で打ち切り
https://i.imgur.com/mTCjkqk.jpg
棋譜 https://1.bitsend.jp/download/6f2c1dba3ec7f2a50536f878d03f0b37.html
>>67
検証ありがとう
whale5はベンチマークの相手をelmoにしていたから相性が強く出ている可能性はあるかもしれない Qhapaq優勝か、これで心置きなくNNUEに移行できるかな NNUEのような省メモリは対局後でもパソコンがサクサク動くので理想的 >>61
1手10秒の勝率の真値を推定するには、1手10秒それ以上でも以下でもない条件での計測が必要なだけで、
0.1秒なら0.1秒の、持ち時間1時間なら1時間の真値が得られるわけでそれでいいだろ
目的によるとしか言えん >>71
普段0.1秒で検討することあるの?変わってるなあ NNUE-whale5 強いね!
エンジンだけ替えて、これだけ差が出るのはすごい事だと思う
TNK 33-6-61 TNK-NNUE-whale3
TNK 24-6-70 TNK-NNUE-whale5
TNK-NNUE-whale3 121-23-156 TNK-NNUE-whale5
クジラ 79-16-105 KPPT-NNUE-whale5
全部 1手 0.2秒
AVX2 使えないので SSE4.2版 使用 >>73
今クジラとwhale5(評価関数はqzilla9)を一手3秒(nps600万)投了値1500でやらせてるが
57局時点で27-3-27と完全に互角になってる >>74
おお、素晴らしい
結果が出るの楽しみに待ってます バージョンが多くて検証が大変そうですな
短時間ではかなり強くなってる感じなんすね。長時間でも現時点でくじらと互角ならNNUEの未来は明るいな >>61
探索の理論的技術的な話を問うているのに
いつでも長く検討させればOKみたいなバカは黙ってて。 NNUE-whale5 の SSE4.2版 アップしました
https://www.axfc.net/u/3911635 >>78
そういう話がしたいのなら
『現在の短時間対局は過去の長時間対局で現在の長時間対局は未来の短時間対局である』
この前提が既に間違いね
そしてなぜハードの進化に合わせて対局時間を短くしていかないのかよく考えてみて とりあえずNNUEとaperypaqとで持ち時間1秒で対局してるけど、NNUEが大体7勝3敗くらいのペースで勝ってくね >>72
改良の効果を見るなら0.1秒でいい
というか0.1秒1000局と10秒10局なら統計的に意味があるのは前者
大会のレギュや検討での予測として使えないというなら、そこに何らかの理論がいるし、1時間の結果に10秒の方が0.1秒より近いという保証は何もない
現状そんなスペックではとかそんな時間ではと勝手な閾値決めて主観でイチャモンつけてるだけ 1秒とかじゃなくて、ある程度長めケースでの実力が知りたかったので、
PC2台使って、3日掛けて、30秒のリーグ戦をやってみたんで、流れを読まずに書き込んでみる。
ファーマットは前スレ443のが見やすかったからパクったけど、443さんとは別人です。
https://i.imgur.com/mAKsYpn.png >>84
30秒とはこれまた極端な……有意差出るまでやろうと思ったらきつすぎる所行 一手の消費時間の長さは長くするほど
投了値の大きさは小さめでも効果は同等になりそうだけど
誰か適切な投了値と消費時間の関係を調べたことある? 同じエンジンで評価関数の優劣を比べるなら深さ固定にすればあまり時間をかける必要無いと思うんだが >>80
ありがとうございます
ダウンロードはできたんですが、動かそうとするとエラーが出るようです elmo絞りが出てきたころの話を知らぬのか
同じエンジンで評価関数を変えるだけで長時間に強い・弱いって差が出てくるのよ >>89
あら、ダメでしたか、申し訳ない
もし良ければ、お使いのCPUを教えてください elmoの勝敗を考慮に入れたアルゴリズムを他のソフトも取り入れたから
今は短時間でもおkの可能性は? >>90
それは当然知っているがそれは0.1秒で対局させたからであって、それだと探索深さが変動して安定した結果が出ないから信頼性低いのではと思った。
長時間になればなるほどだと同じエンジンなら探索深さもほぼ同じになるだろうから正確に強さが図れる
だから探索深さを固定すれば探索に影響受けずに純粋に評価関数の性能を比べられるんじゃないかと考えたわけです また羽生がソフトを上回ったね。(ソフトのノードが低い時)
https://light.dotup.org/uploda/light.dotup.org526554.jpg
このノードでは▲48玉が最善手としている
しかし10億ノードぐらい読んでようやく
同玉が最善でこの手こそが逆転する手というのに気づく
結局▲同玉 △67馬のあとの37手目の▲56香車を枝切りで見逃してたんだね。
こういうノードが低い時の見逃しは藤井や羽生のときによくおきるね
やはりこの二人は低ノードのときのソフトを上回る読みをする 10秒とか1分程度の低ノードのソフト同士の対局て
意味あるの?
読みぬけ多くて羽生や藤井以下になること多いんだが また羽生がソフトを上回ったね。(ソフトのノードが低い時)
https://light.dotup.org/uploda/light.dotup.org526554.jpg
このノードでは▲48玉が最善手としている
しかし10億ノードぐらい読んでようやく
同玉が最善でこの手こそが逆転する手というのに気づく
https://light.dotup.org/uploda/light.dotup.org526555.jpg
結局▲同玉 △67馬のあとの37手目の▲56香車を枝切りで見逃してたんだね。
こういうノードが低い時の見逃しは藤井や羽生のときによくおきるね
やはりこの二人は低ノードのときのソフトを上回る読みをする 某棋士は検討は10秒で十分とか言ってたが個人的にはあり得ない
そんな人の公開したbookは精度が低い 深さ指定は同じ評価関数の学習だけ変えたやつとかなら使えるんだろうけど
エンジンが違うとかNNUEと3コマの評価関数の比較とかには使えないから時間指定がいいよ
あと違うエンジンで短時間は時間制御のマージンとかINFOの出力の違いとかで
違いが出すぎるからあまりおススメせんな
最近はやねうら王系ばっかだからあまり問題にならないけど てかあのbookって短時間の持ち時間で連続対局で指させて作ってるみたいだけど、5960xのCPUで短時間では精度が低いのでは?
確かに膨大な量だけど一つ一つの変化は精度が低い >>96
各持ち時間5時間とかでたまにやらせるけど、それでも棋譜の内容見ると「うーん」って感じる場合が多いよ
それくらいいい将棋を作り出すのは難しい 終盤の枝仮りの強弱のパラメータはユーザーが調整できるようにならんの? やはりこの界隈に詳しくて最高峰のプレイヤーは西尾先生なんだろうなー まぁc-bookを鵜呑みにする人が増えたらそれはそれで勝ちやすくなる 人造棋士18号、当然だが一般知名度なさすぎw
人気No1将棋系ユーチューバー本日の動画
【将棋倶楽部24実況】先手:クロノ 後手:JKishi18gou
検討ソフト:elmo(去年ver)
https://www.youtube.com/watch?v=tQdoRGn_edE
「相手は最強のJKですね」(冒頭)
「J棋士18号? JKいし18号じゃないだろうから」(1分5秒〜)
まあ一般の将棋ファンにとっては
「ポナに勝った去年のelmo>天彦名人に圧勝したポナ>>>(越えられない壁)>>>最新の強豪ソフト」
ってことだなw 人工知能ブームの特集が組まれた本やテレビ番組で最先端の人みたいな扱いで山本さんがでまくっていたから仕方ない
ボナンザとポナンザが知名度は2強であとは無名なのが実態だろう
30万ダウンロードの技巧は将棋ファンには知られているだろうけどさ ポナンザが人工知能とかまさに情弱の証 田舎者よりヤバイわ ポナンザの名前がボナンザのパクリでムカつくわ
まるであの国みたいだな 千田はどれだけ読ましても枝刈りの影響で読めない局面があるからこそ一手10秒程度でもいいということでは?
個人的にソフトの読みがおかしいと思うなら自分の読み筋を入力していって検証すればいいんだからな
ある意味アドバンスド将棋で検討しているようなもの >>91
CPUはcore i5-3570になります あと総合的に見てソフトが人間の技術を上回っているのは間違いないのだから一部間違った評価を下すのを分かったうえで検討するのは問題ない 終盤力を上げてもレーティング上昇には直結しにくいから開発者は終盤に力を入れない.
だから序中盤力の伸びと比べたら昔のソフトからの終盤力の上昇度は小さい. Qzilla-Qhapaq-Roll関数が公開されたな 「人工知能の研究をしています。」
「おおっ、どのような分野ですか?」
「コンピューター将棋です」 (ドヤ!! aperypaqみたいに、しばらくは総合的なレートが高そうなのでQzilla-Qhapaq-Roll関数を使う人が多いだろう、これをキメラして強くなっても、総合的なレートは上回れないと予想する、現にキメラ勢(wakame1st)でもaperypaqと同等だし そろそろAlpha zeroに挑戦状を叩きつけるレベルの強さになってきたのでは?? 人間だって見落とすことがあるし、やたらソフトの見落としが強調されるのはどうもな。
しかし10億ノードもくじらちゃんだと1秒か。10年後くらいはこれが当たり前になってるのか? >>96
ソフト1手10秒、羽生持ち時間9時間とかで対局したら
いい勝負になるかもね
果たして勝ち越せるだろうか result : qqr = 1.00199 x qzilla9 + 0.0173011(diff ratio)
Apery→aperypaqよりは変わってるけど、やっぱり微差なんだよなあ >>122
やはり初期化エラーが出てしまうようです 一般の将棋ファンにとっては知名度・実力ともに
「ポナに勝った去年のelmo>天彦名人に圧勝したポナ>>>(越えられない壁)>>>最新の強豪ソフト」
ポナンザは対プロ戦でも圧倒的に強かっただろ?
だが他のソフトなら、今でも事前貸出で研究してハメればプロが圧勝できると思われてるよw
ポナンザ以外のソフトなら電王戦FINALでプロが勝ち越しで終わってるイメージが今でも根強く残ってるしなw
ポナなら人間では勝てないと誰もが認めたけど >>124
うーん、そうですか…
原因が分からないです、ごめんなさい
逆に「動いてる」って方いませんか? QQRは探索やねうら王なのか。
godwhaleの探索はあくまでもqzilla9に最適化されてるってことなのかな >>126
i5-2400ですが動きました
ありがとう! >>128
>>80 では動かず
>>122 で動いたって感じですか?
>>80 のは corei7 用の最適化が入っていたので、そこを修正してみたのですが https://twitter.com/k_ohga/status/995622837367914497
godwhaleはYO4.80より強くしたけど、4.82が出てあんまり差がないという印象みたい。
あとqzilla9で検証してたから他の評価関数との相性も自信はない様子 >>129
いえ、122が初体験
KPPT-NNUE-whale5_SSE42.exeのほうも問題なく動いております >>124
エラーをここに「正確に」転記したら有効なアドバイスがもらえるかもしれない >>131
そうですか
最適化の関係で >>80 のが動くなら
そちらの方がNPSがわずかに高いと思われます
(やねさんのデフォ設定なので) >>58
新しいウェブアドレスに移動したとか言われてDLできない >>124
初期化エラーってShogiGUIかな?
将棋所ではどうなのかな >>83
0.1秒のテスト対局やったせいで技巧が0.1秒だけに強くなる失敗をしたのは開発者の間では有名な話 Rota氏の計測によると、先手勝率60%か、ソフトが強くなるにつれて徐々に先手勝率が高くなっている気がする >>133
80のほうも動きました、ありがとう
>>124
鵺の評価関数いれてないとか?
KPPT-NNUE-whale5もやってみた?
そっちはelmo等普通のやつでうごく >>107
一般の将棋ファンにとっては実力・知名度ともに
「ポナに勝った去年のelmo>天彦名人に圧勝したポナ>>>(越えられない壁)>>>最新の強豪ソフト」だ
他のソフトなら、今でも事前貸出で研究してハメれば間違いなくプロが1億%圧勝できるよw
ポナンザ以外のソフトなら電王戦FINALでプロが見事に勝ち越してるしな
最新のソフトが対人でも強いと認められてれば今頃巷に溢れてるはずだろ?現実は全然違うけどw
ポナなら人間では勝てないと誰もが認めたけどな >>125
またこの荒らしか、こいつスレを荒らすのが好きだな、今時R4200越えのソフトにトッププロが勝てると思っているのは、お前くらいだアホ >>140
R4200だとかR4500だとか全然関係ないねw
ハメて大駒を捕獲すればプロの楽勝だからな
ポナには通用しないが他のソフトなら貸し出しで弱点を研究すれば簡単にハマるよw >>139
数年まえの電王戦のようなハメてなどR4200以上のソフトに通用するわけないわアホ >>141
お前の言っているのは何の根拠もない思い込みや、当時のR3000程度のソフトとはレベルが違うわアホ 羽生さんや藤井聡太君を出すまでもなく、25歳以下のプロはソフトに全勝という事実!
「角ならずw」「28角w」
ポナ以外のソフトなんて単純だからすーぐハメ手に引っかかるよw
俺だけではなく世間の多くがこう認識してる 最新のソフトが一般の将棋ファンからガン無視され、
ニコ生で評価値出してるぽんぽこがまるで信用されてない
なぜならプロより弱いと思われてるからだw >>146
お前一度 floodgateに参戦してR4300のソフトと対局してみろ人間とはレベルが違うのが分かるから、そしてそれにハメてをして一度でいいから勝ってから大口たたけや どうせなら人工無能とまでは言わんがもうちょっと気の利いたスクリプトでもつくればいいのに
いつも同じでつまらんわ ▲同玉とした直後のたぬきさんの評価
https://light.dotup.org/uploda/light.dotup.org526597.jpg
そのあと△67馬 ▲56香車 と指した後の手のひらを返すたぬきさん
https://light.dotup.org/uploda/light.dotup.org526604.jpg
こういうのみると
ルール次第ではソフトもまだまだだなと思わせる
ソフト一手10秒 人間持ち時間9時間
事前にソフト貸出あり
だと人間が勝ってもおかしくなさそう ニコ生解説のプロとは異なる予想手をソフトが示した場合の視聴者の反応
例:64歩
ポナンザの場合
「64歩かあ・・・、俺らにはよく分からんがこれが正解なんだろうな、さすがポナ」
ポナンザ以外のソフトの場合
「64歩www 弱っwww このソフトバグってんじゃね?w やっぱプロはすげー」
或いは
「こんな手はプロなら誰でも指せるし、俺だって指せるわw 評価値なんてイラネ」 Qhapaqさんは1位なりたい病ですか
公開してもらえるのはうれしいです プロ棋士側の負担も考えようや
もうソフトと戦う時代は終わった、競わなくていいそれでいいんだ 逆に言うとプロが横歩取りの終盤の研究にソフトを使うことはリスクもあるっていうことやな >>135
やはり初期化エラーが出るようです
Error! open evaluation file failed
Error! : read file error , file = eval/KK_synthesized.bin
と表示されます。
evalフォルダを見てみたら、nn.binというのしか入っていませんでした
使い方間違っていますか? ぽんぽこからTNKに乗り換えちゃえばいいのに検討用ソフト。
QQRもTNKも同玉最善手で先手にプラス評価を示せるし >>155
ぽんぽこも時間かければ同玉最善手になるよ
俺のパソコンだと5億ノードぐらいだと同玉最善先手+にならない
10億ノードぐらいかかる >>151
QQR評価関数なかなかすばらしい
クジラパークといっていいのでは
QQR関数(Qzilla-Qhapaq-Roll関数)が公開されました。
YaneuraOu4.82AVXTとの組み合わせでQzilla9+GW5.0.5に対して
勝率約55%、+34のレートを持った強力な評価関数です。
ROTAさんの対クジラのレートチェックも受けてるので
きっと4200越えは間違いないかな
検討用に使わせてもらいます(uuunuuunさんの結果楽しみ)
おーがさん Qhapaqさん ありがとう
uuunuuunさん 計測追加いただけると幸いです Qhapaqの新しいのはやねうら王じゃなくクジラちゃんで使えばいいよね 正直
結局
一手10秒とかの結果でR4200ごえだーとかいっても
結局一手10秒じゃ
▲同玉とした直後のたぬきさんの評価
https://light.dotup.org/uploda/light.dotup.org526597.jpg
そのあと△67馬 ▲56香車 と指した後の手のひらを返すたぬきさん
https://light.dotup.org/uploda/light.dotup.org526604.jpg
こういう事が起きるから
なんかなー
R4200だ4300だといっても虚しいのはおれだけ?
結局一手10秒とかの結果じゃあなあ >>159
お前そんなにソフトが嫌ならソフトを使わんかったらええだけやろが ソフトを無償で使わせてもらっていながら、ソフトに文句を言うアホが沸いとる >>160
なんか最大の弱点はほったらかしにして
R4200だR4300だと競い合ってる様が
馬鹿みたいと言うか
いやソフトすきだからいってるわけで >>162
R4200というのはは何千局とソフト同士で対局させた結果だけど
ソフトには弱点があるから実際には強くなってないみたいなことが言いたいわけ? 勝率最大化と検討用最適化は一致しないっていう毎度の話やろ 一致はしないけどある程度の相関はあるよね。
レーティングよ上がれ上がれと開発されたソフト達だが、10年前5年前と比べれば検討も正確 ソフトを無償で使いながらそのソフトの文句を言うやつや、電王戦のポナンザR3950程度の検討レベルをいまだに崇拝するやつが定期的に沸いとる >>166
ポナは現役の名人を含み、プロとの公式戦で7戦全勝したからな
ポナ以外のソフトでプロとの公式戦で3勝以上したソフトはゼロ
で、お前の自慢のR4200とやらのソフトは「公式戦で」プロに何勝したの?w
一般の将棋ファンから訳わからんソフトが信用されないのも当然だわな
電王Tで優勝したAWAKEでもハメ手であっくんに負けた訳だしw >>167
お前はほんとアホだな、プロ棋士はボナンザ6.0程度の将棋だが、それに勝って何の価値がある ソフト換算でR2800程度のトッププロや棋士に勝つことに対してはソフトからしたら何の価値もないわ アマ6級をトッププロとして、タイトルホルダーをR4230のソフトとしたら、タイトルホルダーがアマ6級の7人に全勝したからといって、
何の価値がある、お前の言っていることはこれと同じレベルの話だわ >>168-170
悔しすぎて3連投かあ、朝っぱらから腹を抱えて笑わせてもらったわ(失礼)w
プロとの公式戦で7戦全勝したポナは、実績と一般ファンからの絶大なる信頼を得たね
まあいつかR4200超えのソフトも公式戦でトッププロに1勝でもできるといいね(無理だろうけど)
期待してるよw >>171
お前みたいな価値が分からないアホは久しぶりや この間千田先生が最新ソフト相手だったらノータイムで指してもらっても勝てないって言ってたんだよなあ
もう平手で同じ持ち時間で人間とソフトがって時代は過ぎ去った 同じ持ち時間なら勝てないのはみんなわかってる。
でもそれでソフトが凄いとは思わないよな
ソフトは人間より非効率な思考を、1億回とか10億回とか
人間じゃ無理な回数重ねて、人間に勝ったとマウントしている。
ただソフト一手10秒 人間持ち時間9時間とかなら
羽生や藤井なら勝てるかもという話 別にいいでしょ
人間も開発者も互いに頑張ってるんだし
それに人間のレートも上がってるんだぜ 人間より効率の良い思考をして
1秒で正しい正解を導き出すソフトがでないかぎり
人間を超えたという気がしないよな
いまは人間より非効率な思考だけど
1億とか数の暴力でそういうのでごまかしてるだけ ソフトが進化してもプロはすごいし、ソフトが将棋の神様に近づいていくのも面白いってことでいいと思うけどな いずれにせよまだまだ将棋の奥が深いということが分かった 産業機械が人間のカロリー消費より多いか少ないか考えるか? ソフト最善手指し続けて更にソフト上回る手指したんならワンチャンあるけどそうじゃないからな
ソフト一手10秒だろうがそんな局面までたどり着けずに撲殺されるだけ ていうか10億ノードなんて20秒じゃん
クラスタ組んだら5秒以内だし 昔渡辺が1時間で読める手は500手くらいって言ってたな
人間並みの0.15NPSとかにしたらさすがに人間より弱そう なぜ将棋だけNPSを人間と揃える必要があるんだ?もしかして将棋ソフトは高度なAIで人間の知性が脅かされていると思ってる人がいるのか?
単なる将棋機械なのに 問題無さそうだったので、>>122のファイルは削除しました
>>80のファイルを使ってください
>>154
nn.bin は新しいたぬき用のファイルなので TNK-NNUE-whale5_SSE42.exe を使ってみてください
KPPT-NNUE-whale5_SSE42.exe は従来の三駒評価関数用です カッパ巻き関数をやね4.82とGW5.05でどっちが強いかは見てみたい
有意差ないかもしれないが 昔のソフトが目指してたのはまさにAIだったんだけどな
ハードが進化してAI目指さなくても力技で勝てるようになってしまった
しょうがないね >>188
ん?評価関数は強化学習で作ってんじゃねぇの? ここからすぐにR4300超えのキメラが現れる
↓
NNUEでR4350超えが現れる
↓
SDT6優勝はR4400超え
くらいが理想のペースかな でもホントにR4200とかいってるのかね
似たような評価関数と探索部が多いからレーティングが過大になっているのでは?
測れるのは全く違う技巧との対戦成績くらいか? >>193
そのうち基準を引き上げてGikou2あたりが基準になりそうだね パターン認識の最適化問題という点では将棋も囲碁もAIにちがいない
「人工知能」とかいう言葉のイメージとはおおよそかけはなれているが
それは訳語の問題でしかない 技巧2は入玉が視野に入る戦いではポンコツ化するし
序盤の穴は定跡で塞がないとガバガバだし
基準としては不適格このうえない >>193
基本的に直近の上位ソフトとばかり指して測定するから、拡散しちゃう傾向はあるね
いざ見かけ上R500差くらいのソフトと対局させてみると、9割もいかないことが多い いよいよ7段昇段をかけた藤井6段の対局が始まった
最新のエンジンで形勢をチェックしよう >>197
その代わり1年前2年前とかのソフトは押し下げられていくから、
最近のソフトではなく数年前のソフトの値で見てみるのがいいのでは? >>74
>>75
200局一手3秒でやらせたらクジラちゃんのほうが探索部の性能が良さそうな結果になった
https://i.imgur.com/JImkVir.png >>80
将棋エンジンをupしてくれるのはうれしいのですが
ダウンロードトラブルが多いので出来れば GigaFileか
BitSendでupしてもらえればありがたいです >>159
ニコニコのぽんぽこはiPad並みの低スペックだから、評価値変動しやすいよ >>186
ありがとうございます
tnk-nnueのほうを使ったら正常に動作しました
なぜかkpptのほうを使うべきだと思い込んでいました
お手数をおかけしました 振り飛車沢山指すと聞いてhoney waffle導入したのに全然振り飛車指してくれないんだが、何が原因なんだろうかわかる方いらっしゃいますかね >>205だが定跡オンに出来てなかったっぽくて、調節したらいけました
ちゃんと定跡オンになってるのかどうかっめどうやって確認できるんですかね >>206
定跡の手は時間を消費しないからONになってたらすぐにわかるよ >>207
成る程、ありがとうございます
ソフト同士の対戦の時に定跡オンだとあまり比較としては宜しくないんですかね?
例えばクジラとクジラより弱い評価関数を対戦させたら、普通はクジラが勝ち越すのにどちらも同じまふ定跡オンにしたら互角の戦いになってしまうなどです >>208
その程度の知識しかないならそれを聞いたって仕方ないだろ 定跡を使わないというのはわかりやすくはあるが
指定局面 初型だけというはいささか疑問だな
どんな手順で勝負が決まっているのか吟味しないと
何を測定しているのかわからんということになりかねない uuunuuunさんは基本定跡offだが、ハニワとwandreだけは定跡onだそうだ 定跡の有無は勝敗にかなり影響を及ぼしてると思うけどね
検討の信頼性を判断するためにって言われることが多いけど、
個人的にはその理屈にはちょっと懐疑的 そのうちR50とかR100の差とかどうででもよくなる qqr、gikou2に対して8割しか勝てないんだけど相性問題というやつ? どなたか、NNUEのスマホ版をアップしていただけませんか? >>214
低ノードだとuuunさんのとこのレート表で見るよりGikou2は強いよ >>215
UPなんてしなくても、ビルドすればいいだけでは? しかし、aperypaqを超えられたのは結局クジラと河童だけってのは
yaselmoを超えられてたのがぽんぽこと河童だけ、ってのに近いな
SDT5からの伸びしろはあったわけだから、言うほど悲観しなくてもいいのかも >>217
素人なので、やり方が分からないのです。 >>216
i7 6700kで8スレ一手3秒でやらせてるんだが低ノードってどこまで? >>220
uuunさんのとこは約1500万ノードでやってるからそれより極端に少ないノードって意味だった
その設定なら1000万ノードくらいは出てるのかな、てことは相性もしくは対局数の不足かな 自作ボードゲーム市場に詳しい「ペンとサイコロ」というブログの
「ゲムマ2017秋・アンケート結果 第二弾:2016→2017年比較」の記事によると
ゲームマーケットに出品した人の半分が赤字で半分が黒字でちょうど半々だそうだ
50万以上の儲けが5%いるが逆に50万以上赤字なのも5%いる
そして初参加の人の7割が赤字なのに対して、ノウハウがありや知名度や固定ファン層が居る
中堅サークルの7割が黒字になってる
継続性とブランド力構築とノウハウが大事だという事だと思う
初参加の人は作る個数と需要を見極めツイッターやユーチューブでの宣伝がカギになる
最初は50〜100個ぐらいをいかに金かけないで作って売るかの勝負になる
これがゲムマ2016・2017年(初の二日開催)の販売数
https://cdn-ak.f.st-hatena.com/images/fotolife/r/roy/20171220/20171220211924.png
これが販売金額
https://cdn-ak.f.st-hatena.com/images/fotolife/r/roy/20171220/20171220212902.png
これがイベントでの利益
https://cdn-ak.f.st-hatena.com/images/fotolife/r/roy/20171220/20171220213109.png >>220
そのノード数からするとやねうら王の設定がおかしいのは間違いない
おそらく技巧より何秒か損していると考えられる、設定が良ければqqrだと技巧に勝率9割以上はいくはず >>222
今76局時点ではqqr(探索部はくじら←これのせい?)の勝率83%だわ >>224
やねうら4.82に変えて設定も見直してみるかな >>223
なんでこのスレに書き込んだのか知らんが半分黒字って凄いな >>225
76局ではまだなんとも言えんな
300局超えてもその勝率ならちょっとおかしいと思うけども >>218
apery_wcsc28+yaneura4.82もaperypaqを超えている >>200
つまりT.N.Kに最適化されている感じか
組み合わせが色々とあって複雑な状況だな QQRは正式にはクジラのかっぱ巻き関数
名前からはとても強く見えないが鬼のように強い 妖怪惑星Qhapaq@Qhapaq_49
私の脳内で「大丈夫、ちょっとだけ(関数の差分は1%くらい)だから」と言いながらクジラちゃんに河童巻きをぶちこんでる画が浮かんできましたが勝ち星を四回も献上してるので多分許されるでしょう。
いやいや澤田さん、くじらちゃんにかっぱ巻きぶち込むのは絵面的に完全にアウトです >>228
>>224
やねうら4.82+qqrにしたら技巧2勝率が20局時点で95%と大幅に改善しました
くじらちゃんの探索部がqqrに向いてなかった?ようです
ありがとうございました やねうら王のtournament版は通常版よりどれくらい強い? やっぱりクジラちゃんとやねうら王では相性がありそうか
ところでやねうら4.82は4.80よりは確実に強くなってる感じなの? 最近話題にならないけど、まふ定跡はみんな入れてないの? 藤井6段夕食休憩時 技巧2でチェックしたら後手藤井6段+900ぐらいだった
7段昇段がほぼ確実 島も丸ちゃん二十連敗くらいで相性云々しちゃ行けなかったんだね 何年か前まではソフトに手動で定跡入れてたけど、もはや必要ないかなあ
穴熊とか矢倉とか手数がかかるし、最近のソフトは囲わないし >>244
ウォーズでも24でも自分の棋譜集めて棋譜結合して解析とかはしないの? >>245
?ソフト用の定跡が必要かどうかという話なんだが、俺が勘違いしてるのか? ▲7六歩 △3四歩 ▲6六歩の出だしでT.N.K.に読ませたら△8四歩が20億ノードくらい読ませても第3候補手までにあがらない
△6四歩 △6二銀 △6二飛とか右四間飛車にするように読んでるけど昔のソフトもそうだった? >>244
むしろソフトの計算時間短縮のために自身で定跡を整備した方が効率的よな >>248
その定跡整備ってのが中々難しいんだよな
あまり長手数入れると勝敗に直結してしまうし
序盤の10手くらいを広く入れておいた方がこの先良いような気がしてきた >>249
そうだな、安定して10〜20手ぐらいを広く入れておきたいわ NNUE-whale5+QQRで色んなソフトと対戦させてるんですが、今のところApery,elmo,HoneyWaffleと10局ずつして5-5,5-5,4-6でHWには負け越し
どれも探索NNUE-whale5です 上位陣って差を感じるほど強さに違いがないよね
1手3秒で10番勝負の上位陣トーナメントやったらaperypaqが優勝したわ そりゃあ10番勝負しかしてなければ当たり前だろうがw >>252
勝率60%位までだと、10局やっても勝ち越したり互角だったり負け越したりするよ、結局勝率60%で10局程度だと、勝敗の差はじゃんけんみたいなもの QQRを相手に再調整を加えたのでバージョンアップ
https://i.imgur.com/SyWwQfW.jpg 3スレ0.3秒 定跡オフ nn.bin
https://i.imgur.com/QNmT9yF.jpg 1手0.1秒 互角局面24手目 nn.bin
https://i.imgur.com/DAKsNHV.jpg 比較用に同条件での前バージョン利用した場合
斧 https://www.axfc.net/u/3911959
Bitsend https://1.bitsend.jp/download/9242c81439e5901aac5f4ebb8fddcc65.html
>>251
NNUE-whaleはT.N.K.に付属のnn.binを使った環境で勝率が上がるように調整をしてあるので
従来の三駒型ですとGodwhaleや本家やねうら王で動かした方が強いかもしれません >>256
いつもありがとうございます。
SSE42とスマホ用のバージョンもアップして頂けると、とても助かります。 勝率6割(+R70)が引き分け無し10局で
勝ち越す確率63.3%
負け越す確率16.6%
5-5の確率20% >>256
こんばんは
素晴らしい探索部ありがとうございます
0.1秒で100局試したのですが、NNUE-whale +くじらとGodWhale +くじらは48-3-49でほぼ互角
NNUE-whale +QQRとやねうら4.82 +QQRはダブルスコアでNNUE-whaleの方が圧倒してたので途中で途中で切り上げました
他にもaperypaqやQhapaqなどでもNNUE-whalevsやねうらをさせたのですが全てNNUE-whaleがやねうらを圧倒してました
10ソフトで1手1秒の総当たり、各ソフトと10局ずつやらせてるところですが、もしかしたらQQRではなくQhapaqが1番強いかもしれません >>256
ありがたく使わせていただきます
少し深め(一手1000万〜1500万ノードほど)の対局ではどうなるか検証してみます >>259
本来勝ち越すべき方が途中まで圧倒的に負けているなんてことはわりとあるので少ない対局数で打ち切るべきではない
例えば途中8勝25敗だったのが200局終わったら98勝85敗17分なんてことはざら >>261
純粋に質問だけど、200局っていう数字に意味はあるのですか?
1000局指したら、400勝550敗50分とかにならないですかね。 例えば、定跡ガチャで外れを引く回数が多かったらそこでぼこぼこ負けるしな。
統計だけではなく、「どういう負け方をしてるか」は見た方が良い。
その意味で、ナイアガラパターンに着目したPALはいいとこ突いてたと思う。 >>262
200局はただの例で意味は無いよ
ちなみに有意差もないから1000局やればそうなるかもしれないね、その逆も >>263
それが大事だよね、やたら反省させられて負けてるとか色々気づくことはある 教師局面を生成する準備として、Depth8での強さを調査中
NNUE/W6 vs NNUE/YO4.82
524-52-424
https://i.imgur.com/gJRonth.png
NNUE/W6 vs NNUE/W3
446-62-492
https://i.imgur.com/2BJrQJv.png >>266
そうなんだよねうちの検証でも、wシリーズ同士を対局させると、シリーズの中ではW3が最強なんだよね
でもwシリーズ以外にはバージョンアップごとに強くはなっているんだよね
結局、どれが最強かっていわれるとW3になってしまう 探索でも三すくみがあるんだな、今まで評価関数だけかと思っていた QQR/YO4.82 vs QQR/GWasame
368-51-581
https://i.imgur.com/IzuCLyJ.png
NNUE/W3 vs QQR/GWasame
497-14-489
https://i.imgur.com/OqoKqs9.png YO.4.82が浅い読みの戦いではダメダメとは恐ろしい 深さの方を固定してるんなら、枝刈り全くしないものが最強ってことになるんじゃないか?
深さ固定で異なるエンジンを比べるのは意味無いのでは depth8くらいになるように時間設定してるんじゃなくて深さ自体固定対局なのか、そりゃYO4.82大不利 バージョンアップがはやくて、検証が追い付かない…
NNUE-whale6 の SSE4.2版 アップしました
AVX2 が使えない人はこちらをどうぞ
https://1.bitsend.jp/download/63ce501bf2f84624823e8d991bed7ad7.html >>261
ということでもう一度NNUE-whaleとやねうらを載せたQQRをもう100局やらせましたが66-3-31でやはりダブルスコアでNNUE-whaleが勝ち越しました昨日は何勝だったか忘れましたが、50局程で中断してその時もダブルスコアでしたのでやはりやねうらより優秀な感じでした
ほかの評価関数でもやねうらが勝ち越したところはまだ見てないです もはや正しい検証が行われてるような気がしないんだが multi ponder測定?
技巧の方が良さそう >>274
それはすごいな、やねさんも探索のパラメーターを大幅に見直すことになるのかなこれで >>269
これも、Depth8なんですか?
それから、GWasameもNNUE-whaleのように、くじらのパラメータでいじってるんですか? >>278
GWasameなんだから、くじらのパラメータですね。失礼しました。 >>279
GWの枝刈りを極端に緩くしたらかなり強かった的なものだったかと >>273
AVX未対応マシンで、どっちも動くことを確認したよ
あんがと NNUE-whaleの三駒版ってNNじゃないのにNNUEってネーミングなのはどうなんだろうか このスレだけで頻出し、ググっても何なのかが全くヒットしない
「NNUE-whale」とは何なのか、バージョンが3,4,5,6とあるが何が違うのか等、解説してくれる優しい方がいらっしゃいましたら嬉しいです。 >>273
ありがとうございます
早速NW5とNW6を評価関数QQRで対局させてみたいと思います >>283
前スレのここらあたりからみると流れがわかりますよ。
741 名前:名無し名人 (ワッチョイ f5a0-fFVh)[sage] 投稿日:2018/05/13(日) 05:56:26.52 ID:5Sivxjbw0
NNUEの2018-otafuku-param.hのパラメータを
全てGodWhaleの数値にした結果 depth固定なら枝刈り少ない方が強いのは自明
後は教師局面つくる費用がどれだけ増えるかの戦い
低depthなら誤差レベルでしかコスト増えない気はするけど
aperyが学習用途で強いのはそこらへんよね
学習用エンジン・定跡作成用エンジン・戦闘用エンジンの3つが要る時代になりそう このスレの名無しの作品
たくさんバージョンあるしこれからも増えそうなので暇人以外触らなくていいと思う
検証を待てばよい >>286
『学習用エンジン・定跡作成用エンジン・戦闘用エンジンの3つが要る時代になりそう』
これだよなきっと >>285
ご回答ありがとうございます。
NNUEとは評価関数の形式を示す名前だと思いますが、
NNUE-whaleとはNNUEとは全く関係なく、TNKチームが利用したやねうら王の改造版エンジンを示すという認識でよろしいでしょうか? >>290
前スレ読んでその辺わからないなら正直触らないほうが良いんでは >>290
正直ネーミングのわりにNNUE大して関係ないよなとは思う >>273
とりあえず0.1秒でHW5とHW6をQQR載せて200局させたところ、91-8-101でHW6の勝ち越しでした 名人戦の検討ソフトぽんぽこ、今日も視聴者から酷評されまくりw
羽生さんの指し手とぽんぽこ予想手が違った場合、
視聴者の羽生さんへの信用度100%、ぽんぽこへの信用度0%w この流れで合ってる?
TNKチームがリリースしたやねうら王改エンジンはAVX2利用版のバイナリしか付属されていなかった
↓
ivy-bridgeのPCを使っている人が、TNKやねうら王改のSSE4.2版使いたいがビルドするスキルが無いので誰かに用意して欲しいとねだった
↓
GodWhale5.0.5のパラメータを適用した「TNKやねうら王改」のSSE4.2版を「NNUE-whale」という意味不明の名前でアップした人が登場
↓
ネーミングセンスの無さに混乱する人が出た >>294
ぽんぽこは名前からして馬鹿にされそうだし(実際に馬鹿にされている)、elmo_wcsc27とのキメラだしな、Apery_sdt5はキメラじゃないし、
sdt5の最強評価関数なので検討にぽんぽこ止めてAperyを採用すれば、ここまで馬鹿にされずに済んだのにな、ま電王Tの優勝ソフトを採用する決まりなのでしょうがないわな >>297
一般の視聴者はキメラとか全く知らないし気にしてるわけないだろそんなこと
一番の原因は運営が低スペックPCをぽんぽこに与えたことと検討モードの設定がガバガバなことかと >>295
なんか自分が悪い流れになってるけど
元から KPPT版にも NNUE-whale って名前が使われているのでしょうがない
名前の由来は、NNUE-whale はもともと TNK版しかなかったけど
改良した部分のコードを KPPT版にも反映したからだと思う >>297
ポナ以外のソフトは全部馬鹿にされるよ
Aperyだって一般ファンからしたら電王戦で斎藤慎太郎に負けた雑魚ソフトっていうイメージが今でも根強いから >>298
結局はAperyより弱いぽんぽこを採用したこと、低スぺPcを与えたこと、検討モードの設定が悪いことから全て運営側のレベルが低いってこと Aperyって言ってるけど探索がやねじゃなければポンポコ以下なんすけど 一般ファンにとっては、ソフトの「現在の棋力」なんてどーでもいいんだよ
公式戦でプロに勝てば強いソフト、負けたら弱いソフトになる
だから公式戦7戦全勝のポナンザは偉大なんだよ >>303
お前の文章をそのまま理解すれば一般ファンはソフトの棋力を全く考えないアホだってこと
まともな人間は棋力つまりレーティングを重要視するわ 公式戦7戦全勝のポナンザはぽんぽこより大分弱いときのものなので何の価値もなく、まともな人間からしたら、お前を含めてアホとしか見ていない >>304
一般ファンはソフトの棋力もレーティングも全く考えないしどーでもいいと思ってる
Aperyの現在の棋力なんて関係ない、斎藤慎太郎に負けた事実は永久に覆らないから
つまり「目に見える結果」がすべてだ >>306
だからお前をアホだっていっているじゃないか >>305
ポナンザに勝てる人間はゼロと誰もが認識してる
だが一般ファンからは、ぽんぽこは羽生さんや藤井聡太より弱いと思われてる
これで十分だ >>308
一般ファンはそんなの無関心だから意味ないよw >>310
だからお前をアホだっていっているじゃないか もしレーティングの重要性が世間に認識されてれば、WCSCや電王トーナメントがガン無視されるわけないからな
現実は真逆だけどw 一般ファンは現在の棋力を考えることも出来ないアホだってこと >>295
NNUEのパラメータをgodwhaleと同じものに変更したものが意外と強いと有志がUP
↓
当時はAVX2版以外のビルドが失敗していた
↓
後にAVX2版以外のビルドも成功
↓
頻繁に更新されるので混乱する人が出た
NNUE-whaleの名前は「NUUE」+「GodWhaleのパラメータ」という意味だから意味不明ではない
TNKチームは関係ない >>315
KPPT版とかもNNUEネーミングなのが混乱する原因じゃない? > NNUE-whaleの名前は「NUUE」+「GodWhaleのパラメータ」という意味
NUUE?
混乱してる人は、だいたい自覚が無いわな >>294
羽生が棋士の手を予想して当てたからと言ってその手が最善の手とは限らない
その棋士の棋風から推察される手を予想しているだけかも知れない
当然のことだが将棋エンジンの予想が最善の場合がほとんどでそれが実力差に
なって表れている 候補手が棋力の遥かに劣る人間の手と一致しないのは当然の
ことだと思う >>319
世の中信用が大事なんだよ
公式戦7戦全勝という実績を残したポナ以外のソフトは信用がない
ニコ生で「ぽんぽこに変えてAperyを出せ」なんてコメントは皆無だろ?
真偽はともかく、ポナ以外のソフトは貸し出しで研究すれば今でもプロに勝ち目はあると少しでも思われてる時点でダメなんだよw NNUE-whale5が落とせないので上げなおしてくれないか バージョン管理のためにもgithub使ってみてはどうだろうか >>320
少数派のポナ信者(こいつらは棋力を考えることの出来ないアホばっかり)のお前が勝手に思い込んでいるだけだ、うざいからこのスレに来るな、
ポナンザの話題なんかどうでもいいわ、過去2大会で優勝も出来なかった非公開ソフトが 名前をつける価値があるもの以外は無理に名前をつけないほうがいいと思いまーす >>323
俺はポナ信者ではない
R4200の無名ソフトより、仮にR3500でも実際にプロに勝ったソフトの方が信用される
世間とはそういうものだw ライバルに追い抜かれぶざまに引退したポナより、はるかに強いソフトが出ているので使えもしないポナに興味ないわ >>325
だからお前をアホだっていっているじゃないか NNUE-whaleシリーズは超短時間対局に最適化されてる感じなのかな? >>328
実際に1500万ノードで本格的に検証したら、0.1秒の超短時間対局と差がでるのか興味がある
このスレの対局の報告では、ほとんどが超短時間対局の結果なので 105 名無し名人 (スッップ Sdfa-hd0g) 2018/05/19(土) 17:03:22.94 ID:zisz81ojd
髭面で煙草を銜えた問くんを想像してしまった >>329
検証ってほどじゃないけどKPPT版を16スレ1秒(500~800万ノードくらい)で使ってみてるけどあんまり強くない感じ
NNUE用だしKPPT版ではあんまり強くないってだけでNNUEなら強いのかもしれないが >>299
変に非難したような書き方になってたので気分を害されたかもしれず、すみません
元からNNUEって名前だったということですが、元って何ですか? SSE4.2版あげてくれてる>>299はNNUE-whale作ってる人とは別 >>315
NNUEは検索エンジンじゃないのでGodWhaleのパラメータは適用できません
あなたがNNUEと呼んでいるのは、TNKチームがNNUE向けに用意したやねうら王改のことじゃないんですか? >>332
元ってのは
>>58、>>256 などの NNUE-whale の作者さんのです >>331
i7 6700k 8スレ一手3秒(おおよそ一手1500万ノードから1800万ノード)でのqqrとの対局をみると最初自分のほうがいいと思ってあとで反省するパターンがかなり多い
nnue whale6が強いのは超短時間のみな気がする
検証結果が出たらまたお伝えします ロタ様あなたのハイスぺでnnue whale6とやね4.82をqqrで検証して下さいませ nnue評価関数に最適化されてるのにKPPTで検証しても意味なくね? 実際にnnue評価関数を積めばある程度の持ち時間でもqqrを6割ボコれるのかが一番重要だろ >>339
超短時間でこれだけ強いと1500万ノードにも興味があるのだが
qqr_whale6 117-5-78 qqr_Y4.82_AVX2 勝率60% 一手0.1秒 (16万ノード) 定跡なし GWasameもNNUE-whaleもYO4.82を使ってる相手に対して勝ち越すはずの評価関数で負け越す感じだわ
本来勝率53~55%くらいあるはずの条件でも勝ち越せない、QQR相手に60%とかいったら面白かったのになー 結局ある程度ノード数がある場合はwhale6-KPPTは弱いってことかな 最初にNNUE-whaleの意味について質問した者です。
皆さんの回答や、前スレの流れを読んだりで大体真相が把握できました。
皆さんご回答ありがとうございました。
混乱の原因を整理しました。
・NNUE関数を使えるように改造したやねうら王に那須氏が「NNUE-v1.0」と名付けたこと
・KPPT最強のQzilla9とNNUE関数を対決させるために「NNUE-v1.0」をGodWhaleと同じパラメータでビルドした「NNUE-whale」エンジンを5ch有志がリリースしたこと
・同有志は、NNUE-whaleは他のKPPT評価関数の強さ比較にも用いたいため、KPPT版をリリースしたこと
・NNUE-whaleは、なぜか最近の流れでは、KPPT版がQQRやApery等の対戦比較にばかり用いられていること 「非現実的な短時間でしか計測して無いこと」も追加で。 leela chessのフォーラムではfacebookがelf opengoの際にalphazeroの再現にチャレンジして失敗したのではって言われてるね。
alphazero自体もかなり疑わしい。 対局数少ないけど、一手500~800万ノード、対YO4.82+QQRの簡易測定結果
エンジンYO4.82
54-3-43(勝率約54%)
エンジンwhale6-KPPT
37-8-55(勝率約40%)
評価関数はどちらも今作成中のやつ
とりあえずKPPT版はノード数少ないときじゃないと力を発揮しないみたい 最近の書き込みで「whale」って記載されているエンジンはNNUE-whaleの略なんですよね? >>350
文脈からしてそうとしか言いようが有りませんね。
KPPT版のNNUE-whaleは、KPPT-TNKって名前を付けておけば混乱が無かったと思うんです。 最近floodgateで勝ちまくっているhavenの正体に興味がわいてきた >>348
chessのフォーラムでなぜfacebookの碁の話が? >>353
ここでも色んな話してるし
コンピュータボードゲームの話は話題に上がるでしょ >>354
つまり5chの話題レベルでしかないってことか
alphashogiならともかく囲碁でまだGoogleを疑ってるのはね >>355
AlphaZeroって囲碁だけじゃなく将棋、チェスも指すぞ >>356
いや実績が全然違うじゃん
alphazeroの自己対戦の棋譜である程度担保されてる alphazeroのshogiは棋譜がそもそも出されていない 技巧は探索ノード100のオーダーからきっちり強さが上がっていくが
YaneuraOuエンジンは10万ノード程度ではぜんぜん不足
スイートスポットはもっと高いところからはじまる >>357
もう一度最初のレスを何回か読み直してきた方がいい
誰も囲碁の実績を疑ってはいない >>359
>348ではelf opengoがalpha zeroの再現に失敗したらしいのを受けてalpha zero自体も疑わしいと言ってるんだから、囲碁のalphazeroを怪しんでるのでは? 強さを疑うわけじゃないけど棋譜出すのが難しい理由があるの? >>361
棋譜のフォーマットが色々あるからどれで出すか悩んでるらしい お前ら「R4200超えのソフトスゲー!」
一般ファンA「そんな信憑性ゼロの戯言など信用できるかw どうせポナンザより弱いんでしょ?」
一般ファンB「羽生さんや藤井聡太ならそのソフトより良い手が指せるわw 無料でも要らないよ」
Google「AlphaZeroが僅か数時間でelmoを超えました 棋譜は出さないけどね」
一般ファンA「やっぱグーグルはスゲー! 棋譜がなくても絶対信じるよー」
一般ファンB「所詮日本の開発者の技術力なんてその程度だわなw」 棋譜はsfenでいいだろ
cfenの将棋版
stockfishの作者が提唱したんだから知らないわけないだろう いや、facebookが汎用AIのアピールのためelf opengoを開発する際に、alpha zeroの再現にもチャレンジしたのではないか
そして、あの発表に出てこないってことは囲碁しか再現できずチェスなどはstockfish開発版より強いそれを再現できなかったのではという向こうの議論
囲碁については異論はない 検討用に将棋のソフト入れたいんだけどオススメのソフトとGUIって何? 書き忘れたけど環境はcore-i7 8550Uの16GでSSDは512Gある 普段からfloodgateでR4300レベルの将棋を見ているものとしては、羽生善治や藤井聡太ていうソフト換算でR2800程度の棋譜は、ほんとボナンザ6.0程度の棋力で見れたもんじゃないな、ソフトでは絶対指さないような平気で悪手を指すしな >>366
メモリが16GBも有るのなら、わざわざNNUEのTNKや技巧2を選択する必要はなく、現在最も強いやねうら王とQQRを使うのが良いのではないでしょうか。
GUIについては、好みで選んでください。
将棋所
長所:動作がサクサクしている
短所:UXでShogiGUIに劣る
ShogiGUI
長所:見た目のわかりやすい。操作がしやすさい。
短所:動作がきびきびしていない
WhaleWatcher
長所:エフェクトがカッコいい。萌え萌えしている。
短所:画面の情報量が少なく、ShogiGUI以上に動作がきびきびしていない >>366
導入の簡単さと言うなら、1位は激指定跡道場4ですが有料な上、弱いです。
次に簡単というなら、ShogiGUI+TNKでしょうか。
TNKはエンジンと関数がセット配布になっており、インストールの手間が少ない上、ダウンロードサイズが24MBしかないのであっと言う間にダウンロードが終わるというのが有りがたい。 所詮プロ棋士の将棋は最新ソフトから見たら、アマ7級程度のお遊びじゃよ Google 「AlphaZeroの棋力が僅か数時間でelmoを超えました 棋譜は出さないけどね」
一般ファンA 「やっぱグーグルはスゲー! 棋譜がなくても絶対信じるよー」
一般ファンB 「所詮日本の開発者の技術力なんてその程度だわなw」
お前ら 「R4200超えのソフトスゲー!」
一般ファンA 「そんな信憑性ゼロの戯言など信用できるかw どうせポナンザより弱いんでしょ?」
一般ファンB 「羽生さんや藤井聡太ならそのソフトより良い手が指せるわw 無料でも要らねえよ」 普段からfloodgateでR4300レベルの将棋を見ているものとしては、羽生善治や藤井聡太ていうソフト換算でR2800程度の棋譜は、ほんとボナンザ6.0程度の棋力で見れたもんじゃないな、ソフトでは絶対指さないような悪手を平気で指すしな
所詮プロ棋士の将棋は最新ソフトから見たら、アマ7級程度のお遊びじゃよ 最新ソフト「最善手はこれ!」
アマ7級「違う手ビシッ!」
最新ソフト「(長考後)・・・それ最善やな」
こういうことがしばしばあるんだが
プロ貶すと逆にソフト貶してることになるぞ >>366
Core i7 8550uということは200万〜250万npsくらいのでしょうか。
R4200の実力のクジラちゃんを動かした場合、R4000程度の能力で動作すると思います。 >>374
見れたものじゃないというのは、お手元にあるR4200程度のソフトの評価値を観察しながらですか?
それともあなたの目だけを頼りにですか?
あなたの目だけという回答なら、なぜプロキシにならなかったのですか?という質問が間違いなく寄せられるはずですが。 将棋所はなんか見かけがWindowsフォームアプリに見えて今更感 やねさんが使い勝手もよくデザインも洗練されている
いままでの将棋GUIが全て過去のものとなるような素晴らしい商用将棋ソフトを作ってるから期待して待ってるといいよ ボナンザ6.0=プロ棋士は、最新ソフトの足元にも及ばない >>381
NPSがいくつくらい出ていれば、
最新ソフト「(長考後)・・・それ最善やな」
を避けられるのでしょうか? >>382
NPSというか検討時に一手あたりどのくらいのノード数探索させるか
かなり難しそうな局面なら最低でも10億以上は読ませたいところ
例えばNPS100万くらいしか出なければ結構時間かかるね 選手権の本番ではこの戦型で先手が1敗1分だったよね
データだけでは勝ち切ることは難しい.FGのデータはいろいろ偏っているからね
西尾明@nishio1979
横歩取り青野流のこの局面、2018年初頭から昨日までのfloodgateデータベースだと先手が522勝102敗で驚異の勝率83.7%となっています。
ただ、ソフトが搭載している定跡が偏っている面もあり(△2六歩は1局しかない)、現在は人間+コンピュータで色々と模索している状況と言えるかもしれません。
https://twitter.com/nishio1979/status/997838682542424065 現状は、
探索速度
ソフト>>>>>人間
局面評価
人間>>>>ソフト
トータル
ソフト>人間
という感じ
ノード数が足りないって言っても、そりゃノード数に上限がなければ強いのは当たり前 >>381
10万円程度のノートパソコンで3Mnps
20万円程度のハイエンドデスクトップパソコンで7Mnps
50万円程度のハイエンドワークステーションで15Mnps
GCEやAWSのハイエンドクラウドで50Mnps
クジラコミュニティで3Gnps
どこが必要十分な性能の分水嶺なのでしょうか? 所詮プロ棋士の将棋は最新ソフトから見たら、アマ7級程度のお遊びじゃよ 後手の持駒:桂
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・ ・ ・ ・ ・v玉 ・v香|一
| ・v飛 ・ ・ ・v角v金v歩 ・|二
| ・ ・v桂v歩 ・v金 ・ ・v歩|三
| ・ ・v歩 ・v歩v銀 歩 歩 ・|四
|v銀 ・ ・ ・ ・ 歩 ・ 銀 ・|五
|v歩 歩 歩 歩 歩 ・ ・ ・ 歩|六
| ・ ・ 銀 ・ 金 ・ 飛 ・ ・|七
| 歩 玉 金 角 ・vと ・ ・ ・|八
| 香 桂 ・ ・ ・ ・ ・ ・ 香|九
+---------------------------+
先手の持駒:桂 歩二
後手番
この局面とかどのくらい読ませれば正しく評価できるんだろうか? >>385
お前はアホか、局面評価も最新ソフトの方が圧倒的にすぐれているわ ボナンザ6.0程度の棋力しかないプロ棋士が最新ソフトより優れている部分などあるわけなかろうが 分かりにくかったか
ノード数が同じ前提なら、局面評価は人間が圧倒的に上
言ってしまえば数の暴力。そもそもソフトとはそういうもの >>385
プロ棋士でトップ20に入る実力の千田六段がノータイム指しのコンピュータに既に勝てなくなっているので、局面評価もソフトの方が人間を上回っているのは間違いないと思います。
ただ、探索速度の優位程の開きはないため、局面によっては人間側の方が正しい判断をすることも有るとは思います。 >>391
それは人間に有利にしたい側の情けない発想でしかないわ、そもそもソフトと人間を同じノード数にする必要などない なんとかしてソフトより人間の方が優れているといいたいアホがおるな ID:W59ohio10が語るコンピュータの地強く評価は間違っていないと思う。
でも、人を馬鹿にした口調と根拠も示さない書きなぐりのせいで荒らし厨と同程度の扱いしか受けない。
R2500以上同士の対局の指し手の良し悪しなんて自分では判断できないはずなのに、さも出来るかのような書き方は不興しか買わない。 >>388
結局深さ次第だよね、今のソフトはその性質上、細く深くっていうのが苦手だから
中盤の30手後に逆転しますみたいな特殊なシチュがつらい
ただ、この辺もハードウェアでゴリ押せばどうにかなるんだよね 千田六段はは本当にノータイム指しに勝てないのだろうか?
自分はdepthを調節したコンピューターとやるときは相手の速指に手拍子したり
何度でもやり直しできるから真剣になりきれず、+2000くらいになっても簡単に負ける
かつての電王戦みたいな真剣にやれる環境ならさすがにノータイムには簡単に負けないのでは?
という気もする uuunuuunさんのところを参考にすればGikou2深さ12ですでに激指14より強い。
そして書籍やインタビューの情報をみるに激指14に勝ち越せる人間はいない 従来の三駒だと評価値がバタバタと荒ぶるとほぼ負けだが
勝っちゃうことがあるnnたぬきはなかなか新鮮だわ 長めの時間はKPPT版の検証しかされていないから
もう1手1秒に設定して自分で検証した
https://i.imgur.com/D2TitCI.jpg ギリギリ有意差がありそうな範囲まで
俺が言いたいのは純粋な評価関数の精度ではT.N.K.が今大会ぶっちぎりに最強だったってこと
その比較用に探索部を統一してT.N.K.と三駒を対戦させられるように
(強化ではなく単なる調整である事が分かりやすくなる手助け)
KPPT版もビルドしたのに
何故か評価関数固定でのエンジンの比較がスタートしただけで全く意味がなかった
検証をして欲しいのは本来の実力を発揮したT.N.K.の強さの方だから!!
更新はもうないので、最後にNNUE評価関数スターターキットとして
評価関数とエンジンを同梱してアップロード(中身はバージョン6のまま)
多分本家やねうら王の次の更新辺りでブチ抜かれるだろうけど
NNUE評価関数の本来の実力を少し早めに体験したい人は是非使ってみてくれ
斧 https://www.axfc.net/u/3912219
bitsend https://1.bitsend.jp/download/a721f09b1dc9a8aebf5997408860b2e2.html 今後の更新ないのは
あの後で約40パターン合計1万局以上を比較検証したけど
200局でも有意差が出るほど強くなる調整箇所がもう見つからなかったのが理由
今回はガチのマジで限界なので今後の更新はないです >>400
すばらしい! 今回のプログラム提供にあらためて感謝します。 結局、今のソフトの強さは枝刈りと引き換えに得たものなので、
大駒を含めた捨て駒の連続+長手数で成立する筋とかは見落としやすい。
もし、貸し出しありの条件で、人間が最新ソフトに勝つ可能性を求めるなら、
・序盤から一気に終盤になる
・変化の余地のない一本道になりやすい
・大駒を切る(枝刈りされやすい)派手な筋が成立しやすい
の3点から、横歩一択だろうな。 >>403
読んでて思ったんだが、
マルチスレッドで動かしてるんだから、枝刈りするものと枝刈りしないもので合議は出来ないもんなのかな。
詰みルーチンも1スレッドあれば十分だろうから、枝刈りをしないルーチンも1スレッドぐらい入れておけばいいんじゃないかな。 >>404
その計算資源をNPS増やすのに使ったのと大差無い結果になりそうな気がするよ >>400
> 俺が言いたいのは純粋な評価関数の精度ではT.N.K.が今大会ぶっちぎりに最強だったってこと
> その比較用に探索部を統一してT.N.K.と三駒を対戦させられるように
> (強化ではなく単なる調整である事が分かりやすくなる手助け)
> KPPT版もビルドした
上記目的なら、TNK_W-NNUEとTNK_W-KPPTという名称でリリースして欲しかったです
名前のせいで混乱が生じてました 対YO4.82+QQRの簡易測定結果続き16スレ1秒(一手500~800万ノード)
エンジンYO4.82
54-3-43(勝率約54%)
エンジンKPPT-whale6
37-8-55(勝率約40%)
エンジンGW
59-6-35(勝率約62%)
ここまでは作成中の評価関数使用
さらにエンジンに調整を入れたT.N.K.がこの結果を圧倒的に上回ることを期待して次を測定
エンジンNNUE-whale6+評価関数NNUE
36-11-53(勝率約40%)
NNUE-whale6の力を使ってもYO4.82+QQRにT.N.K.が勝ち越すことはなさそうな気配で残念
対局数少ないけどなんだかんだGW+三駒はだいぶ強い印象
これ以上を目指すならQQRに6割以上勝つ三駒評価関数から教師作ってNNUE学習させるのが近道感あるかな 局面単位の評価の正確さは人間>3駒なんだろうが、学習の深さと時間が十分であれば3駒が上回る
可能性も否定できない?
depthがある程度深くなるとDLも3駒も大差なくなるのかね >>409
100局でも3つに関しては有意差出てるからね、強そうか弱そうかはなんとなくわかるのよ 数の暴力という点は性質上仕方ないだろ
それにソフト側は1秒の思考と言ってもスペックに依るわな
人間からしたらソフトの局面評価はまだまだ、
ソフトからしたら人間の探索速度は圧倒的に下
それぞれ長所があるということはずっと言われて来ていることなのに >>400
斧ではダウンロードできなかったのでありがとうございます
最強の組合せですね
自分は対局バトルできる環境にないので検討用に試してみました
ソフトに期待していた望み通りの結果が得られました
これまでになかった最高のパフォーマンスです
エンジンの改良も素晴らしかったです
T.N.Kの評価関数が優れものであったことも確認できました
ノートPCでの比較なので低スペックでのパフォーマンスがよいだけなのかも知れませんが、先にQQRで試していたので実感で比較すると、
YO4.82+QQR<NNUE-whale6+QQR<<NNUE-whale6+T.N.K
となります ソフトの局面評価が人間以下なら人間が絶対に悪型だと思ってた良型をソフトが発見するわけないだろうが
ソフトの局面評価のほうが9割9分の場合ではるかに正確 最近は序盤はいかにソフトを使って事前に研究できるかどうか
中終盤は生まれ持っての才能や従来の勉強方法が大事 局面評価ってこの場合探索なしでの評価ってことでしょ。
局面評価自体は人間のほうが上でも探索することではるかに上回るという話で ソフトの局面評価は人間より、はるかに上だろうが、逆にことを言ってるアホがおるな プロ棋士でも日々のソフトの研究なしでは生き残れない世界にまでソフトは進化した
ま、昔の玉を完全に固く囲ってから開戦してた将棋からバランス重視に変貌したのと、矢倉や穴熊が大分減少したり、雁木が当たり前のように指されているのもソフトの影響だしな
どう見ても局面評価もソフトが上だろうが いつまでも古い価値観にこだわってる人や、ソフトを頑なに否定する人はそれはそれでほっとけばいい
そういう人は活躍できなくなるだけ アマでもかつて全国制覇した人全国の予選で敗退したり、そのかわり急にパッと頭角を現してきた人もいる
どう考えてもソフトの影響 どう読み取ったら否定しているように見えるのか・・・・
1人2人はだいたい分かってるようだけども 昔このスレで話題になった将棋世界の創作次の一手の超難問(をちょっと変えた図)
正解は▲1二金の詰めろ逃れの詰めろだけど指せるようになった?
後手の持駒:歩
9 8 7 6 5 4 3 2 1
+---------------------------+
| ・ 金 ・ ・ ・ ・ ・ ・v香|一
|v玉 ・ ・ と ・ ・ ・ 金 ・|二
|v香 ・v桂 銀 龍 と ・ ・ 桂|三
|v歩v歩 ・ 桂 ・ ・ 歩 ・ ・|四
| 歩 歩 ・ ・v歩 ・v飛 ・ ・|五
| ・ 香 銀 ・v金 ・ ・ ・ ・|六
| ・ ・ 銀vと ・ ・ ・ ・ ・|七
| 香 ・ ・v歩 ・ 銀 ・ ・ 金|八
|v角 桂 玉 ・ ・v馬 ・ ・ ・|九
+---------------------------+
先手の持駒:歩七 べつにソフトの影響を否定してるんじゃないんだけど・・・
局面評価の話ってなんかの開発者もコメントしてたと思うがな。
3駒は粗い評価で早く、DLは正確な評価で遅い 一手のまちがいで勝ち負け交錯するクリティカルな局面ではDLでも正確とはいかない
探索なしのDL将棋では序盤から中盤にうつるときにぶっこける >>421
改変ほんとにあってる?何か間違ってね? >>425 原図はこれ.詰みに関係ない歩を持ち駒にしてより難問にしたつもり
後手の持駒:歩二
9 8 7 6 5 4 3 2 1
+---------------------------+
| ・ 金 ・ ・ ・ ・ ・ ・v香|一
|v玉 ・ ・ と ・ ・v歩 金 ・|二
|v香 ・v桂 銀 龍 と ・v歩 桂|三
|v歩v歩 ・ 桂 ・ ・ 歩 ・ 歩|四
| 歩 歩 ・ ・v歩 ・v飛 歩 ・|五
| ・ 香 銀 ・v金 歩 ・ ・ ・|六
| ・ ・ 銀vと ・ ・ ・ ・ ・|七
| 香 ・ ・v歩 ・ 銀 ・ ・ 金|八
|v角 桂 玉 ・ ・v馬 ・ ・ ・|九
+---------------------------+
先手の持駒:歩 >>421
スレ違いだろうが、詰将棋専門のスレでやれ まず先手玉が詰めろってことを認識するのが通常探索ではかなり難しいかも.
無駄合を入れるとかなりの長手数の詰みだから >>421>>426
あー、なる
歩の合駒の機会を増やして超手数にしたのね >>421
原題は知らないがどのソフトでも簡単に正解しましたよ
なかでもwhale6+T.N.Kがピカ一
ノートPCで検討
技巧2は探索深度21手で互角ながらブラス評価に
4.79+yaselmoは22手で互角ながらブラス評価に、23手で先手優勢に
どちらも2分以上消費
4.82+aperypaqは最善手にはなるが、3分以上、23手でもプラス評価にならない
4.82+QQRは40秒、21手でプラス評価に、2分以内に22手で先手優勢評価になる
whale6+QQRは1分以上22手で先手優勢評価
whale6+T.N.Kは数秒20手でプラス評価
10秒21手で先手優勢評価
1分22手で先手勝勢評価 >>431
読み筋は▲1二金になってる?▲7二と なら先手玉が詰んでしまうから間違いっていう問題なんだけど >>432
ちょっとしつこいよ、一瞬で12金になるって その問題は手数自体は長いが変化が少ないのでソフトの実力を測るには向いてないと思う
金駒6枚桂2枚ぐらいの持ち駒で
候補手を進めた上でなのは詰1分回しても詰みか不詰みすらわからない局面が望ましい うちのNNUE-Whale6じゃ2Gノード超えても駄目だったぞ もうあてにならん検証するよりフラゲにでも流して測ってくれよ ていうか浅く深く読むのってソフトが苦手な分野だから当たり前といえば当たり前の話なんだよ >>426,432
改題のほうが12金を見つけるのが早いよ
72との詰めろは一瞬で30000点越えで後手勝勢とでます
原題のはうは探索深度21手以内で正解したのはwhale6+T.N.Kだけ
2分22手で先手勝勢になった
ともあれ、whale6+T.N.Kがピカ一だろうね >>439
当時のスレに60億ノードってあるからかなり枝仮りの精度も上がったんですね.
長手数の詰みの変化でも変化少ない一直線ならかなり深く読めるようになったってことでしょうか.
857:名無し名人:2015/06/19(金) 09:15:50.98 ID:gHPnbk4S.net
ponaxはノード数60億で初めて▲1二金と出ますが、それまでは7四歩、7四銀、7二銀
を読んでました。他のソフトも長時間読ませれば▲1二金と出るのかもしれませんね >>440
先手勝勢とかは出てくるけどそれは12金じゃなくて他の読み筋だし
何か特殊な設定をしてるか勘違いしてるんじゃねぇかと俺は思ってる
大体、金が絡む変化が起きるのって46手目以降だし深さ22で正解が出るわけがない とはいえ、こんな異常な局面なんて実戦に出てこないんだから無視して良いと俺は思うけどね >>441
騙されたと思ってNNUE-whale3で読んでみ >>441
最善手ということなら探索19手で▲12金になるよ
21手で▲12金なら先手勝勢
それ以外の手は後手勝勢です
御自身で最新ソフトで検討してみればわかる話ですよ 今後の更新ないのは
あの後で約40パターン合計1万局以上を比較検証したけど
200局でも有意差が出るほど強くなる調整箇所がもう見つからなかったのが理由
今回はガチのマジで限界なので今後の更新はないです >>445
ソフト同士の強さに最適化?してるだけ?
検討モードで貴方の改良ソフトは有用なの? >>449
候補手1で出てこなかったから増やしたんだぞ >>451
そうなんか
うちではすぐ見つかったけどな >>452
何か設定が違うんかもしれんなぁ
どれぐらいのノードかSSあったら見てみたい 何度か試してみたら同じエンジンでもdepth19で気づくときとdepth21でも気づかないときがあるみたいだな
LazySMPとかもあるしこれだけ複雑だと毎回同じくらいのノード数ってわけにはいかないらしい >>456
それ4手目△4八馬になってるけど△5八馬(以下▲7九玉△3九飛▲同銀△5七馬)が正しい手順じゃないか? >>448
そもそも▲72とでは後手勝勢というのは技巧2でも瞬時にわかるよ
▲72とで先手優勢の評価値が出るのはあり得ない
あなたのソフトは正しく機能していませんね >>460
読み筋を見る限り、後手が間違えた局面を読んで優勢と判断してるみたいだね あ、違う俺が悪かった。詰めろじゃないんだからそりゃあ違う手さすよな。うん このスレも詰将棋解答ちゃんねるになってしまったな
だれか、詰将棋解答禁止コンピュータ将棋ちゃんねるを作ってくれ 検討結果
スペックはノートPC
エンジン:NNUE-whale6
評価関数:T.N.K
* 候補1 時間 02:51.5 深さ 22/37 ノード数 205846320 評価値 1002
読み筋 ▲1二金(22) △6九歩成(68) ▲同 玉(79) △5八と(67) ▲7八玉(69) △4八馬(49) ▲8七玉(78) △3九飛成(35) ▲8二金(81) △同 玉(92) ▲7二と(62) △9二玉(82) ▲8二と(72)
△同 玉(92) ▲5二龍(53) △9一玉(82) ▲4一龍(52) △9二玉(91) ▲3二龍(41) △4二歩打 ▲同 龍(32) △6二歩打 ▲同 龍(42) △8二銀打 ▲同 龍(62) △同 玉(92) ▲7二桂成(64) △9二玉(82) ▲8三銀打
* 候補2 時間 02:51.5 深さ 22/43 ノード数 205846320 評価値 -5214
読み筋 ▲3七銀(48) △7七と(67) ▲8二金(81) △同 玉(92) ▲7二と(62) △9二玉(82) ▲8二と(72) △同 玉(92)
* 候補3 時間 02:51.5 深さ 22/45 ノード数 205846320 評価値 -5730
読み筋 ▲4五歩(46) △1三香(11) ▲7八歩打 △6九歩成(68) ▲同 玉(79) △4八馬(49) ▲8二金(81) △同 玉(92) ▲7二と(62) △9二玉(82) ▲8二と(72) △同 玉(92) ▲7二銀成(63)
△9二玉(82) ▲8二成銀(72) △同 玉(92) ▲5二龍(53) △8三玉(82) ▲8四歩(85) △7四玉(83) ▲8五銀(76) △同 桂(73) 1手2秒 6スレッド [i7-8700k] 計200局
NNUE-WHALE3 対 QQR(YO4.82)
92-4-104
95% 信頼区間 [0.4030612244897959, 0.5408163265306123]
NNUE-WHALE5 対 QQR(YO4.82)
75-8-117
95% 信頼区間 [0.3229166666666667, 0.4583333333333333]
NNUE-Whale6は今同じ設定でQQRと対戦させてるけど
NNUE-Whale6から見て100戦の段階で勝率38% 詰将棋など全く興味ないんだが、ほんまスレチのアホが急に増えたな 詰将棋の解答自体は意味が無いけどソフトが読めるかどうかは意味があるだよ
強さ談義がしたいだけならfloodgateとかuuunみてりゃ良いだけだしな
うちで1二金が見つからなかったのはハッシュサイズが小さかったのが原因
16GB(本当はもう少し少なくできるのかもしれないが)使うようにしてみたら見つかったわ >>466
うちも16スレ1秒で色々やってみたけど勝率40%前後に落ち着くかなって感じだった >>464
詰む実戦例も検討素材として重要だよ
実際の対局で詰みに気付くかどうかは詰将棋を解くのとは別問題
なので「詰み専用ソフトで解けばいい」というほうがスレチでしょ 60手以上の自玉の詰めろを防いで、かつ相手玉に約60手以上の詰めろをかける手を
それよりかなり浅い探索で見つけてしまうってのはどういうメカニズムなんでしょうか? 検討素材として別例も
後手の持駒:角 銀 歩二
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香v桂v銀 ・ ・ ・ ・v桂v香|一
| ・v玉v香 ・ 龍 ・ ・v金 ・|二
|v歩v歩v歩 ・ とv歩 ・ ・v歩|三
| ・ ・ ・v歩 ・ ・ ・ ・ ・|四
| ・ ・ ・ ・ ・ 桂 歩 ・ ・|五
| ・ ・ 歩 ・v歩 銀 ・ ・ ・|六
| 歩 歩 ・ 歩 ・ 歩 ・ ・ 歩|七
|v飛 銀 玉 ・ ・ ・ ・ ・ ・|八
|v馬 桂 金 金 ・ 金 ・ ・ 香|九
+---------------------------+
先手の持駒:歩
後手番
whale6+T.N.Kが、一番早い探索手数で、95角で後手優勢の手順を見つけ出している NNUE-whale3は6より強い感じなんですか?
sse42版ダウンロード出来るならしたいです >>471
劣等局面(優等局面)という評価方法を採用しているからでしょうね
局面が同一で持駒が減っているだけの違いなら劣等局面
反対に持駒が増えているなら優等局面 >>474
NNUEってそういう感じの評価なの?
halfKP(自玉と他駒の関係)でってのは見たけど >>474
なるほど.柿木将棋の無駄合排除のアルゴリズムみたいのがやねうら王に実装されたのかな? 深さ以上の読みを出すときは王手延長のせいだって聞いたけどな
王手が続いてるときは要注意だってことで重点的に深めに読むやつ >>475
NNUEがじゃなくてたぶん最近のエンジンは全部同じ仕様じゃないかな
劣等局面なら即座に枝切りできるから >>478
ああエンジンのほうの話か、NNUEについてイマイチわかってないからちょっと聞いてみたかった
今の探索ってαβの延長だっけどれも 有名になった実戦での29手詰
whale6+T.N.Kは候補手1の設定で瞬時に詰みを読んだ
こんなの始めて
これまでの対局用ソフトはお手上げだったのに
後手の持駒:角 金 銀 歩
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・ ・ ・ ・ ・ ・ ・ 杏|一
| ・v玉v金 ・ ・ ・ ・ ・ ・|二
| ・v銀v桂 馬 ・v歩 とv歩 ・|三
|v歩v歩v歩v歩v歩 ・ ・ ・ ・|四
| ・ ・ ・ ・ ・ ・ ・ 歩 ・|五
| 歩 歩 歩 歩 ・ ・ ・v龍 ・|六
| ・ 銀 桂 ・ ・ 玉 ・ ・ ・|七
| ・ ・ ・ ・ 歩 ・ ・ ・ ・|八
| 香 ・ ・ ・ ・ ・ ・ ・ ・|九
+---------------------------+
先手の持駒:飛 金二 銀 桂二 香 歩三
先手番 技術的なフィードバックがあるならともかく
あの手を読んだ読まなかったとかどうでもいい >>480
いい加減止めろ、いつまで続けるつもりだ まぁさすがに知見が無いのは俺もどうでも良いとは思う >>464
もう他にあんまりコンピュータ将棋のネタも無いからな。
もうコンピュータ将棋も終焉の日が近いわ ここはコンピュータ将棋に関して広く扱うスレッドだから
どんどん続けていいぞ、俺は興味がある。 まあ少なくともスレチではないわな
あんまり続けられると鬱陶しいが まあ金になるならこういうのでもいいのかもね
もちろん高かったら手を出さないけど ARM版のnpsいじればもうちっとましになる
需要があるなら差分を用意してもよいが 囲碁だとDeepZenGoがネット碁で公開しているから
若手プロががんがん公開で勝負している
若手の碁は年寄りには全然理解できないと治勲が言っていた
もちろん悪手ではないから碁の可能性を広げてくれたと
碁棋士はソフトを完全にリスペクトしているけど将棋は未だにモヤモヤ状態だな >>492
差分詳しく!!
めっちゃ需要あります!! 本家本元の方がNEON命令のコードを書いてくれたのか。 >>495
そのせいですね
やはり検討用には最適ですね 本家がNEON対応するのなら控えるか
通常のnnueは特に詰みルーチンとかエンジンは動かしてないと思うぞ
それでもMATEは従来の三駒評価より数手早めに出ることも確かにあるようだ >>501
>出ることも確かにあるようだ
いやぁその程度の差ではなく
どの例でも段違いに早い android用にコンパイルしてみました
最新のNEON 命令対応コミット適用済みです
スマホ用NNUE-whale3
斧 https://www.axfc.net/u/3912525
bitsend https://1.bitsend.jp/download/f3c584d36e9ea8d89e430a3efb22a14e.html
スマホ用NNUE-whale6
斧 https://www.axfc.net/u/3912526
bitsend https://1.bitsend.jp/download/d8a382498f4905094f62bbd1bdfa28dc.html
ShogiDroidの「エンジンインストール」からそのまま導入出来ると思います
>>407>>466>>469
検証ありがとうございます
やはり短時間対局での勝率に全力投球をした調整では
ハイスペック環境用の勝率まで上げるのは難しいようですね
自力では検証困難でしたのでとても参考になりました
>>446
0.1秒対局での勝率が上がるかどうかを基準に調整を加えました
それ以外の要素、検討モードで示す手がどう変化するか等は未確認です ついでに本家やねうら王4.82のandroid版もコンパイルしたので投下
https://1.bitsend.jp/download/d04b9e125a83828121b8bb6f657bd5dd.html
KPPT用、KPP_KKPT用、TNK用の三種類
こっちはコンパイルに必要な変更以外は全て本家やねうら王 >>503
スマホ用までありがとうございます
色々使ってみてなんとなくだけど個人的にはwhale3がバランスいいのかなって感じたかな
今のNNUE評価関数はAperyから50億教師だったはずだから評価関数のほうが進化すれば化けそう
まあ学習がなかなか収束しないのとハイパーパラメーターガチャで結構大変らしいけども
それでも既に検討ではNNUEwhaleシリーズが有用なようなのでありがたく使わせてもらってる やねうら王は将棋界にかかわらないで欲しいですね
詐欺師としか思えませんので >>506
偽善であれ形にできる人間はすごいと思うよ
その対価だってあっても問題ない ビッグマウス過ぎるだけで能力自体はクソ高いから詐欺師ではないだろ >>503
NNUE-whale3のsse42版を使いたいですが、どこでインストールできますか? QQR+YO4.82対してorくじら9+GW5.0.5に対してどれくらい勝てるソフトなら公開されてほしいと思う? 有意差出てるなら50.1%でも
棋風が違うなら40%でも やねさんは、ビッグマウスだが、能力もクソ高くて、
もしかしてそのビッグマウス、全部真実じゃないかと
思わせるのがすごく上手い >>513
同じくらいの強さでも、NNUE評価関数でサイズが小さくて軽ければ、大歓迎!!! >>503
NNUE-whale のスマホ版、待ちに待っていました!
ありがたく使わせていただきます! >>480
その場合は正解がワリと有力候補なので
候補数1でサクサク深く読めてすぐ詰みまで行ける。
しかし候補数2以上で検討すると他の候補が深さ進行の足を引っ張る。
また正解が低位候補の場合、候補数1では正解が枝刈りされてしまう。
例えば実戦例だとこの25手詰め
後手の持駒:金 銀 歩四
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香v桂 ・ ・ ・ ・ ・ ・v香|一
| ・v飛 ・ 龍 ・ ・ ・ ・ ・|二
|v玉v歩v歩v歩v歩 ・v角 ・v歩|三
|v歩 ・ ・ ・v馬 ・ ・ ・ ・|四
| ・ ・ 銀 ・ ・ ・v歩 ・ ・|五
| 歩 ・v桂 ・ ・ ・ ・ ・ ・|六
| ・ 歩 桂 歩 歩vと ・ ・ 歩|七
| ・ ・ 玉 金 ・ ・ 金 ・ ・|八
| 香 ・ 銀 ・ 金 ・ ・ ・ 香|九
+---------------------------+
先手の持駒:銀 桂 歩
あちらを立てればこちらが立たず 48先生調べ
対局数300 先手勝ち173(61%) 後手勝ち109(38%) 引き分け18
Boo13
勝ち149(52%) 先手勝ち91(64%) 後手勝ち58(41%)
GodwhaleChild-5.0.5 KPPT 4.80 64AVX2 TOURNAMENT
勝ち133(47%) 先手勝ち82(58%) 後手勝ち51(35%)
対局数300 先手勝ち155(58%) 後手勝ち111(41%) 引き分け34
shot_gun 0.32 ←(定跡入りPonder無し仕様のやつ)
勝ち176(66%) 先手勝ち100(74%) 後手勝ち76(58%)
Apery_WCSC28
勝ち90(33%) 先手勝ち55(41%) 後手勝ち35(25%)
対局数201 先手勝ち108(55%) 後手勝ち86(44%) 引き分け7
Boo13
勝ち70(36%) 先手勝ち41(41%) 後手勝ち29(30%)
QQR
勝ち124(63%) 先手勝ち67(69%) 後手勝ち57(58%)
勝敗 Boo13 58 Qhapaq_wcsc28 88 レート差 62
先手勝 Boo13 : 32 Qhapaq_wcsc28 : 48
後手勝 Boo13 : 26 Qhapaq_wcsc28 : 40
千日手 15 持将棋 7 平均手数 140 対局数 168
対局数300 先手勝ち114(41%) 後手勝ち162(58%) 引き分け24
Boo13
勝ち160(57%) 先手勝ち67(49%) 後手勝ち93(66%)
elmo_wcsc28
勝ち116(42%) 先手勝ち47(33%) 後手勝ち69(50%)
http://bleu48.hatenablog.com/entry/2018/05/21/104550 千田調べ
QQR飛車落vs技巧2 corei7 5960Xで1手5秒(QQR16スレッド、技巧8スレッド)
QQR:2勝 技巧2:9勝 引分:3(但し、実質QQR勝ち)
https://twitter.com/chidanza/status/998394940236283904 候補手1 では読めない例があるのは、承知してますよ
その場合でも他よりwhaleエンジン+T.N.Kのほうが優れていることには変わらないですよ
また、この実戦例の場合はwhaleエンジン+T.N.Kなら候補手1でも探索25/26で25手詰みを見つけてくれますね
低スペックでも1分、ハイスペックなら瞬時ですね T.N.Kに限らず今ひとつ足りないのは
詰みは読めても詰む手前での最善手を選択できないところかな
とくに候補手1にしていると「詰めろ」になる最善手を見逃すことがあるね
実戦では角が手に入れば詰むとか、あと1歩さえあれば詰むとか、
長手数になるがこの手は詰めろなので一手勝ちとか
こうした発想は人間ならばこそ
そうした欠陥を一手に億単位ノード読ませることでカバーしているわけだけど そういう発想自体はソフトにもあると思うけどな。
ただ長手数の場合はそれだけ局面履歴を増やさないと学習できないという理屈で 結局計算資源の問題でDLも3駒も学習のコスト単位で比べたら大差なかったりして やねうら王の探索は意外と寄せの力が強い
詰将棋エンジンはシングルスレッドでしか動かない
ハイスペックほどスレッドの暴力で詰将棋エンジンより早く結論を出してしまうことも多い >>524
例えばこれなんかは先の実戦局から生じた変化局面図で後手番
ソフトは△58と▲79金を推してくる
実は△58とには▲52とが詰めろなので先手勝ち
ソフトは数手前にこの▲52とを読んでこの変化になるのを避けるべきなのだが、
それができない
後手の持駒:角二 金 銀 歩三
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香v桂v銀 ・ ・ ・ ・ ・v香|一
| ・ ・v玉 ・v金 と ・ ・ ・|二
| ・v歩v歩v歩v歩 ・ ・ ・v歩|三
|v歩 ・ ・ ・ ・ ・ ・ ・ ・|四
| ・ ・ ・ ・ ・ ・v歩 ・ ・|五
| 歩 ・ ・ ・ ・ ・ ・ ・ ・|六
| ・ 歩 桂 歩 歩vと ・ 飛 歩|七
| ・ ・ 玉 銀 ・ ・ 金 ・ ・|八
| 香 ・ ・ ・ ・ ・ ・ ・ 香|九
+---------------------------+
先手の持駒:飛 金 銀 桂二 歩
後手番 >>525
計算資源同等で伸びしろがあるんなら、断然こっちだろw NNUEの学習の話題が全く出てこないのはなんでなんだろう コードも論文風PR文章も鬼難しい。
もしやねさんが、WCSC28のTNKより強いものを作れたら天才だわ >>530
合成しかしない奴ばっかだから学習すらできない >>521
技巧2でも飛車落ちで勝ちきれないことがあるのかよ 羽生や藤井(聡)と1000回やって1回負けるかどうかってレベルでしょ技巧2
それに飛車落ちで勝つことがあるとかヤバいな
もう人間は何億回やろうが何兆回やろうがレート4000超えソフトには勝てないよな多分
例えるなら蟻とゾウ ソフトは人間を超えたが、人間の将棋はソフトにはない魅力があり面白いのは確か、
ソフトは最善手ばかり指すので完璧すぎて面白味がないのは確か 羽生さんや藤井聡太君ならソフトなんかより良い手をさせる
25歳以下のプロはソフトに全勝という歴史的事実
「角成らずw」「28角w」
ポナ以外のソフトなんて単純だからすーぐハメ手に引っかかるしバグだらけ
ポナ以外のソフトなら貸し出しで弱点を研究してハメればプロが圧勝できる
一般ファンが最も信用するソフトは1年経ってもポナに勝ったelmoのまま
進化した最新のソフトでも信頼されず、眼中にもなく、ただでも必要とされてない
これが世間の嘘偽ざる認識だw 大橋拓文@ohashihirofumi
アルファ碁マスターが打った新手を、ティーチでは人間の定石の方が良いと反省しているwww人間強い。 Google 「AlphaZeroの棋力が僅か数時間でelmoを超えました 棋譜は出さないけどね」
一般ファンA 「やっぱグーグルはスゲー! 棋譜がなくても絶対信じるよー」
一般ファンB 「所詮日本の開発者の技術力なんてその程度だわなw」
お前ら 「R4200超えのソフトスゲー!」
一般ファンA 「そんな信憑性ゼロの戯言など信用できるかw どうせポナンザより弱いんでしょ?」
一般ファンB 「羽生さんや藤井聡太ならそのソフトより良い手が指せるわw 無料でも要らねえよ」 >>533
ほんと難しすぎてイマイチ理解できなかったわ >>542
お前 floodgateに参戦してhavenと対局してハメてをして勝ってから大口叩いてこい
haven R4394 49勝 1敗 勝率0.980 将棋俱楽部24 R4081 >>531
どこらへんがネックなんだろう、ハイパーパラメータの多さ? >>544
一般ファンが最も信用するソフトは1年経ってもポナに勝ったelmoのまま
進化した最新のソフトなんて全く信頼されず、眼中にもなく、ただでも必要とされてない
AlphaZeroは僅か数時間でelmoを超えた、日本の開発者は雑魚ばかり
これが世間の嘘偽ざる認識だw >>539
>ソフトは最善手ばかり指すので
「角落ちなら将棋の神に勝てる」と発言した羽生の二番煎じか?
現在のソフトが最善手ばかり指すわけがない
現在のソフトは精々で20手くらい先(詰みを除く)までしか読んでいない
その20手の読みも抜かりが多い
将棋の神は100手以上先まで完璧に読んでいる
数十年後には登場すると思われる50手先までほぼ抜かりなく先読みするソフトも、将棋の神には百戦百敗
浅はかな発言は羽生だけにしてもらいたい 名前も大事だな
アルファベットで短めのシンプルな名前だとスマートで賢そうに見えるんだろう >>546
お前統計データを取ったわけでもなく、何人がお前と同じ考えか分かってもなく、ええ加減なことぬかすな、
統計データもないお前の戯言など、誰も信用しておらずただの荒らしがまた来たとしか思ってないわ >>540
現在の強豪エンジンにはハメ手に引っかかった局面から始めても人間は
全然勝てない >>535
千田の設定ミスで技巧2が8スレッド、QQRが16スレッドの差はある
uuunuuunさんが技巧1で実験したときは技巧の9-1だったそうだ
yaselmoの飛車落ちが大樹の枝相当で、そこからいきなり技巧1まで上がるとも思えん >>550
公式戦7戦全勝のポナ、ポナに勝ったelmo
これ以外のソフトは最新のソフトであっても全く信用されてないのが現実
羽生さんや藤井聡太君ならソフトなんかより良い手を指せる
25歳以下のプロならソフトなんか敵じゃない
これが世間の嘘偽ざる認識だw >>552
だからお前の言っていることには統計データがないんだよ、お前が勝手に思っているだけ >>553
25歳以下のプロはソフトに全勝という紛れもない事実
一般ファンが最も信用するソフトは1年経ってもポナに勝ったelmoのまま
進化した最新のソフトなんて全く信頼されず、眼中にもなく、ただでも必要とされてない
AlphaZeroは僅か数時間でelmoを超えた、日本の開発者は雑魚ばかり
レーティングなんて全然当てにならない
これが世間の嘘偽ざる認識だw ノイズだらけの人間の棋譜を学習して、人間の手が良いと認識してしまってるMasterや絶芸が
Zero、PhoenixGoに負けるのは当然と言える >>555
こいつほんまアホだな、アホな言い分をただ述べているだけ、相手にするのはもう止めよう、おしまい >>557
ポナ以外のソフトはプロに負けるのを恐れて電王戦をポナに丸投げして逃亡した腰抜け
引退したポナを除いて5vs5のマッチを再開し、ソフトを貸し出して研究すれば、今でもプロが5戦全勝する Sa02-HRP5
この人の頭は2015年辺りで止まっている
阿久津がアマが考えた対コンピュータ戦法を真似して突いたとか、永瀬がバグを探して突いた辺りまでで止まっている
阿久津や永瀬の相手をしたソフトは、2014年のバージョンで現在のソフトとは比較にならないくらい弱い >>559
世間の多くが4年経った現在でもそう認識してるから仕方ないねw 昔、「旅人」という頭のおかしいプロ厨がいた
何年も前の低性能PCで何年も前のソフトと対局して、「ソフトは弱い」と結論付けていいた
Sa02-HRP5は、「旅人」の現代版 >>559
>>561
というか対立煽りの釣りでしょ Sa02-HRP5 → No.2bot No.2botの書き込みの移り変わり
2012年頃
・三浦さんがアイオイユウコやホープライトに負けるわけない
・アイオイユウコやホープライトに最強コンピューターが負けてるうちは羽生さんらトッププロには勝てない
・最強ソフトがアイオイユウコやホープライトのようなアマチュアに負けてる内は トッププロ>最強ソフトは揺るがない
・アイオイユウコやホープライトにコロコロ負けてるソフトが羽生さんより強いわけなかろう
↓
2013年頃 Puella α:2013年に開発が中止された昔のソフト
・所詮はNO2ソフトが塚田さんに勝てずNO5ソフトが阿部君に惨敗するレベル トップ中のトップが出る段階ではない
・並のプロの阿部君や塚田さんで勝ったり引き分けたりするレベル
↓
2014年頃
・コンピュータは阿部君塚田さん船江君豊島君らより確実に強いと証明しないとね
・阿部君豊島君には手も足も出ない負け方をしてるわけだし
・渡辺さんより遥かに格下の阿部君塚田さん豊島君らが負けてないんだから
・わざわざ羽生さんが出なくても豊島君クラスならソフトに楽勝できる
↓
2015年〜2016年 AWAKE:2016年5月のコンピュータ選手権で予選落ち ツツカナ2016年10月の電王トーナメントで予選落ち
・将棋はA級全敗棋士が最新最強ソフトを21手で負かした
・現実は普通にA級全敗棋士が最強コンピュータに楽勝してるんだけどね
・されどA級全敗棋士にはトップソフトが勝てないんだったねw
・MAXの能力なら森下さんクラスでもコンピュータより上だと証明された
・ソフトは所詮はソロバン使った森下さんに勝てないレベルだからね
・森下さんクラスでもMAXの能力なら楽勝だったね
↓
2016年
・山崎さん程度が負けたところでA級全敗棋士が楽勝してるうちは大丈夫
↓
2017年に名人が連敗した後は沈黙
No.2botは10年以上前に活躍していた旅人を大幅に劣化させたような存在
旅人の理論 http://www.geocities.co.jp/CollegeLife-Cafe/8331/comp.html >>555
まぁ、少なからずそういう世間の認識があるというのはわからなくもないが、それがどうかしたか?
開発者たちはきちんとした条件で強さを計測している。
世間の認識がどうあろうが、別に強さは変わらん。測定したとおり。
疑似科学で世間をだましにかかってる奴を批判するならその論法でいいかもしれないが、
コンピュータ将棋は普通の科学やってるから数字はそのまんまの意味。 >>537
確実なのは飛車落ちとほぼ同じ飛香落ちはほぼプロ駄目だろう
二枚落ちもyaselmoの時点で2400だったし、QQRなら2600-700でもおかしくない
そうなるとプロ平均クラスでも負け越すだろう
AWSなんて使った日なら羽生藤井だけやっと勝ち越しとかそういうレベルかな 一般の将棋ファンに
「現在最強のソフトは?」「現在最も信頼できるソフトは?」
って聞いてみたらいいよ
殆どの人が
「elmo」、「ポナ」、「激指」 ←←
って答えると思うから
世間なんてそんなもんw 人とソフトを比べるのはもうやめるべき
プロ棋士に対しても失礼 >>566
百歩譲ってその通りだということにしても、だからなんなんだ?
お前さんは何を主張したいんだ? >>568
>だからなんなんだ?
>お前さんは何を主張したいんだ?
Sa02-HRP5(No.2bot)に代わって答えます
コンピュータ >>> プロ棋士 だと都合が悪い
だから屁理屈で プロ棋士 >>> コンピュータ だとしないと気が済まない
こういうことだろう >>565,568,570
公式戦で実際にプロを負かして証明しない限り、世間からは永久に信用されないよ
レーティングではなく対局結果で示さないと
電王戦を開催しなければ
「プロがソフトに負けるはずない」
電王戦で底辺プロに勝っても
「タイトルホルダーがソフトに負けるはずない」
と盲信されてた過去があったようにねw >>570
それはおかしくないか?
Ponanza信仰ととれるようなことをいってるから。 ね、Ponanza信仰でしょ?
こいつポナ山さんなんじゃないの? >>572
俺はポナ信者ではない
ポナが公式戦でプロに勝ちまくり実績を作ったのを評価してるだけ
他のソフトに最も欠けてるのは公式戦での実績
世間を納得させるだけの実績はポナ以外のソフトにはないのが現実 >>570
ソフトが強くなるのも都合が悪い
Ponanzaを大きく超えるソフトが次々と登場している
現在開発しているソフトは引退したPonanza以下ということにしないと気が済まないのだろう
要はPonanzaを超えるソフトが次々と開発されて、コンピュータ >>> プロ棋士 であることが更にはっきりすると困るということだ 再掲載
Google 「AlphaZeroの棋力が僅か数時間でelmoを超えました 棋譜は出さないけどね」
一般ファンA 「やっぱグーグルはスゲー! 棋譜がなくても絶対信じるよー」
一般ファンB 「所詮日本の開発者の技術力なんてその程度だわなw」
お前ら 「R4200超えのソフトスゲー!」
一般ファンA 「そんな信憑性ゼロの戯言など信用できるかw どうせポナンザより弱いんでしょ?」
一般ファンB 「羽生さんや藤井聡太ならそのソフトより良い手が指せるわw 無料でも要らねえよ」 2枚落ちでソフトが人間に勝つとか言う奴定期的に出てくるな
レートが無限大まで行ったら裸玉でもソフトが勝つよな。その通り >>572
ソフトが強くなるのも都合が悪い
Ponanzaを大きく超えるソフトが次々と登場している
現在開発しているソフトは引退したPonanza以下ということにしないと気が済まないのだろう
要はPonanzaを超えるソフトが次々と開発されて、コンピュータ >>> プロ棋士 であることが更にはっきりすると困るということだ 何れは出回ることになるが、現在はスマホで名人に飛車落ちで勝つソフトは出回っていない
そうなっては困るので、スマホ用の名人に飛車落ちで勝つソフトの開発を阻止したいのだろう
>>577は二枚落ちで名人に勝つソフトが登場することを認めたくない
だから「レートが無限大まで行ったら裸玉でもソフトが勝つ」と書く
それにより二枚落ちで名人に勝つソフトを否定したいのだろう
プロ厨(コンピュータ将棋を恐れる連盟関係者)は現在でも生きている >>576 >>579
君たちとても仲良くなれそうだから結婚したら?w ソフト信者はそれはそれでいいけど、2枚落ちでも人間に勝つとか言ったら数字しか見てないのがバレてしまうぞ QQRは駒落ち定理で想定されるよりも強めの勝敗になるらしい(要検証) >>581
つい10年ほど前は、将棋の神でも角落ちだと戦力不足で名人には勝てないと書いていた連中がいた
将棋の神には程遠い現在のソフトですら飛車落ちで名人に快勝するレベルにある
対局しない限り証明できないと書いている輩がいるがw 色々書いてきたが、俺が本当に主張したいのは>>571と>>574だ
これらを100回読んでから思う存分批判したまえ プロは自宅でソフトと角落ちや飛車落ちをやっているだろう
それで彼我の実力差はよくわかっている
だから最近ソフトをディスる棋士はいなくなった 大駒の有無の違いは、ある程度棋力があれば分かりそうなものだが
指してみなければ分からない理論なら何でもアリだわな。 さすがに飛車落ちならとひっそりと自宅で挑戦して返り討ちにあった棋士もいるだろうね 去年だったか今年だったか普通に飛車落ちでも勝てないとプロ棋士は言ってるって
読売新聞に書かれてたぞ >>581 >>587
名人が負けて以降に、角落ちのコンピュータ相手に勝った棋士は1人もいない
飛車落ちのコンピュータ相手に勝った棋士も1人もいない
二枚落ちのコンピュータ相手に勝った棋士も1人もいない
勝つ自信があるなら対局してもらいたいものだ
会長は一泡チャレンジなんてことを言っていた
塚田九段の「開発者はプロ棋士の棋譜を研究できるので、棋士もソフトの棋譜を研究云々」の理屈は通用しなくなった
棋士の棋譜を使わないで開発したソフトなら事前貸し出しなしで対等な関係になる
ソフトの事前貸し出しなしで、飛車落ちで対局
棋士が勝ったら、二枚落ちで対局
棋士が負けたら、角落ちで対局 551<<
それぐらいの設定ミスでは結果的にほとんど影響ないと思う
それよりも技巧2のレベルを普段千田が対局に使用しているまま
元に戻すのをわすれて対局させた可能性がある(自分より少し強いレベル) 千田は最新ソフト相手には飛車落ちで勝ち越せない棋士がいるかもしれないとコメントしてたな >>566
将棋ソフトに少しでも興味が有れば、WCSCやuuunuuunさんのサイトにアクセスして「現在の最強ソフト」を調べるはずです。
興味が無ければ「知らない」と答えるはず。
あなたの「世間」とはあなたの脳内箱庭に過ぎません。 >>596
こんばんは
来年中には盤面認識機能があるスマホアプリが登場する可能性が高いと考えています
需要がなければ開発されないので微妙なところですが 初歩的な質問で申し訳ないんだけど
将棋GUIとぐじらってのは入れて動くんだけどやねうら王ってやつを入れても初期化エラーが出て動かないんだけどなんか設定しなきゃいけないものとかあるの? >>579
レートが無限大まで行ったら裸玉でもソフトが勝つ
は命題としては正しいぞ
神様のレートは有限なので 勝敗が正規分布するという仮定が成り立っていないと思われる。 >>593
uuunuuun @uuunuuun1
今の所QQR(飛車落上手) 9-49 技巧2(下手) 上手勝率15% 一応100局くらいやらせる予定。
-----------------------------
レート差にするとおよそ300(だけど1つ勝つだけで勝率が大きく変わるのでまだなんとも)
ただそれでも推定レート3500±だからなあ、yaselmoから280アップしてる
いくらなんでも急に強くなりすぎてるので、技巧2が駒落ち下手で弱い説を推奨 将棋ソフトにおいては駒落ちとレート差正しくないだろ
ほぼ全てのソフトは教師局面を平手で学習させてんだろうし GCEある程度使ったら無料クレジット残ってても割り当て増加の申請通るね
n1-highcpu-96
Y4.82 QQR
bench 4096 96 19
37083010,38099567,40147234,37763888,38282997,35837319,37742756,36516032,35978130,37860989
bench 128
559124,755735,751427,737757
このスレの詰将棋もどきは大体一瞬で終わる 時間かかっても1分ぐらい 【富士通】”量子コンピューターに匹敵” 新型国産コンピューター実用化へ
https://asahi.5ch.net/test/read.cgi/newsplus/1526951991/
組み合わせ最適化問題に特化と書いてあるが、こういうの使ったら
DL使わんともめっちゃ強いAIが作れるんじゃね? >>606
AWSのm5.24xlargeとは1コアあたりの処理能力が7割ぐらいでちょいと遅いね
n1-ultramem-160(vCPU x 160、メモリ 3,844 GB)
だとnps一緒ぐらいになる
むしろメモリ3.8Tあることにびっくりするが 3.8Tあっても使い方わからんな、半分以上RAMディスクにしそう hefeweizen600台クラスタと二枚落ちで互角なら奨励会初段以上はある? NNUEの学習に使う検証データって出来ることなら多い方がいいけど学習にかかる時間とトレードオフって感じ? ソフト信者は、神様なら裸玉でも人間に勝てるという主張か。将棋は奥深いなあ 駒落ちになると、例えどんなに強い存在であっても、
一定以上のRには達することができないであろう。
その限界値は、昔の想定よりは遥かに高いが、限界があることには変わりない。 >>615
松村になら、羽生さん以外でも裸玉で勝ちそうだけどな。
(レーティングにして、どこまでなら裸玉で負けるのかな。) >>616
例えば飛車を後押しに歩を全てと金にして、スクラム組んで一歩ずつ進んで行けば自然に詰むな
狭義の完全解析とは程遠いが >>616
最短手数は解析するの大変だろうけど、必勝手順なら簡単だから考えてみ 定跡だけ搭載して、探索も評価もせずにQQRにかてるプログラムは簡単に書ける? 藤波辰爾対タナトラ先生の裸玉対決を最近テレビでやったらしい。
もちろん、タナトラ先生の勝ち。
初心者の自分は、指導対局してくれるソフトが欲しい。
(現時点ではぴよ将棋のヒント機能でも十分だけど) >>625
激指の指導対局やレーティング対局オススメ 先手: 俺氏(24三段) / 後手: QQR
手合割:平手
▲7六歩△3四歩▲2六歩△8四歩▲2五歩△8五歩▲7八金△3二金▲2四歩
△同 歩▲同 飛△8六歩▲同 歩△同 飛▲9六歩△7六飛▲7七角△5二玉
▲5八玉△7四歩▲3四飛△3三角▲8四歩△8二歩▲3八金△4二銀▲2八銀
△7三桂▲3五飛△3四歩▲2五飛△2四歩▲4五飛△7七角成▲同 金
△3三桂▲1五飛△1四歩▲7六金△1五歩▲2一飛△5一金▲2三歩△4九角
▲同 玉△6九飛▲4八玉△7九飛成▲2二歩成△6八龍▲3九玉△6九龍
▲4九角△5八銀▲4八金△4九銀成▲同 金△5八角▲5九銀△4九角成
▲同 玉△5八金▲3八玉△2二金▲同飛成△5九龍▲3九金△4八銀
角2枚ゲットしたところまでは優勢で勝ったと思ったら普通に負けた
後で形勢見たら終始ずっと俺が不利でワロタ 裸玉なら、相手の指し手無視して以下の手順で動かせば良いだけ。
△1六歩△1五歩△1四歩△1三歩成
△1二と△1一と△1八飛
△1六飛△9六歩△8六歩△7六歩△6六歩△5六歩△4六歩△3六歩△2六歩
△1五飛△9五歩△8五歩△7五歩△6五歩△5五歩△4五歩△3五歩△2五歩
△1四飛△9四歩△8四歩△7四歩△6四歩△5四歩△4四歩△3四歩△2四歩
△1二飛成△8三歩成△8二と△4三と△5二竜△3二竜 裸王の最短手詰みを見つけられるくらいにはコンピュータ将棋って進化してんの? >>626
マカーなんです…orz
仮想環境で動かしても行けるかな?
とりあえず、Amazonのほしい物リストに入れておきます。 >>627
横歩だとCOMはミスらないから勝てる気がしないけど、
逆に一発入れるには水平線とか長い詰みがある横歩が有力なのかなぁ? https://www.ai-gakkai.or.jp/jsai2018/jsai-cup_report
JSAI Cup 2018: 2018年度人工知能学会データ解析コンペティション
3位:下山 晃 氏(株式会社日立ソリューションズ・クリエイト)
これってBlunder, Ponanza の下山さんだよね ソフトの後手番の有力定跡はどの戦型であっても千日手率が高い戦型を選ぶべきだと思う。
極論を言えば序盤で千日手になった棋譜を全部ぶっこむのが一番マシになる。 作戦としてはありだな
後手番はなるべく千日手や引き分けを目指すソフトが増えてくるかもね コンピューター将棋は先手ゲーになりつつあるらしいから
千日手に出来れば結果オーライなのかな 選手権の先後の勝率を計算した人はまだいない?
印象だけだと後手の勝率も悪くなかった気がするが
エラーやバグがたくさんあったから修正必要だろうが 角道開けて、3間に飛車振って馬と竜が最短手順のばす 最近のソフトって強化学習によって評価関数が最適化されるようにプログラムされてますか?
それとも探索部と評価関数はそれぞれ独立で、いくら学習しても最初に人が入力したデフォのままなのでしょうか? 事前に50億局面を学習して最適化済みなので
対局によって新たにパラメータが調整される事はありませんよ 評価関数を強化学習するね
探索部と評価関数は独立だけど、探索して教師作るから無関係ではないね >>642
>>643
即答ありがとうございます
理想評価関数に限りなく近い50億局面分の極限評価関数が存在するということですね
その評価関数はインタネット上に公開されてますか?
門外漢なもんで詳しくありません >>635
千日手を成立させるためには、先手が「打開したら千日手の設定評価値を下回る」と
判断しなくちゃいけない。
やねうら王のデフォルト設定のまま千日手=-1にしてくれていたら後手はウマーかもしれないが
先手が千日手絶対拒否の-30000とかに設定してたら、後手番が損しそうだぞ
MaltiPV=1で千日手以外の手を読んでいないのなら、先手番の得を上回るのは大変だ 何に使うの?
理想や極限の定義は知らんが
強いソフトが使いたいならやねうら王+QQR使えばいいよ おそらくR4200くらいの強さであろうソフトがマイナビから発売されるからそれを買うとか 50億局面分の評価関数といっても、表形式で50億局面分あるのではなくて、関数近似されている。
なので、50億局面の中に入ってない局面もある程度ちゃんと評価できる。 KPP(T)で約2億(+手番ボーナス)、これだけの表現力があってもそれを未だに使いこなせてない感あるからな
線型の時代は終わってこれからはNNの時代になっていくのかなやっぱ むしろKPPTに正しい値を付けることができるAIを作ろう プロ公式戦で千日手が成立しやすいのは、手番を変えての指し直しが発生するからで、
かつ、人間にはセンチポーン単位での局面評価はできないから、
「先手番での指し直しが欲しい後手番」と「打開したらどのくらい得か判定できない先手番」の
意思が合致しやすい
他方、電王トーナメントのノックアウトステージを除いて、千日手指し直しのない
コンピュータ将棋のコンペティションでは、千日手の合意が極めて取りにくい
千日手の設定評価値を何点に設定するかにもよるけど、通常は評価値プラスの値に
千日手を設定することはないと思われるので、双方ともに自分が不利と判断している
場合にのみ千日手が生じうる
しかも、人間と違ってセンチポーン単位での評価値を(実際に合っているかは別として)
正確に把握しているので、「よくわかんないから千日手にしよう」ということもない
叡王戦の金井のように「打開すれば優位なのはわかってるけど具体的な手順に自信がない」
ということもない
明らかに自分より強いだろうと思われる相手に後手番引いた時に、千日手の評価値を
自分の+128くらいに設定しておけば、価値のある0.5点を取れる可能性が高まるかも知れないけど
そうでない限り、成立しない千日手を読むのはただの時間の浪費かと 千日手の評価値は対戦相手のみならず対局中にもダイナミックに変化するもので
固定値が無理なのかも uuun氏のレーティング表ではYO4.82/QQRが首位になっているけど、うちの計測では
TNK-NNUE-whale6がYO4.82T/QQRに勝率75%で圧勝なんだが、評価関数より探索の相性が顕著にあるからだろう
残念ながらYO4.82はwhale6に弱すぎる結果になった、TNKでKPPTではないので念のため うちの過去の計測では800万〜1000万と1500万での勝率の差はあまり変わらない結果になっている やねうらおのシェア版が特に特徴ないとするとGUIを買うようなもんか
うーん うちの計測だと一手500~800万くらいでwhale6の勝率40%くらいだった
100局の結果だから99%信頼区間で考えても勝率55%は超えない計算になるんけど1%を引いたのか? >>658
そちらの結果とは逆だけど、結果が結果だからどうしようもない >>659
まあ環境も違うしなんともいえんが
ちなみに何局くらいやった? >>658
TNKじゃなくKPPTだと、それ位の勝率になるはずだが、TNKで間違いないの? >>661
KPPT版(qhwcsc28に対して勝率62%程度の評価関数使用)、NNUE両方試したけどどちらも40%程度だったわ 60局だと上振れしてたとしても勝率60%超えかなんでだろうなあ >>658,662
あり得ない結果
全く別のソフトを対戦しているとしか言えないね
直接確率計算2×2]
観測値1 観測値2
-----------------------------------------
群1 40 60
群2 45 15
-----------------------------------------
両側検定 : p=0.0000 ** (p<.01)
片側検定 : p=0.0000 ** (p<.01) >>665
あり得なくはないけどほぼあり得ないよね、宝くじ当たるようなもんだし
勝率75%ってレート差200近いし何か設定ミスなんじゃないかと思うんだけど ノード数ではなくコア数の違いとか?
LazySMPの働き方に差があるならノード数が同じで結果が大きく変わっても矛盾はしないし 自分もやったけど6スレッド1手2秒200局で勝率はTNK NNUE WHALE6対QQRでwhale6側の勝率40%位だった 確かにLazySMPは確かに多少考慮しないといけないと思うけどそもそもが同ノードじゃないしなあ
あとNNUEって軽くていいってイメージがあるけどPCに結構負荷かからない?
KPPT使ってるときより一割くらい電力もってかれてる気がするし、RAMもCPUも熱くなるような >>646
いやーどんなプログラミングなんだろうって >>648
ああやっぱり
個人的にはソフトの序盤の評価は不正確だと思ってます
いくら学習させても終盤に比べフィードバックがあまりにも少ないんで ソフトのダウンロード場所聞くレベルなのに
学習させても〜とか意味わからんけど具体的な内容教えてよ
学習や評価や探索の内容知りたいならならやねうら王のドキュメントやソース見るのが一番いいよ 商用版やねうら王2018、レガシーな環境に配慮する割に収録エンジン多くてストレージ食いそう
インストーラで最小構成インストールとか用意するのかな KPPTじゃなくてNNUE評価関数だからそこまでファイルサイズ大きくならないんじゃね? chokudai(高橋 直大)認証済みアカウント@chokudai
将棋界で「レーティング」って言葉がちょっと先行し過ぎている気がするんだけど、
実力指標を考える上で、どういうレーティング計算式を適用するべきかって議論の余地があるし、
現状のレーティングサイトが採用しているレーティングが十分優れているかの検証はもうちょっとしたほうが良いと思う。
囲碁のレーティングなんかだと、レーティングサイトがパっとググっただけでも2つ出てきて、
その2つのランキングにそこそこの差があったりする。計算式によってこれだけ変わってくるので、精度最大化みたいな話はもうちょいあっても良いよね。
http://sports.geocities.jp/mamumamu0413/total.html …
https://www.goratings.org/ja/ >>675
MyShogiのREADME.mdによるとTNK,ぽんぽこ(STD5),Qhapaq,読み太,やねうら王(KPP_KKPT)が搭載されるらしい NUEEの学習してみようと思ったらtargetdirとかetaとかlearnの後に来るもろもろのコマンドを受け付けてくれないんだけどなんでだろう
見た感じやねうら王と同じ感じでコマンド打てばいいのかと思ったけどそういうわけじゃないのかな
わかる方いたら教えてください 学習機能を削除したビルドだからじゃないの
Makefileを書き換えてarmのlinux環境で試したがNNUEもかわりなく動いたぞ >>679
普通にただのヒューマンエラーだったわ、ありがとう >>645
>「打開したら千日手の設定評価値を下回る」
この文を定式化するのは難しいんだよね
それと
MaltiPV=1で先手が千日手絶対拒否の-30000とかに設定してたら、後手番が損するのではなく、先手番が千日手筋を失って一方的に負けると思うけど
-29999で千日手筋が存在するのはまず想定できないし読めていないMateが存在してもおかしくない
だから現実的に「千日手以外の手を読んでいない」ということはありえないんじゃないかな、-29999となると後手が千日手にしてくれないからね
先手にとっては負けるよりは千日手になる方がマシなので千日手の設定評価値の最適化も必要なんだよ NNUEのお試し学習してみてるけど全然CPUリソース使い切らないわ、メモリがボトルネックなのかな? 先手後手がそれぞれどういう前提で設定されてるかにもよるしね
@ContemptFromBlackがfalseでContemptが正の値になってるとどちらから見ても悪いと判断して回避しやすい
AContemptFromBlackをtrueにしたらContemptが正の値だと後手が積極的に千日手にするけど先手が回避する
先手から見て悪い
後手から見て良い
この場合Contemptの値が同じだとしても@の場合の方が千日手を回避する圧力は高くAの方が千日手になりやすい
とはいえ現実に即しているように感じるのはAの方である
私見で言えばAのContemptは感覚の2倍ぐらいの値にするとちょうどいい動作になる
初期局面が70点先手有利だと考えるのであれば倍の140ぐらいに設定するとちょうどいい
先手後手の千日手の評価値を個別に設定するようにしてみるのも面白いかもね(改造自体は超簡単なはず) >>684
なんで素直にそのまま70点にしたらダメなの? それだと初期局面での先手後手の評価値差の近似値を出すモデルが必要だから大変だな
70点くらいと人間が決めると限界が来るから正確な数値を出す必要があるわけで 技巧2とQQRで対局したが、技巧が勝ったほとんどが技巧の振り飛車
技巧が振り飛車得意なのか、QQRが振り飛車苦手なのか QQRが振り飛車をやや低く評価しすぎてるところはあるんだろうね QQR自体も振り飛車にするんだが、勝率が良くない
ただ、5秒のような短い時間だと弱いが、30秒だと勝率上がるね
もしかして、振り飛車の教師局面が少ないんかね QQRが振り飛車に弱いと思われる
定跡オンのハニーワッフルに対して殆ど五分五分
かぱっくはハニーワッフルを圧倒してる elmo以降のソフトは振り飛車に対して変な囲いや攻め方するからそれが原因だと思われる
普通に穴熊やればいいのにな
そうすりゃ勝率10割でしょ つまりは九段の方の藤井氏なら、QQR勝てる可能性が…!? なんつーか
もう定跡勝負だなこれ
選択定跡によって全然勝率変わる
いや、究極言うとR4200を超えた今は、定跡なんかいらないのかもしれない 事前にかなり深く探索して定跡を搭載しておくのは結構効果大きいと思うけどな
短い時間の対局では定跡を上回る読みを繰り出すのは至難の業でしょ
ただし定跡におかしな手が搭載されていないことが重要かな >>694
まぁ同じ手順に陥らない為に深く考えさせて複数候補手を定跡で登録するのはありだね
今自分も一手目からQQRやTNKに考えさせて自動登録してる(対戦相手は適当にやってQQRやTNKの指し手のみ棋譜から登録)
まあ今後出るソフトも考え10手〜15手までしか登録してないがね >>694
そう思うよな
だけど定跡オンオフのQQRを1手0.1秒で100局戦わせたら定跡オフが勝ち越したよ
他のソフトでやっても大体定跡オフが勝ち越した
まふ定跡、やねうら定跡で試したけど定跡オフが普通に強かった印象 >>696
その定跡のいずれもあまり良くない変化が登録されているからそこがよくないわな >>697
かぱっくが出したくそこら定跡角換わりverだっけ?
あれで試しても定跡オンが負け越した気がするよ >>698
定跡の末端のほうは結構微妙な手が含まれていて定跡を抜けた時点で有利ではなかったりするからね
まあそれでも100局で有意差がでるほど負け越しているならちょっとびっくりだけど 後手番なら必勝筋が見つからない限り千日手を狙う手が最善になるんだが殆どの人がそのことに気づいてないね
今のソフトはそのアルゴリズムが抜けている >>692
レベルが違う 角落ちでも勝てないのに戦型がどうとかという以前の問題 定跡って言わば事前計算結果だから、きっちり整備すれば
定跡オンが定跡オフより不利になる事は理屈の上ではあり得ないはずなんだけどな
まぁ、きっちり定跡を整備するのが難しいというのはわかる チェスの後を追うことになるのかな、後手番は引き分けをめざす 負け戦だからこそ勝ちに行くのが歌舞伎者だってばっちゃが言ってた >>700
もしそれが真実だとしても、現行の稲庭排除ルールでいちゃもんつけられる可能性があるから作れない。 >>706
序盤旧藤井が指して終盤は新藤井が指すのが最強だぞ >>703
そうなんだろうけど、実際定跡オフだと同じような手順ばっかになるんだよなあ
欲言うと、三間や四間飛車穴熊なんかも見たいもんだが、振り飛車弱すぎるからな >>709
もしかして最初から最後まで新藤井が指したら強いんじゃね? >>710
Rが上がるほど勝率の低い戦型は淘汰されていくもんな
振り飛車はNNUEの表現力に結構期待してるわ、適切な教師から学習すれば振り飛車指しこなしてくれるんじゃないかと 特定の戦型での勝率が見たければ指定局面からやらせればいいわけで >>708
稲庭が禁止されてるのはSDTだけで選手権はOKなはずだし
そもそも稲庭は選手権が切れ負けルールの時に切れ勝ちを狙ったソフトであって引き分けは副産物
てかいまのソフトに稲庭効かないし >>713
その結果戦型が淘汰されていっている
澤田さん曰くゴキ中なんて勝率2割くらいらしい
後手番が選択できる戦型がイマイチわからなくなっていてきている状況 QQRの定跡8手くらいで切ったら技巧2相手に10-0だった
なんだかなあ 少し前まで、後手でもまだ指せるのが横歩で、
角換わりの後手番は全然ダメだったんだから、また変わるんじゃない? 将棋はお互いが最善を尽くせば千日手になる
少なくともどちらか一方が間違えると決着が着く しかしやねうら王のandroid対応エントリーに出ているNexus 6Pのベンチの数値低いな
スペック上から想定される値の半分くらいだ AVX2とかでうまく高速化してるのができないから思ったより低いのかな サーマルスロットリングですがな>Nexus6P
nnueを800MHzに制限したCotex-A53がuuunベンチ条件でメインスレッドが約24K
ARM系はだいたい熱のせいでまともなベンチ結果がでないようだが 結局スマホは限界まで使うと廃熱がどうしようもないか >>503、NPS低すぎない?
公式にあるAperyの30%ほどしか出ない
その分評価関数の精度がいいってこと? >>725
NNUEは低NPSで強いことに定評がある
高NPS代表のaperyとNNUEを比べてどうするんだ 非AVX2ですっとこどっこいに遅いのはsse2以下だと思うが
sse2なら多少は改善できる >>726
PC版は同じくらいのNPSじゃなかったっけか?
Android版はPCほど最適化出来なくて遅いのでは? うちのスマホでスレッド1だとNPS半分くらいだねNNUEは >>729
そんなにNPS出る?
PC版でもYO4.82の7割くらいかなって印象なんだけど 予算ごとに最強の構成教えてよ
∞
30万以下
20万以下
10万以下
suimon@floodgate_fan
将棋用途でパソコンの購入を考えている人には希望があれば私で良ければ相談には乗ります。
ただ、本気の本気の人のみでお願いします。
それ以外ならBTOで10万くらいで十分いいのが買えると思います。 >>733
∞ 富士通かNECかHPかIBMに依頼 真面目な話をするとCPUのマルチスレッド性能とRAMに予算内で全ツッパするだけじゃん パソコンに詳しいと自負しているのだろう
多分プロやアマ強豪から相談が来ると思っているのでは 当たらなければどうということはない みたいな将棋だと参考にしずらいし
自分なりの使い方を確立するまでは高額PCとかいらないような気がしないでもないが 自分で金と時間を投資するよりもC-bookをしっかり研究するほうがいいと思うけどなぁ
終盤検討はソフトが強すぎて、逆に人間にはあまり必要がないレベルだし NNUEの学習ってtest_cross_entropyのロスが下がらなかったら永遠に終わらない感じ? >>733
AWSかGCEを使えで結論出てるやろ・・・ 普段のちょっとした検討用途にすらAWSとかGCE使うとか流石に無いだろそれは ちょっとした検討ならスマホレベルで十分やろ
というか検討レベルの為に10万の無駄金出す意味がわからんけどな
デスクトップレベルの16vcpuなら1時間20円だけど5000時間も検討したらさぞ強くなるでしょうなぁ PC購入の適正レベル相談してる人にクラウド使えとか返すのは
知識あるだけの馬鹿だろ >>744
そもそもがバーチャル相談者やぞ
ていうか人間の検討レベルならマジで何でもいい
nnueさえ起動できりゃそれで人外レベルや
自称情弱ならPC買わずにパッケージ版のやねうら王買っとけ 現代では高いAndroidにしておけば間違いない
いいカメラも勝手についてくるから将棋用(笑)にパソコン買うより満足度高いだろw >>676
それは同一条件で複数回試行できない人間の話だろ。
一勝で何ポイント動かすかとか、
持ち時間やタイトル戦の重みづけとか。
コンピュータ将棋とはほぼ無関係。
相性問題の指摘でなければ。 千日手については、初期状態の先手の得を50〜100として、後手有利のー50〜-100としときゃ良いんじゃないの? >>746
androidは排熱が弱いから不可。
パッドを暖め過ぎるとリチウム電池が膨張爆発する。
電源容量に余裕持たせた水冷デスクトップが最強だろうな。
自作でメモリやチップセットにもヒートシンクつけて風当てた方がいいかも。
300Wのストーブやな。 >>749
それを気にするとやはりAWSかGCEだな
商用版やねうら王がクラウドに対応するらしいし、それのスマホ版が出れば素晴らしいのだけれど わざわざ将棋用にi9-7980XEとかでPC組んじゃう人っているんだろうか 千日手といえばハニワvsコブラの香車の打ち合いって囲碁の「コウダテ=コウ材、コウを解消」と同じだよな。
将棋である部分的な千日手がコウ材になるなんて見た記憶がないから驚いたわ。 >>749
8700kでocしてるけどVRM温度がヤバいし
NNUEは他と比べてCPU消費電力とCPU温度がヤバいので殻割りした方がいい >>753
Ryzenでも同じだわ
普段は何ともない軽めのOCなのにNNUEはかなり熱くなる、ついでにメモリも普段より熱い気がする NNUEはヤバイ
何がってクロック下がるくらいにヤバイ
温度70°にガンガン冷やしてもクロックダウンしてたわ
NPSが上がらないのもこのせかもしれん Nexus6Pのsnapdragon810って初期のbig.LITTLEだったっけ?
最高でもbig 4coreしか動かんのならスレッドあたり半分ということになる
サーマルスロットリング説は第二候補に格下げしよう 8bit乗算を並列にこなすSIMDをガンガン回すから動くトランジスタ数はそれなりに増える
GPUに比べればはなくそみたいなもんだが多少熱くなるのはしかたがない
8bit packed整数乗算じゃなくて浮動小数点演算ならもっときつくなるのに
NNUE程度でパフォーマンス維持できんのか 今時のCPUは
インチキ商品ばかり増えるな 最近は自作初心者が簡易水冷でCPUだけ冷やして満足するパターンが多いらしい。
NNUE使うときは、ケースのエアフローしっかりしないとヤバそう。 これから夏だしね。
1〜2畳くらいのマシンルーム用意して、エアコンかけないと。 >>754
nnue自体は軽いせいかDRAMの電圧はやねエンジンと比べると低め ベンチの数字で比較しての話だが
三駒に比べてnnueはマルチスレッドでnpsの落ち込みが若干少ない NNUEを真夏にガン回しして、
次の日にパソコンがただの箱と化してしまうパターンが続出するのか。
胸熱。 素人だけど、エアコン+PCの電気代とクラウド使って回すの、どっちが安上がりなんだろう? >>766
クラウドのほうが高いに決まってる
クラウドで得できるのはイニシャルコスト
ランニングコストは数倍高い Nexus 6P
Qualcomm Snapdragon 810
Cores 8
Process 20nm
big.LITTLE HMP (2 clusters)
4x ARM Cortex-A53 @ 1.96GHz
4x ARM Cortex-A57 @ 1.56GHz
Clock Speed 384MHz - 1.96GHz
GPU Qualcomm Adreno (TM) 430 >>768
awsが一時間50円として
エアコン,pcで1000W使うとして一時間27円
パフォーマンス能力でいうと
一般的なコンシューマ向けCPUの5倍以上はパフォーマンス出るから
コスパを含めたランニングコストではAWSのが上になるのでは? エアコンと合わせて1000Wも食うPCの5倍の性能のインスタンスが50円/hで買えんのか 壊れるリスク回避をどう考えるかだな
パソコン買うと地震雷火事suimonのリスクがある まぁなんにせよ開発者やプロ以外にハイスペック端末は無駄だよ
ツイッターや5chでドヤ顔したいバカ向けなんだろうな 後手の持駒:歩
9 8 7 6 5 4 3 2 1
+---------------------------+
| 馬v桂 ・ ・ ・ ・ ・v桂v玉|一
| ・ ・ ・ ・ ・ ・v金v金v香|二
|v歩 ・ ・ と ・v歩v角v銀 ・|三
| ・ ・v歩 ・v歩 ・v歩 ・v歩|四
| ・ ・ ・ ・ ・ ・ ・ 銀v金|五
| ・ ・ 歩 ・ 歩 ・ 歩 飛 ・|六
| 歩 ・ 桂 ・ ・ ・ ・ ・ 歩|七
| ・ ・ ・ ・ ・ ・ ・ 銀 香|八
|v龍 ・ ・ ・ ・ ・ 金 桂 玉|九
+---------------------------+
先手の持駒:銀 香二 歩五
渡辺対ボナンザ
渡辺は▲2七香だと負けを覚悟したというが、qqrが▲3七馬も候補に挙げてた
この手はどうなのだろう 渡辺対Bonanzaの棋譜を解析したら△1五金の時点で渡辺だいぶ有利なんだなw depth6の100億教師かdepth8の100億教師でNNUE学習させたときR50くらいの違いは出てくるのかな? uuun氏のツイッター記事に藤井聡太でも勝ち越せないApery_twig R3250がQQRに惨敗していた
「QQRの飛車落ち、今度はApery_twig(二年前のバージョン)と対局。52-18で勝ち越し。R3250は大きく凌駕している。
この時代(技巧もそうだけど)は飛車落ちに対して穴熊で対抗するのだけど、入玉して手数を伸ばしている間に穴熊を粉砕している。
yaselmoはApery_wcsc25と同じくらいだったので大きく伸びた」 昔話題になってたね
平手以外、自分がコマ落としても、相手がコマ落としても弱くなるっての 大平がGPS先生に平手で敵わないのに、駒を落とすと勝てるという話をしてたりね。 depth6と8って雲泥の差なんだな
depth6同士では7割勝ってた相手をdepth8にしたら逆に7割負けたわ 深さひとつでレーティングは200上がる
200差あると7割から7割5分だから、
3:7からひとつ上がると互角、もうひとつ上がると7:3でだいたい合ってる計算だな 深さひとつでそんなに変わるなら、もっと深く、例えば20ぐらいまで出来ないのかな。
勿論、100億なんて言うのは無理だから、頻出する局面だけに絞って。
(数万になるのか、数億になるのかはわからないけど。) あ、学習の深さじゃなくて指し将棋の深さだからそのまま適用出来るかは不明だが。
もしも同じ200差くらいなら恐ろしいことだな。
計算機資源次第でとんでもない強さになる…… 河童絞りが一応その発想に近いんじゃないかな
elmo絞りは出現回数が少ない局面があるとそこがノイズになるかもしれないから質がよくても1億とかの教師では厳しい気がする
数十億円使っていいならdepth20の200億教師で数回絞れば10年後くらいに到達するであろう強さになるかもね >>150
羽生さんがポナ常駐後初のニコ生解説?ポナの予想手を見たときの様子、
盲象に怖じずなのか、プライドなのかは分からないが、他の棋士とは違うリアクションだったのを思い出した 毎度毎度短時間計測ばかりでアレだが
ttp://qhapaq.hatenablog.com/entry/2017/02/28/210844
>点数の変化度はdepthではなくdepthのルートに比例する
という記事を発見したので
試しに実装してみた
https://i.imgur.com/8nnDJU5.jpg
https://1.bitsend.jp/download/e35d2853709008de5fe5eef1f126474e.html
実用性は薄いと思われるけど作ってしまったから一応投下 >>681
>先手番が千日手筋を失って一方的に負けると思うけど
なこたぁないだろう。
今は千日手評価値-1に設定してたら次善手が評価値-2でも千日手を優先するわけで
しかもその場合相手の千日手評価値が-1でも千日手になることはおそらく少ない
だから千日手を読むだけ無駄(もちろん終盤戦で千日手に逃れて0.5点取る可能性が
ないとは言わんが、頻度としては序盤千日手より稀だろう)と言ってる 3駒のdepthってDLでいえば局面履歴に相当するという認識でいいんだろうか。 >>793
depth8でちょっと試したらさすがに枝刈り超少ないからか1.73はKPPT-whale6対して勝率60%だったわ windowsでもwslのubuntu上でコンパイルしたらいいんじゃね
cpu性能ならwslでも変わらんよ >>799
3つある中だとどれが優秀なんでしょうか? >>801
自分は製作者じゃないので、わからないです >>801
対局時間によってどのくらいの枝狩りがいいのかはかなり変わるからなんとも uuunさんはNNUE-whaleはレート測定する気ないのかな?
それ系測り始めたらキリ無いか Godwhale5.0.5/QQR 4277 +13/-13 1046
YO4.82/QQR 4234 +17/-10 4733 やねうら王より強くできるのは凄いわ。
長時間だとaperyが強いんだっけ NNUE-whaleは長時間向きじゃないからuuunさんの所の対局条件では無理
しかしk_ohgaさんはすごいよな、Godwhaleもqzilla9も優秀 Godwhale のアンドロイド版、出ないかなあ。 >>806
1500万ノードぐらいで対戦させて棋譜を送れば載せてもらえるのでは
>>793
のClangがどの位のレートになるか興味がある
ところで>>793の数値をguiに登録するときに
設定するようには無理なんでしょうか? 上位ソフトからキメラと18号コマンドで+R20~30のは出来るからR4300到達だな 負けた理由を時間のせいにするな。
suimon@floodgate_fan
指してる時はあまり持ち時間は見ないのですが、最後見たら相手の方が全然時間を使っていないので愕然としました。
suimon@floodgate_fan
誰かこの方の連勝を止めてください…
将棋クエスト棋譜【2分】 (garnet_crow[2440] 対 luckydog[2693]) http://wars.fm/shogi2/game/os2jwuz4oen4 #将棋クエスト #ShogiQuest
https://i.imgur.com/KlNtviZ.jpg >>811
スレ違い、こっちに投稿した方がいいよ「suimonこいなぎstrategy研応援スレッド14」 投稿先間違えたんだろう、たまに違うちゃんねるに誤爆する人いるな Aperyからdepth8の50億程度であの強さだからNNUEがあっという間にR4400乗せてきて三駒最後の栄光はQQRのものになりそう >>804
測ってもらいたければ、まず改名が必要。
NNUE-whaleのKPPT版何て何て略すの?
このソフトは初見だと名前から中身を百パーセント誤解される。本スレの外で使われるためには改名が第一条件。 上で言われてるdepth8っていうのはdepthlimitのこと?bookdepthlimitのこと?どちらでもない?
素人な質問ですまん >>820
すげー、これで枝刈りの多さを調整できるから、検討用とか、教師局面作成用とか、自由に調整できるってことか! >>820
いい値を探すときにちょこちょこ値をいじりやすくてめっちゃ便利
depth8固定対局でYO4.82のdepth10に勝てるか頑張ってみるわ >>773
>>774
suimonさんのPCがいつ死亡するのか楽しみ スマホでNNUE評価関数のソフトを動かすとかバッテリーがバカになりそう。 スマホのバッテリーに関しては評価関数の差なんて無いようなもの
スレッド数は1、ノード数は500万やら1000万程度でザックリ参考にするだけ。な事が何よりも大事よ suimonさんのパソコンの知識が楽しみ
suimon@floodgate_fan
将棋のフリーソフトって、普通のノートパソコンで動かすと少し怖いところがありますよね…
私も以前はノートで使っていたのですが、熱と音が大きくてずっとは使用できませんでした。
午前10:02 · 2018年5月26日 何も考えずにNPSを高くするためにCPUをフル稼働させてれば当然なのだけれど、冷却性能と発熱量のバランスを考慮できるかどうか 稼働スレッド数落とすとか色々やりようがあると思うのだけど SDTやWCSCがきっかけでスカウトされる人が多くなっていていいことだな >>820
結局depthが浅い対局ではFUTILITY_RETURN_DEPTHを0にするのが一番強いね 探索に進行度を使うのは読み太がやってたけど、結局やねうら王より強くならなかったんだっけ 千田が飛車落ちQQRと指してみたいと言ってるね結果が楽しみ >>833
depth固定なら枝刈りしない方が強いというだけの話だぞ >>836
そうそう、そういうこと
どうしても必要な手を枝刈りしちゃうってことだよね 枝刈りは同じ時間でもっと先まで読むという技術なのだから
depth固定ではなくて時間固定にしないとフェアではないでしょう 局面によって枝刈りの深さを変えたら強くなるんじゃないかって話じゃないの? >>838
それはわかってるよ
必要な手を捨てるデメリットと効率よく深くまで読めるようになるメリットを天秤にかけていい感じのとこを探ってるわけだからね
教師を作るうえではdepth固定で作るから浅い同depthでの結果が知りたかった
しっかり枝刈りwhale6
あんまり枝刈りしない設定のadjustable
この二つで2倍くらい同じdepth8まで読む時間が違うのに勝率は60%しかないんだよね
枝刈りを少なくして教師作るべきだと思うけど探索に時間かかりすぎて結局がっつり枝刈りして少し深く読むのそれほど変わらないからどうなんだろう fgからも強いソフトは姿を消し、
電王トーナメントも今年は開催されるか分からず。
兵どもが夢の跡。 以下@とAとBを戦わせるとどの程度の実力差なのでしょうか?
誰か計測された方はいらっしゃいますでしょうか?
@
探索:NNUE-whale (NNUE版)
評価:nn (T.N.K付属)
A
探索:NNUE-whale (KPPT版)
評価:QQR
B
探索:GodWhale5.0.5
評価:QQR >>841
なぜhavenは消えたのでしょうね?
一体何者だったのでしょうか?
AWSで動かしただけのQQRという可能性は無いのでしょうか? >>842
雑に言うと、@=A<B
@とBは@の勝率40%くらいかな >>845
ありがとうございます
大賀さん凄いんですね >>842
@ <A=Bだろう AとBはどちらもやねうら王の亜流で同一evalで対戦させたら
ほとんど差が感じられない >>847
超短時間対局?
一手1500万ノードくらいだとGodWhaleが強くない? Godwhale5.0.5/QQR 4286
YO4.82/aperypaq 4187
いつの間にかaperypaqよりR+100になっていた ログを見るたび思うのだが
レーティングがまだ出てないプレイヤーの推定がぶっ壊れてるんじゃね>floodgate
レーティング分布をある分散の正規分布と仮定してCAPしてしまえば
0敗プレイヤー0勝プレイヤーでもかなり大雑把だが数字は出せる
勝ちっぱなしはとんでもなくデカく負けっぱなしはドベになるから今みたいなことはなくなると思うのだが お前ら何のためにシコシコ勤しんでコンピュータ将棋とかやってるんや
コンピュータ将棋大会()で優勝したところで何になるんや?
新しい技術が生まれるわけでもノーベル賞もらえるわけでもないしな
どうせ他人のソースパクって少し弄るだけの趣味やろ?
そんなんで大先生気取ってるのは恥ずかしいんやないか >>852
大先生云々以外は概ね同意するわ、無駄に時間と電気使ってるけどまあしゃあない >>852
おいおいプロゲーマーの悪口は辞めろってw おうふっ...別に煽ったつもりはないんやが核心突いてしまってすまんな
なんで一般ピーポーからも研究者、技術者からも尊敬されないことに人生削ってるんやろって疑問に思っただけや
俺バカやから何のためにやってるのか説明できる人おるなら教えてや
ただ同じことを母親の前で胸を張って言えるかは別やけどな 引退した若干一名の人以外は趣味でやってるからプロゲーマーじゃないぞ プログラマーの場合、プログラミング自体が本業だから、
本業のためのスキルアップにはなるよ。 >>858
すまん、プログラマーって親に言える仕事なんか?
IT土方がポジってて草 多くの人はそもそも趣味だから生産性は求めてない。やねは「罰ゲーム」と言っている。
全ての行動に生産性を求めるなら、わざわざコンピュータ将棋のスレッドにきて煽ろうとするその行動はどうなんだ?
何のためにここに書き込んでるのか説明できるのか?
同じことを母親の前で胸を張って言えるのか? プログラマーはクソみたいなゴミ
俺はSIerだけど >>861
どっちかっていうとSIerの方が新しく何かを作り出すことが無いだけゴミじゃね プログラマが趣味で作ったソフトがトップ棋士を遥かに凌駕する強さになったんだから
凄いことじゃないかな >>862
プログラマーなんて切った貼ったするだけじゃねーか >>852
こいつみたいな何のとりえもない批判するだけの野次馬が定期的に現れるな 勢いでこんなの作った
https://i.imgur.com/FbpiAy9.jpg
内部の探索パラメータを全てGUI上で変更可能にしたNNUE-whale6
探索部のバージョン切り替え機能も付けて
NNUE-whale6、NNUE-whale3、YaneuraOu4.82(NNUE-v1.0)相当の探索部に
それぞれGUI上の数字一つで切り替られるようにしてある
おまけでGodwhaleが意図せず無効化していたRazoringもGUI上で有効無効の切り替えを可能にして
その影響を手軽に検証できるようにしておいた
>>793の機能も当然、オンオフの切り替えと数字の変更含めてオプション化対応済み
需要不明だけど
とりあえずavx2のTNK,KPPTと
armのTNK,KPP_KKPTの4ファイルをコンパイルしたので投下
https://1.bitsend.jp/download/34dedac6872294b5dffc7c6ab3c18076.html 研究者、技術者から尊敬されないってのは明らかに嘘だな
様々な研究分野、技術分野があるが、そのなかで少なくとも平均的なレベル程度には尊敬されている >>867
で、理論的に何か新しい発見をして論文書いたりした?
自分が恥ずかしい生き方してるって自覚あるか?
蛆虫みたいな奴らだな 将棋ソフトの開発者は自分の趣味で好きで開発しているので、他人がどうだこうだ言ったところで何の影響も受けないない >>866
君、さっそく大先生ぶってるけどその講釈がいくらお金になるの?
可哀想な子やね >>869
と、わざわざレスするのは効いてる証拠
その趣味ってのは他人が書いたソースを切り貼りするだけだよね?
もしかして自分がやってることが賢いとか思っちゃってる?
そんなこと誰でも出来るんだよ >>866
極端だなw
色々めちゃくちゃ細かく検証することがあれば便利……かも?
NPSはほとんど低下しない感じ? >>868
>自分が恥ずかしい生き方してるって自覚あるか?
>蛆虫みたいな奴らだな
こいつが今書き込みしている低能な自分にピッタリ当てはまることを他人に言っているので笑える 検討にソフトをよく使うので開発者にはとても感謝している
公開はしなかったけど数年引っ張ってきたボス役ポジションの山本さんにも感謝している >>874
>顔真っ赤だね
>図星突かれたのかな
このアホはプロ棋士志望か、あるいは藤井聡太オタクでプロよりはるかに強いソフトの存在を鬱陶しく思っている奴かも 俺はただの理系博士課程後期の院生やけどな
お前らのお遊びがあまりにもお粗末やからなんのためにやってるん?って聞いただけや
やっぱり高卒のプログラマーが趣味でやってるんか?
それなら分かるけどw >>876
趣味で作られたソフトを普通のPC1台に入れたらもう棋士は手も足も出ない
プロ棋士の信者にとってはさぞ屈辱だろうな >>868
情報処理学会とかに普通に論文出てるでしょ…
専門の研究会やワークショップもあるし >>877
>俺はただの理系博士課程後期の院生やけどな
こいつ理系博士課程後期の院生っていっておるが、東大出身のポナ山さんやカパックさんよりレベル低い(笑い) >>872
やはり1%〜2%程度は低下していますね
尖った用途に使わないなら
普通のバージョンの方がいいと思います 俺は趣味だろうと創造性も生産性もない奴は見下すよ
別に社会に貢献しろと言ってるわけではないが、この趣味がキャリアに役立つのは磯崎元洋さんや保木邦仁先生みたいな黎明期に尽力した第一人者だけ
その他の99%の残りカスは自分のキャリアに利するわけでもなく、何か新しい発見をするわけでもなく、社会に貢献するわけでもなく、親孝行するわけでもなく、時間を無駄にしてるうんこ製造機やろがい
お前ら同業者にも見下されてるっていい加減気づけや
もし第二の保木、磯崎になりたいならCiNiiに上がってる論文くらいまともに読め
素養も教養もないくせに他人の書いたコードに食いついて人生浪費してるのが見苦しいって言ってんだよバア >>879
で、それはお前が書いたん?
書いたとしてどれくらい引用されたん?
このスレを読む限り論文にできるような知性を持った人間がいるとは思えないが 論文リジェクトされた博士号もらえない人が荒らしにくるようなスレッドなんだな、ここは。 >>882
>素養も教養もないくせに他人の書いたコードに食いついて人生浪費してるのが見苦しいって言ってんだよバア
こいつ東大も入れなかった、ただの院生のくせに、東大出身者が多数いる開発者を馬鹿にしていて笑える >>877
院生ってだけでは、あなたがどれだけすごいのかわからないなあ。
そんな返答しかできないのはお粗末だけど。
博士号をとれずにあせってるのかw >素養も教養もないくせに
おうふっ...別に煽ったつもりはないんやが核心突いてしまってすまんな
IT土方がポジってて草
蛆虫みたいな奴らだな
時間を無駄にしてるうんこ製造機やろがい >>866
専門的な設定変更もいいと思いますが私の様な初心者には
役に立ちません 技巧2のDepthLimitの様なレベル変更ができる
項目を追加してもらえたら助かります >>881
まあある程度いい値見つけたらそれで普通にビルドしたらいいんだし関係ないか
時間あるときにdepth8か10で教師作るのに最適な数値でも探るのに使わせてもらうわ 若い力をこんなスレッド荒らすことに使わずに、リジェクトされた論文を書き直すことに労力を使ったほうがいいんじゃなかろうか。
わざわざこのスレッドで荒らしてるってことは、コンピュータ将棋ですでに先行研究があるとかでリジェクトされたのか? >>889
いや、やねうら王自体に既に実装されているやろ バト将棋ってアプリがあって、中身は技巧なんだけど、勝てば3級程度らしい
どういうことだ?depth1とかなのか? 休学して一年間休んだ学生開発者にもWCSCきっかけでスカウトが来たのに何を言ってるのか ポナ山のツィートはそこそこ面白いが、
端々に道徳的感性の無さ(若さでもある)が透けて見えて、
ちとげんなりするな。 ちなみにやねさんは、プログラミングは本業ではなく、
コンサル業で年収ウン千万だそうで、コンピュータ将棋は完全に罰ゲームだろう >>896
HEROZ所属だからといってポナ山さんにヒーロー的な人格を求めるのは酷なんじゃなかろうか。
何かの能力が秀でてる人は、別なところは常人以下と相場が決まってる。
人間らしくていいじゃないか。 あれ面白いの?
将棋ソフトは書いたことないけど現役プログラマーからみて
つまんらんことばかり書いてるからTwitterや他の記事も読まなくなった。 趣味って、基本的に創造性も生産性もなくね?
むしろ、非生産的だからこそ、趣味なのさ。
生産的だったら、それは趣味ではなく、仕事だ。 趣味に必要なのは愛だよ。愛さえあれば何もいらない。 >>894
試してもらったらわかると思いますが やねうら王のDepthLimitは形だけで
レベル設定はできません >>902
NodesLimitでいくらでも強さを加減できる、100位から任意で入力すれば初心者でも勝てるが >>900
不毛だろうが他人からどう見えようが
楽しくて魂が震えれば、それ自体が報酬。
しかし、ライフハッカーや実用主義者には理解されないね。 >>902
俺の環境では、DepthLimitちゃんと動作してるけど?
そっちは何をもってDepthLimitが効かないと判断してるの? 古いYaneuraOuは探索部は対応してあってオプション設定だけ実装されてなかった
低nodeだと極端によわくなる(技巧と比較するとなりすぎるとすらいえる)ので
削除したのかなとか思ったりしたが NNUEすごいな、RAM512MBの古いスマホでも動いた
もし動くならスマートウォッチ買って動かしてみたい >>852
将棋ソフトをフルスクラッチしたり既存のライブラリを読み取ってそのコードを改善する力は
プログラム開発力に繋がると思うのだけどね。
なお、既存のライブラリほぼそのままの形で流用して大会出てるような輩についてはもはや何とも言えないが^^; なんらかの知見があればそのまま流用でも別に構わんよ
流用したか、フルスクラッチかが重要なんじゃなくて知見の有無が重要なんだから 自由に配布出来るもっともマシな駒の画像って何?
ShogiGUIが使ってるやつしかない? >>912
マイボナか
しんえれ外部駒(形式違うため加工必要) スマホで名人戦の盤面を撮影すると、名人より飛車一枚強い棋力で検討した差し手が表示されるようになると困る
プロ厨は開発を阻害することしかやることがなくなった
プロ厨を駆逐するには、早期に強力なスマホアプリを開発する必要がある
852名無し名人 (スフッ Sd33-SrJ/)2018/05/26(土) 20:08:42.51ID:vY9KgzW7d>>853>>854>>855>>865>>910
お前ら何のためにシコシコ勤しんでコンピュータ将棋とかやってるんや
コンピュータ将棋大会()で優勝したところで何になるんや?
新しい技術が生まれるわけでもノーベル賞もらえるわけでもないしな
どうせ他人のソースパクって少し弄るだけの趣味やろ?
そんなんで大先生気取ってるのは恥ずかしいんやないか 上の方にあった改造したクジラ
1.7320508のバージョンが8スレ3秒でオリジナルに勝ちまくってる
まだ対局数は少ないけど長時間でも強いかもしれない NNUEの学習がKPPTより16倍くらい遅いらしい、もしかして学習だけで1ヶ月くらいかかる……? どれ? 派生が多すぎてどれか分かんない。
自分も検証してみます。 >>905
単に弱くなればいいというものではない 細かく強弱の設定ができなければ
実用的でないと思います >>916
これは本当。自分も学習させてみたけど、100万局面を学習するのに2分くらいかかる(i9-7960X)。10億局面学習するだけで1日以上かかるんだよなあ ちなみにバッチサイズを大きくすると学習時間も極めて増加する。4000万局面を一度に学習させてみたら、10時間くらいかかった >>920
BLAS使わないで試したとき1万sfen/秒くらいしか速度出なかったから設定が何かおかしいのかと思ってたわ
シングルのスコアがいいPCの方が早そうなのかな >>914
>スマホで名人戦の盤面を撮影すると、名人より飛車一枚強い棋力で検討した差し手が表示されるようになると困る
困らないと思うが。 >>912
suimonに聞けば著作権違反の疑いのあるNHK杯仕様の初代光匠を使えるよ
あれはかっこいい KPPTは今までのDepth10学習以上だと時間や経費で困難なのでQQRが限界付近なのかな、
開発者や有志がほとんどNNUEの教師学習しているのを見るとそう思ってしまうんだが 色々設定できるみたいだが、素人にはよーわからん
皆がdepthって言ってるのはどのdepthのことなんだろう?
なんちゃらdepthって項目がいくつかあるけど NNUEの学習はsse4.2でも 40〜50秒/1M局面 だね(i7-3770)
おんぼろPCに任せておけばいいのかも 素人なら手を出さなくてええやん
探索パラメータの調整とかマニアックすぎるべ 高卒プログラマーが大先生になれるんだからいいスレだよなw >>932
そうだぞ、ここは大先生しかいないスレだから
お前みたいな凡人が来るところではない プログラマとして大成するかどうかは
頭の柔らかい若いうちにどれだけたくさんの良質のコードを読むかだな
高校生がやねうら王のコードを苦労して読んで理解したらきっと将来いいコードが書ける >>935
できるとは思うが、20代までに覚えるのよりか数十倍の労力と時間がかかるだろうね。
なので普通はやらない。 学習が遅いのはちょっとした不具合があったからか
>ynasu @ynasu87
>何が起きているのか分かりました。やねうら王の学習で omp_set_num_threads() しているのが main thread だけで、 worker threads に反映されていないようです。後で pull request しておきます。 >>937
メインスレッド以外以上に遅いのは仕様じゃなかったのか、これで学習早くなれば実用性UPだな >>935
別に無理じゃ無いよ。
ただ若いときより飽きが早かったり、まとまった時間が無いのが辛かったりするけど。
いきなり難しいことをせず、薄くて簡単な本から繰り返しするのがお勧め 定期的にこのスレにはプログラマーを底辺職のように言う輩が出没するが、実際のところどうなんだろうな。
やねさんとか、プログラマーをやめて高額所得があるわけで、プログラマーのことをどう思っているのか非常に興味ある。 ホリエモンの言語録を見てたら元PGが現PGをどのように見てるかだいたい想像つくでしょ ttps://github.com/tttak/tnk-/releases
あっさり追加学習に成功してるね、意外といける? >>941
ライブドアはエンジニアには金をきちんと払わなきゃ駄目だと
理解していた会社だったぞ。凄い人もいたし。 >100万局面を学習するのに2分くらいかかる(i9-7960X)。
ARMで試したときの感触だと一スレ分しか動いてない感じのような数字だったが
やはりバグがあったのか >>942
面白いね
振り飛車と居飛車、はたして正解はどちらか >>942
手元で定跡オフにして昨日から計測してみたところ
勝率52%ほどで元のnn.binに勝ち越してる
学習高速化バージョンが出てきて100億局面の学習が完了したらqqr超えるかもね >>947
QQR超えるなんてもんじゃ無いと思う
50億作製→学習を二回やればR200近く上がると思うわ それはどうだろうかな
3駒だってパラメーターが足りないんじゃなくて、適切に配置できてないからであって表現力が優れているからといって学習すればするほど、という風にはならないのでは ttps://github.com/yaneurao/YaneuraOu/commit/e0548ec026e3bad17cbf0011e003c32f0c1a3deb
この更新を取り込んだ高速なバイナリをビルドした方いませんか?
自分でやるとどうしてもNPSが低下してしまうので、もしいれば上げてもらえないでしょうか tttakさんのNNUEでQQR+godwhaleに勝率49%だってさ
探索をnnue whale3に変えるとQQR越えるかな QQR1位維持続いてますね
オーガさん優秀でしたね
無理やり振り飛車の必要性あるのかと思いますが、ソフトの間違いで振り飛車優秀かは
知りたいところでもあります Qhapaqチームのメインの人 東大物理博士
tanukiチームのメインの人 元Google社員
Ponanzaチームのすごい方の人 日立社員
elmo NTT社員
大企業社員と超天才が集まっている将棋ソフト開発者を敬え >>951
QQRは対抗系が苦手って書き込みあったから(>>687-690)
相性の可能性も? 少しいじればあとから出たソフトのが強いので
レーティングサイトで1位なりたかったら発表すればいいです
むなしいことですが Makefileから学習用のバイナリを作るときにOpenMPを有効に出来ません
Msys2/clangでは難しいらしいのでMsys2/gccを使っています
やり方教えてくれる方がいらっしゃれば教えて頂きたいです >>954
rotaさんが計測したQQR+godwhaleに勝率49%のものは
NNUEの振り飛車評価関数ではなくtttakさんのgitのページの下にあるTNKに追加学習させた方だと思うよ >>957
本当ですね!!!!!
みんな!!!>>954は間違いだ!信じるな! >>943
あの社内宴会の様子はとても学生ノリな会社だったな。
まぁ案の定その後ライブドアバブルは崩壊した訳だが^-^; >>953
瀧澤氏はKDDIだろっていうかワザと間違えてる? tttakさんのNNUE評価関数 振り飛車1をwhale6を使用して
QQR+godwhaleと1手10秒no bookで12戦させました
内訳11戦振り飛車戦 whale6から見て4-2-6 長時間の検証は棋譜もくれると嬉しい
観賞用的な意味で >>961
振り飛車を指すように作成した評価関数は同数の教師から学習させたら居飛車より大なり小なり弱いものしか出来ないので
ガチで一番強いのを作るっていうより振り飛車の棋風を楽しむっていう使い道になる、結局ガチで一番強いのを作りたいなら居飛車になる >>961
たった12戦して何を知りたかったの?(笑) >>964
ありがとうございます!
learnコマンド打ってみたらきちんとOpenMP有効になってました
どんな環境でビルドしたか教えて貰えないでしょうか nnue whaleシリーズは対QQRとwhale同士の自己対戦をやる限りwhale3が一番強かった。
他はどれも一手3秒6スレッド300戦でQQRに勝率40%くらい。
もっとハイスペックな環境だとwhale6が強かったりするのか? >>968
その逆でもっと短時間にすると6が強い
短時間の強さは教師局面の質にも影響するだろうから悩ましいところ というか3駒がサチってるのって
肝心のdepth8での強さが変わってないからじゃないか?
手元で実験してみたらdepth8固定だとqzillaとqqrは99-4-97で200戦しても有意差なし
長時間のレーティング上がっていても教師局面を作る上での強さは全く上がってなさそう NNUEて2駒だし、まだまだ3駒関係自体は終わってないのでは? depth増やしたら強くなるかもってここでよく言われてるが、
Aperyが教師をdepth8からdepth10にして強くならなかったんだから、単純にdepth深くするだけでは強くならないって考えるのが普通じゃないの? floodgateにちょくちょく出てきていたfuribisha-evalみたいなやつ、
定跡を使わず振り飛車を指し、かつ強いからどうやって作ってるんだろうってずっと思っていたけど、
tttak氏作成の関数だったと考えるのが自然かな >>971
入力をKPでやってるだけで、NNなんだから各KP間の相互作用まで計算してるんじゃないの? 通常三駒といったら入力が三駒特徴の単層パーセプトロンだろう
終わりというよりそれでここまでこれたほうがむしろすごい感じがするが >>972
3駒で最強の評価関数があったとして(暫定最強とかではなくある対局条件での真の最強関数)
ランダムに局面を生成してその最強関数で0手読みの評価値で学習させると
誤差は全くなくなってその最強関数と同じ最強関数ができる
けど学習させる値として最強関数で何手か先読みした評価値を与えると
誤差を一定以上減らすことが出来ずに学習は終わって出来上がった評価関数も最強のものではなくなる
究極的にはこういう状況にもなるわけだしね 単層パーセプトロンをつきつめると単純にテーブルルックアップになる
理屈のうえでは完全関数を記述できるが汎化能力は0
単層には未来はない 四駒ですでにままならない
多層化すると三駒でも多すぎるだろう
したがって三駒は終了というのは概ね間違っていないと思うなあ >>977
単層だと汎化能力がなくて、多層だと汎化能力が出るの? QQR+godwhale対NNUE WHALE3(tttakさん版) 6スレッド1手3秒
今150戦くらいまでやってQQRの勝率54%くらい ぶっちゃけ、将棋は、読みの深ささえ優越できているなら駒の損得だけで
強いAIができる気がする。もちろん玉の評価が実質∞としたうえでね。
評価関数に求められているのは、オーダリングと枝刈だと思う。 >将棋は、読みの深ささえ優越できているなら駒の損得だけで強いAIができる気がする。
森下九段をコンピュータにマインドアップロードするんですね わかります
肝心なときには負ける未来しかみえないけど NNUEがPCへの負担が大きい理由を教えていただけませんか uuunさんのレーティング表で最初レートがQQRクジラとほとんど差がなかったTNK-NNUE (tttakさん版)も
複数のソフトと対局したらレートが大分下がったね、評価関数には相性問題があるのであたりまえだが ハニワさんの検証でQQRをハニーワッフルの探索に載せると変な将棋を指すってあるけど
QQRの振り飛車評価が狂ってる可能性は少なからずありそうね >>982
三駒はメモリ負荷が高いのに比べて、kp多層パーセプトロンはメモリ負可に比べて計算負荷が高いから そんなお前らにいいスレ
趣味:プログラミングってコスパ良すぎワロタ 転職し放題、アプリ開発で一攫千金狙える、金かからない むしろやってない奴ってなんなの? [428366989]
https://leia.5ch.net/test/read.cgi/poverty/1527392015/ >>946 昨日のこの棋譜見当たらないから詰みを逃して逆転した棋譜をすべて拾ってるわけではないのか。。
http://b.kifupedia.org/20180528.html ああ
>難易度が比較的高そうな即詰みが生じている局面を選びました。
ってあるからこの詰みは難易度が高くないからスルーされたってことか >>989
このブログがどういう層に需要があるのかよくわからないんだよな
世の中変態マニアがいるんだなあ 詰みを全部調べてるなら上位ソフトで負けた方が詰みを逃していた棋譜も載せてくれたらいいのに。
たまたま見てた棋譜で見つかったってことは結構トン死筋を両者見落としているとかあるのかもしれない 天才と池沼は紙一重みたいなところがあるな
薬と毒みたいなもんだ あかん!悪口書いたらやねさんにゲンコツされてまう! このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 12日 23時間 59分 46秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。