▲コンピュータ将棋スレッド136
■ このスレッドは過去ログ倉庫に格納されています
PALの作者がチクチクとポナ山いじってるのは好意が嫌悪かどっちだろ m5.24xlarge YaneuraOu 2018 Otafuku KPPT 4.82 64AVX2 TOURNAMENT qzilla9 bench 4096 96 19 # ハッシュ4096なのは96threadsだとハッシュがすぐに埋まるため =========================== Total time (ms) : 23154 Nodes searched : 1248471943 Nodes/second : 53920356 Nodes searched(main thread) : 13546466 Nodes/second (main thread) : 585059 1threads =========================== Total time (ms) : 12485 Nodes searched : 11984975 Nodes/second : 959949 100スレッドクラスだとuuunベンチ設定の128MBだと10%ぐらい遅くなる >>597 仮にも「学会」とついてる所で出すものかは疑問符がつくな 商品開発とかエンターテイメントとしては正しいと思うんだ (要はパッケージングだけするSIみたいなもんでしょあれ) だから電王トーナメントとかなら俺も賛同してたと思うわ >>517 ,619 あれやらないと、コンピュータの穴だらけの序盤がプロにも伝播しちゃう恐れがあっただろ だから選手権だろうが電王トナメだろうが、あれでいいんだよ いや伝播したらそらマズいやろ やっぱりしちゃうのかw 不屈の棋士で西尾だったか千田だったかが 「ソフトの示した序盤の穴を検証せずに採用してハマる人もいる」 みたいな話ししてなかった? スペック低いPCでサクサク検討してたりしたら序盤なんかたくさんまずい変化ありそうな気はするな >>626 プロの使ってるPCスペックも手法もソフト開発者のそれに全然及ばないのでは? >>626 その統計データの根拠ってどこにあるの?プロ棋士の価値を高るための宣伝にしか思えないが クジラ9などからR1400程度も弱いプロ棋士の序盤は明らかに弱い R1400差ってトッププロと奨励会6級よりも大きな差だからな >>627 の根拠もないからソフト開発者の価値を高めるための宣伝に思えてしまう ここまで実力差があると序盤とか終盤とか関係なく圧倒的にソフトが上だろ 勝てないのにプロの序盤研究云々とかまったくワロえんよ 去年の天彦の無様さ加減にはほとほと呆れ返ったわ そんな中西尾はさすが 西尾明 @nishio1979 以前は定跡はどちらかといえば棋士中心のコンソーシアム型ブロックチェーンでしたが、 現在はコンピュータ将棋の台頭もあり、 バリデーターが不特定多数のパブリック型に変化しつつある気がします。 >>624 追加した定跡でタヌキにやられちゃったのか。。 - 二次予選で Hefeweizen 相手に 80 手近くまで一方的に定跡で指されて非常に苦しかったので、 決勝では、一次、二次予選で elmo, the end of genesis T.N.K.evolution turbo type D, Hefeweizen が勝った時の手を全て登録するという安直な定跡を追加し、2戦目から使用しました。 (初戦の名人コブラ戦には定跡作成が間に合いませんでした。) https://www.apply.computer-shogi.org/wcsc28/appeal/Apery/appeal_wcsc28.txt ドクター・ゲロのTweetが面白かった ----------------------------- 深いdepthで生成した教師局面でelmo絞りすると、短時間対局だと その力を発揮しないのはずっと言われて来た。elmo絞りは先の方まで 考えて指した手の勝敗を手前のほうの手にまで反映させていくから、 本来なら短時間しか読まなくても深い手を指せるので強いはず。 でも、以前のそんなに深くない教師で学習させて作られた評価関数にコロッと負ける。なんでか? 深い教師のほう(Aとしよう)は、近くでは一旦悪くなっても、 その先で良くなる手があるとプラスの評価になるため、短時間でもその手を指す。 で、浅い教師のほう(Bとしよう)は、その手は悪い手と認識して、これ幸いとその筋に飛び込む。 Bの指し手がAのPonderの第一候補ならその先まで読めているので無事にその筋に誘導できるのだが、 Bの手が次善手だったりすると、またそこから考えはじめ、狙った筋とは違う筋に入ってしまうことがある。 違う筋だと逆転する筋が見つからなくて、そこで大反省してしまうことが往々にしてあるのだ。 Hefeweizenの評価関数はこのことを逆用し、学習時に最善だと習った手を次善手に格下げして、 そんなに評価値の変わらない次善手を最善として指させるようにした。 こちらはMulti Ponderで、どんな手が飛んできても先までお見通しの状態で待ち受けているので、 大抵の変化にも問題なく対応できるため、相手のPonderを外しながらどんどん悪い筋に誘導していくことができるのだ。 depth12で学習させた評価関数が異常に弱くなったので、その原因を分析している時にこの手法を思いつき、 18号の新コマンドでチョチョイといじったら、狙い通りの手を指してくれるようになった。 HefeweizenはMulti Ponderと最善手外しの複合技で戦っていたというお話でした。 勝てそうな筋に入ったはずなのに途中で道を間違えてるって感じなのかな PonderはもうMulti Ponder 2くらいをデフォルトにしてもいいのではって思うけどやねうら王ではやらないのかな 評価はあってるけど有利なほうが間違えた場合と 実は評価が間違っていて不利と思われていたほうが好手(新手)を出してる場合 の区別をつけないとまずい。 クジラちゃんとかあれだけの計算資源集めてるんだからMV=5とかで 実戦やってもいいんじゃねーのと思う >>636 AlphaZeroみたいに探索後のルートの全ての手を学習できれば、そんな無駄なことしなくて済むんだけどな 最善手しか学習させないから効率が悪い Alpha Zeroの中身知らんけど、Alpha碁と変わらんのなら、彼らの持っている評価値は 勝率に準じたもので、歩1個100点とかの評価値とは根本的に違う事柄を表現している と思うんだけどね。 つか、探索後のルート全ての手を学習するって、もっともらしい書き方しているみたい だけど、具体的に何をどうするのか、まったく想像できない件。 まあ序盤だけ上手くても負けたら意味ないわな てんてーのことかーーーー!! >>636 小狡いなあ。 最善でなくて勝てばいいのか? まあそうか。 >>636 次善手を使って悪い筋に誘うっていう部分は眉唾物だなあ。 基本的にはMulti PonderとPonder外しによる時間責めっていうのが白ビールの戦略だと思う >>602 sfen文字列って局面だけじゃなくて 初手からの指し手が入ってなかったっけ? 定跡合流を許すように やね定跡に局面ハッシュ入れるように提案したが rejectされた覚えが。 ゲロの改善プロセス面白い いつかは超強い人造棋士パーフェクトセルを作ってくることを期待する >>633 人間は相互にミスするので、 最後に悪手を指した方が負けるゲームになっているが、 将棋は本質的に、先に悪手を指した方が不利が拡大して負けるゲーム。 プロがコンピューターに勝てないのは、 地上75mの鉄骨を渡り切らんだけ。 プロ棋士は、部分的にはコンピューターより深く研究することは可能。 コンピュータを活用すれば尚更。 研究は鉄骨渡りじゃない、道路の白線を歩くだけの話。足がはみ出たら戻すだけ。 50手以上先の不利な駒の位置を遡ってフィードバックできる。 >>646 定跡ファイルはテキストだから見ればわかるけど 初期局面からの指し手ではない >>636 >そんなに評価値の変わらない次善手を最善として指させるようにした。 これを機械的にやれば定跡の多様性も自然と確保できそう 同じくらいの評価値なら次善手を指す作戦や時間攻めルーチンは既に去年のハニーワッフルがやってましたね。 >>642 方策の学習 to maximise the similarity of the neural network move probabilities p to the search probabilities π 論文読めば? The vector of move probabilities p represents the probability of selecting each move (including pass), pa = P r(a|s). >>653 トン >to maximise the similarity of the neural network move probabilities p to the search probabilities π で検索しても論文出てこないというか、出てくるのはAlpha Goの論文だけなんだけど。 あれのpの話なら、既に別ゲームで導入している。強化学習の部分にしても、別に全 分岐を学習させているわけではない事もわかっている。 そのうえで、何が言いたいのかわからんかった。 評価値80と100だと、先に進めば80の方が良くなるというのは、 まだまだ珍しくないもんな。 逆に言うと、将棋の序盤はまだ全然広いってことだな。 AlphaGoZeroの論文には載ってるけど、AlphaGoの論文には載ってないし AlphaZeroにはほぼ同じ文が載ってる 白ビールが優勝したから白ビールの仮説がすべて正しかった というわけでもあるまい 芝とゲロとまふ勘違いガイジ三人衆で草 特にまふとゲロ 我が事のように手柄をアピールして恥ずかしいを超えて寒い パクリで手柄横取りした気分になってる知的障碍者は消えろ ネット対戦でドロイド使って勝ちまくるのがストレス解消。中、終盤は圧倒的で人間の限界より、コンピュータの進歩を実感した。 >>648 今はもうアドバンスト将棋してもプロ棋士とソフトのタッグよりソフト単体のほうが強いんじゃないかね 秒読みのカウントを読み上げてくれるのって激指だけ? 将棋所でもできる? やねさんが出す商用版のGUIがどんな感じになるか楽しみ、GUIがいい感じだったら買う 藤井6段も使ってくれるようなGUIになって欲しいな プロ棋士には全員に配布するかもってえび放送で言ってたよ 多くの棋士が同じ評価関数で研究するかもしれないと思うとそれはなんか嫌だな >>636 よくわからんけど過学習を避ける効果が出てるんじゃないの エロゲー経験が生かせますね ttps://erogamescape.dyndns.org/~ap2/ero/toukei_kaiseki/creater.php?creater=30145#creater_infomation 結局、狭く深く読むのは必ずしも良いことではないんだよな。 深く読んでも間違ってることはあるし。 やっぱ、最近のソフトは枝刈りし過ぎなのでは。 やねさんエロゲに携わってたんですか。。じゃあ、クジラちゃんのUIとコラボして、ソフト名もクジラックス。 このセリフも必須。 / ̄ ̄ ̄\ /::::::::: / :/:::/::::|::::::jハ:::ヽ丶::\ l 通 ふ |l:::::::::: |::/:::/::::/|::::/u |:::::j :|::::::::\ | る っ く ||:::::::::/|::l::::| ://l::/ |:::/l::|::::j::|⌒ ___ | ん..て し || ::: 彡|::?W|/ー-孑' `ト/--|/リ::| / \ |.で の. |∨ ::: {|::| .xテi尓 fテ尓∨::j / 20 | l す 大│∨´八:|.{{弋灼 V灼 }}::/ │ 歳 │ | け 学 | ヽ ハ{ :.:.:.:.:. 、:.:.:.:.:.:レ | な | | ど ?│ `‐f=,、u __ 人 < ん | \! に / _/:/ 丶、 / } / \.│ .で | .  ̄ ̄ / /:::{ / ∧> __´ イ::\_〃`l す | 「 ̄ ̄ ̄| / ::::∨ /、} ノ |:::::: }|| \_l け | | 嘘. | ,′::::::{\\___//|::::::/ |l | ど. | | を | {: :::/V\ ー─一'´ /:::イ |l | / | | つ. |/'∨/ ‐=====-{::/|| || | ° j | き | // /`ヽ ⌒) `| || || , \ / | ま | l | (⌒) の ∠ / || ||ノ 丁  ̄ ̄ | .し. |ヽl | /|ヽ木木のぞみl || || ∧ | た. |ヽ)`ー========-、_/ || |匸_二二,ノ |________|、人 」レ‐ヘハ. | \_∨ \ /{ー‐ }┴-、 | │ └(.二ニ | │ / \ \ `ーrニヘ、 / やねさん談>NNUEの8MBでaperypaq並み 30MBになっても強くならなったってことなのね KPP_KKPTも容量半分なのにKPPTとそんな変わらないからな 学習方法に壁があるんだろう 商用版の情報ってまだほとんど出てない? PCのみでスマホ版はないのかな? 実際えびの放送にやねさんが出た時にも冗談半分とは思うけど クジラちゃんのGUIを使っても良いとかって話をしてたよな >545名無し名人 (ワッチョイ 05b6-A5aB)2018/05/10(木) 03:52:13.77ID:V63K0vvT0>>547 >wakame1st YO2018 clang と qzilla9 godwhale で色々な条件で対局させましたが、 >qzilla9が一勝もできません。 >設定が間違っているにしても、「どちらも間違っている」はずなので同条件のはずです。 >他にこんな方いますか? >または原因があるのでしょうか? 上記発言をしたものです。 今度は wakame1st YO2018 clang と qzilla9 godwhale asame で対局させてみましたが、やっぱりwakame有利です。 自分はもうしばらくwakameを使ってみるつもりです。 ちなみに定跡は最新はどれを使えばよろしいでしょうか? 現在は マフ千田定跡 を使っています。 C-book wcsc28 でしょうか? そもそも使うって何に使うんだ 検討目的なら定跡など不要 >687 検討用は定跡無し。 序盤の勉強用と棋譜解析に定跡有りを使ってます。(時間の短縮になります) 普通の使い方だと思いますが、他の方はどんな使い方なのかは興味があります。 ちなみに定跡はどれを使っていますか? QhapagとArgoCorse_IcSyoは共にaperypaqに六割勝てると言います。 R4270に相当するはずですが、実際にuuunuuunさんに計ってもらったら一体いくつになるのでしょうか? 少し前のカツ丼将棋のtwitterには平億さんの彼女が写った写真が有りましたが、今は有りません。 物言いがついて削除されたのでしょうか? >>690 彼女ができたらAperyは弱くなった 理由は知らないが今年のAperyは強かった コンピュータ将棋における事件というと何を思い浮かべますか? 過去色々な事件が有りましたが、どれも思い出深いです。 ・三浦弘行九段のソフトチート冤罪事件 ・伊藤英紀氏の将棋世界提訴事件 ・巨勢亮一氏の電王戦21手投了事件 ・磯崎元洋(やねうらお)氏の電王戦貸出ソフト書換え事件 ・鈴木雅博(えびふらい)氏の無断ライブラリ使用によるWCSC失格事件 ・勝又清和六段・石田計(Yorkie)氏の電王トーナメント独断裁定&辞退事件 >>689 大体のソフトには有意差あって強いクジラ9がたぬきwcsc28には勝率52%(ロタ氏計測)で、たぬきに相性が悪く、 たぬきのせいでクジラのレートが大分落ちているように、一つのソフトに勝率が良くても三すくみの関係があるので複数の ソフトと対局してみないと総合的なレートは現時点では分からない >>692 陰気な話題をこのスレに持ち込むな、根暗なガイジやな >>683 kpptってほとんど無駄な情報なんじゃね?って話は昔から言われてた 新版のソフトを旧版と対局させると勝率8割。 ところが他ソフトと対局させると結果は良くなってない。 そいつ(他ソフト)のクセが悪いんだー(と思いたい)みたいな話ね >>680 クジラックスって何かなと思って調べたらロリコン漫画かよ この予備軍め 今日京都で羽生さんの講演聞いてきた。 「ネット将棋は以前練習でやっていたが、ある対局の前日に指していたら、どうやら明日の対局者であろう人と当たった。それを何千人が観戦しているという状況が、何か違うんじゃないかと思い、以来辞めてしまった」って言ってた。いつ誰のことか分かる人いる? >>701 何千人が観戦ということは殆どdecsyhiは私でしたと認めたということになるのかな >>701 スレ違いだろ、ネットとコンピュータは関係ないと思うが 羽生の専門スレでやるようなネタだな それ何年か前にあった話題だけど結論はよくわからん 135▲HAHAHAHAHA △dcsyhi 2004年06月05日(土) 22:32:00 http://www.daisei-shogi.net/dcshyi/t-club.html http://www.rayraw.com/index.php?type=nendo& ;nendo=2004 森内名人との名人戦第5局の翌日がデクシ最後の棋譜だとしたら 話がちょっと違うからわからん。 デクシは山下さんの論文では羽生さんにしては弱いって説になってたような そもそも否定ってなんだよ 強豪小学生の中でも強かった子が奨励会入りたてで苦戦するのは駒落ち経験が薄いせいでうまく勝てなくてそこから崩れる事が多いからそれでしょ 大分は道場なかった筈だから駒落ち経験が薄くてもおかしくない 棋力自体は問題ないと思うよ否定された訳じゃない 電王トーナメントはやるか分からず、選手権も再来年には終わるか否か。 長いこのスレの歴史にも、終幕の日が近づいているのかね。 大会は無くても趣味で開発し続ける人はいるかもしれない みんな手元に学習に使った棋譜が残っていそうなのに NNUEが強くなった報告がないのはやっぱり上手く行かなかったのかな ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる