▲コンピュータ将棋スレッド120 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
StockFishがMultiPVの時にはfail low/highを出力しないのは
fail low/highの時の評価値でソートすると最善手が訳分からなくなるからだろうね
一応2017-early-search.cppの2399行目の
MultiPV == 1を>= 1に変えれば出力はされるけど
いざやってみると上級者以外は混乱しそうな予感しかなかった ShogiDroidのやねうら王v465のソースコートがないよ(T_T)
自力でv466化しようと思ったのに(つд⊂) >>710
タグ打たれてないだけでgithubには上がってる >>711
たしか前にshogiguiの掲示板でも似たような指摘あったけど、
その時は技巧の定跡に変な手が紛れ込んでたね。 ソースコードは読むのに時間がかかり過ぎる
大学生の頃はたくさん読んていたのだけれどいつの間にか全く読まないようになってしまった。 コンピュータ将棋ファンのために身銭を切るsuimonさんは流石なんだよな。
suimon @floodgate_fan
ボーナスでHuawei P10 Plusを買おうかな。
午前7:49 · 2017年6月9日 gps_lが2000台まで押し下げられている状況だから
数字的にはわかりにくいが ShogiNetちょっと強くなったようだな Kasuminは上位ハイスペ勢と張り合えるけど格下に連敗したりもする不思議ちゃん うさ親さんのコンピュータ将棋のアルゴリズムを読んでいるのですが、
5-1のZobristHashingの解説についての注釈※2
「厳密には、完全な乱数よりも良い結果を得る方法が有ることも知られているが、本書の範囲を超えると思われるのでここでは触れない」
についての詳細をご存じの方、よろしければ教えてください 衝突が少なく出来るやつを試行錯誤で探しておいて記録しておけばいいのでは?
固定で。 やねうら評価関数がelmoより僅かに強くなったと言ってたけど
それってelmoからの追加学習なのかな?
ゼロベース評価関数スタートでelmo超えてたりしたら凄すぎるけど流石にないか 将棋所ってfloodgate対局中にkeep alive送ってくれないよね
相手が長考すると切れちゃう Windows phoneで使えるソフト教えて
将棋所+技巧とか使える? Shota Chida @mizumon_
ソフトが雁木(というより、67銀47銀)を以前から好んでいて、棋士も採用しつつありますが、以前からずっと指している人はいて、その将棋をソフト関連と思われるのは好ましくない。先日の順位戦の将棋は神崎八段の快心譜です。
午後10:23 · 2017年6月9日
38件のリツイート 95件のいいね Shota Chida @mizumon_
ちなみに、私については気にしなくていいですよ。(というより、そのときのソフトの最新なのかな? とか趣味かな、でいい。)
主張としては、プレイヤーの独自性を独自でないと思われてしまうのは好まない、という一点のみです。
午後10:30 · 2017年6月9日
7件のリツイート 57件のいいね ま〜たツイート転載ガイジがおって草
「言葉使いに気を付けろよ」www 4ヶ月の法則に合わせて苦言を出してあげた千田先生の優しさに注目なんだよな。 FGでShogiNetの出す評価値が
探索制限をした技巧2のそれにけっこう近くなるのは興味深い ディープラーニングで評価値って変だな
評価値出せるなら探索出来るだろうし ShogiNetの人はブログを書いているぞ
詰将棋メモのコンピュータ将棋エントリにリンクがある 大合神ひきょーなクジラちゃん
みんなで力を合わせて1人をボコります かすみちゃんにレイープされるグジラちゃんが見たい! 「歩が無い将棋は負け将棋」って本当だと思う?
試しに、初型図から先手の歩を全て後手の持ち駒にしてソフト同士で対局すると
飛車先の歩が無いから先手の飛車が速攻で23に成り込んで
歩を回収しつつ竜が暴れて先手が勝った あんまり調べるのは
芸人さんで、将棋の格言から歩って名前になったひともいるし、可哀想かな >>1
14歳・藤井聡太四段 対コンピューター戦と“年度内タイトル”への思い
http://bunshun.jp/articles/-/2105
週刊文春 2017年4月20日号
> ──ソフトとの勝敗は?
>
> 「(ソフトの能力は)パソコンのスペックによって変わりますので。
> 私はそんなに凄いスペックのパソコンを使ってないので、
> 勝ち越すくらい……まではいかないです(笑)」
史上最年少棋士・藤井聡太四段、14歳の覚悟と日常
http://www.hochi.co.jp/topics/20170610-OHT1T50094.html
2017年6月10日14時25分 スポーツ報知
> 5月、電王戦で佐藤天彦名人が最強ソフト「ポナンザ」に連敗。
> コンピューターと棋士が戦う時代は終わり、共存期に移行し始めている。
>
> 「実は自分もポナンザとネットで3、4局指したんですけど、全部負けてしまいました。
> もちろん負けたくないと思いましたけど、将棋の長い歴史の中で
> コンピューターと棋士が戦った一瞬に居合わせられたことは良かったと思います」 69連勝の中に藤井四段がいたってこと?ウォーズのponaかと思ってたけど ああ、最後に24にポナが降臨した時のその中にいるよ >>745
それか連盟に貸し出されてるponaとネットワーク越しに対局したか。将棋所なら簡単にできるし。 読み筋の先端がfail-lowだったりfail-highだったりするのはなんかおかしくね?
探索木の根に対して探索窓[-∞, +∞)「相当」の探索を一度も正しく(安定に)やれていないとか、
正しくやったけど結果を忘れた、とかでない限りそうはならない… 3、4回ということは、verdict氏ではない訳か。 >>748
最善手の点数が6だったとして最初に5点の手から探索するとその手は正確に5点と分かる
次の手からの探索は(-6,-5)で呼ばれて最善手は最低でも6が帰って来る
それが最初の手の5点より高いのでもう一回今度は(-∞,-6)で呼ばれて
最高でも6が帰って来るからちょうど6という点数になっていない可能性がある >>750
>次の手からの探索は(-6,-5)で呼ばれて最善手は最低でも6が帰って来る
点数5の手次の手の探索は(nega-scout前提で)-search(-6, -5, (残りdepth)-1)という意味で
5≦score<6の範囲をscoutするという意味ならおk
手を次々探索するうちに(仮定より)窓幅[5, 6)で5より大の値が返される手に出くわし、
そいつはfail-highだから、次に行われる探索は5≦score<+∞
(よほど探索の安定に自信があって攻める探索ルーチンなら6≦score<+∞もアリ)であり、
ここで読み筋が5の値の手から6の値の手に変わるわけだが、
このとき探索窓[5, +∞)で6が帰ってくるからこれはfail-highでは「ない」 >740
>歩を回収しつつ
回収できてる時点で歩がある将棋である ぷろきしはふがいないのでしんじんにまけつづけている 桂ポンって?
Shota Chida? @mizumon_ 36分前
あれ、elmo桂ポンにはまるのか。
elmo技巧に振り飛車で+250くらいの序盤局面から指しつがせて、16局で70%だったから何かあるのだろうなあとは思ったが。 >>754
37桂45桂って速攻するやつじゃね?
藤井が羽生にやってたやつ Kasuminって、定跡を思いっきり伸ばしたエルモちゃんなのかなぁ? 俺のKasumin定跡予想
【従来】
▲76歩(0) → △34歩(-10) → ▲26歩(-4)
▲75歩(-8)
△84歩(+10) → ▲26歩(+11)
▲75歩(+5)
【新定跡】定跡の評価値を最善進行の枝先の評価値で更新
▲76歩(-4) → △34歩(-4) → ▲26歩(-4)
▲75歩(-8)
△84歩(+11) → ▲26歩(+11)
▲75歩(+5)
これなら浅い探索で大規模定跡作っても
評価は正確になるから質と量を両立出来る この手法だと枝の先端の評価値さえあればいいから
途中に関しては極端な話、探索すら必要ない
最初は実戦に出る局面を割り出すのに必要だろうけど
バージョンアップは枝の先端を探索しなおすだけだから非常に楽 >>757
斬新なアプローチで色々試してる人がいるんだね これで80億局面分の定跡が作成出来たとしたら
枝先の探索だけで80億局面全体の評価値が一気に定まるから
そこから学習したりも出来るかもしれないね
序盤に偏りすぎているから強くなるかは不明だけど その定跡の評価法はリバーシAIのロジステロの時代からあったけど、
何故今まで将棋でこれをやる人がいなかったか謎
何か欠点あるのかねえ >>755
「振り飛車で」って言ってるし多分鬼殺し向かい飛車とかで出てくる25桂とただ捨てする筋だろう >>758
新しい手順を一つbookに追加するときその手順上の今までbookにエントリーがなかった局面では
追加された手順の手を除いて最善手を探索してその値を調べる必要がある
末端からミニマックスで上げて行くときそれの方が良かったらそこではその点数を上げる
この作り方ロジステロのところにあったと思ったけど http://yaneuraou.yaneu.com/2017/06/11/
まず、Apery(WCSC26)からdepth 6で教師局面10億生成。これは、私の環境(5PC、200c400t)で2時間です。
ここからelmo絞りで10億局面を学習。(1周のみ)
これは1台のPC(40c80t)で行い、2時間半程度です。
合わせて4時間半。
これで、うかむ瀬とほぼ同等の棋力になりました。わずか4時間半。
Apery(WCSC26)と強さ大差ないYaneuraOu-classic-tceから教師局面作って
完全自製の評価関数作ればいいのに
追加学習だから無理なのか エルモちゃんは多分棒銀に引っかかるよね。
電王戦2局目の評価推移見る限り、急戦棒銀は弱点ぽい。
2六銀の配置を過小評価してるのが原因だろうな。 >>757のようなのはほぼ効果ないとみてるが。定跡というより先読みだろ?
いくら多くの場面も生成しておいたとしても実戦では合致しない可能性が高い。
先読みより、自前の評価関数では指せない手、失敗する手を修正するほうが効果あるとおもうが。 >>764のbookの更新の仕方は同じ手順で負けるのを避けることができ
学習を繰り返すうちに自前の評価関数では指せない最善手を発見できるようになる
オセロはこれでほぼ解かれてしまったんだけどチェスでもやってるとは聞かないから
分岐が多すぎて難しいのかな >>766
じゃあ、エルモ以外のソフトに棒銀指定させてエルモと対戦させてみ。エルモに負け越すに決まってるから。 >>763
そっちの桂ポンで居飛車側の対処がまずくて潰されるソフトは見た記憶がないなぁ.
だれか実験してみてよ elmo絞りで半年を4時間半に
やねうら王ブログで進化について書かれてました >>766
分かる
シンプルな攻め筋をとにかく過小評価するところあるよな >>772
そうそう。
そして、シンプルな攻め筋は人間の得意とするところ。
他のソフトに棒銀指定させたらelmoに負け越すという意見があったが、
別にそういうことが言いたいんじゃない。
あとは、多分駒落ちも苦手だね。
棒銀は下手の有力戦法だから。 >>773
これって、元にした教師局面に偏りがあったってことなの?
教師局面自体、ある程度強くなってたソフトから生成したものだから、その時点で既に抜けちゃってた可能性があるのかな? 数撃ちゃ当たる雑巾絞りは終わりか
stockfishのパクリと手作業の時代 >>774
多分、4六銀の形を評価し過ぎてる弊害じゃないのかな。
コンピュータ将棋って、マジで4六に銀やって、5六に角打てたら、
それだけで満足と思ってる節があるから。
もちろん、良い形なのは確かなんだけども。
特に少し悪い、少し良いくらいの形勢だと、やたら5六、後手なら5四の角打ちにこだわる。 棒銀が苦手なのではなく、棒銀戦法が本質的に優秀なので受けきるのは
常に大変ということなんですね、ええ。 SZA (feat. Travis Scott) - "Love Galore" | Nicole Kirkland Choreography (Millennium Version)
https://www.youtube.com/watch?v=2Vt◆brprqzcs
Lion Babe - Rockets ft. Moe Moks | missTiff Choreography | DanceOn Class
https://www.youtube.com/watch?v=T◆VEFp2uHPdQ
Maryam Shakiba - Odissi Dance - Manglacharan Ganesh Vandana
https://www.youtube.com/watch?v=5◆2bscmW8x80
Gabe De Guzman
Iggy Azalea - "Mo Bounce" | Phil Wright Choreography | Ig : @phil_wright_
https://www.youtube.com/watch?v=E◆I-BWeLP2ok
↓
Kaycee Rice & Gabe De Guzman "KONTROL"
https://www.youtube.com/watch?v=L◆vqrSjggBhk
Haley Messick
Tinashe - Superlove - Choreography by Jojo Gomez - Filmed by @TimMilgram
https://www.youtube.com/watch?v=f◆no9zI7HSYg
↓
Haley Messick
https://www.youtube.com/results?search_query=H◆aley+Messick
KATY PERRY - Bon Appetit ft. Migos | Kyle Hanagami Choreography
https://www.youtube.com/watch?v=cqd◆XgQ5bxxs
↓
Katy Perry - Bon Appetit (Official) ft. Migos
視聴回数 97,951,025 回
https://www.youtube.com/watch?v=dP◆I-mRFEIH0
New Autumn Miller improv
https://www.youtube.com/watch?v=6Y◆Qvwh73SW0
Kehlani - CRZY | Antoine Troupe Choreography | DanceOn Class
https://www.youtube.com/watch?v=y47◆AsHaKYbU
Les Twins TRNDSTTR (Lucian Remix) lyrics
https://www.youtube.com/watch?v=sm◆fLxRu6sQA
Booty Voodoo | Dytto x BluPrint x D-Payne x Marcotix | Freestyle Session
https://www.youtube.com/watch?v=Y8s◆Pid6SwTg ついさっきNHK将棋フォーカスでPonanza VS 佐藤の特集やってたけど
2局ともPona圧勝、佐藤名人の完敗ってはっきり言ってた 今年のNDFみたいに選手権で向飛車の逆棒銀で潰される場合もあるからな。
棒銀の効果ってかなり深い読みが必要 >>781
これではっきりしたね
プロが敵わないソフトはポナンザだけ
他のザコソフトなら事前貸出で弱点を研究すればまだプロの方が強いとね
ポナンザは勇退してもらって来年以降も電王戦の後継棋戦をやってほしい
プロ側が圧勝してソフト厨が涙目になるのが楽しみだw 「elmoなんて所詮awakeに毛の生えた程度でしょ?
貸し出しで研究すればプロが余裕で圧勝するよ」
これが一般の将棋ファンの共通認識 雑巾絞りが洗濯機に進化したのか
1回スイッチを入れれば勝手に終わってそれ以上絞っても水は出てこない >>783
17日にNHKスペシャルでPONA VS 佐藤やるから
今日の将棋フォーカスはそれのEテレ版の予告編なんだろ
PCやネット将棋に無知なロートル爺までPONA&山本一成の顔を覚えることになった 「プロvsソフトの5対5のマッチではプロに敵いませぇ〜ん
ポナンザ先生助けてくださぁ〜い」
と言ってポナンザに丸投げして、プロから逃げ回ったザコソフトw
こんなのプロの敵ではないよなw elmo>今年の選手権のpona>電王戦pona
のはずなのに・・・w
昨日のAO戦の評価値を任されたのは3局すべて電王戦ponaだった
どれだけelmoが信用されてないかを如実に物語ってるよなw elmoなんて運でponanzaに勝っただけの雑魚だからしゃーない
きっちり対局の計測したらponanzaの方が上だったし >>778
3駒関係を線形的に評価してるだけだから、結果駒損とかにならなければ、なんでもかんでも同じ形に持って行こうとするよね
陣形・戦型に優劣があるんじゃなくて、評価値0の互角がそれぞれズレてるだけな気がする
ソフト同士の対局ならそれでいいかもしれんけど、棋譜解析する上では間違ってるのでは? だって、elmoカパックは持ってるしなあ。
しかも、運営が検討に使ってるハードだってハイスペでもない。
そりゃ、ponaの方見たいわ。 >>793
序盤の駒組みは、もっと可能性があるように感じるね。
ソフトによって再評価された形も多いが、
反対にソフトによって過小評価された形もあるのでは。
この辺りは、3駒関係を超えるブレイクスルーでないと無理かもな。
elmo絞りは、ごく短期間ブレイクスルーと呼ばれたが、
結局それ以上にはなかなかなれず、どうもブレイクスルーでもなさそうだし。 プロとポナンザ以外のソフトで団体戦を行い、プロが1勝でもすれば人類が負けたことにはならない
だが現実は、情けないことにソフトがプロから逃げ回ってる 人対ソフトの話は>>794のスレ行けよほんと、全く興味ないわ >>768
コンピュータチェスは初期配置じゃなくて
イーブンな指定局面からの対局だからだと思う
電王トーナメントでは初期配置スタートだから
上の手法で超巨大定跡が作れたなら
elmoそのままでも上位に喰い込めそうな気がしなくもない ソフト穴熊指さなくなって不思議や。中飛車だろうが四間飛車だろうが美濃系が多いな。たまに穴熊する程度
昔のソフトって居飛穴多いイメージだったけど今は違うのね 穴熊は玉の位置がなかなか動かないせいで、以前のソフトは過学習になって過大評価していたんだと思う 今後はelmoを見習って入玉の評価値が急増するのは確実
入玉が最強
お互い最善手を指すと持将棋ドローという将棋と言うゲームの本質がバレてしまう 穴熊に組めれば実際にソフトでも勝率は良かったから過大評価ってことではないんでは。
ノーマル四間elmo対昔のソフトの居飛車穴熊の棋譜を見てみたい気はするが。 >>765
うかむ瀬とWCSC26のR差200って言ってるけどuuunさんとこの調査だと
LazySMP使用で330あるんだが。
もし200差広げて「同等」って言ってるなら、若干精度に問題あり。
まあ、論考の本旨に影響をあたえるものではないけどな。 電王戦第2局の展開はそれなりに衝撃的だったけど、
別に今のソフトが穴熊を評価しないわけではない。
あの時は、
・角交換後なので角打ちの隙が増える
・後手の守りも金銀4枚、しかも端もつき越して広い
・穴熊だけど8筋9筋つき越されてて全然安心感がない
・角打ちが怖いので攻撃の要の右辺もうかつに動けない
こんだけ揃えばそりゃマイナスだよ。
むしろ何故穴熊にしちゃったのかというレベル。 Although the AI gets ever stronger by playing against itself,
DeepMind couldn’t rely on that baseline training to cover the knowledge gaps
? nor could it hand-code a solution.
You have to kind of coax it to learn new knowledge or explore that new area of the domain,
and there are various strategies to do that.
You can use adversarial opponents that push you into exploring those spaces,
and you can keep different varieties of the AlphaGo versions to play each other
so there’s more variety in the player pool.
自己対局だけじゃ変な癖付いたらずっとそのまま >>778
そういう意味で言うと、まふ定跡elmo版のリリースが楽しみ ■ このスレッドは過去ログ倉庫に格納されています