▲コンピュータ将棋スレッド120 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
3、4回ということは、verdict氏ではない訳か。 >>748
最善手の点数が6だったとして最初に5点の手から探索するとその手は正確に5点と分かる
次の手からの探索は(-6,-5)で呼ばれて最善手は最低でも6が帰って来る
それが最初の手の5点より高いのでもう一回今度は(-∞,-6)で呼ばれて
最高でも6が帰って来るからちょうど6という点数になっていない可能性がある >>750
>次の手からの探索は(-6,-5)で呼ばれて最善手は最低でも6が帰って来る
点数5の手次の手の探索は(nega-scout前提で)-search(-6, -5, (残りdepth)-1)という意味で
5≦score<6の範囲をscoutするという意味ならおk
手を次々探索するうちに(仮定より)窓幅[5, 6)で5より大の値が返される手に出くわし、
そいつはfail-highだから、次に行われる探索は5≦score<+∞
(よほど探索の安定に自信があって攻める探索ルーチンなら6≦score<+∞もアリ)であり、
ここで読み筋が5の値の手から6の値の手に変わるわけだが、
このとき探索窓[5, +∞)で6が帰ってくるからこれはfail-highでは「ない」 >740
>歩を回収しつつ
回収できてる時点で歩がある将棋である ぷろきしはふがいないのでしんじんにまけつづけている 桂ポンって?
Shota Chida? @mizumon_ 36分前
あれ、elmo桂ポンにはまるのか。
elmo技巧に振り飛車で+250くらいの序盤局面から指しつがせて、16局で70%だったから何かあるのだろうなあとは思ったが。 >>754
37桂45桂って速攻するやつじゃね?
藤井が羽生にやってたやつ Kasuminって、定跡を思いっきり伸ばしたエルモちゃんなのかなぁ? 俺のKasumin定跡予想
【従来】
▲76歩(0) → △34歩(-10) → ▲26歩(-4)
▲75歩(-8)
△84歩(+10) → ▲26歩(+11)
▲75歩(+5)
【新定跡】定跡の評価値を最善進行の枝先の評価値で更新
▲76歩(-4) → △34歩(-4) → ▲26歩(-4)
▲75歩(-8)
△84歩(+11) → ▲26歩(+11)
▲75歩(+5)
これなら浅い探索で大規模定跡作っても
評価は正確になるから質と量を両立出来る この手法だと枝の先端の評価値さえあればいいから
途中に関しては極端な話、探索すら必要ない
最初は実戦に出る局面を割り出すのに必要だろうけど
バージョンアップは枝の先端を探索しなおすだけだから非常に楽 >>757
斬新なアプローチで色々試してる人がいるんだね これで80億局面分の定跡が作成出来たとしたら
枝先の探索だけで80億局面全体の評価値が一気に定まるから
そこから学習したりも出来るかもしれないね
序盤に偏りすぎているから強くなるかは不明だけど その定跡の評価法はリバーシAIのロジステロの時代からあったけど、
何故今まで将棋でこれをやる人がいなかったか謎
何か欠点あるのかねえ >>755
「振り飛車で」って言ってるし多分鬼殺し向かい飛車とかで出てくる25桂とただ捨てする筋だろう >>758
新しい手順を一つbookに追加するときその手順上の今までbookにエントリーがなかった局面では
追加された手順の手を除いて最善手を探索してその値を調べる必要がある
末端からミニマックスで上げて行くときそれの方が良かったらそこではその点数を上げる
この作り方ロジステロのところにあったと思ったけど http://yaneuraou.yaneu.com/2017/06/11/
まず、Apery(WCSC26)からdepth 6で教師局面10億生成。これは、私の環境(5PC、200c400t)で2時間です。
ここからelmo絞りで10億局面を学習。(1周のみ)
これは1台のPC(40c80t)で行い、2時間半程度です。
合わせて4時間半。
これで、うかむ瀬とほぼ同等の棋力になりました。わずか4時間半。
Apery(WCSC26)と強さ大差ないYaneuraOu-classic-tceから教師局面作って
完全自製の評価関数作ればいいのに
追加学習だから無理なのか エルモちゃんは多分棒銀に引っかかるよね。
電王戦2局目の評価推移見る限り、急戦棒銀は弱点ぽい。
2六銀の配置を過小評価してるのが原因だろうな。 >>757のようなのはほぼ効果ないとみてるが。定跡というより先読みだろ?
いくら多くの場面も生成しておいたとしても実戦では合致しない可能性が高い。
先読みより、自前の評価関数では指せない手、失敗する手を修正するほうが効果あるとおもうが。 >>764のbookの更新の仕方は同じ手順で負けるのを避けることができ
学習を繰り返すうちに自前の評価関数では指せない最善手を発見できるようになる
オセロはこれでほぼ解かれてしまったんだけどチェスでもやってるとは聞かないから
分岐が多すぎて難しいのかな >>766
じゃあ、エルモ以外のソフトに棒銀指定させてエルモと対戦させてみ。エルモに負け越すに決まってるから。 >>763
そっちの桂ポンで居飛車側の対処がまずくて潰されるソフトは見た記憶がないなぁ.
だれか実験してみてよ elmo絞りで半年を4時間半に
やねうら王ブログで進化について書かれてました >>766
分かる
シンプルな攻め筋をとにかく過小評価するところあるよな >>772
そうそう。
そして、シンプルな攻め筋は人間の得意とするところ。
他のソフトに棒銀指定させたらelmoに負け越すという意見があったが、
別にそういうことが言いたいんじゃない。
あとは、多分駒落ちも苦手だね。
棒銀は下手の有力戦法だから。 >>773
これって、元にした教師局面に偏りがあったってことなの?
教師局面自体、ある程度強くなってたソフトから生成したものだから、その時点で既に抜けちゃってた可能性があるのかな? 数撃ちゃ当たる雑巾絞りは終わりか
stockfishのパクリと手作業の時代 >>774
多分、4六銀の形を評価し過ぎてる弊害じゃないのかな。
コンピュータ将棋って、マジで4六に銀やって、5六に角打てたら、
それだけで満足と思ってる節があるから。
もちろん、良い形なのは確かなんだけども。
特に少し悪い、少し良いくらいの形勢だと、やたら5六、後手なら5四の角打ちにこだわる。 棒銀が苦手なのではなく、棒銀戦法が本質的に優秀なので受けきるのは
常に大変ということなんですね、ええ。 SZA (feat. Travis Scott) - "Love Galore" | Nicole Kirkland Choreography (Millennium Version)
https://www.youtube.com/watch?v=2Vt◆brprqzcs
Lion Babe - Rockets ft. Moe Moks | missTiff Choreography | DanceOn Class
https://www.youtube.com/watch?v=T◆VEFp2uHPdQ
Maryam Shakiba - Odissi Dance - Manglacharan Ganesh Vandana
https://www.youtube.com/watch?v=5◆2bscmW8x80
Gabe De Guzman
Iggy Azalea - "Mo Bounce" | Phil Wright Choreography | Ig : @phil_wright_
https://www.youtube.com/watch?v=E◆I-BWeLP2ok
↓
Kaycee Rice & Gabe De Guzman "KONTROL"
https://www.youtube.com/watch?v=L◆vqrSjggBhk
Haley Messick
Tinashe - Superlove - Choreography by Jojo Gomez - Filmed by @TimMilgram
https://www.youtube.com/watch?v=f◆no9zI7HSYg
↓
Haley Messick
https://www.youtube.com/results?search_query=H◆aley+Messick
KATY PERRY - Bon Appetit ft. Migos | Kyle Hanagami Choreography
https://www.youtube.com/watch?v=cqd◆XgQ5bxxs
↓
Katy Perry - Bon Appetit (Official) ft. Migos
視聴回数 97,951,025 回
https://www.youtube.com/watch?v=dP◆I-mRFEIH0
New Autumn Miller improv
https://www.youtube.com/watch?v=6Y◆Qvwh73SW0
Kehlani - CRZY | Antoine Troupe Choreography | DanceOn Class
https://www.youtube.com/watch?v=y47◆AsHaKYbU
Les Twins TRNDSTTR (Lucian Remix) lyrics
https://www.youtube.com/watch?v=sm◆fLxRu6sQA
Booty Voodoo | Dytto x BluPrint x D-Payne x Marcotix | Freestyle Session
https://www.youtube.com/watch?v=Y8s◆Pid6SwTg ついさっきNHK将棋フォーカスでPonanza VS 佐藤の特集やってたけど
2局ともPona圧勝、佐藤名人の完敗ってはっきり言ってた 今年のNDFみたいに選手権で向飛車の逆棒銀で潰される場合もあるからな。
棒銀の効果ってかなり深い読みが必要 >>781
これではっきりしたね
プロが敵わないソフトはポナンザだけ
他のザコソフトなら事前貸出で弱点を研究すればまだプロの方が強いとね
ポナンザは勇退してもらって来年以降も電王戦の後継棋戦をやってほしい
プロ側が圧勝してソフト厨が涙目になるのが楽しみだw 「elmoなんて所詮awakeに毛の生えた程度でしょ?
貸し出しで研究すればプロが余裕で圧勝するよ」
これが一般の将棋ファンの共通認識 雑巾絞りが洗濯機に進化したのか
1回スイッチを入れれば勝手に終わってそれ以上絞っても水は出てこない >>783
17日にNHKスペシャルでPONA VS 佐藤やるから
今日の将棋フォーカスはそれのEテレ版の予告編なんだろ
PCやネット将棋に無知なロートル爺までPONA&山本一成の顔を覚えることになった 「プロvsソフトの5対5のマッチではプロに敵いませぇ〜ん
ポナンザ先生助けてくださぁ〜い」
と言ってポナンザに丸投げして、プロから逃げ回ったザコソフトw
こんなのプロの敵ではないよなw elmo>今年の選手権のpona>電王戦pona
のはずなのに・・・w
昨日のAO戦の評価値を任されたのは3局すべて電王戦ponaだった
どれだけelmoが信用されてないかを如実に物語ってるよなw elmoなんて運でponanzaに勝っただけの雑魚だからしゃーない
きっちり対局の計測したらponanzaの方が上だったし >>778
3駒関係を線形的に評価してるだけだから、結果駒損とかにならなければ、なんでもかんでも同じ形に持って行こうとするよね
陣形・戦型に優劣があるんじゃなくて、評価値0の互角がそれぞれズレてるだけな気がする
ソフト同士の対局ならそれでいいかもしれんけど、棋譜解析する上では間違ってるのでは? だって、elmoカパックは持ってるしなあ。
しかも、運営が検討に使ってるハードだってハイスペでもない。
そりゃ、ponaの方見たいわ。 >>793
序盤の駒組みは、もっと可能性があるように感じるね。
ソフトによって再評価された形も多いが、
反対にソフトによって過小評価された形もあるのでは。
この辺りは、3駒関係を超えるブレイクスルーでないと無理かもな。
elmo絞りは、ごく短期間ブレイクスルーと呼ばれたが、
結局それ以上にはなかなかなれず、どうもブレイクスルーでもなさそうだし。 プロとポナンザ以外のソフトで団体戦を行い、プロが1勝でもすれば人類が負けたことにはならない
だが現実は、情けないことにソフトがプロから逃げ回ってる 人対ソフトの話は>>794のスレ行けよほんと、全く興味ないわ >>768
コンピュータチェスは初期配置じゃなくて
イーブンな指定局面からの対局だからだと思う
電王トーナメントでは初期配置スタートだから
上の手法で超巨大定跡が作れたなら
elmoそのままでも上位に喰い込めそうな気がしなくもない ソフト穴熊指さなくなって不思議や。中飛車だろうが四間飛車だろうが美濃系が多いな。たまに穴熊する程度
昔のソフトって居飛穴多いイメージだったけど今は違うのね 穴熊は玉の位置がなかなか動かないせいで、以前のソフトは過学習になって過大評価していたんだと思う 今後はelmoを見習って入玉の評価値が急増するのは確実
入玉が最強
お互い最善手を指すと持将棋ドローという将棋と言うゲームの本質がバレてしまう 穴熊に組めれば実際にソフトでも勝率は良かったから過大評価ってことではないんでは。
ノーマル四間elmo対昔のソフトの居飛車穴熊の棋譜を見てみたい気はするが。 >>765
うかむ瀬とWCSC26のR差200って言ってるけどuuunさんとこの調査だと
LazySMP使用で330あるんだが。
もし200差広げて「同等」って言ってるなら、若干精度に問題あり。
まあ、論考の本旨に影響をあたえるものではないけどな。 電王戦第2局の展開はそれなりに衝撃的だったけど、
別に今のソフトが穴熊を評価しないわけではない。
あの時は、
・角交換後なので角打ちの隙が増える
・後手の守りも金銀4枚、しかも端もつき越して広い
・穴熊だけど8筋9筋つき越されてて全然安心感がない
・角打ちが怖いので攻撃の要の右辺もうかつに動けない
こんだけ揃えばそりゃマイナスだよ。
むしろ何故穴熊にしちゃったのかというレベル。 Although the AI gets ever stronger by playing against itself,
DeepMind couldn’t rely on that baseline training to cover the knowledge gaps
? nor could it hand-code a solution.
You have to kind of coax it to learn new knowledge or explore that new area of the domain,
and there are various strategies to do that.
You can use adversarial opponents that push you into exploring those spaces,
and you can keep different varieties of the AlphaGo versions to play each other
so there’s more variety in the player pool.
自己対局だけじゃ変な癖付いたらずっとそのまま >>778
そういう意味で言うと、まふ定跡elmo版のリリースが楽しみ >>796
Intelの不揮発性メモリが標準になったら4駒関係使いやすくなりますかね? >>804
評価関数だけの話でしょ
探索部は共通にしないと趣旨が変わる 3D XPointはDRAMをリプレースできるものじゃないだろ
公表されている範囲でも多少マシな不揮発メモリという程度にすぎない
主記憶の置き換えは無理 381 Xeon elomo+読み太 後手優勢-1000前後で推移しています
390 >381 何で読み太なんだよ 今はやねうら王の方が高速化されてるし良いのに
394 >390 ミラー主に言ってください^^;
415 >394 最新のやねうら王は読み太比で20%近く高速化されてるって伝えてあげて〜
460 >415 やねが強いのは知ってるが、読み太の読み抜けが体感上少ないので、読み太を使っているとのこと。
482 >460 候補手2にすると盤石なんだけどね
やね信者ウザいな
緊急でつけたfail low/high出力も上手く機能してないようだ。ハッシュが悪い!と責任転嫁しているし
すぐ千日手固定になる仕様や、前の手の読み筋しか読まなくなる仕様、枝切りしすぎて読み抜け多い仕様は直ることなない
家庭用PCでの棋譜解析・検討エンジンにやねうら王は向いていない
やねうら王は対コンピュータ・クラスタ向きのエンジン。まふ定跡最強厨と似たようなもの
読み太はノートPCで上位入賞だから低ノード条件で強い。叡王戦予選のような早指しには向いている そりゃ、問題を再現できるguiやエンジンの設定情報とか局面の詳細も無く喚いてるだけだから、その症状が仕様かバグかも分からんし適当な対応でスルーだわな。 突然長文投稿とかこわい。
2chの将棋関係ってヤバイ人多すぎでしょ 3行しか文章が読めないアホ日本人が増えてる方が怖いな
フクシマの放射能を被曝して脳が劣化してきたか? どっかのスレで読み太の探索は長時間に向いてるって言ってた人もいるし短時間のほうが相対的に強いって言う人も居るし要するに適当な印象か
誰か暇人確かめてくれんかなあ >>799
じゃあチェスも実はほとんど結論出てるのかな
オセロも20年前にはランダムに配置した局面で双方先後を持って同時打ちとかなってた 駒得だけの評価関数で教師局面作って、elmo絞り1回すると
BONA6相当の棋力とか凄い >>818
人間の棋譜を使わない評価関数ってことだよね? >>816
長時間のほうが若干勝率いいけど、エルモの評価関数使っても、魔女や屋根ほど強くならない。 >>812
何かと思ったらuuunuuunのレート計測してた人じゃん
読み太とelmo-qhapaq評価関数(ver 1.1)だな
あれだけ計測して人の体感なんだから少しは信ぴょう性あるでしょ
XeonのNPSだからそこらへんのi7程度と比べても20%UPしても遥かに上だから
俺も個人的に読み太優秀だと思うけどな elmoは電王トーナメント出てないだろ
あれでソフトの使用権得てる 菅井がやってたうっかり三間飛車?からの角交換向飛車にしての桂ポンだった。
技巧とelmoの評価値が食い違ってるのが多い印象。逆棒銀で潰れた棋譜もあるみたい。10秒将棋だけど
Shota Chida? @mizumon_ 28分前
Dropboxのelmo技巧フォルダに,昨日記したelmoの棋譜を入れました。(序中盤でミスしたもののみ) 将棋は千日手のようにループができる
個別の棋譜にループがなくても複数集めたらループになる可能性もある
そこらへんの処理に明快な方法を見いだせなくて
やねうらおはオンラインの定跡更新は初期の段階で諦めたような「曖昧な」記憶がある 巨大定跡はロマン
Newやねうら定跡は50GBくらいになって欲しいね >>823
elmoはGPLだから使用権の別途契約はいらないけどね。 もう定跡じゃなくて巨大な置換表に全部覚えておけばいいんじゃないの 将棋のオープニングは当たればラッキーという程度
高確率で当たることを期待する置換表とは運用意図が異なる 機械学習をいかに精緻なものを作るかという方向で競争が始まるのかなあ 去年の激指も一応完全自前って話だったと思うけど早繰り銀をよくやるくらいで
特に変わった特徴はなかったな 技巧ミニのBishopLearningの駒割り使えばフルブートストラッピング完成 探索部のパラメータ調整も自動化しないといけないんじゃない?
stockfish不使用の探索期待している > Bonanza6のプロの棋譜からの学習とは何だったのか…。
> NDFの手法であるKPP相対[2014]とか、AWAKEの手法であるKPE次元下げ[2015]とか、一体何だったのか…。
> この瞬間にすべてが過去の遺物となったと言えるだろう。
というか、雑巾絞りのために数百万円の投資したやねさんもワロエナイ
まあ、平岡さんとやねさんが、それぞれ異なる手法で個人で集められる計算資源の限界にトライしてくれたおかげで、
その他の手法としてelmo絞りが発見できたということではあるから、
コンピュータ将棋にとって無駄ではなかったのだが。
(もちろんKPP相対や次元下げも、それをやってもponanzaに届かないところから雑巾絞りが見つかったのだし)
という辺りを書いてると、なんとなく以前NHKで見たポワンカレ予想解明までの歴史を思い出した。
なにげに滝澤さん、単に強い評価関数を作っただけではなく、結果論としては過去を全部白紙にする
保木さん級の発見をしたことになるな。 人間の棋譜を使わないと強さは保ったまま異端の方向に進化していくのだとしたら面白いな。
将棋でも突き詰めたらアルファ碁的な世界になるのかもしれん むしろ、人間の棋譜を使わないほうが強くなったりしてね やねうらってelmoの学習式は勝敗項の寄与が大きすぎる!とか言って自信満々に記事にしてたのにこっそりコメント欄で撤回してんだな まあ今回のアルファ碁は人間の棋譜を使わないバージョンじゃないみたいだから
強化学習を繰り返したらあんまり関係ないのかもしれんば 人間の棋譜を使うより詰みを見つけるのが早いとか摩訶不思議な評価関数だな
リゼロは見てて面白い将棋。もしelmoくらい強くなったら凄い 人間の棋譜を使わない評価関数だと定跡とか使うと逆に弱くなりそうだな E1 R-500
E2 R-190
E3 R-80
E4 R-5〜40
epoch 10で浮かむ瀬まで行ってほしいけど
工夫しないで行くのは厳しい気がする ■ このスレッドは過去ログ倉庫に格納されています