AlphaZeroの将棋棋譜がついに公開！

**名無し名人** · 2018/12/07(金) 09:36:58.65

論文
A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play
http://science.sciencemag.org/content/362/6419/1140

棋譜（１００棋譜）
https://deepmind.com/research/alphago/alphazero-resources/
羽生善治竜王のセレクション１０棋譜付き！

**名無し名人** · 2018/12/10(月) 00:11:56.17

AIの将棋が将棋の真理になるとは思えんけど、人間の力になってくれることは間違いないから、本当ありがたい。

強くなるのにPC1台ですむのだから、プロはうかうかしてられない。

**名無し名人** · 2018/12/10(月) 00:12:32.35

100棋譜全部をプロ棋士に解説してほしいわ
それやってくれるなら2000円くらいなら全然金出すね

**名無し名人** · 2018/12/10(月) 00:14:46.33

Zeroの成長過程の棋譜を見せて欲しい

**名無し名人** · 2018/12/10(月) 00:17:21.60

ハム将棋をこえたのは1分くらいなんだろうか

**名無し名人** · 2018/12/10(月) 00:18:37.64

俺はレベルの高い棋譜を見たいってだけだから
人間の参考になる云々はどうでもいいんだけど
（まあ人間の参考になるということは人間の棋譜のレベルも高くなるわけでありがたいんだけど）

そんなに人間の参考にしたいなら絶対飛車を振るようにプログラミングされた
準最強ソフトでもつくってもらったらどうだろうね？
初手76歩に後手が34歩と応じてきたら絶対角替わりするソフトとか

**名無し名人** · 2018/12/10(月) 00:22:11.78

千手番を持ったとき
▲７六歩△３四歩▲２二角成△同銀▲４五角
これを定跡としてこの局面では必ず筋違い角を指すソフトとか
つくってくれたらおもしろいかもなぁ

**名無し名人** · 2018/12/10(月) 00:29:35.61

ゼロの棋風が相手をなぶるような意地悪流と知って急に親近感が湧いた

**名無し名人** · 2018/12/10(月) 00:34:15.74

>>515
まあ二面指しにすればどんなに強い相手にも指し分けにはできるという人間の知恵は偉大だと思う

**名無し名人** · 2018/12/10(月) 00:34:17.96

棋理に反する戦法の棋譜が欲しいなら
自分で金出してソフトが生きる環境を整えて
自分で指定局面まで動かして稼働させてみればいい

**名無し名人** · 2018/12/10(月) 00:51:54.05

>>520
振り飛車党のソフトはすでに作られてる

**名無し名人** · 2018/12/10(月) 00:55:24.49

これ本当にelmo？
Dolphin先生に言わせれば悪手連発なんだが

誰かelmo持ってる人棋譜解析してみてよ

**名無し名人** · 2018/12/10(月) 00:58:58.17

>>526
elmoもってても論文の条件の44スレッド120億ノードのelmoなんて再現できる人はおらんやろ

**名無し名人** · 2018/12/10(月) 01:09:57.60

囲碁と比べたら、そこまで驚くべき指し方はないな

**名無し名人** · 2018/12/10(月) 01:11:35.70

でもこれ論文？だったら検証はなんにせよしてみたいよなあ
同条件は無理でもエルモ用意してほんとにこうなるのかとか、他のソフトならどうなるのかとか

**名無し名人** · 2018/12/10(月) 01:20:53.62

Zeroの方どうすんねん

**名無し名人** · 2018/12/10(月) 01:24:19.53

自分がAlphaZeroの棋譜再現しようと思ってんだったら
elmoは乱数つかってるから棋譜通りの局面に進むとは限らんでｗ

まあ何百回かやったら同じ棋譜を再現できるかもしれんがなｗｗ

**名無し名人** · 2018/12/10(月) 01:30:26.94

>>528
自己学習を続けて頭打ちになるまでの期間が
チェス９時間
将棋１２時間
囲碁１３日間だからな

それだけゲーム性が奥深すぎて人間は囲碁を理解できてなかったってことだろ

**名無し名人** · 2018/12/10(月) 01:42:16.25

千田ですらヤムチャなんだからなｗ

**名無し名人** · 2018/12/10(月) 02:09:31.27

>>532
逆に将棋は持ち駒が使える割に、チェスと大して差は無かったということ。
理由は、持ち駒が使えるゆえに詰みやすい、引き分けにならないからだと思われる。

**名無し名人** · 2018/12/10(月) 02:19:47.42

でもこれだけソフトが強くなっても完全解析にはまだほど遠いんだろうな
完全解析を山の山頂だとするとAlphaZeroは２合目か３合目あたりだろうか

**名無し名人** · 2018/12/10(月) 02:28:01.64

これみたら将棋でもleelaプロジェクトを始める奴出てくるんじゃね？
leela chess zeroのコードがもうあるんだから、本質的には、あとは将棋のルールに変更するだけっしょ
最大の問題は将棋民がどれだけ協力するかだがｗ

**名無し名人** · 2018/12/10(月) 02:46:53.07

プロが採用しないような奇襲戦法を検討させてみたい
凄い発見があるかもしれん

**名無し名人** · 2018/12/10(月) 02:50:35.21

12時間以上学習しても強さ変わらんの？
マジ？

**名無し名人** · 2018/12/10(月) 02:51:25.25

>>535
山にも登ってないよ。アプローチが全く違う。

**名無し名人** · 2018/12/10(月) 02:51:52.23

なにこれ？
AlphaZeroっていうユーザー名はどこの国の人？
棋譜見たけどソフト使ってそうな怪しい指し方

**名無し名人** · 2018/12/10(月) 03:31:41.34

>>539
いや虱潰しに探索しまくるのと自己対戦による学習でアプローチが全く違うのは分かってるつもりなんだが
仮に完全解析したときの強さを１００としたら今は２０〜３０くらいなのかなって

**名無し名人** · 2018/12/10(月) 07:04:27.80

>>480
例えは分かりやすくないとな。お前の言うガイジってなんだ？

**名無し名人** · 2018/12/10(月) 07:36:19.86

枝刈り評価値上位３つぐらいで探索したとして５０手先の最強の手を予想する
場合は以下の局面数を評価しないといけないことになる。

3^50 = 717,897,987,691,853,000,000,000.0000
　　　 = 717,897,987,691,853 x 1兆局面だぞ！

これはどんな最強マシンでも不可能に思える。
だから単純な評価値のminmax法だけではすぐに完全な読みには限界がくる。
具体的には２０手ぐらいの評価値探索で打ち切る方法でどれぐらい節約できか
にかかっているかと思う。

そこまでの数学力がないので調べることがないが現時点での
探索みると深さ３７開始時に18,339,449,975(約１８３億）
探索みると深さ３８開始時に27,868,971,435(約２７０億）
掛かってる。　
枝刈りによる局面数増加を抑える仕組みがあるとしてこのまま１００億ノードで
深さが１づつ増えるのなら希望も持てるが果たしてどうなのだろうか？

**名無し名人** · 2018/12/10(月) 07:44:28.55

>>543
つまり長手数を読める人間は一時的にソフトを上回る手を指してもおかしくない？

**名無し名人** · 2018/12/10(月) 07:45:42.63

昨日の千田の解説みてると学習途中の棋譜見たそうだったな
角道開けなくなるってのは確かに謎だわ

**名無し名人** · 2018/12/10(月) 08:00:14.13

月刊チダンザみたいな番組作って定期的にやって欲しい

**名無し名人** · 2018/12/10(月) 08:10:24.46

１００局のNNUEKai7＋将棋所の連続棋譜解析が終了。ふう

**名無し名人** · 2018/12/10(月) 08:27:47.15

AlphaZeroが強いのはわかるがelmoのほうはプロ棋士より弱いね
一致率の平均が60%とか、平均悪手が60とか
何か設定を間違えたんではないかな
棋譜解析してみた感想です

**名無し名人** · 2018/12/10(月) 09:25:06.46

elmoは天彦に勝ったポナンザより強いぞ

**名無し名人** · 2018/12/10(月) 09:42:17.88

>>548
ソフト同士の対局で負けた方の一致率ってもっと高いものなの？

**名無し名人** · 2018/12/10(月) 09:44:55.18

1日でelmo越えるなら
それなりの時間学習したら
将棋ソフトで勝てるのいなくなりそう

**名無し名人** · 2018/12/10(月) 09:45:17.75

何との一致率だよw

**名無し名人** · 2018/12/10(月) 09:49:23.68

>>533
‪1時間で分かるドラゴンボール強さ順
https://youtu.be/iak6KPLWSf8 @YouTubeより‬

**名無し名人** · 2018/12/10(月) 09:50:28.68

>>547
解析するならGUI使うだろ

**名無し名人** · 2018/12/10(月) 09:51:18.34

>>542
ググれガイジw

**名無し名人** · 2018/12/10(月) 09:56:20.18

>>551
途中でサチって頭打ちになるだろう

**名無し名人** · 2018/12/10(月) 10:00:42.43

>>556
もちろん成長は限界あるだろうけど
elmoとドルフィンや狸の差ぐらいなら
1ヶ月もあれば越えないかな

**名無し名人** · 2018/12/10(月) 10:15:57.14

>>552
ああそうだよねｗ

**名無し名人** · 2018/12/10(月) 10:26:23.43

α的には角換わりは後手番有利って結論なの？

**名無し名人** · 2018/12/10(月) 10:32:07.32

人間の将棋とは別物なのがハッキリして良い

**名無し名人** · 2018/12/10(月) 10:43:16.83

>>559
後手で頑張れるのが角換わりぐらいで、先手はわざわざ角換わりにする必要がないと判断してるから先手で角道は開けない。

**名無し名人** · 2018/12/10(月) 10:47:06.21

>>559
角換りは後手に完全防御されたら　先攻できない
⇒　先手のメリットを生かせない戦法
人間のプロ将棋も、もうじき角換り離れが始まると思う

**名無し名人** · 2018/12/10(月) 10:57:39.20

全員同じ序盤戦術とるようになったら将棋中継は最初の1時間いらんな

**名無し名人** · 2018/12/10(月) 10:57:41.23

>>561
ん？先手76歩、後手84歩は僅かに残ってるけど、後手34歩は学習後ほぼ付かない
先手76歩も学習進めるほどつかないて話じゃなかったか？
だから後手で角換わりなんて戦型指さないのでは？

**名無し名人** · 2018/12/10(月) 11:01:23.75

既に、オセロは、wzebraに勝てる物は無いでしょ。

**名無し名人** · 2018/12/10(月) 11:16:33.65

オセロR907でAlphaZeroについて語ってるのは何monだよw

**名無し名人** · 2018/12/10(月) 11:17:54.61

先手から角換わりしない相掛かりや雁木はソフト同士でも後手不満なしと思ったが

**名無し名人** · 2018/12/10(月) 11:24:36.16

横歩を取られるのが嫌なんだな。
やはり俺の感覚は正しかったんだ！上級者は横歩とられるのが通っぽい感じだけど俺は横歩を取られるとすげえ腹立つw

**名無し名人** · 2018/12/10(月) 11:24:43.92

千田じゃなくて40代以上でＡやB1にいる棋士の見解聞いてみたい
その年代で上に残ってる人って柔軟な発想持ってそう

**名無し名人** · 2018/12/10(月) 11:29:23.69

将棋で一番難解な戦型と言われてる相がかりが結論か
角換わりから相がかりに人間も移行するんだろうな

**名無し名人** · 2018/12/10(月) 11:34:39.10

チェスだとポーン得できても同じ駒を序盤に何回も動かすのは良くない言われてるけど将棋は持駒を使える分、手得より駒得のほうがアド高いのかな？

**名無し名人** · 2018/12/10(月) 11:35:04.89

時代が山ちゃんに追いついたのだ

**名無し名人** · 2018/12/10(月) 11:42:33.79

あいがかりってなかなか定石化しないしやっぱり奥が深いんだろうな。
かくがわりとか横歩ってすぐハメられちゃうし

**名無し名人** · 2018/12/10(月) 11:42:39.78

「筋がいい」というのは誉め言葉でなく、
「弱い」の言い換えになっちゃう。

**名無し名人** · 2018/12/10(月) 11:51:54.68

筋悪の低級は筋がいいとでも言うつもりか？

**名無し名人** · 2018/12/10(月) 11:53:00.35

平成の次の年代は変態将棋が覇権を握るのか

**名無し名人** · 2018/12/10(月) 11:54:05.51

千田が紹介してたオルカの最新版
横歩の先手勝率の高さ。
角換わりは局数は多いけど先手勝率は0.167しかない。
コンピュータ将棋的に横歩は先手有利、角換わりは後手有利。
アルファは相掛かりを好み、角道は絶対開けないマンになるて事かな。
https://twitter.com/Rota_JP/status/1071568731191468033?s=09
https://twitter.com/5chan_nel (5ch newer account)

**名無し名人** · 2018/12/10(月) 11:54:32.83

みんな妄想ばかり書き込んでるからこのスレめちゃくちゃでワロタ

**名無し名人** · 2018/12/10(月) 11:56:10.19

かくがわりが後手遥かに有利ってのが興味深い。
後手が完璧に組めば先手の攻めが成立しないってことかな。
そうなると手詰まりになるから千日手が最善。

**名無し名人** · 2018/12/10(月) 11:57:57.44

>>577
定跡オフの角換わりはあてにならないよ。
それから、角換わり腰掛け銀26歩型、角換わり腰掛け銀25歩型、角換わり早繰り銀、その他で分類するべきだよ。
角換わりで全てひとまとめにするのは暴論だね。

**名無し名人** · 2018/12/10(月) 12:00:10.35

>>577
プロでも25歩突いての角換わりは後手の方が勝率高いよね
25歩が邪魔になって手待ち作戦に対して明快な攻めがない
26歩型は先手有利だが今度は角道閉じて雁木にされるとこれも後手がややいい
相掛かりは自由度が高すぎて先後関係なく棋力差が一番反映されやすい感じかな

**名無し名人** · 2018/12/10(月) 12:02:22.28

>>576
理解ではなく感じる系が覇権

**名無し名人** · 2018/12/10(月) 12:06:49.31

「Pythonで書かれたAlphaZeroを動かして三目並べを学習させてみる」とか
「三目並べをAlphaZeroで学習させる」とかのページがあるんで
誰が一番初めにAlphaZero将棋を動かしてみるかだね。

やっぱりポナンザの人が一番最初かな

**名無し名人** · 2018/12/10(月) 12:09:23.69

結果的に雁木が角換わりを潰したのか

**名無し名人** · 2018/12/10(月) 12:14:08.56

>>581
本当に雁木がいいのか？w
雁木が悪いだろw

**名無し名人** · 2018/12/10(月) 12:14:55.15

雁木(笑)

**名無し名人** · 2018/12/10(月) 12:15:13.08

▲２六歩、▲２五歩の後は、▲９六歩らしいよ、AlphaZero的には

**名無し名人** · 2018/12/10(月) 12:15:53.27

>>583
既にコンピュータ囲碁で有名（将棋でいうBonanza保木さんクラス）なフランスのRemiさんが動かしてて、来年の選手権への参戦を表明してる（今年の選手権にも参戦したものの、学習時間不足により敗退）

**名無し名人** · 2018/12/10(月) 12:16:56.69

最近プロで採用数の減っている雁木

**名無し名人** · 2018/12/10(月) 12:17:08.60

相掛かりは、やっぱり人間のレベルでは先手の優位を維持するのが難しそう。
プロの先手後手の勝率の差が縮まるんじゃないか。

**名無し名人** · 2018/12/10(月) 12:17:11.00

このYouTubeチャンネルで解説されるのを待っているのだけれど、いつになったら投稿するかどうか

suimonの将棋チャンネル
https://www.youtube.com/user/BGVN1127

**名無し名人** · 2018/12/10(月) 12:17:20.26

>>578
妄想の話が捗るのは仕方ないだろ
裏を返せばゼロの棋譜が期待はずれって事

**名無し名人** · 2018/12/10(月) 12:18:48.26

>>544
一応補足しとくと、ソフトも一本道で深く読むこともやってる
もちろん人間より精度は落ちると思うけど

**名無し名人** · 2018/12/10(月) 12:22:19.89

>>589
先手雁木は不利だし
25歩まで突かれると後手も雁木できないからね
雁木は角換わり拒否の２の矢でしかない

**名無し名人** · 2018/12/10(月) 12:22:57.12

グーグルのマシンじゃなく、現在世界一の米国のスパーコンピュータサミットで動くアルファーゼロ作れば良いのに作らないのは、単にお金の問題なのか？
そのクラスのコンピュータ選手権開催すれば良いのに

**名無し名人** · 2018/12/10(月) 12:23:23.81

zeroが期待外れって言ってる人は、どんなものを期待していたのかね。
斬新な序盤戦術？玉で攻めるとか、序盤で大駒を捨てるとか？

**名無し名人** · 2018/12/10(月) 12:24:16.06

AlphaZeroの終盤が変なのは、AlphaZeroがバグっているからか、まだ伸びしろが残っているかだと思う
たぶんバグってはいる

**名無し名人** · 2018/12/10(月) 12:26:11.16

定跡無しで自己学習だからね。
序盤に関しては一体何じゃこりゃっていうアルファ碁並の衝撃は期待してた人は多かったんじゃないかな。

**名無し名人** · 2018/12/10(月) 12:26:27.07

今の将棋ソフトの流れとは違うものがないか期待したんだろうが
近い結論になったのが気に入らないんだろう
ただ人間的には薄い玉で殴り合うのは限界があるだろうが

**名無し名人** · 2018/12/10(月) 12:26:35.50

>>597
バグってないよ
終盤緩むのはMCTSアルゴリズムの特徴で、囲碁でも同様の現象が確認されてる

**名無し名人** · 2018/12/10(月) 12:30:47.12

>>584
anti_何ちゃらって人が角換わりは打開できる打開できるってツイートしてたから、角換わりが打開できないなら、結果的にAlphaZeroがanti_何ちゃらさんを潰したことになるね。

**名無し名人** · 2018/12/10(月) 12:30:49.87

将棋の浅さが囲碁と比較して露呈したのが気に入らないんだろう

**名無し名人** · 2018/12/10(月) 12:31:49.12

>>601
suimonとアンチの戦いはコンピュータ代理戦争と言えよう

**名無し名人** · 2018/12/10(月) 12:32:49.67

悪手を一手も指さないいわば「将棋の神」とアルファゼロとの棋力の差はどのくらいあるんだろうね。

**名無し名人** · 2018/12/10(月) 12:33:51.94

https://imgur.com/a/ElCuC1u

AlphaZeroがelmo(2017年5月版)に負けた将棋
AlphaZeroの駒組みが無策すぎてワロタ

AlphaZeroの序盤は参考にならないな

**名無し名人** · 2018/12/10(月) 12:33:56.25

まあ将棋を深くしようと思えば、マスと駒の種類を増やせばいいわけで、
別に浅くても気にする必要はないだろ。

**名無し名人** · 2018/12/10(月) 12:35:46.65

長年セルフじょうせきになってた５手目9六歩がこれから流行りそうで嫌や

**名無し名人** · 2018/12/10(月) 12:36:56.18

>>602
将棋より囲碁の方が単純に手のパターンが上だからね
ただ将棋の恐ろしさは一手のミスで簡単に逆転が起きるところ
人間がやるところに魅力がある

**名無し名人** · 2018/12/10(月) 12:42:33.75

>>600
なるほどね！
でも、平岡さんはツイッターでAlphaZeroの入玉判定にバグがあることを指摘している

**名無し名人** · 2018/12/10(月) 12:44:39.47

バグってるというか汎用学習ルーチンだから入玉宣言法なんて知らないんじゃないのか？

**名無し名人** · 2018/12/10(月) 12:46:12.70

入玉のルールは覚えさせてるのかね

**名無し名人** · 2018/12/10(月) 13:02:02.25

>>609
終盤の話してたはずなのに入玉の話だったのか？

**名無し名人** · 2018/12/10(月) 13:06:39.35

>>605
これって仕掛け決まってんの？
２２銀２４歩同歩同飛４４歩でわからん。
まさか２２飛車なりから３１角で決まってんの

**名無し名人** · 2018/12/10(月) 13:11:53.49

AlphaZeroは、最初の頃、初手▲7六歩で角道を開けてたが
何度もやっているうちに開けなくなったという報告があるな

千日手になりやすい角換わりを避けるために
相掛かりを志向し始めたのか知らんが

それで相掛かりを拒否されて角換わりになって負けてる棋譜がある
もう1周くらいしたら角換わりを拒否できる先手矢倉を志向し始めるんだろうか

**名無し名人** · 2018/12/10(月) 13:17:13.34

>>613
31角なら32金53角成同金同桂成52歩かな？さすがに切れてんじゃね？