▲コンピュータ将棋スレッド145

**名無し名人** (ｵｲｺﾗﾐﾈｵ MM27-ArCb) · 2018/12/06(木) 01:26:53.92

↑スレ立て時は1行目と2行目に「!extend:checked:vvvvv:1000:512」をコピペして立てて下さい
荒らし対策のために強制コテハン（ワッチョイ）を表示するコマンドです

第28回世界コンピュータ将棋選手権参加チーム
https://www.apply.computer-shogi.org/wcsc28/team.html
詰将棋メモコンピュータ将棋２０１８
http://toybox.tea-nifty.com/memo/2018/01/post-0205.html
世界コンピュータ将棋選手権参加ソフトリンク集
http://www.ne.jp/asahi/tetsu/toybox/soft/softlink.htm
floodgate 最新２週間レーティング
http://wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html
コンピュータ将棋協会
http://www.computer-shogi.org/
コンピュータ将棋
http://ja.wikipedia.org/wiki/コンピュータ将棋
コンピュータ将棋まとめサイト(コンピュータ将棋レーティング)
https://www.qhapaq.org/shogi/

※前スレ
▲コンピュータ将棋スレッド143
https://mevius.5ch.net/test/read.cgi/bgame/1540817996/_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured

VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured

**名無し名人** (ﾜｯﾁｮｲ d390-9nNR) · 2018/12/09(日) 08:30:47.36

>>226
まじか
いつ発言されたのかは知らないが、本当だとしたらかなり鋭い分析だね。
Alphazeroのaperyqhapaqとの勝率とも合致する

**名無し名人** (ﾜｯﾁｮｲ 5b51-n9Ol) · 2018/12/09(日) 08:47:22.32

囲碁界の人は謙虚に棋譜から学ぼうとしてたのに
将棋界は文句しか言わねえなあｗ

**名無し名人** (ｱｳｱｳｸｰ MM4d-vEJO) · 2018/12/09(日) 09:39:12.21

前回の論文の問題点をほぼほぼ解消したのにまだ叩かれるAlphaZeroかわいそう

**名無し名人** (ﾜｯﾁｮｲ 1375-n9Ol) · 2018/12/09(日) 10:04:43.83

そもそもpreprintって正式な論文の前段階だからな

**名無し名人** (ﾜｯﾁｮｲ d390-9nNR) · 2018/12/09(日) 10:15:46.74

そうですね。まぁ査読を出す前の論文ですし。
いろんな指摘があるのはいいこと

**名無し名人** (ﾌﾞｰｲﾓ MMab-Rj2N) · 2018/12/09(日) 10:24:18.02

そもそも論として
数十億ノードの世界でorqhaやNNUEkai7がelmoよりも強いという保障もない
検討用途を考えたら億単位のノードでの強さが最重要だから
それを証明してみせたAlphaZeroが現状では頂点でしょう

>>228
120億ノードは自分の計算ミスで
実際にはelmo側は1手30億ノードくらいっぽい

**名無し名人** (ｻｻｸｯﾃﾛﾗ Spcd-eAYQ) · 2018/12/09(日) 10:39:09.98

depth32ですら中盤だと50億ノードくらい読むことあるからな
depth40で1億教師作れればalphazeroを軽く超えられるんだろうが現実的じゃない

**名無し名人** (ﾜｯﾁｮｲ 492b-pfIc) · 2018/12/09(日) 10:50:46.50

コンピューター将棋ってコンテンツが低レベルなガラパゴスコンテンツ過ぎてオワコンだなー
googleが汎用プログラムで12時間学習させるだけでガラパゴス王者をフルボッコｗ
井戸の中の蛙なことを知らずにお釈迦様の手のひらの上でイキってる孫悟空だな

**名無し名人** (ﾜｯﾁｮｲ 197c-n9Ol) · 2018/12/09(日) 10:59:18.19

>>209

これ見るとAlphpaZeroは44コアのマシン1台と第1世代TPUx4
elmoは44コアのマシン1台

だよね？

**名無し名人** (ﾜｯﾁｮｲ 2b61-u+MK) · 2018/12/09(日) 11:09:18.04

そうだけど
Stockfish is designed to exploit CPU hardware and cannot make use of GPU/TPU, whereas
AlphaZero is designed to exploit GPU/TPU hardware rather than CPU.

**名無し名人** (ﾜｯﾁｮｲ b37e-pji+) · 2018/12/09(日) 11:18:02.42

最近ついにstockfishのVer10がリリースされた
某将棋エンジンと違い確実にレートが上がって
いるようだ　このチームに将棋エンジンも作って
ほしいな

**名無し名人** (ｴﾑｿﾞﾈ FFb3-EzUf) · 2018/12/09(日) 11:47:07.22

今はもうstockfishの最新を反映させても対して強くならないよ

**名無し名人** (ﾜｯﾁｮｲ 31b3-7LmC) · 2018/12/09(日) 11:52:05.40

将棋とチェスでは中盤に入ってからの展開がかなり違うからな
stockfishと同じように枝を刈ってもそうそう劇的に強くならないだろう

**名無し名人** (ﾜｯﾁｮｲ d390-9nNR) · 2018/12/09(日) 12:01:51.57

ロタ
@Rota_JP
【orqha1018は横歩取りの後手番を持たない】

次のWCSCでは横歩取りは消滅する予感

**名無し名人** (ﾜｯﾁｮｲ 5b1b-yUOw) · 2018/12/09(日) 12:17:31.74

ロタ如きが何を偉そうに

**名無し名人** (ﾜｯﾁｮｲ 1375-n9Ol) · 2018/12/09(日) 12:22:47.87

青野流は先手勝率７、８割の世界だからな
最低限対策（△7四飛）を調べてからじゃないと後手は大損するだけ

**名無し名人** (ﾌﾞｰｲﾓ MMab-Rj2N) · 2018/12/09(日) 12:23:38.32

「消滅する予感」の部分は本人言ってないぞ
風評被害はやめよう

**名無し名人** (ﾜｯﾁｮｲ 1375-n9Ol) · 2018/12/09(日) 12:28:13.82

とは言っても去年の選手権のときに横歩取りの青野流は二局あって実は先手が負けているんだよな。
ハードが強力になれば事前のデータ通りにいかない可能性もある

**名無し名人** (ﾜｯﾁｮｲ 31b3-7LmC) · 2018/12/09(日) 12:31:19.26

常にdepth34くらいまで読める状況なら後手にもまだいい手があるかもしれないしな

**名無し名人** (ﾜｯﾁｮｲ 898a-pji+) · 2018/12/09(日) 12:55:06.98

alphazeroはチェスのDeep Blueの衝撃には遠く及ばない
https://www.youtube.com/watch?v=6EsO4mO9B5M

alphazeroはElmoを少し超えただけだった
https://www.mikunimaru.com/entry/2017/12/06/142754
既にalphazeroと同等のPCソフトが登場している

**名無し名人** (ｽﾌﾟﾌﾟ Sdb3-P7Tn) · 2018/12/09(日) 13:13:45.97

トロシュナの新馬戦の大外一気がすごいとワイの中で話題に‪

2018年10月21日　新潟5R　2歳新馬牝　トロシュナ
https://youtu.be/mh_Vf8DEAj0 @YouTubeより‬

**名無し名人** (ﾜｯﾁｮｲ 49eb-+wPc) · 2018/12/09(日) 13:22:54.45

実際問題、白ビールやPALのようなアンチコンピューティングに長けたソフトが
十分な設備・定跡ONでぶつかればAlphaZeroもそこまで圧倒的大差をつけることは出来ないと思うけどな
AlphaZeroの指し方はいかにも未完成でスキがある　近いレーティングのソフト相手にあのような舐めプが通じるだろうか？
AlphaZeroの学習がサチってるなら1年以内には追い越すだろう

**名無し名人** (ﾜｯﾁｮｲ 1375-n9Ol) · 2018/12/09(日) 13:27:06.00

なめぷなのはかなり差がついてからだよ。

**名無し名人** (ｱｳｱｳｶｰ Sa9d-bEj7) · 2018/12/09(日) 13:47:11.52

AlphaZeroは80ブロックのネットワークを使えばもっと強くなるのかな？
もちろん学習に必要な計算量が多すぎるけど

**名無し名人** (ﾜｯﾁｮｲ f9c3-mXnG) · 2018/12/09(日) 13:57:28.44

AlphaZeroは、全くの自力の学習で強くなるよと示す論文であって、縛りプレイしてるから、
もっと効率的に学習することそのものは可能。
たとえば、最初はElmoの出す教師局面の評価値から学習して、その後自己対戦で学習、
とするだけで基本的な戦略の獲得のところはすっ飛ばせて、
最終レート到達までの時間やステップ数は早められる。
ただ、学術的にはそんな将棋ソフト用の特殊な学習の仕方をしても意味が無くて、むしろ、汎用的に学習できるよと示すために
あえて多少非効率でも自己対戦のみという縛りプレイでやってるんだよ。
強くすることそのものが目的の各種将棋ソフトとはその点で成り立ちが違う。

**名無し名人** (ﾜｯﾁｮｲ f9c3-mXnG) · 2018/12/09(日) 13:59:24.73

せっかく羽生竜王に協力してもらうなら、
桂馬が横にも飛べるルールで自己対戦学習したAlphaZeroと羽生竜王との対局とかして欲しかったな。

**名無し名人** (ﾜｯﾁｮｲ 1375-n9Ol) · 2018/12/09(日) 14:06:26.36

勝勢になってからなめぷなのはランダムに全部の手を学習させて勝率だけしか評価されてないから。
華麗な最短の寄せだろうが形勢が悪くならない悪手だろうが等価になる。

**名無し名人** (ﾜｯﾁｮｲ 199e-Jax/) · 2018/12/09(日) 14:40:17.38

>>253
だよね
汎用的な学習という戦略の評価なのにアウトプットの優劣つけて騒いでるの馬鹿みたい

**名無し名人** (ﾜｯﾁｮｲ 199e-Jax/) · 2018/12/09(日) 14:44:25.97

羽生とはNHKの取材通じて接触があったしこういうときに一番業界で有名な人を釣りだすのが
いつものDM／Googleのやり方なんでいってもしょうがないのだが
相掛かりスキーということで羽生でなく郷田に棋譜選定してもらいたかったな、てのだけが憾み

**名無し名人** (ﾜｯﾁｮｲ 41b3-xpW6) · 2018/12/09(日) 15:50:46.04

新しいハードの開発は個人じゃ限界があるし、google先生に遅れをとるのはしゃーない。
これからはTPUで開発する時代になるんだろうか。知らんけど
あえてCPUにこだわる利点は?

**名無し名人** (ﾜｯﾁｮｲ 19dc-3M3s) · 2018/12/09(日) 16:09:06.31

>>252
たぶん微差だと思うよ。
強くするために必要なパラメータ数はたぶん指数関数的に増えていくから、２倍にしてもたいして変わらんと思う。

**名無し名人** (ｽｯﾌﾟ Sdf3-q7Tr) · 2018/12/09(日) 16:14:40.53

>>236
>googleが汎用プログラムで12時間学習させるだけでガラパゴス王者をフルボッコｗ

Googleが専門家を集めて組織的に数年前に渡り開発したソフトが、個人が趣味で数ヶ月間？で開発したソフトに勝率9割くらいだった
ディープラーニングの実験だったとは言え開発効率ではelmoが優っていた
elmoに勝率が99.99%くらいでないと互角ではないと思う

**名無し名人** (ﾜｯﾁｮｲ 41b3-xpW6) · 2018/12/09(日) 16:26:49.96

やたらelmoばかりが比較対象になるけど
そろそろaperypaqに9割のほうがよくないかね

**名無し名人** (ﾜｯﾁｮｲ 2b61-u+MK) · 2018/12/09(日) 17:26:21.38

>>242
定跡使って横歩除いたら勝率の悪い後手横歩を回避しないNNUEkai7のほうが強い可能性あるよね

**名無し名人** (ﾜｯﾁｮｲ 31b3-7LmC) · 2018/12/09(日) 17:32:09.26

今のレーティングの数字って横歩にかなり左右されてるからな実際

**名無し名人** (ﾜｯﾁｮｲ 1375-n9Ol) · 2018/12/09(日) 18:02:28.84

相掛かり系でもちょっと変わった手順前後で横歩取りに誘導できるときもあるから
後手の横歩を完全に避けるのはけっこうめんどいよ

**名無し名人** (ﾜｯﾁｮｲ ab9f-n9Ol) · 2018/12/09(日) 18:44:43.86

>>253
AlphaZeroが青野流や雁木を自分で見つけたのはいいんだが，
振り飛車は自己学習で対戦した上で，勝率悪くて不利だとして指してないのかね？

AlphaZeroに対して先手中飛車やノーマル振り飛車が通用しないのかは，ちと気になる。

**名無し名人** (ﾜｯﾁｮｲ 898a-pji+) · 2018/12/09(日) 20:03:01.76

第29回世界コンピュータ将棋選手権の余興で、AlphaZero　ｖｓ　優勝ソフトの三番勝負はどうだろうか
優勝ソフトの圧勝で決着すると思うが、実現したら面白そうだ

**名無し名人** (ﾜｯﾁｮｲ 2b67-aglF) · 2018/12/09(日) 20:14:08.60

読みが勝ってれば勝てるゲームで勝率が100%に近くならない時点で強さ論ずる意味があるのかは疑問だが
99.999%位いって当たり前じゃね?

**名無し名人** (ﾜｯﾁｮｲ b37e-Ae4l) · 2018/12/09(日) 20:46:32.00

>>266
本当に自信があったら正式に参加するだろうし
その逆だったら余興にも参加しないだろう

**名無し名人** (ﾜｯﾁｮｲ 199e-Jax/) · 2018/12/09(日) 20:59:08.97

>>258
TPU使ってるのは画像分析／深層学習を前提としたシステムだからで
そうでない従来型のソフトがTPU使っても意味ないんじゃね

**名無し名人** (ﾜｯﾁｮｲ 937c-SnoT) · 2018/12/09(日) 21:23:36.46

このスレをコピペて荒らしてるの誰なんだろな
無関係なスレを張ったりしてるところを見ると囲碁板をあらしてる奴と同一人物ぽいが

**名無し名人** (ﾜｯﾁｮｲ 914a-qQ+0) · 2018/12/09(日) 21:31:42.29

千田の番組月刊でやってほしいわ

**名無し名人** (ﾜｯﾁｮｲ 41b3-uoKk) · 2018/12/09(日) 22:57:16.42

消費電力でも負けるとなるとCPUの長所が分からなくなってくる。動作が軽い？

**名無し名人** (ﾜｯﾁｮｲ 41eb-OBpN) · 2018/12/09(日) 23:02:23.85

汎用性

**名無し名人** (ﾜｯﾁｮｲ 31b3-7LmC) · 2018/12/09(日) 23:08:38.89

個人が手軽に使うならやっぱりCPUがいいよね

**名無し名人** (ﾜｯﾁｮｲ 1375-n9Ol) · 2018/12/09(日) 23:12:15.69

アルファ碁のときも言われていたけど実際には何十手先も先の局面を読んでるわけじゃないのに
直観力が優れているからあたかも読んでいるかごとくの指し手を選ぶことがあるってことなんだよね？
実際に読んでいる局面の量はかなり少ないわけなんだから

**名無し名人** (ﾜｯﾁｮｲ 31b3-7LmC) · 2018/12/09(日) 23:19:24.30

各局面での感覚が随分違うんだろうなとは感じたね

**名無し名人** (ﾜｯﾁｮｲ 41b3-uoKk) · 2018/12/09(日) 23:21:09.73

マシンパワーに押されてほとんどふさがれてるけど例外に弱いという弱点もある、
とも言われてたと思う。

**名無し名人** (ﾜｯﾁｮｲ 1375-n9Ol) · 2018/12/09(日) 23:36:46.60

１２番の▲7六歩ってついたの普通のソフトだとずっと先手不利な状態が続くね。。
千田解説にあった▲8三角とか▲4一角の超絶攻防手を知ってないと絶対に指せない手だからな。。

後手の持駒：歩二
９８７６５４３２１
+---------------------------+
|v香v桂・v金v玉・v銀v桂v香|一
| ・・v銀・・・v金v角・|二
| ・・v歩v歩v歩v歩・・v歩|三
|v歩・・・・・v歩飛・|四
| ・v飛・・・・・・・|五
| 歩・・・・・歩・・|六
| ・・歩歩歩歩・・歩|七
| ・角金玉・・銀・・|八
| 香桂銀・・金・桂香|九
+---------------------------+
先手の持駒：歩二

**名無し名人** (ﾜｯﾁｮｲ 197c-n9Ol) · 2018/12/09(日) 23:44:45.61

AlphaZeroの消費電力は TPU x4 だけじゃなくて
それにプラス44コアCPUの消費電力も加算だから
elmoよりTPU分消費電力は多いよ

**名無し名人** (ﾜｯﾁｮｲ 1375-n9Ol) · 2018/12/09(日) 23:54:55.49

この６万npsっては読みの深さはどれくらいなんだろ？かなり枝狩りするのか他のソフトと同じ程度の枝狩りなのか知りたい

＞AlphaZeroはMCTSを使うことで、例えばチェスではチャンピオンのStockfishが1秒当たり
＞約6000万のポジションを検索するのに対し、わずか6万しか検索せずに済むという。
http://www.itmedia.co.jp/news/articles/1812/09/news018.html

**名無し名人** (ﾜｯﾁｮｲ f9c3-mXnG) · 2018/12/09(日) 23:57:35.72

なんで電力あたりの強さなんて評価で見てるんだ。
AlphaZeroのアーキテクチャだと、TPUの方ばっかり回って
CPUはスカスカの稼働率かも知れないから、実際のところの使用電力なんか分からんよ。
TPUは流石に100%使い切るだろうけど、両方を100%使い切ることはなかなか難しい。

**名無し名人** (ﾜｯﾁｮｲ abe9-N9aG) · 2018/12/10(月) 00:08:36.20

消費電力はともかく、TPU 1基が180T FLOPSで、4基だと720T FLOPS
かたや48コアPCでも3T FLOPSぐらいしかないので
単純計算だと240倍ぐらい演算能力が違うように思うけど…
（実際はそこまでの差ではない？）

**名無し名人** (ﾜｯﾁｮｲ f9c3-mXnG) · 2018/12/10(月) 00:10:03.44

重いけど正確な評価関数で少なく局面を読むAlphaZeroと、
軽いけど精度が粗い評価関数で大量に読むこれまでのソフト、という構図。
現状の既存の将棋ソフトの構造では局面の評価値の精度はAlphaZeroに圧倒的に及ばない。
どっちの方向に将来的を感じるかと言ったら、より高精度な評価関数を持ちうるAlphaZeroの方。
AlphaZeroの方は精度をあまり落とさず更に軽量化して方向もある(ニューラルネットの軽量化は既にある手法)だろうし。

**名無し名人** (ﾜｯﾁｮｲ 41b3-uoKk) · 2018/12/10(月) 00:28:23.54

NNUEはどちら側なんだか。KPPTは見かけなくなったな

**名無し名人** (ﾜｯﾁｮｲ d9e7-5nnA) · 2018/12/10(月) 07:06:34.91

「AlphaZero」がチェス、将棋、囲碁の各世界最強AIを打ち負かす
AlphaZeroはこの方法で、チェスを9時間学習した後チェスの世界チャンピオンAI「Stockfish」を、将棋を12時間学習した後世界コンピュータ将棋選手権の2017年の勝者「elmo」に、囲碁を13日間学習した後AlphaGo Zeroに勝利した。

http://www.itmedia.co.jp/news/articles/1812/09/news018.html

**名無し名人** (ﾜｯﾁｮｲ 53e7-n9Ol) · 2018/12/10(月) 07:37:49.96

枝刈り評価値上位３つぐらいで探索したとして５０手先の最強の手を予想する
場合は以下の局面数を評価しないといけないことになる。

3^50 = 717,897,987,691,853,000,000,000.0000
　　　 = 717,897,987,691,853 x 1兆局面だぞ！

これはどんな最強マシンでも不可能に思える。
だから単純な評価値のminmax法だけではすぐに完全な読みには限界がくる。
具体的には２０手ぐらいの評価値探索で打ち切る方法でどれぐらい節約できか
にかかっているかと思う。

そこまでの数学力がないので調べることがないが現時点での
探索みると深さ３７開始時に18,339,449,975(約１８３億）
探索みると深さ３８開始時に27,868,971,435(約２７０億）
掛かってる。　（候補手１の場合で候補手３の場合はこの３倍かかる）
枝刈りによる局面数増加を抑える仕組みがあるとしてこのまま１００億ノードで
深さが１づつ増えるのなら希望も持てるが果たしてどうなのだろうか？

**名無し名人** (ﾜｷｹﾞｰ MM6b-/Ctd) · 2018/12/10(月) 08:06:22.15

>>278
*kifu for windows に張り付け
後手の持駒：歩二
９８７６５４３２１
+---------------------------+
|v香v桂・v金v玉・v銀v桂v香|一
| ・・v銀・・・v金v角・|二
| ・・v歩v歩v歩v歩・・v歩|三
|v歩・・・・・v歩飛・|四
| ・v飛・・・・・・・|五
| 歩・・・・・歩・・|六
| ・・歩歩歩歩・・歩|七
| ・角金玉・・銀・・|八
| 香桂銀・・金・桂香|九
+---------------------------+
先手の持駒：歩二
*▲８七歩だと塚田スペシャル風手順で後手有利
▲８七歩 △９五歩 ▲同　歩 △９六歩 ▲同　香 △８六歩
▲同　歩 △同　飛 ▲８七歩 △９六飛
*なので▲７六歩は必然だが▲８三角とか▲４一角の超絶攻防手があって後手ペースか
*でも▲８三角とか▲４一角はムズイな

**名無し名人** (ﾜｯﾁｮｲ e18a-e/g/) · 2018/12/10(月) 15:47:49.24

287の図で考えることは…
・▲7六歩△8八角成る▲同銀△3三角▲8六歩△同飛▲8七歩
　こう進んだ時の持ち角の価値と歩の数の差　（と評価値）
・▲8七歩△9五歩▲同歩△9六桂のとこからの変化
　▲3七桂△9五飛▲3四飛とか
　▲7六歩△9五飛▲3四飛とか
　飛回りが消えてるから人間同士なら前者選びそう
　後者は乱戦というか盤面全体の戦いと言うかに持ち込んで
　端をぼかしてしまおうという高等戦術だね
　この辺を突き詰めて調べると評価値どうなるかだなあ

**名無し名人** (ﾜｯﾁｮｲ ab9e-xqdQ) · 2018/12/10(月) 19:00:11.45

俺も >>286 と同じで数学の証明問題が苦手で教えて欲しいんだが
>>11
の駒落ち必勝手順の証明で
「裸王では、下手が偶数手目に78飛76歩75歩74歩73歩成72と73飛成33角成と指せば、17手目に上手玉がどこにあっても残り3手で詰みである。」

これは「20手以下で必勝」という必勝手順の証明だが、最善手の証明ではない
最善手と証明するには、18手以下の必勝手順は無いと証明しないといけないって事でOK？

**名無し名人** (ｱｳｱｳｳｰ Sa05-0KWN) · 2018/12/10(月) 19:17:02.18

>>289
最善手の定義とは何？
詰将棋においては手数は大事だけど
指し将棋においては手数はスコアに影響しない

**名無し名人** (ﾜｯﾁｮｲ 5b1b-yUOw) · 2018/12/10(月) 20:35:31.87

ロタって1500万ノード厨の典型的ガイシで
AlphaZeroの棋譜を妄信するｗ
お前の1500万とAlphaZeroや現実の対戦するノードと剥離があるのすら理解できてない
今まで1GBで計測してて疑問視されてたのに急に変える能無し
レーティングサイトはuuunが苦肉で決めた基準なのに個人の主観入ってる時点でクソ
河童もパクられるのムカツク発言してたのに野良パクって平岡に苦言される始末
AlphaZeroの棋譜でてイキッてるマウントガイジしかいない

**名無し名人** (ｽﾌﾟﾌﾟ Sdb3-o+3q) · 2018/12/10(月) 20:38:48.75

ガイジは黙っててね

**名無し名人** (ﾜｯﾁｮｲ 41b3-uoKk) · 2018/12/10(月) 20:40:44.12

AlphaZeroをageるにしてもsageるにしてもなんかこう毎回極端というか
それはそうと河童絞りDepth16が地味に気になる

**名無し名人** (ﾜｯﾁｮｲ 31b3-7LmC) · 2018/12/10(月) 20:49:22.32

あれだけ計算資源投入した棋譜なんてそうそう作れないから、それだけでかなり価値があると思うんだがな
ここのところ毎回評価関数ではトップのもの作ってるし河童絞りは優秀だよな

**名無し名人** (ﾜｯﾁｮｲ f9c3-TQQH) · 2018/12/10(月) 21:06:33.67

>>246
それは単に青野流先手の定跡の作り込みが甘かっただけでしょ？
PALや白ビールは後手で持っても相手がそこにハマれば勝てる定跡を持ってた

**名無し名人** (ﾜｯﾁｮｲ f9c3-TQQH) · 2018/12/10(月) 21:09:20.58

>>266
デイビッド・シルバーを読んで論文の報告会を開いてもらうのが一番ためになりそう
そこでWCSCの様子を見て面白いと思えばなにが進むかもね

**名無し名人** (ﾜｯﾁｮｲ f9c3-TQQH) · 2018/12/10(月) 21:26:26.89

ニューラルネットワークとMCTSの終盤については今やってるTCEC見てると、
176スレッドのストックフィッシュが早々に評価値ゼロのドローを示してる時に
LeelaChess0は自分に+6.0とかの圧勝の数値を出してたりするんだよなあ

**名無し名人** (ﾜｯﾁｮｲ 31b3-7LmC) · 2018/12/10(月) 21:27:28.57

elmoに76歩を強要してるせいでalphazeroの後手番での真の力がイマイチわからない感あるのが残念
普通にやらせるとわりと負けるんだったらalphazeroはかなり後手番苦手ってことになるがどうなんだろう
自分は絶対76歩突かないくせに相手には必ず突かせるってちょっとひどすぎるよな

**名無し名人** (ﾜｯﾁｮｲ 49eb-+wPc) · 2018/12/10(月) 21:29:40.80

elmoが対戦相手としては弱すぎて何にも分からんというのが実際のところ
せめてAperypaqの棋譜が公開されていれば…　それでも弱すぎるが…

**名無し名人** (ﾜｯﾁｮｲ 1375-n9Ol) · 2018/12/10(月) 21:39:27.10

>>295　記憶違いしてたみたい。強い相手だと調べたらこんな感じだった。たぬき戦は決勝で定跡ではめたけど終盤力で負けたってのがあった

第五回電王トーナメント決勝
たぬき戦に負け　Yorkieに２５６手で勝ち（例の騒動になったの）
第28回世界コンピュータ将棋選手権
Apery戦に２５６手で引き分け

**名無し名人** (ﾜｯﾁｮｲ 2b61-u+MK) · 2018/12/10(月) 21:58:24.06

>>291
1500万前後のノードならhash1GBでも十分じゃないの

**名無し名人** (ﾜｯﾁｮｲ 4b9f-0EIi) · 2018/12/10(月) 22:00:39.36

囲碁みたいに自己対戦の棋譜出してくれればいいんだけどな
双方入玉が多そうやがｗ

**名無し名人** (ﾜｯﾁｮｲ 1375-n9Ol) · 2018/12/10(月) 22:03:57.65

２５６手で引き分けになるっていうルールも学習してくれたら
終盤や入玉の指し口も変わったんじゃないかな

**名無し名人** (ﾜｯﾁｮｲ f9c3-TQQH) · 2018/12/10(月) 22:22:29.42

選手権に向けては320手ルールでの学習が必要なのか

**名無し名人** (ﾜｯﾁｮｲ db6e-dQ1q) · 2018/12/10(月) 22:29:23.61

選手権もまた手数制限無しの切れ負けルールになるかもしれないし

**名無し名人** (ﾜｯﾁｮｲ 41b3-uoKk) · 2018/12/10(月) 23:01:24.30

囲碁だけど絶芸の80ブロックってAlphaZeroの倍だったのか・・・
次元が違い過ぎてどっちがどれだけ強いのかまったくわからん

**名無し名人** (ｽﾌﾟﾌﾟ Sdb3-P7Tn) · 2018/12/10(月) 23:53:28.16

floodgateも選手権のテストに使用されるなら320手ルールを導入した方がいい気がする

**名無し名人** (ｽﾌﾟﾌﾟ Sdb3-P7Tn) · 2018/12/10(月) 23:56:52.25

floodgateの棋譜が定跡作成や学習に使用されることがあるかもしれないし

**名無し名人** (ﾜｯﾁｮｲ 898a-yUOw) · 2018/12/11(火) 00:04:49.08

盤面の評価値には手数の概念はない。

２５６手や３２０手で引き分けになるというのは、千日手と同様に
探索部で判断すべきこと。

**名無し名人** (ｽﾌﾟﾌﾟ Sdb3-P7Tn) · 2018/12/11(火) 00:21:12.73

>>309
シボレーでresign varueを下げて学習させた評価関数は入玉が下手になっていた。
直接的な評価で手数は関係なくても、学習などで影響が出る可能性がある。

**名無し名人** (ﾜｯﾁｮｲ ab9f-6hef) · 2018/12/11(火) 01:08:49.74

>>299
というか、一本調子なのが。
AlphaZeroに勝てないな～と思ったら、
戦法変えて奇襲したりいろいろやってほしい。

まあ敗局自動学習しないと無理…
大昔のやねうらおもてなし定跡って
どうしたんだっけ。

**名無し名人** (ﾜｯﾁｮｲ ab9e-xqdQ) · 2018/12/11(火) 01:12:46.47

>>290
200手で裸王に必勝でも最善手なの？

**名無し名人** (ﾜｯﾁｮｲ 19dc-3M3s) · 2018/12/11(火) 01:34:46.81

最善手という言葉だから１手しかないように感じるかもしれないけど、必勝の手は全て最善手。
将棋のルールで短手数で勝ったほうがいいとかいうものはないから、引き分け手数以内に必勝になる手があるならそれはどれも最善手。

**名無し名人** (ﾜｯﾁｮｲ 19dc-3M3s) · 2018/12/11(火) 01:45:20.79

>>309
ルール上引き分け手数が設定されている場合は、盤面の評価値に手数は関係あるよ。
たとえば320手で引き分けルールで、323手目に詰みがある局面の評価値は引き分けの0であるべき。
そういう理由かどうかはわからないけど、AlphaZeroの入力には手数も入ってる。

**名無し名人** (ｽﾌﾟﾌﾟ Sdb3-P7Tn) · 2018/12/11(火) 10:08:29.04

竹俣ベニー

‪ベニー、細川投げる。１イニングに３死球
https://youtu.be/TJJNaP7ZscM @YouTubeより‬

**名無し名人** (ｱｳｱｳｶｰ Sa9d-Od6P) · 2018/12/11(火) 10:29:09.67

リサリサあたりはなんか投げそうだなｗ

**名無し名人** (ﾜｯﾁｮｲ 1375-n9Ol) · 2018/12/11(火) 12:49:40.38

＞以前にAMDが「世界コンピューター将棋選手権」をスポンサーしていたことを思い出した。2003～2006年ころの話である。
https://news.mynavi.jp/article/semicon-56/

**名無し名人** (ﾌﾞｰｲﾓ MMb5-nAVI) · 2018/12/11(火) 13:01:49.41

>>317
終盤のGCP使ってるって話（事実はAWSのほうが多い）から
深層学習使ってるって話に飛躍して更にAlphaZeroへ飛ぶってすごい展開だな

**名無し名人** (ｵｯﾍﾟｹ Srcd-Entg) · 2018/12/11(火) 13:27:04.93

>>128
AMDワンメイク大会とかできないかなあ

**名無し名人** (ﾜｯﾁｮｲ 19dc-3M3s) · 2018/12/11(火) 13:45:34.58

AMD大会になると、DL勢がつらい。
ほぼ100%Cuda使ってるのをOpenCL使わないといけなくなるからなぁ。

**名無し名人** (ﾜｯﾁｮｲ 41b3-xpW6) · 2018/12/11(火) 18:32:32.15

AlphaZero宣言勝ちができないかどうかは知らんが、そうだとすると
初手76歩を避けたりするのに影響が出ている可能性が

**名無し名人** (ﾜｯﾁｮｲ 33a0-9GlL) · 2018/12/11(火) 19:23:10.72

googleがelmoに勝ったらしい

「AlphaZero」がチェス、将棋、囲碁の各世界最強AIを打ち負かす
http://www.itmedia.co.jp/news/articles/1812/09/news018.html

**名無し名人** (ﾜｯﾁｮｲ 93b3-n9Ol) · 2018/12/11(火) 19:38:37.38

素人意見だが、アルファゼロは２つのネットワークを持ってるから、
ＮＮＵＥも２つ持ったら、もっと深く読めるようになって、強くなるってことはないのか。

**名無し名人** (ﾜｯﾁｮｲ 41eb-OBpN) · 2018/12/11(火) 19:51:54.65

tanukiチームあたりは来年さらに洗練されたNNUEの評価関数を出してきそう。

**名無し名人** (ﾜｯﾁｮｲ 019f-n9Ol) · 2018/12/11(火) 19:52:57.49

>>322 短いので引用
DeepMindは、AlphaZeroの目的はチェスや将棋、囲碁に勝つことの先にあり、
様々な実世界の問題を解決するシステムを構築することにあると語った。
AlphaZeroは、単一のアルゴリズムが一連の設定で新しい知識を発見する方法を
学べることを示しており、まだ初期段階ではあるが「複雑な問題に対する斬新な
解決策を見いだす汎用的な学習システムを構築するというわれわれのミッション
に自信を与えてくれた」という。

**名無し名人** (ﾜｯﾁｮｲ d176-xqdQ) · 2018/12/11(火) 19:56:26.48

DM「とりあえず囲碁将棋チェスボコっとくか
将棋ファン「うおおおAlphaZeroすげえええええええ」
DM「さ、次いこう次」
将棋ファン「AlphaZero！！AlphaZero！！」

いいのかそれで

**sage** (ｱｳｱｳｳｰ Sa05-OBpN) · 2018/12/11(火) 20:07:52.79

AlphaZero凄いとは思うが、我々にとっては絵に描いた餅とかわらんからな

**名無し名人** (ﾜｯﾁｮｲ 31b3-n9Ol) · 2018/12/11(火) 20:27:02.58

潰れた店のレビュー