▲コンピュータ将棋スレッド125

**名無し名人** (ﾜｯﾁｮｲ 6672-Q7KS) · 2017/10/19(木) 18:08:55.48

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512
叡王戦公式HP
http://www.eiou.jp/
第27回世界コンピュータ将棋選手権参加チーム
http://www2.computer-shogi.org/wcsc27/team.html
詰将棋メモコンピュータ将棋２０１７
http://toybox.tea-nifty.com/memo/2017/01/post-965e.html
世界コンピュータ将棋選手権参加ソフトリンク集
http://www.ne.jp/asahi/tetsu/toybox/soft/softlink.htm
floodgate 最新２週間レーティング
http://wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html
コンピュータ将棋協会
http://www.computer-shogi.org/
コンピュータ将棋
http://ja.wikipedia.org/wiki/%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E5%B0%86%E6%A3%8B
将棋フリーソフト rating on single machines(各ソフトのレーティング評価)
http://uuunuuun.wix.com/shogi-engines

前スレ
▲コンピュータ将棋スレッド124 [無断転載禁止]c2ch.net
https://mevius.5ch.net/test/read.cgi/bgame/1505704966/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured 👀
Rock54: Caution(BBR-MD5:0be15ced7fbdb9fdb4d0ce1929c1b82f)

2017/10/22(日) 10:22:47.54

神「引き分けにしかならないゲームで何熱くなってんの」

2017/10/22(日) 10:27:33.37

最善手が引き分けになるのはそれ以外よりはるかにハードルが高い
ゲーム木を考えたらﾜｶﾙ

2017/10/22(日) 10:35:40.12

>161
機械学習なんて将棋じゃ実用化される前の話じゃろ
AI将棋や激指が全盛期の頃、手作業で一生懸命将棋の知識をプログラミング
してた前提で

2017/10/22(日) 10:55:01.22

コンピューター将棋のスレなのに何言ってんだろ。
アルファ碁より先に自己学習でルールの変更に対応できる仕組みで開発者達は開発してるじゃん。
今のソフトがプロの棋譜学習してるとか何を根拠に言ってんだ？

2017/10/22(日) 12:17:23.18

>>171
このスレに居るのになんで知らんのか分からんけど数ヶ月前にやねが自己対戦以外の棋譜なしでelmoの棋力にするのに成功してるからその手法使えばすでに出来るぞ

2017/10/22(日) 12:32:12.35

わかりきった、終わった議論を今更…

2017/10/22(日) 12:48:04.28

グーグル信者は囲碁も将棋もろくに知らないでただ絶賛してスレ荒らしたいだけなんだからスルーしろよ

2017/10/22(日) 13:07:43.19

勝てないのでは知っているうちに入らないのでは…

2017/10/22(日) 13:44:58.59

４月７日　AlphaGo Zeroの初稿　natureへ投稿
５月２３日　AlphaGO vs カケツ戦　（AlphaGoが人間の棋譜を使わず強くなったという噂）
６月１２日　やねうら王ホームページで「人間の棋譜を用いずに評価関数の学習に成功」報告
１０月１８日　AlphaGo Zeroの論文　出版

なので、時系列的にやねうら王よりもAlphaGo Zeroの方が先んじているというのが本当

2017/10/22(日) 14:15:42.95

いや、やねうら王の方法は重要な特徴量である駒割りをスタート時点から使っていて
その駒割りは人間の棋譜を元に得られたものだから
残念ながら「人間の棋譜を用いずに評価関数の学習に成功」とは厳密には言えない
AlphaGo Zeroとは別物
駒割り0の状態から学習スタートしてAlphaGO Zeroより早く公開していたなら
文句無しで凄い成果だった

2017/10/22(日) 14:26:23.02

全盛期羽生＝今の井山だとすると
井山が一度も勝たせてもらえない相手がカケツ。
そのカケツがAlphaGo Zeroに4子（将棋だと飛車落ち？）でフルボッコ喰らうレベル。

2017/10/22(日) 15:25:11.72

>>181
駒割りは人間の棋譜なしにそれらしい値に収束させるのは先行研究で示されてたからそこは重要ではない
あとあの駒割りは棋譜から得られたものではなくApery平岡さん（アマ三段前後の棋力）による手入力のものが元になっているはず（手入力だとしても人間の知識をベースに作られてることは間違いないが）

2017/10/22(日) 15:34:22.92

bonanza1＝奨励会レベルの強さから学習させてるのすら分からずに
やねうら王が前からやってたとか言うのは痛すぎる

2017/10/22(日) 18:10:12.72

>>181
やねうら王の学習ルーチンが公開された直後の
有志の評価関数育成実験報告の中に
駒割りすらもゼロから学習させて成功したというのがあったな

2017/10/22(日) 18:49:40.57

駒割りゼロは嘘
駒割り100からの学習
ゼロならランダムに近いけど100なら駒を取ると得なのは理解してる

まあ学習は1日以下の差だろうけど
ランダム評価関数を実際に試した感じだと

2017/10/22(日) 18:50:50.55

人間の棋譜を一切使わずに数日で人間最強をはるかに上回るソフトを作ることが出来たとしたら
今まで人類が築き上げてきた将棋文化の完全否定となる
将棋のルールができて、人類が何十年、何百年もかけて作ってきたものを数日で超えてしまう

2017/10/22(日) 18:57:33.98

その将棋というゲームのルールを作ったのは人間じゃないの？

2017/10/22(日) 19:00:47.37

数か月前やったランダム評価関数の実験は
やねうら王だとうまく行かなかったから
elmo_for_learn使った

2017/10/22(日) 19:17:38.98

そもそも探索部に駒取りは先に読むとか、色々な将棋的な決め打ちがあるけどそれは良いのか？

2017/10/22(日) 19:44:10.54

まあそれよりはponanza chainerの二歩を教えなくても勝手に学習したの方がインパクトあるな

2017/10/22(日) 19:45:12.93

@issei_y　 6月2日
結局探索部分を人間が書いていることこそが
強さのボトルネックなんだろうな。

Zero
"we chose to use the simplest possible search algorithm"
the MCTS is not augmented by any other
heuristics or domain-specific rules.

山本が目指していた方向性か
探索から人間が入れた将棋の知識除いたら
どれぐらい弱くなるかな

2017/10/22(日) 19:48:03.24

>>188
ルールが出来て以降の人類が作ってきた将棋文化は一切否定される

2017/10/22(日) 19:51:40.76

囲碁では自己対戦で去年の最強ソフトに100線100勝のソフトが登場した
将棋で同様のことが起こったら、二枚落ちでも名人に勝ち越すソフトが登場するのではないか？

**名無し名人** (ﾜｯﾁｮｲ d676-CdTO) · 2017/10/22(日) 20:00:08.07

>>193
人間の強さをはるかに超えるソフトもベンチマーク程度の意味しかなくなんない？
レートの大きさを延々求めるだけのものみたいな

**名無し名人** (ｱｳｱｳｶｰ Sadd-+cFJ) · 2017/10/22(日) 20:01:04.76

2枚落ちでもプロが負ける説の人からすれば、ソフトが19枚落ちでも人間が負けそうだな

**名無し名人** (ﾜｯﾁｮｲ 7a23-bcII) · 2017/10/22(日) 20:12:17.53

>>196
どうだろうか
一応駒落ち非線形仮説はあるけど
2枚の場合は1枚に比べて加点があることは明らかそうなので
3枚以上も1枚から2枚に比べてどうとはいえないけど少なくとも加点があることは自明だろう
逆側から考えるとレート上限仮説によって最大レートは抑えられるから
上下の挟み撃ちによってあるn以上で超えるはいえそう
問題はnがいくらかだけど

直接証明の場合は19枚落ちなら余裕だろと思っても
必勝法を示さないといけないです

**名無し名人** (ﾜｯﾁｮｲ 7a23-bcII) · 2017/10/22(日) 20:14:47.18

飛角の大駒2枚落ちは現状の人間とか>>196にとってはとてつもないハンデだ
人間には二枚落ち城跡があるからとか思っているかもしれないけど
未来の将棋ソフトにはそれは人間が小駒の使い方が下手なだけで
実は飛角の二枚落ちよりも両香右桂の三枚落ちの方が重いハンデであることが示されるかもしれない
それは現時点ではわからないわけだ

**名無し名人** (ﾜｯﾁｮｲ c11e-0mKs) · 2017/10/22(日) 20:25:16.16

重いハンデもへったくれもないよ
究極的に+1か0か-1しかないんだから
勝ち方によって点数の違いがあるゲームなら別だけど

**名無し名人** (ﾜｯﾁｮｲ 7a23-bcII) · 2017/10/22(日) 20:33:44.87

>>199
究極的は完全解析しないと無理だろ
それに下手は上手より弱いとしないと

**名無し名人** (ﾜｯﾁｮｲ 9578-pXkP) · 2017/10/22(日) 20:36:31.26

２枚落ちでもプロが負ける仮説は定跡全力でチューンした上でプロに近いレートで戦わせれば実験できるだろ
現状実験してないから分からないのに負ける負ける言うからプロ棋士ファンの神経を逆なでしてるんでしょ
正直に現状よく分からないと言うべきでそれ以上もそれ以下もない

**名無し名人** (ﾜｯﾁｮｲ 7a23-bcII) · 2017/10/22(日) 20:39:20.73

駒落ちの最大の問題点は研究する動機に乏しいことだよな
どうしても平手のおまけ扱いだから知見が全くない

**名無し名人** (ﾜｯﾁｮｲ c11e-0mKs) · 2017/10/22(日) 20:41:01.90

負けるっていうのは強い方がいい手を指して勝つわけじゃなくて
勝ち局面を持ってるにもかかわらず正解手を選べずにミスした瞬間に負けになるわけだから
ミスさえしなければハンデを貰ってるほうが必ず勝つしミスするなら強い相手には絶対負ける

**名無し名人** (ﾜｯﾁｮｲ 9578-pXkP) · 2017/10/22(日) 20:58:43.45

>>199
いくら用語の定義が明確でないと言っても
「香落ちより１９枚落ちのほうが重いハンデ」
という文章は明らかに成立するでしょ

あなた一人が日本語苦手で頭悪いの露呈してるだけだから
あんまり賢ぶらないほうがいいんじゃ………

**名無し名人** (ﾜｯﾁｮｲ c11e-0mKs) · 2017/10/22(日) 21:03:16.62

将棋やってる人は数学的にものを考えられない人が多いんだよね
ここはプログラム書ける人もいるみたいだけど

**名無し名人** (ﾜｯﾁｮｲ d623-7buw) · 2017/10/22(日) 21:04:37.29

>>203
そうそう
プロ棋士がコンピュータに比べて二枚落ちで負けてもおかしくないほど
レーティングが低い=ミスの比率が高い、のなら
プロ棋士が2枚落ちで負けても何もおかしくない、と思う

**名無し名人** (ﾜｯﾁｮｲ f9d2-2TS2) · 2017/10/22(日) 22:17:03.70

>197
19枚落ちなら必勝手順はあるし、強い完全解析の必要もない。
俺でも目隠し将棋でプロに勝てる手合いだ。
ちょっと訓練すれば5級だろうが目隠しで行けるだろう。

ある手合いまでは下手が間違えなければ楽勝というのは確実に存在する。
プロにとっての閾値がどこにあるかだな

**名無し名人** (ﾜｯﾁｮｲ 168a-pXkP) · 2017/10/22(日) 22:17:06.60

>>205
現状最強の指し手紡げるソフトでも角落ち自己対戦でまれに負けるんだから
駒落ちは下手必勝というのはあなたの想像の中の形而上学的な話をしてるに過ぎない
そもそも最善を尽くせば角落ちは下手必勝ということについての数学的証明がなされたことはないからね
きわめて高い確度でそうであろうと予想されてるにすぎない

残念ながらその事実を断定した時点であなたが数学的とは何かについて語る資格はないし
あなたはエンジニアにも見えない

**名無し名人** (ﾜｯﾁｮｲ c11e-0mKs) · 2017/10/22(日) 22:25:02.40

>>208
俺が言いたかったのは完全解析だとかではなく
>>198で書かれてた重いハンデがどうこうってのはソフトが強くなったらどうかとか関係なく
あくまで人間が実戦的にどの程度勝ちやすいか負けやすいかの統計的な話でしかないってこと

**名無し名人** (ﾜｯﾁｮｲ c11e-0mKs) · 2017/10/22(日) 22:31:30.15

それに角落ちで勝ちだとは言ってないよ
元が二枚落ちの話だし
それは勝ちを仮定していたけど
そうでなければそもそも下手が強い側に元から勝てっこないから

**名無し名人** (ﾜｯﾁｮｲ 4da0-9Njj) · 2017/10/22(日) 22:46:35.89

駒得評価関数スタートのやねうら王と
完全なランダムムーブで始めたAlphaGo Zeroは全然違うよね。
駒割りも0でスタートして人類超えた将棋ソフトはまだないよ。
例の改造版は駒割100だから駒得評価関数の一種だし。

**名無し名人** (ﾜｯﾁｮｲ d696-+cFJ) · 2017/10/22(日) 23:14:50.83

完全解析の話にまで及んだら、上手が勝つ可能性もあるからなｗ

ミスする頻度の話は、勝勢からの大逆転負けの頻度ということか？
でも、平手の勝勢は正確に射さないとダメな局面もあるし、測り方が難しい。2枚落ちは下手が駒をタダで取られるとかしない限り差は縮まらない。
てかそもそもプロ以下の俺でさえもソフト相手に2枚落ちなら全勝するよ

**名無し名人** (ﾜｯﾁｮｲ 168a-pXkP) · 2017/10/22(日) 23:17:21.65

>>210
だから未だ二枚落ちについてすら下手必勝の数学的証明は提出されたことがないでしょ
二枚落ちと角落ちはともに数学的に厳密には局面勝敗不明なんだから
その間に格差を認めるならあなたの言った「ハンデの軽重」の存在を認める以外ないでしょ
矛盾してるよ

**名無し名人** (ｽﾌﾟｯｯ Sd7a-2TS2) · 2017/10/22(日) 23:22:24.67

>>211
そら違うものだがこれの意義って既存のビックデータを使わずに自分で生成したデータのみの学習でビックデータを使った学習に匹敵する強さのAIを生み出せるって事だからそこの部分では同じ事じゃないの？

**名無し名人** (ﾜｯﾁｮｲ c11e-0mKs) · 2017/10/22(日) 23:25:51.89

>>213
俺はハンデの軽重がそのときどきのソフトの強さによって
決められるわけではないってことを書いたと説明したのに分からないやつだな
ハンデの軽重自体は勝率から決まると

**名無し名人** (ﾜｯﾁｮｲ 4da0-9Njj) · 2017/10/22(日) 23:29:11.23

>>214
AlphaGo Zeroの場合は
完全な自己対戦スタートにした事で
人間の棋譜スタートの旧Alpha Goよりも最終的に強くなった事に意義がある訳で・・・
rezeroは強さに対する利点を見出してないから、その点でも全く違う。

**名無し名人** (ﾜｯﾁｮｲ ce9f-XCQz) · 2017/10/22(日) 23:35:03.78

>>211
駒割ゼロならゼロっていう情報を意図的に与えてるとも取れるでしょ

**名無し名人** (ﾜｯﾁｮｲ a17e-wYkv) · 2017/10/22(日) 23:35:08.07

モンテひよこから棋譜作って学習させてみたいけど
そのモンテひよこが公開されてない

**名無し名人** (ｽﾌﾟｯｯ Sd7a-2TS2) · 2017/10/23(月) 00:22:44.95

>>216
ほー、旧Alpha Goみたいに人間の棋譜スタートにするとZeroと同等の学習量をこなしても同じ強さにならんのか

**名無し名人** (ﾜｯﾁｮｲ 8edc-aYWJ) · 2017/10/23(月) 00:34:23.79

>>219
そういうことらしいってのを質疑応答でハサビスさんが言ってたらしいよ。
AlphaGoにとっては人間の棋譜って足かせだったんじゃないかっていう説。
正しい学習を阻害していた可能性があるんだと。

**名無し名人** (ｽｯﾌﾟ Sd7a-PPE6) · 2017/10/23(月) 00:56:29.21

羽生が角落ちなら将棋の神に勝てるとか言っていた当時は、角落ちだと戦力不足でどんなに強くても名人には勝てないと力説している人がいた

**名無し名人** (ﾜｯﾁｮｲ d661-Jp9u) · 2017/10/23(月) 01:41:52.76

駒割については他の評価関数の項目で吸収されるので実質的な
意味はない…という話は既にどっかで解説されていたのに
駒割にこだわる人は読んでないようだ。

**名無し名人** (ﾜｯﾁｮｲ c5eb-gcVe) · 2017/10/23(月) 01:42:33.18

配布中のtamoreなんとなく終盤はyaselmoより強いように見える。検討にはいいかも

**名無し名人** (ﾜｯﾁｮｲ 9578-pXkP) · 2017/10/23(月) 01:52:56.05

>>215
恥知らずな奴だなあ
「ハンデ貰えばミスさえしなければ必ず勝つ」とかのたまってたじゃないか
これどう読んでも「勝率100%」以外の意味には取れないだろ
議論に負けそうになったからって嘘つくのはよくないよ

これで「数学的」とか言いながらマウント取ろうとするって………

203 名無し名人 (ﾜｯﾁｮｲ c11e-0mKs) sage 2017/10/22(日) 20:41:01.90 ID:/R+3J9+c0
負けるっていうのは強い方がいい手を指して勝つわけじゃなくて
勝ち局面を持ってるにもかかわらず正解手を選べずにミスした瞬間に負けになるわけだから
ミスさえしなければハンデを貰ってるほうが必ず勝つしミスするなら強い相手には絶対負ける

**名無し名人** (ﾜｯﾁｮｲ a523-2TS2) · 2017/10/23(月) 02:36:56.67

>>220
ほー、学習局面の膨大さ的に最終的に誤差になるかと思ってたわ

**名無し名人** (ﾜｯﾁｮｲ cdee-jbpI) · 2017/10/23(月) 04:29:50.16

>>225
これ、かなり気になってた部分だから俺もソース欲しいわな。
学習方法や時間を変えた結果ではないのかなと思ってたけど

2017/10/23(月) 05:08:13.03

人間の棋譜から学習するという段階の時代ではなく、　
経験に基づいて選択肢を絞り込んでから　ありそうなところを深く考える、という　人間の手法　を
機械的な手順に置き換えて　さらに絞り込みの精度を上げていくという方法を　コンピューターが使ってるので、

棋譜を並べて勉強するのではなく　ゲーム盤で駒を動かしているだけで　勉強になってるんじゃないか。

**名無し名人** (ﾜｯﾁｮｲ a17e-wYkv) · 2017/10/23(月) 05:22:00.69

// ○ KKPP型

平岡氏のヒントで○にしたのか
それとも実際にテストしたのか

**名無し名人** (ﾜｯﾁｮｲ 3d2c-/wYC) · 2017/10/23(月) 06:34:28.43

http://netdays365.com/2017/10/22/%e3%80%90%e3%82%a2%e3%83%ab%e3%83%95%e3%82%a1%e7%a2%81%e3%82%bc%e3%83%ad%e3%81%ae%e6%a3%8b%e8%ad%9c%e3%80%91%e3%83%ac%e3%83%bc%e3%83%884775%ef%bd%9e5185%e3%80%90alphagozero%e3%80%91/

**名無し名人** (ﾜｯﾁｮｲ ce9f-XCQz) · 2017/10/23(月) 06:42:45.11

>>222
擬似的に駒割を修正するようにKPPTパラメータが決定されてるのはそうだけど、
言われてるのは学習の開始時にゼロベースになってないことだよ
人力パラメータや棋譜を使おうが使わまいが最終的には自己対局て学習するし、どちらが強いってこともないと思うけどね
AlphaGoの使わない方が強いってのは、たまたまor学習の進行が上回った瞬間がキャプチャされただけと考えてる

**名無し名人** (ﾜｯﾁｮｲ 7abd-GnHq) · 2017/10/23(月) 07:30:54.58

つか初期値依存で最終的な学習結果がガラッと変わるようでは学習方法に問題有りとしか言えぬ
結果が不出来なら叩かれるべきは初期値として与える駒割ではなくて学習方法、、、

**名無し名人** (ﾜｯﾁｮｲ 7abd-GnHq) · 2017/10/23(月) 07:33:15.09

正規化項として歩の価値ぐらいは固定値で持たせて結果にバイアスが生じたならやっぱそれは
固定値で持たせたという学習方法の問題やし…

**名無し名人** (ﾜｯﾁｮｲ 7abd-GnHq) · 2017/10/23(月) 07:42:54.85

訂正
×：固定値で持たせた
○：不適切な量を固定値で持たせた

**名無し名人** (ﾜｯﾁｮｲ d661-Jp9u) · 2017/10/23(月) 08:19:55.00

>>230
駒割の自動学習はやねうら以前に先行研究があり駒割が手動で入力されていても
本質的な問題ではない

**名無し名人** (ﾌﾞｰｲﾓ MMe9-cI4C) · 2017/10/23(月) 08:55:08.87

駒割のみからスタートのrezeroよりも
既存評価関数スタートのまふ評価関数の方が
計算資源に乏しいにも関わらず強くなってるんだから
将棋に関してはゼロベースは何の利点も見出してないね今のところ

**名無し名人** (ﾜｯﾁｮｲ fa7c-iA1h) · 2017/10/23(月) 09:05:39.47

将棋は探索部が非常に重要だからな

**名無し名人** (ｱｳｱｳｳｰ Sa89-ntwp) · 2017/10/23(月) 09:46:39.14

>>194
AlphaGo Zeroが100勝するバージョンはレート上トップ棋士よりやや強いか互角くらい
将棋でいうとGPSクラスタ相当だと思うけど、それくらいが相手なら最新のソフトに十分なマシンパワーを与えれば全勝でもおかしくないのでは

**名無し名人** (ｵｯﾍﾟｹ Sr85-o9zC) · 2017/10/23(月) 10:48:34.59

Alpha GOはポリシーネットで相手の指し手を予想してたが、人間の指し手を読まなくなったとすると
対人戦で読み筋ズレまくって弱くなったり…しないか？

過学習の袋小路、ぐるぐるジャンケンにはまり込んで無いのかね？

**名無し名人** (ｱｳｱｳｶｰ Sadd-DTsA) · 2017/10/23(月) 10:54:17.32

>>120
ベストなタイミングでコンピュータと戦って歴史に名を残したオセロ。将棋は…？

●負けたことで残せる「歴史」
――中でも印象に残った言葉はありますか？

　将棋ファンの同僚からの一言です。彼は慰めてはくれたのですが、他の場面で「まあ、将棋は味とか含みがあるからね」とも言われました。

　つまり「味や含みといった微妙な駆け引きのある将棋はオセロより複雑で、だからコンピュータに負けることはないだろう」という意味を言外に感じました。
もちろんオセロにも味や含みはあるし、将棋に劣らない複雑なゲームなのですが、その場で反論はしませんでした。

　囲碁将棋ファンが持つオセロへ対する誤解は根強く、1つも2つも下に思われていたので。それをその場で正すのは難しい。「いずれ時が来れば分かりますよ」と、
心の中でつぶやきました。20年を経て、それは全く予想通りになっていると思います。

　また、「チェスと同じ年にオセロが負ける」ことで、歴史に名が残ると思いました。「負けた」という歴史を刻むことは、
複雑な知的ゲームとしてのオセロの立場を守ることにつながると。

　例えば、これがチェスが負けた5年後であれば、オセロにおける人間とコンピュータの力の差がさらに広がり、誰の目にも明らかになって、チャンピオンとソフトの対戦は
そもそも企画されなかったでしょう。そういう意味ではギリギリで滑り込んだと思っています。

　あの年（1997年）しかなかった。現にいま、盤上ゲームにおけるAIとの歴史を語る際には、囲碁、将棋、チェスとセットで扱ってくれることも多いのです。あのつらい敗戦は、
4大頭脳ゲームの1つとしてオセロが認知されることに明らかに貢献していますね（笑）。

**名無し名人** (ﾜｯﾁｮｲ a17e-wYkv) · 2017/10/23(月) 11:51:49.75

>>231
elmo式は問題有りか

リゼロ評価関数のほう、ようやくepoch11にしてelmo(WCSC27)と並んだのだが、
穴熊に全然囲わない。穴熊超嫌い。どうやっても穴熊に囲わない。
もちろん、穴熊は優秀なので相手に一方的に穴熊を許すと作戦負けになる。

一方、まふ定跡のまふさんが定跡として四間飛車の定跡を教師局面の生成のときに用いて評価関数を
学習させると(その定跡の半分は穴熊に進行するので)、
居飛車穴熊を自然と指すようになったとこのブログのコメント欄で書かれている。
http://yaneuraou.yaneu.com/2017/06/26/

**名無し名人** (ｱｳｱｳｶｰ Sadd-UNAg) · 2017/10/23(月) 12:08:14.47

今回ゴミ棋譜連発になるかもなｗ

**名無し名人** (ﾜｯﾁｮｲ 71c3-REa2) · 2017/10/23(月) 13:21:33.19

>>237
アルファ碁zeroってトップ棋士と互角なの？
将棋はすでにその辺のソフトにトップ棋士がぜんぜん敵わないのに
碁のほうが簡単だと言われてたのに

**名無し名人** (ﾜｯﾁｮｲ 6d5d-IrI6) · 2017/10/23(月) 14:13:20.84

>>242
イ・セドル（少し衰えたがそれでも鬼強い）を４－１で降した初代Alpha碁。
世界の名だたるトップ棋士たちに６０戦無敗のマスター。
そのマスターに勝率９割なのがAlpha碁ゼロ。

将棋で言えば、名人がゼロで、天彦が奨励会６級、清水上・稲葉兄・早咲のアマ強豪で道場初段くらい。

**名無し名人** (ｱｳｱｳｶｰ Sadd-UNAg) · 2017/10/23(月) 14:35:59.79

ワールドランカーが次々に散っていったからなｗ

**名無し名人** (ﾜｯﾁｮｲ 2672-wYkv) · 2017/10/23(月) 16:02:17.10

uuunuuun?さんが作ってるソフトの棋力レートでtamoreが今１位なんだけど
これって9/20に公開されたkkp_kkpt版の方を指してるんじゃなくて
昨日リリースされた従来の手番付き(kkp_KPPっていうんだっけ？)の方の事をさしてるんかな？

**sage** (JP 0He2-kA64) · 2017/10/23(月) 17:01:05.49

裏でやり取りしてる最新のkkp_kkpt版じゃねぇの

2017/10/23(月) 17:07:45.46

>>238
サンプルとして与えられたデータに対応し過ぎると　未経験のデータが来た時に大きく外れた対応をしてしまうというのが　過学習の理屈なんだが、
対戦相手からあまり影響を受け過ぎないようにしつつ　その機会損失を上回って余りある回数をぶんまわすことで　少しずつ修正することで　過学習を避けてると思うんだぜ。

アルファ碁ゼロは　レーティングが上がったということより、
教師付き学習を止めて　自己対戦の強化学習をしたら　前のより強くなった、というところでペーパーを書いた、という感じに見えるぜ。

**名無し名人** (ﾜｯﾁｮｲ 8146-Jp9u) · 2017/10/23(月) 17:19:19.24

>>247
おいクソみたいな顔文字はどうしたんだよ

**名無し名人** (ｱｳｱｳｶｰ Sadd-dL/I) · 2017/10/23(月) 17:28:34.55

>>245
これどこにある？
よければURLはってください

**名無し名人** (ﾜｯﾁｮｲ ddb3-aYWJ) · 2017/10/23(月) 17:42:46.34

tamoreの最新版、yaselmoに勝ちまくるんだけど俺んところだけ？

**名無し名人** (ｽｯｯﾌﾟ Sd9a-HJ4h) · 2017/10/23(月) 18:07:31.13

数百局やらないと分からない。
終盤はyaselmoより強いように見えるけど

**名無し名人** (ﾜｯﾁｮｲ 511b-WSSd) · 2017/10/23(月) 18:28:42.11

>>250
tamoreってどこで配布されてるんですか？

**名無し名人** (ﾜｯﾁｮｲ faf5-ijGe) · 2017/10/23(月) 18:44:14.96

>>252
https://www.dropbox.com/sh/y9zpxt1ysf5ahz3/AADE4OIuu9gmj7bByUsdQMKAa

**名無し名人** (ｱｳｰｲﾓ MM89-ntwp) · 2017/10/23(月) 19:04:00.98

>>242
文がわかりにくくてすまんな
互角なのはAlphaGo ZeroじゃなくてAlphaGo Zeroのベンチマークに使われて全敗した旧AlphaGoのほうだ

**名無し名人** (ﾜｯﾁｮｲ 511b-WSSd) · 2017/10/23(月) 19:21:53.26

>>253
ありがとう

**名無し名人** (ﾜｯﾁｮｲ 511b-WSSd) · 2017/10/23(月) 19:55:31.77

>>253
このtamoreって
20170920と20171019のどっちがyaselmoより強いの？

**名無し名人** (ｽｯｯﾌﾟ Sd9a-HJ4h) · 2017/10/23(月) 20:04:33.59

ほとんど同等。

**名無し名人** (ﾜｯﾁｮｲ 0e1b-wYkv) · 2017/10/23(月) 20:13:52.71

>>248
お前失礼極まりないな

**名無し名人** (ﾜｯﾁｮｲ 719f-9PaC) · 2017/10/23(月) 20:28:09.68

碁はニコニコのインチキルールだったら棋士にも勝機があるかもしれん
PC制限&アプデ禁止ならそぞり囲碁に持ち込める可能性がある

**名無し名人** (ﾜｯﾁｮｲ 719f-9PaC) · 2017/10/23(月) 20:28:27.62

なぞり囲碁

**名無し名人** (ﾜｯﾁｮｲ faf5-ijGe) · 2017/10/23(月) 20:46:46.65

個人的には、tamoreより横歩取り評価関数の方が気になるので、検証中

**名無し名人** (ﾜｯﾁｮｲ fa61-bcII) · 2017/10/23(月) 21:05:25.41

>>245
uuunuuunさんのレート表だとyaselmoがトップなんだけどどこのランキング？

**名無し名人** (ﾜｯﾁｮｲ 0e1b-wYkv) · 2017/10/23(月) 21:16:21.03

>>262
uuunuuunさんのツイ画像の中にあった
日付見ると結構前に出来てるんだな

**名無し名人** (ﾜｯﾁｮｲ 511b-WSSd) · 2017/10/23(月) 21:31:07.59

この前の王座戦第四局の52手目の56飛の局面なんだけど
yaselmoでもなかなか後手有利の評価を出せないんだよな
65億局面読ませてやっと後手有利-430ぐらい
5億くらいだと互角評価になっちゃう
こういう局面を正確に読めるソフトってまだ出来ないのかな？

**名無し名人** (ﾜｯﾁｮｲ 51a2-iDVv) · 2017/10/23(月) 21:46:21.58

>>242
こういう関係性

3008　樊麾（2016年1月1日付け）
3144　対樊麾戦バージョン（GPU176）
3520　イ・セドル（2016年3月16日、ランキング4位）
3670　柯潔（2017年10月23日、ランキング1位）
3739　対イ・セドル戦バージョン（TPU48）
4858　対柯潔戦バージョン（TPU4）
5185　アルファ碁ゼロ

**名無し名人** (ﾜｯﾁｮｲ 71c3-REa2) · 2017/10/23(月) 21:51:19.00

>>254
こっちが誤読してたスマン

**名無し名人** (ﾜｯﾁｮｲ ddb3-0GSP) · 2017/10/23(月) 22:10:33.81

伸びやばない？
将棋は1年で200伸ばしてたところを、最近オープンソース流行で半年200伸びててスゲーって感じだろ？
なにさらっと1000とか上げてんの？

**名無し名人** (ﾜｯﾁｮｲ 511b-WSSd) · 2017/10/23(月) 22:13:54.47

碁はそれだけ人間が理解するには難しすぎたってことだよね

**名無し名人** (ﾜｯﾁｮｲ ba75-bcII) · 2017/10/23(月) 22:21:23.25

ハードだけで数十億かけてるってのもある。金の力で進歩速度は変わる

**名無し名人** (ﾜｯﾁｮｲ faf5-ijGe) · 2017/10/23(月) 22:25:47.74

>>262
https://mobile.twitter.com/uuunuuun1/status/896916008018911232

**名無し名人** (ﾜｯﾁｮｲ d676-/A0t) · 2017/10/23(月) 22:27:00.15

ほとんど変わらんな