▲コンピュータ将棋スレッド128
レス数が900を超えています。1000を超えると表示できなくなるよ。
deep neural network, rather than the linear function approximation used in typical chess programs.
This provides a much more powerful representation, but may also introduce spurious approximation errors.
MCTS averages over these approximation errors, which therefore tend to cancel
out when evaluating a large subtree. In contrast, alpha-beta search computes an explicit minimax,
which propagates the biggest approximation errors to the root of the subtree. alphago zeroとaperypaqで対局がみたい。
CSAルールで投了までのきちんとした対局を uuunuuunさんがブログで物申してるな、これは面白い AlphaGoの盛り上がりを横目で見てるだけだったのが
Google側から将棋に殴り込みかけて来てくれたんだから
これはモチベーション上がるやろ ブログよく読むと微妙に的外れなこと書いてある気がしないでもないな、対局にHash10GBも使わんだろさすがに >>795
お化けスペックと言うけど本当に?
その話をしてる人が一人しかいないしどうにもよく分からない >>815
今回の時間は、庶民にはとても高価な1080Tiを搭載したPC1台で頑張ると約110年かかるらしいよ いずれにせよ、評価値900は切る値としては低過ぎるよ。
ソフトは強くなればなるほど、早い段階で高い評価が出る傾向が強まるから、
これ終盤に入る前に打ち切られてんじゃね?
つまり、DLが苦手とする土俵を避けてる可能性がある。 R4200の評価関数使って、終局まで指せばそこそこいい勝負なんじゃないかな >>816
そこも気になるところだな。
110年かけてそれなら、従来型+DLの方が効率は良いのでは、っていうね。 >>819
別に強い将棋ソフト作りたい訳じゃなくて、DLで色々できるよってアピールだからさ HASHはまぁ4096あたりでもいいような。
>>816
AWSのスポットで100万かければ近いところまで行けるみたいだぞ
まぁSDT基準の1080Tiだと既存ソフト+DLの組み合わせの方が強いけど 評価値900程度で、とあるけど
そもそもAlphaZeroの900の定義は他の将棋ソフトの5000相当とかってオチはないの? >>821
むしろ、もし金が有り余ってたらAWS使って既存ソフトでdepth16の500億局面とか試してみたいもんだ >>822
評価値-900が10手継続で投了はelmoの方
AlphaZeroは期待勝率が5%未満になったところで投了。
alphazeroはusiプロトコル使ってないっぽく、センチポーン単位の評価値出せないから
囲碁と同じで期待勝率による評価値。 で、将棋の-900が期待勝率5%未満と言えるかどうかだけど、
多分自己対局だけしてたら900ついたら逆転率5%未満じゃないかなあ、
という感じはするんだけど、どうだろね。 >>822
alphagoは5%だよ。投了の設定は。
実際強いんだろうけど定跡の記述もないし、将棋の対局設定の雑さにガッカリ
どうせチェスの片手間なんだろうな。 I hope that you may test these programs before declaring AlphaZero beats currently available shogi programs.
uuunuuunさん完全に煽ってるよなこれ >>825
あ、そうだったのか…
論文全く見ずお恥ずかしい Anatomy of a Computer Chess Program
でいろんな既存手法を説明した後
このセクションで説明されている技術のどれもAlphaZeroで使用されていません。
これらの技術のいくつかは、さらにAlphaZeroのパフォーマンスを向上させることができると思われます。
しかし、私たちは、純粋な自己対局強化学習アプローチに焦点を当て、将来の研究のためにこれらの拡張を残しています。
AlphaGo Zeroでrolloutを使わないのも同じ理由 英語が苦手で、結果として煽るニュアンスになってたらワロス
まふさんが検証してるけど、公開の投了値の設定ならaperypaqでも今回くらいの結果は出せるみたい。 elmoに勝ったとか言ってるけどさぁ、もっと強いソフトあるし、そもそも設定ちゃんとしてそいつら倒してから出直してくれない?
って言ってるよなこれw A transposition table facilitates the reuse of values and move orders when the same position
is reached by multiple paths.
と説明しちゃってるから、ハッシュも使ってないんだ
AlphaGo Zeroでは使ってたのに
ハッシュ使っただけでも少しは強くなるだろうな >>830
つまりドラゴンボールで例えると
AlphaZeroはフリーザ第一形態って訳だな Anatomy of a Computer Chess Programで
opening book、endgame tablebaseも説明してるから使ってない
ハサビスのツイート見なくても論文読めばわかることだったか やっぱり英語力がないと怖いな。間違ったニュアンスで伝わってしまう AlphaGoZeroの時には40日回したのに
12時間しか回してない時点で察して欲しいよね。
相手にならないから途中で論文書き始めただけ。
googleの事だから
裏ではまだ学習回しているだろうし
次回の論文ではブッチギリに強い結果を出してきて黙らせに来るよ。 >>837
これ見た感じだと時間さえあれば天井知らずで強くなる、ってわけでもなさそう
ttp://www.itmedia.co.jp/news/articles/1712/06/news138.html
ttp://image.itmedia.co.jp/l/im/news/articles/1712/06/l_ki1609376_alphazero01.jpg アピールなんだから短時間でこれだけ強くできるって出さなきゃ見向きもされないだろう
実際にどれだけの時間がかかるかは分からないから鵜呑みには出来ないが
あとルール以外教えてないよってのがどこまで本当かってのも重要だろう
これで汎用性をアピールしてるんだし 入玉ありで最後までやらせたら40勝10敗50引き分けとかになりそう グーグルに嫉妬してもしかたないだろ。素直にほめてやれよ。
アルファシリーズを有料販売してくれないかな。有料と言っても格安でね。 AlphaGo Zeroは1万2000くらいだっけ 囲碁の方だと6月くらいにツールを出しますと言って半年経っても出せてないしある程度のクオリティ(論文で発表してる強さ)になるまで出さないと思うが >>873
汎用性のアピールに将棋とチェスが選ばれただけだから、既にDEEPMINDは違うことやってるで たぶん 世の中金ってことがよくわかってしまってほんと悲しい >>837だった。
設定に関して突っ込みどころ満載だったから仕方ないね。 将棋に関しては半年後くらいに達成できそうな強さだけど
チェスはかなり未来に行った強さに感じるね。 AlphaZeroに1発も入らなかったStockfish先輩マジ可哀想 伸びることは伸びるだろうな、R5000には届かないかもだが >>776
そういう苦労をしないためのAdaGradなんじゃね? NGCでアクセスできるAIやHPC用ソフトウェアも増加:NVIDIA TITANユーザーがAI開発に「NVIDIA GPU Cloud(NGC)」を利用可能に - @IT http://www.atmarkit.co.jp/ait/articles/1712/06/news061.html >>848
コンピューター将棋開発者って趣味で開発してるわけだし学習、対局に数百万は出せんわな。 その計算資源を他の学習方法にまわせばもっと強いのができるっていうけど、将棋ソフト未経験者がノウハウなしに作ったことに価値があるんだろう
3つ星レストランの味をご家庭で味わえますって感じで いや、箱根に歩いていこうとしていたら新幹線で追い抜かれたって感じだわ deepmindに物申すのはいいけど自分が何者かでどういう実績があるのか説明しないと、俺らがここで煽ってるのと同じ扱いされるような Googleの将棋ソフトがelmo超えたのニュースの反応見ても
日本人は嫉妬深いですね
屁理屈こねて否定ばかしの開発者
見苦しさは渡辺明のようですね >>862
大丈夫ここ便所の落書きと違って、ほとんど開発者は論文を読んだ上で冷静に分析してるよ。 査読中みたいだし保木さんや金子さんは引用されているから物言う資格はあるだろう
対局条件をもっと将棋に合わせて再実験してほしいね
評価値3000とか手数300とかに 妬むと言うんだろうか
科学の論文で根拠を出さない方が変だと思うが
同じ位の既存が無いなら凄いって話で終わるけど WCSCまでにR4500くらいの評価関数を用意してalphazeroを招待したいもんだ 論文発表は、NatureかScienceとかだろうね >>865
いや〜それがdeepmindに伝わっているかどうかが問題で
送っただけじゃたくさんあるクレームの一つで終わっちゃうのではと WCSCルールならaperypaqの方が強いだろ
新バージョンのalphazero作ってくれるなら見てみたいけど チャンピオンベルトを持ってないから仕方ないね。
本番での強さがこういう場面で大きく響いてくる。
Qhapaqが廃課金して臨んでいたら
論文に載っていたのはelmoではなくQhapaqだったかもしれないけど後の祭り。 これさ。将棋AI開発者が挑戦状たたきつけたら、公開対局してくれるんじゃね? alphazero倒すためにAWS使って超強い評価関数作るためのクラウドファンディングやって
見返りは完成した評価関数とかだったらある程度金集まるかな? >>816
その話してる人ツイッターで一人だけだし本当のところどうなのかと気になってる
山本さんとかもう少しDeep Learning頑張っていれば良かったみたいなツイートしてるけど
PCスペックが全く足りなかったら頑張っても意味がないわけだしさー
>>821
その話おおかたの見方?
とりあえず、一人だけがPCスペック凄いって主張しているように見えて
嘘か本当かちょっと判断が付かない
というか、これが本当ならマスコミももっとこのことを報道すべきなのになんかその辺りの話が聞こえてこないし・・・
あと100万円というけど実際にはこのプログラムが完成する前で何千回とか試行錯誤してるし
DLの方法って普通の人には作成が困難なのだろうか? sdtルールでもaperypaqの方が有利だろ
なんせショボいハードに強制統一だから >>877
具体的な年数はどうでもいいとして、GPUの数十倍の性能のTPUが5000個だぞ?
これが個人でできるお手軽スペックならやるやつたくさんいるわ >>879
マスコミはプログラムの方ばかり強調してるけど本当に重要なのはハードウェアって事になるよな
そういえば格安で高スペックなスパコンチップ作ってた社長逮捕されてしまったな
ソフトもだがそれを作る人材を増やすという意味で、本当はこういった研究の方が重要って事なのだろうか? >>880
結局のところ、世の中お金ですってことよ
PEZYは性能に関しては本物っぽいから期待してたんだがどうなることやら
ハードが進化しないことにはどうしようもない、NNとかDLの理論は結構前からあったがハードのスペック不足で机上の空論だった
それが、ハードの進化によってアイデアをマシンパワーによって形にできるようになってきたって段階だな今は >>614
えっ、平岡さんて彼女に振られたん!?!????(´・_・`)(´・_・`)(´・_・`)(´・_・`)(´・_・`) GoogleはNNに特化したハードウェアをどっさりこさえてるからそのぶん強いんだよ
GoogleのTPUはGPUの10倍の価格性能比を持つとされる
Pezyのような汎用スパコンはGPUをのっけてるからNNの処理自体はGPU同等だが
汎用である分価格性能比では圧倒的に劣る
TPU >>>>>>>> GPU >>>>>>> スパコン
だからこの種の用途に使うのはまったくの無駄
Googleもスパコンは使ってるけど
その強みはしょぼい機械を大量に積み上げた徹底した分散型処理にある
単体のハードウェアの性能を競う方向とは正反対 チェスの方がCOMのレートの伸びが緩やかだし将棋よりずっと天井ありそうなのに将棋より結果いいの謎だな >>884
NNに価値があると分かれば
その機能だけ詰め込んだ演算チップにして売り出せないの?
スパコンUのような複雑な物よりも遥かに安く
多くの人の役に立つチップになりそうじゃない?
GPUボードなんて1枚10万でも飛ぶように売れてるし(マイニング用途が多そうだけど) AlphaZeroに挑戦できる権利が1ソフトだけで、その1ソフトを決める1戦100局決着の大会開いて
それに勝ち抜いたソフトがAlphaZeroに1戦1000局決着で勝負できるっていうの開催したら大いに盛り上がると思う(´・_・`)
>>882
ご想像にお任せします(´・_・`) 時間が経てば経つほどGoogle先生の計算資源は充実していくわけで、半年でレーティング200上昇したとか騒いで勝負しようとしても
絶望的な差を見せつけられて終わりそう だがしかしelmoに1割も負けんの?だっさwとか上手く煽れば
ここから数年の目標となるようなレートをgoogleに作らせることができるのではないか >>886
もう結構な数のメーカーがDeepLeaning専用プロセッサの開発をしてる。
来年くらいに市場に出てくると思う。 DLプロセッサが大量にあったとしても
それを価格・性能の両面で効率的に稼働させる能力はGoogleが圧倒しているのが現状
おもちゃみたいなデバイスが目の前に1000個あっても
ふつうのプログラマじゃ途方に暮れるだけ なんでもいいから個人としてはXeonPlatinum 8180 2個積みのPCがそこらへんに落ちててほしいんじゃー AWSの計算機リソースを借りりゃいいだろうが
今や大学の研究室ですら当たり前になってるのに
頭が20世紀で止まってるんじゃねーの? >>890
それは楽しみだな
>>893
アホみたいにお金取られたOrz
レンタルカーを想像してみると良いと思うけどある程度使うなら所有した方が良い
それにHDD丸ごと転送とか凄い時間が掛かる AWS借り続けると車買えるくらいになるからびっくりよな 化け物みたいなスペックのソフトが今後WCSCに出てくるだろうし
ドワンゴが死にそうだけどSDTは続いてほしいなぁ SDT無くなると半年サイクルじゃなくなっちゃうしな 計算機リソースというのはふつうの商品とは正反対で
小分けにすればするほどトータルのコストが下がる
安くチョコレートを食べたかったら1kgの板チョコの固まりじゃなくて
1gの豆チョコを1000個買うしかない >>895
1時間だけ凄いサーバーが欲しいとかならありだけどね
しかも英語が苦手だとよく分からないのに課金されていて泣きそうになったよ
無料で始めたんだけどその範囲が正直よく分からなかった;;
未だになぜ課金されたのか分からないし・・・ aperypaq+まふ定跡 vs elmo wcsc27でaperyqaq+まふ定跡の勝率100%だって
まふ氏のブログだと対局条件がさっぱりわからんけど そうなんだけど、ソフト組む立場としたら並列化やらなんやら超めんどいから
性能が高いやつ1個で済むようになってほしいんだけどね。
2台で150%、4台で280%とかそういう増え方するから貧乏人としては
何台が一番コストパフォーマンスがいいか、とか考えないといけないし。 >>896
前回ポナがXeon22台 Titan X128台 メモリ4.8TB
だったけど
エルモのXeon2基に負けてるからな >>901
定跡って対局前に超長時間思考してから対局しているようなもんだから、その条件は流石にいかんでしょ >>898
計算機リソース
例えば家で4TBのHDDが1万円、バックアップにもう1台追加、壊れるまで5年としたら4TBのストレージが僅か2万円。
これをサーバで借りたらもう1桁は必須になるでしょ
もし2万円以下で済むなら教えて欲しい
ちなみに容量無制限のサービスとかあったけど全てサービス停止に追い込まれてる
むしろ、個人と違い、ダウンタイムの耐性が必要になったり、利益を上乗せする必要があるから、かなり割高になってるじゃん >>904
でもそれ言うとAlphaZeroもハードウェアが対等なのかという疑問が >>905
ストレージの話ではなくて、計算能力の話だよね、きっと。
CPUのコストパフォーマンスを見てみればだいたいわかると思う。
最上位CPUと中堅CPUって価格は10倍とかいくことがよくあるのに、
処理能力差は3倍いけばいいほうってことが多い。 >>906
対等じゃないと思う(ややAlphaZero有利か)し、完全に対等な条件を探すのは大変だと思う チェス界からも絶賛と同時に疑問の声もあるそうだ
ーーーーーーーーー
takodori? @takodori
カスパロフ、ニールセンのコメントあり。
Stockfish が考えられないミス、ブランダーを指していると指摘している人が複数。多分、Stockfish の性能が発揮しにくいコンピュータ環境なのではないと推測している人が結構いるね。
https://www.chess.com/news/view/google-s-alphazero-destroys-stockfish-in-100-game-match レス数が900を超えています。1000を超えると表示できなくなるよ。