▲コンピュータ将棋スレッド128
■ このスレッドは過去ログ倉庫に格納されています
今年の電王トーナメントでも多少問題になってたけど、来年は深層学習勢が増えたときに
公平なハードとはなにかっていう問題が出てくるよなどこまでGPUやTPUを認めるのがルール
として最善なのかってのは答えがないわけだから、、 電王トーナメントのCPUもGPUはメインストリーム最上位と相場が決まっている
CPUはOCなしのモデルになるが DLのみで出場だと1080Ti1枚とかだと結構きつそうだな ツイッターでデマ拡散したuuunuuun1がチェスガチ勢にキレられててワロタ 人間に勝っただけでドヤってた将棋ソフト開発者の哀れさ
本気の勝負になったら絶対勝てないからスペックガーとか言い出す
第2回電王戦をスペック制限無しでやったプロ棋士を見習えよ スペックガーどころかfloodgate出てこいとか言ってるようだが WCSC27で1000コアの技巧とPonanzaは32コアのelmoに負けてる
雑魚ソフトはスペック良くしても雑魚ソフトのままだろ スペックだけでは中々埋まらない差はあるけど、実際深く読むと強くなるのも事実 Takuya Akiba? @iwiwi
DeepMind の AlphaZero チームの方を捕まえられる機会があったので、将棋について
http://www.uuunuuun.com/single-post/2017/12/07/Some-concerns-on-the-matching-conditions-between-AlphaZero-and-Shogi-engine …
とりあえずこのページを見るように伝えてみました。チームに共有してくれると約束してくれました。
コメントも見るように伝えたので言いたいことが他にある人はコメント書くと良いかも。 >>361
もうアホ晒すなよ
汎用に専用で勝負して恥ずかしくないのか
ソフトでプロに勝ってプロはソフトより馬鹿って騒いでるのと同じだろ 汎用で専用に勝てるとか言ってる馬鹿がいるんだからしょうがないだろw Qhapaqの人は投了値900ならelmoに9割勝てるソフトも作れるらしいから
公開されるまで待とうぜ alphazeroの一番の貢献は、PONANZAなき今一つの目標ができたこと。 正直、DMからしたら「floodgate? どうも注目されそうにないな、べつにいっか」ってなりそうな気もする。
来てほしいけど 誰かこれに触発されてAWSにジャブジャブお金つぎ込む開発者いてほしい 日本の天才()プログラマーダサ過ぎて笑う
囲碁8時間、チェス4時間、将棋2時間ってマジで低レベルな競争だったんだろうな まあ日本のは個人の趣味だからしゃあない
誰か優しい人が5000万プレゼントすれば数日でR4500になるだろ より強力な将棋ソフトの開発を競うメタゲームとして考えれば汎用のほうがソフトで
専門のほうがプロということになるな 40年間苦労して発展を続けてきたのに2時間で全否定ww プログラムから作る汎用AIで専用AIに勝利
@悪い見方
↓
今までのソフトはただのおもちゃだった
↓
おもちゃ作りに一生懸命になってたプログラマーはカス
A良い見方
↓
シンプルに、alphaZeroは今までのプログラマー達よりも賢い
↓
新文明の到来 行き詰まりを感じていた開発者のほとんどにとっては明るい話だろう
一つのゴールが提示されたんだからそこに達する道はいろいろある >>374
ニューラルネットもモンテカルロもそして、コンピュータ将棋のαβも長い歴史があるよね。
過去の多くの技術者たちの努力あって今がある。 AlphaZeroは将棋はあくまでも通過点でしょ。
DeepBlueの後に更に強いPCのソフトが続々出たけどIBMが動じないように
仮にやねうらおとかがシコシコとソフト使っても立場がひっくり返ることがない。
「我々は次のステップに移行するから、限定的なところで頑張って」
と言われたらおわり 今までの将棋ソフトの下積みに関係なくAlphaZeroは今の強さを発揮できる。今までのソフトくだらねぇ
って話かもしらんが、それ言ったらAlphaZeroだって将来的には画期的な汎汎汎汎用AIでも開発されて、
NNやらなんやらの下積みに関係なくAlphaZeroを超えるAIができあがり、今までの歴史下らねえ
ってなりかねん。
あんまり結果ばかり重視しすぎじゃなかろか。
結果に至るまでの仕組みの探求も大事だろうというか >>331
引き分けがあるのが欠陥と言ってるのはそれこそ脳の欠陥だぞ。
ドローの意義:
第一に、形勢判断が複雑になる。たとえば「六分四分で有利」と言っても、10局指して6勝4敗になりそうなのか、
4勝2敗4和か、それとも2勝0敗8和なのか。また「どちらが有利か」の判断よりも「有利の程度がドローの幅を超えているか」
の判断のほうが難しい。知らない人には想像もつかないだろう。さらに消去法も効きにくい。ドローのないゲームなら
勝ちにならない手順はすぐに捨てていいが、チェスではドローが最善の結果かもしれないのだからそうはいかない。
ドローで満足するか、形勢不明の乱戦に踏み込むか、悩むところだ。だから棋風の違いも出やすい。
第二に、先手の利を中和している。ドローのないゲームで研究が進むと、全部先手勝ちになるおそれがある。
囲碁は昭和初期にそういう状態に近づいてコミを導入したし、将棋の名人戦では最近10年間(55期〜64期)の
先手勝率が7割を超えている。チェスでは「先番の利」が「ドローの幅」とうまく釣り合っている。
白が勝つか、黒がドローに逃げ込むか、あるいは白の指しすぎを誘ってうっちゃるか、研究が進んでも興趣は失われない。
第三に、競技会の観戦もおもしろくなる。結果が3種類ある分、展開が多様になるし、大詰めでは他のゲームの進行を
見ながら互いにドローで満足するか勝ちにいくかという駆引きがある。
第四に、棋力測定の効率が高くなる。ドローのないゲームだと2局指したとして結果は2、1、0勝の3段階だが、
チェスなら2.0から0.0まで5段階に分かれる。
日本には戦略目標が1種類しかなく、結果も2種類しかないゲームがある。チェスより複雑だと思っている人が多いらしいが
不思議でならない。サッカーやボクシングでもドローの名勝負は多い。チェスはドローが多くてつまらないという人は
「自分は内容を味わう力がない」と告白しているだけである。
http://hnishy.la.coocan.jp/chessterms.htm >>381 を俺なりに補足すると
「負けを回避する」のに「大ギャンブルで勝ちを狙う」しかないのか、それとも
「無理をせずにドローを目指すのか」で、将棋は前者しか選択肢が事実上ないけど
チェスは選択肢が2つある、というのが「ドローの幅」であり、「先番の有利を
補っている」ということであり。
あと、チェスのスコアは「○勝○敗○分け」ではなく「勝ち1分け0.5負け0」の
勝ち点方式で表示され、こうなると引き分けがネガティブではなくなる。
(シリーズの勝敗がトータルスコアの和で表示される。世界選手権15番勝負の結果が
「1勝0敗14分け」とされるか「8-7」と表記されるかは全然印象が違う)
個人的には、昔サッカーも勝ち点が勝ち2分け1だったのを勝ち3分け1に変えた
経緯があるし、勝ちの勝ち点を3にしてもいいのではないかとは思ってるが、 >>333
(リンク先URL弾かれるので引用のみ)
最近の統計を見てみましょう。
Chessgames.comというチェスの棋譜のデータベース(70万局くらいなのでもしかして少ない?)では
2013年時点で白の純粋な勝ち率37.4%、黒の純粋な勝ち率27.4%、引き分け率35.2%で白の勝率55.0%
(つまり黒の勝率45%)となってるらしいです。これはほぼ全部マスタークラスの方々の棋譜だと思います。
他の時代や他の場所の統計を見ても例えば最近のコンピュータのレーティング戦の統計だと
CCRL 40/40 Rating List July 26, 2014
White wins: 35.2%, Black wins: 25.9%, Draws: 38.9%, White score: 54.6%, Black score : 45.4%
CEGT 40/4 Rating List 26 Jul 2014
White Wins : 39.5%, Black Wins : 29.4%, Draws : 31.1%, White score : 55.1%, Black score : 44.9%
白の勝率52%〜56%、つまり黒の勝率44%〜48%です。
・・・これってそこまで先手有利か? やねうらおだってブログで似たような煽りやってたけど
でも現実にここまで将棋ソフトの積み上げを無視されると
開発者も反論したくなるのも分かる。
でも大半のキメラだの定跡がどうだの
ライブラリ流用して大したことして
ない連中が色々言うのはただただ見苦しい こんなとこでもこの話題がずっと続いてるんだから、世間に与えたインパクトはでかいな。狙い通りじゃねえか あんまり訳わからんリプしてると
将棋民ウザッてなって
次の論文からはシレッと外されちゃうよ
…てな趣旨の発言をやねうらおがしてた 論文に著者連絡先の記載なし、査読なしの論文をarxivで公開したのは悪手だった説 145 名無し名人 2017/12/10(日) 11:05:23.26 ID:yBvli5X7
1900点って自分のことだったのか。
将棋クエスト棋譜【2分】 (garnet_crow[2395] 対 tylers2002[1950]) http://wars.fm/shogi2/game/ui5dd8egpuqq #将棋クエスト #ShogiQuest
https://i.imgur.com/dJxu9Y5.jpg >>386
そのツイURLキボンヌ
あるいは文面コピペでも コンピュータ将棋基礎情報研究所のSilver論文の私的解釈が興味深い。
今回の論文のポイントはコンピュータ将棋やチェスにおけるミニマックス法の有効性を考え直す必要があるって意見のようだ。
評価関数の形じゃなくて問題は探索か 評価関数が超有能なら探索は割と適当でもいいみたいな話なかったっけ? >>390
いま現状最強である(パラメーターも限界まで調整済み)やねエンジンですら
非手番でとんでもないと読んでたり、メイト外れたり色々あるからな
あれがバグじゃないとでもいうんだろうか 刈っちゃいけない枝を全く刈ってないとは言えないよなっていつも思う 刈っちゃいけない枝を刈ってることがあるのは論理上当たり前 >>394
枝ってより、候補手5番にもならないようなゴミ手を読むんだよね
例えば駒を取る一手なのに何故かコチラに一手パスして取らせようとしたり やっぱりちょくちょくバグレベルの手あるよなー
評価関数がもっと精度あがれば枝狩り甘くしても上手くいくのかな? >>395
理論上がどれほどなのかも分からんけど
floodgateで対局させてると3〜5局に一回は確認してる
それが勝敗に結びつくかはどうかはおいといても
非手番はポンダー外れる程度だとしても手番時に読みぬけや
大逆転される原因は多少ありそうだけど 誤解がないように先にいっておきますが
やねさん批判のつもりはないです floodgateで見てもそれが探索によるものなのかわかりづらいのでは?
その局面で評価関数にゴミ手がいい感じの評価値として学習されてたのかもしれないし やねの探索は序盤めちゃめちゃ枝刈って終盤は枝刈り少ないってイメージ >>400
その辺は数種類の評価関数や一世代前の読み太なども使ってみたんですけど
探索が悪くないと仮定するとキメラの弊害?とも思った事ありますが
キメラしてない評価関数でも確認できたんですよね ディープブルーもオリジナルボナンザも枝刈りなんかしてないだろ
当時将棋がよくわからなかった保木はともかく
枝刈りが安全確実なら当時のIBMの人間が枝刈り処理を入れないはずがない まあ確かにやねエンジン同士のさらに同じ評価関数ミラーで対局させても、明らかにおかしいことはあるんだよな
手番のとこの関係で同じ局面でも同じように評価してるわけじゃないと思うけど、読み抜けっぽい評価値の急変はあるよね 今度同じ現象起こったら棋譜から検討モードで原因少し探ってみます ここにグダグダ不満書く時間はあるのに
その探索不具合直すコード書く時間はないのなw 読み抜けって言っても
枝刈りによる読み抜けと、探索深度が浅い事による読み抜けの2つが・・・ 実際常にdepth32くらいまで読めていれば起きない読み抜けなのかもしれないってのはあるけどね >>407
>枝刈りによる読み抜けと、探索深度が浅い事による読み抜けの2つ
だから限られた時間内では枝刈りの度合いと探索深度は兼ね合い・バランスの問題になる
いいとこ取りなど論理上あり得ない 常に超絶ハイスペックPCでしか動かさないソフトなら、それ専用にコード書いたら絶対今より強くなるよね
やねさんは省メモリ化を初めとして家庭的なPC目線で開発してるからありがたいわほんと >>403
両方当たり前のように枝刈入ってるし…。 >>386
578 自分:名無し名人[sage] 投稿日:2017/12/10(日) 15:43:04.87 ID:P96HOLJr
AI竜星戦版絶芸
10月のAlphaGo Zeroの論文を参考にして8月版絶芸に勝率100%
旧絶芸に2子で勝ったバージョンより強い
時価総額アジア1位のテンセントでも、ちゃんと論文参考にしたと言うのになあ
まあそのレベルの企業だからともいえるけど
馬鹿みたいに僻んでる奴って何なんだろうな
中国人以下の見苦しい反応は恥ずかしいからやめてくれ
時価総額50兆あれば再現できるんだよ やねさんも記事更新してる。
αβと深層学習の詳しい話が聞けそう。 どこかがスポンサーになってやねさんに1億くらいプレゼントしたらすごく面白いと思うんだがなー 他の役に立たないプログラムに金使うわけ無いだろどアホウ >>417
とか言ってるから、日本のIT企業(笑)はテンセントに負けてんだよ 日本のIT企業と海外の本物のIT企業を比べちゃいけないんだよな 無差別級ではAlpha Zeroが最強かもしれないが
駒得オンリーではひようら王が未だに最強だし(震え声)
とはいえ探索部も
googleがディープラーニングでパラメータ調整すれば
駒得だけでももっと強くなりそう。 一生懸命車をチューニングしている脇をスペースシャトルがぶっこ抜いたイメージ
将棋ソフト開発者も凄いんだけど来ちゃいけない相手が来た AlphaZeroがプロ漫画家で、
やねうら王とかが同人作家 なんか的外れだなー、AlphaZeroはそもそも将棋用じゃない
色々な料理を扱う三つ星レストランがラーメンを作ったらラーメン屋よりうまかったってとこだな マイナースポーツを内輪で楽しんでいたら
室伏広治(未経験者)がやってきて
初日で一番強かった感じだな なら恥じることでもなんでもないな
才能が違うんだから 5000 TPU 2時間って
TPUv1 (INT8 92TOPS) = V100 (FP16 120TFLOPS)
として
p3.16xlarge(V100 8個 1時間2400円) * 625 * 2時間
約300万円ぐらい
スポットなら100万でいけるかも >>425 >>426
汎用と専用の区別を失念していたw
すまん 将棋自体ほとんど日本国内でしか指されないし、蛙になるのもまぁしゃーない 「俺このマイナースポーツなら行けるんじゃね? 」
↓
室伏「12時間の練習で君らの誰よりも一番上手くなったぞ」
↓
「やっぱり身体能力には勝てなかったよ・・・ 」 ←いまここ 100m走の日本人が10種競技のイギリス人にまるで歯が立たない感じ? ↓
「室伏広治でも追い越すのに12時間かかるなんて俺ら凄い!」
いまの流れはこうだぞ せっかく将棋専用なんだから資金募るとかなんとかして
ちゃんとやればだいぶ強いからねって見せておいてほしいもんだ その12時間で今までの将棋ソフト開発者が使った以上の
コンピュータ資源をつぎ込んでるという まぁGoogleはもう将棋に興味無くしただろうし
Googleの成果を国内のプログラマがどう活かせるかの問題になってきそう
でも個人レベルで組めるクラスタでは無いので無理かもしれないね 計算資源を開発する期間無視してるの恥ずかしくないんですかねぇ・・・ >>436
それ言い出すと
身内のAWSをじゃぶじゃぶ使えない
貧乏開発者からブーメランが飛んでくるぞ 趣味の延長線上でやってた開発者はすげーってなるだけですむけど、ponanza完全に負けしまったな
負けなかったとしてもponanzaがAlphaZeroほどの成果を上げて>>378のようなこと言って
勝ち逃げしてたらボロクソ叩かれてただろうな >>365
それができるならなぜ作らなかったのかな
評価値がプラス900になったら中身をエルモに替えるだけのプログラムで全勝できたのに >>442
仮に終盤は専用ソフトのほうが強いとしても、評価値がプラス900になるまではDLで読ませて、そこから先は専用ソフトの手法で探索させれば最強ソフトになるわけだからね
ハサビスに先を越されたことになるよ 何言ってるかよくわからんがポナ方式の評価値で切り替えバージョンってことか? 900で投了ならelmoに9割勝てる→それ以上続けると逆転されることがある→途中で関数変えれば最強では?
ってこと? あー、なるほど、山本はプログラム開発を短距離走としてとらえていたわけか、、、
長距離走としてとらえていたやねうら王のほうが賢かったし、山本はもう体力ギレで立ち上がれないなw
まあ、Googleは車だけどなwwwやねうら王は他の全プログラマーの悔恨も結果も全部しょい込んで、車に切り替えたほうがいいよ。 まあハサビスさんもこんな面倒くさい連中相手したくないよなあ
もっと煽れば以外にあっさり将棋最強なんて諦めてすぐに消えてくれるかもよ? ■ このスレッドは過去ログ倉庫に格納されています