▲コンピュータ将棋スレッド125
■ このスレッドは過去ログ倉庫に格納されています
ごめん、スレたてたケド、Rock54: Cautionみたいなのが出たので他の人だれか残りのテンプレお願いします。 ※日本語 コンピュータ将棋や囲碁の掲示板 ttp://524.teacup.com/yss/bbs コンピュータ囲碁フォーラム ttp://www.computer-go.jp/indexj.html Zenの開発チームの代表のホームページ(いくつかの論文の邦訳がある) ttp://www.geocities.jp/hideki_katoh/ KGS Go Server(部屋/部屋のリスト/ソシアル/Computer Go でソフトと対局できる) ttp://www.gokgs.com/ ※英語 computer-go mailing list ttp://www.computer-go.org/mailman/listinfo/computer-go/ Wikipedia ttp://en.wikipedia.org/wiki/Computer_Go Human-Computer Go Challenges(人間対コンピュータの対局一覧) ttp://www.computer-go.info/h-c/ Sensei's Library ttp://senseis.xmp.net/?ComputerGo ※AlphaGo Google DeepMind: AlphaGo ttp://www.deepmind.com/alpha-go.html Natureの論文 "Mastering the game of Go with deep neural networks and tree search" ttp://www.nature.com/nature/journal/v529/n7587/abs/nature16961.html 論文と同じ内容 ttps://storage.googleapis.com/deepmind-data/assets/papers/deepmind-mastering-go.pdf Google DeepMind YouTube Channel ttps://www.youtube.com/c/DeepmindAI AlphaGo vs Fan Hui 棋譜 ttps://gogameguru.com/alpha-go-fan-hui/ 次スレ立ってから埋めろ早漏野郎め 998 名前:名無し名人 (スッップ Sd9a-ven3)[sage] 投稿日:2017/10/19(木) 17:46:12.04 ID:UxemSEdRd [6/8] うめ 999 名前:名無し名人 (スッップ Sd9a-ven3)[sage] 投稿日:2017/10/19(木) 17:46:33.57 ID:UxemSEdRd [7/8] うめ 1000 名前:名無し名人 (スッップ Sd9a-ven3)[] 投稿日:2017/10/19(木) 17:46:48.22 ID:UxemSEdRd [8/8] 1000 Approaches using purely reinforcement learning have struggled in AI because ability does not always progress consistently, said David Silver Bots often beat their predecessor, but forget how to beat earlier versions of themselves. 今の3駒だな 前スレ990位の方へ エルモに100戦100勝まではいかないが、 前々スレにyabainoの人が勝率95%まで行ったとか言ってた 真偽は知らぬが 大会を盛り上げるために、どのソフトが電王トーナメントで優勝するか人気投票やらない? >>6 yabainoって下位と当たって連勝して勝率凄い事になってたけど 上位にボロ負けして勝率5割くらいの奴でしょ 実況スレにも張り付いて評価値出してたけど読み切れてなかった i7 yaselmoで当たったけど一回も負けなかったぞ >>7 ではポナンザに一票 山本さんの公表したelmoとの対戦成績が本当ならまだ最強の可能性もあるということで 横歩定跡にハマってそこから引っくり返せないyabainoは大したこと無い >>10 偽浮かむ瀬のアホのせいか 詐称野郎がいるおかげで上位がすぐ居なくなってる 消えろ 去年からまふさんが指摘してたフトの穴ってまだ改善されないんだなあ まふさんが非公開で定跡作って開発者に渡してるでしょ 息を潜めてるのが不気味すぎる 勝ってもR1点か2点にしかならんような24五段前後の挑戦を受けると 後から棋譜解析するとソフトとの一致率が妙に高いこと多いよね〜 まあ横歩の特定の形や相掛り37銀戦法の特定の変化で ソフト特有のミスをするんで相居飛車なら勝てること多いけど やっぱり気分悪いよねーー alohago zeroの進化の過程 3hrs:初心者 10hrs:基本定石を発見 16hrs:小ナダレ定石を学習 19hrs:死活、厚みと地の概念を学習 24hrs:小目定石を学習 35hrs:星の定石を学習 55hrs:人間の理解を超える定石を発見 72hrs:対セドル戦ver.に並ぶ ただ、Zenの加藤さん曰く、ディープラーニングによる囲碁はこのzeroくらいが 限界らしいね(人類トップにR+1500) もちろんこのペースでマウンテンデューのマシンを回し続ければ強くなり続ける だろうけど、電気代かければ強くなるのはわかっているので。 ZENの加藤さんとボンクラ伊藤さんがどうも被るんだよなあ Googleのやる事に対してケチ付けることから入ってる ディープラーニングの限界が近いって根拠あるのかな? 将棋の三駒関係も限界を毎年超えてた印象だけど >>21 同じようなことをやってれば、感覚的にどのあたりが限界かわかる。 しかし、新手法がど〜んと出てきて大抵感覚がぶち壊されるのであまり意味がない。 Zenの加藤氏はコーディングしてる訳ではないでしょ? セドルが5-0で勝つとか言ってた奴の言う事を信じてるのか >>20 ぶっちゃけ伊藤さんよりもよっぽど酷いと感じる なおTPUはTensorFlowでないと扱えないから Chainerで書いてしまったponanzaは非対応、残念 >>18 セドル戦バージョンとレーティングが1500くらい離れてるから、人間のトップとはもっと離れてそうだけど >>28 ファン・フイ戦のAlphaGo 3168 井山七冠 3554 柯潔 3667 イ・セドル戦のAlphaGo 3739 AlphaGo Master 4821 AlphaGo Zero 5185 らしいので、5185-3667=1518で、やはり約R1500差? >>28 セドル戦バージョンが実はびっくりするほど強くはないってこと。 多分対局時点でのセドルとアルファ碁のレート差200あるかないかくらい。 zeroやmasterが出てきた今となっては、たぶん柯潔やパクジョンファンなら セドル戦バージョンとは10回やったら3〜4回くらいは勝つチャンスありそう。 これ将棋でも多分一緒で、現時点で豊島と(2013年当時の)GPSクラスタが 10回やったら豊島3〜4回くらいは勝てるチャンスあると思う。 >>31 当時の名人よりはGPSクラスタは若干上だと思うけど、今の豊島なら勝ち越すまであるな。 >>32 当時は人間のトップが衰えてレーティングが下がったのと 今は序盤定跡の進歩があるからGPS全敗もある >>32 さすがに今でもGPSクラスタのほうが豊島よりは強いと思うぞ。 古い定跡しか入っていないGPSに対し、定跡でどこまでリードを固められるかだな。 (逆に言うと早い段階でGPSの持ってる定跡から外れるから) >>21 限界って言ってもここが頭打ちってわけではなく、電気代惜しまずにぶん回してりゃ 勝手に強くなる。でもそれってかけたカネの額の割に効果としてはどうなのよってこと。 要するに強くなるにはなるけどダラダラと緩やかに坂を登るなら、それって技術的には ある種の限界って意味は成立するでしょ。 >>33 >>34 二人は真逆の意見だな。 俺は当時の1900をソフトレート3000あたりで見てて、 今の人間トップ層は当時よりレート200弱程度上がってると見てる。 対ソフトは慣れもあるからもう少し高いとも思う。 GPSクラスタの推定レート3200〜3400 序盤ももちろんだけど中盤力も上がってる。 色々考慮してまったくの同条件(電王戦のような)での研究がなければ互角ってとこだと思うから勝ち越しもあるぐらいで見てる。 そういや平岡は最近コンピューター将棋の先手番後手番の勝率うんぬんの話を全くしなくなったな。 昔は先手番の勝率高くて先手じゃないと勝負にならないっていうくらい言っていたのに >>41 GPS全敗予想と今でもGPSのが豊島より強い予想で割れてたから、二人の意見真逆なんだなって思っただけだぞ。 なんか引っかかることでもあった? ただの野次馬ですが、yaselmoに強くramuとtamoreには互角の評価関数が出来ました。 【適当にブレンド vs yaselmo】持ち時間10分切れたら一手10秒 たぬき互角局面集使用 対局数34 21勝10敗 引分3 勝率66.18% R+116.59 (引分0.5勝換算) 【適当にブレンド vs ramu】持ち時間10分切れたら一手10秒 たぬき互角局面集使用 対局数24 12勝11敗 引分1 【適当にブレンドを_kpp_kkptに変換 vs tamore_kpp_kkpt】持ち時間10分切れたら一手10秒 対局数20 10勝10敗 引分 たぬき互角局面集使用 定跡なしで計ったほうがいい あと対局数は0が一個足らない AlphaGOも100局で測ってたし100局をスタンダードにしような >>44 数少なくてもいいし方法公開を強要しないが 棋譜がないと誰も信用しない あとkpp変換は強さ100くらい減るから >>45 >>46 >>47 一局だけでもかなり時間がかかるので大変ですが、それぞれ100局まで対戦しますね。 出来れば200局以上が理想ですが時間的に無理です。 3駒はもう弄ってもピーキーな評価関数ができるだけで意味ないと思う 4駒がR500位差つけてさっさと3駒終わらせてほしい >>48 ただお互いが変換して100位同じようにレートが下がっているので、フェアだと思いますが。 アルファ碁ゼロが世界最強棋士に5〜6子くらいらしいな。 googleが本気で将棋ソフト開発したらソータも二枚落ちで負けそうだ。 >>50 4駒を使うに十分な計算資源を開発者に提供してやれば? >>51 お互いって何だ? 棋譜なkれば狼少年でしかない いまさら「適当にブレンド」って言われてもねぇ・・・ 有意差の早見表を再掲しておこう 51% 6764局 52% 1691局 53% 752局 54% 423局 55% 271局 56% 188局 57% 139局 58% 106局 59% 84局 60% 68局 >>56 TPU仕様のクラウドはまだ商品化されてないから価格は決定されてないはず。 なので、GPU換算でのおおざっぱな試算しかできないな。 TPUは1枚でGPU15枚分の性能だそうだ。 というわけで、GPU15000枚分のクラウドの使用料金を計算するといい。 >>52 すでに現状でも、最上位ソフトには角落ちでは歯が立たず、 飛車落ちでも厳しいわけだから、二枚落ちでも勝てなくなるだろうね。 >>60 山口 祐 @囲碁ソフトAQ開発中? @ymg_aq 1時間前 AlphaGo Zeroが72時間で人間超えてやべーってなってますけど、真にやべーのはこの学習を3日で終わらせるGoogleのマシンパワーですから。 私のPC(GTX 1080 x2)だと、同じ学習を完了するのに62年程度かかります。Master超えバージョンなら735年です。 将棋は、そろそろ終盤データベースを整備する頃合いだよ。 ・初期配置から合法手の応酬によってできる局面のみに限定 (詰め将棋のような仮想局面は必要なし) ・詰み・必至の見逃しから先の変化は一切不要 ・将棋のルールで一手パスはできないこと 詰み・必至の局面から逆算していき、 (一手パスできないので)どう指しても悪くなる局面を見つけて行く、 そのような局面のデータを蓄積していけばいいだけ。 そこから先は、一切読む必要、時間を使う必要はなくなる。 よく指される戦型からの変化を最優先で潰していけば、効率もよく、 プロ将棋に与える影響も極めて大きい。 Googleは25億円だからな 個人が25万円でやろうとしたら1万倍の時間がかかる >>62 マシンパワーで解決できるなら、これほど簡単なことはないじゃないか。 やはり将棋ソフトの棋力向上は、ハード面とソフト面の両輪で実現されるということ。 >>61 二枚落ちで先にプロにと金作られたら、将棋の神々でもどうしようもないよ。 数年前まで、最上位の囲碁ソフトは、日本の一流棋士に3子〜4子の手合いだったのにな。 今じゃ、世界最強クラスの囲碁棋士が、 逆にアルファ碁 ZEROに5子〜6子置く手合いかよwwwwwww 棋力的に10子以上強くなってるな。 >>63 将棋はチェスと違って終盤が広い。 むしろ送り詰め局面とか美濃囲いで角打って捨て駒で詰みとか 部分マッチの方が有望。 >>66 羽生さんが「(将棋の神相手に)角落ちでなんとか」とか言ってたのを思い出しますねw >>38 先手というだけで勝利が決まりやすくなるんだったらそもそもponanzaの後手番で負けなしは説明つかないからな。 さすがに無知な平岡君でも先手後手では勝負の決着にほぼ影響ないという事は理解したんだろ >>68 チェスの終盤データーベースは(仮想局面も含めて)全数検索してるでしょ。 >>71 それを駒が減らない将棋でどう実現するつもりだよ… あれは終盤のパターンがかなり限定できるというチェスやオセロなどのゲームの特徴があるからできる芸当だよ >>69 もう道策最強説とか、神の一手シューコーさんとか、呉清源とか、崇められてきたのが空しくなってくる。 >>72 だから全数検索はやるな、と>>63 でも書いてるわけだが。 神様が上手を持っても二枚落ち定跡には手も足も出ないだろう そんなに言うな自分で作れよ お前の中では出来るんだろ? じゃあ、Ponanza開発者でアマ強豪の山本一成は、 なんで2016年当時のPonanzaに二枚落ちですでに負けてるわけ?(笑) また駒落ちガイジが湧いたのか ほんと定期的に湧くよな 山本もその後対局繰り返したら勝てるようになったと言ってるよ >>78 まーた練習かw ほんと将棋厨はカンニングが好きだなw ちなみにソースは?(笑) 2016年当時と比較して、将棋ソフトの棋力も大幅に上がってるけど? 一定レベルあれば2枚落ちからは負けないけどなぁ 低級には分からないかもだけど そんなことは当たり前の話じゃないの。 問題は、棋力向上が続く最上位将棋ソフトに対する 「一定レベル」とはどのあたりのレベルか?ということだわな。 >>81 なんだよw 2016年4月のそのツイートかよw 知ってるよ、そんなの。 で、大幅に棋力向上している、今後も向上が見込まれる 最上位クラスの将棋ソフト相手に二枚落ちで勝てるの?(笑) 羽生善治「コンピュータが将棋を解明したらルールを変えればいい」→囲碁のルールしか知らない新型AlphaGo、55時間で人類の理解を超える [741292766] http://leia.5ch.net/test/read.cgi/poverty/1508495879/ もはやもうルール教えればDeep Learningで一気に人間の域を越える今の時代となってはこの発言も只の戯れ言でしかなくなったな ソフトが神になろうが2枚落ちでは負けないんだよなあ 大駒無しってどうしようもない差 ソフト信者は現実見ようね ちょっと昔のこと知ってる人いたら聞きたいんだけどさ、同時代のソフトに対して 傑出してたソフトの例としてやねがよくponanzaか森田将棋かみたいなことを 書いていたけど、選手権4連覇中の金沢将棋って、傑出度的にはこの二者ほどでは なかったのかな? ソフトが強くなればなるほど2枚落ちの開始局面の評価値に絶望して初手で投了しそう >>69 この間の札幌のコンピュータ将棋カンファレンスで、伊藤先生が千田にその話題振ってた。 ・神と人間トップの差は?(以前羽生に聞いた時は「角落ち」ソフトとの差が角落ちなら神との差はもっと?) 千田:神の強さのイメージがわからない 現在最強のソフトとアマチュアが20分切れ負けなら1回くらいしか勝たない そうすると神の強さは飛車落ち飛香落ちでもおかしくないが、二枚落ちなら神相手でも負けることはない >>90 elmo❨飛車落ち❩>大樹の枝=人間最強クラスだから神の強さは、想像もできないようなものだよな 取りあえず角落ちでももう負けねえ、とツイッターかブログで 宣言したらどうなだかねえ それでも二枚落ちならさすがに負けなさそうだけどなあ 飛車落ちでも同じこと思ってたけどw 隻腕の剣士ならカッコもいいが、 両腕なしでは素人をあしらうのが精々で 羽生さんがルール変えればいいって言ってるけど具体的に何処を変えるんだろう 駒落ちのソフトは研究されていないので現状は平手のソフトを流用している 今後もしばらくは駒落ち専用ソフトを開発するより平手のソフトを強くしたほうが駒落ちでも強くなるだろう だが将来的に駒落ちの研究が進むと実は駒落ちは思ったほどハンデが大きくなかったとなるかもしれない >2017-10-20 15時ごろ緊急メンテナンスのためサービス停止し、23時半頃復旧しました >>62 GTX1080比で3700倍ぐらいかな。半精度で30PFLOPSぐらい。 すごいのはすごいけど、来年導入予定の産総研のABCIの1/10以下。 この分野で1年の差は大きいかもしれないけど、国内でも来年には十分使える物量みたい。 むかし個人のパソコンをインターネットでつないで 並列処理させて難問に取り組むプロジェクトがあった気がするんだけど、 あれの将棋版ってできないものかね? プロの棋譜の学習に頼らずに 未知の定跡が発見されるかも知れないなんて夢があるじゃないか。 ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.4.7 2024/03/31 Walang Kapalit ★ | Donguri System Team 5ちゃんねる