▲コンピュータ将棋スレッド136
■ このスレッドは過去ログ倉庫に格納されています
>>420 今将棋所でApery,Aperypaq,elmo,Qhapaq,Qzilla9,T.N.K,技巧2,初代wakameの計8ソフトによる総当たりリーグ戦してるわ 各ソフトと20戦ずつやらせて計140局 1番成績悪いelmo除外して残った7つでさらに10局ずつ計190局 uuunさんのサイトよりサンプル少ないからまったく当てにならないデータとか言われたらそれまでだがな >1番成績悪いelmo 技巧2の方がいいのか意外だな >>425 求めてるのは自然と弱い手がさせるソフトじゃない? それなら素直に人間と指そうよ 感想戦だって出来るんだし >>427 技巧2は意外と格上ソフトにも善戦することが多い印象 elmoは8つの中で明らかに一つ成績が悪かった リーグ戦190ではなく200局になるな 一応200局データには取ろうとしてるが、くじらをやねうらエンジンに載せたりどれが1番いいか調整してる時にもAperypaqなどと戦わせてたけど、どのソフトに対しても優位にたってたし、負け越しは一度も見てないな >>428 自然の定義は? ちなみに人間と指すと、ビックリする悪手がよく出るよ >>433 それ定義するのが難しいから 自然と弱い将棋ソフト作るのが難しいんじゃないの? leela chessは、stockfishと比べて極めて自然な指し回しらしい。 alpha zeroとelmoとの対戦の棋譜くらいは公開してくれないかなぁ >>423 使うにはユーザー登録とか必要だしそれにそこまで強いわけではないから 開発したい人には非常い興味深いものだろうけど普通のソフト将棋好きには話題にならないんだと思う それはそうと今回は陰の強豪elmoと上位常連の読み太は公開ないのかね >>411 何と同じ? もしかして棋理(経験則)の事を定跡と呼んでる? ブックにヒットするかどうかの話を越えてるのかな? >>428 人間らしい弱さを学習する必要があるだろうなぁ。 棋力別の棋譜から悪手の特徴を学習して、わざと悪手を指せるようにするのがいいのだろうが、DLとかで実装の負担が減れば誰か開発するだろう。そのうち minmaxで反復深化よりMCTSのほうが人間らしい弱さに近づけやすいかもしれないが どうやって評価したもんだか >>431 20戦づつってことは結構なノード数でやってる感じ? >>436 https://en.chessbase.com/post/leela-chess-zero-alphazero-for-the-pc However, the engine’s play is quite different from anything I have seen or tested before, and I am speaking from over 20 years experience. What on earth was going on?? I never heard of an engine compensating hundreds of Elo of tactical gaps with pure positional play. もう一週間以上前だから今どうか分からないけど、普通のエンジンとはかなり違うようだ Bonanza 1.0とか当時は自然で人間らしいと言われてたし、案外古いソフト引っ張ってくるだけでなんとかなる説 https://i.imgur.com/FOdlwue.jpg とりあえずリーグ戦こんな結果になった 見にくくてすまんな くじらちゃんの圧勝と言っていいだろう >>443 elmoというのはWCSC27でポナを倒した時の評価関数とやねverのものですか? >>431 やっぱりaperypaq安定して強いな >>443 技巧2が異常に強いのは何故? elmoに対しても勝率30%程度になるはず >>444 すみません 確認したら2017年1月のものでした、 elmo.sdt5をインストール、調節して再度他7ソフトと30局ずつやらせます エンジンはやねうら482載せてました、 他のソフトは公開されてる中で最新のものです ApreyはWCSC28はエンジンはかなり優れてますが、評価関数はSDT5を載せた方が強いと思いますのでそのようにしました Qhapaq公開は楽しみですね しかし白ビールの人はあれで助教とか 教授とかはどんな化け物なんだよ 大学関係者デラオソロシス((((;゚Д゚))))ガクガク >>443 さすがに各30局では少ないと思う 自分の経験ではノード数にもよるけど30局で勝率55~57%位までだと、100局やったらほぼ互角になる場合が結構あるよ 同じように30局で勝率60%位なら100局やっても勝ち越すことが多い 100局やって勝率55~57%位のものは500局位やったら互角になることがあるよ >>452 勿論序列を決める十分なサンプルと言えないのはわかっているのですが、このまま対局数を増やしてもくじらちゃんの1位は揺るぎないと思ってます。 しっかりデータ取ったわけじゃないですが、くじらちゃんにやねうら載せてAperypaqやwakameとやらせてもやはりくじらちゃんがハッキリ勝ち越しましたし、くじらちゃんはやねうらよりGodwhaleの方がハッキリ勝ち越したというのもありましたし 1手1秒かそれ以下だよね? 思考時間を伸ばすと、クジラちゃんの勝率は落ちるよ >>449 2017年1月にelmo は公開されていないのですが。。。 >>455 WCSC27のelmoの作成日は20170103 >>443 面白いデータだけど、流石に対局数が少なくてなんとも言えんなー… May 08, 2018 Memory-optimized machine types with up to 160 vCPUs and 3.75 TB of system memory are now available in Beta. See the pricing page to learn how these machine types are billed. Google I/Oに合わせて発表だったのね これでそこそこ結果変わったな ARM cotex-a53だとNNたぬき遅いわ g++ pgoコンパイルでnpsが三駒評価の三割弱 >>439 そのままの評価関数値だと相当弱いから depth6〜 multipv3〜 で探索した評価値の差で採択率決めるといいんじゃね floodgateのsinbo-6700k、最終盤だけめっぽう強いな 中身はタヌキかな >>414 メモリの問題はAWS使えば解決するとは思うけど、あんまり意味ないよなあ uuunuuunさんのところでクジラのレートが下がったのはT.N.K.との相性が問題だったとのこと クジラがaperypaqに対してR50差、aperypaqがT.N.K.に対してR50差なのに クジラはT.N.K.にR10差しか出ないと >>443 の人の環境でクジラ対T.N.Kを200局くらい1手1500万ノードで回したら どういう結果になるかは興味あるな T.N.K.との相性問題が発生しているとして、こういうときはT.N.K.の自己対局の棋譜と、 クジラ対T.N.K.でクジラが負けた棋譜をそれぞれ大量に用意して絞るとよかったりするんだろうか。 そんな変な過学習は起きないような気もするが >>467 >>443 の対局結果を見る限りおそらく一手1秒以下だと思う、ノード数が極端に少ない場合は、 短時間で強い特性を持つクジラの勝率が上がったのだと思う、一手1500万ノードでやったらクジラの勝率は落ちるはず qzilla9ってキメラにしたり絞ったり改造したものを公開してもいいのかな? クジラが長時間で弱くなる傾向はない http://ii.ttlv.jp/wcsc28_gwprj/ NNUEと他のソフトとの長時間もないのに難癖もいいところ つうかGoogleが本気だすと日本の趣味でやってる日本のプログラマーw達が一瞬でふっとばされるの知ってからもう興味なくしたわ >>467 qzilla9対TNK、1500~2000万ノードで200局やるとくじらの勝率56%だった >>474 結局金の力が圧倒的すぎるからしゃーない NNUEはおろか3駒ですら何億もかけて良ければかなり強くなるだろうよ Aprey_wcsc28(純正)はやねうら王+aperypaqとほぼ互角だがやねうら王+Aprey_wcsc28(eval)は 探索の差でやねうら王+aperypaqより強くなっているようだ >>469 自分は新しいソフトを評価するときは用意している3通りの局面図を検討させることにしていて 期待した読み筋や評価値に達した時間で判定してます クジラのパフォーマンスは最高ですよ なんならこの前の名人戦第1局を棋譜解析してみるというのも手です クジラの評価値が一番安定していて信頼できることがわかるはずです ソフト同士の対戦より自分の興味は検討用に使えそうなソフト選びにあるので横から失礼しました アルゴコルセの市村さんのブログから > 5/2の前日準備の時にAWSに接続できないということが分かって、 > 今回はローカルのノートPC、i5のCPUで4コアで戦わないといけないと思った時点で > 「これは多分一次予選通過できないよな」と思って5/2の夜帰る時に気分がお通夜 > だったことを思い出せば上々といってよかったのだが、もしAWSが使えてたら > 8位入賞は狙えたんじゃないかと思ってしまってとにかく悔しくてしょうがない。 > 懇親会のときのスピーチでQhapaqさんが「今回aperypaqに六割勝てる評価関数で参加した」と > 言っていてそれが衝撃で。「ArgoCorseが今回用意した評価関数もaperypaqに六割勝てるもの > だったのですが」と思って。だからAWSのm5.24xlargeを使ってマシン的に互角だったら > 8位入賞は狙えたんじゃないかと、終わってから思うと、それが悔しくてしょうがない。 https://twitter.com/argonworks/status/993960488319909890 そこまで強い評価関数用意してたんだったら、別にライブラリ勢だからと不必要に謙虚になる必要もなくて 堂々と「こんだけ強いもの用意できました」と言っておけば森岡さんも不快にならんかったのと違う? (森岡さんも言い過ぎだと思うけど) 電王戦復活すりゃいいんだよ プロじゃなくてぐぐる先生に挑戦させる >>480 これによると、商用版やねうら王のGUIはえびふらいのHWを元にして作成するとのこと 操作性は大事よな 特に自分でフリーソフトを導入できない人にとっては「わかりやすさ」が大事となる マテリアルデザインとか >>481 エルモの人もミスで不満あるだろうし あとから書くのはどうかね がショーの人も アルゴコルセの15位とW@ndreの16位は俺にとってはすごく意外で アピール文書読んでもこの2つがシード取れるとは思ってなかったのよ アルゴコルセはAWSのすごいの用意して、自信はあるんだろうなとは思ってたけど >>486 あれはohgaさん→Noviceさん→滝澤さん、だからなあ あと、エンジン引っこ抜いてこれば将棋所やShogiGUIでも使えるようにするってさ >商用版やねうら王 えびふらいの放送でいろいろ話してた >>481 レート計測結果を公開すれば評価されるんじゃね 物自体が公開されたほうが面白いけど クラウドを使えないというのは謎だけどね・・・ [貝瑞基因杯2018世界人工智能囲碁大戦最終順位] 優勝:[中国]鳳凰囲碁(Phoenix Go) 準優勝:[中国]絶芸(Fina Art) 第3位:[ベルギー]麗拉囲碁(Leela Zero) 第4位:[中国]天算囲碁(TS Go) 第5位:[韓国]石子旋風(DolBaram)、[韓国]小愛囲碁(BADUKi) 第7位:[日本]英雄王(HEROZ Kishin) 第8位:[フランス]高盧(Golois) Heroz…… 市販ソフトとなると基本的に詰将棋ルーチンはついてるけど、やねうら王にもつくんだろうか >>465 ピンポンーw 詰みルーチン積んでるから、 強豪にゲリラ的に勝つことがあるみたい・ >>497 詰みルーチンは選手権ではクラスタの一要素として動いてたので、配布版のバイナリにはついてないと思うけど 単に評価関数の差では このスレの住民がYouTuberスレで暴れているのだけれど、一体誰だろう? 747 名無し名人 (スップ Sd12-U1E9 [1.75.5.253]) sage 2018/05/05(土) 18:38:20.45 ID:L99eiw4td 折田はなんでレーティング選手権に出なかったんだ? 777 名無し名人 (スップ Sd12-U1E9 [1.75.5.253]) sage 2018/05/06(日) 12:22:21.36 ID:awve6uJXd たとえ、プロ棋戦に繋がらなくても折田はレーティング選手権に出るべきだろ 他の強豪アマは出てるのに 836 名無し名人 (スップ Sd12-U1E9 [1.75.5.253]) sage 2018/05/07(月) 19:42:34.91 ID:Qzm/yHnkd アゲアゲがプロになっても底辺だろう 838 名無し名人 (スップ Sd12-U1E9 [1.75.5.253]) sage 2018/05/07(月) 19:50:03.36 ID:Qzm/yHnkd アゲアゲは金儲けの味を覚えてしまったようだ そりゃ、レーティング選手権に出るよりライブ配信した方が信者から投げ銭してもらえて儲かるさ ライブ配信のような甘い蜜を覚えてしまったらもう上では勝てないだろうな 昨日まで問題なかったクジラちゃんがいきなりウイルス扱いされたなんでや >>451 まんぐう将棋と同じ人の大学の研究科にいたけど 教授だからと行ってもプログラム技術やコードの最適化とかが優れているわけではない。 ガチガチの最適化とかは暇な学生さんの方が強い。 新しい理論やアルゴリズムを提案するのが仕事なので自分の研究テーマ以外はあんまり知らないんだよ。 あと、アルゴリズムを考える=コードを最適化する、というのは違う。 教員の人は自分の時間が作りやすいので趣味に没頭できるんだけど。 決勝 7回戦 大合神クジラちゃん2 - 名人コブラ http://live4.computer-shogi.org/wcsc28/kifu/WCSC28_F7_DGK_MCB.html これ見てたら両者千日手の権利がある局面があって両方打開して結局256手で引き分けだったけど 本当の形勢はどっちが優勢だったの? 技巧で研究した内容を激指にぶつけても全く勝てなくて、 試しに技巧と激指を指させたら激指が勝っててワロタ 大会前にダメな変化潰せてよかったではある ちなみに、技巧で評価値1000以上だったんだぜ・・・ >>511 超速対ゴキ中で、エルモが▲+700つけた筋をApery_SDT5が△+に覆したりしてるから。 まああるっちゃある。 >>513 やっぱ教師局面が数十億や数百億だと、圧倒的に足りないんだよな 将棋の世界は広大だわ 今月の将棋世界の升田賞選考経過はおもしろかったな 新聞記者2名がソフト発の手は升田賞に選びたくないと言ったら 塚田が、ソフト発でも棋士は十分研究して指しているので問題ないと反論していた しかし記者はソフトを相当忌々しく思っているんだな ソフト発の手がダメなんて事になったら新手生まれなくなるわ >>519 何を表彰するの?ネタづくりとか? サトシンのかつらとか、永瀬軍曹のバナナとか? 考えてみると記者と将棋ソフトの方が棋士と将棋ソフトより利害関係にあるのかも >>523 ソフトの解析結果をつかって観戦記風の 文章を作るプログラムをどっかで見たな。 けっこうさまになっていた。 解説だけなら観戦記者は不要になる。 ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる