▲コンピュータ将棋スレッド125
■ このスレッドは過去ログ倉庫に格納されています
>>486
千日手に突入してるからじゃねーの?
局面図貼ってみろ suimon
@floodgate_fan
·
5m
偽りの真実が彷徨う人混み
作り笑いも覚えたけれど、涙もまだあるから
suimon
@floodgate_fan
·
1h
真夜中の帰り道
名前の知らない浮浪者(紳士)が
近づいて愚痴をこぼしてきた
「やりたいことを捨て去り
あくせくと毎日書き込んでも
気づいたらこの腕には何も残っていない」
と嘆いていた 👀
Rock54: Caution(BBR-MD5:0be15ced7fbdb9fdb4d0ce1929c1b82f) またsuimon粘着ここに来たのか
シコシコスレ立てしてればいいだろ
少なくともこっち来んなよ 黒い瞳の奥底は四面楚歌
ただでさえいろいろあるのにコンピュータ将棋スレくらい好きに使いたい。 臭えから残り香はTwitterスレから出てくるなよ 残念ながら4.78は4.77に比べてAVX2とAVX2-tournament共にNodes/secondが-1.2%位
下がっています。若干4.77より弱い可能性があります。
yane4.78AVX2 bench 1024 1 19(1回目先に計測) Nodes/second 746947
yane4.78AVX2 bench 1024 1 19(2回目後に計測) Nodes/second 753635
yane4.78AVX2 bench 1024 1 19(3回目後に計測) Nodes/second 753577
yane4.78AVX2 bench 1024 1 19(4回目先に計測) Nodes/second 748779
yane4.78AVX2 平均750734(4.77より-9399, -1.236%)
yane4.77AVX2 bench 1024 1 19(1回目後に計測) Nodes/second 760543
yane4.77AVX2 bench 1024 1 19(2回目先に計測) Nodes/second 760360
yane4.77AVX2 bench 1024 1 19(3回目先に計測) Nodes/second 758190
yane4.77AVX2 bench 1024 1 19(4回目後に計測) Nodes/second 761442
yane4.77AVX2 平均760133
yane4.78AVX2-tournament bench 1024 1 19(1回目先に計測) Nodes/second 746514
yane4.78AVX2-tournament bench 1024 1 19(2回目後に計測) Nodes/second 757473
yane4.78AVX2-tournament bench 1024 1 19(3回目先に計測) Nodes/second 763337
yane4.78AVX2-tournament bench 1024 1 19(4回目後に計測) Nodes/second 757316
yane4.78AVX2-tournament 平均756160(4.77より-9145, -1.194%)
yane4.77AVX2-tournament bench 1024 1 19(1回目後に計測) Nodes/second 761009
yane4.77AVX2-tournament bench 1024 1 19(2回目先に計測) Nodes/second 768113
yane4.77AVX2-tournament bench 1024 1 19(3回目後に計測) Nodes/second 767749
yane4.77AVX2-tournament bench 1024 1 19(4回目先に計測) Nodes/second 764351
yane4.77AVX2-tournament 平均765305 >>493
お前弱いくせにに毎日毎日うるせーんだよ
消えろ >>474
大阪人は幼少の頃から毎週末に吉本新喜劇見させられて育つから
話にお笑い要素を求められる、詰め込んでしまうのは仕方ない事なんやで tamoreとtamoreGKの違いがよくわからない
40秒で対戦させてみたが
評価値の正確さはtamoreの方が上回ってる気がする 新しいYaneuraOu落としてコンパイルしてみたんだが
検討のときの詰みの手数が1手少なくなっているんだが自分だけ? >>505 ライブラリー派と非ライブラリー派を分けてる感じらしい
ーーーーーー
<カテゴリA>
思考部はすべてオリジナルなプログラム。決勝進出を望むもの。
<カテゴリB>
思考部の一部を他者のプログラムの技術を流用したプログラム。予選のみの参加で、決勝進出を望まないもの。
思考部のオリジナルについて
<思考部の定義>
プログラムにおける思考部とは、次の一手を選択するために重要な意味を持つ部分を指す。
手の選択に直接関連しない部分である、GUIや通信部分、単に合法手を生成するだけの部分はそれに当たらない。
<オリジナルとは>
オリジナルであるとは、開発者自身が自分の手でコードを書いたものを指す。ソースコードが公開されたプログラムやライブラリ等があるが、
そのプログラムの作者本人以外がそのソースコードの思考部の全部、または一部をそのままコピーして使用した場合は、
ここではそれをオリジナルとは呼ばない。また、他者の行なった機械学習によって得られた結果を流用することも、ここではオリジナルとは呼ばない。
http://www.igoshogi.net/ai_ryusei/01/requirements.html >>474
大阪は頭ええ事よりも面白い事の方が評価されるからしゃーないねん [Floodgate/Shogi-serverのお知らせ] 25日の23時ごろシステム障害があり、27日22時頃復旧しました。 math26? @math26 20 分前
>Eテレ「人間ってナンだ?超AI入門」第5回
2017年11月3日 (金) 10:00-
ゲスト
プロポーカープレイヤー 木原直哉
人狼知能開発者 狩野芳信、鳥海不二夫
AIエンジニア 山本一成、水上直紀 16コア/ 16T 1手10秒/ hash4096 /no_book /ノード 6000万〜9000万 /投了値 3000
Y04.77T使用
自ソフト1 vs tamore
50局 30-2-18 .625
とりあえず手持ちがtamore相当の強さがあることが分かった
やる前は正直40%くらいしか勝てないかと思った(tamoreかなり強いと評判なので)
時間あれば手持ちの他のソフトとも対戦させてみます。(しんどいので100局とかはやらないです) >>511
自分もtamoreと独自にブレンドしたものを長時間対局させたけど、50局時点で31-1-18 .632
で勝ってたのが、100局になった時点で45-2-53でtamore負けた。最低200局は対局しないと
分からないと思うけど。 >>512
訂正 100局になった時点で45-2-53でtamoreに負けた。 カツ丼将棋の24レートだいぶ下がってるな。前2500くらいあったのに
KatsudonShogi:ai
会員 2061 (三段)
[today] 0勝 0敗 >>512
情報ありがとうございます。
50局までは同じような感じですね。
今度時間あれば50局追加対局してみます。 >>505
ここで囲碁将棋チャンネルを引っ張ってくるか―、って感じ。
メイエン先生がソフト作ってたりするの、こういうとこで効いてるのかなあ。 電王トーナメントまで土日祝は今日を含めてあと5日
開発者頑張って 囲碁の方は 思考部のライブラリ使用は ずっと決勝進出無しの予選までルールで やってきたので、その風土の引継ぎだろうなんだぜ。
また、今までそもそも無かった、他者の行った機械学習の結果を利用することを 前もって制限したのが、新しい違い。
先行するコンピューター将棋が参考になったのではないか。
この縛りは 既大会の参加者には 急かすところがなく、秘伝のタレを煮込め、という方向性のよう。
その他 会場の風景の違いとしては、
コンピューター将棋の方は 対局中に開発していたり、読み筋が出てくることと、評価値が上がったり下がったり メイトが出たりするので 騒いだりしているが、
コンピューター囲碁の方は 勝率表示なんで見ても 55% とか 60% とか 強豪でもなければ盛り上がらないのと、
盤面に石が埋まってくると だいたい終わりなんで、それまでの間 おしゃべりしている感じだぜ。
あと、第9回、第10回まで 囲碁の方は プロ棋士の方が ほとんどのコンピューターソフトより強かったのと
ソフトが弱かったので 指し手が全然ダメダメだったのが 雰囲気の違いだぜ。
もう1つ大きな違いが 決勝の会場内で マシンと同じ部屋で 一般来場者を呼んでの 大盤解説 をしていたぜ。
両方出ると面白いんじゃないか。 勝敗項ではなく
数手先の評価値で後から補正したのって
どのソフトだっけ?
何で上手く行かなかったのか忘れてしまった YaneuraOu 4.78 sse42ですが
将棋所3.9.2で連続対局出来ていますか?
私の所では二試合目が始まらない
開始局面平手 おちつけおちつけ
雑談を議論と勘違いしてるやつしかいないんだから きふわらべさんさKPPTに変わる新しい評価関数を作ってください 残念ながら4.79は4.77に比べてNodes/secondが、AVX2は-0.474%、AVX2-tournamentが
-1.188%下がっています。若干4.77より弱い可能性があります。
yane4.79AVX2 bench 1024 1 19(1回目先に計測)Nodes/second 746963
yane4.79AVX2 bench 1024 1 19(2回目後に計測)Nodes/second 749448
yane4.79AVX2 bench 1024 1 19(3回目先に計測)Nodes/second 755180
yane4.79AVX2 bench 1024 1 19(4回目後に計測)Nodes/second 759042
yane4.79AVX2 平均752658(4.77より-3588, -0.474%)
yane4.77AVX2 bench 1024 1 19(1回目後に計測)Nodes/second 752502
yane4.77AVX2 bench 1024 1 19(2回目先に計測)Nodes/second 757242
yane4.77AVX2 bench 1024 1 19(3回目後に計測)Nodes/second 761134
yane4.77AVX2 bench 1024 1 19(4回目先に計測)Nodes/second 754108
yane4.77AVX2 平均756246
yane4.79AVX2-tournament bench 1024 1 19(1回目先に計測)Nodes/second 745794
yane4.79AVX2-tournament bench 1024 1 19(2回目後に計測)Nodes/second 758463
yane4.79AVX2-tournament bench 1024 1 19(3回目先に計測)Nodes/second 754705
yane4.79AVX2-tournament bench 1024 1 19(4回目後に計測)Nodes/second 758298
yane4.79AVX2-tournament 平均754315(4.77より-9069, -1.188%)
yane4.77AVX2-tournament bench 1024 1 19(1回目後に計測)Nodes/second 767241
yane4.77AVX2-tournament bench 1024 1 19(2回目先に計測)Nodes/second 766751
yane4.77AVX2-tournament bench 1024 1 19(3回目後に計測)Nodes/second 760884
yane4.77AVX2-tournament bench 1024 1 19(4回目先に計測)Nodes/second 758662
yane4.77AVX2-tournament 平均763384 やねうらおってなかなか凄い人だな。
認めて差し上げよう。 三駒関係や、ディープラーニングには 人間には見つけられない癖があるはずで、
盲点が無いプログラムが既に登場しているとは 考えづらく、
また、探索部に ストックフィッシュを使っているということは
手を細く絞って深く読んでいると思うので、
そんなソフトで作られた評価関数は
野球のスイングで言うと 全打席ホームラン狙いをしてるんじゃないかとも思うんで、
ストックフィッシュと 自作ソフトの合議制にして、
自分の手番でストックフィッシュが選んだ手は 選ばないようにして
相手が読んでいる本筋を外し続けるとか、
やってみたいことは いろいろあると思うんだぜ。 ニューラルネットワーク(NN)ははもともと
各クラスのベクトルの単純平均をプロトタイプとする最近隣法(NN法)にすぎない
(それの境地に向けて学習が進むだけ
からベイズ分類器に劣るベイズさいこー
しかし逆に対象の事前確率も共分散行列もわからない状況のときは
単純平均というのは案外頑健な統計量というほかなく、
そんなNNをうまいぐあいに凡化性能マックスで収束させるDNは脅威
これは学習対象の事前確率と共分散行列を具体的に知らねば出し抜き続けることは至難 全打席ホームラン狙いの例えが意味わからんが、それも結構じゃないか
小技とかクソ喰らえ、クラッチ?んなもんねぇよが最新野球科学だし
実際真理ではないんだろうが、実益上問題なければそれでいい 最新、難易度ランキング
100:チェス世界チャンピオン
98:世界棋士レーティング(囲碁)1位
97:世界囲碁マスター・世界棋王・世界囲碁選手権者のいずれかを獲得
95:囲碁七冠達成、将棋七冠達成
90:囲碁名人位、将棋名人位
87:チェスグランドマスター
85:東大医学部教授
80:最高裁裁判官、事務次官
79:医師(東大医学部、理科三類経由)
74:弁護士(東大法学部→旧司法試験)、囲碁プロ試験合格、将棋プロ試験合格4段
70:医師(国立) 裁判官(地方、東大法京大法)、囲碁アマ8段、将棋奨励会3段
69:検察官 弁護士(私立法学部→旧司法試験)、囲碁アマ7段、将棋奨励会初段
67:公認会計士(東大京大) 検察官弁護士(東大京大法学部→新司法試験)
65:英検1級、医師(私立) 国家総合職(国立)新司法試験(私立法学部)、院生試験、奨励会試験、囲碁アマ6段
64:公認会計士(国立)弁理士(理系国立)
63:公認会計士(私立)電験1種 技術士(上位) 司法書士(国立)、囲碁アマ5段、将棋アマ5段
62:弁理士(私立)税理士(5科目) 弁理士(国立文系)
61:日商簿記1級、司法書士(私立)、囲碁アマ4段、将棋アマ4段
60:英検準1級、漢検1級 ストックフィッシュ系は 軽い局面評価関数である三駒関係を利用した 膨大かつ高速な探索ノード数がウリで、
その探索の長所を活かすために 評価関数を軽くしているところもあるので、
四駒関係が それを上回るとすると、 三駒関係の読みを外して勝っているはずなんだぜ。
読みの広さ、深さが 局面評価の貢献を上回るなら 二駒関係や駒割りのみに戻るはずなんだが、こっちの道も十分ありうる。 tamoreとyaselmo混ぜても強くなんないの >>535
探索の長所を活かすために 評価関数を軽くしているところもあるので ←??? 単純に混ぜただけじゃ強くならない、というか弱くなる tamoreはKPPTの極限まで強くしています、その為、確かにtamoreを混ぜてある特定の評価
関数より強くできますが、その代わり、ほぼ互角だったtamore_G,Kより弱くなったり、yaselmo
との勝率が落ちたり、また、tamore_G,Kを混ぜても、tamoreに弱くなったりと、相性が顕著に
出ます。従って、混ぜても、ある特定の評価関数に強いだけで、レーティングそのものは逆に
下がるようです。ちなみに私は透さんではありません。 tamoreは野生の読み太と混ぜると強くなる(tamore以上に)
野生の読み太は2つほど出てますが
配合具合は試してみて下さい >>541
それも1%単位で試し、確かにtamoreより明らかに強いのが出来ましたが、tamore_G,Kより弱く
なりました。逆にtamore_G,Kにも同じようにした結果、tamoreより弱くなりました。 結局、ブレンドに使った、そのものに強いだけで、素材性質に違うものには弱くなります。 また、yaselmoにはtamore+野生の読み太や、tamor_G.K+野生の読み太より、tamoreが、ずば抜け
て一番強いです。 自分の環境ではyaselmoとtamoreは200局やって互角だったんだがな 従って、tamoreとtamore_G,Kに限っては、混ぜるとレーティングが下がります。 なんだかんだ言って、yaselmoより有意差があるほど強いのがない件。 単なる相性だろう
直対だけで言えばrelmoだってyaselmoと互角だし relmoとyaselmoが互角はない。
5秒6スレ300戦やってyaselmoが勝率65% 相性ってのは互角局面集を使っても出るの?
もし相性があるとしたらどこらへんが原因で出るの? 16コア/ 16T 1手10秒/ hash4096 /no_book /ノード 6000万〜9000万 /投了値 3000
Y04.77T使用 /平手初期局面
自ソフト2 vs tamore
50局 26-3-21 .553
あと2ソフトほどと対戦してみます tamore GKもtamoreもyaselmoも6スレ5秒で対relmoの勝率7割越えなかったから
定跡なしでrelmoとやってみるといい >>553
70%ってことはレート150くらいの差。
流石にrelmoにそこまで勝てない気がする
。手元のR表だと自ソフト2とrelmoの現R差159だけど、
直接対局だけではないので。
良くて対relmoは65%かな(予測)
時間ある時やってみます。 信頼区間をつけないと相性とか7割とか言っても全く信用できない 今月の数学セミナー、コンピュータ将棋・囲碁特集で、
Ponanzaの開発経緯とか数学的背景、千田の記事とか載ってるよ やっぱりそんなに甘くないよな
手軽な遊びだから、一時期夢中になってブリードしまくってたけど、
yaselmoより有意に強くなってるで!って思ったら、
技巧2に全然勝率上がらないとかよくある >>557
特定のソフトとの多対局-対戦成績からのレート計測がほぼ無意味と思ってる。
(開発者の方の強さ測定には必要だろうけど)
勿論それなりに正確なこともあるが
必ず557さんのようなことになる。
信頼区間?単なる趣味にそこまでしないよ
信用しなくてけっこうよ、公開はしないんだから ご自由に発言して。
ここおもしろいね すぐ「信用できない」 (笑) 連続対局回してて7割位勝ってる!と喜んで床について、
朝起きたら100局で五分五分だった、というのが今日もあった・・ 100局でもどっちが強いかわからないし
長時間対局なら更にわからないな >>559
ちゃんと観測していないからだろ;
自己対戦中もOSがバックグラウンドでやるI/O処理やら
推奨振動子のジッタやらでソフトはPC外部からの量子論的干渉を受け続けているんじゃ >>559
1手の秒数に限らず100局はやらないとダメかもですね。
本当に強いソフトに関しては最低100局までやってみようかな。
けど、それ以上はソフトを公開する方ならともかく必要ないかと。
自分のソフト1も2もそこそこ強いのに少なからずバグあるので・・・
こうやって測定して遊ぶ 悪趣味。
やねさんが最強で間違いない。 >>560
>>561
>>562
100局やると大体の誤差は5%前後以内くらいにはなるかなーと
95%信頼区間は前後10%だけど
80%信頼区間は前後5%くらい
5%以上は強くないとあんまり強くなった気がしないし、
100局で五分五分なら強くないと判断できる
5%未満を追い求めるなら別だし、グラフ見てイケそうと思うんなら追試も可能だし >>558
「信用できない」は、お前さんが嘘を言ってるという意味じゃないよ。
ランダムの偏りにあまりに無防備な報告者が多いからね。
ランダムの定義からすると逆説的だが、偏らないことが保証されてるのはランダムではない。
サイコロは6回ごとに必ず6がでたりはしない。 >>558
信用できないはまさに565が言った通りで、嘘をついてるとかじゃなくて
単なる偶然や勘違いとの区別がつかないって意味な あれれ 人間のtopプロがタイトル戦七番(先に4勝)で決着つけて信頼区間の話にはならないよね。
対 tamore 勝っても負けても載せるつもりだったけど、今のところ勝ってしまってるだけ。
なんでソフトだと結果に厳しく言われんのかな?別に公開(今後更に強いのできても)もしないし、
こっちが強いとは一言もいってない。今 tamoreに勝ち越せるソフトってどのくらいあるのかな。 ここに対局結果掲載したのが馬鹿だったんでとりあえずやめます。
対局の結果は偶然や大勘違いでした。 お騒がせしました。 ご自慢のソフト(キメラしただけ)を公開しないって言ってるなら
ここで結果を言っても誰も何も思わないのにw
せめて棋譜でも貼ればいいのに承認欲求の塊で草 まぁ、大人げなかった気もしないでもないな。
さらっと承認欲求を満たしてあげても別に何も困らないからそうしてあげてもよかったなw どうせSDTまでの余興だし。
大っぴらに言わないだけで強豪チームはyaselmoより強くしてるでしょ >>574
じゃあDB2こいよ
俺のi7ボコッてくれよ
ご自慢のソフトでw まぁ、キメラで承認欲求満たしたい人って少なからずいると思うんだよね。
uuuuuunさんあたりがキメラ大会開けばいいんでないかなぁと思ったりはする。 馬鹿が馬鹿を呼んで馬鹿だらけになるので、
ここで馬鹿の承認欲求を満たす必要はない >>577
それは残念ながら否定できないな。
考えを改めよう。 GKに、100戦して8割勝つソフト出来た
公開しないけど 俺の評価関数は勝率1億パーセントだから
おまえ等まだまだだな うかむせに横歩定跡で狩られてたcurryはもういないのか
成長したな またソフトtamoreは羽生に負けてたぞ
49竜を悪手認定したのに
手を進めたら互角後手寄りになりやがった
これってソフトの欠陥なのかね? 「最善手」はその局面の完全解析なんだから議論する意味はない ■ このスレッドは過去ログ倉庫に格納されています