▲コンピュータ将棋スレッド126
■ このスレッドは過去ログ倉庫に格納されています
>>749
もうしばらくは評価関数乞食タイムだからしゃあないな 確かに、floodgateは対戦相手が多い方が面白いからな。自己対局で満足していないで、まだ
参戦したことがない人も、floodgateで荘ホ局しましょう=B自分もちょこbソょこ参戦してb「るけど、同じ
位の強さの相手と対戦したときは面白いよ。評価関数の差は、どんぐりの背比べの違いしか
ないと思う。 キメラを絞ったものを放流して、sdt5の評価関数達と対局させてみてるけど
結構戦えてて意外とこんなもんなのかって感じ >>749
PR文読んでも使ってみたくなる要素皆無だしな
なんらかのブレンドで覚醒したら分からんけど ttps://github.com/TukamotoRyuzo/Yomita/issues/24
独自フォーマットなのか
逆に期待 elmoの滝澤さんのツィッターみたけど
elmoは選手権時より+150しかレート上がらなかったんだな
それでもあの成績だから
yaselmoとかでも十分トーナメント進出はできたな 瀧澤さんは途中まで四駒で頑張ってたからしょうがない
やねや平岡さんもそうだけどやっぱり四駒厳しいんだな
マシン制限無しの選手権で期待 激指が着実に一年間R50〜100上昇させてるということで
「こんなに早いペースで進化されたら、プロ棋士はあっという間に置いて行かれる」とか言ってたのにな 四駒じゃ公開されてもパソコン性能足りなくて動かないOR重いって人が多いでしょ
実用的じゃなくなるね 選手権までにはどこかが四駒間に合わせてきそうだし楽しみだわ
RAM32GBまでにおさまってれば言うことなし ぽんぽこはまだ一般人が使うのは無理?
ソース公開と言われてもわからない ポナはクローズのままじゃないの
ドワンゴは永久保存とか言ってたが
そのうち捨てちゃうんじゃないかw aperyが相性問題で4駒諦めたとしたら
学習について何らかの新しい知見が必要になるんじゃね
極端な方向につっこんで修正が効かないのでは強くしようがない >>766
sdt5直前に言ってた相性問題は三駒の方だと思う
四駒は処理の重さが一番の課題かと メモリ32Gで動かすとするとKKPPTがせいぜいでしょ
そんなに劇的に重くなるとは思えんけど 3駒でもメモリ帯域でNPS30%程度変わるから
4駒だとボトルネックがCPUよりもメモリ側になりそう
最高級のメモリで32GBも揃えるのは
マザボもワンセットだろうし個人では相当キツイぞ 大会でレギュレーション決められてるのはどうしようもないけど、検討用で四駒が重いならメモリ増やせばいいんでないの? 稼働時の重さははじめに見積もるだろうし動き出せばわかること
そこでこりゃあかん、となれば早めに切り上げると思うが
学習がうまくいかないことのほうが怖いと思うなあ KPPと(KKPT+技巧方式の進行度+駒の効き)でレート向上しないのかね 今のfloodgateはアンカー無しで平均1500になるんだっけ?
これでは参加者が変わると変動が半端ないと思うのだが >>763
おとなしく手引ページが出来るまで待っとこうな 3駒ですら重すぎる可能性だってある
次回は4駒どころか2駒が優勝しても不思議ではないぞ wdoor.c.u-tokyo.ac.jp/shogi/view/2017/11/13/wdoor+floodgate-300-10F+infiniti0+WesternLariat+20171113053002.csa
kyokumen.jp/positions/97712
この局面で振り飛車をやってくれる定跡キボンヌ KPP_KPPT型ってブレンド出来ましたっけ?
人造棋士18号が公開されたので。
あとKPPTとKPP_KPPT型の変換コマンドってありますか? >>>777
四間飛車にするように定跡入れてみてるけど勝率は良くない
振り飛車やりたかったら評価関数自体を振り飛車の教師局面増やして
1から学習するしかないんだと思う >>778
ブレンドできるし、変換コマンドもあったはず
ソース内のtestコマンドのところを見てみたらあるんじゃないかな 対振り飛車の指し方はバージョンアップするたびに変化するから面白いな
もうelmo囲いはやらなくなってる? aperyが一から書き直して強くなったってことは学習部分の実装がキモになるのか。 aperyは4駒じゃなくてPPP試してたみたいですね、commit見る限りでは PPP 結局3駒に
新しい評価関数を目指した 鵺 出場辞退
4駒勢 ほとんどのチームが上手くいかず
3駒より優秀な評価関数を作れたらボナメソ以来のブレイクスルー 規模がでかくなれば学習は遅くなるだろう
適切な条件も違うだろうがそれを見つけるのは大変だな
時間切れで諦めるのも宜なるかな C++でソースコードからバグを発見するのは余りにも難しい
やねうら王の学習部にも何処かにバグがあるんだろうけど
発見するには相当な労力がかかりそうだね 開発者計測まとめ
shotgun floodgateでR3500(sg_test?)
elmo 旧elmo+R150(1手5秒, 1553局)
Qhapaq 旧elmo+R180?、yaselmo+R70
ぽんぽこ 旧elmo+R180、蒼天幻想+R190、白美神+R280
やねうら王 旧elmo+R170以上(評価関数だけならぽんぽこより強いらしい)
Apery 旧elmo+R310、yaselmo+R115(探索はAperyWCSC27, 1手3秒4スレッド)
Ponanza DLなしでWCSC27+R20〜40、DLありでさらに+R150
Ponanza(WCSC27)はNNをオーダリングに使用して+R70だったので、Value Networkと三駒評価関数を併用することにより+R80。
ただし、オーダリングのNN自体が強くなっている可能性もあるので、VNの向上分は殆ど無いかもしれない。
全体的に自己対局のバイアスがかかって過剰な勝率になっていることに注意。 core i7-7700
ハッシュメモリ各8GB
定跡なし
秒読み10秒
ノード数 4000万〜6000万
やねうら王エンジン使用
の条件で
Aperyとtamoreを50戦対局させた結果
対局数50 先手勝ち23(51%) 後手勝ち22(48%) 引き分け5
Apery
勝ち36(80%) 先手勝ち18(81%) 後手勝ち18(78%)
tamore
勝ち9(20%) 先手勝ち5(21%) 後手勝ち4(18% うるせえなあ
10秒だと丸1日以上かかるんだよ
お前がやってみろよ いろんな話をきくとAperyの評価関数はR4180くらいかなって気がする まふ@まふ定跡開発者? @mafu_op_theory
身バレに気をつけている私が、謎の交流関係を持っている親友に
「話のネタに使っていいよ」と言った結果。
「この前、辻野さんに囲碁AIの話聞いたんだよね。メールしてみよう」
「誰?」
「Google Japan元社長」
ファッ!?
囲碁ソフト用定跡作成が始まるっっ!わけがない。
↑60歳の辻野晃一郎を辻野さんと呼べる人が親友なのか。 >>780
なかったみたいです。
KPPT型とKPP_KPPT型の変換コマンドを知っている方は教えていただけますか? パソコンに疎い私でも分かるようなyaselmoやらAperyの導入方法を教えてください><
suimon氏のブログに記載されている導入方法を試してみてもよく分かりませんでした>< >>795
あります。
test evalconvertのところを見てください。
Dr.ゲロ >>796
ノード数が少なくなったら意味ねえだろ?
それなら1秒でやればいいだろ
いちいちからむな >>797
Aperyはダウンロードして展開してエンジン登録するだけだよ
あなたにはやねうら系列はおそらくまだ無理でしょう Aperyは大会に参加して使うとか以外なら、再配布、改変化らしい
平岡さんのtextに書いてあった >>800
お前も評価関数変換無理だったもんなwww >>795
test evalconvert kppt32 フォルダ名 kpp_kkpt32 フォルダ名
みたいな感じで変換できるんじゃなかったっけ?
間違ってたらすまん
そして変換しただけではただもとよりやや弱い物ができるだけな気がする 心配なら比較するのもいいと思うよ
差異無しだとおもうけど ponanzaは公開してほしいけど、今の現状を考えれば公開しない方が良いと思う。
マジで大会がクソゲになっちゃうから。
今年の時点で既にクソゲー感あったのに、もし仮に公開して、
来年やねうらライブラリとポナンザライブラリとAperyライブラリで合計20チーム、
なんてことになったら、仮にそれよりちょっと落ちるけど独自性も将来性もあるソフトがあっても、
絶対に埋もれてしまう。
習甦なんて、着実に強くなってるのに全然決勝の舞台に出てこられないじゃん。 海底、Noviceの慶応コンビは真面目で優秀ですね 二日弱放置してるやつ
やね4.79tournament・定跡なし・3秒(12-15Mノード)
apery対yaselmo 189-12-123
引き分け除去だと95%信頼区間でyaselmoからR+35.76〜112.9
引き分け0.5勝だと95%信頼区間でyaselmoからR+34.43〜110.85
やっぱ300局ちょいじゃ少なすぎて精度がごみくずだな、もうちょい放置しとく
勝率: 0.6057692307692307
標準誤差: 0.027733077259971005
95% 信頼区間 [0.5512820512820513, 0.657051282051282]
相対イロレーティング: 74.62267709353846
標準誤差: 20.173657188835367
95% 信頼区間 [35.760164491724396, 112.94803334821783]
勝率: 0.6018518518518519
標準誤差: 0.027258521192369895
95% 信頼区間 [0.5493827160493827, 0.654320987654321]
相対イロレーティング: 71.77796042530761
標準誤差: 19.761153538528742
95% 信頼区間 [34.42685860978275, 110.84713530342793] >>789
Tamoreは4140て話もあったから、
Aperyはひょっとして4380あり得る? >>807
将棋ブロガーは不真面目で褒められない上にコマンド打てない雑魚だもんなぁ >>806
公開して、ライブラリ登録しないという道があるが 公開してくれた方が棋界にとってはプラスになるけれど、こればかりは山本さん次第だな >>812
それこそメチャメチャ使いやすいGUIとセットで売れば良いのに 確かにこれ以上改良しないならある意味完成版なのでパッケージングしてしまってもいいね
※ただしマイナビはポナックスの件もあり難しそうなので他に当たる(ベクター?)しかなさそう >>809
ノード数少なめだからそこらへん関係してそう 決勝のショットガンvs狸のFGで大量に指された横歩の将棋。ここで狸が△5五桂っていう手を前から読めていたのが勝因
shotgunは4分の長考で大反省。他のソフトは△5五桂読める?
後手の持駒:飛 金 桂 歩
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香v桂v銀 ・ ・ ・ ・ ・ と|一
| ・v歩v玉 ・ ・ ・v歩 龍 ・|二
|v歩 ・v歩v歩 圭 ・ ・ ・v歩|三
| ・ ・ ・ ・ ・v歩 ・v歩 ・|四
| ・ ・ ・ ・ ・ ・ ・ ・ ・|五
| ・ ・v角v角v香 ・ 歩 ・ ・|六
| 歩 ・ ・ 歩 歩 歩 ・ ・ 歩|七
| ・ 銀 ・ 金 玉 ・ ・ ・ ・|八
| 香 ・ 金 ・ ・ 金 銀 桂 香|九
+---------------------------+
先手の持駒:銀 歩二
後手番
先手:shotgun2
後手:ponpoko2 Ponanzaはいまさら公開はしないでしょ。ポナ山さんにメリットがない。
数人体制で開発してるのにそれぞれの人に了解取って、
ソースコードを公開用に整備して、ってめっちゃ手間でしょ。何の得があるの?
今までの彼の行動原理から考えてそれはやらないでしょ。
てかポナ山さん引退しないでしょ。肩書が定まるまでは。
今Ponanzaの開発止めちゃうとようわからんAI伝道者的な人、みたいになっちゃう。
一方Ponanzaの地位は確立している。Ponanzaを開発したい優秀なチームメンバーを集めればいいだけ。
開発からは引退で、これから当面はチームの統括に専念しますよ、ってことじゃね?知らんけど >>817
18号はたぬきと遺伝子が似ているので、割とすぐに△5五桂を挙げてきますね。 >>817
うちのは45桂を最善に挙げて評価値は後手が100くらいいいって言ってるな
よく思うけど評価関数って読み抜け多いんだよな実は
最善の手を指して評価値-500振れるとか絶対最善じゃないだろっていう >>818
公開というか有料でもいいからGUI整えて激指みたいに売り出せば使うのにってことじゃね?
ソースを何もかも公開しろって思ってるわけじゃないでしょ >>817
△5五桂見つけるには
やねうら王 Apery_std5では60億局面、
Gikou2だと5000万局面
Qhapaq_WCSC27だと3億4000万局面
Apery_WSCS25だと3億局面
どのソフトも△6五桂か△4五桂が第一感のようですね >>746
そうでございましたか ありがとうございます やっぱり局面によっては技巧2の方が優秀だったりするんだな。
将棋沼は深いもんやでえ >>821
Ponanza終了なら、解析されるのを恐れる必要もないし売るって手もあるかもなあ
売ることを前提に開発していたならそれも有りかもね
でも心血注いだ自分のアイデンティティを売るってのは感情的に抵抗あるだろな。前例あるけど。 エイプリーの評価関数強いな。2戦しかやってないけど、 強さなんて一瞬で過去のものになる
その他で売りを作れないとすぐに使わないソフトになってしまう 4駒は来年5月のコンピュータ将棋選手権に持ち越しだね
メモリーの制約はないから、だれが成功するか、ヨーキーはやってくれるだろう
あと勝又は出禁な ponanzaは商用パッケージで苦い思いをしているから相当無理くさい
昨今の傾向からしても無料公開のほうがまだ可能性があるくらい
もっともどちらもほぼないと思う >>829
WCSCでも、実行にAWS使う場合は144GiBまでのメモリしか使えない やねさんが、KPP_KKPTにするとNPSが10%くらい上がって
メモリ帯域がボトルネックになっているようなPCでmany core時はもう少し得するかも
って言ってますが、なんでメモリ帯域がしょぼいと得するかわかる方いますか? DRAMのデータセルアクセスは遅いのよ
多段のキャッシュ機構やらパイプライン化を意識したデータ参照やらで隠蔽しているけど
生アクセスを待つ事態になったら恐ろしい遅延が発生する >>822
うちのやねうら王4.79AperySDT5だと7500局面くらいで見つけるけど・・・ >>833
省メモリな評価関数になればなるほど
複数コアのときの伸び率がいいということですか? 非開発者のライブラリ勢ディスりを池さんが論破しててワロタ
ぶっちゃけ、WCSCは1万円参加費がかかり、マシンも自分で調達する必要があり、賞金も出ないし、賞品すら出ない(盾とかトロフィー、賞状を除く)ので、そもそもコピーで参加する意義がないと思っているので私は心配してませんw
炎上の可能性もあり、もれなく顔もさらされるのに普通出ないわな ライブラリ勢で完全上位互換ぐらいまで改造して
ドヤ顔で出てくる人間は見たいけどな とある1手だけ切り取れば、まだプロの方が優れてる時もたまにあるけど、
チェスとかもそういうのあるんかね
それとも全く無いんかね 少なくとも選手権に関してはライブラリ制度に文句があるならCSA会員になって正式に
議題にするよう提案すればいいのになぜ他の開発者を焚き付けて
変更しようとするのか。 >>839
チェスは将棋以上に人間とソフトの強さが乖離してるから無理そう >>834
わかった
スレッド数が多いと△5五桂が見つからない
これはLazySMP絡みで何かある ponanzaは、DL活用法についてはオープンにするそうだ。
DLに関しては、主に序盤で大きな効果を発揮すると思う。
少ない思考時間で序盤に形勢を損ねずに乗り切るにはかなり役立つのでは。
定跡と組み合わせれば、定跡・従来探索・nn探索の間の調整が非常に難しくなるが、
上手く行けば物凄い精度で序盤を指し回せそう。 LazySMPってどこかのスレッドがよさげな手を見つけちゃうと
他の手の深くにあるもっといい手って中々みつからないのかな? 将棋プログラムPonanzaにおける強化学習とディープラーニングの応用
将棋プログラムPonanzaは史上初めて名人に勝利するプログラムとなった。
この飛躍の鍵となったのが機械学習、特に強化学習と呼ばれる技術である。
これまでの将棋プログラムは何を考え、どのように強くなったのか紹介する。
さらに、膨大な量の探索を行う「大人の知能」である現在の将棋プログラムと鋭い感性を持つ「子供の知能」であるディープラーニングの組み合わせが導くAIの新たな可能性を検討していく。
次の選手権はディープラーニングが必須になってくるのか……? クジラちゃんの作者が今の大規模クラスタにディープラーニング組み合わせたいって話してたな。 >>838
NineDayFever WCSC26(Bonanzaライブラリ)、Apery_WCSC25(Bonanzaライブラリ)は探索、評価関数ともに本家Bonanza6.0よりかなり強いので間違いなく完全上位互換クラス
(AperyのソースコードのGPLライセンスでの公開、ライブラリ登録については本家Bonanzaの保木さんから許可を得ており、ライセンス違反ではないとのこと)
elmoは評価関数の強化だけなら凄まじいけど探索手付かずだから完全上位互換とはいえないのかな >>842
あぁ、うちのショボPCはLazySMPの恩恵を受けられないから、逆に見つけちゃったとも考えられるのか……。おもしろい仮説ですね。 ■ このスレッドは過去ログ倉庫に格納されています