▲コンピュータ将棋スレッド121 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
正直言って人工知能ではない
研究費貰ったり商売するためにハッタリかましてるだけ 強いAIを実現してないのでどこもゴミと言ってなんの意味があるのかは不明 FGにYssCNN_F128L12_a48x2ってのがいるね
YSSもディープラーニングか >リゼロ評価関数epoch8公開しました。
キターーーーーーー。これでelmoと同等かな。終盤強いから検討のとき助かる https://www.youtube.com/watch?v=hp9LTLq0GpU
つべで藤井聡太関連のクリップを漁ってたら、これの4分55秒から出村弁護士が出演してた。
出村先生選んで札幌でわざわざ取材させるのは結構いい調査してるなあと。 検討モードが一番信頼できるフリーソフト教えてください 後手番って横歩よりも角換わりに誘導したほうが勝率いいんかな。 PEXTが使えないCPUで多少速くなる(飛車が盤上にあるとき限定)
// 飛車の横の利き
inline Bitboard rookRankEffect(Square sq, const Bitboard& occupied)
{
// 中略
#if defined(USE_AVX2)
u64 u = (occupied.extract64<1>() << 6*9 ) + (occupied.extract64<0>() >> 9);
u64 index = PEXT64(u, 0b1000000001000000001000000001000000001000000001000000001 << r);
#elif defined(__arm__) // 32bit arm
u64 u = occupied.extract64<0>() >> 9;
u32 index = ((uint32_t(u) & 0b1000000001000000001 << r) | (uint32_t(u >> 27 - 3) & (0b1000000001000000001 << 3 + r)) |
((uint32_t(occupied.extract64<1>()) << 6) & (1 << 6 + r)))
* UINT32_C(0b10000000100000001) >> (r + 16) & 0b1111111;
#else
u64 u = (occupied.extract64<1>() << 6*9 ) + (occupied.extract64<0>() >> 9);
u32 index = u32((u & 0b1000000001000000001000000001000000001000000001000000001 << r)
* UINT64_C(0b1000000010000000100000001000000010000000100000001) >> (r + 48)) & 0b1111111;
#endif
return RookRankEffect[file_of(sq)][index] << r;
} なお movegen.cpp の歩の打てる所チェックのPEXT64も同じようなことが可能だが
ほとんど効果がなかった <チラ裏に書いておこう>
// 前略
// このRANK9に集まった情報をpextで回収。
#if defined(USE_AVX2)
u32 index1 = u32(PEXT64( a.extract64<0>(), RANK9_BB.p[0]));
u32 index2 = u32(PEXT32((u32)a.extract64<1>(), (u32)RANK9_BB.p[1]));
#elif defined(__arm__)
u32 index1 = ((u32(a.extract64<0>()) & 0b1000000001000000001 << 8) |
(u32(a.extract64<0>() >> 27 - 3) & (0b1000000001000000001 << 3 + 8)) |
(u32(a.extract64<0>() >> 54 - 6) & (1 << 6 + 8)))
* UINT32_C(0b10000000100000001) >> (8 + 16) & 0b1111111;
u32 index2 = (u32(a.extract64<1>()) & u32(RANK9_BB.p[1])) * UINT32_C(0b100000001) >> 16 & 0b11;
#else
u32 index1 = u32((a.extract64<0>() & RANK9_BB.p[0]) * UINT64_C(0b1000000010000000100000001000000010000000100000001) >> 56) & 0b1111111;
u32 index2 = (u32(a.extract64<1>()) & u32(RANK9_BB.p[1])) * UINT32_C(0b100000001) >> 16 & 0b11;
#endif
</> Garry Kasparov: "Deep Thinking" | Talks at Google
Garry Kasparov and DeepMind’s CEO Demis Hassabis discuss Garry’s new book “Deep Thinking”,
his match with Deep Blue and his thoughts on the future of AI in the world of chess.
https://www.youtube.com/watch?v=zhkTHkIZJEc Alpha Goは風のように現れ
無敵のまま風のように去っていった。
=== 完 === カスパロフは
プーチンに公然と逆らっても消されない
というのが凄い >>110
政治家として実力や権力欲はないが名声は大きいタイプは
古今東西殺すのは最後にしてもらえる >>51
Nスペ微妙だった
事前貸出ルールは無かったことにされて、ただの事前貸出対策ランダム指しの初手38金を
山本一成でも「なぜその手を選んだのか分からない」PONANZAのおそろしい手!!ってことにされてたのにはワロタが >>112
さすがにそこまでの作り方ではなかったと思う。
単に評価値で見てみたらそこまで悪くは無い手でそれ以上でも以下でもない、
ということを知っていても知らなくてもそれぞれのストーリーを聞き手の中で組み立てて
了解可能だったと思う。
おそらくこれ、最初は将棋一本で作ろうとしてプロデューサー試写でダメ出し入って
それで人工知能総合番組にしたんだと思う。
だから正式タイトルが決まらなかったし一週間伸びた。 電王戦の記者会見でnhkの記者が「Ponanzaはシンギュラリーティーに到達したと言えるのでしょうか」と頓珍漢な質問してたな
その程度だろう ジャップはLGBT差別して同性婚を認ず、血液型で性格がきまると信じてるからな >>116
貴方の祖国はどうなんですかねえ(注 韓国は男女差別、地域差別が酷い国として国際的に非難されている) >>117
下らん煽りに乗るな
ジャップ呼びは酷い行為だが、それされただけで韓国認定してしまった時点であんたも奴とおなじ穴のムジナになるんだ
同じく相手の人種を勝手に規定存在しない敵に向けて攻撃開始してしまってるからな >>118
良識だが匿名相手には無駄
しかし匿名でもしっかり心に響くのだから面白い 今日の朝の番組で藤井4段がソフトを凌ぐなんたらかんたらいってたが見逃した 最近、平岡さんが禹さんの舎弟みたいになってきてるなあ 教授今度はコンピュータではなくフジー君について語るのかw rezero8+elmo=relmo8より
rezero8+mafuのほうが強いものが出来る >>126
それ作ってみたけど評価値の出方めちゃくちゃおかしかったぞ やねうら王のソース読んでたら、evalmergeコマンドには隠しオプションがあるんだな。
比率でなく評価値の絶対値が大きいほうを採用したり、小さいほうを採用したりできるようだ。 それ登場して即使ってみたけど
弱くなるだけだからあんまり意味なかった >>130
あぁ、絶対値で大きいほうを採用=それ以上大きい評価値は生成されないってことか…。 >>128
ですね。elmoのアウトブリードでelmoより強いんで、配合素材として優秀で重宝してます。 >>133
ありゃりゃ、そういうことじゃないんですね。
ダメだな。算数ニガテだ。 評価関数ブレンドも1回限定の
評価値補完の手法にすぎないということなのかな、結局大本の評価関数は大量の局面を用意して学習させなきゃだめと 高品質の教師局面を効率的に大量に用意するゲーム
ブレンドもその一環 elmoの手法が標準的になるってことは独自路線だった古豪ソフトもトップクラスに復活するってことなのかな? 4スレ0.1秒
mafu + rezero8
勝ち124(62%) 先手勝ち72(72%) 後手勝ち52(53%)
relmo8
勝ち74(37%) 先手勝ち46(46%) 後手勝ち28(28%) >>137
できがいいけど金と時間がなくて学習が甘いソフトが強くなるな >>138
それじゃなくて
mafu+rezeroとmafu+relmoの対戦を試さないと
その結果は当然かと 3駒以上の新しい評価項目の発掘が今後の課題やな
NNから評価項目抽出できたらええんやけど >>142
R4000超えてるからねぇ。まず勝てない。 >>142
試しにrelmo8と去年の技巧を飛車落ちでやったらrelmo8が勝ったわ 短時間なら浮かむ瀬相手に飛車落ちで勝つことはあるけど、きちんと時間持たせたらどうだろうねえ 駒落ちについてはあんまり語らん方がいいと思うけどね
駒落ちでもたまたま動いてくれたし、たまたまかなり強かっただけで、平手の強さと駒落ちの強さの関係はそのソフト次第でしょ
駒落ちでの挙動や強さにはなんの保証もないし ちょうどrelmo8 + まふ評価関数の対戦してたけど
テンプレ埋めるのだるいから貼るのやめます(´・ω:;.:... 情弱丸出しなこと聞くけどまふ評価関数ってmafu.7zって方?
それとも_.depth.x.7zって方?
ブレンドに使いたいんだけどどっちか分からん >>150
>現在「mafu」(まふ評価関数)のブレンド相手の情報募集しています。
とあるから、mafu.7zの方だと思ってるけど 磯崎はまふとrelmo対戦させたりしてないから分かってないのかな?
定跡なしでもrelmo超えとるし そういえば、むかーしPonanzaとかいう非公開ソフトがあったような気がするが記憶にないわ mafu.7z + epoch8 が現状最強ということか
なんだか日替わりで最強が入れ替わってないか? >>155
千田がまふ評価関数を部分的に歪んでいると言っているのも念頭にあるのでは スマホと言えど技巧はやっぱり強いな
勝勢になったのに100手以上粘られた FRCが一番わかりやすい例
Fischer Random Chess
この変則チェスは、1996年6月19日にラプラタで発表された。フィッシャーの目的は、
序盤定跡の記憶や準備に頼らず、創造力と才能で勝負が決まるようなチェスの変種を作ることであり、
そのためにチェスの初期配置をある一定の条件の下にランダム化した。
CCRLにもあるし
フィッシャー有能 やねうら王のソースを眺めていたら
// 精度の良い評価関数ならばこの幅を小さくすると探索効率が上がる
// やねうら王のKPPT(Apery WCSC26)ではStockfishのまま(18付近)がベスト。
という項目が2017-early-search.cppにあったから
今の評価関数(まふ+rezero8)なら幅を小さくすると強そうと思って15から3刻みで色々と試したけど
6まで下げても0.1秒200局で互角だしあまり変化はなかった
流石に探索部には素人が手軽に強く出来る部分は残っていないのね・・・ >>165
depth 5以上でないと利いてこないパラメーターを0.1秒対局で計測できるわけねーじゃん 3スレ2秒で計測し直す
とりあえずパラメータ6でスタート まふは歪んでいるの?
それなら人の棋譜解析にはrelmo8使っておくか。 まふは歪んでても強いという棋風を味わえる。
電王戦トーナメントで優勝するソフトはelmoから+300〜+400上げないとならないのかもしれない。 relmoに勝ち越せるブレンドはできたんだけど、今度は技巧2にやや負け越すようになってしまった
負け方が大反省ばかりなので、技巧に見えてこっちに見えてない筋がけっこうあるみたい
技巧の血が欲しい(吸血鬼かw) なんだかんだ将棋ダビスタはrezeroとelmo系の第一世代のイブリードしか上手くいかないことがほとんど。 >>177
まぁ実際はそれだろうな
自分で320勝250敗とか労力&時間を費やしてたら、「勝ち越せる」なんて軽いフレーズで流さないからね
驚くほど少ない対局数だろうことが容易に推測できる 最新のリゼロとelmoを混ぜるとelmo+R300ぐらいになっているんだろうか・・ 計測が追い付かん。
relmoの他にも、技巧2との勝率も出した方がいいんだろうが そういやここで統計を書くと必ず「そんな糞スペックでは意味ねーわ」というレスが付くので、スペックを書きたくなくなるのは分かる
実際問題NPSだけが大事なんだから、糞スペックのヤツはこうやって見栄を張るといい
NPS平均1000kのPCで3秒対局
ここに貼り付ける時は「NPS3000kのマシンで1秒対局してみたんだが・・・」
嘘だけど、実際無問題だし、見栄も張れるしこれでOK 「もうやめて、Ponanzaのライフはゼロよ」
状態だな
まふ神降臨
第5回 電王トーナメントどうなるんだこれ >>182
同じNPSでもスレッド数少ない方が強いんでしょ?それじゃ過小評価でしょ
そもそも低ノードでは〜って言い訳にはなってないよな
短時間で弱いっていう事実が残るだけで >>183
電王トーナメントはやねさんの言う通り大規模じゃんけん大会になるだろう じゃんけんでお金もらえても誰も損はしないけどなw
まあ頑張ってた人は気の毒ではあるが まあ山本もいずれはponanzaもそうなるって言ってたし
こんなにも早いとはおそらく誰も思わなかったろうけど じゃんけんってのは実力拮抗して運次第って意味?
そうはならないよね。最近数週間、数日の進歩をみてると R4200が基準としてなんだかんだ言って、やねさんや平岡さんなど強豪ソフト開発者はR4300クラスのソフトをぶつけて来るんじゃない? 平岡や磯崎も焦ってると思うよ
まふさんの評価関数は最強! ■ このスレッドは過去ログ倉庫に格納されています