▲コンピュータ将棋スレッド140
■ このスレッドは過去ログ倉庫に格納されています
>>749
話を正確にしたいんだけど
俺が主張した内容は以下の通り。
新しく出たソフトに対して10回程度の結果でも7勝3敗という結果が
でれば7勝した方がその時点で強いと決めつけても、そうそう間違いがないということ。
その結果に異議があるのなら違った結果になった人が俺の場合は逆だったよとか
互角だったよとか書き込めばいいだけの話になる。
そうすることによって最初に主張した人ももう一度対戦させて自分の対戦結果が
間違ってたかどうか検証するだけの話になる。
100回以上対戦させた結果じゃないと意味がないという主張こそおかしいといいたい。 >>750
8勝2敗から、200局越えたら勝率50%切ったことあるよ >>748
非理想的なコインの偏りとは何?
回数が増えれば信頼区間の幅が小さくなり統計学的に
有意だという話だけじゃないの?
10回の対戦で95%の信頼区間は0.4−0.9であり、
実際にEXCELでシミュレーションすると実感できるが
10回対戦結果を100回繰り返して負け越すケースは
6、7回しかないんだよw
10局 7勝 3敗
勝率: 0.7
標準誤差: 0.15718104959867515
95% 信頼区間 [0.4, 0.9] >>751
統計学的には95%の信頼区間外の現象が生じたということじゃないの?
8 wins / 10 games
WP: 0.8
SE: 0.13719886811400706
95% CI [0.6, 1]
ELO: 240.823996531185
SE: 148.96177836321317
95% CI [70.43650362227247, 1e+308] 10局ガイジに構うのはもうやめとけって
なに言っても聞くきがないんだからさ まあ10っていうのは普通の人にとってみればかなり大きい数字だからね
確率だかなんか難しい学問やってこなかった場合それで十分と思うのは無理もないと思う キメラが大量発生した時は開幕9連勝から負け越しは俺も経験した。
ずっと検証してりゃそれくらいはあるんだよ。
普通じゃない主張をしてるという自覚は持ってほしい 順位戦だってたった10戦だしタイトル戦の結果だって全く意味ないよな ドサクサに紛れて経験上どうだとか嘘つくやつが多いな 少ない対局数だったり極端に短時間だったりする結果から強そう弱そうと予測するのは個人の自由
他人にそれを強要するからおかしくなる
10局やって全勝したら強そうと思うのは普通の感覚
じゃあ8勝2敗の他の結果と比べて全勝の結果が圧倒的に優れているかとなると謎、だから対局数を増やす 誰も定量的に議論してなくて草
俺の計算だと10局中7勝の場合
7勝側の真の勝率が50%切る確率は11%くらい モンティ・ホールとか条件付き確率の問題苦手そう。
https://bellcurve.jp/statistics/course/6448.html
事前確率がわかってないので、条件付き確率よりさらにわかりにくい問題ではある。 「髪の毛が一本もない人はハゲである」(前提1)「ハゲの人に髪の毛を一本足してもハゲである」(前提2)
ここで前提1に前提2を繰り返し適用していく(つまりツルッパゲの人に髪の毛を一本ずつ足していく)。そして次の結論を得る。
「よって全ての人はハゲである」(結論) >>763
逆にやったら
全ての人はふっさふさである。 >>759
誰も強要してませんよ。
一つの見解と受け取ればいいだけじゃないですか?
私の経験測では10局やって7勝3敗以上の結果が出れば
強いという判断をするということだけです。もちろん例外は
1割以上あるでしょうけどw
お手軽に新しい評価関数を評価できる方がいいと思ってるだけです。
100局やるとなったらその間ノートパソコンで他の事が出来なくなるから
より少ない対局数で判断したいと思ってるだけです。 一発勝負の大会でも頭抜けて強いソフトはだいたい強かったからな
今回はそういう気配があった白ビールとPALが非公開だから確かめられないけど
技巧、ukamuseとそのパクリの真やねうら王、elmoははっきり強かった 「10局やってそんな結果が出たとは興味深いですね。すごいすごい」
これでOKか? >>742
試してみたけど以前のと変わってないような気がする。
かれこれ3回ぐらいやってるけど一回も勝ち越してないよ。
https://i.imgur.com/OKEzF3A.png >>768
だからそんな風な反応なんか期待してないから!
じゃ自分もやってみてほんとかどうか試してみるってのが期待するレスだよ。 10戦では「どのくらい」強いかはまるでわからない、だから皆価値がないと言うんだと思うよ >>770
「10戦の結果がそんなだったんですね!(統計的にはゴミクズなので)自分で検証してみたいですね!!」
これで大満足だな。 >>769
あれ?イルカの中に入ってるのってそもそもやねうらおうだよな?
ドルフィンとは別なんだっけ? dolphinはソースコードを読めば分かるけど
LMRの条件分岐のコードも細かくチューニングされている
パラメータだけと見せかけて実は結構大掛かりな改造が施してあるね やはりたった10回でどちらがより強いかと言い出すのは早計すぎる
大数の法則だよ、少しでも試行回数が多い方がデータとしての信頼度は高い
たとえ100回やっても大まかな勝率しかわからないと思う
1%単位まで勝率を求めるなら最低でも1000回は必要かな >>766
>一つの見解と受け取ればいいだけじゃないですか?
なら100局は必要という意見も一つの見解と受け取ればいいじゃない
100局必要という人に対して、10局で十分と反論するからより批判されてるのにそれが分かってないのか? >>774
ファイルがやねうらおになってたからてっきりドルフィンの中にやねうらおがそのままはいってるのかと思ったわ >>776
こんなスレを開発者の皆さんが見てるかと思うと恥ずかしいです 10局君はまだまだやな
漏れくらいになると、その10分の1の試行数で十分
しかも5割以上の確率で正しく判断できるw
でも友達は試行すらせずサイコロ振って決めてるから
それに比べればまだまだやけど >>775
実際に1000回やったエビデンスを出せば良いんじゃね? 前にもここに書いたけど、shogi sparkの開発者はアマ強豪の奥村だったんだな。
ソースは朝日杯の中継 ほう
>奥村アマはスマホアプリ「Shogi Spark!」の開発者でもある。将棋ソフト「技巧」を用いて、次の一手問題を自動で生成する。
>奥村アマ自身も日々の練習で使用し、朝日アマのベスト8入りの原動力になったと語っている。 そのアプリ、どれ指しても大差ないような問題とか、取る一手の成と不成が片方だけ正解とかあって、微妙な面はある
アマ強豪の方は文系だと思ってたから同姓同名の別人と思ってた >>778
追加で調べたらdolphinのLMR周りのコード変更はwhale6と同一だった
というかSDT6でのwhaleシリーズのコードの取り扱いハッキリさせないと後で揉めそう
改造箇所からしてStockfish系列ならどんなエンジンにでも流用可能だし べつにやねうら王って改変・再配布って条件付だけど自由じゃなかったっけ?
誰がどう弄って公開しても、それを改変されたくないとか再配布されたくないとかできないんじゃね? >>785
随分とアマ強豪に詳しいんすね
suimonさんですか? >>787
ソフトのライセンスとは別の大会独自のライブラリルールに
引っかかる話だと思われる >>789
あーなるほど
使いたければ皆等しく使えるってほうが面白いと思うけどどうなんだろうね
まあwhale6のコードで長時間でも強くなるのかそもそも謎だけど whaleシリーズは低ノードで強くなるようにパラメータ調整している感じなので、WCSCなどの億単位のノード数ではあまり強くないかも >>785
すーぐ大差無いとか言い出す
だから細かい形や手順の違いが分からずに研究もアバウトなんだよなw アンチsuimonは基地外しかいないな
多分アプリの何も分かってないんだろうけど一応言っておくわ。
とある局面(プロ公式戦?)で候補4つの4択問題で、技巧の評価値が一番いいのが正解。100と99なら100が正解だし、問題の局面によってはどれ指しても-1000とかがあるから、そういう意味で微妙と言った スマホアプリ「Shogi Spark!」が使える使えないの話は別のスレでやってくれ 定跡や差し手の研究家のsuimonさん関連の話題は専門スレのこっちでやってくれ
「suimonユキ_feat.mztn7応援スレッド16」
https://mevius.5ch.net/test/read.cgi/bgame/1530536517/ suimonさんは将棋ソフト開発とは関係ないし、将棋ソフトを使って定跡や差し手の研究をしている立場でしかない
定跡や差し手の研究をしていない一般の将棋ソフト愛好家から見たら興味ないだろ そもそも、ろくに研究できてないし中途半端なただのアマチュアなんだよなw >>793
すぐ開発者の素性を調べてここにレスしてしまうお前も酷いぞw >>791
こういうような短時間と長時間で得手不得手があるなどというのは
理論的な分析はあるんだろうか? >>800
最適な枝刈り方法はどれだけの時間をかけて読むかで変わるという話は随分前からある
極論無限に時間をかけて読めるなら枝刈りなんてなくてもかまわないわけだし >>786
dolphin/whale6のLMR改造部分のうち
「&& type_of(pos.piece_on(to_sq(move))) == ROOK_DRAGON」
ROOK_DRAGONは値としては18なので、必ずfalseになってしまうような気がします。
position.hのvaluable_capture()の「return ( cp == BISHOP_HORSE || cp == ROOK_DRAGON);」は
「return ( cp == W_PAWN || cp == W_LANCE);」と等価なので、意図した動作ではないような気がします。
修正して強くなるか弱くなるかは分かりませんが...
もし間違っていましたらすいません。 >>801
探索変えるのならわからんでもないが
評価関数バイナリ変えたら時間により変わるというのが理屈が謎なんだよなあ >>803
時間が変われば探索で提示される局面が変わって、
局面が変われば当然その評価関数の得手不得手かも変わるからね
でも言えるのは違ってもおかしくないってことだけで、
この評価関数はこういう傾向にあって〜みたいなのは立証できないと思うわ 一手読みに特化した評価関数と普通に何手も先読みさせて使う評価関数では
最適なものはまずそれぞれ違うものになるだろうから
探索深さによっても違って来るんじゃないの 序盤を深く読めば中盤に、中盤を深く読めば終盤になる。
序盤、中盤、終盤で駒の価値や位置関係の価値が変わるのであれば、
読みの深さで向き不向きが出てくる。
技巧2は進行度で評価関数テーブルを切り替えてるので、そこを重視しているようだ。
やね氏は、序盤、中盤、終盤で駒の位置が変わっているので、
(つまりテーブルの違う位置を使うので)1つのテーブルに重ね合わせてもさほど問題ないだろう、
とお考えのようだ。 >>734
就職面接ではいくつか進展があったらしく
未納だった国民年金も1ヶ月分は払ったらしく
めすあざらしと一緒にアイナナのコンサートに行ってるらしく
まあ順調に進捗してるのでは? 生主雇うのって怖いなあ。
仕事の話は禁止にしないと。 えびふらい無職って、親のすねかじって生きてたのか? >>798
大会ではアマ竜王戦の県代表になってるし、本は増刷もかかってるし、
それはそれで過小評価しすぎだろう
なんでこう極端なんだ将棋板は >>809
無職じゃないよw
国民年金の対象、つまりフリーランスで、囲碁・将棋チャンネルとかは嘱託 スレ違い、suimonさんの専門スレがあるので、こっちでやってくれ
「suimonユキ_feat.mztn7応援スレッド16」
https://mevius.5ch.net/test/read.cgi/bgame/1530536517/ 今度の電王トーナメントは探索部がカギになりそうだな
評価関数と探索部はワンセットが最新のトレンドだし 山口 祐 / Yu Yamaguchi @ymg_aq
産総研のABCI。Tesla V100 x4基のノードが180円/時間で借りられます。
AWSで同等のインスタンス(p3.8xlarge)を借りようとすると2300円/時間とかするので爆安すぎます。
安すぎて税金によるダンピングとか民業圧迫とか言われそうですが、普通に私も借りたいですね
https://abci.ai/jp/how_to_use/tariffs.html 山口 祐 / Yu Yamaguchi @ymg_aq
産総研のABCI、どのくらいヤバいかというと、
ユーザーあたりMAXの32ノードを借りられた場合、
AlphaZero(将棋)の学習が70万円と5日で完了する計算です
↑これは借りられた奴が勝つってやつだな ディープラーニング勢が言い訳出来なくなるから辛いなこれ
計算資源がないから弱くても許された感があったのに 山口 祐 / Yu Yamaguchi @ymg_aq
さてここにAI囲碁世界選手権で稼いだ150万円があります ちなみに来年辺りメスアザラシとの結婚を考えている模様 >>821
アザラシのペニスはクソでけえんだぞ
満足させられるか? 囲碁のDL勢ってのはどれも市販されてないんだよね?
もし将棋もDLが主流になったら今みたいに手軽に使えなくなるんだろうか? >>812
アマ竜王戦もレーティング選手権も予選落ちで全国大会で通用していないし、本はAmazonランキング圏外で全然売れてないし、適性な評価なんだよなぁ。 >>825
加藤さんの判断で、市販版はグラボを使えない仕様になってる
囲碁ソフトの主要なユーザー層でゲーミングPCなんて持ってる人はほぼいないから >>826
まあ、お前は県大会も突破できなきゃ単著も出せないわけだが >>825
天頂の囲碁はDLバージョン未搭載 ユーザーのハードが千差万別なので
問い合わせに対応しきれない https://abci.ai/jp/about_abci/computing_resource.html
□計算ノード
各計算ノードには2基のIntel Xeon Gold 6148と、SXM2で接続されたNvidia Tesla V100が4基、NVMeで接続された1.6TBのSSD、384GiBメモリが搭載されています。
計算ノードの単体性能は、506 AI-TFLOPSで、人工知能研究の機械学習に必要とされる半精度浮動小数点の演算を1秒間に506兆回行う能力を有します。
工学的な科学技術計算で必要とされる倍精度浮動小数点演算おいては、計算ノード単体で34.2 TFLOPSの性能を有します。 >>828
俺A級の立命館戦で勝ったことあるけど、おまえ勝ったことあるの?w よっわw
将棋クエスト【2分】棋譜(garnet_crow[2343] 対 kamokamoo[2459]) http://questgames.net/shogi2/game/s88df9yp4dpj #将棋クエスト #ShogiQuest >>832
>>833
お前らいい加減にしろ
将棋ソフト開発とsuimonの話と何の関係があるんだ
このスレを荒らすなや suimonの話ならこっちに書き込めや、suimonの話など誰も興味ないわ
「suimonユキ_feat.mztn7応援スレッド16」
https://mevius.5ch.net/test/read.cgi/bgame/1530536517/ そら、世界コンピュータ将棋選手権の真っ最中にレーティング選手権に参加なんかしてたら外野扱いされるわな(笑) >>816,817,820
パル山さん本気出しちゃうかー!
でもSDTの規定スペックは最高でもGTX 1080だろうし、AlphaZeroレベルの学習してもKPPTにすら負けそう 【悲報】 日本政府さん、焦る 「すまんこれからIT奴隷が30万人不足するんだが…これどうすんの?」 [437931475]
https://leia.5ch.net/test/read.cgi/poverty/1532915265/
お前らもコンピュータ将棋なんてどーでもいいもん作ってないで
ちっとはもっと役に立つ物作る事に精出せよ 異様に専門的に成ってきたなこのスレ(w。開発者も参入か(w。 むしろ開発者の書き込みは見なくなったろ
いろんな人が流入して幾分専門性は落ちたと感じる >>839
suimonことsuiseihuman
早く自分のスレに帰れよ >>822
えー、平岡さんまで山本組の仲間入りなの
それは地味にショックだ😵 >>846
HEROZの株持ってる平岡さんならともかく、
自営業という名の半ニートえびちゃんでさえ婚約しているというのに
おまえらときたら 言っとくけどコン将界は意外と割と妻帯者や彼女持ち比率高いと思うわ💑 ■ このスレッドは過去ログ倉庫に格納されています