最新ソフトで棋士の指し手一致率を調査した結果 2
レス数が900を超えています。1000を超えると表示できなくなるよ。
>>806
スレ主は大山84.8%、羽生78.5%と言っていて大幅に違うんだよ 他の棋士の一致率もあるのに大山と羽生にだけこだわってるあたり羽生オタが荒らしてるんだろ
根拠出して反論してほしいわマジで
NGして終わりだが >>805
俺はあなたに意見を求めているんだよ
おかしいと思うかおかしいと思わないか
それとも思考停止ですか 何かのミスなのか測定法が違うのか理由は知らないがスレ主と他の人とで全く異なる結果になっている
これはスレ主の主張の根幹に関わることなので放置すべきではなく原因究明すべきことだと思うよ >>805
それとこのデータはあなたが支持しているわけだから、そのデータを分析すると評価値が2000を超えると大山のほうが羽生より7.5%も一致率が高くなっているんだが、これについてもあなたの意見を聞かせてくれ >>794,795 >>808
自分は718だが羽生オタではないよ
697とスレ主の結果が食い違っていたから追試しただけ
結構な手間がかかるしこれ以上深入りする気はない
休みを1日使えば100局ぐらいは棋譜解析できるので
興味のある人は独自にやってみるといい 三人がほぼ同じ数字を出してるのにスレ主一人だけが異なっている
このことをスレ主はもっと重く見るべきだと思うがなぜか危機感がなく意に介していないよね
これではスレ主の数字を信用しろと言われても無理がある >>814
意に介さないわけではないが、前から違う結果を見せられているからあきらめているよ
大山羽生だけでなく、2019年の棋士の一致率全部について言えていることなのでね
他スレで他人の棋譜解析の結果報告などをみても俺の計測のほうがいつも高いよ
それでも自分の計測には自信を深めているし、もともと趣味と興味で始めたことなので何よりEloレーティングとの近似性という点で成果を上げてきたわけだから満足している面がある
とはいえ、再現性がないとしたら残念なことなので、できる人が是非とも再現性のある一致率計測でデータベースを構築してEloレーティングとの近似性なり親和性を確認してほしいという希望をもっている
俺のほうは目的達成感があって、今後は興味がある棋士のみ棋譜解析するつもりだ
棋士名をあげると渡辺豊島永瀬藤井大地本田になる
今後は相手一致率がわからなくとも2019年のリストとの比較でどの位置の棋士かわかるので苦労はないからね
大山については一致率が特定の暦年や棋戦で大山のほうが羽生より高いという計測結果は譲らないが、通年で見た場合、羽生は安定して78%前後の一致率(これも俺の計測での数値なわけだが)を上げているのが素晴らしい
大山については、「昔の一致率が低い時代の棋士」という定説を覆して少なくとも「一致率で羽生と差のない」棋士という共通認識を広めることができただけでも成果だからね
実際はそれ以上の棋士かもしれないというだけで十分でしょ >>81
>大山については一致率が特定の暦年や棋戦で大山のほうが羽生より高いという計測結果は譲らない
逆だよ
誰も譲れなんて言っていない
この問題から逃げずに向き合って自分の計測こそが正しいことを示せと言っている
その努力を怠っていることを言ってるのだよ >>814
そういう「一人だけが異なっている」捏造のような疑わしい数字が出された上で
>>707 「山下のインチキ論文」 >>717 「ガイジ山下」 >>793 「山下がアホ」というように
特定の個人の実名が出され、誹謗中傷のような行為が行われているのだから
非常に悪質かつ有害だと思う >>817
ここのスレ主のおっさんが出した数字など関係なく
もともと最初から山下論文はアホだよ
公におかしなペーパー発表してんだから批判されるのは当然 >>818
スレ主が「おっさん」であることが何故分かるのか非常に興味深い
半知障みたいなガキである可能性はないの? >>815
816は815宛てな
>他スレで他人の棋譜解析の結果報告などをみても俺の計測のほうがいつも高いよ
>それでも自分の計測には自信を深めている
おれなら人よりいつも高い数字が出るようなら自分の間違いを疑うけどね
>もともと趣味と興味で始めたことなので何よりEloレーティングとの近似性という点で成果を上げてきた
間違った数字との近似性を示すことに意味も成果もないよ
だからこそ根幹となる数字の信頼性だけは危機感持って示すべき所なんだよ 普通に考えておっさんだろ
そりゃ若い子の可能性もゼロではないがどんだけひねくれてるんだ
そんなだからインチキをインチキと見抜けないんだよ >>818
山下氏の論文は別におかしくない
当時はBonanzaが一番強かったのでBonanzaで分析したらこうなったというのを論文として発表しただけ
そして今スレ主がdolphin/illqhaで分析したらこうなったという最新研究をしているということ
研究というのはそうやって発展していくものだぞ 山下さん叩いてるやつは単純に自分の好きな棋士の数字が低かったことにキレてるんだろうな
「ボナンザには○○名人の棋譜がレベル高すぎて理解できなかったんだな。やっぱり○○名人はすごい!」
というように好意的に物事を考えていくことが心身の健康のために大切だよ >>822
おかしいよ
仮想棋力とするレーティングや分析の設定がおかしい
そして自分が信じて止まない羽生最強論の結果ありきの発表
あまりにも浅薄な内容 >>824
おかしくないよ
何がおかしいのか具体的に指摘しろよ >>790
更新しました
※一部誤りがありましたが honest mistakeであり捏造ではありません、悪しからず
大山
一致率: 1242/1794 = 0.6923
一致率2000: 905/1380 = 0.6558
一致率1000: 616/998 = 0.6172
羽生
一致率: 1431/2051 = 0.6977
誤) 一致率2000: 892/1322 = 0.6747
正) 一致率2000: 1140/1679 = 0.6790
一致率1000: 854/1280 = 0.6672
https://pastebin.com/2wxJH3a1
https://pastebin.com/rtRCAUZB この一致率を例の式に当てはめるとどういう結果になるの? >>826
訂正感謝
納得しました
つまり、こういことですね
<=|1000|の局面の一致率は羽生が大山よりよくて、
>|1000|<=|2000|の局面と>=|2000|の局面は羽生より大山がいいと
これで少し安心しました
当方はデータを取り出すスキルがなかったのでそうした分析ができてなかったもので助かります
https://i.imgur.com/7MafVWU.png ■ 捏造データに注意!
■ 捏造データに注意!
↓↓↓↓↓↓↓↓↓↓
大山:84.8% 羽生:78.5% >>472 名前:◆f7OmZ9ucu2
↑↑↑↑↑↑↑↑↑↑
■ 捏造データに注意!
■ 捏造データに注意!
● 正しいデータ
大山:69.2% 羽生:69.8% >>697
大山:70% 羽生:69% >>718
大山:68.8% 羽生:70.7% >>727 ■ 捏造データに注意!
■ 捏造データに注意!
↓↓↓↓↓↓↓↓↓↓
大山:84.8% 羽生:78.5% >>472 名前:◆f7OmZ9ucu2
↑↑↑↑↑↑↑↑↑↑
■ 捏造データに注意!
■ 捏造データに注意!
● 正しいデータ
大山:69.2% 羽生:69.8% >>697
大山:70% 羽生:69% >>718
大山:68.8% 羽生:70.7% >>727 >>782
>棋譜単位の一致率とレートとの負の相関を利用して大山と羽生の相手のレベルの差に
>言及するのは非生産的なら、そこにアプローチする生産的な手段を見せてくれ
同意
横からだけど
大山 VS 羽生で
1.直接対決させたわけじゃない人、得に時代が違いってそれができない人の評価は、棋譜だけでは無理
この原理原則を認めましょう
(もちろん、いま時点での現役プロ棋士の解析はかなり意味あることは認めるよ)
2.しかし、人の欲望として、なんか最新ソフトを使って、時代を超えた評価をやってみたい
それは認めるけど、だからと言って「おれの解析が真実だ」というのは言い過ぎでは?
3.そもそも、将棋は100手くらいで勝負がつく。自分だけなら半分の50手。
一手だと、一致率への影響は、1/50=2%
どう指し手も勝ちという形勢が離れた場合、人はソフト最善より勝ちやすい手を選ぶ
2手あれば、4%違う
4.そして、序盤10手くらいまでは、定跡だとすれば、分母は40手になり、上記影響は4%以上
5.結論として、大山 VS 羽生の一致率だけの評価で、「大山最強」は結論づけられないと思うよ >>831
間違ってることはほぼ言ってないが
だったら 5. の結論では仮想レートだけで羽生最強なんて叫ぶなと
それを数倍大きく訴えないと公正ではない >>824
分析の設定がおかしいというなら「○○のオプションは××にすべき」とか具体的な話をすべきだわ
「アインシュタインの相対性理論はおかしい!理論構築がおかしい!」とか言ってるやつがいても具体的に指摘しないと学会ではスルーされるだけだよ
大山の評価が思ったよりも低かったからいらだってるだけにしか見えないんだよね
単に当時のソフトはそこまで強くなかったから誤差があっただけだろ >>817
スレ主の研究は偉大なものだし先行研究を批判的に乗り越えるのは科学の発展に必要なことだが、それで先行研究者の人格が否定されることはあってはならないよな
将棋で言えば居角左美濃急戦が登場したことで矢倉新24手組は絶滅したけどだからといって矢倉新24手を考案した田中寅彦が「インチキ」「ガイジ」「アホ」とはならん
そもそも研究に不満があるならば誰でも最新ソフトで追試可能なのにスレ主しか本格的に取り組まなかったわけでスレ主以外に山下論文を批判する資格はない >>833
相対性理論は現実に観測した事実と矛盾してない
山下論文とやらは他の人も指摘されてるように綻びだらけ
本質的に理科の思考ができてたらインチキだなと判る
論者やこれに追従する人々は基礎教養が足りない
当時のソフトの未完成さなど全く関係ない話 >>834
「最新ソフトで追試」なども各論を見てるだけ
田中の序盤戦術についての論評もトンチンカンな喩え 当時はソフトが弱かったから正確に分析できなかったというだけのことで誹謗中傷を受けるんだから大変だな そういう問題ではない
今のソフトも未来から見ると当時のは弱かったと映る
ものさしの精度の問題ではなく使い方や思考過程が間違ってることに気付けない基礎教養の問題
現実と矛盾した測定値が算出されるならそれはどこかおかしいのでは?と考察しないといけない >>825
現実と解離しすぎ。
加藤の方が大山より強いとか。
大山ー羽生も実際の結果からかけはなれてるし
現実を説明できない仮説に意味はない >>732の意見を支持する
>>112で触れたことだが2014年の論文発表時点でおかしいことに気づいてなければならない
歴代のプロのトップ棋士にレート差があるとしてもせいぜい100以内の差でないと、大山より150も200もレートが低かった当時のA級棋士はいったい何だったのかという話になってしまう
途中断絶なく綿々と続いているプロ棋士の棋力にそんな格差が生じるわけがない
112 ◆f7OmZ9ucu2 sage 2019/08/29(木) 07:43:01.63 ID:hnAsKu/o
二日制タイトル戦では、渡辺は羽生よりEloレートで少なくとも40強かっただろう
山下レートでは逆に羽生が渡辺より260強かったことになっているので誤差は300ということになる
渡辺と羽生で300もの誤差が起きてしまう計算式で、300点の範囲に1位(渡辺1978)から38位(佐藤和俊1678まで)まで存在するプロ棋士の棋力の測定は無理だ
何度も「無理」を連呼しているが「無理だ」としか言いようがない >>839
だからそれは「誤差」だろ
当時のソフトは弱いから誤差が大きいんだよ
今のソフトは強くなってきたから誤差が減ってきた
それだけの話 >>842
現象とかけ離れた数値を出してしまうほどの大きな「誤差」ならハナからダメ
本当になにも理解してないな >>842
誤差が大きいのは研究発表時点でわかることだから、この指標はプロ棋士には使えないとすべきだっただろうね
それと、ソフトが強くなった現在でも平均悪手でプロ棋士のレートを推定するのは無理なんじゃない
なぜ追検証しなかったんだろうね
別に誰がやってもいいことだけどプロ棋士のEloレーティングと平均悪手が強く相関したという成功例を誰も発表できていないよね >>843
山下の推定は現実の棋士の棋力とある程度相関してると思うけどダメなん?
どんな数字だったら不満がなかったのか教えてくれ
>>844
でもあなたも推定の誤差の大きさの見積もりはやってないよね?>>648-649 >>845
少なくとも現棋士の平均悪手の分布くらい出さないとダメなんではなかろうか
>>634の右側は一致率の散布図だが、ご覧のようにC級棋士とB2以上の棋士とでも分布が違っている
それぞれに近似式も違っている
平均悪手はそもそもプロ棋士の分布がプロ棋士のEloレーティングと相関していることすら示されていない >>718に追記
棋譜解析をしたKIFファイルにさらに棋譜解析するとなぜか一致率が上がることに気づいたので、2周目を実行してみた
棋譜コメに書き込まれた解析データを使って補正しているのだろうか?
条件は718と同じだが、羽生1964/11/13の棋譜の119手目がなぜか1周目で160分もかかり2周目では240分経っても終わらないため、この棋譜のみ2周目は1手10秒で解析した
大山1964
全体一致率平均75%
勝局一致率平均80%
敗局一致率平均60%
羽生1995
全体一致率平均74%
勝局一致率平均79%
敗局一致率平均59% >>844
山下さんの発表スライド見ると最後の方にこの手法には限界があるだとか仮定に仮定を重ねたものだとかちゃんと明記されている
山下さんも別に「この研究で羽生>大山が結論付けられた」と言いたかったわけではなく「とりあえずやってみたらこうなったけど誰かもっと精密な検証して」くらいの気持ちだったんだろう
それを羽生ヲタが無視して数字だけを拡散して「ソフトによると羽生>大山だぞー!!!」と連呼したのが悪い
羽生ヲタは頭おかしいからな
そして山下論文から何年も経つのに誰も最新ソフトでもっと精密に検証しようとしなかったのも悪い
そんな中で検証を始めた◆f7OmZ9ucu2 さんのことは尊敬している
しかし山下さんを批判するのは筋違いだと思う
◆f7OmZ9ucu2さんの研究結果を見たら山下さんも喜ぶと思う 本人もブレが大きすぎてイマイチな手法であると認めている
後からより良いものが出てきたら終わる
論文なんてものはそんなもんだ
スレ主がよりよい手法を考案したことによって山下論文は役目を終えた
それだけのこと
https://twitter.com/yss_aya/status/528115832484675584
山下宏 @yss_aya
詰の有無が一番信頼できるとは思います。最初はこれだけで棋力が推定できるかと思ったのですが、いかんせん出現率が低すぎました。平均悪手だけだとブレが相当大きいので、もっと他の指標の組み合わせとか模索したいです。
https://twitter.com/5chan_nel (5ch newer account) >>846
それは山下の誤差の大きさの話とは無関係だね
あと、山下の研究があったから足りない所が見えるのだと思うよ
その足りない所を埋めることでよりよい研究をすればいいと思う
>プロ棋士のEloレーティングと相関していることすら示されていない
というのもその通りで、あなたには一致率による相関を是非示して欲しいと思ってる
しかし一方で、あなたの一致率の計測は人と異なるという事実がある
つまり、あなたの示した相関は追試に耐えるものではないんだよ
なぜあなたの計測だけ人と異なるのか、原因究明すべきだと思う
人と同じ結果が出せない限り、いつまでたっても示したことにならないので 過疎スレが不自然に伸びてるので見てみたら↓これを発見してビックリ
316 名前:名無し名人 投稿日:2019/10/06(日) 22:23:43.02 ID:3enTK5Zu
暇な奴もいるもんだな(笑)
>>162-166
>>174-198
>>203-221
>>304-315 >>850
いや、追試はそれぞれの測定で全棋士についてやれば一致率の相関については俺と同様の結論が引き出せると思うよ
全棋士は無理でも2019年の渡辺豊島永瀬藤井羽生などの面々でも議論しやすいと思うけどな
相対比較できるデータは提示しているわけだし
平均悪手は評価値が1000以下の局面に限定して計測するという条件があるから他人が追試するのは困難だけどね >>852
人と異なる一致率を計測してるのに同じ結論が得られると思い込む自信の根拠が分からない
一致率の相関というのは、各棋士ごとの一致率を並べたベクトルとレートを並べたベクトルに対して、
これらを正規化したものの内積だよね
よって一致率ベクトルを、これを定数倍したものに置き換えたとき、同じ相関となるのは分かる
しかし、実際はあなたの計測と他の人の結果は定数倍という違いにはなってないからね >>852
一致率を調べる方法(手順)を詳細に書けばいいんじゃないの?
別の人とはソフトの設定が違うか見ている数字が違うかってことでしょ
詳細な手順を書いてそれを他の人が実施してみて似たような一致率が出たら誰も疑問に思わなくなるはず
人によって全然違う一致率になるというのは深刻な問題で極端なこと言えば捏造し放題になるから科学的な検証にはならないよ 些細な技術論より根幹となるところを述べると
Elo rating をウィキでは概要からして100m走だとタイムが実力の指標となると断じてて
時代の異なる選手同士の比較の考察は為されていない
もうひとつ大事なことは「2者対戦型のゲームの勝敗」として「勝利」を1試合の結果に単純化しているが
将棋や囲碁で最重要なのはタイトル戦の番勝負を制することであり
極論すると渡辺が言うように5割台の勝率でも良い
「将棋が強い」とはどういう事なのかをまずはしっかり論議してもらいたいものだ 240 名前:名無し名人 (スププ Sd94-q9eN) 投稿日:2019/12/30(月) 23:15:46.51 ID:kRR32ppkd
5ちゃんだけが生き甲斐の
ヒマでヒマで仕方ない基地外ニート
かまって欲しくてたまらないので
色んなスレに蜘蛛のように巣を張り
一度餌が掛かると涎を垂らして
執拗に相手に絡みつく
心底気色悪い変質者
こんな気色悪い奴とレスバする奴の気が知れん
キチガイ喜ばしてるだけなのに >>855
イロレーティングは相対評価の指標であって異なる時代の棋士との比較には使えないということは正しい
しかしこのスレはそれを前提にして「現在の棋士のイロレーティングと相関関係のある一致率指標を作る→一致率指標によって過去の棋士を評価する」というフレームワークを目指しているのだから全く問題ない
むしろ過去のイロレーティングと現在のイロレーティングが比較できないからこそ一致率でやる価値があるという問題意識だろ >>853
羽生と大山の比較だけで定数倍になっていないと断じるのはあまりにも暴論だ
仮に2019年の棋士からデータ数が多い10数名の棋士の一致率を出してみて俺が計測した一致率と比較してみればいい
一致率の精度が比例的なものなら基本的に定数倍になるだろうし全棋士が定数倍になる必要もない
要はEloレーティングと一致率の相関が>>634のように確認されればいいことだよ
新しいソフトとの一致率が棋力と大いに関係あるなら誰が計測した一致率でも比例関係は認められるはずという仮定がそもそもの起点になっているわけだから >>837
5年前の話なら終わっていた話なんだが、藤井ブームのなかで2年前に復活させた心証は俺のなかではあまりよろしくない
というのも、改良研究を続けるはずだったのにソフトの性能が飛躍的に向上したにもかかわらずやってなかった
それなのに、藤井聡太の29連勝を解析して平均悪手が羽生の平均悪手に近似していたために「史上最強棋士の羽生さん並みの棋士が現れた」とセンセーションに打ち上げてしまった
それに著名な数学者や千田率から平均悪手に転向した棋士までが乗っかってしまった
底が浅い研究でもこれだけ権威をバックに付けたら看過できなくなるのは当然だろ >>858
あなたの計測する一致率は人よりも定数倍の違いがあるとしよう
つまり、あなたと人とでカウントする最善手の数に定数倍の違いがある
これは、最善手を正しくカウントできていないことの証明になるよ >>848
研究職にあるものだけど、
それは逃げのために書く定番のセリフだよ。
はっきり言うと二流がよく使う。
一流の人は自分でも穴や不足があると思うものは発表しないからね。 ■ 捏造データに注意!
■ 捏造データに注意!
↓↓↓↓↓↓↓↓↓↓
大山:84.8% 羽生:78.5% >>472 名前:◆f7OmZ9ucu2
↑↑↑↑↑↑↑↑↑↑
■ 捏造データに注意!
■ 捏造データに注意!
● 正しいデータ
大山:69.2% 羽生:69.8% >>697
大山:70% 羽生:69% >>718
大山:68.8% 羽生:70.7% >>727 ■ 捏造データに注意!
■ 捏造データに注意!
↓↓↓↓↓↓↓↓↓↓
大山:84.8% 羽生:78.5% >>472 名前:◆f7OmZ9ucu2
↑↑↑↑↑↑↑↑↑↑
■ 捏造データに注意!
■ 捏造データに注意!
● 正しいデータ
大山:69.2% 羽生:69.8% >>697
大山:70% 羽生:69% >>718
大山:68.8% 羽生:70.7% >>727 >>860
ソフトが神レベルに強くなると今の一致率70%〜80%が50%〜60%になるかもしれない
というのも、これまであまり差が出てない評価値にも白黒がつけられるてしまうから
逆に今のソフトで一致率が50%〜60%に落ちてしまうのは白黒判定にブレがあるからに他ならない
この場合のブレは均等に生じると考えられるから30局以上の棋譜解析にあっては棋力評価に影響しないという仮定が可能だ
つまり、評価されるコアな部分は一致率が相対的に高い場合も相対的に低い場合も変わらないのではないか
それをたしかめるためにやるのが検証というものだろう
前スレでも俺が検証を始める前に一致率など調べるだけムダと言い放った人がいたけど研究とはそういうものではない >>865
>ソフトが神レベルに強くなると今の一致率70%〜80%が50%〜60%になるかもしれない
だから何?
あなたと人でカウントする最善手の数が異なるのはソフトが違うからだと言いたいの? ■ 捏造データに注意!
■ 捏造データに注意!
↓↓↓↓↓↓↓↓↓↓
大山:84.8% 羽生:78.5% >>472 名前:◆f7OmZ9ucu2
↑↑↑↑↑↑↑↑↑↑
■ 捏造データに注意!
■ 捏造データに注意!
● 正しいデータ
大山:69.2% 羽生:69.8% >>697
大山:70% 羽生:69% >>718
大山:68.8% 羽生:70.7% >>727 ■ 捏造データに注意!
■ 捏造データに注意!
↓↓↓↓↓↓↓↓↓↓
大山:84.8% 羽生:78.5% >>472 名前:◆f7OmZ9ucu2
↑↑↑↑↑↑↑↑↑↑
■ 捏造データに注意!
■ 捏造データに注意!
● 正しいデータ
大山:69.2% 羽生:69.8% >>697
大山:70% 羽生:69% >>718
大山:68.8% 羽生:70.7% >>727 >>866
その喩えでも理解できるだろうに何故ポジティブな思考ができないのか
ソフトを変えても一致率と棋力が比例するのか? まさにその点を検証するためにそれぞれに検証することに意義がある
一致した局面が計測する人によって多かったり少なかったりするのは瑕疵ではない
「一致した局面が少なかったほうが一致していた局面は、一致していた局面が多かったほうでも一致している」
この場合、コアは同じなので一致率と棋力との比例関係は維持されると仮定できるだろうということだ
一致率で棋力を判定するのに向いていないのは、
最新最強のソフトで計測すると勝った側のほうが一致率が高いのに逆の判定になることがある
こうした場合だろう
一致率を指標にできない典型例は1秒判定のGPSfishだ>>591,592
新しいソフトでも最善手または最善手に近い手が>>391のように悪手と判定されてしまうことはある
それでも一致率は十分試してみる価値がある
一致率で納得できない点には目を瞑っても、解析を積み重ねて行けば一致率で棋力を推定することに問題はないのだ
そのことを藤井七段の一致率は示している >ソフトが神レベルに強くなると今の一致率70%〜80%が50%〜60%になるかもしれない
そうかもしれないし逆に80%超になるかもしれない
神レベルに近づくことで偽陽性は減るが偽陰性も減る
つまり今まで疑問手扱いされてきた手がそれでも十分勝ちに繋がる手という判定がされるかも 「棋力」って何?
文字通り将棋の実力として何をもってその力とするのか不明
ハブオタが羽生>大山,大山厨が大山>中原≒羽生という強弱格付けの結論ありきで検証を進めてる >>870
それは将棋の神様の性格によるだろう
勝てればいいんだよという鷹揚な神様なら「その手でもいいよ」と◯をつけてくれるが、負けている側の手は投了以外は全部悪手にされるだろう
厳格な神なら最短で勝てる手と最長に粘れる手しか最善手として認めないと言い張るかもしれない
指導したがる神なら「こっちの手のほうが勝ちやすいからこういう手を指せるようになりなさい」と採点してくるだろう
どんなありがたい神でも人間にしてみれば互いの読みの限界の範囲内で見つけることができた最善手以外は意味をなさない
そのようにして見つけた最善手の数が多い棋士が強い棋士だろう >>869
>一致した局面が計測する人によって多かったり少なかったりするのは瑕疵ではない
有志の追試を見るに多少の誤差があるがほぼ同じ結果で、そこに瑕疵がないのは分かる
しかし、あなた一人だけが突出して異なっているのは瑕疵だよ
なぜならだれも再現できない数字だから
>解析を積み重ねて行けば一致率で棋力を推定することに問題はないのだ
>そのことを藤井七段の一致率は示している
あなたが計測しているつもりでいる一致率が実は一致率になっていないとしたら問題だよ
そして誰も再現できない以上その疑いが濃いと言える
実際、あなたは自分で、自身の計測は人よりも定数倍の違いがあると言ってるでしょ
>羽生と大山の比較だけで定数倍になっていないと断じるのはあまりにも暴論だ>>859
この時点であなたの言う一致率は一致率を示してないことは明らかだよ 山下さんも、ソフトが強くなれば検証結果も変わるって分かってるはずだから
毎年、最強ソフトを使って検証して論文書くべき。 >どんなありがたい神でも人間にしてみれば互いの読みの限界の範囲内で見つけることができた最善手以外は意味をなさない
言葉尻捉えるわけじゃないけど、これ言い出したらお終いだよ
人間より遥かに強いだろうソフトから見た一致率で強さを検証してる立場なのに >>875
研究者の視点で言うと、
山下論文はレーティングを作ったのが蛇足。
テーマを「コンピュータ分析で棋士の強さを客観的に計れるのか」きして、
悪手率で概ね並ぶが、これだけは説明できない事象が出てくるとして
今後の課題としておけば良かった ■ 捏造データに注意!
■ 捏造データに注意!
↓↓↓↓↓↓↓↓↓↓
大山:84.8% 羽生:78.5% >>472 名前:◆f7OmZ9ucu2
↑↑↑↑↑↑↑↑↑↑
■ 捏造データに注意!
■ 捏造データに注意!
● 正しいデータ
大山:69.2% 羽生:69.8% >>697
大山:70% 羽生:69% >>718
大山:68.8% 羽生:70.7% >>727 ■ 捏造データに注意!
■ 捏造データに注意!
↓↓↓↓↓↓↓↓↓↓
大山:84.8% 羽生:78.5% >>472 名前:◆f7OmZ9ucu2
↑↑↑↑↑↑↑↑↑↑
■ 捏造データに注意!
■ 捏造データに注意!
● 正しいデータ
大山:69.2% 羽生:69.8% >>697
大山:70% 羽生:69% >>718
大山:68.8% 羽生:70.7% >>727 今んとこ、◆f7OmZ9ucu2の主張が他人の追試に耐えられなかったってことでいいの? 追試以前に時代が異なる棋士をレーティングや一致率で強さを比較するのが無理筋 そこまで否定されるものではないだろ
一致率については同じソフトで同様に解析すればその数値の比較は時代に無関係
問題となるのは「一致率が棋士の強さを表しているか」であって
それも根本的には正しいのではないかとこのスレでの研究で証明されつつあった
が、その根底にある解析結果に不備があるのではという話
個人的には結果が変わる(大山と羽生どちらが強いかという結果等)可能性はあるが
相手の強さも含めて一致率を解析することによって過去の棋士との強さを比較することができるという結論自体は支持したいが 捏造というと全部が捏造みたいな話になる
捏造でないなら何か秘密があるとしか思えないな >>881
当人の一致率に加えて相手の一致率を考慮することで棋力評価の精度を高める、
これは山下になかったことでアイデアだと思う
なので換算レートで時代の異なる棋士間を評価するのは明らかな無理筋には見えない
もちろん、換算レートの誤差は吟味されるべきだが、結果によっては無理ではないだろう
換算レートの誤差を評価するにはこうすればいい
人間に近いレベルの将棋ソフトを10用意しリーグ戦を行うことで模擬の単年のA級順位戦とする
その結果を最新ソフトで評価し一致率を計測することで>>630の数値で各ソフトの換算レートを出す
このことを再度繰り返すと、20個のソフトにそれぞれ換算レートが付くことになる
この20ソフトのうち未対局のソフト同士の対局は換算レートにより勝率予測ができるが、
多数回の反復対局で真の勝率を出し、それとの乖離を見て換算レートの誤差を評価する 要は◆f7OmZ9ucu2の数値がどうして他の人の数値と全然違うのかって理由が明らかになればいいことでしょ
何かの設定が違うだけならそれが分かればいくらでも追試できるわけで
逆に理由が明らかにならないならいつまでも「捏造データでは?」という疑惑が消えないことになる >>881
◆f7OmZ9ucu2はレーティングでの比較はしてないでしょ
「現代の棋士のレーティングと現代の棋士の一致率には相関関係がある」「だから時代の異なる棋士も一致率で比較できる」
と言ってるだけでしょ >>886
そんなの補正レーティングで見てるのと同義
結局広義のレーティングの中にイロレーティングやその他色々あるわけ
一致率もその亜流にすぎない
超強いソフト様にこんだけ一致してたら相当強いだろうという荒い推測
たまたまスレ主独特の出し方が現実に合ってるからといって正しいわけではない >>886
捏造が疑われる数字をもとにした「換算レート」とやらが書かれていますよ
>>472
> 換算レートは大山が1992、羽生が1846になった
> つまり、大山のほうが146高い 100m走ですらタイムでの単純比較で歴代チャンピオンの優劣など評せない
レートや一致率もこの時代の棋士とこの棋士はこういう値だと言えるだけ
なのにその上各自の一致率の数値がてんでバラバラの結果の算数ごっこ >>889
ピントのずれた批判は議論を混乱させるだけ
100m走のタイムで歴代の速さの比較はできる >>889
「各自の一致率の数値がてんでバラバラ」ではないです
■ 捏造疑惑のあるデータ
大山:84.8% 羽生:78.5% >>472 名前:◆f7OmZ9ucu2
● 疑いのないデータ
大山:69.2% 羽生:69.8% >>697
大山:70% 羽生:69% >>718
大山:68.8% 羽生:70.7% >>727 >>892
ストップウォッチのない世界で、100mを同時に走って順位を決める競技が毎年行われていたとすると、違う年の優勝者同士の速さの比較はできない
そこにストップウォッチによる計測が持ち込まれると、違う年でも比較できる
簡単な話です
スレ主のやろうとしていることは、まさにそういうこと
ただ、本スレではそれに成功しているとはとても言えないけどね どうやらこれ以上一致率が変わらなくなるまで何度も解析を重ねているようだな
それならわかる
そこのところは専売特許で隠しているのか
最初にそれで出したから全部それで通すことにしたのかだな あれこれ詮索されているが、入手したソフトは同じでもブレがないように独自改良したもので計測したものと理解してくれるといい
ブレがないのを自慢していたのだが、他人では再現できないことを気にしないで突っ走して来たのは失敗だったかもしれない
しかし、他人のやり方では棋力と一致率の相関が思うように得られないのであれば俺のやり方が参考になるだろうが、俺が知りたいのは俺のやり方でなくとも同じ結論になるのかならないのか?なのでその意味での追試を期待している
逆にいうと、俺流を通せば棋力と相関することは確認できているので追試を受ける必要などない あれこれ詮索されているが、入手したソフトは同じでもブレがないように独自改良したもので計測したものと理解してくれるといい
ブレがないのを自慢していたのだが、他人では再現できないことを気にしないで突っ走して来たのは失敗だったかもしれない
しかし、他人のやり方では棋力と一致率の相関が思うように得られないのであれば俺のやり方が参考になるだろうが、俺が知りたいのは俺のやり方でなくとも同じ結論になるのかならないのか?なのでその意味での追試を期待している
逆にいうと、俺流を通せば棋力と相関することは確認できているので追試を受ける必要などない この先は真相は当たらずとも遠からずで仮想話と思ってくれ
最初に解析したときはdepth12で解析してみた
山下式解析が当てになるものなのか知りたかった
解析グラフは悪手疑問手だらけでギザギザが激しいものになった
悪手判定が出たものを検討モードで解析すると判定が最善手に変わったりした
そこで、depthがいくらなら検討モードの結果と同じような解析が得られるのかを試してみた
結論としてdepth17ならよいかなと思えた
そうした経緯があったため、どの棋譜も最初にdepth12で解析にかけ、そのあとdepth17で解析をし直して一致率を出すようになった
depth12とdepth17の違いを目で追って確認するのが面白かった
始めにあったギザギザが面白いように取れて行き、悪手や疑問手が◯に変わっていくのが快感で楽しかった
キチンと解析すればプロ棋士の悪手は少ないんだということが同じ人として嬉しいものだから、そうやって大山の棋譜を調べ、羽生の棋譜も調べた
はからずも慣らし運転をしたのちに棋譜解析をするという方法を採用していたことになる
棋力と一致率の相関を本格的に調べるために2019年の全棋士について調べることを決意したときも同じやり方を踏襲した
一貫性を重視したからなわけだが、それ以上に最初にdepth12で解析してdepth17との違いを確認するのが習慣となってしまった
パソコンはノートPCなので連続解析する発想はまったくなく、過去の棋譜よりその日その日の対局棋譜を解析するのが趣味なので、このやり方がノートPCに合っていたわけだ >>894
スレ主としては食い違いは前からのことで、解決はもうあきらめているようだ
815◆f7OmZ9ucu2 2020/01/08(水) 17:16:08.13ID:mZBBcCHb>>820
>>814
意に介さないわけではないが、前から違う結果を見せられているからあきらめているよ
大山羽生だけでなく、2019年の棋士の一致率全部について言えていることなのでね
他スレで他人の棋譜解析の結果報告などをみても俺の計測のほうがいつも高いよ 改良ソフトを使っていたことをなんで今まで隠していたの? >>900
仮にそう思えば、一致率の違いは気にならずに自分のソフトでの計測で相関を調べるモチベーションが出るだろうということだよ >>901
どんな改良をすればあなたと同じ結果が再現できるの? ■ 捏造データに注意!
■ 捏造データに注意!
↓↓↓↓↓↓↓↓↓↓
大山:84.8% 羽生:78.5% >>472 名前:◆f7OmZ9ucu2
↑↑↑↑↑↑↑↑↑↑
■ 捏造データに注意!
■ 捏造データに注意!
● 正しいデータ
大山:69.2% 羽生:69.8% >>697
大山:70% 羽生:69% >>718
大山:68.8% 羽生:70.7% >>727 ■ 捏造データに注意!
■ 捏造データに注意!
↓↓↓↓↓↓↓↓↓↓
大山:84.8% 羽生:78.5% >>472 名前:◆f7OmZ9ucu2
↑↑↑↑↑↑↑↑↑↑
■ 捏造データに注意!
■ 捏造データに注意!
● 正しいデータ
大山:69.2% 羽生:69.8% >>697
大山:70% 羽生:69% >>718
大山:68.8% 羽生:70.7% >>727 >>898
747 名前:◆f7OmZ9ucu2 投稿日:2020/01/07(火) 06:24:00.14 ID:H4fkd1Gd
昨日から2回逆順解析(一度目はdepth12で軽く解析して次にdepth17で再解析する)で調べ直した
大山の数値が下がっているがそれでも羽生より高い レス数が900を超えています。1000を超えると表示できなくなるよ。