『スッキリわかるPythonによる機械学習入門』という本で、外れ値を削除しています。
特徴量が、'SNS1', 'SNS2', 'actor', 'original'で、目的変数が'sales'のデータがあって、
x軸を'SNS1'、y軸を'sales'とした散布図
x軸を'SNS2'、y軸を'sales'とした散布図
x軸を'actor'、y軸を'sales'とした散布図
x軸を'original'、y軸を'sales'とした散布図
の4つの散布図を描いています。
そして、
x軸を'SNS2'、y軸を'sales'とした散布図を見て、ポツンと他の点から離れたデータを外れ値としています。
その外れ値は、'SNS2'の値が同じである他の点と比べて、'sales'の値が非常に小さいです。
このやり方に疑問を持っています。
外れ値とされた点の'sales'の値が小さいのは、例えば、'actor'の値が非常に小さい(悪い)値であるからかもしれません。
'actor'の値が非常に悪い値ならば、'sales'の値が小さくても何も不自然じゃないわけです。
この本のように、特徴量の1つをx軸に、目的変数をy軸にしてあるデータが外れデータかどうか判断するというのは意味があるんですか?
【統計分析】機械学習・データマイニング27
31デフォルトの名無しさん
2022/03/13(日) 22:13:14.92ID:6Ds930NS32デフォルトの名無しさん
2022/03/14(月) 11:36:42.50ID:6DbrPlzA model.score(x = x_test, y = y_test)
を実行するとエラーがでますが、
model.score(X = x_test, y = y_test)
とするとエラーがでません。
model.score(X = x_test, Y = y_test)
とするとやはりエラーがでます。
これはなぜですか?
を実行するとエラーがでますが、
model.score(X = x_test, y = y_test)
とするとエラーがでません。
model.score(X = x_test, Y = y_test)
とするとやはりエラーがでます。
これはなぜですか?
2022/03/14(月) 13:10:14.53ID:TgkC28rK
引数名がそう定められてるから
34デフォルトの名無しさん
2022/03/14(月) 13:35:01.07ID:6DbrPlzA35デフォルトの名無しさん
2022/03/16(水) 16:59:49.10ID:ekpgiyg1 『スッキリわかるPythonによる機械学習入門』という本ですが、外れ値の選定がいい加減すぎるように思います。
外れ値は本当に人間が選定するのでしょうか?
それこそ、機械学習で外れ値を選定するというのが合理的であるように思うのですが。
外れ値は本当に人間が選定するのでしょうか?
それこそ、機械学習で外れ値を選定するというのが合理的であるように思うのですが。
2023/03/01(水) 18:25:02.50ID:nUGZrS0Q
恋とは自分本位のもの愛とは相手本位のもの
2023/07/31(月) 12:09:11.67ID:6FtARTFk
ゲホゴホ Oo。(▼o▼;)y-゜゜゜ カッコツケスギタカ・・・
2023/09/30(土) 20:54:36.89ID:EbKCaSNj
あんた、やるやん。
レスを投稿する
