機械学習とデータマイニングについて語れ若人
*機械学習に意識・知能は存在しません。
人の意識に触れたい方はスレ違いです
■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
Machine Learningを用いた論文一覧2018
https://shiropen.com/seamless/machine-learning/2018
2017年のディープラーニング論文100選
https://qiita.com/sakaiakira/items/f225b670bea6d851c7ea
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76
■前スレ
【統計分析】機械学習・データマイニング26
https://mevius.5ch.net/test/read.cgi/tech/1568506986/
【統計分析】機械学習・データマイニング25
https://mevius.5ch.net/test/read.cgi/tech/1561568018/
【統計分析】機械学習・データマイニング24
https://mevius.5ch.net/test/read.cgi/tech/1556674785/
【統計分析】機械学習・データマイニング23
https://mevius.5ch.net/test/read.cgi/tech/1551352040/
探検
【統計分析】機械学習・データマイニング27
2020/01/13(月) 13:48:11.20ID:XVZ9a4MG
2021/11/12(金) 13:34:15.65ID:6G+wh9+9
31デフォルトの名無しさん
2022/03/13(日) 22:13:14.92ID:6Ds930NS 『スッキリわかるPythonによる機械学習入門』という本で、外れ値を削除しています。
特徴量が、'SNS1', 'SNS2', 'actor', 'original'で、目的変数が'sales'のデータがあって、
x軸を'SNS1'、y軸を'sales'とした散布図
x軸を'SNS2'、y軸を'sales'とした散布図
x軸を'actor'、y軸を'sales'とした散布図
x軸を'original'、y軸を'sales'とした散布図
の4つの散布図を描いています。
そして、
x軸を'SNS2'、y軸を'sales'とした散布図を見て、ポツンと他の点から離れたデータを外れ値としています。
その外れ値は、'SNS2'の値が同じである他の点と比べて、'sales'の値が非常に小さいです。
このやり方に疑問を持っています。
外れ値とされた点の'sales'の値が小さいのは、例えば、'actor'の値が非常に小さい(悪い)値であるからかもしれません。
'actor'の値が非常に悪い値ならば、'sales'の値が小さくても何も不自然じゃないわけです。
この本のように、特徴量の1つをx軸に、目的変数をy軸にしてあるデータが外れデータかどうか判断するというのは意味があるんですか?
特徴量が、'SNS1', 'SNS2', 'actor', 'original'で、目的変数が'sales'のデータがあって、
x軸を'SNS1'、y軸を'sales'とした散布図
x軸を'SNS2'、y軸を'sales'とした散布図
x軸を'actor'、y軸を'sales'とした散布図
x軸を'original'、y軸を'sales'とした散布図
の4つの散布図を描いています。
そして、
x軸を'SNS2'、y軸を'sales'とした散布図を見て、ポツンと他の点から離れたデータを外れ値としています。
その外れ値は、'SNS2'の値が同じである他の点と比べて、'sales'の値が非常に小さいです。
このやり方に疑問を持っています。
外れ値とされた点の'sales'の値が小さいのは、例えば、'actor'の値が非常に小さい(悪い)値であるからかもしれません。
'actor'の値が非常に悪い値ならば、'sales'の値が小さくても何も不自然じゃないわけです。
この本のように、特徴量の1つをx軸に、目的変数をy軸にしてあるデータが外れデータかどうか判断するというのは意味があるんですか?
32デフォルトの名無しさん
2022/03/14(月) 11:36:42.50ID:6DbrPlzA model.score(x = x_test, y = y_test)
を実行するとエラーがでますが、
model.score(X = x_test, y = y_test)
とするとエラーがでません。
model.score(X = x_test, Y = y_test)
とするとやはりエラーがでます。
これはなぜですか?
を実行するとエラーがでますが、
model.score(X = x_test, y = y_test)
とするとエラーがでません。
model.score(X = x_test, Y = y_test)
とするとやはりエラーがでます。
これはなぜですか?
2022/03/14(月) 13:10:14.53ID:TgkC28rK
引数名がそう定められてるから
34デフォルトの名無しさん
2022/03/14(月) 13:35:01.07ID:6DbrPlzA35デフォルトの名無しさん
2022/03/16(水) 16:59:49.10ID:ekpgiyg1 『スッキリわかるPythonによる機械学習入門』という本ですが、外れ値の選定がいい加減すぎるように思います。
外れ値は本当に人間が選定するのでしょうか?
それこそ、機械学習で外れ値を選定するというのが合理的であるように思うのですが。
外れ値は本当に人間が選定するのでしょうか?
それこそ、機械学習で外れ値を選定するというのが合理的であるように思うのですが。
2023/03/01(水) 18:25:02.50ID:nUGZrS0Q
恋とは自分本位のもの愛とは相手本位のもの
2023/07/31(月) 12:09:11.67ID:6FtARTFk
ゲホゴホ Oo。(▼o▼;)y-゜゜゜ カッコツケスギタカ・・・
2023/09/30(土) 20:54:36.89ID:EbKCaSNj
あんた、やるやん。
レスを投稿する
ニュース
- 日銀、0.75%に利上げ - 30年ぶり高水準、物価高抑制 [ぐれ★]
- 【スクープ】敏腕プロデューサーSKY-HIが未成年女性アイドル(17)を深夜に自宅呼び出し、〈かわいすぎる死ぬ〉〈だぁいすき〉などのLINEも [Ailuropoda melanoleuca★]
- 【スクープ】敏腕プロデューサーSKY-HIが未成年女性アイドル(17)を深夜に自宅呼び出し、「かわいすぎる死ぬ」「だぁいすき」などのLINEも★2 [Ailuropoda melanoleuca★]
- 胸を強調した女性アニメキャラをファミレスがコラボ企画で起用。「この表現はどうなのか」SNSで疑問の声 ★3 [少考さん★]
- フィンランド議員らがSNSに“つり目”写真 「アジア人差別に政府としてどう対応?」問われた官房長官の答えは ★3 [ぐれ★]
- 【芸能】新幹線で『弁当にビール』はニオイが気になる 鈴木福「どこまで許容していくのか...難しい」 [冬月記者★]
- 【高市号外】新発10年国債利回りが1.990%に 20年ぶり [115996789]
- 日銀0.25%利上げ決定。好感して円安 [256556981]
- 広告業界「ブラックフライデーは完全に日本に定着した」 カネを使わない日本人のために消費喚起イベントがどんどん増える [452836546]
- OpenAI「どなたか15.5兆円資金を出してくださる人はいませんか!!」お前らの力でチャッピーを救え!! [673057929]
- Vtuber「ATMで5万円引き出したら4万円と1枚が千円札だったんだけど…😰」→炎上。 [153490809]
- 高市早苗政権「サハリン2は安倍晋三の遺児」 [175344491]
