機械学習とデータマイニングについて語れ若人
*機械学習に意識・知能は存在しません。
人の意識に触れたい方はスレ違いです
■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
Machine Learningを用いた論文一覧2018
https://shiropen.com/seamless/machine-learning/2018
2017年のディープラーニング論文100選
https://qiita.com/sakaiakira/items/f225b670bea6d851c7ea
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76
■前スレ
【統計分析】機械学習・データマイニング26
https://mevius.5ch.net/test/read.cgi/tech/1568506986/
【統計分析】機械学習・データマイニング25
https://mevius.5ch.net/test/read.cgi/tech/1561568018/
【統計分析】機械学習・データマイニング24
https://mevius.5ch.net/test/read.cgi/tech/1556674785/
【統計分析】機械学習・データマイニング23
https://mevius.5ch.net/test/read.cgi/tech/1551352040/
探検
【統計分析】機械学習・データマイニング27
2020/01/13(月) 13:48:11.20ID:XVZ9a4MG
31デフォルトの名無しさん
2022/03/13(日) 22:13:14.92ID:6Ds930NS 『スッキリわかるPythonによる機械学習入門』という本で、外れ値を削除しています。
特徴量が、'SNS1', 'SNS2', 'actor', 'original'で、目的変数が'sales'のデータがあって、
x軸を'SNS1'、y軸を'sales'とした散布図
x軸を'SNS2'、y軸を'sales'とした散布図
x軸を'actor'、y軸を'sales'とした散布図
x軸を'original'、y軸を'sales'とした散布図
の4つの散布図を描いています。
そして、
x軸を'SNS2'、y軸を'sales'とした散布図を見て、ポツンと他の点から離れたデータを外れ値としています。
その外れ値は、'SNS2'の値が同じである他の点と比べて、'sales'の値が非常に小さいです。
このやり方に疑問を持っています。
外れ値とされた点の'sales'の値が小さいのは、例えば、'actor'の値が非常に小さい(悪い)値であるからかもしれません。
'actor'の値が非常に悪い値ならば、'sales'の値が小さくても何も不自然じゃないわけです。
この本のように、特徴量の1つをx軸に、目的変数をy軸にしてあるデータが外れデータかどうか判断するというのは意味があるんですか?
特徴量が、'SNS1', 'SNS2', 'actor', 'original'で、目的変数が'sales'のデータがあって、
x軸を'SNS1'、y軸を'sales'とした散布図
x軸を'SNS2'、y軸を'sales'とした散布図
x軸を'actor'、y軸を'sales'とした散布図
x軸を'original'、y軸を'sales'とした散布図
の4つの散布図を描いています。
そして、
x軸を'SNS2'、y軸を'sales'とした散布図を見て、ポツンと他の点から離れたデータを外れ値としています。
その外れ値は、'SNS2'の値が同じである他の点と比べて、'sales'の値が非常に小さいです。
このやり方に疑問を持っています。
外れ値とされた点の'sales'の値が小さいのは、例えば、'actor'の値が非常に小さい(悪い)値であるからかもしれません。
'actor'の値が非常に悪い値ならば、'sales'の値が小さくても何も不自然じゃないわけです。
この本のように、特徴量の1つをx軸に、目的変数をy軸にしてあるデータが外れデータかどうか判断するというのは意味があるんですか?
32デフォルトの名無しさん
2022/03/14(月) 11:36:42.50ID:6DbrPlzA model.score(x = x_test, y = y_test)
を実行するとエラーがでますが、
model.score(X = x_test, y = y_test)
とするとエラーがでません。
model.score(X = x_test, Y = y_test)
とするとやはりエラーがでます。
これはなぜですか?
を実行するとエラーがでますが、
model.score(X = x_test, y = y_test)
とするとエラーがでません。
model.score(X = x_test, Y = y_test)
とするとやはりエラーがでます。
これはなぜですか?
2022/03/14(月) 13:10:14.53ID:TgkC28rK
引数名がそう定められてるから
34デフォルトの名無しさん
2022/03/14(月) 13:35:01.07ID:6DbrPlzA35デフォルトの名無しさん
2022/03/16(水) 16:59:49.10ID:ekpgiyg1 『スッキリわかるPythonによる機械学習入門』という本ですが、外れ値の選定がいい加減すぎるように思います。
外れ値は本当に人間が選定するのでしょうか?
それこそ、機械学習で外れ値を選定するというのが合理的であるように思うのですが。
外れ値は本当に人間が選定するのでしょうか?
それこそ、機械学習で外れ値を選定するというのが合理的であるように思うのですが。
2023/03/01(水) 18:25:02.50ID:nUGZrS0Q
恋とは自分本位のもの愛とは相手本位のもの
2023/07/31(月) 12:09:11.67ID:6FtARTFk
ゲホゴホ Oo。(▼o▼;)y-゜゜゜ カッコツケスギタカ・・・
2023/09/30(土) 20:54:36.89ID:EbKCaSNj
あんた、やるやん。
レスを投稿する
ニュース
- 【速報】山上徹也被告に無期懲役を求刑 ★3 [Hitzeschleier★]
- 中国外務省「日本への渡航を控えて」→高市内閣の支持率はとくに下がらず…なぜ日本国民がこれほど「高市内閣」を応援するのか★2 [♪♪♪★]
- 「片脚は人工関節で、ろくに睡眠も取れていない」 激ヤセが不安視される高市首相の体調 | デイリー新潮 [少考さん★]
- 「年収の壁」、178万円に引き上げで合意 自民・国民民主 [どどん★]
- 「お前の処女が欲しい」 養女(当時12歳)と7年にわたって数十回以上性交した男(59)の公判 行為は男の勤務先や車内でも [Hitzeschleier★]
- 【高市首相】「日本人が日本各地を旅行するのも大切」 中国からの渡航自粛巡り ★6 [ぐれ★]
- 【速報】山上徹也、無期懲役 ★2 [329329848]
- 【高市悲報】東京がNYを抜き世界二位になったと話題の世界都市力ランキング、発表元の研究所所長が竹中平蔵😅 [359965264]
- 6500億円の追加減税決まる [237216734]
- Financial Times誌「日本人は90兆円のタンス預金が隠してあるらしい」驚異的だと絶賛!日本凄すぎる! [673057929]
- えっ、ちょっと待って。高市早苗ってこのまま総理やめるまで日中関係悪化させたままでい続けるつもりなの!? [757453285]
- 実際、サウナの扉ぶっ壊れたらどうすればええの [535650357]
