【統計分析】機械学習・データマイニング28

■ このスレッドは過去ログ倉庫に格納されています
2020/05/01(金) 09:32:34.08ID:d7veCBiW0
!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512

機械学習とデータマイニングについて語れ若人

*機械学習に意識・知能は存在しません。
人の意識に触れたい方はスレ違いです

■前スレ
【統計分析】機械学習・データマイニング27
https://mevius.5ch.net/test/read.cgi/tech/1578892284/

スレ立ての際は、一行目冒頭に
!extend:on:vvvvvv:1000:512
をお願いします。
VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured
2020/07/17(金) 23:01:02.99ID:qKOLafZwa
企業でデータサイエンスやってるけどディープラーニングとかGBDTとかは使えて当たり前で
むしろモデルの精度よりも背景分布の推定や解釈性、因果推論の方が圧倒的に重要
GBDTの重要度を顧客に出したところでなぜそうなのかを説明できないといけない
2020/07/17(金) 23:57:51.35ID:zSX7HXP2H
>>683
とても矛盾した仕事ですね
DL はあくまでも、客観的な相関関係を求めるものなのに
それに対して主観的な因果関係を付加するのですか?
2020/07/18(土) 01:05:54.82ID:hGu+rp74a
なぜその因果関係を主観的だと思っているのか
686デフォルトの名無しさん (アウアウウー Saf1-rAgY [106.154.135.44])
垢版 |
2020/07/18(土) 01:25:33.91ID:6Wz8jddIa
>>684
因果推論の「推論」を主観的に想像することだと思ってる?w
2020/07/18(土) 07:11:09.23ID:6+67qovv0
データから相関関係はわかっても、どちらが原因でどちらが結果かはわからないよね。
2020/07/18(土) 08:26:49.94ID:Iwhr9cjK0
そうだよ(笑)
2020/07/18(土) 08:49:48.56ID:KIRMqycZH
>>686
そもそも因果関係の認定は主観的なもの、というのが私の感覚です
だから最近のペーパーは相関関係(これは客観的なもの)だけ示して、それでペーパーになる、という体たらくまでに落ちぶれたと思っています
690デフォルトの名無しさん (アウアウウー Saf1-rAgY [106.154.135.44])
垢版 |
2020/07/18(土) 09:48:10.05ID:6Wz8jddIa
>>689
だから〜の件が意味不
昔のペーパーは因果関係まで客観的に示してたの?主観的なものなのに?
2020/07/18(土) 10:34:09.04ID:yJIrza8C0
>>689
シナの奴隷は落ちぶれてないのかw
2020/07/18(土) 10:46:07.52ID:4wzWiBHZ0
https://www.youtube.com/watch?v=hNb8IhrSAwE

このスピーチも6年前でAIブームの火付け役になった猫認識の1年、2年後だが
いい感じに当ててるよね

>>1989年、時価総額で世界のトップ50社の中に、
>>日本企業は32社入っていた。ところが2018年には、
>>残っているのはトヨタ1社のみで、ほかはすべて落ちてしまった
>>って書いてあるけど
トヨタも自動運転の時代に突入するとヤバイだろうって言われているもんな
2020/07/18(土) 11:36:10.83ID:/okXyV5F0
>>689
因果関係はあくまで数学的なものであって主観を含まない
時系列ならGranger因果解析、未観測交絡因子がない前提の下ならLiNGAMを使えば統計的に因果関係を求めることができる
2020/07/18(土) 12:54:30.98ID:l5QGC7g0a
>>692
時価総額で企業価値を語ることの愚かさ

「トヨタVSテスラ」の構図は本当か? 「時価総額」という数字のマジックにだまされるな
https://www.itmedia.co.jp/business/articles/2007/15/news045.html
2020/07/18(土) 13:17:30.43ID:/hv/YkbI0
因果関係は実験できるなら原因と考えること要素を変化させて結果と考えられる要素を測定して変化が想定通りか確認したらいいんじゃね?
696デフォルトの名無しさん (アウウィフ FFf1-2sjB [106.171.72.60])
垢版 |
2020/07/18(土) 14:45:32.58ID:uRU3MGLxF
LとRの発音の違いが瞳孔の開き具合で判別出来るのか
おもろいな
2020/07/18(土) 15:20:51.45ID:44BqusNo0
>>因果関係は実験できるなら

実験できないことが多いから困ってんだろ。
2020/07/18(土) 15:29:28.81ID:CbKE/lXY0
因果はめぐる糸車
2020/07/18(土) 15:34:05.88ID:KIRMqycZH
>>693
いいえ、因果関係の認定には大きく主観が作用します
因果関係こそ主観的であると思います
2020/07/18(土) 16:13:06.81ID:/hv/YkbI0
>>697
その阻害要因を取り除くことが不可能かどうか個別に違うだろうけどな
2020/07/18(土) 16:17:00.44ID:/hv/YkbI0
>>696
相関関係があるなら判別できるんじゃないかな?
ある特定の個人には当てはまるかもしれないし
ある病気や遺伝子を持つ限定した人達には当てはまるかもしれない
それが分かれば瞳孔と発音の相関関係から病気の診断や予測に応用できるかも
2020/07/18(土) 20:32:59.90ID:NJ+LQ+vqd
深層学習やるにも超高性能なパソコンが必要か。
むずい。
2020/07/18(土) 20:34:58.75ID:rsR5e1Af0
必要なのはグラボだけやぞ
1060ぐらいあれば遊ぶには十分。同じぐらいの値段で売れるしそこまで損もしない
2020/07/18(土) 20:56:52.07ID:OGAWKHxYa
適当にデータ突っ込んで大規模なネットワークで学習させれば結果がでるなんて単純なものではないから
「よく分からないけどどんなスペックが必要?」のレベルならGPUに金使う前にまず勉強からスタート
2020/07/18(土) 21:30:01.11ID:Iwhr9cjK0
p100あたりなら安く手に入る?
2020/07/18(土) 22:36:48.24ID:rsR5e1Af0
>>705
p100ってteslaやろ、んなもん素人が持ってても使いにくいだけだぞ
型落ちしたteslaなんて普通のグラボよりコスパ悪いし
ゲームに流用できないのももったいないし、いいところがマジで無い

スパコンやマイニングでもするなら止めはせんけどw
2020/07/18(土) 23:28:49.54ID:44BqusNo0
だからgcpかaws使えよ。。少しいじったら飽きるからそれで十分。
2020/07/18(土) 23:52:32.24ID:6+67qovv0
>>695
現実の世界は、その要素が無数にあって相互に作用するカオスな世界だから。
ある要素の変化は別の要素を変化させ、それが回り回って元の要素を変化させる永遠の連鎖作用だから。
単純に原因と結果とか言えない。
2020/07/19(日) 01:26:53.97ID:wRmUZy780
>>708
直接ではなくても原因をコントロールする事で結果を望む形にできたら利用価値はある
710デフォルトの名無しさん (ワッチョイ 454b-aTVc [210.188.32.147])
垢版 |
2020/07/19(日) 07:31:35.95ID:aiqwLyDu0
>>694
ホリエモン予想
https://www.youtube.com/watch?v=kHsEVwN4MwU

ただこの人も外すときは外すからね
2020/07/19(日) 07:59:45.36ID:x6uiukTb0
>>709
一つの要素の同一の変化でも、他の無数にある条件の1つのわずかな違いによって、結果は180度変わることもある。
微小な変化が結果を左右する予想不可能な世界が現実。
気象学がいくら発達しても1年後の天気予報はできない。
2020/07/19(日) 09:28:10.44ID:CzbuCasO0
>>710
VBプログラマーw
2020/07/19(日) 09:40:28.77ID:EpjM+Kts0
>>712
今はVBすげー進化してるぞ。昔から使って極めているならアリ
新規でVBを選ぶ理由はないけど
2020/07/19(日) 10:20:09.77ID:x6uiukTb0
いまどき業務用アプリ以外で、Windows上でしか動かないディスクトップアプリに何の価値があるのか?
2020/07/19(日) 10:23:51.53ID:N0Ciz8Pg0
現実的には再現性が一定以上なら
相関関係であっても有益であるしコントロール可能

元の>>683は、顧客に説得できる根拠となるかなんで、
んな高次な概念を詰めて勝負したところで、カラフルなパワポの資料に負けたりする
2020/07/19(日) 10:28:17.40ID:EpjM+Kts0
>>714
ゲームとか大半それなんだけど
2020/07/19(日) 10:42:42.97ID:vlEIvTu00
要は人を騙せたら勝ち
718デフォルトの名無しさん (ワッチョイ d5ad-FXhc [42.148.220.186])
垢版 |
2020/07/19(日) 11:45:16.66ID:tM1y9lg00
このスレを見ててもやっぱり因果と相関の違いをちゃんと説明する必要があると思った
まず天気予報は予測の問題だから因果推論ではない。天気予報で問題になるカオスと因果推論で問題になる交絡因子は別物
因果推論の方法は大きく分けて2つある
1つは無作為割り当て。医療研究なんかで使われる手法。>>695はその事を言ってるのだと思う。この方法は金と時間がかかる
もう一つは大量の因子を取ってきて回帰分析なんかを使って条件付き共分散を計算して因果を推察する方法
この結果は交絡因子が問題になるから科学的な根拠に乏しくなる
2020/07/19(日) 11:48:47.46ID:5NSBkyh/a
>>714
そのアプリが有用ならWindows買ってきて使えばいいし有用でないなら使わなければいいだけなのに何を怒っているのか理解できない
2020/07/19(日) 12:09:50.41ID:mgFG1ZE4M
>>714
windows捨ててlinux使おうぜ。ナカーマ
721デフォルトの名無しさん (ワッチョイ e355-YsWi [59.147.205.222])
垢版 |
2020/07/19(日) 12:17:05.84ID:LbUeYdJI0
>>714
ディスクトップに保存しておいてって上司に言われたことがあるのを思い出した。
2020/07/19(日) 12:40:46.18ID:COM8Y4uSM
ディスクトップについて考察が必要だ
2020/07/19(日) 12:44:13.92ID:EpjM+Kts0
ディスクトップ

ディスクトップはディスクのトップと思われがちだが、
ディス クトップ(dis cu-top)の意味である
つまり
2020/07/19(日) 12:45:34.57ID:wRmUZy780
>>711
ケースバイケース
利用できるものもあるしまだ難しいものもあるというだけ
全か無かではない
2020/07/19(日) 12:49:24.09ID:wRmUZy780
windowsにubuntuとか仮想マシンを入れられるよな
WSLとかVirtualBoxとか
2020/07/19(日) 12:50:34.41ID:wRmUZy780
デスクの上だよな
突っ込むところではないのか?
2020/07/19(日) 12:51:13.12ID:EpjM+Kts0
>>725
入れれるけどパフォーマンス激減するのがネック
2020/07/19(日) 12:51:49.56ID:VdGkA6ub0
英米ではLの発音を叩き込まれるらしい。その恐怖心が目に現れるんじゃね。
2020/07/19(日) 13:50:00.01ID:hUCl6LZG0
LとRの区別はだいじだ

>>696
口元の力み具合で、じゃんけんのどの手を出そうと考えてるかわかるとかわかんないとか

>>OS論争してるおまいら
それぞれのOSのユーザーが他OSユーザーをどういう風に見ているか みたいな画像な↓
https://images.app.goo.gl/swhhKQS39hg885vt9

あと、
>>677に1票w
730デフォルトの名無しさん (ワッチョイ fd01-aTVc [126.87.53.32])
垢版 |
2020/07/19(日) 14:02:39.18ID:x6uiukTb0
>>723
デスクトップです。はいはい、すみません。揚げ足取りご苦労さま。
2020/07/19(日) 14:05:13.90ID:t18T0wn6H
>>729
ぽえまーとどう違うんですか?
2020/07/19(日) 14:12:36.85ID:hUCl6LZG0
>>731
たぶん最上級に活用してるんだろw
2020/07/19(日) 15:07:42.55ID:COM8Y4uSM
ポエトだけどな
2020/07/19(日) 15:23:59.14ID:hUCl6LZG0
>>733
そいつぁタダの英単語だろ
敢えて「ポエマー」を最上級に活用するところが、みそだろ
2020/07/19(日) 16:55:03.86ID:t18T0wn6H
>>732
最上級は -est であって -ist とは違うのでは?
2020/07/19(日) 17:12:40.21ID:bQ+7ZTBJM
ポエマーはボケたんじゃなかったのか
2020/07/19(日) 17:24:17.22ID:x6uiukTb0
>677はpoemyという新しい単語を作り出すほどクリエイティビティスト
2020/07/19(日) 19:51:59.58ID:hUCl6LZG0
>>735
だから「たぶん最上級」なんだろw

>>736
いやツッコミ待ち?というか、DQN的なジャーゴンというか、スラングというか、だと思うぞw
739デフォルトの名無しさん (ブーイモ MM0b-uxm5 [163.49.209.109])
垢版 |
2020/07/19(日) 21:16:16.60ID:EojUkFKDM
> お前は毎朝起きるたびに俺に負けたことを思い出すよ^^

あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!

クソチョンw

Pythonさえろくにできないバカチョンのくせに
できるとほざくクソチョンw

日本で強姦と窃盗を繰り返す
犯罪者在日のクソチョンw
740デフォルトの名無しさん (ラクッペペ MM6b-47rB [133.106.73.160])
垢版 |
2020/07/20(月) 00:10:16.64ID:7+hTzHatM
>>739
発狂すんなw
2020/07/21(火) 12:49:21.55ID:xGfQeSp+F
【脱税】中国人男性、競馬の予想ソフトで的中させた当たり馬券の利益18億円を申告せず、名古屋国税が所得隠し指摘→すでに上海へ高飛びか
https://asahi.5ch.net/test/read.cgi/newsplus/1595301945/
742デフォルトの名無しさん (アウウィフ FFf1-sTnA [106.171.72.149])
垢版 |
2020/07/21(火) 14:06:26.18ID:+OCbOnRhF
八王子スーパー強殺 パート女性を執拗に暴行 襲撃目的の可能性
https://www.sankei.com/affairs/news/200721/afr2007210002-n1.html
https://wezz-y.com/archives/76574
Aicia Solid Project
2020/07/22(水) 11:50:35.28ID:RgojGPAo0
AIで犯罪プロファイリングしてるとかいうけど、どんなかんじなんだろうな
2020/07/22(水) 12:59:46.75ID:PwM/wgdW0
簡単にできそう(笑)
2020/07/24(金) 08:29:41.76ID:oIjJeR8F0
統計学を勉強しようとおもうんだけど、東京大学工学教程の確率・統計I、IIってどうですか?
2020/07/24(金) 08:40:36.63ID:g8qC8bO60
東大生じゃなかったからわかんない
2020/07/24(金) 09:25:05.95ID:qBklVNba0
図書館とか行って複数の本をみた方が良い
同じ事を違う表現で説明してあるから
自分にとって判りやすい解釈しやすいものを見つけたら良い

大まかに理解した後で別の本をみたら
最初は理解できなかったものも理解し易くなる
2020/07/24(金) 10:47:35.68ID:Mf5vLGWl0
>>745
東大統計教室の方読め
749デフォルトの名無しさん (ワイーワ2 FF9a-keh3 [103.5.142.122])
垢版 |
2020/07/24(金) 10:52:17.44ID:qMgm686nF
978-4-563-02437-6
750デフォルトの名無しさん (ワッチョイ 737d-5TCi [210.165.214.3])
垢版 |
2020/07/28(火) 11:39:53.65ID:Aa6k0IJH0
機械学習で株式リターンの予測を試みるDiscordコミュニティ作成しました
興味のある方がいたらぜひとも参加お願いします
ttps://discord.gg/ny366we
2020/07/28(火) 13:01:26.89ID:v2UR+ECMM
クリックしても何にも変わらないよ?
2020/07/28(火) 21:17:21.59ID:dUWZISOx0
今は人類2.0の時代らしい
2020/07/29(水) 00:32:58.52ID:/O9VxGvAa
○○2.0みたいなの一時期流行ったな
754デフォルトの名無しさん (アウアウエー Sa9f-DfbS [111.239.44.52])
垢版 |
2020/07/29(水) 01:36:14.93ID:CwVjY0Ria
第6世代移動通信システム
第五世代コンピューター
インダストリー4.0
三本の矢
選択する未来2.0
VR元年
原発ゼロ年代
2020/07/29(水) 02:02:35.27ID:aJbD4oVY0
windows3.1
2020/07/29(水) 02:02:39.37ID:6r2N0Oica
さすが受験勉強の過学習者
2020/07/29(水) 09:39:45.97ID:r/8qMvlO0
アンドロイド南極28号がオランダで活躍してるんだって、NHK-BSでやってた
視界の中央が黒くなる病気には網膜LSIを使って視界を回復するとか
758デフォルトの名無しさん (ワイーワ2 FF9f-lIev [103.5.140.150])
垢版 |
2020/07/29(水) 10:47:10.12ID:hY/5h1XOF
その研究40年位前に聴いた気がする
2020/07/29(水) 11:21:15.62ID:Tt0gP0e+0
フィードフォワードネットワークとマルチレイヤーパーセプトロンの違いってなに?
760デフォルトの名無しさん (アウアウエー Sa9f-DfbS [111.239.47.206])
垢版 |
2020/07/29(水) 13:07:24.30ID:ISclzKExa
>>759
バックプロパゲーションがあるか無いかの違いです
2020/07/29(水) 13:19:51.92ID:R0wc3GX30
>>759
フィードフォワードはデータの方向に着目した分類の仕方でパーセプトロンも含む概念だと思う

ニューロンの結合の仕方やデータの流れる方向による分類
層構造とか網構造とか双方向にデータが流れるとか
2020/07/29(水) 14:31:43.66ID:Tt0gP0e+0
>>761
あ、なるほど
2020/07/29(水) 18:37:27.15ID:sbLu7P+90
つまり誤差が逆伝播するってことだってばよ
2020/07/29(水) 21:15:20.03ID:Tt0gP0e+0
なかなか論文からすぐにプログラムを作れるようになれないよう😭
2020/07/30(木) 08:31:09.38ID:aMAEXQwY0
言い方違うけど一緒な話はこの業界ではよくある。
weight decayもl2 reguralizationも一緒。
766デフォルトの名無しさん (ワッチョイ df55-xE3T [59.147.205.222])
垢版 |
2020/07/30(木) 08:34:29.18ID:MsWH6O3V0
新しい方法に見せたいっていうだけの話。
胡散臭い分野。
2020/07/30(木) 09:03:12.28ID:aMAEXQwY0
それもあるだろうけど、ただ単にまとまりなくバラバラに動いてるだけってのもある。
2020/07/30(木) 10:58:14.90ID:YCvH4bv50
自由に競争した方がその分野の発展にはいいかもしれない
但し結果を公開して同じ失敗とかをしないような仕組みがあった方が無駄が少なくなると思う

統制するとモチベーション維持とかやらされてる感とかの問題出そうだし
769デフォルトの名無しさん (ブーイモ MMcf-34n8 [163.49.215.26])
垢版 |
2020/07/31(金) 19:32:35.55ID:fNvzQEuxM
> お前は毎朝起きるたびに俺に負けたことを思い出すよ^^

あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!

クソチョンw

Pythonさえろくにできないバカチョンのくせに
できるとほざくクソチョンw

日本で強姦と窃盗を繰り返す
犯罪者在日のクソチョンw
770確率統計マスター (ワッチョイ e794-SLIs [124.18.139.153])
垢版 |
2020/08/01(土) 11:24:49.62ID:fr9PM3Uz0
統計学の教科書は最後の補足も含めて全部見ておくべき.

データサイエンスといえば確率統計、確率統計と言えばデータサイエンス
AIやらpythonやらsqlは統計学のオマケ
771デフォルトの名無しさん (アウアウカー Sa3b-DfbS [182.251.244.17])
垢版 |
2020/08/01(土) 11:26:01.60ID:biQ1QRTHa
>>770
統計学の教科書は何?
2020/08/01(土) 15:38:17.49ID:qqfuAfnU0
古臭い小寺平次の本でいいよw
2020/08/01(土) 16:37:38.10ID:VUiADSw60
それベイズ対応してんの?
2020/08/01(土) 16:45:26.22ID:3wGkaLtU0
複数の本を読めばいいんじゃね?
775デフォルトの名無しさん (ブーイモ MMcf-34n8 [163.49.215.32])
垢版 |
2020/08/01(土) 18:49:30.19ID:9T234IvEM
>>773
入門書レベルの人は
ベイズなんて全く気にしなくていい

「おれさあ、ベイズわかってんだよね!」などと言って
自慢したいんだろうがやめておけ。

統計学にて自慢は大ケガのもとだ
初心者は初心者らしくしてればよい
2020/08/01(土) 22:20:33.78ID:2x93Oy2h0
ベイズ統計を分布の話から理解しようとしたら無限次元正規分布(ガウス過程)とカーネル法の理解が必要
2020/08/01(土) 23:18:52.83ID:FCIy3haw0
ベイズ統計は本当に何にも知らないか、頻度論を十分に理解している必要がある
776はナンセンスだが
2020/08/02(日) 00:23:45.16ID:fYvyolud0
めんどくさいから条件付確率で計算するっていえばいいよ。
2020/08/02(日) 01:08:34.50ID:Fohp2Mnq0
ベイズじゃないと解けない、あるいは解くのが困難な問題ってどんなのがあるの?
2020/08/02(日) 02:06:40.43ID:gvZohg9M0
プログラム的にはベイズ対応することでパラメータチューニングなど速くなるよね。
2020/08/02(日) 02:52:45.20ID:63NiyH+f0
どういうこと?
782デフォルトの名無しさん (ワッチョイ 07ad-z+yJ [42.148.220.186])
垢版 |
2020/08/02(日) 13:35:52.74ID:0QwOQoj10
>>779
lasso回帰はラプラス分布の事前分布だぞ
そういう意味ではDLなど正則化付きのあらゆる分析はベイズ的と言える
つまり正則化付きモデルの予測分布を解析的に知りたければベイズが必ず必要になると思う。違ったらスマン
他には経験ベイズでハイパーパラメーター無くしたいとかの動機もある
ノンパラベイズ使って辞書なしで単語分割してくれる技術がある。最近だとDLでも出来るみたいだがベイズで発明された上でDL化してるわけだからベイズの知識を持ってないとそのDLの発明は出来ないわな。全く同じものじゃないだろうし
2020/08/02(日) 15:39:07.71ID:63NiyH+f0
それってモッチーのやつ?
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況