【統計分析】機械学習・データマイニング28

レス数が900を超えています。1000を超えると表示できなくなるよ。
2020/05/01(金) 09:32:34.08ID:d7veCBiW0
!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512

機械学習とデータマイニングについて語れ若人

*機械学習に意識・知能は存在しません。
人の意識に触れたい方はスレ違いです

■前スレ
【統計分析】機械学習・データマイニング27
https://mevius.5ch.net/test/read.cgi/tech/1578892284/

スレ立ての際は、一行目冒頭に
!extend:on:vvvvvv:1000:512
をお願いします。
VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured
2020/08/04(火) 19:12:38.01ID:vNaRpqaO0
>>805>>807
Google の猫みたいなことならできるでしょ
データの復元とはちょっと違うけど、その出力を得る理想的な入力の逆算はできる・・・場合もある

ネットワークが複雑になっちゃうと無理だろうけどね
たとえば Attention なんかがはさまるとできそうな気がしない
2020/08/04(火) 19:47:42.61ID:+NjkABcTM
んーできない
2020/08/04(火) 20:13:18.02ID:ppbPy2CTa
ここの人は統計もかなりできるの?
私ダメだわ
2020/08/04(火) 20:14:44.78ID:Jpa+XVhsa
>>805です。皆さんありがとうございます。

完全な復元は難しいですが、学習を通じた近似的手法、あるいは理想解に近づけるための模索といった方法なら可能なのですね。
情報理論などについてもう少し勉強してみようと思います。
2020/08/04(火) 21:21:08.63ID:uMd91kkd0
いい加減な知識しかないので
ちゃんとしたいとは思ってるけど。。。
2020/08/04(火) 21:40:00.17ID:HlboFhDlH
初学者レベルでやんす
2020/08/04(火) 22:18:30.76ID:F4yFaW3g0
>>813
カルマンフィルタ=ベイズという意見があり、ベイズが必須というわかった口した発言(>>ID:lImhU2CT0)があったので反論したまで。
2020/08/04(火) 22:20:41.91ID:F4yFaW3g0
ところでカルマンフィルタ=ベイズとは何が背景でのべているかな?
2020/08/04(火) 22:26:50.76ID:F4yFaW3g0
まあ、皆さんよく勉強しましょうね。
2020/08/04(火) 22:49:47.27ID:F4yFaW3g0
>>813
あと…、まさかカーネル法ごときも理解せず反論してるわけじゃないですよね?
824デフォルトの名無しさん (ワッチョイ 07ad-+qZQ [42.148.220.186])
垢版 |
2020/08/04(火) 23:02:46.92ID:lImhU2CT0
>>820
ではカルマンフィルタ=ベイズではない話と確率微分方程式とリースの表現定理がどう関わってくるのか聞こうか
そして、>>792でカルマンフィルタは最尤推定だと言ってるんだが、何の話をしてるんだ?
>>791がこっちの意図まで分かるように詳しく説明してくれていてそれを認めているのは明らかだが
2020/08/04(火) 23:11:32.89ID:F4yFaW3g0
>>824
まずカルマンフィルタは最尤推定ではない。
いったいどの定義からその話になるんだ?
2020/08/04(火) 23:37:31.38ID:oCMoht+F0
最尤推定とベイズ推定は違うが
827デフォルトの名無しさん (アウアウウー Sadb-XZpV [106.154.138.145])
垢版 |
2020/08/05(水) 00:56:32.87ID:3Qce/Txqa
>>826
MAP推定が最尤推定+ノルム正則化と見做せるのは有名な話だが
2020/08/05(水) 01:39:36.62ID:9hC4Y1iK0
>>827
それが真だとしても
同じ対象の見方を変える事ができるだけのような気がする
等しいというのは何?
どんな問題にも全く同じ結果を得ることができて計算量も同じとか?
829デフォルトの名無しさん (ワッチョイ abad-vXrP [42.148.220.186])
垢版 |
2020/08/05(水) 02:20:19.28ID:pFzGbS6W0
PRML13章
状態空間モデルのうち、
・潜在変数(カルマンフィルタ):最小平均二乗誤差推定
・モデルパラメーター(EMアルゴリズム等):最尤推定
モデルパラメーターは変分ベイズでも推定可能
830デフォルトの名無しさん (ブーイモ MM7e-0KWr [163.49.206.223])
垢版 |
2020/08/05(水) 08:52:13.52ID:L/0IIDMFM
> お前は毎朝起きるたびに俺に負けたことを思い出すよ^^

あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!

クソチョンw

Pythonさえろくにできないバカチョンのくせに
できるとほざくクソチョンw

日本で強姦と窃盗を繰り返す
犯罪者在日のクソチョンw
2020/08/05(水) 09:27:48.03ID:4RrjVtjpH
>>824
まあ、ついででいうとまるで人(俺)が理解してないことを前提にしてる点でお話にならないと思う。
ただただ難しい話をしてるわけじゃなく、ベイズベイズ拘るのは世界を知らないと同じ。
2020/08/05(水) 09:33:45.78ID:4RrjVtjpH
あと
ID:F4yFaW3g0=ID:F4yFaW3g0=ID:CwJFfZdJHな
2020/08/05(水) 11:37:02.40ID:QGe0ZSPmM
カルマンフィルタて大学で習ったかなあ
記憶にない(笑)
834デフォルトの名無しさん (ワッチョイ abad-LFEr [42.148.220.186])
垢版 |
2020/08/05(水) 11:40:03.08ID:pFzGbS6W0
>>831
全然議論になってなくて草
アンチベイズならその理由を言えばいいのに
唐突に確率微分方程式やリースの表現定理を出して支離滅裂な発言を繰り返すのは理解していない証拠
カルマンフィルタなんか数時間で勉強出来るからそれを知ってるぐらいで天狗にならずに情報幾何学ぐらいは勉強するべき
ただわめき散らすだけじゃなく論理で反論しないとな
「なぜベイズは要らないのか」今その話をしているのだから余計な話はしなくて結構
2020/08/05(水) 12:41:19.79ID:tujEJ2J8H
PRMLは避けて通れないのかに
難しいっちゅうんで後回しにしてる
2020/08/05(水) 13:22:50.66ID:QGe0ZSPmM
なんかもう古典じゃん。。。
837デフォルトの名無しさん (ワッチョイ abad-LFEr [42.148.220.186])
垢版 |
2020/08/05(水) 13:29:37.71ID:pFzGbS6W0
>>835
英語が得意だったらPRMLの英語版のPDFが無料で公開してくれてるよ
PRMLを読みやすくしてくれる同人誌も無料で公開してくれてるよ
2020/08/05(水) 13:35:11.94ID:tujEJ2J8H
>>837
同人誌!それにしよさんくす
2020/08/05(水) 14:29:21.15ID:N0j3MR6T0
PRML読みやすいわけでもないけど、ある程度まとまったものってなるとどうしてもあれすすめることになるわな。
2020/08/05(水) 17:42:02.49ID:m5ClADKrd
>>834
勝手に断言すなばーか。
情報幾何も習得済みだよ。
2020/08/05(水) 17:45:14.82ID:m5ClADKrd
ところで…
カルマンフィルタを最適推定と勘違いしていた>>ID:pFzGbS6W0さんはなぜベイズだけが問題解決に必須だと断言するの?
842デフォルトの名無しさん (ワッチョイ abad-LFEr [42.148.220.186])
垢版 |
2020/08/05(水) 18:30:42.26ID:pFzGbS6W0
>>841
>>782 >>792
843デフォルトの名無しさん (ワッチョイ abad-LFEr [42.148.220.186])
垢版 |
2020/08/05(水) 18:31:55.07ID:pFzGbS6W0
ちなみにベイズ"だけ"とは誰も言っていない
2020/08/05(水) 18:59:23.89ID:vGwBquT70
マウントの取り合いスレ
845デフォルトの名無しさん (ラクッペペ MMce-snT3 [133.106.85.16])
垢版 |
2020/08/05(水) 19:12:56.72ID:8jazMwDLM
成果出ないからってかっかすんなよ
2020/08/05(水) 19:55:17.28ID:QGe0ZSPmM
モチ付け
2020/08/05(水) 20:27:13.20ID:vRBDfu770
情報幾何を勉強する勘違い君
2020/08/06(木) 11:39:19.74ID:OXsaO7XL0
んな議論に終止符を打ちたいAutoML-Zero君
849デフォルトの名無しさん (ブーイモ MM7e-0KWr [163.49.212.74])
垢版 |
2020/08/06(木) 12:59:35.66ID:VbLHuZhqM
> お前は毎朝起きるたびに俺に負けたことを思い出すよ^^

あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!

クソチョンw

Pythonさえろくにできないバカチョンのくせに
できるとほざくクソチョンw

日本で強姦と窃盗を繰り返す
犯罪者在日のクソチョンw
850デフォルトの名無しさん (エムゾネ FFc2-SiUo [49.106.187.113])
垢版 |
2020/08/06(木) 18:47:51.11ID:n8+uhlZvF
クラスターのクラスター分析新説
https://www.asahicom.jp/articles/images/AS20200806001627_comm.jpg
2020/08/06(木) 19:10:50.42ID:IAzz78X70
今年の流行語大賞かな>> クラスター
2020/08/07(金) 03:20:16.64ID:50vefOoP0
>>842
わらわら。
まあ、本人も言ってる通り客観的な定義かあやしそうだから数式で示してよ。
853デフォルトの名無しさん (ワッチョイ abad-LFEr [42.148.220.186])
垢版 |
2020/08/07(金) 12:06:23.10ID:tje0Be2N0
>>852
労働の対価って知ってるか?
2020/08/07(金) 20:34:42.93ID:gDTukX5oa
LiNGAMの説明で軸を入れ換えただけで非対称性があるから因果推論可能という説明を見ますが
具体的にどうやってそれをモデルに組み込んでるんですか?
論文は読んでません
2020/08/07(金) 20:44:10.24ID:4FpQfo0p0
説明見てません
2020/08/07(金) 22:00:13.35ID:Lq7q63j/M
初めて聞いた
2020/08/09(日) 11:05:10.00ID:vCWHxAzt0
図解・ベイズ統計「超」入門 (サイエンス・アイ新書) 、という本で
学習しようと思うのだけれどこれは絵本 かな?
2020/08/09(日) 11:22:26.36ID:vWm9zQuTM
>>857
新書という時点で立ち読み用だし、レビューを見る限りプログラミング向けでは無い雑学用と思います。
http://review.rakuten.co.jp/item/1/213310_16719864/1.1/
2020/08/09(日) 11:52:28.09ID:vCWHxAzt0
そっかあ、残念
860デフォルトの名無しさん (ワッチョイ 3782-k6Jo [124.40.110.128])
垢版 |
2020/08/09(日) 20:43:45.03ID:JQseNYoO0
【マインド・エンジン】絶対不可能といわれていたコンピュータによる言葉の意味理解。ついに成功したので公開します。
https://youtu.be/bNXX9Iq9ad8

このマインドエンジンに対する皆さんの見解を教えて下さい。
861デフォルトの名無しさん (ワッチョイ ff01-Ea0s [126.161.133.248])
垢版 |
2020/08/09(日) 20:48:54.63ID:2tff8pgk0
>>860
坂田氏なん?
862デフォルトの名無しさん (ワッチョイ ff01-Ea0s [126.161.133.248])
垢版 |
2020/08/09(日) 20:51:28.49ID:2tff8pgk0
吉本の人?
863デフォルトの名無しさん (ワッチョイ ff01-Ea0s [126.161.133.248])
垢版 |
2020/08/09(日) 20:54:25.88ID:2tff8pgk0
全レスしないの?
2020/08/09(日) 20:58:37.79ID:4WEokrKK0
スレ違いだね
2020/08/09(日) 21:00:02.65ID:vCWHxAzt0
>>860
胡散臭すぎて蕁麻疹が出る(笑)
866デフォルトの名無しさん (ワッチョイ 3782-k6Jo [124.40.110.128])
垢版 |
2020/08/09(日) 21:18:55.71ID:JQseNYoO0
今までになかった画期的な自然言語処理だね。
人間と同じだ。
867デフォルトの名無しさん (ワッチョイ ff01-Ea0s [126.161.133.248])
垢版 |
2020/08/09(日) 21:45:03.60ID:2tff8pgk0
人間と同じ能力があるなら、善悪や美醜のような判断もできるかも。
2020/08/10(月) 01:16:26.98ID:TEUy4hO8a
本当に発見したなら論文あげるなり実装あげるなりすればええやん
869デフォルトの名無しさん (ワッチョイ 3782-k6Jo [124.40.110.128])
垢版 |
2020/08/10(月) 07:01:26.47ID:W1yZOvAx0
>>868
マインドエンジンのデモ見れば?
2020/08/10(月) 08:08:41.65ID:Br0am4mg0
そうやって糞動画を再生させようとするのやめれ
2020/08/10(月) 14:09:47.47ID:ey4rWf980
低評価押してきた
872デフォルトの名無しさん (ブーイモ MM7b-0KWr [202.214.230.99])
垢版 |
2020/08/11(火) 09:40:48.44ID:lpYV++WDM
> お前は毎朝起きるたびに俺に負けたことを思い出すよ^^

あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!

クソチョンw

Pythonさえろくにできないバカチョンのくせに
できるとほざくクソチョンw

日本で強姦と窃盗を繰り返す
犯罪者在日のクソチョンw
2020/08/11(火) 21:01:12.18ID:rDVBtvnc0
基本的な質問で申し訳ないんですけど、そもそも分類器(で良いんですかね)って何なんでしょう
例えばタイタニックのデータを使って学習するとか、顔写真いっぱい読ませて顔検出させるとか、学習の結果何らかの「判断基準」が生成されるという認識なんですけど
この基準の実体って一体どういうものなんでしょうか。いや中に小人さんがいるわけでもないわけですし
何かしらの新規データが投入されて、その基準と「照らし合わせて」、「判定する」っていうのが色々説明読んでも概念的というか実際どういうことしてるのかと
opencvの顔認識見てるんですけど分類器のコンストラクタでなんかぐちゃぐちゃ数値書いてるxmlを読み込んでてこれどういうこと?ってなって不思議に思ったんです
2020/08/11(火) 21:05:07.88ID:jZ5k68ph0
ラベル
2020/08/11(火) 22:03:15.22ID:KooE75uAa
>>873
ある空間を〇と×に分ける境界線や境界面
2020/08/11(火) 23:15:43.68ID:Uga1WByLa
>>875
正確には超平面
座標変換した超空間でもっともうまく分類する
超平面を決定する問題
2020/08/12(水) 01:46:47.09ID:moze581p0
超平面ググッてみましたけど、つまり二次元のグラフで最小二乗法で近似直線の方程式出すみたいに、入力データに上手く合致する方程式が生成されるってことでいいんですかね。平面って方程式の形で扱うことになりますよね
方程式を保存というのもあれですから、a1x1+a2x2+......+anxn=0 としたらa1〜axのリストが分類器として外部ファイルに保存されるとかそんな感じでしょうか
判定する新規入力データに関しては各特徴量と係数をそれぞれ掛け合わせて総和を取ってみたいな
2020/08/12(水) 02:43:55.48ID:w6oAeYHsM
>>877
2次元平面でならExcelの散布図に散らばった
データ点同士が似ているなら近傍に偏りがあるはず
と言うことにして境界線を求める
その境界線が求まればそれ以上以下、内部外部などで判定出来るようになるということ
その軸(パラメーター)がxyの2つではなく
gpt-3 だと1750億パラメーターつまり1750億次元の散布図の境界を超平面で分割する事
2020/08/12(水) 07:58:03.72ID:moze581p0
ありがとうございます。
ただ知りたいのはそういう概念的なところでなくて、プログラムの中でそれがどういう数値データになっているのか
判定ってどういうアルゴリズムでされているのか、そういう次元のことでして
880デフォルトの名無しさん (アウアウウー Sa0f-xZXO [106.154.139.209])
垢版 |
2020/08/12(水) 08:47:18.70ID:oslZmgSwa
>>879
>>877の通り
数式の係数を保存している
2020/08/12(水) 09:03:28.71ID:nB2KOli60
>>879
アルゴリズムはいろいろSVMとかDTとかKmeansとか
2020/08/13(木) 11:10:55.74ID:gY7SOC7gM
小人さんは実在するぞ
2020/08/13(木) 11:21:18.72ID:hEkUIQP40
私はコロボックル
2020/08/13(木) 17:24:41.27ID:oPeghVQL0
機械学習のプログラミングスクールに行こうと思ってるけど直前で悩みだした
70万が半分になるけどやっぱり高いし、とはいっても独習だと学んだ証明が得られないし
2020/08/13(木) 17:42:09.89ID:ppn8VBnFM
受けることをオススメ
2020/08/13(木) 18:02:22.39ID:oPeghVQL0
>>885
受けた方がよいですか、そっかー
2020/08/13(木) 18:12:17.93ID:oPeghVQL0
>>885
すいませんけど一応理由欲しいです。背中を押して欲しくて
2020/08/13(木) 18:18:23.01ID:cJL5QApJ0
やめとけ
2020/08/13(木) 18:22:20.27ID:oPeghVQL0
どっちや〜
2020/08/13(木) 18:29:28.31ID:1iT07aDZM
子どもチャレンジや学研やらリモートの独学に向いてない人は一定数いる
コロナ禍で美術大の学生さんとかは気の毒で仕方ない
ん十万円も払ってモニター画面だけでは満足出来ない
環境に身を置かないと学習出来ないという体質なら
通える環境がある所に行くべき
2020/08/13(木) 18:38:21.50ID:oPeghVQL0
通える環境あるのはやっぱりいいですよね
ほんとはキカガクってスクールが第一希望でしたがコロナでオンライン授業になったみたいなので
やめとこーってなりました
892デフォルトの名無しさん (ワッチョイ 6be3-mp9S [180.13.139.111])
垢版 |
2020/08/13(木) 19:04:36.11ID:r7iwhviY0
就職活動?
2020/08/13(木) 19:18:07.04ID:osOujt8N0
まずは統計検定3級を狙ってみたら?
実務だと2級〜1級の人が多い印象だけど。
2020/08/13(木) 19:27:51.42ID:FtwIdS07a
講義とか研修とか同じ内容でも受ける人によってその価値は違うだろう
内容を理解できるか、既に知っていた事か、自分の興味と合っているか、実践する機会があるかとか人によって違うし
2020/08/13(木) 19:30:28.51ID:oPeghVQL0
>>892
転職かスキルアップかな

>>893
統計2級はなんとか取りました
あとはudemyやyoutubeでチュートリアル的なものは出来るようになったけど
理論面はちょっと厳しい
2020/08/13(木) 19:36:08.23ID:osOujt8N0
>>895
2級持ってるなら、社内プロジェクトに参加させてもらってデータ分析の実務経験を積んだらいいんじゃない?
プライベートで本読んだりコンペに参加したりしつつ。
2020/08/13(木) 19:54:58.78ID:ut3SsjSC0
>>895
カリキュラム公開されてるの?
2020/08/13(木) 19:57:20.92ID:oPeghVQL0
会社でそう出来れば一番いいですが難しいので外で学んでくるかってとこですね

>>894の人の言う通りですし、金額に見合うかは分かりませんが得るものはやっぱりあると思うので
スクールで頑張ってみます
899デフォルトの名無しさん (アウアウウー Sa0f-xZXO [106.154.138.184])
垢版 |
2020/08/13(木) 20:14:48.58ID:P1wR/sA0a
大学の聴講生にでもなった方が良いんじゃないかしら
2020/08/13(木) 21:05:19.42ID:ppn8VBnFM
>>887
体系的に学べるし
得るものはあるから
2020/08/13(木) 22:44:19.09ID:i1XxUoec0
自分みたいに基礎だけ勉強して
すぐコンペに参加するタイプの人は少なそうだな
コンペで上を目指すということは
その問題に対しての基礎知識を知らなければならないということであり
今、何が最新なのかを探すことになる
上にいる奴等の手法を逸早くパクるっていう
一番重要なことは勉強で学ぶことが出来ない

と言っても自分ももう参加してないんで今はどうなっているのか知らないが、、、
自動化が進んでるんだろうな
2020/08/14(金) 00:53:50.54ID:gJGUXyQYM
今アンサンブル時代って聞いた
即興でチーム作ってアンサンブル学習で多数決で勝負らしい
JAZZかよ
903デフォルトの名無しさん (ブーイモ MM7f-Ipo0 [163.49.205.163])
垢版 |
2020/08/14(金) 08:38:20.44ID:AaNqGTg5M
> お前は毎朝起きるたびに俺に負けたことを思い出すよ^^

あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!

クソチョンw

Pythonさえろくにできないバカチョンのくせに
できるとほざくクソチョンw

日本で強姦と窃盗を繰り返す
犯罪者在日のクソチョンw
2020/08/14(金) 09:42:02.08ID:ui4QDh2L0
gpt3の日本語版、 NTT 当たりが作らないかな
2020/08/14(金) 15:06:59.95ID:TzsLPA1t0
スクールとかいって活躍した人知らないからやめときな
ぶっちゃけこの分野はみんな独学だよ
2020/08/14(金) 16:53:06.04ID:zGikWryMa
基本を学んだ証明が欲しいならコンペや自作プロダクトでいくらでも証明できるからな
907デフォルトの名無しさん (ワッチョイ 9f55-p5K4 [59.147.205.222])
垢版 |
2020/08/14(金) 17:12:19.00ID:XgOd4/dA0
>>906
コンペって参加すれば何人中何位とかランク付けされるんですか?
それとも、例えば、トップ3だけ表彰されるとかそんな感じですか?

もし、10000人参加して全員の順位が出るのならば、1000位くらいでも結構勉強しているという証明になりますよね。

そもそもコンペというのは人間が評価はしないんですか?単に、認識率が高ければ高いほどいいAIというような評価なんですか?
もし後者だとすると10000人参加しても1位から10000位まで簡単にランク付けできますね。
908デフォルトの名無しさん (アウウィフ FF0f-jwrZ [106.171.85.168])
垢版 |
2020/08/14(金) 17:14:42.45ID:XKPWE/tlF
お布施システム
ととかるちょ
2020/08/14(金) 18:34:12.90ID:ag8CRJ8B0
>>907
Kaggleという有名なコンペがあるから調べてみるといいよ。
実務だと与えられたデータで予測精度を競うというより、データそのものを適切に抽出する実験計画の能力の方が求められたりするけど。
2020/08/14(金) 19:11:26.69ID:TzsLPA1t0
>>901
xgboost一強になってしまってから知らないんだけど
トレンド変わったのかな
2020/08/14(金) 19:32:59.15ID:ui4QDh2L0
カグラーの使えなさは異常
2020/08/15(土) 11:18:49.77ID:CN8sC7mw0
>>902
ある意味パワー勝負みたいなところあるからね
そんな感じになってるんか

>>910
テーブルデータ以外でも
無理矢理xgb使ってみるといい数値が出る
ってことも結構あるしな
2020/08/15(土) 11:42:21.06ID:CN8sC7mw0
文部科学省が公開した新学習指導要領に対応した高校の「情報」の教員研修用教材で
kaggleのタイタニックや黒魔術が載ってたんだな、、、
レス数が900を超えています。1000を超えると表示できなくなるよ。
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況