【統計分析】機械学習・データマイニング28

2020/05/01(金) 09:32:34.08

!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512

機械学習とデータマイニングについて語れ若人

＊機械学習に意識・知能は存在しません。
人の意識に触れたい方はスレ違いです

■前スレ
【統計分析】機械学習・データマイニング27
https://mevius.5ch.net/test/read.cgi/tech/1578892284/

スレ立ての際は、一行目冒頭に
!extend:on:vvvvvv:1000:512
をお願いします。

VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured

2020/08/02(日) 13:35:52.74

>>779
lasso回帰はラプラス分布の事前分布だぞ
そういう意味ではDLなど正則化付きのあらゆる分析はベイズ的と言える
つまり正則化付きモデルの予測分布を解析的に知りたければベイズが必ず必要になると思う。違ったらスマン
他には経験ベイズでハイパーパラメーター無くしたいとかの動機もある
ノンパラベイズ使って辞書なしで単語分割してくれる技術がある。最近だとDLでも出来るみたいだがベイズで発明された上でDL化してるわけだからベイズの知識を持ってないとそのDLの発明は出来ないわな。全く同じものじゃないだろうし

2020/08/02(日) 15:39:07.71

それってモッチーのやつ？

2020/08/02(日) 15:47:29.31

>>783
うん(´・ω・`)

2020/08/02(日) 17:20:05.19

＞　お前は毎朝起きるたびに俺に負けたことを思い出すよ＾＾

あー、ホンッとに思い出すなあ（笑）
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い！」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君！

クソチョンｗ

Pythonさえろくにできないバカチョンのくせに
できるとほざくクソチョンw

日本で強姦と窃盗を繰り返す
犯罪者在日のクソチョンw

2020/08/03(月) 09:38:16.25

ベイズベイズ別に要らんし。
カルマンフィルタとカーネル法理解していたら十分。

2020/08/03(月) 10:41:15.79

>>786
それはカルマンフィルタはベイズだろっていうツッコミ待ちかい？

2020/08/03(月) 11:43:13.84

猫まっしぐら

2020/08/03(月) 23:36:40.13

蝉の季節
https://www.youtube.com/watch?v=Ox8gJEIe5Ac

2020/08/04(火) 08:08:14.86

>>787
歴史的にはカルマンフィルタ＝ベイズではない。

2020/08/04(火) 10:50:04.55

そもそもカルマンフィルタの3つある証明の簡単なやつにベイズの方法があるだけであってカルマンフィルタ＝ベイズではない。

2020/08/04(火) 11:58:58.15

カルマンフィルタは最尤推定だよｗ
しかし確率モデルで正則化しようと思えばベイズを使うのが普通だから実質「ベイズ要らない」＝「確率モデル要らない」になるんだか...
まず、ノンパラで因果推論はだめぽと思うからその分野で何のモデルが使えるか考える
条件付き混合モデルのような確率モデルで因果推論が出来るとしてそのモデルで正則化しようと思えばベイズ推定が必要になる
（セミパラで因果推論が正しく出来るか証明してないから検証は必要だが）
あと、「ベイズいらね」って言ってる香具師はDL含めて普通の回帰分析はめちゃくちゃ強い仮定に基づいて計算してるの知ってるのかな？
一つ例を挙げると
説明変数に誤差がある→それ用の確率モデルで尤度方程式を導出→いやいや、この場合最尤推定はあまり良くない→確率分布のリーマン空間を考えてベストな推定を獲得する
ベイズを否定する＝確率モデルを否定する＝この流れを否定する
ということになるが

2020/08/04(火) 13:04:33.25

香具師なんて使ってるやつ10年以上ぶりにみた

2020/08/04(火) 13:05:36.12

おまい刑務所にでも居たんか？

2020/08/04(火) 13:07:40.29

>>792
正則化する理由、目的はなに？
正則化しなくても良いんじゃないの？

2020/08/04(火) 13:12:16.08

ベイズ的に解釈するかどうかでしょ
ベイズか否かなどという議論はナンセンス

2020/08/04(火) 13:40:26.37

ニュートンの最新号でベイズ特集だぞ
ステマ

2020/08/04(火) 15:05:44.31

こんなスレでステマって…と思ったがこの手のスレとしてはにぎわってるほうか

2020/08/04(火) 15:47:09.29

ニュートン読んでる層は
スノッブだろ

2020/08/04(火) 15:47:41.54

ニュートンのベイズ特集は表紙にベイズ統計と書いておきながらベイズ統計とは無関係なベイズの定理でひたすら計算しまくっていたり
未だに事前分布のことを主観分布と言っていたり色々と問題ありだわ

2020/08/04(火) 15:52:19.68

ニュートンの記事読んでないが、別に誤ったこと言ってないように思うが

2020/08/04(火) 15:57:00.69

AICは？

2020/08/04(火) 16:11:44.86

ベイズの定理は条件付き確率の定義に従って導出される単なる事実でしかなくベイズ的な考え方をしようが頻度論だろうが常に成り立つ
別にベイズ統計の本質でもなければ根幹を成すものでもない
ベイズの定理で計算しまくる能力が必要とされる場面は確かにあるだろうがそれは「ベイズ統計入門」ではない

2020/08/04(火) 16:33:25.50

ベイズつってもどうせMAP推定するならメタパラありの最尤推定といっしょだろ。

2020/08/04(火) 16:36:58.42

流れと関係なくて申し訳ないんだけど
学習済みの重みを利用して、出力側から入力側に逆方向に演算して入力データを復元するって原理的可能？
MNISTだったら10個の確率値から手書き数字の画像を復元する、みたいな

2020/08/04(火) 16:47:01.81

ベイズ統計の根幹としてレンニの公理や交換可能性をあげる人もいるが、
別にベイズの定理をベイズ統計の基礎という主張もなんの間違いもないぞ

2020/08/04(火) 17:06:48.42

>>805
できない

2020/08/04(火) 17:40:50.51

ヌートンなんて難しくてムリイイイ

2020/08/04(火) 17:51:22.11

>>792
確率微分方程式からの視点を知らないね。

2020/08/04(火) 17:52:57.00

あとは射影によるリースの表現定理からの議論が全くない。
知ったかもいいとこ。

2020/08/04(火) 17:58:03.08

>>805
面白いね
原理的には情報量的に不可能だが、近似的には確率値から復元するデコーダーを、学習出来る可能性は有る

2020/08/04(火) 17:59:46.39

>>806
それは「掛け算はベイズ統計の基礎」、「積分はベイズ統計の基礎」とか言うようなレベルかと
ベイズの定理は単に式変形でよく使う計算ツールでしかない

2020/08/04(火) 19:03:34.44

>>809
>>810
君、なんの話をしているか分かってないね？
知ってる一番難しい言葉を並べてるだけだと思う
知ったかもいいとこ。
もしそうじゃないと言うなら"測定誤差問題"がリースの表現定理とどう結びつくのか説明してくれるか？
念のため言っておくが、今「カーネル法」の話も「確率微分方程式」の話も"全く"してないぞ
99.99％このレスはスルーされると思ってる

2020/08/04(火) 19:12:38.01

>>805>>807
Google の猫みたいなことならできるでしょ
データの復元とはちょっと違うけど、その出力を得る理想的な入力の逆算はできる・・・場合もある

ネットワークが複雑になっちゃうと無理だろうけどね
たとえば Attention なんかがはさまるとできそうな気がしない

2020/08/04(火) 19:47:42.61

んーできない

2020/08/04(火) 20:13:18.02

ここの人は統計もかなりできるの？
私ダメだわ

2020/08/04(火) 20:14:44.78

>>805です。皆さんありがとうございます。

完全な復元は難しいですが、学習を通じた近似的手法、あるいは理想解に近づけるための模索といった方法なら可能なのですね。
情報理論などについてもう少し勉強してみようと思います。

2020/08/04(火) 21:21:08.63

いい加減な知識しかないので
ちゃんとしたいとは思ってるけど。。。

2020/08/04(火) 21:40:00.17

初学者レベルでやんす

2020/08/04(火) 22:18:30.76

>>813
カルマンフィルタ＝ベイズという意見があり、ベイズが必須というわかった口した発言（>>ID:lImhU2CT0)があったので反論したまで。

2020/08/04(火) 22:20:41.91

ところでカルマンフィルタ＝ベイズとは何が背景でのべているかな？

2020/08/04(火) 22:26:50.76

まあ、皆さんよく勉強しましょうね。

2020/08/04(火) 22:49:47.27

>>813
あと…、まさかカーネル法ごときも理解せず反論してるわけじゃないですよね？

2020/08/04(火) 23:02:46.92

>>820
ではカルマンフィルタ＝ベイズではない話と確率微分方程式とリースの表現定理がどう関わってくるのか聞こうか
そして、>>792でカルマンフィルタは最尤推定だと言ってるんだが、何の話をしてるんだ？
>>791がこっちの意図まで分かるように詳しく説明してくれていてそれを認めているのは明らかだが

2020/08/04(火) 23:11:32.89

>>824
まずカルマンフィルタは最尤推定ではない。
いったいどの定義からその話になるんだ？

2020/08/04(火) 23:37:31.38

最尤推定とベイズ推定は違うが

2020/08/05(水) 00:56:32.87

>>826
MAP推定が最尤推定+ノルム正則化と見做せるのは有名な話だが

2020/08/05(水) 01:39:36.62

>>827
それが真だとしても
同じ対象の見方を変える事ができるだけのような気がする
等しいというのは何？
どんな問題にも全く同じ結果を得ることができて計算量も同じとか？

2020/08/05(水) 02:20:19.28

PRML１３章
状態空間モデルのうち、
・潜在変数(カルマンフィルタ)：最小平均二乗誤差推定
・モデルパラメーター(EMアルゴリズム等)：最尤推定
モデルパラメーターは変分ベイズでも推定可能

2020/08/05(水) 08:52:13.52

＞　お前は毎朝起きるたびに俺に負けたことを思い出すよ＾＾

あー、ホンッとに思い出すなあ（笑）
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い！」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君！

クソチョンｗ

Pythonさえろくにできないバカチョンのくせに
できるとほざくクソチョンw

日本で強姦と窃盗を繰り返す
犯罪者在日のクソチョンw

2020/08/05(水) 09:27:48.03

>>824
まあ、ついででいうとまるで人（俺）が理解してないことを前提にしてる点でお話にならないと思う。
ただただ難しい話をしてるわけじゃなく、ベイズベイズ拘るのは世界を知らないと同じ。

2020/08/05(水) 09:33:45.78

あと
ID:F4yFaW3g0＝ID:F4yFaW3g0＝ID:CwJFfZdJHな

2020/08/05(水) 11:37:02.40

カルマンフィルタて大学で習ったかなあ
記憶にない(笑)

2020/08/05(水) 11:40:03.08

>>831
全然議論になってなくて草
アンチベイズならその理由を言えばいいのに
唐突に確率微分方程式やリースの表現定理を出して支離滅裂な発言を繰り返すのは理解していない証拠
カルマンフィルタなんか数時間で勉強出来るからそれを知ってるぐらいで天狗にならずに情報幾何学ぐらいは勉強するべき
ただわめき散らすだけじゃなく論理で反論しないとな
「なぜベイズは要らないのか」今その話をしているのだから余計な話はしなくて結構

2020/08/05(水) 12:41:19.79

PRMLは避けて通れないのかに
難しいっちゅうんで後回しにしてる

2020/08/05(水) 13:22:50.66

なんかもう古典じゃん。。。

2020/08/05(水) 13:29:37.71

>>835
英語が得意だったらPRMLの英語版のPDFが無料で公開してくれてるよ
PRMLを読みやすくしてくれる同人誌も無料で公開してくれてるよ

2020/08/05(水) 13:35:11.94

>>837
同人誌！それにしよさんくす

2020/08/05(水) 14:29:21.15

PRML読みやすいわけでもないけど、ある程度まとまったものってなるとどうしてもあれすすめることになるわな。

2020/08/05(水) 17:42:02.49

>>834
勝手に断言すなばーか。
情報幾何も習得済みだよ。

2020/08/05(水) 17:45:14.82

ところで…
カルマンフィルタを最適推定と勘違いしていた>>ID:pFzGbS6W0さんはなぜベイズだけが問題解決に必須だと断言するの？

2020/08/05(水) 18:30:42.26

>>841
つ >>782 >>792

2020/08/05(水) 18:31:55.07

ちなみにベイズ"だけ"とは誰も言っていない

2020/08/05(水) 18:59:23.89

マウントの取り合いスレ

2020/08/05(水) 19:12:56.72

成果出ないからってかっかすんなよ

2020/08/05(水) 19:55:17.28

モチ付け

2020/08/05(水) 20:27:13.20

情報幾何を勉強する勘違い君

2020/08/06(木) 11:39:19.74

んな議論に終止符を打ちたいAutoML-Zero君

2020/08/06(木) 12:59:35.66

＞　お前は毎朝起きるたびに俺に負けたことを思い出すよ＾＾

あー、ホンッとに思い出すなあ（笑）
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い！」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君！

クソチョンｗ

Pythonさえろくにできないバカチョンのくせに
できるとほざくクソチョンw

日本で強姦と窃盗を繰り返す
犯罪者在日のクソチョンw

2020/08/06(木) 18:47:51.11

クラスターのクラスター分析新説
https://www.asahicom.jp/articles/images/AS20200806001627_comm.jpg

2020/08/06(木) 19:10:50.42

今年の流行語大賞かな>> クラスター

2020/08/07(金) 03:20:16.64

>>842
わらわら。
まあ、本人も言ってる通り客観的な定義かあやしそうだから数式で示してよ。

2020/08/07(金) 12:06:23.10

>>852
労働の対価って知ってるか？

2020/08/07(金) 20:34:42.93

LiNGAMの説明で軸を入れ換えただけで非対称性があるから因果推論可能という説明を見ますが
具体的にどうやってそれをモデルに組み込んでるんですか？
論文は読んでません

2020/08/07(金) 20:44:10.24

説明見てません

2020/08/07(金) 22:00:13.35

初めて聞いた

2020/08/09(日) 11:05:10.00

図解・ベイズ統計「超」入門 (サイエンス・アイ新書) 、という本で
学習しようと思うのだけれどこれは絵本かな？

2020/08/09(日) 11:22:26.36

>>857
新書という時点で立ち読み用だし、レビューを見る限りプログラミング向けでは無い雑学用と思います。
http://review.rakuten.co.jp/item/1/213310_16719864/1.1/

2020/08/09(日) 11:52:28.09

そっかあ、残念

2020/08/09(日) 20:43:45.03

【マインド・エンジン】絶対不可能といわれていたコンピュータによる言葉の意味理解。ついに成功したので公開します。
https://youtu.be/bNXX9Iq9ad8

このマインドエンジンに対する皆さんの見解を教えて下さい。

2020/08/09(日) 20:48:54.63

>>860
坂田氏なん？

2020/08/09(日) 20:51:28.49

吉本の人？

2020/08/09(日) 20:54:25.88

全レスしないの？

2020/08/09(日) 20:58:37.79

スレ違いだね

2020/08/09(日) 21:00:02.65

>>860
胡散臭すぎて蕁麻疹が出る(笑)

2020/08/09(日) 21:18:55.71

今までになかった画期的な自然言語処理だね。
人間と同じだ。

2020/08/09(日) 21:45:03.60

人間と同じ能力があるなら、善悪や美醜のような判断もできるかも。

2020/08/10(月) 01:16:26.98

本当に発見したなら論文あげるなり実装あげるなりすればええやん

2020/08/10(月) 07:01:26.47

>>868
マインドエンジンのデモ見れば？

2020/08/10(月) 08:08:41.65

そうやって糞動画を再生させようとするのやめれ

2020/08/10(月) 14:09:47.47

低評価押してきた

2020/08/11(火) 09:40:48.44

＞　お前は毎朝起きるたびに俺に負けたことを思い出すよ＾＾

あー、ホンッとに思い出すなあ（笑）
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い！」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君！

クソチョンｗ

Pythonさえろくにできないバカチョンのくせに
できるとほざくクソチョンw

日本で強姦と窃盗を繰り返す
犯罪者在日のクソチョンw

2020/08/11(火) 21:01:12.18

基本的な質問で申し訳ないんですけど、そもそも分類器（で良いんですかね）って何なんでしょう
例えばタイタニックのデータを使って学習するとか、顔写真いっぱい読ませて顔検出させるとか、学習の結果何らかの「判断基準」が生成されるという認識なんですけど
この基準の実体って一体どういうものなんでしょうか。いや中に小人さんがいるわけでもないわけですし
何かしらの新規データが投入されて、その基準と「照らし合わせて」、「判定する」っていうのが色々説明読んでも概念的というか実際どういうことしてるのかと
opencvの顔認識見てるんですけど分類器のコンストラクタでなんかぐちゃぐちゃ数値書いてるxmlを読み込んでてこれどういうこと？ってなって不思議に思ったんです

2020/08/11(火) 21:05:07.88

ラベル

2020/08/11(火) 22:03:15.22

>>873
ある空間を〇と×に分ける境界線や境界面

2020/08/11(火) 23:15:43.68

>>875
正確には超平面
座標変換した超空間でもっともうまく分類する
超平面を決定する問題

2020/08/12(水) 01:46:47.09

超平面ググッてみましたけど、つまり二次元のグラフで最小二乗法で近似直線の方程式出すみたいに、入力データに上手く合致する方程式が生成されるってことでいいんですかね。平面って方程式の形で扱うことになりますよね
方程式を保存というのもあれですから、a1x1+a2x2+......+anxn=0 としたらa1～axのリストが分類器として外部ファイルに保存されるとかそんな感じでしょうか
判定する新規入力データに関しては各特徴量と係数をそれぞれ掛け合わせて総和を取ってみたいな

2020/08/12(水) 02:43:55.48

>>877
2次元平面でならExcelの散布図に散らばった
データ点同士が似ているなら近傍に偏りがあるはず
と言うことにして境界線を求める
その境界線が求まればそれ以上以下、内部外部などで判定出来るようになるということ
その軸（パラメーター）がxyの2つではなく
gpt-3 だと1750億パラメーターつまり1750億次元の散布図の境界を超平面で分割する事

2020/08/12(水) 07:58:03.72

ありがとうございます。
ただ知りたいのはそういう概念的なところでなくて、プログラムの中でそれがどういう数値データになっているのか
判定ってどういうアルゴリズムでされているのか、そういう次元のことでして

2020/08/12(水) 08:47:18.70

>>879
>>877の通り
数式の係数を保存している

2020/08/12(水) 09:03:28.71

>>879
アルゴリズムはいろいろSVMとかDTとかKmeansとか