【統計分析】機械学習・データマイニング29

2020/08/20(木) 09:16:43.41

!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
↑すれたてる毎に１行ずつ減るので、減ってたら３回に増やしてたてること。

機械学習とデータマイニングについて語れ若人

＊機械学習に意識・知能は存在しません。
　　人の意識に触れたい方はスレ違いです。

■前スレ
【統計分析】機械学習・データマイニング28
https://mevius.5ch.net/test/read.cgi/tech/1588293154/
-EOF-

VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured

2020/12/11(金) 20:40:10.09

http://ibis.t.u-tokyo.ac.jp/suzuki/lecture/2020/intensive2/Kyusyu_2020_Deep.pdf

2020/12/11(金) 20:46:05.84

＞　お前は毎朝起きるたびに俺に負けたことを思い出すよ＾＾

あー、ホンッとに思い出すなあ（笑）
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い！」的なことはよーくわかったよ。ホントなにもできない朝鮮ゴキブリBot君！

クソチョンｗ

Pythonさえろくにできないバカチョンのくせに
できるとほざくクソチョンw

日本で強姦と窃盗を繰り返す
犯罪者在日のクソチョンw

2020/12/12(土) 10:33:01.32

>>850
とてもためになりました。ありがとう。

2020/12/12(土) 13:35:25.09

偉い人(ﾟ∀ﾟ三ﾟ∀ﾟ)来てた
この資料いい

2020/12/12(土) 13:53:24.93

850, 851のpdfを読むと
層の横幅Mが広い（素子数が多い）と大域的最適解を得られるっぽいけど
どのくらいの素子数なのか実現可能な数なのかはよくわからなかったな
その素子数を計算で求めることができるのかも

P20に初期化は1/Mって書いてあるけど、横幅Mを計算するλminが何か書いてないような
wの初期化するN(0,I)のIも何か判らない
NTKで調べたら出てくるのか？

逆温度βもどんな値になるのか、変化するのかも判らないな

非凸性→深層学習
その他→他の機械学習（ランダムフォレストとか）
が適しているって感じ？

2020/12/12(土) 13:53:44.49

勾配降下法の意味は理解できましたが、使う意味がよく分からないです。
初めから勾配ベクトルが零ベクトルになるように偏微分の連立方程式解いて
その解を損失関数に代入したものの中から最小のものを選べば済むんじゃないですか？
そうすれば局所最適解に陥ることも避けられますし

2020/12/12(土) 14:05:36.18

わかんない😭💦💦

2020/12/12(土) 14:07:28.60

>>856
数千万次元の非線形連立方程式が解けるのならね

2020/12/12(土) 14:23:15.47

高校生なのかな。。

2020/12/12(土) 15:03:16.60

損失関数の導関数が4次方程式までなら頑張れば解析的に解ける希ガスとか言ってるテスト

2020/12/12(土) 15:52:55.84

次元（変数の数？）が膨大な上に、偏微分で得られた導関数が5次以上になると
代数的に解くことができなくなるからってことなんですね
勉強になりました、ありがとうございます

2020/12/12(土) 16:15:01.19

意味がねーｗ

2020/12/12(土) 16:29:51.26

>>861
計算量の問題もあるが、それだけじゃないんだぜ
学習データだけで最適解を求めてしまうと過学習に陥りやすくなる
いろいろ制約つけて、学習を途中で止めた方が汎化性能が高くなる
アーリーストップとかで調べてみるといいよ

2020/12/12(土) 17:27:15.16

解析的に求められないってことを知った上での発言かと思ってた

2020/12/12(土) 19:10:37.14

極端な話n次元ならn次方程式を用意すれば
サンプルを完全にトレースできる
でもそれだと過学習
一つ別のデータに出会ったとたん破綻する

2020/12/12(土) 19:25:51.39

非線形だから簡単じゃないんだろう
わざわざより高次元空間に写して線形判別しないと上手くいかない

2020/12/12(土) 19:30:18.23

>>865
それは違う気がするな
重みやパラメータをデータから決めただけで
モデルの出力が学習に使用したデータから少しずれたら判別でしなくなるのとは違う

例えば2値判別する時に2点のデータからその中間で判別する境界線を学習したら
データの2点から少しズレても正しく判別できる

2020/12/13(日) 15:04:12.55

>>864
多分「解析的に求められない」の意味もわかってないと思われる。

2020/12/13(日) 17:00:04.31

>>867
同じグループに判別されるデータが飛び飛びではなくて連続しているという前提が成り立つ空間ではそうなるけど
少しズレたら別のグループに判別される様な空間では複雑な境界線になるだろうな

2020/12/13(日) 17:57:39.41

>>869
それを解消するために座標変換するんじゃないのか?

2020/12/13(日) 18:03:07.74

その通り
飛び飛びかどうかなど自分で勝手に決めた空間での話に過ぎない

2020/12/13(日) 19:15:07.22

>>870
それは判っているけど
具体的にどんな変換をしたら良いかはどうやって見つける？

2020/12/13(日) 21:11:16.73

>>872
片っ端から試してみる

2020/12/13(日) 21:42:26.60

試したものより良いものがあるかもしれない
試したものが良くないものばかりの場合は幾ら試しても大して改善しない

2020/12/13(日) 21:52:06.68

笑

2020/12/14(月) 00:23:44.30

>>874
そもそも真の分布などが分からないものを扱うために分析者の判断で何らかの近似をするのが機械学習を含む統計的分析なので「その方法よりいい方法があるかもしれない」は常に発生する問題

2020/12/14(月) 00:50:35.50

>>876
必要な次元とか空間の特徴とか計算料を少なくする条件とか
判る事がゼロなのかどうかで違ってくるだろう

2020/12/14(月) 11:04:36.51

アルゴリズムにも人権を与えて
自動運転でミスったりしたら
減点すればいい

運転免許もアルゴリズムに与えて
失敗したアルゴリズムには免許与えない

アルゴリズムが得た給料を
損害時の補償に使う

人を殺したらそのアルゴリズムを死刑つまり廃止する

2020/12/14(月) 11:59:16.54

そして機械学習は禁止され、技術の発展は止まりましたとさ

2020/12/14(月) 12:02:43.92

問題が発生したとき思考停止で禁止にして表面的に解決した事にするのはよくないよ

2020/12/14(月) 12:05:47.51

タチコマみたいにクローン沢山作って同期させて、問題が起きたらその手前まで巻き戻せばいいんじゃね。知らんけど

2020/12/14(月) 14:16:48.97

ぼーくらはみんなーいーきているー♪

2020/12/14(月) 14:45:36.70

富士通が次元の呪いを解決していたとは知らなかった(笑)

2020/12/14(月) 15:59:36.18

メビウスの帯

2020/12/14(月) 19:55:52.98

>>878
人と違ってアルゴリズムが厳密に同じか違うかは判定できなないだろ

2020/12/14(月) 20:26:26.89

会社がそのアルゴリズムを採用する
会社は損失を負うリスクを回避するようになる
つまり良くないアルゴリズムは淘汰されていく

2020/12/14(月) 20:27:33.96

初期値で大分変わるじゃん

2020/12/14(月) 20:41:14.50

企業はそのリスクを背負う気はないようだが？

2020/12/14(月) 21:07:07.90

さあね
わからないだろ

2020/12/14(月) 23:00:30.31

これどう思う？

https://twitter.com/AnimaAnandkumar/status/1338282250614411264

AI研究者はひどい。
https://twitter.com/5chan_nel (5ch newer account)

2020/12/14(月) 23:29:54.38

最近解雇されたGoogle の AI 研究者はヒドイjsw

黒人で女だから差別されたって言えば最強、誰も何も言えなくなるのを利用した卑怯者

正義面して、ポリコレがいきすぎてる

2020/12/15(火) 06:12:32.08

奇怪学習

2020/12/15(火) 11:20:26.15

仲間内の揉め事って感じだよね。他の失業者も沢山いるんやが

2020/12/15(火) 19:44:22.58

>>891
ハイハイ、逆張り俺すげー言いたいのはよくわかったよ。
こういう馬鹿がトランプ支持してんだろうね。

2020/12/15(火) 20:43:52.56

逆張りってどういうこと

2020/12/15(火) 21:00:46.70

敵対的生成ネットワークを実世界で
展開する俺すげー

かな？

2020/12/15(火) 22:32:21.93

敵対するだけして何も生成せん

2020/12/15(火) 22:54:29.21

いや普通に差別されて訴えてるだけだろ。それを裏がある（ドヤ）とかやってるから馬鹿だと言ってる。

2020/12/16(水) 00:18:34.82

ttps://ic4-a.wowma.net/mis/gr/114/image.wowma.jp/43123942/others/strapless-panty.jpg

2020/12/16(水) 15:42:13.61

>>898
残念な人だなぁ

2020/12/16(水) 19:13:38.18

ネットで話題になるっていうことは
そういうことだろう

糞みたいな動画をいろんなSNSに貼りつけ
煽ったり叩いたり擁護する奴が現れ書き込みが増えて行き
同時期にスタートした同じテーマの質の良い動画をうｐしている
youtuberより3桁、4桁上の視聴数を稼ぐことになっていた

人気の動画っていうのも
そういうことだろう

炎上してネットで話題になった案件でも
そこで何回も投稿している奴は数人しかいない

2020/12/17(木) 00:42:55.37

>>900
普通にピチャイが謝罪してるんだが。。やっぱトランプ脳やな。。
https://thebridge.jp/2020/12/timnit-gebru-googles-dehumanizing-memo-paints-me-as-an-angry-black-woman-the-first-part

2020/12/17(木) 18:33:27.73

画像認識でロス0まで学習を行っても教師画像を数枚誤認識するんですけどなんでですか？

2020/12/17(木) 19:03:27.64

ロスを計算するときに前データを使っていないから？

2020/12/17(木) 19:04:04.34

前データ→全データに訂正

2020/12/21(月) 11:57:35.55

「AI」に納税の義務はあるのか？　「汎用人工知能」（AGI）が議論に一石
https://techtarget.itmedia.co.jp/tt/spv/2012/19/news01.html

2020/12/21(月) 21:38:36.11

Appleも自分の所で車作ってるんだな
ウォルマートが2021年から完全無人の自動運転トラック配送をスタートするし
日本の自動車業界と配送業者の終焉も近そうだけど

2020/12/21(月) 21:52:09.49

全ての国道を自動運転対応にする公共事業をやればいい

2020/12/21(月) 22:38:50.40

2021年9月にApple Carを発売する見込み、、、らしい

倒産寸前から時価総額1兆ドルになったアップルがここまで成長した理由に
ジョブズの改革を上げてたけど
損益計算書を持つ独立した事業単位を持つことを廃止したとか
マネジメントしかできない管理職を解雇し、企業が作る製品の「専門家」が管理職に投入されることになったとか
日本の技術系企業の創業者とか発明、開発した人が社長になる時代の方式に近そうだけど
組織がある程度の規模になった時にやってくる
「僕ちゃんが数値を良くしてあげますよ」的な怪しい奴等は
その場凌ぎの増強剤で逃げ切るばかりで
糞の役にも立たないってことをジョブズは見抜いていたな
上も下も中間も片っ端から首をはねたらしいからな

時計もパソコンもスマホも車もAppleの時代になるんだな

2020/12/21(月) 22:53:13.36

Windowsパソコンのほうがシェアは高いのに，コンピュータサイエンティストとかが講義で使っているパソコンがほぼ必ずと言っていいほど，Appleのパソコンなのはなぜでしょうか？

2020/12/21(月) 23:05:38.48

>>910
画面が綺麗なのと、ターミナルでシェルが使えるからじゃね。知らんけど

2020/12/21(月) 23:47:37.95

Mac を使っている香具師は、情弱w
Linux を知らないから、BSD のMacを使う

プロは、Windows 10 Home 版でさえ、WSL2 で、Ubuntu 18.04 などの、Linuxを使う。
Windows10 Home用のDocker も入れる。
それには、Kubernetes も入っている

Linux, Docker, AWS が基幹技術。
それと、シェルスクリプト・Ruby が出来れば、環境構築できる

Docker Compose ? はあ？
もう、Kubernetesが入っているけどw

こういう話についていけない香具師が、Macを買うw
結局、いつまで経っても、Linux API を学ばないから、単なるプログラマーにしかならない

2020/12/22(火) 08:12:20.46

Linux板でアンチLinuxやってるやつか。

2020/12/22(火) 09:11:01.85

CUDAを使えるGPUが入っているPCはWindowsかLinuxだよなあ
MacだとAMDだけだから深層学習に限ればやりにくい

2020/12/22(火) 09:34:02.32

Macの新しいM1チップは2.6 TFLOPSでTensorFlowも使えるらしい。趣味程度なら使えるかな？
長時間学習するなら専用サーバーかクラウドだろうね。

2020/12/22(火) 10:02:16.62

たかがプラットフォームにどうして勝ち負けを挑む人が居るのか...

2020/12/22(火) 10:19:45.59

ム板住人じゃないからだと思います。

2020/12/22(火) 11:38:02.54

実務で役立つ機械学習講座、らしいぞhttps://startlab.jp/course-details_course04.html

2020/12/22(火) 17:54:43.06

データセットに黒人が少ないから認識率が悪かった、という当たり前の事実を報告しただけでなんでai倫理の権威になれたのか、というと
報告者が黒人だったからなんだよな

2020/12/22(火) 19:06:33.51

仮想化したらwindowsでもlinuxとか使える

2020/12/22(火) 20:18:29.55

>>919
当たり前である事と明白であることは違う
考えてみりゃ当たり前のことでも今まで注目されていなかった部分に光を当てるのは普通に価値があると思うが…

2020/12/22(火) 21:54:05.72

多項分布で昔からある問題な気がするけど…

2020/12/22(火) 22:21:47.64

黒人がゴリラに誤認識されたからって
アルゴリズムが差別を助長してるわけでもない
ただデータセットが偏っていただけ

なのに差別だと騒ぐ
差別を探して差別を作り出してる

2020/12/23(水) 10:47:36.39

360度カメラで囲んで顔写真撮って、データセット作ってるらしいからそのうち直るんかね

2020/12/23(水) 11:58:53.12

360度取るってどういうことだろう

2020/12/23(水) 12:11:08.03

球状の部屋の壁面がカメラだらけだった

2020/12/24(木) 09:22:45.46

>>891
Googleはまだましだけど、ビックテックはポリコレの巣窟
それがイヤで転職してくるエンジニアも居るから、人材独占にならずに良いんだろうけど

2020/12/24(木) 17:27:48.54

reluを発表した人って誰？

2020/12/24(木) 18:25:09.77

G検定の質問かな。。。

2020/12/24(木) 18:48:13.52

そーゆうときはなんでもヒントンいうとけばええねん

2020/12/24(木) 21:59:16.60

マカロビッツ

2020/12/25(金) 13:03:17.54

もしかして諸説あるの？

2020/12/25(金) 21:36:42.23

DeepMind、ルールを教えなくても「パックマン」などでハイスコアを出せるAIシステム「MuZero」
https://www.itmedia.co.jp/news/articles/2012/24/news090.html

2020/12/25(金) 22:03:53.69

EM法とGPとMCMCとALSの違い教えてください

2020/12/27(日) 20:57:58.83

ヒントンさんが成果出して当時の日本人研究者の人が全く成果出してないのはなぜなんだろう

2020/12/27(日) 22:08:34.70

日本の頭いい研究者って数式の展開は得意だけど独創性がないよね

2020/12/28(月) 02:45:12.16

当時ニューラルネットの研究者は
ローカルミニマムに陥る現象を論理的に解決できないって言って逃げたらしいけど
活性化関数やミニバッチやドロップアウトみたいな工夫だけで攻略できたのにな
まあそれでも十数年かかった訳だけど

2020/12/28(月) 02:56:37.56

>>937
答えを知ってから色々言ってもなぁ
他の分野でも同じ
GAFAみたいにならなかったとか

まだ未解決の問題はあるからそれを解いたら良い

2020/12/28(月) 07:28:21.69

ノードの性質を理解したらああいう工夫はできたよね
上っ面でしか理解してないのかも
ヒントンはホント優れた研究者

ニューラルネットワークはブラックボックスだって言って説明責任を逃げてるけど本当は説明できるのかもね

2020/12/28(月) 08:08:43.03

ヒントンにヒントをもらおう！

2020/12/28(月) 08:12:28.08

実際の性能出すまでの準備は相当なもんだろ。
image net 作るだけでも大作業だっての。
SGDが奇跡的に汎化性能向上に寄与したのもやってみてなんぼの感覚があったからで理論的裏付けが何かあったわけでもない。
てか今もその研究は終わってない。

2020/12/28(月) 08:12:51.68

>>937
僕らがローカルミニマムに陥ってないと思えるのは
究極的には量子力学的な背景があるからなのかな

>>939
今は機能として自分たちの外に
見てるから説明が欲しいけど
人間と同じレベルのロボットが作れて
人間と見分けがつかなくなった時に、
それでもできる事に説明を求めるようになるのかな。
できない事に説明を求めるのは
なんとなく理解するけど。

2020/12/28(月) 10:08:57.82

アノテーションアプリのVottだが

半年前までは「10日くらいアセットにアクセスしないでいると読み込めなくなる」
って状態だったので
少なくとも近日中に再編集する必要のあるものは毎日開いて見るようにしていた

原因をWebで検索しても分からなかった

ところで今になって、最近開いてなかったものを読み込んでみたらちゃんと読み込めた

何か改善されたのかなあ
自分もNode.jsとelectronを勉強してVottのオレオレ版でも
作ろうと思ってたのだがw

bounding boxじゃなくて完全輪郭検出があるものも出てきたが
データセットのありかが全部中国だな

2020/12/28(月) 10:33:39.61

ヒントン教

2020/12/28(月) 10:34:51.24

コンピュターの処理能力があがったため、これは前回のNNブームでも同じ

2020/12/28(月) 13:07:32.68

普段から、強力な計算機に触ってないと思いつかない。なんてありそう

2020/12/28(月) 14:27:21.03

なぜ伸びないのか、なぜ成長しないのか
それは金を掛けないからに決まっている

問題というか失敗というか
これからドンドン落ちてく要因となったのは
経営者とか政治家とか文系分野でTOPに居た
おっさん爺さん勢のせいだと言い切って間違いないだろう

2020/12/28(月) 16:15:05.05

>>942
説明してほしくなるのは
人間のレベルがaiより低いからだと思う
将棋でも人間には意味不明でもよくよく調べたらその手に意味があったということがあるし

2020/12/28(月) 16:24:00.96

政治家のせい経営者のせいとか文句言うだけ言って自身はそいつらより効果的な施策を実行するのかと思いきや何もしないのが一番無能

2020/12/28(月) 16:46:52.13

>>942
>>850, 851
のpdfにある方法で初期化するとその近くに大局的最小値があるとか書いてあったと思う
凸関数とかノード数無限大とか何かしら条件があったかもしれないけど

2020/12/28(月) 16:48:16.38

人間に任せるのだって人間の脳の処理は完全に解明されていないけど人間だからって理由で任せているけどね