【統計分析】機械学習・データマイニング33

2023/03/17(金) 01:30:49.78

!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
↑すれたてる毎に１つずつ減るので、減ってたら３回に増やしてたてること。

機械学習とデータマイニングについて語れ若人

＊機械学習に意識・知能は存在しません。
　人の意識に触れたい方はスレ違いです。

■前スレ
【統計分析】機械学習・データマイニング29
https://mevius.5ch.net/test/read.cgi/tech/1597882603/
-EOF-
【統計分析】機械学習・データマイニング30
https://mevius.5ch.net/test/read.cgi/tech/1609459855/
【統計分析】機械学習・データマイニング31
https://mevius.5ch.net/test/read.cgi/tech/1632587566/
【統計分析】機械学習・データマイニング32
https://mevius.5ch.net/test/read.cgi/tech/1659286605/

VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured

2023/10/16(月) 18:09:46.56

ニューラルネットワークのリッジレッド解析て有効か？🤔

2023/10/16(月) 18:16:41.75

調べたけど駄目だスジが悪すぎる
こんな調子じゃなんも成果出てこねえや

2023/10/16(月) 18:31:59.96

ニューラルネットは巨大すぎて、深く勉強しても使うことがない気がするので、
教養くらいにとどめてる。学習済みモデルを使うこと以外はほぼあり得んじゃろう。

2023/10/16(月) 18:41:22.51

精度が低くていいのであれば、何をつかってもいいんじゃないの?
さいころを転がして文を作ってもいい

2023/11/02(木) 14:59:28.50

nttもllmやんのかよ
イッチョカミwww

2023/11/03(金) 18:52:54.40

岡谷貴之著『深層学習第1版』

ソフトマックス関数は冗長だが、ユニットの一つを選びその入力を0にしてしまえば冗長性を回避できる。
選んだユニットに入る結合重みもきちんと出力に反映される。

というようなことが書かれているのですが、本当に、選んだユニットに入る結合重みもきちんと出力に反映されますか？

2023/11/03(金) 19:02:04.03

そもそも、ソフトマックスかんすうとかはしまょうたいりょうのかほうせい(f(x)+f(y)＝f(x*y))が大前提

2023/11/04(土) 09:21:40.60

ハルシネーションて創造力の原動にならない？
人間が矯正して消しちゃうけど個性なんでわ？

2023/11/05(日) 10:24:18.73

確率的勾配降下法について質問です。

E(W) = E_1(W) + … + E_N(W)

の値をできるだけ小さくするような W を求めたい。

E_i(W) は i 番目のデータに対するニューラルネットワークの出力と i 番目の正解データとの誤差です。

確率的勾配降下法では、 (grad D)(W) を計算するのではなく、ランダムに i ∈ {1, …, N} を選んで、 (grad D_i)(W) を計算して
重み W を更新します。

こうすると、 W を更新する際に、 i 番目のデータに対する E_i(W) の値は小さくなると思いますが、全体として E(W) の値が小さくなることはどうやって分かるのでしょうか？

例えば、

(grad E_1)(W) を計算して、 W を更新する。 → E_1(W) の値が小さくなる。
(grad E_2)(W) を計算して、 W を更新する。 → E_2(W) の値は小さくなるが、直前にせっかく小さくした E_1(W) や他の E_i(W) の値は大きくなってしまう。

というようなことが起こらないのでしょうか？

2023/11/05(日) 13:39:34.14

結局、もぐらたたきのように、いくら局所的な改善をしても全体としては一向に改善されないというような事態にはならないのでしょうか？

2023/11/05(日) 13:53:23.48

大きくなったらキャンセルすれば良いんじゃないか
そもそもEってErrorのEか？EigenのEか？

2023/11/05(日) 16:29:42.61

データ量が大きくなって、ネットワーク構造を複雑にすると
なぜか全体として改善されることが経験的にわかっている
なぜかを研究する分野もある

2023/11/05(日) 17:11:37.33

>>389
ミニバッチのロスの平均に対してgradient descentを行うので、
そのデータセットに対しては、ある程度は最適化できると思います。

局所解の可能性はともかくとして。

2023/11/05(日) 17:18:34.99

>>391
>>392-393

ありがとうございました。
岡谷さんの本には、確率的勾配降下法により E(W) がどんどん小さくなっていくのは当たり前のことであるかのように何の説明もありませんでした。

2023/11/05(日) 20:15:53.11

>>394
当たり前ではないよ
その証明はかなり難しい

2023/11/05(日) 20:45:36.83

確率的勾配降下法
https://www.msi.co.jp/solution/nuopt/glossary/term_da265770bed70e5f0a764f3d20c0ce3d242e6467.html

難しいね、うん

2023/11/05(日) 23:32:13.01

なんでみんな偏微分勉強しないの？

2023/11/06(月) 15:33:19.99

自由エネルギー原理、ちかまたオカルトみたいなことやってんのな😅

2023/11/06(月) 17:41:34.06

機械学習における最適化理論と学習理論的側面
https://www.kurims.kyoto-u.ac.jp/coss/coss2020/suzuki-lecture1.pdf

確率的勾配降下法の収束の証明、ざっと眺めてみたら、まじめにやると禿げる

2023/11/06(月) 18:13:52.90

確率勾配法も、transfomerやCNNもあんまり数理的に詳しくない人が思いついた気がするけど、数理的に深い方の統計機械学習はどのくらい価値があるのかイマイチわからない

2023/11/06(月) 23:02:03.53

ヒューリスティックなことって結構あるよね
局所最適解に捕まってないという証明出来ないこと多いし

2023/11/07(火) 00:34:05.64

>>400
バックプロゲーションやNNの最適化を60年代にすでに完成させてた甘利先生が
ローカルミニマムに陥るのを防ぐことはできないと言って諦めた分野だからな

少なくとも数学的な理論では無理だと判断した
ローカルミニマムに陥らないようにする各種手法を小手先のテクニックと言って切り捨ててたし

確かにミニバッチ勾配降下法とかドロップアウトとかレイヤー正規化だとかの理論は
あくまでやってみたら有効だったというだけで証明は一切ない

2023/11/07(火) 07:26:59.94

現実の現象は決定論的でないしノイズまみれだから気にすることない

2023/11/07(火) 11:07:08.91

解空間が複雑で分からないと言ってるだけだろ、最適解の尺度（L2ノルム等）を決めた時に解を求める方法があるといってるんだよ。
万能な方法があるわけがない、甘利爺なんかを信じなるなよ

2023/11/07(火) 12:43:17.08

甘利先生の講義はめちゃくちゃわかりやすいんだよ
https://www.youtube.com/live/AVCjutAjtGs

論文はかなり難しいのだけど講義はすげー直感的にわかりやすい

2023/11/07(火) 12:51:38.81

>>404
甘利先生は万能な方法を探そうとして情報幾何やらの方向にいってしまって帰ってこなかった
そして深層学習が流行り出して戻ってきた
ジェダイの帰還

2023/11/07(火) 13:00:09.34

なにしに戻ってきたんだかwww

2023/11/07(火) 13:00:25.56

なにしに戻ってきたんだかwww

2023/11/07(火) 13:19:10.36

>>406
情報幾何は失敗だった草

2023/11/07(火) 13:35:21.83

>>409
結果的にはね
そこには「何もなかった」
しかし純粋な数学的理論としてNNを紐解こうとしたらそっちに行くしかないのはわかる

2023/11/07(火) 14:38:35.93

昔ある学会である人のは発表を聞いてそれは俺が前にやったと言っていた傲慢な爺

2023/11/07(火) 15:31:42.12

甘利先生の考えた「自然勾配」を最適化に使うと言う理論は今でこそ一般化した感じはあるが
これを70年代に生み出していたのはマジの天才としか言いようがないよ

2023/11/07(火) 15:33:49.11

理論的な綺麗さを求める人はそれはそれで必要だからやってくれればいいけど工学馬鹿にしたような感じがしてちょっと俺は

transformerの内部解析すらしようとしないし（笑）できないのかもしれんが

2023/11/07(火) 15:44:03.88

甘利先生が60年代と70年代に出した論文を超えるようなものを出した日本人はいないからね
この時期は福島先生という今のCNNとまんま同じNNを出した天才もいるし
時代が違っていれば日本人が世界していた可能性も高い

2023/11/07(火) 15:45:51.99

s/世界していた/世界を支配していた/

2023/11/07(火) 15:49:56.83

ハードウェアの発展（GPU、メモリ）があったからDLが発展した。それだけ。

2023/11/07(火) 15:52:40.77

>>416
でもその発展の時期にヒントンは現場にいた
甘利先生はいなかった
その差なんだよね
悲しいわ

2023/11/07(火) 15:59:17.64

本当のブレイクスルーはtransformersぐらいだしね
それ以外は全部元ネタはあったわけで
それをさも新しいもののように発表してるから
甘利先生は怒ってるのだろう

2023/11/07(火) 16:41:31.61

甘利爺さんも外野ｗ

2023/11/07(火) 16:48:34.03

自然勾配使われてねえじゃん

2023/11/07(火) 22:48:16.56

>>414
福島先生は日本放送協会の役に立たない基礎研究をやっていたと後輩がいってた

2023/11/07(火) 23:06:40.04

>>414
↑
と言ってるバカ。

日本はソフトウェア技術が低いので当時も無理。

2023/11/10(金) 17:43:39.65

YouTubeの3Blue1BrownJapanのニューラルネットワークの動画を見ました。

「第2層が短い線を検出し、第3層がパターンを検出し、」という説明がありました。
ニューラルネットワークの重みやバイアスが何なのかはブラックボックスとして考えないのかと思っていましたがそうではないんですね。

ニューラルネットワークを学習させ、満足のいくものを完成させたとします。
このとき、例えば、第1層がどんな処理をしているのか人間が分かるような説明はどうやって見出すのでしょうか？

2023/11/10(金) 18:16:16.88

重みを可視化してこんなのかな～て当たりをつけて実際にサンプルを入れて反応を見る

2023/11/10(金) 18:31:10.70

>>424

ありがとうございました。

そういうことが分かると非常に満足度は高いと思いますが、よりよいニューラルネットワークを作るのに役立ちますか？

2023/11/10(金) 20:35:16.62

現状では説明できないんだよ
経済系の人とか説明が重要らしくて困っているらしいけど
ちなみに説明しようという研究分野があるけど難航している
複雑に分散されているのが説明困難な理由らしいけど

2023/11/10(金) 20:50:38.03

そもそも機械学習の手法の目的は予測する事で、介入効果については例えばRFでimportanceが高かろうが何も言えなく、実はテーブルデータに関しては役に立つ局面のは限定的だとおもう

2023/11/10(金) 21:25:01.31

NNにwhyと聞いてもわからない

2023/11/11(土) 00:45:05.44

>>423
それは、色々ある。

あと、その動画は、例えばのイメージとして、
第○層が何で、
とかっていう便宜上の説明だったかと。

2023/11/11(土) 01:11:32.04

>>423
これ
https://www.youtube.com/watch?v=vU-JfZNBdYU

2023/11/16(木) 17:00:07.32

Microsoftが独自設計のAI特化型チップ「Maia 100」
https://gigazine.net/news/20231116-microsoft-maia-ai-accelerator-cobalt-arm-cpu/

2023/11/16(木) 17:58:58.50

nnにllmつけて説明させた研究があったろ
あれでええやん😅

2023/11/16(木) 18:44:27.66

Microsoft、AI最適化チップ「Azure Maia 100」
https://www.itmedia.co.jp/news/articles/2311/16/news085.html

2023/11/18(土) 07:10:39.79

アルトマン退社？求心力落ちない？🤔

2023/11/18(土) 09:42:49.83

ナチスの親衛隊に居そうな名前だな

2023/11/18(土) 10:03:41.84

>>434
カリスマ性無いし

アルトマン

2023/11/18(土) 10:21:57.21

アルトマンと言えば結婚相談所

2023/11/18(土) 11:56:46.85

ブロックマンも？

2023/11/18(土) 15:33:38.13

>>438
ブロックマンは
まともな感じ

2023/11/18(土) 20:16:30.61

それがブロックマン他数名？もOpenAIを出ていったらしい

2023/11/18(土) 20:28:43.34

>>440
いや、
ブロックマンは残るらしい

会長は解任

2023/11/18(土) 20:56:56.14

>>441
情報が古い
twitter.com/gdb/status/1725667410387378559
www.theinformation.com/articles/three-senior-openai-researchers-resign-as-crisis-deepens
https://twitter.com/thejimwatkins

2023/11/18(土) 21:20:46.49

>>442
というと？

2023/11/18(土) 21:50:49.06

で結局OpenAIはMSに買収されてしまうの？

2023/11/19(日) 12:10:17.89

グーグルにおけるアンソロピック的なナニかになるかと

2023/11/19(日) 12:16:41.68

>>440
あ

Brockmanも退職するっぽいね

いろいろ、クーデターっぽいな…

2023/11/19(日) 14:05:22.99

取締役会てのがなんか怪しくね？
何もしとらんやん

2023/11/19(日) 14:37:40.63

資本主義とはそういうものやで。日本のIT企業も経営陣は何もしてないし、コードもかけない。

2023/11/19(日) 14:50:44.00

日本のIT企業は錬金術をやっているところ

2023/11/19(日) 14:52:27.66

儲かると観ると役員入れ替えと買収乗っ取りが進む
そして糞企業に成り下がる
sunもoracleもgifもgoogleもyoutubeも歩んだ道

2023/11/19(日) 16:39:16.02

それらは立派な技術で世界制覇した、揚げ足とってもみじめになるだけ

2023/11/19(日) 21:13:19.79

アルトマン氏の復職、マイクロソフト含むオープンＡＩ株主が要求
https://www.bloomberg.co.jp/news/articles/2023-11-19/S4CGWWT0G1KW01

2023/11/19(日) 21:18:57.99

>>452
やっぱ、
大株主抜きでアルトマン解任とか、おかしいよな…

2023/11/20(月) 17:08:59.18

アルトマンはMSに合流だってさ

2023/11/20(月) 20:52:56.88

【速報】サム・アルトマン氏　マイクロソフトに入社へ
https://news.yahoo.co.jp/articles/ced32c8d9c93a2f4b58d47b82dfa3389a2f3b536

2023/11/22(水) 12:34:29.92

OpenAI理事会、アルトマン氏の復帰を協議　米報道

2023/11/22(水) 12:37:59.34

>>456
ゴタゴタすぎｗ

2023/11/22(水) 13:39:12.51

アルトマンの解雇に動いた取締役のヤツも
旗幟を変えて沈没する反アルトマンから逃げ出したな

2023/11/22(水) 14:26:44.88

gptsと似たようなサービス出してるやつが取締役会にいるらしいな

それで追い出したんじゃないか、て話が出てる

2023/11/22(水) 15:46:09.11

CEOとして復帰合意
https://twitter.com/OpenAI/status/1727206187077370115
https://twitter.com/thejimwatkins

2023/11/22(水) 15:49:54.53

>>460

クーデターを仕組んだ奴らはどうなるのか？　ｗ

2023/11/22(水) 16:30:54.75

従業員の9割退職するとか言い出したからな
そんな絞りカスみたいなのだけ残されても会社の体をなさないし復帰しか選択肢はなかっただろう

2023/11/22(水) 20:27:59.27

結局首謀者は誰だったのか

2023/11/23(木) 19:14:55.48

最近CNNについて勉強してるんだけどなんでCNNの進化EfficentNetで止まっちゃってるの？
ViTが出たからもうCNNはオワコン扱いなのかな

2023/11/23(木) 19:26:22.56

なんと、ViT言葉からキーバリューで畳み込みと似たことをやってるのかと思ったら、畳み込みしないモデルなのか

2023/11/24(金) 09:23:51.32

畳み込みはしないけどパターン認識の基本だから
結局畳込み的なフィルタ処理はやってる

2023/11/25(土) 18:55:08.72

>>448
それは会社組織・社会の機能不全の要にも思えるけどな
幕末の藩制の非効化みたいに

2023/11/26(日) 10:28:58.39

音声合成VALL-E-Xってのを使ってみたが、評判はいいのに俺が使ったら全然似てなかった。
だれか使った人いる？

2023/11/30(木) 09:11:46.36

llmがファインチューニングかけるとアホになるのは
ファインチューニングで使うコーパスや方針が非論理的だからだろ

2023/12/02(土) 03:20:12.89

LoRAは絵ではうまく言ったけどLLMでは思ったほど成果がないらしいな

2023/12/03(日) 16:40:58.19

GPT-nとBERTの違いがイマイチあやふやなんだけど
TransformerのEncoderを使って事前学習して特徴量を生成するのがBERT
TransformerのDecoderを使ってBERTが生成した特徴量をもとに自然言語を生成するのがGPT-nって理解であってるのかな？

GPT-4も学習時はBERT使って学習してるのよね？

2023/12/03(日) 16:59:59.16

>>471
全然ちゃいまんがな
GPTとBERTはtransformers使ってるだけで中身は別だぞ

2023/12/03(日) 17:01:30.18

多分99％以上の人は自力で学習する事はないだろうから、その辺全部まとめてtransfomerでいい気がするｗｗ

2023/12/03(日) 17:08:21.32

あとGPTもEncoderとDecoderでモデルを分けてるわけじゃない
同じモデルを使ってるから単に用途の的な意味でしかない
コード読んだらわかるけど

2023/12/03(日) 17:18:35.64

>>472
GPTとBERTの立ち位置が良く分からなくて混乱してくる…
単方向か双方向かの違いなのかな？
それだと双方向に学習するBERTの方が精度高そうなのになんでGPTの方が流行ってるんだろう

論文とかコードは数式が難しくて読める気がしない…

2023/12/03(日) 17:21:29.12

>>471
別個の言語モデル
アーキテクチャが違う
つかbingに聞けよ😅

2023/12/03(日) 17:37:00.52

タスク分解を備えた自律エージェントがAGI開発の次の壁を破りそうだけど、これが完成すると設計の壁が無くなるので、コーダーだけじゃなくSEも失業危機

2023/12/03(日) 18:45:24.95

そんなことができるなら誰も苦労はしない

2023/12/03(日) 20:32:11.51

>>475
主に違うのは学習方法だよ
GPTはRNNみたいに次の文字を推定するように学習する
一方BERTは任意の位置の穴埋め問題を解くような推定をする

2023/12/03(日) 20:47:26.62

あとBERTは最後に線形層などを追加して分類問題として使えたり
様々なタスクに使えるようにできてる

GPTはそうではないが結局プロンプトを分類問題として指定することで同じことができることが判明した
つまりGPTこそあらゆる機能に応用可能な存在だった訳だ

2023/12/03(日) 22:08:28.11

export PS1="$ "