【統計分析】機械学習・データマイニング31

2021/09/26(日) 01:32:46.82

!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
↑すれたてる毎に１つずつ減るので、減ってたら３回に増やしてたてること。

機械学習とデータマイニングについて語れ若人

＊機械学習に意識・知能は存在しません。
　　人の意識に触れたい方はスレ違いです。

■前スレ
【統計分析】機械学習・データマイニング29
https://mevius.5ch.net/test/read.cgi/tech/1597882603/
-EOF-
【統計分析】機械学習・データマイニング30
https://mevius.5ch.net/test/read.cgi/tech/1609459855/

VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured

2021/10/02(土) 11:08:59.79

>>18 は「こういう論文がある」と言っただけで正しさには言及してないが

2021/10/02(土) 11:56:06.35

NNは人工ニューラルネット、工学モデル

2021/10/02(土) 13:21:22.44

在日朝鮮人

2021/10/02(土) 14:16:19.44

>>13
それな

脳をコピー(劣化コピー)しても脳以上の性能は期待出来ないよな
せいぜい疲れずに死ぬまでこきつかえるかも知れないが
どうせ脳のコピーだからやっぱり寝ないといかんだろうし

2021/10/02(土) 17:25:35.47

完全に妄想だけど睡眠はパラメータの蒸留に相当してるのでは？

2021/10/02(土) 20:05:16.72

>>25
それでも、これまでに解決できなかった事ができるようになれば投資する価値はある

2021/10/02(土) 20:07:30.07

脳のシステムをコピーして、ソフトウェアに出来たらそれだけでも結構すごいけどな
今はそれすらできない

2021/10/02(土) 20:07:43.97

睡眠中に短期記憶の領域から長期記憶の領域に移されるとか
アルツハイマーの原因タンパク質を排出するとか
言われている

睡眠中は無防備になるのにそれでも必要なんだから何らかの機能や役割があるんだろうな

2021/10/02(土) 23:19:18.80

クソチョンw

2021/10/03(日) 12:38:37.08

人間の視聴覚に介入することすら未だままならないもんな

2021/10/03(日) 12:56:18.91

Googleがやっとショウジョウバエの半脳規模のコネクトーム解析に成功したところ

最高解像度のショウジョウバエの脳接続マップ、Googleが公開
https://www.gizmodo.jp/2020/01/fruit-fly-brain-map.html
ハエの脳神経回路の高解像度マップ、グーグル、HHMI研究者らが発表
https://www.technologyreview.jp/nl/this-map-of-a-flys-brain-connectivity-is-the-best-weve-ever-seen/

2021/10/03(日) 12:57:43.81

＞ショウジョウバエの脳のニューロン数は約10万であるのに対し、ヒトの脳には約860億個のニューロンがある

ショウジョウバエでも未だにこの程度なのに、ヒト脳の完全解析なんて無理よ
富岳も、全脳シミュレーションにはまだ計算能力が足りない

2021/10/03(日) 13:47:46.78

よくわからが神経の接続は繋がったり消えたり強化されたりすｒんだろ静的解析だけではわからないじゃね

2021/10/03(日) 14:51:30.08

>>34
すまないが確認してみるから
検体になってはくれまいか？

2021/10/03(日) 14:57:09.26

神経の成長は、19歳を超えるとほぼ固定される

2021/10/03(日) 15:50:11.96

>>35
すまｎ、もうスカスカ

2021/10/03(日) 15:59:54.62

アインシュタインの脳は世界中に散らばってたな

2021/10/04(月) 11:18:18.37

転移学習とファインチューニングって何が違うの？

2021/10/04(月) 12:00:10.56

ファインチューニング⊂転移学習

2021/10/04(月) 12:24:33.93

>>39
俺もそこはイマイチだったけど、目的が違うんだと理解してる

ファインチューニングは、その名の通り微調整
公開された学習済みモデルの、出力層付近の重みを自分の（または新たな）データセットで学習させて適応させるとかで、ファインチューニングの前後でモデル全体の目的は変わらない

転移学習は、モデルをそのまま別の目的へ使用すること
例えばよくある例だと画像認識モデルを特徴抽出器としてSVMに流し込んで、分類させるのに使うとか
転移学習の前後では全体の目的は変わる（例では画像認識→画像分類）

2021/10/04(月) 13:05:31.91

特定の層だけ学習済みの層を使うのも転移学習なんじゃね？
オートエンコーダ層だけ他のをそのまま使うとか

2021/10/04(月) 14:59:44.37

ファインチューニングだと層の数や各テンソルの成分数までいじる、って見たような

転移学習だと既にあるモデルに別の画像モデルを載せて学習させてた

2021/10/05(火) 14:43:18.00

>>41
プリトレインのパラメータはフリーズしてffを新たに訓練すること？

2021/10/09(土) 16:11:35.50

機械学習において概念の獲得というのは可能なのでしょうか？

例えば犬種を見分けるモデルを作成する中で大きさという概念を獲得させ、その結果を転用して大きさから車種を判別するといったことは可能でしょうか？

2021/10/09(土) 16:38:50.81

できない

2021/10/09(土) 17:12:37.82

どこかのパラメータが大きさを認識するかもしれないけどそれを全く別の種類のものに適用したければ
どのパラメータが大きさを認識するか調べて抽出して新たなモデルを人間が作成するしかない
大きさという概念をプログラムが知らない前提なんだから人間が調べて取り出す必要がある

2021/10/09(土) 17:55:12.92

>>47
やはり現状では人間の手が必要ですよね。

特定の概念に特化したモデルを予め作成し転用することは可能でしょうか？

例えば画像情報から大きさを判別するモデルを作成し、この大きさ判別モデルをモジュールとして別のモデルに組み込んで使うという形です。

2021/10/11(月) 02:41:21.29

概念って何？

2021/10/11(月) 02:42:37.37

定義を述べてください

2021/10/11(月) 11:48:03.15

人間の定義なんてものは主観的で
規則ベースの方式は所詮おれがかんがえたさいきょうのモデル、でしかなく
汎用性は無く例外に弱く使い物にならないのは散々見せられてきた

2021/10/11(月) 12:29:27.13

その辺は言語モデルと画像認識と分類クラス名がリンクされたモデルというのを
作らないと難しいか

2021/10/11(月) 17:21:06.15

そのあたりをグチャッとやってるのがdall-e

2021/10/11(月) 23:03:29.37

>>53
記事を見つけて読んでみましたが面白いですね。
ttps://ainow.ai/2021/04/26/253364/

時間や場所の概念を獲得した(テキストに正しく反応できた)だとか、当初の目的以外の用途に使えたというのは実に興味深いです。

120億パラメータというのがこれまた凄まじいですが、特定の概念に関する部分だけ抽出出来たら宝探しみたいで楽しいでしょうね。

2021/10/12(火) 21:36:26.65

入門書読んでる途中で練習がてらUCIからEnergy efficiencyってデータセットひっぱてきたんだけど
すごく素直なデータセットだな。欠損値ないし、ただ単に重回帰分析しただけで決定係数が0.9越えてた
ここまで素直だとなにか罠があるんじゃないかと不安になる。諸先輩方はどう思います？

2021/10/12(火) 21:55:01.31

>>55
過学習してるだけ

2021/10/13(水) 00:10:46.35

>>56
その可能性を考えて、訓練データとテストデータ両方の
決定係数を見てるんですけどそんな差がないんですよね。
データ分ける時にシード固定せずに40回ほど試したんですけど
決定係数の差は、大きくても0.043、もとのデータも768件あるんで
過学習なんでしょうか？

2021/10/13(水) 05:53:18.70

>>57
ちゃんとクロスバリデーションすべきだなとか思ったけど

2021/10/13(水) 06:07:06.10

ごめん途中で書き込んじゃった

自明な予測との比較はどうなんだろとか思ったけどよく読むと予測精度じゃなくて決定係数の話ですね。
決定係数って学習データへの当てはまりの指標じゃなかったかな。学習データの分散のどの程度を説明できてるかですね確か。
訓練とテストに分割する意味がよく分からないなと思いました。

2021/10/13(水) 21:21:29.85

>>57
とりあえずテスト誤差と訓練誤差調べてみたら？

57 (ﾜｯﾁｮｲ 2ffd-36a8 [210.236.126.224]) · 2021/10/13(水) 21:58:48.95

先輩方ありがとうございます。次にやることが見えてきました。

追伸、IP出るスレは苦手なのでこれにて失礼します。スレ汚し失礼しました。

2021/10/14(木) 01:06:13.63

>>61
IP出たらまずいことでもあるんか？

2021/10/14(木) 01:34:54.45

>>61
勉強が足りてないですが自覚したなら努力を継続できるでしょう。
頑張って

2021/10/15(金) 11:35:14.97

新しい資本主義会議メンバーに松尾豊さんが選ばれましたね。

2021/10/15(金) 11:41:30.88

松尾豊さんのことをAIの第1人者と紹介していましたが、本当ですか？

2021/10/15(金) 12:41:50.92

最も〇〇なものの一つの表現と同程度に捉えておくと良いかと思います。

現在のAIブームの初期から積極的に活動されてたことは確かですし、語れる研究者は貴重な存在ですよね。

2021/10/15(金) 13:11:36.46

>>65
判断基準は論文を書いてるかどうか

2021/10/15(金) 14:44:03.12

松尾豊さんは、論文を書いていますか？

2021/10/15(金) 15:26:26.65

研究者として第一線で発表してるかといわれたら違う
ai研究の顔、広報としての役割が強い

2021/10/15(金) 16:16:51.08

書いてます

2021/10/15(金) 21:08:40.11

大学教授は学生に書かせて添削するのが仕事でしょ

2021/10/15(金) 21:11:12.81

どのくらいの頻度で書いているかとかその内容とかも考慮した方が良いような

2021/10/15(金) 21:12:21.67

物理学とか医学でノーベル賞取ってる人はいるけど
この分野でノーベル賞的なものを取れる人はいるのか？

2021/10/15(金) 21:20:11.26

は？

2021/10/15(金) 21:28:31.52

>>73
日本語で書いてくれ

2021/10/15(金) 21:57:46.92

>>75
具体的にどこの意味が理解できない？

2021/10/15(金) 22:00:03.52

ノーベル賞を知らないとか？

2021/10/15(金) 22:01:26.83

最初に多層ニューラルネットワークを考えた人は正直ノーベル賞レベルだと思う
ようやく花ひらいたけど基本は当初と何も変わってないし

2021/10/15(金) 22:08:34.90

ノーベル何賞になるんだよ

新設しないと該当する賞がねーだろ

2021/10/15(金) 22:10:54.30

>>79
だからノーベル賞的なものと書いた
数学だとそれはフィールズ賞らしいけどな

2021/10/15(金) 22:13:46.30

チューリング賞

2021/10/15(金) 22:17:19.03

ニューラルネットワークって物理の文脈で捉えることも可能だからゴリ押せば問題ない

2021/10/15(金) 22:20:07.48

シャノン賞ってのもあるらしい

https://www.tus.ac.jp/quiz/q21_30/a26.html

2021/10/15(金) 22:25:50.03

>>73
甘利センセあたり？

2021/10/15(金) 22:25:58.98

ノーベル賞の認知度の高さが一般人の科学への認識を歪めてる感はありますね。

2021/10/16(土) 10:54:08.18

>>85
科学とは何？

2021/10/16(土) 21:09:36.43

数学以外の何か。

2021/10/16(土) 21:10:57.83

なんじゃい、そりゃｗ

2021/10/17(日) 02:04:54.29

Alpfafold2を話題にしないのはなぜ

2021/10/17(日) 13:38:23.60

良くわかんない

2021/10/17(日) 16:01:57.87

知らないから

2021/10/17(日) 17:37:38.26

＞　お前は毎朝起きるたびに俺に負けたことを思い出すよ＾＾

あー、ホンッとに思い出すなあ（笑）
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い！」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君！

クソチョンｗ

2021/10/18(月) 15:52:55.77

情報系じゃなくて実験系の出身だから論文読むのも大変だわ
機械学習が必要になってPytorchやTensorFlow使ってるんだけど、
自分がやってることと言えば論文軽く読んでGitHubからコード落として、ネットワークを目的に応じて修正し自分のデータに適用してるだけ
詳細なアルゴリズムはよく理解できてないことも多い
全く新しいモデルを提案する人達はすごいなと感じます

2021/10/18(月) 16:00:54.53

>>93
同分野でも原理か応用かでやってることは全く違いますからね。

原理を知っておいて損はありませんが、応用で一番大事なのは対象となる事象の理解なんて言われるくらいですし。

パソコンを使って何かを創る人とパソコンの仕組みを研究してる人って感じですね。

特定分野の一技術がこれだけ広く利用されている現状はなにげにすごいことです。

2021/10/18(月) 16:34:14.02

K-meansするとき、標準化や正規化って必須なの？
特徴によってスケールが違うんだけど。。。

2021/10/18(月) 17:04:01.15

特徴によってスケールが違うから正規化するんだろ

2021/10/18(月) 17:08:36.65

偏差5σにあうようにデータを修正するのかｗ

2021/10/18(月) 18:01:46.73

データを歪めてるわけで良くないのかなって

2021/10/18(月) 18:32:58.29

>>98
データを歪めてるというよりも、異る値を公平に比較するために揃えてる感じですね。

正規化は単体のデータではなくデータの集合に対して行いますので、単体の値が変化しても集合内のデータ間の関係(例えば距離の比)は保たれます。

手法が見ているのがこの生の値なのか関係なのかが問題で、生の値をそのまま使う場面はかなり稀だと思います。

2021/10/18(月) 19:13:34.77

>>99
なるほど
サンクス

2021/10/18(月) 20:49:50.55

>>95
例えば身体測定のデータが身長km体重gで入ってたらどうなると思う？

2021/10/18(月) 21:09:15.04

どうなるの？

2021/10/18(月) 21:19:05.98

ＮＦＴゲーム、ブロックチェーンゲームに今すぐ参入しなさい
これからこの市場は100倍になる
２年もしたら先行者利益が失われてブルーオーシャンからレッドオーシャンになるだろう

2021/10/19(火) 10:33:12.65

こんなとこで宣伝しなきゃならんほどアブナイのか...

2021/10/21(木) 19:37:27.13

機械学習やDeepLearningにおいて、線形代数ってどのレベルまで勉強したらいい？
行列の計算方法がわかるくらいじゃ不十分？

2021/10/21(木) 20:17:54.37

>>105
ベクトル値関数のベクトル、行列でのフレェシェ微分を計算できるぐらいは必要。

2021/10/21(木) 20:19:17.89

>>105
要らない

2021/10/21(木) 21:07:59.43

ケイリー・ハミルトンくらいは理解しとけ

2021/10/22(金) 00:39:22.28

固有値固有ベクトル基底変換

2021/10/22(金) 00:52:21.99

テンソルの演算と多変数関数の連鎖率とミニバッチ勾配降下法だけで全て対応可能だよね
ややこしい微分方程式の解を求めるための重積分の計算とかとか
ラグランジュの未定乗数法もいらないから数学的には相当楽勝
おそらく機械学習の分野の中でも1番シンプル
この分野を難しく解説してる本もあるけど
想像以上にめちゃくちゃシンプルだよ
大学で物理や数学やってた人からするとめちゃ簡単に感じる
この簡単な仕組みで世界を変えたのは本当に凄いとしか言いようがない

2021/10/22(金) 05:42:14.16

日本人のai本は必ず数式展開がある印象

2021/10/25(月) 09:59:55.92

数学の行列もいじれない人は既存のソフトウェアで十分。

2021/10/25(月) 10:21:03.07

要らないよね

2021/10/25(月) 11:31:53.12

人材としてね

2021/10/25(月) 16:40:33.32

ツール化が進んだので結果的に数式はいらなくなっている
新しい分野に適応するのはほぼ不可能だろうな
先行事例があるものだけがうまく行く可能性がある
それでも条件が違うとうまく行かないだろうが

2021/10/25(月) 17:57:52.78

今のAIってかなり雑な処理してるように思えるんだけど
生体もそんな感じだから良いのだろうか

こんな雑にやってたらじきに頭打ち来るよね？
gpt3やらtransformerベースのcv見てるとそう思う

2021/10/25(月) 21:44:10.30

＞　お前は毎朝起きるたびに俺に負けたことを思い出すよ＾＾

あー、ホンッとに思い出すなあ（笑）
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い！」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君！

クソチョンｗ

2021/10/26(火) 18:45:50.36

クジラ飛行机の『PythonによるAI・機械学習・深層学習アプリのつくり方』という本を読んでいるのですが、はがきの郵便番号の枠の抽出処理が
原始的すぎるので驚いています。

抽出領域のサイズを大きすぎたり小さすぎたりしないようにしていたり、抽出した輪郭同士が近すぎるのは駄目とか細かなルールを
コーディングしています。

機械学習って、あまり楽しいもんじゃないですね。

2021/10/26(火) 18:47:04.79

>>118
それは例だろ。。。

2021/10/26(火) 18:47:18.21

本当に必要に迫られている人とか仕事でやっている人なら、一生懸命やるかもしれませんが、そうでない人のモチベーションってなんですか？

苦行でしかないような気がします。

2021/10/26(火) 18:59:31.24

>>120
そうなんだ。。。

2021/10/26(火) 19:03:21.27

それは機械学習ではなくて前処理だ
前処理は苦行であるが必要なのだ

ちなみ、本を読んでないからなんとも言えないところがあるけど、おそらくもっとスマートに抽出する方法はある。
機械学習のエキスパートだからといって
画像処理のエキスパートとは限らない

あとソフト屋さんはソフトでなんとか
しようとするけど、照明とかカメラとか
ハードを工夫することも大事