X



【統計分析】機械学習・データマイニング31

■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん (ワッチョイ 7b10-4VFp [114.163.141.1])
垢版 |
2021/09/26(日) 01:32:46.82ID:fnXwjiVa0
!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
↑すれたてる毎に1つずつ減るので、減ってたら3回に増やしてたてること。

機械学習とデータマイニングについて語れ若人

*機械学習に意識・知能は存在しません。
  人の意識に触れたい方はスレ違いです。

■前スレ
【統計分析】機械学習・データマイニング29
https://mevius.5ch.net/test/read.cgi/tech/1597882603/
-EOF-
【統計分析】機械学習・データマイニング30
https://mevius.5ch.net/test/read.cgi/tech/1609459855/
VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured
0007デフォルトの名無しさん (ワッチョイ a255-7j45 [59.147.205.222])
垢版 |
2021/09/29(水) 18:55:13.15ID:LXQaHKgJ0
コンペって気軽にゲーム感覚で参加できるようなものですか?

プログラミングコンテストの問題を解くような気軽な感覚で参加できますか?
0010デフォルトの名無しさん (ワッチョイ 4710-zD50 [118.1.13.140])
垢版 |
2021/09/30(木) 21:20:34.36ID:LzQNN1mS0
AGI開発 明らかになった3つの課題

@脳神経科学とソフトウェア開発の両方に精通した人材が少なく、その育成が困難

A脳全体をカバーする神経科学知見は膨大であり、個人の認知能力に頼って脳全体の機能を統合したソフトウェアを設計することには無理がある

B脳の認知機能をソフトウェアに適切に反映させるためには、参照する脳の記述粒度を適切に選択する必要がある
0011デフォルトの名無しさん (ワッチョイ 4710-zD50 [118.1.13.140])
垢版 |
2021/09/30(木) 21:21:01.10ID:LzQNN1mS0
今回山川と高橋らは、脳型AGI開発を
"脳参照アーキテクチャ(BRA)を共同で描く設計作業"と、
"BRAに基づいてソフトウェアの実装と統合を行う開発作業"
に分けることによる「BRA駆動開発方法論」を提案

「BRA」は、脳型ソフトウェアの仕様情報として標準化されたデータ形式で、
主に解剖学的構造を記述した「脳情報フロー(BIF)」形式のデータと、それに付随する「仮説的コンポーネント図(HCD)」で構成されている

まず神経科学の論文やデータを収集、整理してBIFを作成。
BIFは、脳内におけるさまざまな粒度の「サーキット」をノードとし、それらの間の軸索投射にあたる「コネクション」をリンクとする有向グラフだ。

─必ずしも脳を深く理解していない開発者であっても、HCDを仕様として参照することで、脳型ソフトウェアの実装に携われるようになる。
─作成されたソフトウェアの生物学的妥当性は、その構造と動作がBRAと一致しているかどうかによって評価され、
BRA自体の信憑性は、神経科学的知見の裏付けによって評価される
0018デフォルトの名無しさん (ワッチョイ cf10-c8Z6 [153.243.53.4])
垢版 |
2021/10/01(金) 19:34:49.19ID:lQL5Va8g0
>>16
脳でもbackpropが行われているのではないかと言った論文が出ていたと思う
0022デフォルトの名無しさん (オッペケ Sr77-c8Z6 [126.161.99.23])
垢版 |
2021/10/02(土) 11:08:59.79ID:uacjIgMDr
>>18 は「こういう論文がある」と言っただけで正しさには言及してないが
0024デフォルトの名無しさん (ブーイモ MM7f-PTyk [163.49.202.110])
垢版 |
2021/10/02(土) 13:21:22.44ID:y2EY2XxLM
在日朝鮮人
0025デフォルトの名無しさん (エムゾネ FF5f-jOtc [49.106.187.122])
垢版 |
2021/10/02(土) 14:16:19.44ID:yFRwYWliF
>>13
それな

脳をコピー(劣化コピー)しても脳以上の性能は期待出来ないよな
せいぜい疲れずに死ぬまでこきつかえるかも知れないが
どうせ脳のコピーだからやっぱり寝ないといかんだろうし
0029デフォルトの名無しさん (ワッチョイ cf10-J7Q7 [153.131.102.129])
垢版 |
2021/10/02(土) 20:07:43.97ID:UdlqgpCg0
睡眠中に短期記憶の領域から長期記憶の領域に移されるとか
アルツハイマーの原因タンパク質を排出するとか
言われている

睡眠中は無防備になるのにそれでも必要なんだから何らかの機能や役割があるんだろうな
0030デフォルトの名無しさん (ブーイモ MM7f-PTyk [163.49.202.189])
垢版 |
2021/10/02(土) 23:19:18.80ID:zWqv5K6jM
クソチョンw
0032デフォルトの名無しさん (ワッチョイ 9310-2jfQ [118.1.13.140])
垢版 |
2021/10/03(日) 12:56:18.91ID:5gxQKpTk0
Googleがやっとショウジョウバエの半脳規模のコネクトーム解析に成功したところ

最高解像度のショウジョウバエの脳接続マップ、Googleが公開
https://www.gizmodo.jp/2020/01/fruit-fly-brain-map.html
ハエの脳神経回路の高解像度マップ、グーグル、HHMI研究者らが発表
https://www.technologyreview.jp/nl/this-map-of-a-flys-brain-connectivity-is-the-best-weve-ever-seen/
0033デフォルトの名無しさん (ワッチョイ 9310-2jfQ [118.1.13.140])
垢版 |
2021/10/03(日) 12:57:43.81ID:5gxQKpTk0
>ショウジョウバエの脳のニューロン数は約10万であるのに対し、ヒトの脳には約860億個のニューロンがある

ショウジョウバエでも未だにこの程度なのに、ヒト脳の完全解析なんて無理よ
富岳も、全脳シミュレーションにはまだ計算能力が足りない
0040デフォルトの名無しさん (ワッチョイ cf10-eQG6 [153.243.53.4])
垢版 |
2021/10/04(月) 12:00:10.56ID:uwgJa6dm0
ファインチューニング⊂転移学習
0041デフォルトの名無しさん (ワッチョイ 3fe4-puhv [61.114.68.38])
垢版 |
2021/10/04(月) 12:24:33.93ID:NQkhcE1O0
>>39
俺もそこはイマイチだったけど、目的が違うんだと理解してる

ファインチューニングは、その名の通り微調整
公開された学習済みモデルの、出力層付近の重みを自分の(または新たな)データセットで学習させて適応させるとかで、ファインチューニングの前後でモデル全体の目的は変わらない

転移学習は、モデルをそのまま別の目的へ使用すること
例えばよくある例だと画像認識モデルを特徴抽出器としてSVMに流し込んで、分類させるのに使うとか
転移学習の前後では全体の目的は変わる(例では画像認識→画像分類)
0045デフォルトの名無しさん (ワッチョイ 73fb-uTfP [92.203.11.83])
垢版 |
2021/10/09(土) 16:11:35.50ID:R9jtZdzp0
機械学習において概念の獲得というのは可能なのでしょうか?

例えば犬種を見分けるモデルを作成する中で大きさという概念を獲得させ、その結果を転用して大きさから車種を判別するといったことは可能でしょうか?
0047デフォルトの名無しさん (アウアウウー Sab7-8nkb [106.128.116.15])
垢版 |
2021/10/09(土) 17:12:37.82ID:AqE3enYfa
どこかのパラメータが大きさを認識するかもしれないけどそれを全く別の種類のものに適用したければ
どのパラメータが大きさを認識するか調べて抽出して新たなモデルを人間が作成するしかない
大きさという概念をプログラムが知らない前提なんだから人間が調べて取り出す必要がある
0048デフォルトの名無しさん (ワッチョイ 73fb-uTfP [92.203.11.83])
垢版 |
2021/10/09(土) 17:55:12.92ID:R9jtZdzp0
>>47
やはり現状では人間の手が必要ですよね。

特定の概念に特化したモデルを予め作成し転用することは可能でしょうか?

例えば画像情報から大きさを判別するモデルを作成し、この大きさ判別モデルをモジュールとして別のモデルに組み込んで使うという形です。
0054デフォルトの名無しさん (ワッチョイ 73fb-uTfP [92.203.11.83])
垢版 |
2021/10/11(月) 23:03:29.37ID:iNvGL8qd0
>>53
記事を見つけて読んでみましたが面白いですね。
ttps://ainow.ai/2021/04/26/253364/

時間や場所の概念を獲得した(テキストに正しく反応できた)だとか、当初の目的以外の用途に使えたというのは実に興味深いです。

120億パラメータというのがこれまた凄まじいですが、特定の概念に関する部分だけ抽出出来たら宝探しみたいで楽しいでしょうね。
0055デフォルトの名無しさん (ワッチョイ 2ffd-36a8 [210.236.126.224])
垢版 |
2021/10/12(火) 21:36:26.65ID:llg6th+00
入門書読んでる途中で練習がてらUCIからEnergy efficiencyってデータセットひっぱてきたんだけど
すごく素直なデータセットだな。欠損値ないし、ただ単に重回帰分析しただけで決定係数が0.9越えてた
ここまで素直だとなにか罠があるんじゃないかと不安になる。諸先輩方はどう思います?
0057デフォルトの名無しさん (ワッチョイ 2ffd-36a8 [210.236.126.224])
垢版 |
2021/10/13(水) 00:10:46.35ID:JsCrEKeM0
>>56
その可能性を考えて、訓練データとテストデータ両方の
決定係数を見てるんですけどそんな差がないんですよね。
データ分ける時にシード固定せずに40回ほど試したんですけど
決定係数の差は、大きくても0.043、もとのデータも768件あるんで
過学習なんでしょうか?
0058デフォルトの名無しさん (アウアウウー Sab7-Awko [106.161.246.212])
垢版 |
2021/10/13(水) 05:53:18.70ID:5xUxuv4Ba
>>57
ちゃんとクロスバリデーションすべきだなとか思ったけど
0059デフォルトの名無しさん (アウアウウー Sab7-Awko [106.161.246.212])
垢版 |
2021/10/13(水) 06:07:06.10ID:5xUxuv4Ba
ごめん途中で書き込んじゃった

自明な予測との比較はどうなんだろとか思ったけどよく読むと予測精度じゃなくて決定係数の話ですね。
決定係数って学習データへの当てはまりの指標じゃなかったかな。学習データの分散のどの程度を説明できてるかですね確か。
訓練とテストに分割する意味がよく分からないなと思いました。
006157 (ワッチョイ 2ffd-36a8 [210.236.126.224])
垢版 |
2021/10/13(水) 21:58:48.95ID:JsCrEKeM0
先輩方ありがとうございます。次にやることが見えてきました。

追伸、IP出るスレは苦手なのでこれにて失礼します。スレ汚し失礼しました。
0063デフォルトの名無しさん (アウアウウー Sab7-Awko [106.161.248.235])
垢版 |
2021/10/14(木) 01:34:54.45ID:oiazgOwIa
>>61
勉強が足りてないですが自覚したなら努力を継続できるでしょう。
頑張って
0064デフォルトの名無しさん (ワッチョイ 9f55-twAR [59.147.205.222])
垢版 |
2021/10/15(金) 11:35:14.97ID:n9WPu0Ca0
新しい資本主義会議メンバーに松尾豊さんが選ばれましたね。
0065デフォルトの名無しさん (ワッチョイ 9f55-twAR [59.147.205.222])
垢版 |
2021/10/15(金) 11:41:30.88ID:n9WPu0Ca0
松尾豊さんのことをAIの第1人者と紹介していましたが、本当ですか?
0068デフォルトの名無しさん (ワッチョイ 9f55-twAR [59.147.205.222])
垢版 |
2021/10/15(金) 14:44:03.12ID:n9WPu0Ca0
松尾豊さんは、論文を書いていますか?
0071デフォルトの名無しさん (ワッチョイ ff10-T3Zk [153.243.53.4])
垢版 |
2021/10/15(金) 21:08:40.11ID:WRM45+d50
大学教授は学生に書かせて添削するのが仕事でしょ
0075デフォルトの名無しさん (ワッチョイ 775f-Kp2r [106.73.78.34])
垢版 |
2021/10/15(金) 21:28:31.52ID:NWwEDSp30
>>73
日本語で書いてくれ
0092デフォルトの名無しさん (ブーイモ MMfb-GVjw [210.138.179.7])
垢版 |
2021/10/17(日) 17:37:38.26ID:kbVq19blM
> お前は毎朝起きるたびに俺に負けたことを思い出すよ^^

あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!

クソチョンw
0093デフォルトの名無しさん (ワッチョイ 775f-Kp2r [106.73.78.34])
垢版 |
2021/10/18(月) 15:52:55.77ID:EmDGqAJL0
情報系じゃなくて実験系の出身だから論文読むのも大変だわ
機械学習が必要になってPytorchやTensorFlow使ってるんだけど、
自分がやってることと言えば論文軽く読んでGitHubからコード落として、ネットワークを目的に応じて修正し自分のデータに適用してるだけ
詳細なアルゴリズムはよく理解できてないことも多い
全く新しいモデルを提案する人達はすごいなと感じます
0094デフォルトの名無しさん (ワッチョイ 97fb-/6z9 [92.203.11.83])
垢版 |
2021/10/18(月) 16:00:54.53ID:nRAR4WNG0
>>93
同分野でも原理か応用かでやってることは全く違いますからね。

原理を知っておいて損はありませんが、応用で一番大事なのは対象となる事象の理解なんて言われるくらいですし。

パソコンを使って何かを創る人とパソコンの仕組みを研究してる人って感じですね。

特定分野の一技術がこれだけ広く利用されている現状はなにげにすごいことです。
0096デフォルトの名無しさん (エムゾネ FFbf-mxW8 [49.106.193.217])
垢版 |
2021/10/18(月) 17:04:01.15ID:r9t2S6+pF
特徴によってスケールが違うから正規化するんだろ
0099デフォルトの名無しさん (ワッチョイ 97fb-/6z9 [92.203.11.83])
垢版 |
2021/10/18(月) 18:32:58.29ID:nRAR4WNG0
>>98
データを歪めてるというよりも、異る値を公平に比較するために揃えてる感じですね。

正規化は単体のデータではなくデータの集合に対して行いますので、単体の値が変化しても集合内のデータ間の関係(例えば距離の比)は保たれます。

手法が見ているのがこの生の値なのか関係なのかが問題で、生の値をそのまま使う場面はかなり稀だと思います。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況