X



【統計分析】機械学習・データマイニング30
■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん (ワッチョイ db01-G7ci [60.86.178.93])
垢版 |
2021/01/01(金) 09:10:55.46ID:a+OQlEaa0
!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
↑すれたてる毎に1つずつ減るので、減ってたら3回に増やしてたてること。

機械学習とデータマイニングについて語れ若人

*機械学習に意識・知能は存在しません。
  人の意識に触れたい方はスレ違いです。

■前スレ
【統計分析】機械学習・データマイニング29
https://mevius.5ch.net/test/read.cgi/tech/1597882603/
-EOF-
VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured
0412デフォルトの名無しさん (ワッチョイ eb10-hmOq [153.131.102.129])
垢版 |
2021/04/18(日) 23:21:52.89ID:m+SV1W/C0
量子論の不確定原理なら人間の主観とか関係なく不確定なんじゃね?
不確定だとしても確率的には値の差があるだろうから9割はこの範囲の値とか決まるだろうな
どんな外れ値でも確率ゼロではないから絶対に間違いとは言えないけど観測される頻度は稀になるはず
それよりも大きな頻度で観測されたら仮説の方が間違いなのは変わらない
0413デフォルトの名無しさん (ワッチョイ 095f-CoNo [106.73.78.34])
垢版 |
2021/04/18(日) 23:35:52.79ID:yp3ki8fH0
>>412
主観入りまくってますがなw
0415デフォルトの名無しさん (ワッチョイ eb10-Zgro [153.243.53.4])
垢版 |
2021/04/19(月) 00:49:42.58ID:Y2i4yGVV0
>>412
現象を説明する為にモデルを当てはめる時点で主観入ってる
0417デフォルトの名無しさん (テテンテンテン MM8b-E5dH [133.106.36.180])
垢版 |
2021/04/19(月) 09:31:02.90ID:QmRvPrb/M
>>416
誰の言葉?
0421デフォルトの名無しさん (ワッチョイ 9b89-1iXq [39.111.228.181])
垢版 |
2021/04/19(月) 11:20:30.03ID:vPt4CmiJ0
スレタイ読めないやつと比べてどっちが頭が悪いの?
0423デフォルトの名無しさん (ワッチョイ 9b89-1iXq [39.111.228.181])
垢版 |
2021/04/19(月) 14:37:35.07ID:vPt4CmiJ0
>>422
どう関係するの?
0426デフォルトの名無しさん (ワッチョイ eb10-hmOq [153.131.102.129])
垢版 |
2021/04/19(月) 20:34:22.39ID:GRSFwPvE0
人間が考えるなら主観が入り込むというなら全てに主観が入り込むことになる
つまり主観という点では差がない

出てくる成果には現実を上手く説明できるかどうかの差が生じる
より現実を説明できる成果は単なる個人の固定観念とは違う価値のあるもの
現実と合致する程度が高い成果は一個人の主観とは言えない程に質が変わる
0432デフォルトの名無しさん (ワッチョイ 21e6-E5dH [14.3.167.89])
垢版 |
2021/04/20(火) 08:55:31.90ID:XU4ld2UL0
>>429
どこのシステム?
0434デフォルトの名無しさん (ワントンキン MM53-Ct+I [153.248.160.56])
垢版 |
2021/04/20(火) 09:49:15.80ID:JWX72o4+M
データの仕事するなら数学よりコンサル力が重要
もしくはWeb分析や製造管理などドメイン知識を学んで特化するかだな
技術系でいきたいならクラウド使って基盤から自分で作れるようになれば引く手数多
最適化エンジニアは自動化されて終わるよ
0435デフォルトの名無しさん (ワッチョイ 095f-CoNo [106.73.78.34])
垢版 |
2021/04/20(火) 11:59:17.59ID:pbjOZaIB0
メーカー研究開発やってるけど機械学習に対する敷居はここ数年で大きく下がったね
GUIツールなら実験系の人でも普通に使ってるし
データサイエンスに加えて、それ以外の専門を持たないと厳しいね
0437デフォルトの名無しさん (ワッチョイ 21e6-E5dH [14.3.167.89])
垢版 |
2021/04/20(火) 18:27:49.71ID:XU4ld2UL0
>>436
特殊なシステムか。。。
ソニーの奴辺りを使ってるかと思った
0438デフォルトの名無しさん (ワッチョイ b302-ashK [101.140.211.220])
垢版 |
2021/04/20(火) 22:42:35.89ID:PyHebxw60
>>435
というか、専門分野を持たない統計屋が成り立ってる現状が疑問
数学をさらに極めているアクチュアリーでさえ、金融工学等でスキル補強してる
0439デフォルトの名無しさん (ワッチョイ 095f-CoNo [106.73.78.34])
垢版 |
2021/04/20(火) 22:59:27.20ID:pbjOZaIB0
だからデータサイエンス学部とかちょっと心配になるね。
0440デフォルトの名無しさん (ワッチョイ eb10-hmOq [153.131.102.129])
垢版 |
2021/04/20(火) 23:09:28.18ID:RpmUT2UU0
データから突き詰めていけば
その領域の構造も見えてくるんじゃないの?

予備知識として知っておいた方が良いけど
先入観とか思い込みで新たな発見を阻害しているかも
0441デフォルトの名無しさん (ワッチョイ eb10-/Mlu [153.243.53.4])
垢版 |
2021/04/20(火) 23:58:44.60ID:KfvQjl/O0
データから突き詰めて、分かった事実の99%は、その領域の人間にとって、何を今さらって言うレベルの常識なのが現実
0442デフォルトの名無しさん (ワッチョイ eb10-hmOq [153.131.102.129])
垢版 |
2021/04/21(水) 00:26:38.44ID:pJR1O2/f0
それでも需要があるのは何故?
0449デフォルトの名無しさん (ワッチョイ 21e6-E5dH [14.3.167.89])
垢版 |
2021/04/21(水) 18:06:22.19ID:qv/v785L0
基礎だけ教えるだけでしょ
あとはpythonかrあたりを習わせて
0450デフォルトの名無しさん (ワッチョイ eb10-Y48T [153.131.102.129])
垢版 |
2021/04/21(水) 20:54:12.98ID:pJR1O2/f0
リコメンドとかは個人毎に人がやるのは作業時間的にむりなんじゃね?
作業時間は人件費、コストになる
売上アップ分より少ないコストで実現できれば投資する価値がある
0451デフォルトの名無しさん (ワッチョイ eb10-Y48T [153.131.102.129])
垢版 |
2021/04/21(水) 21:00:23.59ID:pJR1O2/f0
当たり前と思われている事も
具体的にどの顧客やケースに適用できるかは
勘でしかわからなかっただろうから
担当者毎に違う判断をすることになる

ある担当者は知見を使えると考えるけど
別の担当者は知見を使えると考えない
その知見が明確に認識されていなければ組織内で共有もされていないだろうから
経験の浅い担当者はその知見があることすら認識していない

知見を可視化する事は共有可能になるし
組織全体の成果の底上げにつながる
0453デフォルトの名無しさん (テテンテンテン MM8b-Ct+I [133.106.136.89])
垢版 |
2021/04/21(水) 21:58:18.31ID:4ieWnGe7M
解くべき問題を探し回って捻り出さなきゃいけない時点で相当なハンデなんだよな
普通のソフトエンジニアリングだったら、解くべき問題なんてそこら辺の事務のおばちゃんに聞けばいくらでも出てくるだろう
逆に言えば解くべき問題を見つけられる人間に希少価値があるとも言えて、だからコンサルの飯の種としては最適だ
一方で解く側の人間にとってはパイの小さな分野だと言える
0454デフォルトの名無しさん (ワッチョイ eb10-Y48T [153.131.102.129])
垢版 |
2021/04/21(水) 22:49:45.31ID:pJR1O2/f0
今の世界中の課題は新型コロナ
データサイエンスで何ができるか
0455デフォルトの名無しさん (ワッチョイ eb10-Y48T [153.131.102.129])
垢版 |
2021/04/21(水) 22:51:36.83ID:pJR1O2/f0
少し前に目の結膜か何かをカメラで撮ると感染しているか判別するAIアプリのニュースがあったな
役に立つのか知らんけど
0456デフォルトの名無しさん (ワッチョイ eb10-Y48T [153.131.102.129])
垢版 |
2021/04/21(水) 22:55:35.42ID:pJR1O2/f0
ガンとか他の病気も早期発見できたら役に立つと思うけどな
トイレの便器にセンサーつけて異常検知するとか言うニュースもあったな

コロナ禍でストレスかかってる人が増えているとかも聞くし
早く検知して対処できたら良いんじゃね?
0457デフォルトの名無しさん (ワッチョイ 3197-ZzAP [182.171.246.142])
垢版 |
2021/04/21(水) 23:33:54.27ID:AHvTeMJC0
普通のソフトエンジニアリングでも、データドリブンな開発というのはこれから重要になっていくと思うけどな。
その辺のおばちゃんが言ってることをデータを収集して分析して、本当なら改善すればいいし単に特殊例でそうなっただけならスルーすればいいし。
定性的な開発で済む場合もあるけど、定量的な開発ができることで業務改善できる分野はいっぱいあると思うよ。少しでもそういう見方で意味論をある意味捨象して数値で評価しようとする立場の人間が増えることはいいことだと思うけどな。
まあ、数値の評価ってのはいかようにも出せるので、文系的な議論がしっかりなされた上で数値的な評価で裏付ける、というのがよいと思うけれど。
0459デフォルトの名無しさん (ワッチョイ eb10-Y48T [153.131.102.129])
垢版 |
2021/04/22(木) 08:38:37.02ID:iKwCvStp0
ソフトウェアエンジニアリングとかソフトウェア工学って
ソフトウェアを作るときにバグをどうやったら少なくできるかとか
生産性を上げるにはどうするかとかそう言う分野のことを指すんじゃね?

ソフトウェア事業とかソフトウェアビジネスって言った方が良い
0460デフォルトの名無しさん (テテンテンテン MM8b-E5dH [133.106.35.132])
垢版 |
2021/04/22(木) 08:57:06.72ID:M8v84iKOM
>>459
正解
0462デフォルトの名無しさん (ワッチョイ b302-ashK [101.140.211.220])
垢版 |
2021/04/22(木) 14:18:43.57ID:CDCM7CdZ0
>>454
むしろ、コロナ騒動でデータサイエンティストの無力を実感

・国や地域によって患者・重傷者・死者のカウント基準が異なる
・陽性と判定するCt値も同様に定まっていない
・PCR検査以外の感染者の検出方法ほぼ全てで擬陽性が多分に含まれる手段を用いている

データとしてゴミだらけで統計以前。
これらに問題提起をして的外れな対策に意見すべきであった
0470デフォルトの名無しさん (ワッチョイ 6fe6-zZYr [14.3.167.89])
垢版 |
2021/04/23(金) 18:44:22.53ID:rBK2myaR0
>>469
候補を出すだけならいらないんじゃない?
0474デフォルトの名無しさん (ワッチョイ c702-/alk [101.140.211.220])
垢版 |
2021/04/24(土) 18:30:45.31ID:kEsviUBS0
製薬やマテリアルは自然界の物質をそのまま変数として使えるから、さほど難しくないテーマ
世の中の大多数のテーマは変数の生成から始めないといけない
0476デフォルトの名無しさん (スッップ Sdaf-R9kE [49.98.149.9])
垢版 |
2021/04/24(土) 19:24:54.82ID:aBat7e4Id
マテリアルもいい記述子見つけるの大変だよ
0477デフォルトの名無しさん (ワッチョイ cff3-Iq6q [220.211.225.116])
垢版 |
2021/04/25(日) 12:26:44.89ID:0okbEX8U0
ワクチン開発でDNNを活用するというのは異常に難易度が高いよ。
例えば、コロナウィルスの場合、COVIDウィルスのスパイクのタンパク質配列とかを
学習データに使用するけど、普通は、この種のウィルス特有のデータを10種類以上
選択する必要がある。このデータ選択は、ウィルスの専門知識がないと無理。
状況によっては公開データが用意されていない場合もあるので、その場合は、
研究室でタンパク質配列とかRNA配列とかを解読する作業も必要となってくる。
さらに、DNNに関しても、既存のネットワークを流用することはできないので、
新規にネットワークのアルゴリズムを作る必要もある。この作業は、普通のAI
エンジニアでは無理。更に、機械学習に関してもかなり膨大なGPUリソースが
必要となる。また、専用のネットワークは動かしてみた上で修正を入れるという
作業が発生するため、TPUv3x1024くらいのリソースを開発期間の数ヶ月に渡って、
占有するという状況が発生する。開発要員としてはウイルス学、AIの各領域のポスドク
クラスの専門研究者を10人くらい集めて、さらにクラウド費用として数億円くらいアサイン
する必要があるかもね。まあ、これはほとんど不可能な要件なんだけどね。
0478デフォルトの名無しさん (ワッチョイ f75f-R9kE [106.73.78.34])
垢版 |
2021/04/25(日) 16:03:32.73ID:A9tbQoo40
>>477
十年前からきたのかな?
0479デフォルトの名無しさん (アウアウウー Sa47-yxcN [106.154.0.13])
垢版 |
2021/04/25(日) 16:35:58.53ID:lzmMLOISa
>>477
去年効果のありそうな物質の候補をリストアップしたニュースがあったな

それになんでもDNNを使わなくて良いし
0480デフォルトの名無しさん (ワッチョイ c301-Im0W [220.56.102.222])
垢版 |
2021/04/27(火) 21:39:48.80ID:SgCXWhD40
東大卒 旧通産省・工業技術院の元院長・飯塚幸三
「ブレーキを踏んだが、車が加速した」

流石高学歴で上に行った奴だな
この程度の嘘を平気でつけるのがこのクラス
AIで犯罪を起こしそうな率を検出させてみると
政治家とか企業のトップとか軒並み率が高そうだけど
末端労働者程率が低かったりして
犯罪者が作ったルールに一般市民が従っているっていう
0481デフォルトの名無しさん (ワッチョイ c301-Im0W [220.56.102.222])
垢版 |
2021/04/27(火) 21:55:07.22ID:SgCXWhD40
菅義偉の詳細データ入れると
99.9%とか出るんだけど
菅総理だけ表向きの事情で0%にしないといけないっていう
そんなチューニングがメンドクサそう
特別なチューニングを何個もやってるうちにおかしなシステムになって
最終的に末端が叩かれて
一般人が犯罪者になるっていう
0482デフォルトの名無しさん (ワッチョイ 6f89-8KU9 [39.111.228.181])
垢版 |
2021/04/27(火) 22:26:18.40ID:drc3/kck0
馬鹿参上
0483デフォルトの名無しさん (ワッチョイ df10-6Okr [153.243.53.4])
垢版 |
2021/04/28(水) 00:01:36.86ID:kjLpBedQ0
頭にアルミホイル巻いとけ
0486デフォルトの名無しさん (ワッチョイ 49e6-m6wT [14.3.167.89])
垢版 |
2021/05/02(日) 11:16:21.40ID:N4VRd0iX0
>>1
sdgと言われるとsgdと空目する
0487デフォルトの名無しさん (ワッチョイ 2901-TNk6 [126.242.255.174])
垢版 |
2021/05/02(日) 17:25:15.38ID:liMkj8Q90
あわしろ氏は、AIはベイズ推論だけで十分だって言ってたけどね。
0489デフォルトの名無しさん (ワッチョイ 1355-Ew5U [59.147.205.222])
垢版 |
2021/05/02(日) 18:11:39.92ID:JG6YyYGw0
ビショップの本を買ったのですが、積読状態です。
気合入れて読む価値はありますか?
0490デフォルトの名無しさん (ワッチョイ 1355-Ew5U [59.147.205.222])
垢版 |
2021/05/02(日) 18:13:31.90ID:JG6YyYGw0
フィールズ賞受賞者のD. マンフォードらのパターン認識の本が全く話題になりませんが、あの本はどういう位置づけの本なのでしょうか?
0491デフォルトの名無しさん (ワッチョイ 49e6-m6wT [14.3.167.89])
垢版 |
2021/05/02(日) 19:10:03.88ID:N4VRd0iX0
基礎
0492デフォルトの名無しさん (ワッチョイ 2901-TNk6 [126.242.255.174])
垢版 |
2021/05/02(日) 20:33:26.36ID:liMkj8Q90
一般教養。
0494デフォルトの名無しさん (ワッチョイ 49e6-m6wT [14.3.167.89])
垢版 |
2021/05/03(月) 07:36:08.52ID:k1jvROw50
>>487
誰?
0495デフォルトの名無しさん (ワッチョイ 2901-TNk6 [126.242.255.174])
垢版 |
2021/05/03(月) 08:09:03.39ID:s03MGASG0
IT業界に居て知らないことは無いだろ。
0497デフォルトの名無しさん (ワッチョイ 115f-Cc6k [106.73.78.34])
垢版 |
2021/05/03(月) 08:24:08.67ID:sjGHdyBX0
俺も知らん
俺が好きなのはあんどりゆー先生
0498デフォルトの名無しさん (ワッチョイ 2901-TNk6 [126.242.255.174])
垢版 |
2021/05/03(月) 08:56:18.97ID:s03MGASG0
だからお前らは駄目なんだよ。
0501デフォルトの名無しさん (ワッチョイ 115f-Cc6k [106.73.78.34])
垢版 |
2021/05/05(水) 16:21:28.27ID:YD9wgWX/0
colab pro使ってる人いる?
0502デフォルトの名無しさん (ワッチョイ b163-D0wr [122.24.13.95])
垢版 |
2021/05/06(木) 11:59:48.85ID:9ulEY78a0
Colab pro日本からも契約できるようになったんだよな
0503デフォルトの名無しさん (ワッチョイ 115f-Cc6k [106.73.78.34])
垢版 |
2021/05/06(木) 13:39:08.91ID:3t4KZ2ob0
月1000円ちょっとだから家で機械学習で遊ぶのにいいかなと思って
0505デフォルトの名無しさん (ワッチョイ ee73-dxvU [153.200.72.220])
垢版 |
2021/05/12(水) 11:00:45.44ID:lwPC+Em40
我勉強中なんだけど、
「RMSE(平均平方二乗誤差)を使い求まる解は、誤差が正規分布に従うという前提の下で求まる最尤解と同じになる」

これってどういう意味?
0508デフォルトの名無しさん (ワッチョイ ee73-7ir8 [153.200.72.220])
垢版 |
2021/05/13(木) 09:33:19.17ID:LL50QdoW0
>>506
THX!
やってみるわ
0511デフォルトの名無しさん (ワッチョイ d073-gSvD [153.200.72.220])
垢版 |
2021/05/16(日) 18:14:37.34ID:BCvV60Hy0
>>510
マジ!?
本番サーバのバッチでも使える?
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況