!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
↑すれたてる毎に1つずつ減るので、減ってたら3回に増やしてたてること。
機械学習とデータマイニングについて語れ若人
*機械学習に意識・知能は存在しません。
人の意識に触れたい方はスレ違いです。
■前スレ
【統計分析】機械学習・データマイニング29
https://mevius.5ch.net/test/read.cgi/tech/1597882603/
-EOF-
VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured
【統計分析】機械学習・データマイニング30
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん (ワッチョイ db01-G7ci [60.86.178.93])
2021/01/01(金) 09:10:55.46ID:a+OQlEaa0377デフォルトの名無しさん (ワッチョイ 0902-tdH6 [106.166.50.77])
2021/04/17(土) 11:10:35.27ID:7oBh743X0378デフォルトの名無しさん (アウアウウー Sad5-hmOq [106.154.0.128])
2021/04/17(土) 12:00:18.35ID:8ejS6mqaa k-meansとかのクラスタリングで
正常クラスタ群と異常クラスタ群に分けられる?
過去に異常検出した時のデータと正常データを区別できるようにしておいて
クラスタリングを繰り返して上手く正常と異常に分かれるクラスタ数を見つける
新たになデータが各クラスタのどれに属するか判定して
異常クラスタに属したら異常の可能性があるから
調べるとか運用停止するとかの対処をする
正常クラスタ群と異常クラスタ群に分けられる?
過去に異常検出した時のデータと正常データを区別できるようにしておいて
クラスタリングを繰り返して上手く正常と異常に分かれるクラスタ数を見つける
新たになデータが各クラスタのどれに属するか判定して
異常クラスタに属したら異常の可能性があるから
調べるとか運用停止するとかの対処をする
379デフォルトの名無しさん (スププ Sd33-6OPz [49.98.80.40])
2021/04/17(土) 13:21:11.85ID:ohP60UMxd いや、分類ってそれなりの分類の尺度をユーザーが決めるから意味あるんじゃねーの?
機械学習的に分類しても、で?っていう気にしかならんのだが。
機械学習的に分類しても、で?っていう気にしかならんのだが。
380デフォルトの名無しさん (ワッチョイ 0902-tdH6 [106.166.50.77])
2021/04/17(土) 13:27:16.40ID:7oBh743X0381デフォルトの名無しさん (スププ Sd33-6OPz [49.98.80.40])
2021/04/17(土) 13:31:51.20ID:ohP60UMxd ある種の外れ値を認識する方法としては意味ある時もあるか。
主観がどうとか言ってるのは全く的外れにしか思わん。
逆に主観とのある種の一致性を無駄に主張する道具には使われてる印象だが。
主観がどうとか言ってるのは全く的外れにしか思わん。
逆に主観とのある種の一致性を無駄に主張する道具には使われてる印象だが。
382デフォルトの名無しさん (ワッチョイ d1a7-5HvV [124.97.67.135])
2021/04/17(土) 13:45:29.23ID:QU2IYZKl0 外れ値は外れ値だけ正常値は正常値だけ近くなるような距離関数選んで
dbscanにかけろよ
dbscanにかけろよ
383デフォルトの名無しさん (ワッチョイ 0902-tdH6 [106.166.50.77])
2021/04/17(土) 13:51:53.23ID:7oBh743X0 コンドルはワシタカ目(もく)なのかコウノトリ目なのか
とか
フラミンゴはコウノトリ目なのかガンカモ目なのか
とかを骨格とか卵白のアミノ酸配列などに注目したりとか
色々指標を変えて学者が二百年も言い争い続けて、
結局はDNAの塩基配列をクラスター分析したら、
https://ja.wikipedia.org/wiki/%E9%B3%A5%E9%A1%9E#%E7%8F%BE%E7%94%9F%E9%B3%A5%E9%A1%9E%E3%81%AE%E7%9B%AE%E5%88%86%E9%A1%9E
コンドルはコウノトリに近いんだよ〜って20年前の自称鳥類物知りが語ってたのに
結局ワシとかに近い方に入れられてしまった
とか
フラミンゴはコウノトリ目なのかガンカモ目なのか
とかを骨格とか卵白のアミノ酸配列などに注目したりとか
色々指標を変えて学者が二百年も言い争い続けて、
結局はDNAの塩基配列をクラスター分析したら、
https://ja.wikipedia.org/wiki/%E9%B3%A5%E9%A1%9E#%E7%8F%BE%E7%94%9F%E9%B3%A5%E9%A1%9E%E3%81%AE%E7%9B%AE%E5%88%86%E9%A1%9E
コンドルはコウノトリに近いんだよ〜って20年前の自称鳥類物知りが語ってたのに
結局ワシとかに近い方に入れられてしまった
384デフォルトの名無しさん (スププ Sd33-6OPz [49.98.80.40])
2021/04/17(土) 14:41:09.11ID:ohP60UMxd385デフォルトの名無しさん (ワッチョイ 21e6-E5dH [14.3.161.87])
2021/04/17(土) 14:43:54.03ID:dljYNFer0 そう。。。
386デフォルトの名無しさん (ワッチョイ 0902-tdH6 [106.166.50.77])
2021/04/17(土) 15:08:57.10ID:7oBh743X0387デフォルトの名無しさん (ワッチョイ 8101-tdH6 [126.218.244.47])
2021/04/17(土) 15:11:19.78ID:Qe2ZIyvF0 >>384
頭大丈夫か?
頭大丈夫か?
388デフォルトの名無しさん (ワッチョイ 0902-tdH6 [106.166.50.77])
2021/04/17(土) 15:20:42.83ID:7oBh743X0 どのレベルで「客観的な分類なんて要るのか?」
と言いたいんだろうと思ってたが
古典的な哲学寄りの煽りだったのか
と言いたいんだろうと思ってたが
古典的な哲学寄りの煽りだったのか
389デフォルトの名無しさん (バットンキン MM53-V9SR [153.233.255.91])
2021/04/17(土) 15:22:02.38ID:nv8Do3m/M 自分の頭が大丈夫かどうか
それは誰にも分からない
腹が減ったのは分かる
それは誰にも分からない
腹が減ったのは分かる
390デフォルトの名無しさん (ワッチョイ eb10-hmOq [153.131.102.129])
2021/04/17(土) 20:52:47.18ID:v2WFWWWe0 人間の恣意的な分類より
体型的で規則的な分類の方が個人による分類の違いがでないから分類結果の共有に間違いが少ない
体型的で規則的な分類の方が個人による分類の違いがでないから分類結果の共有に間違いが少ない
391デフォルトの名無しさん (ワッチョイ 2901-GJAZ [122.255.141.199])
2021/04/17(土) 22:10:48.61ID:4y7R77pu0 サイボウズ青野社長が目指す「100人100通り」の働き方実現
https://www.nikkan-gendai.com/articles/view/money/228305
初公開! サイボウズの自由すぎる働き方はこんなやり方で管理されていた
https://cybozushiki.cybozu.co.jp/articles/m005338.html
どうしてサイボウズは、働き方を変えられた?
「時間」と「場所」の制約がない多様な働き方
https://toyokeizai.net/articles/-/17941
サイボウズの働き方改革事例(前編)
「働き方の多様化」へ、その歩みはトップの覚悟からはじまった
https://ws.zxy.work/case/171/
サイボウズの働き方改革 〜働き方の多様性がチームワークあふれる会社を創る〜
https://jinjibu.jp/article/detl/eventreport/2172/
サイボウズはなぜ自由な働き方ができる? ーインターンが見た裏側には、ツールと情報共有があったー
https://www.wantedly.com/companies/cybozu/post_articles/311667
働き方先進企業が警告「パワハラ的な日本企業は在宅勤務で沈む」
https://business.nikkei.com/atcl/gen/19/00189/092800012/
「働き方を自分で選ぶ」時代へ。その多様性が責任になり、パフォーマンス向上につながる。
https://www.nice2meet.us/talk-cybozu-hr.html
https://www.nikkan-gendai.com/articles/view/money/228305
初公開! サイボウズの自由すぎる働き方はこんなやり方で管理されていた
https://cybozushiki.cybozu.co.jp/articles/m005338.html
どうしてサイボウズは、働き方を変えられた?
「時間」と「場所」の制約がない多様な働き方
https://toyokeizai.net/articles/-/17941
サイボウズの働き方改革事例(前編)
「働き方の多様化」へ、その歩みはトップの覚悟からはじまった
https://ws.zxy.work/case/171/
サイボウズの働き方改革 〜働き方の多様性がチームワークあふれる会社を創る〜
https://jinjibu.jp/article/detl/eventreport/2172/
サイボウズはなぜ自由な働き方ができる? ーインターンが見た裏側には、ツールと情報共有があったー
https://www.wantedly.com/companies/cybozu/post_articles/311667
働き方先進企業が警告「パワハラ的な日本企業は在宅勤務で沈む」
https://business.nikkei.com/atcl/gen/19/00189/092800012/
「働き方を自分で選ぶ」時代へ。その多様性が責任になり、パフォーマンス向上につながる。
https://www.nice2meet.us/talk-cybozu-hr.html
392デフォルトの名無しさん (ワッチョイ 0902-tdH6 [106.166.50.77])
2021/04/17(土) 23:03:07.99ID:7oBh743X0393デフォルトの名無しさん (アウアウウー Sad5-9UsI [106.128.114.6])
2021/04/18(日) 01:15:06.95ID:oEMklD2xa 機械学習で分類するには分類基準をまず人間が与える必要がある訳でそれを客観的と言えるのか
394デフォルトの名無しさん (ワッチョイ 8101-6OPz [126.25.168.179])
2021/04/18(日) 03:01:48.20ID:/yrt+WGh0 客観的である必要はない。
人間にとって分類しやすいかどうかのがよっぽど意味があるというのに。。
分類をなんのために行うのかさえわかってないでk-meansで出ましたとか言ってるバカは
機械学習とかやめてほしいわ。印象を悪くする。
人間にとって分類しやすいかどうかのがよっぽど意味があるというのに。。
分類をなんのために行うのかさえわかってないでk-meansで出ましたとか言ってるバカは
機械学習とかやめてほしいわ。印象を悪くする。
396デフォルトの名無しさん (ワッチョイ 0902-tdH6 [106.166.50.77])
2021/04/18(日) 09:08:11.82ID:lVaCsfaE0 https://qiita.com/futakuchi0117/items/6f444ea1596506fafe5d
x-means法が既にあるね
x-means法が既にあるね
397デフォルトの名無しさん (ワッチョイ eb10-hmOq [153.131.102.129])
2021/04/18(日) 09:46:42.30ID:m+SV1W/C0 >>394
自然科学は自然を理解するモノだから
人間の考えより自然の方が正解
対象によって何が正解かは違ってくる
人間の都合で良いものは人間に合わせたらいいけど
自然科学は自然が正解
実験結果とか実際と差があるなら人間の仮説の方が間違いだから修正する
自然科学は自然を理解するモノだから
人間の考えより自然の方が正解
対象によって何が正解かは違ってくる
人間の都合で良いものは人間に合わせたらいいけど
自然科学は自然が正解
実験結果とか実際と差があるなら人間の仮説の方が間違いだから修正する
398デフォルトの名無しさん (ワッチョイ eb10-hmOq [153.131.102.129])
2021/04/18(日) 09:55:52.80ID:m+SV1W/C0 元のデータ空間のままでk-meansが上手くクラスタリングできない場合は
別の空間に移してからクラスタリングすると良いかもしれない
DNNも入力に近い層で空間を移していると解釈する人もいるし
どんな写像にするかをデータから学習していると考えられる
中間層の出力を使ってクラスタリングすると上手く分けられるようになっているかもしれない
別の空間に移してからクラスタリングすると良いかもしれない
DNNも入力に近い層で空間を移していると解釈する人もいるし
どんな写像にするかをデータから学習していると考えられる
中間層の出力を使ってクラスタリングすると上手く分けられるようになっているかもしれない
399デフォルトの名無しさん (ワッチョイ 095f-CoNo [106.73.78.34])
2021/04/18(日) 11:49:56.96ID:yp3ki8fH0 測定誤差や間違いを多く含むデータを利用し、人間の主観が入った機械学習を利用している時点で…
400デフォルトの名無しさん (ワッチョイ b302-ashK [101.140.211.220])
2021/04/18(日) 13:36:27.79ID:QeEYhUGL0 その測定誤差を低減する上で必要な基礎知識って大学のデータサイエンス課では教えてなさそう
https://www.ds.shiga-u.ac.jp/about/ds/curriculum/
ジャンル的に工学部の履修内容だからか?
https://www.ds.shiga-u.ac.jp/about/ds/curriculum/
ジャンル的に工学部の履修内容だからか?
401デフォルトの名無しさん (アウアウウー Sad5-9UsI [106.129.75.24])
2021/04/18(日) 17:14:46.61ID:IRPicDM6a どんな手法でどんなデータを計測するかということを設計する時点で設計者の主観が大いに入り込むことを理解できずに
データだけから判定を下すのだから客観的だろと言っている自称DSが多過ぎる
データだけから判定を下すのだから客観的だろと言っている自称DSが多過ぎる
402デフォルトの名無しさん (ワッチョイ 8101-6OPz [126.25.168.179])
2021/04/18(日) 20:04:19.08ID:/yrt+WGh0 >>397
クソ馬鹿野郎は黙っててくれ。
物理においても人間の主観を蔑ろにするようなバカは話にならん。
量子力学も相対性理論も厳密には正しくないニュートン力学にどのような意味で帰着されるか
厳密に考えてる。
そういうことをまるっきり理解していない輩は消えてくれ。
クソ馬鹿野郎は黙っててくれ。
物理においても人間の主観を蔑ろにするようなバカは話にならん。
量子力学も相対性理論も厳密には正しくないニュートン力学にどのような意味で帰着されるか
厳密に考えてる。
そういうことをまるっきり理解していない輩は消えてくれ。
403デフォルトの名無しさん (ワッチョイ 21e6-E5dH [14.3.167.89])
2021/04/18(日) 20:21:19.55ID:ysDt+vZr0 そう。。。
404デフォルトの名無しさん (ワッチョイ 0902-pvza [106.174.65.36])
2021/04/18(日) 21:38:13.62ID:fLgnYf4l0 GeForceの新規生産をCUDA動かない新verに切り替えるらしい噂
マイナー相手に争奪戦で勝てる気が全くしないw
マイナー相手に争奪戦で勝てる気が全くしないw
405デフォルトの名無しさん (ワッチョイ 1301-tnKp [219.29.42.55])
2021/04/18(日) 22:09:58.07ID:n32h2KsI0 >>404
CUDAが動かなければGeForceの意味がない。ディープラーニングでもゲームでも使い物にならない。CUDA性能を維持してマイニングに使えなくするのがマイニング対策済30x0では?
CUDAが動かなければGeForceの意味がない。ディープラーニングでもゲームでも使い物にならない。CUDA性能を維持してマイニングに使えなくするのがマイニング対策済30x0では?
406デフォルトの名無しさん (ワッチョイ 514f-ubdj [60.37.107.122])
2021/04/18(日) 22:16:31.16ID:Qxa4OXG60 >>404
それはマイニング制限とは別の話?CUDA使いたければTesla買えとか?
それはマイニング制限とは別の話?CUDA使いたければTesla買えとか?
407デフォルトの名無しさん (ワッチョイ 0902-WfsT [106.166.50.77])
2021/04/18(日) 22:17:55.90ID:lVaCsfaE0 Tensorコアだけじゃどうしようもないからなあ
408デフォルトの名無しさん (ワッチョイ eb10-hmOq [153.131.102.129])
2021/04/18(日) 23:13:01.66ID:m+SV1W/C0409デフォルトの名無しさん (ワッチョイ eb10-hmOq [153.131.102.129])
2021/04/18(日) 23:13:58.56ID:m+SV1W/C0 >>399
測定誤差は正規分布に順うとしたら誤差の平均値が判るからその値を調整したらいい
測定誤差は正規分布に順うとしたら誤差の平均値が判るからその値を調整したらいい
410デフォルトの名無しさん (ワッチョイ eb10-hmOq [153.131.102.129])
2021/04/18(日) 23:14:17.97ID:m+SV1W/C0 フィッシャーの三原則とかある
411デフォルトの名無しさん (ワッチョイ eb10-hmOq [153.131.102.129])
2021/04/18(日) 23:15:20.18ID:m+SV1W/C0412デフォルトの名無しさん (ワッチョイ eb10-hmOq [153.131.102.129])
2021/04/18(日) 23:21:52.89ID:m+SV1W/C0 量子論の不確定原理なら人間の主観とか関係なく不確定なんじゃね?
不確定だとしても確率的には値の差があるだろうから9割はこの範囲の値とか決まるだろうな
どんな外れ値でも確率ゼロではないから絶対に間違いとは言えないけど観測される頻度は稀になるはず
それよりも大きな頻度で観測されたら仮説の方が間違いなのは変わらない
不確定だとしても確率的には値の差があるだろうから9割はこの範囲の値とか決まるだろうな
どんな外れ値でも確率ゼロではないから絶対に間違いとは言えないけど観測される頻度は稀になるはず
それよりも大きな頻度で観測されたら仮説の方が間違いなのは変わらない
413デフォルトの名無しさん (ワッチョイ 095f-CoNo [106.73.78.34])
2021/04/18(日) 23:35:52.79ID:yp3ki8fH0 >>412
主観入りまくってますがなw
主観入りまくってますがなw
415デフォルトの名無しさん (ワッチョイ eb10-Zgro [153.243.53.4])
2021/04/19(月) 00:49:42.58ID:Y2i4yGVV0 >>412
現象を説明する為にモデルを当てはめる時点で主観入ってる
現象を説明する為にモデルを当てはめる時点で主観入ってる
416デフォルトの名無しさん (ワッチョイ 5101-JtN7 [60.69.230.42])
2021/04/19(月) 09:16:49.17ID:I4CFpA8M0 All models are wrong, but some are useful.
417デフォルトの名無しさん (テテンテンテン MM8b-E5dH [133.106.36.180])
2021/04/19(月) 09:31:02.90ID:QmRvPrb/M >>416
誰の言葉?
誰の言葉?
418デフォルトの名無しさん (ワッチョイ 1190-tdH6 [220.216.26.186])
2021/04/19(月) 09:32:33.96ID:xpugMHkq0 F=G*m1*m2/r^2
419デフォルトの名無しさん (ワッチョイ 1190-tdH6 [220.216.26.186])
2021/04/19(月) 09:35:52.97ID:xpugMHkq0 George Edward Pelham Box
420デフォルトの名無しさん (ワッチョイ 8101-6OPz [126.25.168.179])
2021/04/19(月) 10:50:45.42ID:7a+3hK+O0 ニュートン力学は間違ってる(厳密には正しくない)から使えないとか言い出すやつは頭悪いだろ。
421デフォルトの名無しさん (ワッチョイ 9b89-1iXq [39.111.228.181])
2021/04/19(月) 11:20:30.03ID:vPt4CmiJ0 スレタイ読めないやつと比べてどっちが頭が悪いの?
422デフォルトの名無しさん (ワッチョイ 8101-6OPz [126.25.168.179])
2021/04/19(月) 14:28:49.64ID:7a+3hK+O0 >>421
スレタイと関係ないと思っちゃうのか。。そりゃ頭悪いな
スレタイと関係ないと思っちゃうのか。。そりゃ頭悪いな
423デフォルトの名無しさん (ワッチョイ 9b89-1iXq [39.111.228.181])
2021/04/19(月) 14:37:35.07ID:vPt4CmiJ0 >>422
どう関係するの?
どう関係するの?
424デフォルトの名無しさん (ワッチョイ 0902-WfsT [106.166.50.77])
2021/04/19(月) 17:58:53.25ID:ZVFLPhBo0 >>404
CUDAを動かなくする、という情報は少なくとも自作板では見つからなかったな
CUDAを動かなくする、という情報は少なくとも自作板では見つからなかったな
425デフォルトの名無しさん (ワッチョイ 1302-tdH6 [59.138.123.33])
2021/04/19(月) 19:34:04.83ID:6UVoDsj30 >>417
ロジャーペンローズが似たようなことを言っている
ロジャーペンローズが似たようなことを言っている
426デフォルトの名無しさん (ワッチョイ eb10-hmOq [153.131.102.129])
2021/04/19(月) 20:34:22.39ID:GRSFwPvE0 人間が考えるなら主観が入り込むというなら全てに主観が入り込むことになる
つまり主観という点では差がない
出てくる成果には現実を上手く説明できるかどうかの差が生じる
より現実を説明できる成果は単なる個人の固定観念とは違う価値のあるもの
現実と合致する程度が高い成果は一個人の主観とは言えない程に質が変わる
つまり主観という点では差がない
出てくる成果には現実を上手く説明できるかどうかの差が生じる
より現実を説明できる成果は単なる個人の固定観念とは違う価値のあるもの
現実と合致する程度が高い成果は一個人の主観とは言えない程に質が変わる
427デフォルトの名無しさん (アウアウウー Sad5-9UsI [106.129.74.126])
2021/04/19(月) 21:20:07.15ID:GUe2JtDVa 主観的か客観的かは重要ではない
どれだけ客観的な手法を構築したとしても予測精度が低ければ使い物にならない
どれだけ客観的な手法を構築したとしても予測精度が低ければ使い物にならない
428デフォルトの名無しさん (ワッチョイ e984-tdH6 [218.217.236.65])
2021/04/20(火) 07:24:15.31ID:jszIXr370429デフォルトの名無しさん (ブーイモ MMeb-kFzn [163.49.212.148])
2021/04/20(火) 08:08:47.60ID:5/fHSI6qM 新卒で機械学習エンジニアになったけどGUIで学習するツールが導入されてて、マウスポチポチするだけでお仕事になるの納得行かない
430デフォルトの名無しさん (エムゾネ FF33-9UsI [49.106.186.189])
2021/04/20(火) 08:10:50.56ID:SsFdkrp5F 単なる作業員になったらその内捨てられる
431デフォルトの名無しさん (ブーイモ MMeb-kFzn [163.49.212.148])
2021/04/20(火) 08:20:33.94ID:5/fHSI6qM432デフォルトの名無しさん (ワッチョイ 21e6-E5dH [14.3.167.89])
2021/04/20(火) 08:55:31.90ID:XU4ld2UL0 >>429
どこのシステム?
どこのシステム?
433デフォルトの名無しさん (ワッチョイ 0902-tdH6 [106.166.50.77])
2021/04/20(火) 09:05:48.17ID:YStzcIe+0 ファインチューニングすらしないでいいとか羨ましい
434デフォルトの名無しさん (ワントンキン MM53-Ct+I [153.248.160.56])
2021/04/20(火) 09:49:15.80ID:JWX72o4+M データの仕事するなら数学よりコンサル力が重要
もしくはWeb分析や製造管理などドメイン知識を学んで特化するかだな
技術系でいきたいならクラウド使って基盤から自分で作れるようになれば引く手数多
最適化エンジニアは自動化されて終わるよ
もしくはWeb分析や製造管理などドメイン知識を学んで特化するかだな
技術系でいきたいならクラウド使って基盤から自分で作れるようになれば引く手数多
最適化エンジニアは自動化されて終わるよ
435デフォルトの名無しさん (ワッチョイ 095f-CoNo [106.73.78.34])
2021/04/20(火) 11:59:17.59ID:pbjOZaIB0 メーカー研究開発やってるけど機械学習に対する敷居はここ数年で大きく下がったね
GUIツールなら実験系の人でも普通に使ってるし
データサイエンスに加えて、それ以外の専門を持たないと厳しいね
GUIツールなら実験系の人でも普通に使ってるし
データサイエンスに加えて、それ以外の専門を持たないと厳しいね
436デフォルトの名無しさん (ブーイモ MMeb-kFzn [163.49.211.29])
2021/04/20(火) 18:16:49.45ID:/RDGneBGM437デフォルトの名無しさん (ワッチョイ 21e6-E5dH [14.3.167.89])
2021/04/20(火) 18:27:49.71ID:XU4ld2UL0438デフォルトの名無しさん (ワッチョイ b302-ashK [101.140.211.220])
2021/04/20(火) 22:42:35.89ID:PyHebxw60439デフォルトの名無しさん (ワッチョイ 095f-CoNo [106.73.78.34])
2021/04/20(火) 22:59:27.20ID:pbjOZaIB0 だからデータサイエンス学部とかちょっと心配になるね。
440デフォルトの名無しさん (ワッチョイ eb10-hmOq [153.131.102.129])
2021/04/20(火) 23:09:28.18ID:RpmUT2UU0 データから突き詰めていけば
その領域の構造も見えてくるんじゃないの?
予備知識として知っておいた方が良いけど
先入観とか思い込みで新たな発見を阻害しているかも
その領域の構造も見えてくるんじゃないの?
予備知識として知っておいた方が良いけど
先入観とか思い込みで新たな発見を阻害しているかも
441デフォルトの名無しさん (ワッチョイ eb10-/Mlu [153.243.53.4])
2021/04/20(火) 23:58:44.60ID:KfvQjl/O0 データから突き詰めて、分かった事実の99%は、その領域の人間にとって、何を今さらって言うレベルの常識なのが現実
442デフォルトの名無しさん (ワッチョイ eb10-hmOq [153.131.102.129])
2021/04/21(水) 00:26:38.44ID:pJR1O2/f0 それでも需要があるのは何故?
443デフォルトの名無しさん (ワッチョイ 5101-1iXq [60.86.178.93])
2021/04/21(水) 04:57:56.95ID:BjUmBGuB0 (1)マーケティングの成功 (ただ単に運がよくはやれたってだけかもw)
(2)1%に賭けてるところもあるかもしれない (薬系なんかは特に)
(2)1%に賭けてるところもあるかもしれない (薬系なんかは特に)
444デフォルトの名無しさん (アウアウウー Sad5-tdH6 [106.154.125.220])
2021/04/21(水) 09:27:01.32ID:ULWWT4ypa いわゆる「暗黙知」の問題を解決できるから
例えば、初心者に対して説明しやすい
あまりにも当たり前だと思い込んでしまっていることは
そもそも話そうとすらしない
例えば、初心者に対して説明しやすい
あまりにも当たり前だと思い込んでしまっていることは
そもそも話そうとすらしない
445デフォルトの名無しさん (ワッチョイ 8101-6OPz [126.25.168.179])
2021/04/21(水) 15:29:43.27ID:KSNXGwT50 それも現場では当たり前だから話そうともしないけどね。
446デフォルトの名無しさん (バットンキン MM53-V9SR [153.233.255.91])
2021/04/21(水) 16:39:38.54ID:YSTRB6CIM データサイエンス学部って企業と組んでむしろゴリゴリドメイン細分化してなかったっけ
DS実用化の観点からは正解にも見えるけど
DS実用化の観点からは正解にも見えるけど
447デフォルトの名無しさん (ワンミングク MM53-Ct+I [153.251.94.11])
2021/04/21(水) 16:58:44.66ID:LssXF+cLM 企業と組むっていってもデータ渡されてモデル作るだけでしょ
少なくともうちの会社と大学の共同研究はそう
そんなもんKaggleと大差ないよ
少なくともうちの会社と大学の共同研究はそう
そんなもんKaggleと大差ないよ
448デフォルトの名無しさん (バットンキン MM53-V9SR [153.233.255.91])
2021/04/21(水) 17:10:53.01ID:YSTRB6CIM ほんまやね
新しい学部だし企業でもないからそこまで深くコミットすること出来ないんでしょね
新しい学部だし企業でもないからそこまで深くコミットすること出来ないんでしょね
449デフォルトの名無しさん (ワッチョイ 21e6-E5dH [14.3.167.89])
2021/04/21(水) 18:06:22.19ID:qv/v785L0 基礎だけ教えるだけでしょ
あとはpythonかrあたりを習わせて
あとはpythonかrあたりを習わせて
450デフォルトの名無しさん (ワッチョイ eb10-Y48T [153.131.102.129])
2021/04/21(水) 20:54:12.98ID:pJR1O2/f0 リコメンドとかは個人毎に人がやるのは作業時間的にむりなんじゃね?
作業時間は人件費、コストになる
売上アップ分より少ないコストで実現できれば投資する価値がある
作業時間は人件費、コストになる
売上アップ分より少ないコストで実現できれば投資する価値がある
451デフォルトの名無しさん (ワッチョイ eb10-Y48T [153.131.102.129])
2021/04/21(水) 21:00:23.59ID:pJR1O2/f0 当たり前と思われている事も
具体的にどの顧客やケースに適用できるかは
勘でしかわからなかっただろうから
担当者毎に違う判断をすることになる
ある担当者は知見を使えると考えるけど
別の担当者は知見を使えると考えない
その知見が明確に認識されていなければ組織内で共有もされていないだろうから
経験の浅い担当者はその知見があることすら認識していない
知見を可視化する事は共有可能になるし
組織全体の成果の底上げにつながる
具体的にどの顧客やケースに適用できるかは
勘でしかわからなかっただろうから
担当者毎に違う判断をすることになる
ある担当者は知見を使えると考えるけど
別の担当者は知見を使えると考えない
その知見が明確に認識されていなければ組織内で共有もされていないだろうから
経験の浅い担当者はその知見があることすら認識していない
知見を可視化する事は共有可能になるし
組織全体の成果の底上げにつながる
452デフォルトの名無しさん (ワンミングク MM53-Ct+I [153.155.231.132])
2021/04/21(水) 21:22:24.85ID:scWNm3nIM 一般論としてはその通りだけど、実際の仕事では一般論じゃなく個別の課題に対して何をどうすればどう効果があるのかを説明できなきゃいけない
容易に想像できる通り、そのためには最適化より重要なスキルが山ほどある
容易に想像できる通り、そのためには最適化より重要なスキルが山ほどある
453デフォルトの名無しさん (テテンテンテン MM8b-Ct+I [133.106.136.89])
2021/04/21(水) 21:58:18.31ID:4ieWnGe7M 解くべき問題を探し回って捻り出さなきゃいけない時点で相当なハンデなんだよな
普通のソフトエンジニアリングだったら、解くべき問題なんてそこら辺の事務のおばちゃんに聞けばいくらでも出てくるだろう
逆に言えば解くべき問題を見つけられる人間に希少価値があるとも言えて、だからコンサルの飯の種としては最適だ
一方で解く側の人間にとってはパイの小さな分野だと言える
普通のソフトエンジニアリングだったら、解くべき問題なんてそこら辺の事務のおばちゃんに聞けばいくらでも出てくるだろう
逆に言えば解くべき問題を見つけられる人間に希少価値があるとも言えて、だからコンサルの飯の種としては最適だ
一方で解く側の人間にとってはパイの小さな分野だと言える
454デフォルトの名無しさん (ワッチョイ eb10-Y48T [153.131.102.129])
2021/04/21(水) 22:49:45.31ID:pJR1O2/f0 今の世界中の課題は新型コロナ
データサイエンスで何ができるか
データサイエンスで何ができるか
455デフォルトの名無しさん (ワッチョイ eb10-Y48T [153.131.102.129])
2021/04/21(水) 22:51:36.83ID:pJR1O2/f0 少し前に目の結膜か何かをカメラで撮ると感染しているか判別するAIアプリのニュースがあったな
役に立つのか知らんけど
役に立つのか知らんけど
456デフォルトの名無しさん (ワッチョイ eb10-Y48T [153.131.102.129])
2021/04/21(水) 22:55:35.42ID:pJR1O2/f0 ガンとか他の病気も早期発見できたら役に立つと思うけどな
トイレの便器にセンサーつけて異常検知するとか言うニュースもあったな
コロナ禍でストレスかかってる人が増えているとかも聞くし
早く検知して対処できたら良いんじゃね?
トイレの便器にセンサーつけて異常検知するとか言うニュースもあったな
コロナ禍でストレスかかってる人が増えているとかも聞くし
早く検知して対処できたら良いんじゃね?
457デフォルトの名無しさん (ワッチョイ 3197-ZzAP [182.171.246.142])
2021/04/21(水) 23:33:54.27ID:AHvTeMJC0 普通のソフトエンジニアリングでも、データドリブンな開発というのはこれから重要になっていくと思うけどな。
その辺のおばちゃんが言ってることをデータを収集して分析して、本当なら改善すればいいし単に特殊例でそうなっただけならスルーすればいいし。
定性的な開発で済む場合もあるけど、定量的な開発ができることで業務改善できる分野はいっぱいあると思うよ。少しでもそういう見方で意味論をある意味捨象して数値で評価しようとする立場の人間が増えることはいいことだと思うけどな。
まあ、数値の評価ってのはいかようにも出せるので、文系的な議論がしっかりなされた上で数値的な評価で裏付ける、というのがよいと思うけれど。
その辺のおばちゃんが言ってることをデータを収集して分析して、本当なら改善すればいいし単に特殊例でそうなっただけならスルーすればいいし。
定性的な開発で済む場合もあるけど、定量的な開発ができることで業務改善できる分野はいっぱいあると思うよ。少しでもそういう見方で意味論をある意味捨象して数値で評価しようとする立場の人間が増えることはいいことだと思うけどな。
まあ、数値の評価ってのはいかようにも出せるので、文系的な議論がしっかりなされた上で数値的な評価で裏付ける、というのがよいと思うけれど。
458デフォルトの名無しさん (バットンキン MM53-V9SR [153.233.255.91])
2021/04/22(木) 02:31:03.78ID:EZ9yi1XHM 事務のおばちゃんを例に出すまでもなく、ソフトウェア・エンジニアリングはマネタイズの方法がたくさん開発されてて実績も豊富
DS分野でいうとBI導入が流行ってるのもマネタイズの分かり易さからでしょ
DS分野でいうとBI導入が流行ってるのもマネタイズの分かり易さからでしょ
459デフォルトの名無しさん (ワッチョイ eb10-Y48T [153.131.102.129])
2021/04/22(木) 08:38:37.02ID:iKwCvStp0 ソフトウェアエンジニアリングとかソフトウェア工学って
ソフトウェアを作るときにバグをどうやったら少なくできるかとか
生産性を上げるにはどうするかとかそう言う分野のことを指すんじゃね?
ソフトウェア事業とかソフトウェアビジネスって言った方が良い
ソフトウェアを作るときにバグをどうやったら少なくできるかとか
生産性を上げるにはどうするかとかそう言う分野のことを指すんじゃね?
ソフトウェア事業とかソフトウェアビジネスって言った方が良い
460デフォルトの名無しさん (テテンテンテン MM8b-E5dH [133.106.35.132])
2021/04/22(木) 08:57:06.72ID:M8v84iKOM >>459
正解
正解
461デフォルトの名無しさん (ワッチョイ 8101-6OPz [126.25.168.179])
2021/04/22(木) 09:30:40.56ID:KHhdvM960 マネタイズできてるのはかなりの規模で使われた場合ばっかだろ。
中小や受託案件なんかは全く関係ないわ。
中小や受託案件なんかは全く関係ないわ。
462デフォルトの名無しさん (ワッチョイ b302-ashK [101.140.211.220])
2021/04/22(木) 14:18:43.57ID:CDCM7CdZ0 >>454
むしろ、コロナ騒動でデータサイエンティストの無力を実感
・国や地域によって患者・重傷者・死者のカウント基準が異なる
・陽性と判定するCt値も同様に定まっていない
・PCR検査以外の感染者の検出方法ほぼ全てで擬陽性が多分に含まれる手段を用いている
データとしてゴミだらけで統計以前。
これらに問題提起をして的外れな対策に意見すべきであった
むしろ、コロナ騒動でデータサイエンティストの無力を実感
・国や地域によって患者・重傷者・死者のカウント基準が異なる
・陽性と判定するCt値も同様に定まっていない
・PCR検査以外の感染者の検出方法ほぼ全てで擬陽性が多分に含まれる手段を用いている
データとしてゴミだらけで統計以前。
これらに問題提起をして的外れな対策に意見すべきであった
463デフォルトの名無しさん (ブーイモ MM05-Vz79 [210.138.6.253])
2021/04/22(木) 14:42:04.01ID:TgsR4gUfM 検査数(当日)と患者数(2日前)とか
そこからかよ。みたいな
そこからかよ。みたいな
464デフォルトの名無しさん (ワッチョイ 29dd-i6SG [122.249.112.164])
2021/04/22(木) 18:30:59.89ID:Uzm+txz10465デフォルトの名無しさん (ワッチョイ 1302-tdH6 [59.138.123.33])
2021/04/22(木) 19:26:43.57ID:lA0hV6360 頼れそうなデータは重症者と死者数なんだが
死んだときに感染していればカウントするそうだから
データとしては「かなり」多めに出るな
誤差さえわからない
死んだときに感染していればカウントするそうだから
データとしては「かなり」多めに出るな
誤差さえわからない
466デフォルトの名無しさん (ワッチョイ 5101-1iXq [60.86.178.93])
2021/04/22(木) 19:47:09.32ID:FRH+m68J0 「重症」の定義が国によってばらばらなんだが
467デフォルトの名無しさん (ワッチョイ 5101-1iXq [60.86.178.93])
2021/04/22(木) 19:47:48.04ID:FRH+m68J0 +日本の新規感染確定@PCR分てのは保健所分だけ公表で、医療機関独自系は非カウントなう
468デフォルトの名無しさん (ワッチョイ cb10-y0cZ [220.106.39.128])
2021/04/23(金) 08:36:21.23ID:tnFfajmm0 死者数のリボルビング発表も言われてるしなあ
469デフォルトの名無しさん (ワッチョイ b302-T6Cp [106.174.65.36])
2021/04/23(金) 17:31:31.74ID:P+WEt3o30 ワクチン開発で多数の候補物質からふるい落とすとかに活用したらしいけど
そういうのは半端なくドメイン知識いるし
そういうのは半端なくドメイン知識いるし
470デフォルトの名無しさん (ワッチョイ 6fe6-zZYr [14.3.167.89])
2021/04/23(金) 18:44:22.53ID:rBK2myaR0 >>469
候補を出すだけならいらないんじゃない?
候補を出すだけならいらないんじゃない?
471デフォルトの名無しさん (ワッチョイ 8701-qRZI [60.69.230.42])
2021/04/24(土) 08:25:25.67ID:MOnT+7TF0 データサイエンティスト「こちらが候補の一覧です。何の物質なのかわかりませんけど。」
お客さん「・・・」
おわり
お客さん「・・・」
おわり
472デフォルトの名無しさん (オイコラミネオ MM67-ztIH [150.66.82.72])
2021/04/24(土) 12:25:29.89ID:OO9vAqoAM やっぱデータサイエンチストに任せずに自分でやったほうがいいか
473デフォルトの名無しさん (アウアウウー Sa47-On6t [106.154.129.102])
2021/04/24(土) 15:21:15.93ID:6XEQ6ynBa474デフォルトの名無しさん (ワッチョイ c702-/alk [101.140.211.220])
2021/04/24(土) 18:30:45.31ID:kEsviUBS0 製薬やマテリアルは自然界の物質をそのまま変数として使えるから、さほど難しくないテーマ
世の中の大多数のテーマは変数の生成から始めないといけない
世の中の大多数のテーマは変数の生成から始めないといけない
475デフォルトの名無しさん (ワントンキン MM9f-XmRv [219.165.66.56])
2021/04/24(土) 19:20:19.57ID:b1XnG/z6M データの意味を知らずにできるような単純な問題ならそれこそデータサイエンティストなんか要らんよ
親切なツール使えば現場の人間でも難しくないだろうし、近い将来完全に自動化される
親切なツール使えば現場の人間でも難しくないだろうし、近い将来完全に自動化される
476デフォルトの名無しさん (スッップ Sdaf-R9kE [49.98.149.9])
2021/04/24(土) 19:24:54.82ID:aBat7e4Id マテリアルもいい記述子見つけるの大変だよ
477デフォルトの名無しさん (ワッチョイ cff3-Iq6q [220.211.225.116])
2021/04/25(日) 12:26:44.89ID:0okbEX8U0 ワクチン開発でDNNを活用するというのは異常に難易度が高いよ。
例えば、コロナウィルスの場合、COVIDウィルスのスパイクのタンパク質配列とかを
学習データに使用するけど、普通は、この種のウィルス特有のデータを10種類以上
選択する必要がある。このデータ選択は、ウィルスの専門知識がないと無理。
状況によっては公開データが用意されていない場合もあるので、その場合は、
研究室でタンパク質配列とかRNA配列とかを解読する作業も必要となってくる。
さらに、DNNに関しても、既存のネットワークを流用することはできないので、
新規にネットワークのアルゴリズムを作る必要もある。この作業は、普通のAI
エンジニアでは無理。更に、機械学習に関してもかなり膨大なGPUリソースが
必要となる。また、専用のネットワークは動かしてみた上で修正を入れるという
作業が発生するため、TPUv3x1024くらいのリソースを開発期間の数ヶ月に渡って、
占有するという状況が発生する。開発要員としてはウイルス学、AIの各領域のポスドク
クラスの専門研究者を10人くらい集めて、さらにクラウド費用として数億円くらいアサイン
する必要があるかもね。まあ、これはほとんど不可能な要件なんだけどね。
例えば、コロナウィルスの場合、COVIDウィルスのスパイクのタンパク質配列とかを
学習データに使用するけど、普通は、この種のウィルス特有のデータを10種類以上
選択する必要がある。このデータ選択は、ウィルスの専門知識がないと無理。
状況によっては公開データが用意されていない場合もあるので、その場合は、
研究室でタンパク質配列とかRNA配列とかを解読する作業も必要となってくる。
さらに、DNNに関しても、既存のネットワークを流用することはできないので、
新規にネットワークのアルゴリズムを作る必要もある。この作業は、普通のAI
エンジニアでは無理。更に、機械学習に関してもかなり膨大なGPUリソースが
必要となる。また、専用のネットワークは動かしてみた上で修正を入れるという
作業が発生するため、TPUv3x1024くらいのリソースを開発期間の数ヶ月に渡って、
占有するという状況が発生する。開発要員としてはウイルス学、AIの各領域のポスドク
クラスの専門研究者を10人くらい集めて、さらにクラウド費用として数億円くらいアサイン
する必要があるかもね。まあ、これはほとんど不可能な要件なんだけどね。
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 中国と対話で良い関係つくるのが責任と首相 [少考さん★]
- 日本テレビ、国分太一の会見受け回答「『コンプライアンス違反行為があった』ということ以上に公にできない」「答え合わせ難しい」 [Ailuropoda melanoleuca★]
- 生クリームだけの真っ白なクリスマスケーキ 大手メーカーが販売、その理由は…フルーツなしで価格は半額以下に ★2 [おっさん友の会★]
- 【文春】元TOKIO・国分太一(51)「女性スタッフ2名への“わいせつ事案”」日テレ事情聴取の全貌が分かった! ★3 [Ailuropoda melanoleuca★]
- 〈シカが泣いている…〉奈良が“観光崩壊”危機…外国人観光客は44.5万人、宿泊客単価は3万1千円 [1ゲットロボ★]
- 国分太一 騒動で「数日間の間で全てを失った」 涙ながらに率直な心境吐露 [Anonymous★]
- 【悲報】高市、答弁修正。バカウヨ敗北wwwwwwwwww [834922174]
- 立川志らく「高市政権に逆らったら全部日本人じゃねえなんて言ってない」 [931948549]
- ジョージの男磨きハウス面白いよな
- 高市総理「台湾発言は、これまでの政府答弁を繰り返すと予算委員会を止められると思い発言した」 [256556981]
- 【正論】高市さん「存立危機事態については、具体例を挙げて聞かれたので、答えた」戦犯立憲岡田と判明 [519511584]
- 【悲報】「ジャングリア沖縄」、開業3ヶ月目にしてガラガラになってしまうwwwwwwwwwwwwwwwwwww [839150984]
