X



【統計分析】機械学習・データマイニング19
■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん (スッップ Sd12-4l6a)
垢版 |
2018/03/09(金) 18:09:45.75ID:WX3plG2ad

機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング17
http://mevius.5ch.net/test/read.cgi/tech/1502032926/
【統計分析】機械学習・データマイニング18
http://mevius.5ch.net/test/read.cgi/tech/1507807291/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
0352デフォルトの名無しさん (ワッチョイ 658a-NiX3)
垢版 |
2018/06/02(土) 02:32:28.13ID:rcIgt08P0
問題はデータサイエンティストとしての知識を披露したいのに、結局凡人が理解出来る範囲しかデータを提供出来ないということ。

分かりやすくするためにいろいろ削った結果、言いたいことがほとんど残らない。
とりあえずクライエントが望みそうな方向に誘導するのが一番無難。
0355デフォルトの名無しさん (アウウィフ FF09-sZ2J)
垢版 |
2018/06/02(土) 14:06:37.67ID:yUEJ+BJSF
>>352
なるほど
0356デフォルトの名無しさん (アウウィフ FF09-sZ2J)
垢版 |
2018/06/02(土) 14:07:23.05ID:yUEJ+BJSF
>>354
まともなAI(ω)なら会社変われって結論を出すと思うが
おまいは従えるか?
0357デフォルトの名無しさん (ワッチョイ d68a-lkdC)
垢版 |
2018/06/02(土) 14:44:07.82ID:LbmCn/qT0
DSの仕事は日本にはそうそうないらしい
面接や就職説明会ではどの会社もいい部分ばかりみせるけど
優秀なDSを本当に活用できる企業はほんの一握りで、ほとんどのDSはアナリストのよう
な雑務をこなしながら、いつか良い職に就ける日を夢見て独学で頑張ってるようだ
でも英語を勉強すれば外資にいけるし、英語が出来なくても本当に優秀なDSなら、学歴か実績があれば最近はいろいろといい求人があるんじゃないかな
0358デフォルトの名無しさん (アウアウウー Sa09-lkdC)
垢版 |
2018/06/02(土) 15:23:42.42ID:LQ/0xe+Ta
機械メーカーの研究開発職であちこちセンサー付けた自社製品の機械をひたすら動かしてデータ収集して
種々の解析して異常発生の兆候を見るための手法の開発してるけどこれはデータサイエンティスト?
そうだとしたらほとんどの研究職はデータサイエンティストだろうけど
0359デフォルトの名無しさん (アウアウカー Sa5d-zSKM)
垢版 |
2018/06/02(土) 16:56:45.27ID:4KUmT+Nha
客のデータで重要な知見が得られたならそれは当然客が競争優位に立つために重要なので詳細を公表できるわけがない
自分の成果を第三者にアピールするなら自力でデータ集めからやるか、個別案件に依存しない新たなアルゴリズムの開発、公の機関との共同研究ぐらいしかないだろう
0360デフォルトの名無しさん (アウアウウー Sa09-wn3A)
垢版 |
2018/06/02(土) 18:02:19.41ID:is52Aub+a
>>349
というかもうすぐ失業者が出るとか?
0361デフォルトの名無しさん (ワッチョイ fa7c-Eswy)
垢版 |
2018/06/02(土) 18:36:15.08ID:JtCCMOg20
この分野もプログラミングと一緒で
何か個人で成果を出さないと認められない世界になってきた
ということでいいのでしょうか?
0362デフォルトの名無しさん (マクド FF1d-lkdC)
垢版 |
2018/06/02(土) 21:26:42.66ID:RUOu/NskF
そんなことないさ
極端は話、論文を読んで実装できるレベルで数学、数理統計学、ベイズ統計、機械学習の理論をしっかり理解し、
pythonおよびライブラリを有名どころ一通り使いこなせて
C++かjavaでアプリを自由自在に組めて、rubyにも精通していて、SQLでDBの操作が出来て、前処理の実務経験も豊富で、本職のDSのようにRを使いこなせたら、年収1500万ぐらいは楽に稼げるだろう

はじパタ本ぐらい読んでこの業界に入る人にとっては、そんなに遠いところでもないはず。自分はまだそこまでたどり着けてないけど
0369デフォルトの名無しさん (アウアウウー Sa09-wn3A)
垢版 |
2018/06/03(日) 18:02:36.60ID:lwvLql6da
>>367
c++は使えた方がいい。
0375デフォルトの名無しさん (ワッチョイ 1abd-9Pia)
垢版 |
2018/06/04(月) 10:22:00.48ID:U51DyN8C0
論文読んで実装できて、DBを操作できて、画像なり自然言語なりひとつ専門分野を
持っていれば、年収1200万以上の求人がちらほらあるな
まあ、そういう奴は他にもいろいろと出来ることがあるんだろうけど
0376デフォルトの名無しさん (アウアウカー Sa5d-zSKM)
垢版 |
2018/06/04(月) 10:52:45.21ID:2a6RSZ8ma
rubyやpython等のスクリプト言語はあくまでスクリプトでありその場で結果を確認しながらデータを操作するのに向いている
C等のコンパイル言語はその場で確認といった用途には向かないが最適化すれば実行速度は圧倒的に高速
なのでスクリプト言語でデータを弄りながら方針決めをして、今後同様の操作を何度も行うのであればコンパイル言語でプログラム作成するのが正しいやり方
0378デフォルトの名無しさん (ワッチョイ 1abd-9Pia)
垢版 |
2018/06/04(月) 11:03:37.92ID:U51DyN8C0
DSならほとんどの職場でRはメイン言語
機械学習エンジニアでも、DSと職務の分業が進んでなければ、なんだかんだで
Rを使う仕事が回ってくることが多い
てかうちがそう
0379デフォルトの名無しさん (アウアウカー Sa5d-wn3A)
垢版 |
2018/06/04(月) 11:54:54.71ID:aXg3ysJDa
日本なんかpythonエンジニア用無し。
アメリカは高収入なのに。
日本は未だCOBOLエンジニアの需要がある。
0384デフォルトの名無しさん (ワッチョイ d68a-lkdC)
垢版 |
2018/06/04(月) 16:27:17.01ID:/FAaC0Tv0
DSはともかく、機械学習のエンジニアの求人は、1000以上でもスキル要件自体はそこまで厳しくないような…
まあ。中身よく分からないけどライブラリ実装できます、みたいな奴は論外としても。
大学一年程度の数学を理解していて、はじパタ本に毛が生えた程度の、機械学習の理論に関する理解があって、自分の専門領域を自然言語処理でも画像認識でもとにかく一つぐらい持っていれば、それでスキル要件を満たすんじゃないか
もちろん実務に関する細々としたスキルも、持ってること前提の話だけど
0387デフォルトの名無しさん (アウアウイー Sac5-iQ7d)
垢版 |
2018/06/05(火) 00:11:39.63ID:8Iw+/nEDa
>>379
米国も一緒よ
0393デフォルトの名無しさん (ワッチョイ d68a-lkdC)
垢版 |
2018/06/05(火) 10:48:23.57ID:4dP1NJWe0
数学+統計+機械学習
+python+DB+クラウド+extra …… これで年収600ぐらいかな
自然言語処理とか、そういう専門領域を身に着けて、給料がすこし増える感じ

年収1000を超えている奴らは普段いったい何をやっとるんだろう
0396デフォルトの名無しさん (ワッチョイ d681-CfZI)
垢版 |
2018/06/05(火) 12:27:13.03ID:XrtFx+DZ0
元々そんなに年収高くないサラリーマンやってる前提の話なのか。
その会社にいたままで高所得は難しいのは当然だとおもうが。
転職やフリーは考えないのか。
たとえばテレビ業界とか年収高いほうだろうが、フリーアナウンサーになるのがいるが。
0397デフォルトの名無しさん (ワッチョイ d68a-lkdC)
垢版 |
2018/06/05(火) 13:12:53.70ID:4dP1NJWe0
実際そうなんだよね。求人見ると、よさげなところがちらほらある
何度か転職を繰り返して、いろんな刺激をもらって成長していくうちに、突き抜けるんだろうか
0404デフォルトの名無しさん (ササクッテロ Sp05-cMCF)
垢版 |
2018/06/05(火) 19:15:28.45ID:FpfgnXpSp
>>393
この場合の数学+統計+機械学習ってどのくらいのレベルでしょうか
BishopやMurphyのテキストがちゃんと解読できるくらい?
0405デフォルトの名無しさん (ワッチョイ 0e4b-sZ2J)
垢版 |
2018/06/06(水) 06:58:46.99ID:NJm/h3bv0
なんで機械学習ってインタプリタ主流なの?
遅いじゃん
0406デフォルトの名無しさん (ワッチョイ 4123-PWQK)
垢版 |
2018/06/06(水) 09:41:33.10ID:I9hgDbEz0
https://youtu.be/zYKOL5RpVbo
【大学数学】ベイジアンネットワーク【機械学習】
概出?
0407デフォルトの名無しさん (JP 0Hf1-etJG)
垢版 |
2018/06/06(水) 12:33:25.21ID:bWEoegzUH
全然ネットワークじゃないじゃん
0409デフォルトの名無しさん (ササクッテロ Sp05-cMCF)
垢版 |
2018/06/06(水) 14:14:23.03ID:r2g/1oegp
>>408
なるほど
あのレベルのテキストだと歯が立たない箇所が多くて
0410デフォルトの名無しさん (アウアウカー Sa5d-wn3A)
垢版 |
2018/06/06(水) 17:31:32.85ID:q1bS2rcEa
>>405
Juliaは速いんだけどな。
0412デフォルトの名無しさん (アウアウカー Sa5d-zSKM)
垢版 |
2018/06/06(水) 19:38:43.45ID:hS3HWMA0a
実験的にパラメータちょっと弄って変化確認するならインタプリタが最適
その後実運用する段階ではコンパイル型言語使って作り直してコンパイルした方が速度面で有利だろうけど実際のところどうする人が多いのかは知らない
0417デフォルトの名無しさん (ワッチョイ d681-CfZI)
垢版 |
2018/06/06(水) 22:34:15.26ID:+qEQXuQ70
>>415
グーグルのアルファ碁からしてわかってないけど発展してるだろ。
別にはなるが、ディープラーニングを広義に学習方法の自動学習法と捉えた場合。
使う手法が、多層ニューラルネットである必要はないわけだが。このへん進んでるか。


ディープラーニング - Wikipedia

しかし、近年、ヒントンらによる多層ニューラルネットワークの学習の研究や、学習に必要な計算機の能力向上、
および、Webの発達による訓練データ調達の容易化によって、充分学習させられるようになった。
その結果、音声・画像・自然言語を対象とする問題に対し、他の手法を圧倒する高い性能を示し、2010年代に普及した。
しかしながら、多層ニューラルネットが高い性能を示す要因の理論的な解明は進んでいない。
0419デフォルトの名無しさん (アウアウカー Sa2d-abwI)
垢版 |
2018/06/07(木) 00:41:54.57ID:2mKmeoG5a
機械学習の個々のアルゴリズムには流行り廃りがあるけど統計学に基づく点には変わりないので
最新の機械学習のブラックボックス化された関数使えるより統計学を体系的に学んでいる人の方が長期的には有利
0420デフォルトの名無しさん (ワッチョイ eb81-oLIW)
垢版 |
2018/06/07(木) 04:16:51.96ID:EtNPtLaF0
これは?




情報幾何への入門と応用
http://www.sci.osaka-cu.ac.jp/~ohnita/2006/inf_geom/sos_dan/book_0403.pdf


非加法的エントロピーを加法的エントロピーにする方法ーAdS/CFT対応の情報幾何バージョンー
http://www2.itc.kansai-u.ac.jp/~afujioka/talk/tanaka.pdf
0422デフォルトの名無しさん (アウウィフ FFd5-MvoD)
垢版 |
2018/06/07(木) 10:15:29.32ID:4mIWw2z0F
>>413
バイトコードにしたからと言ってネイティブ機械語みたく爆速になる訳じゃないよ
for文とかアホみたいに書いてるよりスッキリnumpy使え
0423デフォルトの名無しさん (アウウィフ FFd5-MvoD)
垢版 |
2018/06/07(木) 10:17:11.63ID:4mIWw2z0F
>>417
ほんそれ
0424デフォルトの名無しさん (ワッチョイ eb8a-6+Fv)
垢版 |
2018/06/07(木) 18:31:54.55ID:Kn/6DS9U0
>>419
いまは実感が湧かないけど、たぶんだけど35歳とか過ぎた頃に違いが出てくるんだろうな
0430デフォルトの名無しさん (ワッチョイ eb8a-6+Fv)
垢版 |
2018/06/09(土) 17:15:22.94ID:UJU1F4Hl0
機械学習のブラックボックス化された関数うんぬんというけど
数学わからない癖に機械学習のアルゴリズムを組んでる
文系エンジニア的な奴はそんなにいないよなあ
そんな入口そうそうない
0431デフォルトの名無しさん (アウアウカー Sa2d-abwI)
垢版 |
2018/06/09(土) 18:48:56.36ID:yrN1RUIVa
機械学習ブームがここまで盛り上がるなど予想されていなかったので基礎研究からやってる企業を除いて機械学習の専門家を雇っている企業などほとんどない
バリバリの理系出身だとしても大半は専門外の人間が錬金術的にパラメータ調整してたまたま上手くいっているだけで基礎から理解して使えている人はそうそういない
偶然の産物だろうが適切な出力が得られていればそれで構わないが、基礎が分かっていないと今後新しいアルゴリズムが主流になった時も同様に運任せで錬金術することになる
0433デフォルトの名無しさん (ワッチョイ 9323-LHz9)
垢版 |
2018/06/10(日) 01:49:54.08ID:Ame7ypF10
だとしたら、アセンブラ出来ない奴、デジタル回路が組めない奴、はみんな基礎が分かってないから
運任せでプログラムを組むべきじゃないなw

要は、各々の世代でどのレイヤーの知識が重視されるか?なんだと思う
今はベクトル数学や統計学のレイヤーとは離れた技術が上の層にどんどん積み重なっていて
そろそろ分業しないと成り立たなくなる時代が来ている様な気がする
0434デフォルトの名無しさん (ワッチョイ b3dc-X4KX)
垢版 |
2018/06/10(日) 08:25:10.29ID:7GMv3HHL0
富士通のZinraiとか、金かけて、宣伝しているけど、
国内企業のAIってどのレベル?

某大手企業のを試用した範囲では、ゴミのような出来。
このスレの連中のような趣味でやってるレベルにも達していない。

「偶発的な適切な出力」という表現があるけど、
恐らく、作っている奴は、「適切」の指標すら解っていない。
0436デフォルトの名無しさん (ワッチョイ 9b76-V68u)
垢版 |
2018/06/10(日) 08:47:48.39ID:eesH+2qR0
東芝、NEC、オムロン、富士通、日立
みたいなところの研究所からは
まともな研究が出ているけど
それを商品化するところは丸投げするから
変なのが出てくる
0437デフォルトの名無しさん (アウアウウー Sad5-sWV6)
垢版 |
2018/06/11(月) 09:37:38.76ID:BjFidTNMa
>>436
東芝とNECは会社が危ない。
0440デフォルトの名無しさん (アウアウカー Sa2d-abwI)
垢版 |
2018/06/11(月) 10:10:19.21ID:dbmbgvPBa
AIで会社経営を立て直すには過去の大量の成功・失敗の経営情報が詳細な内部情報とセットで必要であり
それは一社及びそのグループ会社程度の規模では量的に足りなさすぎるので実質的に不可能と考えて良い
0444デフォルトの名無しさん (JP 0H05-iGaC)
垢版 |
2018/06/11(月) 12:29:12.99ID:fk/EJioNH
BIやっても
それを読み解いて
活用できる経営者が居ないとね
0447デフォルトの名無しさん (マクド FFad-6+Fv)
垢版 |
2018/06/11(月) 15:35:31.29ID:izT/KIr3F
機械学習って、統計学の横に色んなジャンルが派生的に発展していて
縦に発展しているようなイメージがないんだが

流行り廃りで、いま学んだ知識の大半が今後は通用しなくなりそうというか
業界の人たちはかなり悲観的だよね
0448デフォルトの名無しさん (ワッチョイ d123-MvoD)
垢版 |
2018/06/11(月) 15:53:18.80ID:539MWtkj0
積み重ねだから役に立たなくなるってことはないよ
0449デフォルトの名無しさん (アウアウカー Sa2d-abwI)
垢版 |
2018/06/11(月) 17:56:57.83ID:dbmbgvPBa
派生部分しか理解していない人は流行りが終了すれば新しい流行りを1から勉強し直す
根幹となる統計学が理解できていれば新しい流行りの理解も早いはずなので流行り廃りに対応しやすくなる
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況