【統計分析】機械学習・データマイニング19

■ このスレッドは過去ログ倉庫に格納されています
2018/03/09(金) 18:09:45.75ID:WX3plG2ad

機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング17
http://mevius.5ch.net/test/read.cgi/tech/1502032926/
【統計分析】機械学習・データマイニング18
http://mevius.5ch.net/test/read.cgi/tech/1507807291/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
2018/05/27(日) 17:06:39.17ID:OO1HBhKxa
人工知能=人工的に作られた、知能を持っているように見えるもの
なので基本的に受け手側の考え方次第で何でも人工知能になり得る
2018/05/30(水) 19:43:16.79ID:TZFpuQkh0
ライブラリを利用できるだけのプログラマーの間でも
特徴抽出のセンスだけで腕に相当の差がつきそうなもんだけど
そういう組み込み系のエンジニアの年収はどのあたりの幅に収まるもんなんだろう
2018/05/31(木) 08:16:28.31ID:HCWSsrHmM
画像分類のテストやろう
2018/05/31(木) 08:22:24.22ID:Dy3hGHo20
報酬は国際標準ぐらいはいただけるのでしょうか?
2018/05/31(木) 10:24:25.80ID:j81tJVCu0
特徴抽出のセンスってデータの前処理の話?
そのデータを長年扱ってて背景知識あるかどうかだよ
2018/05/31(木) 11:09:07.45ID:MEsz5FAe0
そっか、自分いま機械学習の勉強を進めてて
数学・統計学まわりから先にがっつり勉強したから機械学習本体の
学習がまだ進んでないような段階なんだけど、この先どの程度の年収の職に就けるのか
不安を感じている。これは世間で言われているほど美味しくないんじゃないか
2018/05/31(木) 11:13:27.46ID:Dy3hGHo20
残念ながら日本では作文能力が高い方が収入が高い
333デフォルトの名無しさん (ワッチョイ 9981-CfZI)
垢版 |
2018/05/31(木) 11:15:22.59ID:hmaH1OSK0
>>331
お前にとって美味しいかは知らないが実力があれば今と今後、最も稼げるのはほぼそうだろ。
プロ野球とか芸能人とかも年収差はある。
2018/05/31(木) 11:52:32.15ID:KvQfJLBD0
>>331
>>246
君には輝ける未来が待っている(適当)
2018/05/31(木) 18:06:38.24ID:m8bWSgNKa
日本で一生過ごす前提なら結局スペック高かろうが低かろうが大して収入なんて変わらない
2018/05/31(木) 18:12:08.73ID:7VYLoR1Y0
情処を取ったほうがよさげ
2018/05/31(木) 18:49:44.60ID:4k9lsrlf0
>>336
それは最低限の素養では?
2018/05/31(木) 19:14:21.74ID:3mgKKlen0
>>331
正解
2018/05/31(木) 21:09:27.65ID:t2zpblena
職に就かずに稼ぐ方向で頑張れ
2018/06/01(金) 02:33:22.26ID:K/pDq2Y60
特殊スキル持っても一般では理解されず、学歴で見られる
漏れも出来るなら職に就かず稼ぐ方を進める
2018/06/01(金) 11:24:42.12ID:dAoRdizS0
日本である程度稼いだら東南アジアに引っ越してダラダラと暮らしたい
2018/06/01(金) 15:46:05.19ID:RhYZ0Afc0
年収600万くらいかねえ。1エンジニアで1000万とかまず超えない
2018/06/01(金) 17:57:35.25ID:QWsFWCyXa
日本では文系職でも理系職でも皆同じようにしか昇給しないからな
表向きは成果主義導入してても成果による差はごくわずか
公平感を保つためと言うがやる気のある人からすればむしろ不公平感しかない
344デフォルトの名無しさん (ワッチョイ 4123-sZ2J)
垢版 |
2018/06/01(金) 18:07:29.88ID:Wbxpqrec0
どうせもらう側に行けないから気にすんな
345デフォルトの名無しさん (ワッチョイ fa89-89TH)
垢版 |
2018/06/01(金) 18:48:27.48ID:yj/dLDhy0
現時点でAIデータサイエンティストとして院卒レベルの人材じゃないとノーチャンだよな
冷静に考えて足りないのは、機械学習の上辺を理解してる営業だけ
技術職のキャパはすでに上限ギリギリいっぱいな気がするわ
英語がネイティブレベルならまだ話は別かもだが

自分で事業起こすにしても
凄まじい計算資源がないとまともな事業展開は無理だから、超大手の研究や投資に依存せざるを得ない
量子コンピュータの機械学習への組み込みに成功したらなおさらそれが加速する
割と今ってディストピアまっしぐらじゃね?
2018/06/01(金) 19:15:13.52ID:dAoRdizS0
普通のPCで動くものじゃないと普及しないよ
2018/06/01(金) 19:37:15.51ID:RsiXZK4kM
んなこたーない
2018/06/01(金) 20:01:42.58ID:XIR6/IC1d
データサイエンティストって職業成り立ってない。
雑用ばかり
2018/06/01(金) 21:27:49.03ID:RhYZ0Afc0
8割雑用らしいね
2018/06/01(金) 21:30:58.41ID:dvK9VBFS0
雑用に追われない仕事なんか無いよ。
2018/06/02(土) 00:42:10.32ID:yb2DUuBi0
確かに
2018/06/02(土) 02:32:28.13ID:rcIgt08P0
問題はデータサイエンティストとしての知識を披露したいのに、結局凡人が理解出来る範囲しかデータを提供出来ないということ。

分かりやすくするためにいろいろ削った結果、言いたいことがほとんど残らない。
とりあえずクライエントが望みそうな方向に誘導するのが一番無難。
2018/06/02(土) 09:15:49.36ID:yb2DUuBi0
そういうのは論文か本かブログで発表するといいと思いう
2018/06/02(土) 13:08:37.80ID:7GL2UkROd
いやだからお客様のデータを論文で披露するわけないやん
355デフォルトの名無しさん (アウウィフ FF09-sZ2J)
垢版 |
2018/06/02(土) 14:06:37.67ID:yUEJ+BJSF
>>352
なるほど
356デフォルトの名無しさん (アウウィフ FF09-sZ2J)
垢版 |
2018/06/02(土) 14:07:23.05ID:yUEJ+BJSF
>>354
まともなAI(ω)なら会社変われって結論を出すと思うが
おまいは従えるか?
2018/06/02(土) 14:44:07.82ID:LbmCn/qT0
DSの仕事は日本にはそうそうないらしい
面接や就職説明会ではどの会社もいい部分ばかりみせるけど
優秀なDSを本当に活用できる企業はほんの一握りで、ほとんどのDSはアナリストのよう
な雑務をこなしながら、いつか良い職に就ける日を夢見て独学で頑張ってるようだ
でも英語を勉強すれば外資にいけるし、英語が出来なくても本当に優秀なDSなら、学歴か実績があれば最近はいろいろといい求人があるんじゃないかな
2018/06/02(土) 15:23:42.42ID:LQ/0xe+Ta
機械メーカーの研究開発職であちこちセンサー付けた自社製品の機械をひたすら動かしてデータ収集して
種々の解析して異常発生の兆候を見るための手法の開発してるけどこれはデータサイエンティスト?
そうだとしたらほとんどの研究職はデータサイエンティストだろうけど
2018/06/02(土) 16:56:45.27ID:4KUmT+Nha
客のデータで重要な知見が得られたならそれは当然客が競争優位に立つために重要なので詳細を公表できるわけがない
自分の成果を第三者にアピールするなら自力でデータ集めからやるか、個別案件に依存しない新たなアルゴリズムの開発、公の機関との共同研究ぐらいしかないだろう
360デフォルトの名無しさん (アウアウウー Sa09-wn3A)
垢版 |
2018/06/02(土) 18:02:19.41ID:is52Aub+a
>>349
というかもうすぐ失業者が出るとか?
361デフォルトの名無しさん (ワッチョイ fa7c-Eswy)
垢版 |
2018/06/02(土) 18:36:15.08ID:JtCCMOg20
この分野もプログラミングと一緒で
何か個人で成果を出さないと認められない世界になってきた
ということでいいのでしょうか?
2018/06/02(土) 21:26:42.66ID:RUOu/NskF
そんなことないさ
極端は話、論文を読んで実装できるレベルで数学、数理統計学、ベイズ統計、機械学習の理論をしっかり理解し、
pythonおよびライブラリを有名どころ一通り使いこなせて
C++かjavaでアプリを自由自在に組めて、rubyにも精通していて、SQLでDBの操作が出来て、前処理の実務経験も豊富で、本職のDSのようにRを使いこなせたら、年収1500万ぐらいは楽に稼げるだろう

はじパタ本ぐらい読んでこの業界に入る人にとっては、そんなに遠いところでもないはず。自分はまだそこまでたどり着けてないけど
2018/06/02(土) 21:58:24.27ID:ZdNVaxeud
↑うわーキモい
2018/06/02(土) 22:45:55.01ID:YJeybHCa0
rubyって精通してる必要ある?
2018/06/02(土) 23:01:04.79ID:msBkLZBc0
無い
2018/06/02(土) 23:23:23.72ID:RUOu/NskF
この業界で出来る人、ほんとにそのぐらい出来るぞ
rubyはとりあえずアプリを組めれば何でもいい時にできるといいらしい(らしい)
2018/06/02(土) 23:43:43.64ID:Xxy0jUP60
pythonできるならpythonでやればいいだろう。
2018/06/03(日) 01:37:31.13ID:ye/SjRuk0
案外遠くないかも
そこに自由自在に英語を使いこなすがあると、キツかった
369デフォルトの名無しさん (アウアウウー Sa09-wn3A)
垢版 |
2018/06/03(日) 18:02:36.60ID:lwvLql6da
>>367
c++は使えた方がいい。
2018/06/03(日) 18:10:58.37ID:Sn3BUjXc0
ruby持ち出すあたりと言語の数でアピールするあたりは土方
2018/06/03(日) 18:14:00.20ID:wHcku/Asa
>>362
9割方できるのに年収5割もないんだが
2018/06/03(日) 18:37:18.74ID:GqeOltBNM
単なる妄想なんだからマジレスすんな
2018/06/03(日) 21:47:17.18ID:NQeh+B6q0
>>371
どうせ転職前だろ
2018/06/04(月) 08:27:18.16ID:egUEpKac0
>>369
rubyでやるようなことをC++でやるのは時間の無駄だろう
375デフォルトの名無しさん (ワッチョイ 1abd-9Pia)
垢版 |
2018/06/04(月) 10:22:00.48ID:U51DyN8C0
論文読んで実装できて、DBを操作できて、画像なり自然言語なりひとつ専門分野を
持っていれば、年収1200万以上の求人がちらほらあるな
まあ、そういう奴は他にもいろいろと出来ることがあるんだろうけど
2018/06/04(月) 10:52:45.21ID:2a6RSZ8ma
rubyやpython等のスクリプト言語はあくまでスクリプトでありその場で結果を確認しながらデータを操作するのに向いている
C等のコンパイル言語はその場で確認といった用途には向かないが最適化すれば実行速度は圧倒的に高速
なのでスクリプト言語でデータを弄りながら方針決めをして、今後同様の操作を何度も行うのであればコンパイル言語でプログラム作成するのが正しいやり方
2018/06/04(月) 10:58:58.35ID:V5YNqVKdM
Rってまだ必要?
2018/06/04(月) 11:03:37.92ID:U51DyN8C0
DSならほとんどの職場でRはメイン言語
機械学習エンジニアでも、DSと職務の分業が進んでなければ、なんだかんだで
Rを使う仕事が回ってくることが多い
てかうちがそう
379デフォルトの名無しさん (アウアウカー Sa5d-wn3A)
垢版 |
2018/06/04(月) 11:54:54.71ID:aXg3ysJDa
日本なんかpythonエンジニア用無し。
アメリカは高収入なのに。
日本は未だCOBOLエンジニアの需要がある。
2018/06/04(月) 12:12:45.42ID:nO1Gbusea
COBOLは退職間際のオッサンなら無理に他の言語学ぶ必要もないが、20代・30代がやるのは危険過ぎる
確実に現役中に需要がほぼ皆無になるのが確定してるから
2018/06/04(月) 12:57:44.82ID:UeJV2JW90
あの何でもコピーして済ませようとする性癖が身につくと
他の言語では3流以下だしね
2018/06/04(月) 13:23:02.38ID:Mm35u4AmM
アメリカでもCOBOL使ってそうだけど^^;
2018/06/04(月) 14:22:53.88ID:r5mvsur00
500以上の求人は管理職クラスになってくるからきついよ
2018/06/04(月) 16:27:17.01ID:/FAaC0Tv0
DSはともかく、機械学習のエンジニアの求人は、1000以上でもスキル要件自体はそこまで厳しくないような…
まあ。中身よく分からないけどライブラリ実装できます、みたいな奴は論外としても。
大学一年程度の数学を理解していて、はじパタ本に毛が生えた程度の、機械学習の理論に関する理解があって、自分の専門領域を自然言語処理でも画像認識でもとにかく一つぐらい持っていれば、それでスキル要件を満たすんじゃないか
もちろん実務に関する細々としたスキルも、持ってること前提の話だけど
2018/06/04(月) 16:30:37.77ID:GYArdKs60
現実見ような
2018/06/04(月) 16:32:51.55ID:rBFur3bP0
雑談スレ、真板でやれ(常套句)
387デフォルトの名無しさん (アウアウイー Sac5-iQ7d)
垢版 |
2018/06/05(火) 00:11:39.63ID:8Iw+/nEDa
>>379
米国も一緒よ
2018/06/05(火) 00:28:08.25ID:ReguELfZa
アメリカの場合、別にPythonが使えるから高収入なわけではないしな
2018/06/05(火) 01:23:13.95ID:EUMft5TI0
流石にpython使えば収入上がるなんて夢想するバカはおらんだろ
2018/06/05(火) 01:35:52.92ID:eJdMbG0h0
技術力の豊富さ≠年収ではない

この分野はいかに顧客を騙せるかが年収を左右する。
2018/06/05(火) 09:31:44.79ID:nmFKZM7kM
わかる
2018/06/05(火) 10:36:23.23ID:kqp72Cm26
pythonのスキルが年収に相関があるんじゃなくて
機械学習的な知識が年収に相関あるんじゃね?
てきとー
2018/06/05(火) 10:48:23.57ID:4dP1NJWe0
数学+統計+機械学習
+python+DB+クラウド+extra …… これで年収600ぐらいかな
自然言語処理とか、そういう専門領域を身に着けて、給料がすこし増える感じ

年収1000を超えている奴らは普段いったい何をやっとるんだろう
2018/06/05(火) 12:05:50.14ID:ng8QTc3R0
google辺りに勤めてんでは。
2018/06/05(火) 12:09:20.15ID:ng8QTc3R0
よほど機械学習で変わるような業務でないと給与は上がらんでしょ。netflixみたいに推薦がなければ事業が成り立たないような
396デフォルトの名無しさん (ワッチョイ d681-CfZI)
垢版 |
2018/06/05(火) 12:27:13.03ID:XrtFx+DZ0
元々そんなに年収高くないサラリーマンやってる前提の話なのか。
その会社にいたままで高所得は難しいのは当然だとおもうが。
転職やフリーは考えないのか。
たとえばテレビ業界とか年収高いほうだろうが、フリーアナウンサーになるのがいるが。
2018/06/05(火) 13:12:53.70ID:4dP1NJWe0
実際そうなんだよね。求人見ると、よさげなところがちらほらある
何度か転職を繰り返して、いろんな刺激をもらって成長していくうちに、突き抜けるんだろうか
398デフォルトの名無しさん (ワッチョイ 4dd2-sZ2J)
垢版 |
2018/06/05(火) 13:29:21.53ID:+AKv4GUB0
【開戦空振り、XDay″】 トランプが米朝戦争、回避したので、九条改憲も、説得力を失った m9(^Д^)
http://rosie.5ch.net/test/read.cgi/liveplus/1528170899/l50
2018/06/05(火) 13:50:33.10ID:T9cUxXgr0
>>394
高級貰ってんだろうな、うらやま
2018/06/05(火) 14:49:58.05ID:WhdJgtXp6
なんでうちのパパ年収1千万超えてたの?
営業マンのくせに
2018/06/05(火) 14:58:19.70ID:dkwyVF1KM
営業は売れば売るだけ稼げる種類のものあるからね
2018/06/05(火) 15:02:27.15ID:T9cUxXgr0
おいしい法人相手の営業とか
2018/06/05(火) 16:24:35.99ID:iejmw7Os0
金の引換券とか和牛の権利を売りつけていたんじゃね?
404デフォルトの名無しさん (ササクッテロ Sp05-cMCF)
垢版 |
2018/06/05(火) 19:15:28.45ID:FpfgnXpSp
>>393
この場合の数学+統計+機械学習ってどのくらいのレベルでしょうか
BishopやMurphyのテキストがちゃんと解読できるくらい?
405デフォルトの名無しさん (ワッチョイ 0e4b-sZ2J)
垢版 |
2018/06/06(水) 06:58:46.99ID:NJm/h3bv0
なんで機械学習ってインタプリタ主流なの?
遅いじゃん
406デフォルトの名無しさん (ワッチョイ 4123-PWQK)
垢版 |
2018/06/06(水) 09:41:33.10ID:I9hgDbEz0
https://youtu.be/zYKOL5RpVbo
【大学数学】ベイジアンネットワーク【機械学習】
概出?
407デフォルトの名無しさん (JP 0Hf1-etJG)
垢版 |
2018/06/06(水) 12:33:25.21ID:bWEoegzUH
全然ネットワークじゃないじゃん
2018/06/06(水) 12:50:20.55ID:SPyKL2bL0
>>404
最新の論文を三日ぐらいで読めればOK
わりとゆるい
409デフォルトの名無しさん (ササクッテロ Sp05-cMCF)
垢版 |
2018/06/06(水) 14:14:23.03ID:r2g/1oegp
>>408
なるほど
あのレベルのテキストだと歯が立たない箇所が多くて
410デフォルトの名無しさん (アウアウカー Sa5d-wn3A)
垢版 |
2018/06/06(水) 17:31:32.85ID:q1bS2rcEa
>>405
Juliaは速いんだけどな。
2018/06/06(水) 19:15:06.34ID:5LVJrhXp0
コンパイラ使うの面倒だからじゃね。
PDCAを早く回すならインタプリンタが楽でしょ
2018/06/06(水) 19:38:43.45ID:hS3HWMA0a
実験的にパラメータちょっと弄って変化確認するならインタプリタが最適
その後実運用する段階ではコンパイル型言語使って作り直してコンパイルした方が速度面で有利だろうけど実際のところどうする人が多いのかは知らない
2018/06/06(水) 19:55:44.28ID:th+iOTAXa
Pythonは実行時にバイトコードにコンパイルする。いわゆる中間コード方式
2018/06/06(水) 21:12:31.67ID:Abx8Yx8C0
結局、機械学習って、
技術追求してもデータに対するアプローチ(指標)が解らないと、詰む?
2018/06/06(水) 21:23:35.70ID:Glbjy1Oa0
どうしてそういう学習をしたのかプレゼン出来ないと
資金源を断たれて詰む
2018/06/06(水) 22:16:22.03ID:A9/lAbnw0
研究者レベルのことを求められても困るのだ
417デフォルトの名無しさん (ワッチョイ d681-CfZI)
垢版 |
2018/06/06(水) 22:34:15.26ID:+qEQXuQ70
>>415
グーグルのアルファ碁からしてわかってないけど発展してるだろ。
別にはなるが、ディープラーニングを広義に学習方法の自動学習法と捉えた場合。
使う手法が、多層ニューラルネットである必要はないわけだが。このへん進んでるか。


ディープラーニング - Wikipedia

しかし、近年、ヒントンらによる多層ニューラルネットワークの学習の研究や、学習に必要な計算機の能力向上、
および、Webの発達による訓練データ調達の容易化によって、充分学習させられるようになった。
その結果、音声・画像・自然言語を対象とする問題に対し、他の手法を圧倒する高い性能を示し、2010年代に普及した。
しかしながら、多層ニューラルネットが高い性能を示す要因の理論的な解明は進んでいない。
2018/06/06(水) 23:08:00.64ID:jB/Oh58q0
Wikipediaコピペは馬鹿にされるからやめたほうがいいよ
2018/06/07(木) 00:41:54.57ID:2mKmeoG5a
機械学習の個々のアルゴリズムには流行り廃りがあるけど統計学に基づく点には変わりないので
最新の機械学習のブラックボックス化された関数使えるより統計学を体系的に学んでいる人の方が長期的には有利
420デフォルトの名無しさん (ワッチョイ eb81-oLIW)
垢版 |
2018/06/07(木) 04:16:51.96ID:EtNPtLaF0
これは?




情報幾何への入門と応用
http://www.sci.osaka-cu.ac.jp/~ohnita/2006/inf_geom/sos_dan/book_0403.pdf


非加法的エントロピーを加法的エントロピーにする方法ーAdS/CFT対応の情報幾何バージョンー
http://www2.itc.kansai-u.ac.jp/~afujioka/talk/tanaka.pdf
2018/06/07(木) 06:24:32.11ID:npK3Jb7s0
CNNとLSTMを"deep"でひとくくりにしていいもんだろうか
422デフォルトの名無しさん (アウウィフ FFd5-MvoD)
垢版 |
2018/06/07(木) 10:15:29.32ID:4mIWw2z0F
>>413
バイトコードにしたからと言ってネイティブ機械語みたく爆速になる訳じゃないよ
for文とかアホみたいに書いてるよりスッキリnumpy使え
423デフォルトの名無しさん (アウウィフ FFd5-MvoD)
垢版 |
2018/06/07(木) 10:17:11.63ID:4mIWw2z0F
>>417
ほんそれ
424デフォルトの名無しさん (ワッチョイ eb8a-6+Fv)
垢版 |
2018/06/07(木) 18:31:54.55ID:Kn/6DS9U0
>>419
いまは実感が湧かないけど、たぶんだけど35歳とか過ぎた頃に違いが出てくるんだろうな
2018/06/07(木) 20:13:26.28ID:E34l5tNQ0
50過ぎてからだよ
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況