【統計分析】機械学習・データマイニング19
■ このスレッドは過去ログ倉庫に格納されています
機械学習とデータマイニングについて何でもいいので語れ若人
※ワッチョイだよん
次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね
■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76
■前スレ
【統計分析】機械学習・データマイニング17
http://mevius.5ch.net/test/read.cgi/tech/1502032926/
【統計分析】機械学習・データマイニング18
http://mevius.5ch.net/test/read.cgi/tech/1507807291/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured 問題はデータサイエンティストとしての知識を披露したいのに、結局凡人が理解出来る範囲しかデータを提供出来ないということ。
分かりやすくするためにいろいろ削った結果、言いたいことがほとんど残らない。
とりあえずクライエントが望みそうな方向に誘導するのが一番無難。 そういうのは論文か本かブログで発表するといいと思いう いやだからお客様のデータを論文で披露するわけないやん >>354
まともなAI(ω)なら会社変われって結論を出すと思うが
おまいは従えるか? DSの仕事は日本にはそうそうないらしい
面接や就職説明会ではどの会社もいい部分ばかりみせるけど
優秀なDSを本当に活用できる企業はほんの一握りで、ほとんどのDSはアナリストのよう
な雑務をこなしながら、いつか良い職に就ける日を夢見て独学で頑張ってるようだ
でも英語を勉強すれば外資にいけるし、英語が出来なくても本当に優秀なDSなら、学歴か実績があれば最近はいろいろといい求人があるんじゃないかな 機械メーカーの研究開発職であちこちセンサー付けた自社製品の機械をひたすら動かしてデータ収集して
種々の解析して異常発生の兆候を見るための手法の開発してるけどこれはデータサイエンティスト?
そうだとしたらほとんどの研究職はデータサイエンティストだろうけど 客のデータで重要な知見が得られたならそれは当然客が競争優位に立つために重要なので詳細を公表できるわけがない
自分の成果を第三者にアピールするなら自力でデータ集めからやるか、個別案件に依存しない新たなアルゴリズムの開発、公の機関との共同研究ぐらいしかないだろう この分野もプログラミングと一緒で
何か個人で成果を出さないと認められない世界になってきた
ということでいいのでしょうか? そんなことないさ
極端は話、論文を読んで実装できるレベルで数学、数理統計学、ベイズ統計、機械学習の理論をしっかり理解し、
pythonおよびライブラリを有名どころ一通り使いこなせて
C++かjavaでアプリを自由自在に組めて、rubyにも精通していて、SQLでDBの操作が出来て、前処理の実務経験も豊富で、本職のDSのようにRを使いこなせたら、年収1500万ぐらいは楽に稼げるだろう
はじパタ本ぐらい読んでこの業界に入る人にとっては、そんなに遠いところでもないはず。自分はまだそこまでたどり着けてないけど この業界で出来る人、ほんとにそのぐらい出来るぞ
rubyはとりあえずアプリを組めれば何でもいい時にできるといいらしい(らしい) pythonできるならpythonでやればいいだろう。 案外遠くないかも
そこに自由自在に英語を使いこなすがあると、キツかった ruby持ち出すあたりと言語の数でアピールするあたりは土方 >>369
rubyでやるようなことをC++でやるのは時間の無駄だろう 論文読んで実装できて、DBを操作できて、画像なり自然言語なりひとつ専門分野を
持っていれば、年収1200万以上の求人がちらほらあるな
まあ、そういう奴は他にもいろいろと出来ることがあるんだろうけど rubyやpython等のスクリプト言語はあくまでスクリプトでありその場で結果を確認しながらデータを操作するのに向いている
C等のコンパイル言語はその場で確認といった用途には向かないが最適化すれば実行速度は圧倒的に高速
なのでスクリプト言語でデータを弄りながら方針決めをして、今後同様の操作を何度も行うのであればコンパイル言語でプログラム作成するのが正しいやり方 DSならほとんどの職場でRはメイン言語
機械学習エンジニアでも、DSと職務の分業が進んでなければ、なんだかんだで
Rを使う仕事が回ってくることが多い
てかうちがそう 日本なんかpythonエンジニア用無し。
アメリカは高収入なのに。
日本は未だCOBOLエンジニアの需要がある。 COBOLは退職間際のオッサンなら無理に他の言語学ぶ必要もないが、20代・30代がやるのは危険過ぎる
確実に現役中に需要がほぼ皆無になるのが確定してるから あの何でもコピーして済ませようとする性癖が身につくと
他の言語では3流以下だしね 500以上の求人は管理職クラスになってくるからきついよ DSはともかく、機械学習のエンジニアの求人は、1000以上でもスキル要件自体はそこまで厳しくないような…
まあ。中身よく分からないけどライブラリ実装できます、みたいな奴は論外としても。
大学一年程度の数学を理解していて、はじパタ本に毛が生えた程度の、機械学習の理論に関する理解があって、自分の専門領域を自然言語処理でも画像認識でもとにかく一つぐらい持っていれば、それでスキル要件を満たすんじゃないか
もちろん実務に関する細々としたスキルも、持ってること前提の話だけど アメリカの場合、別にPythonが使えるから高収入なわけではないしな 流石にpython使えば収入上がるなんて夢想するバカはおらんだろ 技術力の豊富さ≠年収ではない
この分野はいかに顧客を騙せるかが年収を左右する。 pythonのスキルが年収に相関があるんじゃなくて
機械学習的な知識が年収に相関あるんじゃね?
てきとー 数学+統計+機械学習
+python+DB+クラウド+extra …… これで年収600ぐらいかな
自然言語処理とか、そういう専門領域を身に着けて、給料がすこし増える感じ
年収1000を超えている奴らは普段いったい何をやっとるんだろう よほど機械学習で変わるような業務でないと給与は上がらんでしょ。netflixみたいに推薦がなければ事業が成り立たないような 元々そんなに年収高くないサラリーマンやってる前提の話なのか。
その会社にいたままで高所得は難しいのは当然だとおもうが。
転職やフリーは考えないのか。
たとえばテレビ業界とか年収高いほうだろうが、フリーアナウンサーになるのがいるが。 実際そうなんだよね。求人見ると、よさげなところがちらほらある
何度か転職を繰り返して、いろんな刺激をもらって成長していくうちに、突き抜けるんだろうか なんでうちのパパ年収1千万超えてたの?
営業マンのくせに 金の引換券とか和牛の権利を売りつけていたんじゃね? >>393
この場合の数学+統計+機械学習ってどのくらいのレベルでしょうか
BishopやMurphyのテキストがちゃんと解読できるくらい? なんで機械学習ってインタプリタ主流なの?
遅いじゃん https://youtu.be/zYKOL5RpVbo
【大学数学】ベイジアンネットワーク【機械学習】
概出? >>404
最新の論文を三日ぐらいで読めればOK
わりとゆるい >>408
なるほど
あのレベルのテキストだと歯が立たない箇所が多くて コンパイラ使うの面倒だからじゃね。
PDCAを早く回すならインタプリンタが楽でしょ 実験的にパラメータちょっと弄って変化確認するならインタプリタが最適
その後実運用する段階ではコンパイル型言語使って作り直してコンパイルした方が速度面で有利だろうけど実際のところどうする人が多いのかは知らない Pythonは実行時にバイトコードにコンパイルする。いわゆる中間コード方式 結局、機械学習って、
技術追求してもデータに対するアプローチ(指標)が解らないと、詰む? どうしてそういう学習をしたのかプレゼン出来ないと
資金源を断たれて詰む >>415
グーグルのアルファ碁からしてわかってないけど発展してるだろ。
別にはなるが、ディープラーニングを広義に学習方法の自動学習法と捉えた場合。
使う手法が、多層ニューラルネットである必要はないわけだが。このへん進んでるか。
ディープラーニング - Wikipedia
しかし、近年、ヒントンらによる多層ニューラルネットワークの学習の研究や、学習に必要な計算機の能力向上、
および、Webの発達による訓練データ調達の容易化によって、充分学習させられるようになった。
その結果、音声・画像・自然言語を対象とする問題に対し、他の手法を圧倒する高い性能を示し、2010年代に普及した。
しかしながら、多層ニューラルネットが高い性能を示す要因の理論的な解明は進んでいない。 Wikipediaコピペは馬鹿にされるからやめたほうがいいよ 機械学習の個々のアルゴリズムには流行り廃りがあるけど統計学に基づく点には変わりないので
最新の機械学習のブラックボックス化された関数使えるより統計学を体系的に学んでいる人の方が長期的には有利 これは?
情報幾何への入門と応用
http://www.sci.osaka-cu.ac.jp/~ohnita/2006/inf_geom/sos_dan/book_0403.pdf
非加法的エントロピーを加法的エントロピーにする方法ーAdS/CFT対応の情報幾何バージョンー
http://www2.itc.kansai-u.ac.jp/~afujioka/talk/tanaka.pdf CNNとLSTMを"deep"でひとくくりにしていいもんだろうか >>413
バイトコードにしたからと言ってネイティブ機械語みたく爆速になる訳じゃないよ
for文とかアホみたいに書いてるよりスッキリnumpy使え >>419
いまは実感が湧かないけど、たぶんだけど35歳とか過ぎた頃に違いが出てくるんだろうな >>420
情報理論は場合の数の加法性の仮定が前提にあるから使えない。
後者の記事は条件が限定的過ぎて使えない 機械学習のブラックボックス化された関数うんぬんというけど
数学わからない癖に機械学習のアルゴリズムを組んでる
文系エンジニア的な奴はそんなにいないよなあ
そんな入口そうそうない 機械学習ブームがここまで盛り上がるなど予想されていなかったので基礎研究からやってる企業を除いて機械学習の専門家を雇っている企業などほとんどない
バリバリの理系出身だとしても大半は専門外の人間が錬金術的にパラメータ調整してたまたま上手くいっているだけで基礎から理解して使えている人はそうそういない
偶然の産物だろうが適切な出力が得られていればそれで構わないが、基礎が分かっていないと今後新しいアルゴリズムが主流になった時も同様に運任せで錬金術することになる だとしたら、アセンブラ出来ない奴、デジタル回路が組めない奴、はみんな基礎が分かってないから
運任せでプログラムを組むべきじゃないなw
要は、各々の世代でどのレイヤーの知識が重視されるか?なんだと思う
今はベクトル数学や統計学のレイヤーとは離れた技術が上の層にどんどん積み重なっていて
そろそろ分業しないと成り立たなくなる時代が来ている様な気がする 富士通のZinraiとか、金かけて、宣伝しているけど、
国内企業のAIってどのレベル?
某大手企業のを試用した範囲では、ゴミのような出来。
このスレの連中のような趣味でやってるレベルにも達していない。
「偶発的な適切な出力」という表現があるけど、
恐らく、作っている奴は、「適切」の指標すら解っていない。 大手企業つっても零細に丸投げしたの納品したりするから出来がまちまちなんだよ 東芝、NEC、オムロン、富士通、日立
みたいなところの研究所からは
まともな研究が出ているけど
それを商品化するところは丸投げするから
変なのが出てくる 日本のメーカーは組織が疲労している P ドラッカー AIで会社経営を立て直すには過去の大量の成功・失敗の経営情報が詳細な内部情報とセットで必要であり
それは一社及びそのグループ会社程度の規模では量的に足りなさすぎるので実質的に不可能と考えて良い BIやっても
それを読み解いて
活用できる経営者が居ないとね 機械学習って、統計学の横に色んなジャンルが派生的に発展していて
縦に発展しているようなイメージがないんだが
流行り廃りで、いま学んだ知識の大半が今後は通用しなくなりそうというか
業界の人たちはかなり悲観的だよね 派生部分しか理解していない人は流行りが終了すれば新しい流行りを1から勉強し直す
根幹となる統計学が理解できていれば新しい流行りの理解も早いはずなので流行り廃りに対応しやすくなる ■ このスレッドは過去ログ倉庫に格納されています