【統計分析】機械学習・データマイニング19

■ このスレッドは過去ログ倉庫に格納されています
2018/03/09(金) 18:09:45.75ID:WX3plG2ad

機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング17
http://mevius.5ch.net/test/read.cgi/tech/1502032926/
【統計分析】機械学習・データマイニング18
http://mevius.5ch.net/test/read.cgi/tech/1507807291/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
2018/05/04(金) 02:16:20.57ID:bK3Gh0RP0
知らんがな
153デフォルトの名無しさん (アウアウエー Sa82-XucL)
垢版 |
2018/05/04(金) 02:34:10.65ID:9i+OMC2Ta
前者はAIでも可能
後者が出来るのは人類と宇宙人だけ
2018/05/04(金) 03:04:42.90ID:aUVy4DgX0
ちんちんシュッシュ
155デフォルトの名無しさん (ワッチョイ bb81-a7mP)
垢版 |
2018/05/04(金) 14:26:05.44ID:KcBJq3t70
某中堅の監査法人に勤めていて、1年ほど前から、人工知能を使った業務の自動化を検討して、
私もそのメンバーに選ばれましたが、私も含め周りの人間も手探り状態です。

大学は商学部出身なので、高校数学からやり直し、大学の線形代数、微分積分、確率
とやってきて、今、統計学(学士以上、修士未満、測度論の手前まで)を一通り学び終わったところです。
資格でいうと、統計検定準1級合格レベル(来月受験予定)、品質管理検定1級、アクチュアリー一次試験・数学合格。

ここまでだと、大学のカリキュラムや資格試験の出題範囲に沿って勉強していけばよかったのですが、
このあと、機械学習・データマイニングへと進んでいくには、どういうカリキュラムを組んで良いか途方に暮れています。
何か道しるべになるようなサイトやアドバイスを頂けないでしょうか?
2018/05/04(金) 14:38:42.92ID:6UZD6yO4a
仕事に就けよ
2018/05/04(金) 15:29:34.02ID:Xs/3uOHs0
頭悪い
158デフォルトの名無しさん (ササクッテロラ Sp23-XvOm)
垢版 |
2018/05/04(金) 15:32:47.26ID:UrowMpykp
機械学習なんか数学わからなくても適当にライブラリ突っ込めばなんとかなるだろ
2018/05/04(金) 15:40:19.58ID:gcrbzhuS0
結局実務に活かしたいの?機械学習を学びたいんの?
160デフォルトの名無しさん (ワッチョイ bb81-a7mP)
垢版 |
2018/05/04(金) 15:51:29.33ID:KcBJq3t70
>>158-159
着地点は実装ですが、前提として理論はしっかり学んでいきたいと考えています。

以前にも、コンサルティング会社とシステム会社にオブザーバーをお願いして、
内外のツールの選定作業をしましたが、どれも実務上使い物になるものはありませんでした。
2018/05/04(金) 16:36:19.06ID:7Lir60Yr0
お前が作ったやつが実用になるとおもってるのか(苦笑)
2018/05/04(金) 18:51:16.04ID:bK3Gh0RP0
業務の自動化に費やした時間>通常業務時間
となるのが目に見えてるな。

内部の人間しか細かい要求に答えられないと思われるが、システムの継続と保守を考えたら外注するのがコスト的にベストだよ。
需要に合ったものが出来ないのなら、コミュニケーション不足と考えたほうがよい。
2018/05/04(金) 19:29:00.82ID:CiEZteI50
>>160
もう、自分たちで作るしかないな

理論からしっかり組み立てて
試行錯誤の後、3年くらいで使い物になるものが出来るんじゃね?
2018/05/04(金) 20:11:29.97ID:aUVy4DgX0
専用にプログラマ雇ったほうがいいのでは?
本業とひっくり返りそうだ
165デフォルトの名無しさん (スププ Sdaa-L/eJ)
垢版 |
2018/05/04(金) 23:23:35.05ID:LjKjJrNYd
システムの継続と保守ってとこが、無限に金吸い込まれて行くブラックホールになるんだよな。
166デフォルトの名無しさん (ワッチョイ bb81-a7mP)
垢版 |
2018/05/04(金) 23:58:23.94ID:KcBJq3t70
コメントありがとうございます。
内製か外注かという点については、内部でも会議が重ねられましたが、
情報漏洩防止、株主代表訴訟対策、ノウハウの蓄積、コンサル業務への将来的発展性など
もろもろの諸事情を勘案して情報戦略として、内製ということで決まりました。

今は所内で社内SEを育てようと、私も含めてここ1年間はずっと社内・外部研修&自習学習で、
本業からは外れています。経験者採用もやっていますが、なかなかこの分野での研究実績が優れた人は見つからないですね。
2018/05/05(土) 00:49:10.67ID:mfDX1kRR0
理論寄りの話はコンピュータ科学、実装寄りの話は情報工学やソフトウェア工学を学ぶのがいいと思うよ。
2018/05/05(土) 02:16:45.97ID:AI3wdtqMa
ツイッターで
CNNが畳み込み演算ってのは間違いで
正しくは相互相関だぞってキレてる
畳み込み警察いてわらう
2018/05/05(土) 05:22:23.10ID:mYUVM+9u0
convolution=畳みこみじゃなかった?
2018/05/05(土) 08:36:54.54ID:X7W9+/sC0
Yes高州クリニック
2018/05/05(土) 08:57:44.25ID:fg/m/ffT0
>>155
人工知能を使うことが目的になってるように見えるけど、人工知能でどういう問題を解決したいの?
2018/05/05(土) 10:50:42.85ID:mYUVM+9u0
> 某中堅の監査法人

ってあるから
検査の結果が異常かどうかの判定や
品質の予測かな

だとしたら
既存のディープでない機械学習で十分に思える
2018/05/05(土) 12:14:35.24ID:5AtpQsf4a
深層学習の畳み込み層の処理は「畳み込み」じゃなかった件
http://tdual.hatenablog.com/entry/2018/05/02/113110
https://twitter.com/tdualdir/status/991505578311667712
正しくは相互相関 なぜConvolutionalと名付けた まあ、ただの名前だし、数学の用語が誤用させるのはよくある

T2@T_Shuke
微分・積分・統計学を学べばconvolutionは幾度も出てくるけど、勉強してこなかったデータサイエンティスト(笑)はcnnで元来の意味とは異なる畳み込みを先に覚えてしまうということか

tdual@情報幾何
おい。畳み込み層の処理は畳み込みじゃないのかよ。
相互相関かよ。

きくらげ@Kiikurage
最近の「CNNは畳み込みじゃない」論争、なにが発端?
2018/05/05(土) 12:18:21.17ID:5AtpQsf4a
なんかこえー畳み込みおじさんいて笑う

T2 @T_Shuke
微分・積分・統計学を学べばconvolutionは幾度も出てくるけど、勉強してこなかったデータサイエンティスト(笑)はcnnで元来の意味とは異なる畳み込みを先に覚えてしまうということか

T2 @T_Shuke
できない、やらない、聞く耳を持たない、常に上から目線、大企業病の自称大企業の自称データサイエンティストは業界の面汚しだと自覚してほしい


T2 @T_Shuke
データサイエンティストは確率積分方程式とか勉強するの?


T2‏ @T_Shuke
確率論もさることながら統計学もやらないでデータサイエンティストを騙る人が多くて恐ろしい
2018/05/05(土) 13:07:58.74ID:WeHVwUop0
で何がいいたいの?
2018/05/05(土) 13:32:48.47ID:mYUVM+9u0
マウント取りたい、でわ?
2018/05/05(土) 14:59:39.78ID:1G3J9UmWM
マウントでは無い。ガードポジションだ。
2018/05/05(土) 16:40:59.33ID:aHGQVvYa0
三度の飯より好きな粗探し
2018/05/05(土) 17:19:15.82ID:3Z0P2vrnM
実際、CNNが畳み込みだと思ってる馬鹿が多いことに呆れるだろ
ここにもいるみたいだけど
まあそれだけディープニューラルネットが馬鹿でもそれなりに使えるようになったってことだけださ
180デフォルトの名無しさん (アウアウエー Sa82-XucL)
垢版 |
2018/05/05(土) 17:53:07.26ID:JV+fv9fZa
あなたは心の病気だよ
相手が誰でも喧嘩を吹っかけて勝った気にならないと落ち着かない症状
しかしそんな事じゃ本質的な解決を避けてるだけだから
いつまでも満たされずにいつも不安になる
そして不安を一時的に誤魔化す為にまた喧嘩してマウント
DLの事など全く関係が無い
少しでも勝てそうなポイントばっかり探して勝とうとするだろ
負けそうになったらすぐ退散か話題をブチ切り
医者に相談するレベルで異常だよ
少なからずあなたのような人はいるけどいつまでもやってると全員にNGされて一人で絶叫するだけ
以前にも指摘されてたろ
こう書いても無視か絶叫だろうが
何らも会話する要素が無い
知らない人はあなたのコメントに惑わされることもあるだろうが
ウンザリ
2018/05/05(土) 18:03:59.62ID:mYUVM+9u0
おじさんていうか、この画像見る限りカマ野郎だな
2018/05/05(土) 18:41:33.03ID:6z2bJvRq0
単純なデータマイニングだったとしても
今ならAIと吹聴できる雰囲気
2018/05/05(土) 18:48:01.93ID:fg/m/ffT0
http://pr.fujitsu.com/jp/news/2017/08/30.html
これAI?
2018/05/05(土) 18:51:58.57ID:2crywUWm0
>>183
ただのシンプレックス法にみえますが
185デフォルトの名無しさん (アウアウエー Sa82-XucL)
垢版 |
2018/05/05(土) 18:52:13.33ID:JV+fv9fZa
いいえ
2018/05/05(土) 19:59:20.26ID:mYUVM+9u0
線形計画法?
まさかね
2018/05/05(土) 20:48:19.40ID:3UnMqSUUa
>>183
そもそもAIに統一見解などないので何でもAIと言ってもいいしAIでないと言ってもいい
2018/05/05(土) 22:12:18.36ID:fg/m/ffT0
この説明もわかりません
「例えば、8,000人の子供がそれぞれ第5希望まで希望を出すと、5の8,000乗通りの組み合わせが出てきます」
保育園の数をnとするとこども1人あたりの希望のパターンは5通りではなくて n x (n-1) x (n-2) x (n-3) x (n-4) 通りになるように思えるのですが
2018/05/05(土) 23:22:52.20ID:SKb5ESLld
ちなみに以前からいる数オタサラリーマンはID:5AtpQsf4aではないから一緒にすんなよ
2018/05/05(土) 23:26:57.44ID:IRsLdu93H
言ってることには完全同意だが
191デフォルトの名無しさん (アウアウイー Sa63-yf0G)
垢版 |
2018/05/05(土) 23:46:21.20ID:enzOGVxga
>>184
最適化には見えるが、シンプレックス法を使っているかどうかは
だれがみてもわからないでしょ。
192デフォルトの名無しさん (アウアウウー Sacf-rBcH)
垢版 |
2018/05/06(日) 06:48:12.43ID:Rzf1X+Soa
>>187
最狭義に解釈したら全脳シュミレーション。
193デフォルトの名無しさん (ワッチョイ 1fe5-yy75)
垢版 |
2018/05/06(日) 21:32:25.66ID:+C0M/Mi80
ある個人が1日に10回体重を計ったデータが100日分あるとしてください
いわゆるディープラーニングでは、その10個のデータを渡せば特徴量間の関係も織り込んだ予想をしてくれるのでしょうか
それとも最大値と最小値の差や標準偏差といったものを算出して特徴量として使うほうがいいのでしょうか?
2018/05/06(日) 22:33:48.38ID:+57R8Rqo0
同じ人の体重が1日10回の100日あったところで微妙な体重の増減しかわからないし、ディープラーニング関係ないんじゃないの?
2018/05/06(日) 22:34:25.54ID:dnghj99u0
>>193
最近の流行は前者ですね
1000サンプルでは全く足りないと思いますが
2018/05/06(日) 22:55:58.93ID:1EffEJkT0
>>193
特徴量間とか言って体重以外にどんな特徴があるかわからんし何させたいのかわからんからなんとも言えない気がする。
2018/05/07(月) 00:30:01.13ID:QYgoMqFn0
話をぼやかすのはいいけど大事なとこも飛んでるんじゃないか
2018/05/07(月) 09:46:21.00ID:QcYL19ie0
脳味噌も飛んでるんだろ
199デフォルトの名無しさん (ワッチョイ 1fe5-yy75)
垢版 |
2018/05/07(月) 09:57:51.89ID:WowDb12P0
>>195
ありがとうございますその方向で始めてみます

>>194, 196, 197
すみません例えが悪すぎました
2018/05/08(火) 10:12:54.82ID:Hod3NdbK0
マイクロソフト、FPGAを用いたAI処理基盤「Project Brainwave」開発者向けプレビューを発表。GoogleのTPUより高性能と。Build 2018
https://www.publickey1.jp/blog/18/fpgaaiproject_brainwavegoogletpubuild_2018.html
2018/05/08(火) 13:10:53.78ID:6KNfCOeG0
Azureって全然使ってる話聞かないな・・・
2018/05/08(火) 13:36:51.21ID:HLj53JRe0
MS教徒は使ってるだろう、たぶんw
2018/05/08(火) 14:15:29.26ID:Z/lGKNEa0
>>201
話を聞かないだけで裏で動いてる
大半の人は使ってるよ
2018/05/08(火) 14:18:31.99ID:6KNfCOeG0
試用期間だけ使って放置してたら営業から電話かかってきて乗り換え先聞かれたよ
あんまうまくいってないんだと思う
2018/05/08(火) 15:30:36.00ID:JhnZm3ev0
アズーリってイタリア代表のことだろ
206デフォルトの名無しさん (アウアウエー Sa82-XucL)
垢版 |
2018/05/08(火) 16:42:21.10ID:75TKeViaa
>>200
ニコニコドワンゴのFPGAはどうなったんだっけ?
断念したんだっけ?
2018/05/08(火) 17:21:44.51ID:Uy9kTMLc0
草草草
2018/05/08(火) 17:46:58.59ID:hk49TKVYF
>>206
まだ募集中らしい
http://gihyo.jp/dev/serial/01/dwango-engineersoul/0003?page=2
http://dwango.co.jp/recruit/
2018/05/09(水) 08:44:29.12ID:zJcTmdKI0
>>201
あんたが知らないだけ。
今のMicrosoftは、WindowsやOfficeじゃなくてクラウドの会社。
2018/05/10(木) 23:55:52.88ID:4xKRIE0p0
千葉 雅也『勉強の哲学 〜来たるべきバカのために』は、昨年度の文系書籍部門ベストセラーだったけど買わなかった。

さっきなんとなく立ち読みしたら、機械学習的発想だった。「バカになれ」とは「全体を見ないで専門バカにならないために、適当に勉強を切り上げて、
次の流行に次の流行に…と軽薄にやりつつ、試行錯誤の経験を蓄積するためにバカにされることを恐れずにイタイ発言とか作品発表とかもどしどしやろう」っていう事らしい。
2018/05/10(木) 23:58:12.62ID:4xKRIE0p0
まあおそらく、全ての知識は陳腐化するから全ての人はバカになる。だから、バカを極めた超バカは超賢いに?!?
2018/05/11(金) 00:01:38.26ID:V7mBfh0G0
さっきインスタンス死になりかけた。
ギリギリ、ランチのフランス料理にいいワインつけてデザートとった程度で気が付いた。
2018/05/11(金) 00:16:05.19ID:/s88DeTW0
>>210
面白そうな人だね

プログラミングでいえば、
C++ の求道的な道には見切りをつけて、javascript ruby, php, らの流行のフレームワークを追いかけつつ
糞なプログラムもどんどん書こう、

ということですか
2018/05/11(金) 00:36:45.81ID:y+BskuzCa
過去のAIブームと同様に機械学習ブームも早晩終わるわけで、根底にある統計学的な理論を理解しようともせず
ブラックボックスのパッケージ使うだけの人はこの機械学習ブームからは何も学べていないに等しいと言える
2018/05/11(金) 02:12:10.95ID:A7F+PL7k0
RDBMSの理論的背景を知らなくたって、ただblogサイトを作るために(Wordpress等のために)MySQLを使うことはできる。
機械学習のプロダクトも簡単なものから順に日用品化していくよ
2018/05/11(金) 04:36:05.76ID:CPfY1M+aM
ニューロファジィブームなんてあったな
2018/05/11(金) 08:26:38.06ID:rUq6uHhNa
>>215
日用品化していくからこそ、それを単に使えるだけという能力には徐々に価値がなくなるので背景の理論の理解が必要ということ
2018/05/11(金) 09:43:13.74ID:VcqjRgjX0
ニューロファジィ洗濯機とかあったな
あのブームは何故終わったんだろう
2018/05/11(金) 10:29:41.45ID:6zO/OIdMa
基本的にAIと呼ばれたものが一般に広まって当たり前に使われるようになれば単なるアルゴリズムの一種としか見なされなくなるから過去のAIブームの産物も消えたようでこっそり生きている
ただAIと呼ばれることがなくなっただけ
2018/05/11(金) 11:27:07.44ID:ZT+eqGwU0
マッチングを三角形でやるだけ(笑)
2018/05/11(金) 11:40:54.70ID:8z0MZM/ia
>>210
一つの学習器だけ使ってると過学習するから弱学習器をいっぱい積み重ねた方が汎化性能良くなるよ、って話かな。
人間としてどっちが上等とは一概に言えない気もするけど。
222デフォルトの名無しさん (ワッチョイ 230e-SSf1)
垢版 |
2018/05/11(金) 12:38:43.15ID:J1gyQeij0
たしかに人間も過学習で馬鹿になった人をいっぱい見かける
2018/05/11(金) 13:30:59.55ID:A7F+PL7k0
>>217
最高性能を追求するならそうだけど、SOTAの8割の性能でいいから自動化したいみたいな用途なら出来合いのお任せでも十分
224デフォルトの名無しさん (JP 0H19-uR0+)
垢版 |
2018/05/11(金) 15:27:30.15ID:Do9Vt+CWH
>>210
文系ぽいアホな言い分
2018/05/11(金) 16:27:06.60ID:bEMX4pkHa
>>223
労働者目線では出来合いのおまかせなら誰でもできるわけで給料が上がりづらいので、
理論を体系的に理解した上で各時代の最先端(その時点では簡単に出来合いのものを、というわけにはいかないもの)が扱えなければならない
226デフォルトの名無しさん (ワッチョイ 2581-uwJI)
垢版 |
2018/05/12(土) 11:48:14.28ID:I4hg+tR90
年を負う毎に技術が高度化しているから、技術格差が所得格差に繋がるのは必然でしょうね。
昔は、スタンドアローンのスクリプトが書けるだけで、月に200万円も貰えた時期がありましたが、
今じゃ、学生さんやお年寄りでも、使える人がいる。一方で、今でさえ、それすらできない人もいる。
227デフォルトの名無しさん (ワッチョイ 2581-uwJI)
垢版 |
2018/05/12(土) 11:56:56.98ID:I4hg+tR90
現状こんなところ
システムを使うだけのオペレーター:年収300万円(AIに取って代わられる可能大)
ライブラリーを呼び出して使うだけのエンジニア:年収600万円(今はIT人材不足だが、将来的には単価下落の方向)
そのライブラリーを作れるエンジニア:年収1000万円(技術力を更新できれば、単価維持も可能)
オリジナルの技術でビジネスモデルを構築できるエンジニア:年収1000〜∞万円
2018/05/12(土) 12:01:56.36ID:oLH0Jxi00
年収千円〜数万円か
2018/05/12(土) 12:17:19.98ID:Gp1ZevWI0
aiって発展途上だし
いずれ壁にぶつかるよ
230デフォルトの名無しさん (ワッチョイ 2581-uwJI)
垢版 |
2018/05/12(土) 12:33:32.56ID:I4hg+tR90
>>229
>いずれ壁にぶつかるよ
それは、オマエの狭い狭〜い了見からの思い込みにすぎない。

壁にぶつかるか、壁を突き抜けていくか。壁を突き抜けていくと考える研究者の方が多数派。
最近のトップカンファレンスでの発表を見聞きしていると、その確信が深まる。
2018/05/12(土) 12:46:18.99ID:t5IX29IH0
>>229
ただ氷河期があるだけだよ。今のブームが終わると次は10年以上先に第4次AIブームがくるだろう(たぶん、きっと)
2018/05/12(土) 14:07:11.87ID:Gp1ZevWI0
>>230
どのカンファレンスで?
233デフォルトの名無しさん (ワッチョイ 2581-uwJI)
垢版 |
2018/05/12(土) 14:25:33.05ID:I4hg+tR90
>>232
NIPS、IJCAI、ICML、ICANN・・・
e.g. GANs in ICANN2017
2018/05/12(土) 15:09:53.56ID:k3HnGCAi0
もうちと技術的な話題を語りたい
2018/05/12(土) 15:12:00.80ID:k3HnGCAi0
イメージだけが先行するのはよくない
2018/05/12(土) 15:13:28.18ID:Gp1ZevWI0
>>231
氷河期には同意
2018/05/12(土) 16:06:46.04ID:mNXPQM7YM
壁にぶつかるとしたらハードの方じゃない?
2018/05/12(土) 16:13:25.11ID:9vavBtpKM
嫌、資金繰りでしょ
 予算なくして何も動かず
2018/05/12(土) 16:58:31.26ID:rGvoCbsi0
壁を打ち破る理論が出るのが早いか
投資家に見放され、陳腐な技術に堕ちるのが早いか
2018/05/12(土) 20:48:46.86ID:k3HnGCAi0
>>239
いいね。その視点。
2018/05/13(日) 09:26:21.44ID:Aqkp1SM/0
アホだろ、何も言っていない
2018/05/13(日) 13:05:08.75ID:5GB+Z4yy0
機械学習は進歩早いからオリジナルの技術って言っても何かに利用しましたっていう部分しかない。
ネットワームモデル自体の研究は研究者の仕事だ
243デフォルトの名無しさん (ワッチョイ c59f-SSf1)
垢版 |
2018/05/13(日) 14:09:00.06ID:44h/7/Ui0
他の理論が出てきても無駄にはならんしょ
2018/05/13(日) 15:57:51.89ID:c7M0ifU90
競艇とか競馬の着順予想って順位を予測するのが多いのかな?
タイムのほう予測できない? 👀
Rock54: Caution(BBR-MD5:8f50f269c4f2853ecd0dfe9a88a1b798)
2018/05/13(日) 17:23:36.58ID:XX/GFF2c0
なんで目玉ww
2018/05/13(日) 19:54:44.45ID:5GB+Z4yy0
つうかただのPGはどの分野でも400が相場だろ
500以上は管理職クラスだ
2018/05/13(日) 20:12:13.07ID:7hdE7MHA0
俺もPGになりたい
2018/05/13(日) 20:34:58.03ID:I2IQY/cn0
プリンターのお守り
テープかけ
カード読まし

バブル期最低のハイテクバイト
2018/05/13(日) 21:20:58.66ID:OMM0aEsA0
>>246
流行の最先端を走ってるPGなら800はいける
米国なら青天井
2018/05/13(日) 21:28:31.61ID:eWw2CnRZ0
>>249
>流行の最先端
今の最先端はなんですか?
2018/05/13(日) 22:49:53.01ID:OMM0aEsA0
・・・スマホゲーム?(笑)
252デフォルトの名無しさん (ワッチョイ 2581-uwJI)
垢版 |
2018/05/13(日) 22:53:56.18ID:sJLHDeLd0
今の労働市場で、PG400万円って、よほどこき使われているだろw
東京の話だが、600万円が中央値。フリーのPGなら800万円程度。
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況