【統計分析】機械学習・データマイニング20

■ このスレッドは過去ログ倉庫に格納されています
2018/08/07(火) 18:56:37.59ID:sGPH9ejna
機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング19
http://mevius.2ch.net/test/read.cgi/tech/1520586585/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
2018/08/20(月) 13:45:29.62ID:FFhVJI7V0
ウォズニアック(笑)、買ってきて分解するかハッキングで秘密情報をゲットするかだろ
2018/08/21(火) 01:36:24.60ID:/yckThHF0
自称データサイエンティストwにはコスト意識欠如したバカが多い
RMSE0.01の世界を仕事に持ち込むかどうかは
解こうとしてる業務課題によるってのを分かろうとしないんだよな
kaggleみたいな趣味を仕事に持ち込むなっての
2018/08/21(火) 02:01:10.52ID:0i7+6f1S0
データサイエンティストは資格団体が儲けるために宣伝してたものだから
2018/08/21(火) 02:55:06.78ID:/yckThHF0
santanderだかhomecreditだか知らんが
お前らはそのクズ脳使って現実世界で
いかに結果を出すかが勝負だろうに・・・
こんなクズらを量産してるコンペサイトも責任あるわな
2018/08/21(火) 07:38:48.25ID:QzaLOIOta
データサイエンティストを活用できないような旧態依然の仕事の仕方しかできない企業だと自白してるようなものだな
143デフォルトの名無しさん (JP 0H49-N245)
垢版 |
2018/08/23(木) 10:00:35.80ID:OjwP8SxPH
トヨタも虜にする「天才が憧れる天才」AI企業
https://www.businessinsider.jp/post-173455
2018/08/23(木) 10:20:54.57ID:CIjDH4qv0
こういう宣伝するから舐められるんだよ
2018/08/23(木) 17:38:39.42ID:HHKF7Z0Cd
トヨタ傘下の宣伝乙
2018/08/24(金) 04:04:32.75ID:9ULU2Heua
流行りの分野なのに過疎ってるなw
147デフォルトの名無しさん (ワッチョイ ead2-Gisg)
垢版 |
2018/08/24(金) 04:27:49.76ID:/HKmPBJZ0
バリバリやってるような若い人は来ないんじゃね
今やひろゆきプラマイ3歳くらいのロートルおっさんの吹き溜まりでしかないから
148デフォルトの名無しさん (ワッチョイ 668a-wF79)
垢版 |
2018/08/24(金) 18:27:13.17ID:6/Hl2w7N0
kaggleを仕事の世界に持ち込むメリットそこそこあるけどな
やっぱりkaggleで称号を持つぐらいの奴が会社にいれば
営業が社の強みとしてアピールできる材料に出来るだろうし
なにより流れ作業で仕事をしないことで、知識が蓄積されるから人材が育つ

識別器のライブラリだけ暗記して、直感の力で仕事をしている奴なんて
いずれは冷や飯を食うことになるから
ブームが続いている今のうちに、早く新しい分野を開拓しないと
2018/08/24(金) 21:13:23.89ID:/I2dO3CP0
ブームは終わってる
2018/08/24(金) 22:08:26.47ID:HU5uwe68a
>>148
中小企業ならどうかしらんが、チームで仕事するのに邪魔なだけ
2018/08/24(金) 22:17:03.65ID:44W3Jl8Zd
普通に働いてたらkaggleとかやる時間ないってw
2018/08/24(金) 22:18:42.76ID:NZdsQ/EYM
社畜には時間がない
2018/08/24(金) 23:45:08.95ID:4Fq5m83Sa
まだkaggleのコンペって参加したことないけど個人で上位入るような人ってどれぐらい時間かけてるんだろう?
2018/08/25(土) 12:22:02.93ID:00w/RGH3a
これから失敗作のメンテナンスの仕事が増えるのかな?
2018/08/25(土) 13:29:16.58ID:DbpiyqTC0
大企業で機械学習のエンジニアやっても
pandasでデータを読み込んで、sklearnで識別器を用意してデータに適合させて
予測を出して、識別精度を確認して、matplotlibでグラフに吐き出して、「ハイ、終わり!」
というイメージがある
実際はもっと大変なことしてるんだろうけど
2018/08/25(土) 13:33:08.64ID:lUMKao1I0
if文の分類で済む案件でも機械学習でやるのが最近のトレンド
2018/08/25(土) 15:27:10.18ID:EiC1ChZC0
if then elseのは255個までだったかw
2018/08/25(土) 16:07:18.11ID:rvalG9fC0
中国の一部のスタートアップは
機械学習とうたっていながら
後ろで人間が動いているそうだ
159デフォルトの名無しさん (ワッチョイ bd23-oIkv)
垢版 |
2018/08/25(土) 16:15:01.69ID:XJJEagRp0
ネット検閲を人力でやる国だからな
2018/08/25(土) 20:39:30.67ID:x0dm8Qgo0
NRIもそうだと、NRIスレで読んだ。
2018/08/26(日) 00:54:53.86ID:ZXXU+XiBa
中国の人件費なら優秀なエンジニア雇うより人力の方が安上がりだろうなと思ったけど日本でもIT土方の人件費ならまあまあ安上がりか
162デフォルトの名無しさん (ワッチョイ ead2-Gisg)
垢版 |
2018/08/26(日) 02:03:09.46ID:xGLfO5+N0
アルファ碁ってハードと電気代凄いんだっけ
古い話だがディズニー初CG映画のトロンのエンドロールで
CG風手書きの中国人クレジットが大量に出てたの思い出した
2018/08/26(日) 09:08:47.86ID:Y7gWViZy0
>>162
普通のPCだと計算に2万年掛かるらしいw

論文でこうやれば、とんでもなく強い将棋ソフトが出来るよ〜って発表されてるのに、
ハードのハードルが高すぎて、誰も再現できてない
2018/08/26(日) 14:19:30.69ID:YDdfe8KHa
courseraのmachine learningの開講日が9/3って書いてるけどこれっていつでも好きな時に始められるんじゃなかったんだな
2018/08/26(日) 15:22:19.38ID:Vik0GRh80
深層強化学習は計算コスト高い
2018/08/26(日) 15:43:18.52ID:zKxHvctla
人気も高い
2018/08/26(日) 23:37:53.15ID:EQMoXtKGM
>>164
気にしないで開始したけど問題ないみたい
2018/08/27(月) 12:58:47.96ID:NrR+t5G40
この度、一度挫折した機械学習に再入門しようと思いこのスレに来たのですが、おすすめの書籍やサイトなどありますか?
2018/08/27(月) 13:33:39.51ID:IaPqXo0qr
Udemyで全講座1200円セールしてるから好きなの選んだら
2018/08/27(月) 13:52:59.26ID:0RSt9/yYa
定番オライリーのゼロから
2018/08/27(月) 16:52:51.31ID:9Rk35fCU0
大学一年レベルの数学→最適化数学→はじパタ本→達人データサイエンティストによる理論と実践
これにプラスで、ゼロから作るdeep learningを読めば、ベースの知識は作れる
172デフォルトの名無しさん (アウウィフ FFa1-DNis)
垢版 |
2018/08/27(月) 17:38:35.99ID:Q4eMB8PsF
ただしF欄は除く
173デフォルトの名無しさん (ワッチョイ b65a-/8lv)
垢版 |
2018/08/27(月) 19:28:35.38ID:3tv7gyOX0
>>168
・やさしく学ぶ 機械学習を理解するための数学のきほん
・人工知能プログラミングのための数学がわかる本
・ゼロから作るDeep Learning(2冊)
174デフォルトの名無しさん (フリッテル MM2e-oIkv)
垢版 |
2018/08/27(月) 22:19:47.74ID:S8OKJlGuM
kerasのLSTMって、まだpeepholeに対応してないの?
2018/08/27(月) 23:16:18.81ID:/KrSPkLld
tf で見たから使いようはあるでしょ
2018/08/28(火) 02:12:53.08ID:mzHghCiAa
わかパタ買ったんだけど、その前にはじパタ読んだほうがいいの?
177デフォルトの名無しさん (アウアウウー Saa1-Zm8m)
垢版 |
2018/08/28(火) 05:35:17.79ID:uOZLnoMMa
日本はAI・ロボット化の開発競争に敗れ国際競争力を失い下手をすると2025年あたりには一億総失業になる。
2018/08/28(火) 07:55:50.04ID:GU2LbP2xa
機械学習を支える大学数学を学び直す 中井悦司著『技術者のための線形代数学』発売
https://codezine.jp/article/detail/11006
2018/08/28(火) 08:18:13.05ID:y25npp8k0
最近、技術系の書籍は壊滅的だったのに、
機械学習関連だけは大復活で色んな本が出てるね
180デフォルトの名無しさん (ブーイモ MM8e-/8lv)
垢版 |
2018/08/28(火) 08:50:04.97ID:ESzSTJ18M
中身大して変わらないのにタイトルに「機械学習のための〜」とか付けると馬鹿が買ってくれる
2018/08/28(火) 09:15:49.81ID:nucg3hcz0
初学者向けの本が乱発してるのは
宣伝としてやってるんだよ。
本自体で稼ごうとしているわけじゃない
2018/08/28(火) 09:19:27.01ID:y25npp8k0
>>181
「やさしく学ぶ 機械学習を理解するための数学のきほん」のことですか?
183デフォルトの名無しさん (アウアウウー Saa1-Zm8m)
垢版 |
2018/08/28(火) 10:12:48.93ID:AXaUJqBfa
>>181
石村夫妻が「よくわかる機械学習のための数学」とか長沼伸一郎氏がブルーバックス本を書かないのがおかしい。
2018/08/28(火) 10:15:43.37ID:3VNxsysUM
機械学習の直感的解釈なんて本だと被るね。いま本書いてるひと皆弟子みたい
185デフォルトの名無しさん (ワッチョイ a5d2-wF79)
垢版 |
2018/08/28(火) 11:22:51.50ID:d5FF+Adu0
【癌センター、収益UP】 ×さくらももこ(53) △貴乃花(46) ×亜利弥((45) △神の子KID(41)
http://rosie.5ch.net/test/read.cgi/liveplus/1535420186/l50
186デフォルトの名無しさん (ラクッペ MMed-NdIa)
垢版 |
2018/08/28(火) 15:15:25.81ID:DCHZu+I+M
pythonとkerasによるディープラーニング買った
これでkeras極めるけどkerasくらいならこの本いらんかったかな…
187デフォルトの名無しさん (ラクッペ MMed-NdIa)
垢版 |
2018/08/28(火) 15:17:58.39ID:DCHZu+I+M
ディープじゃない機械学習って学ぶ意味ある?
素人の素朴な疑問でごめん
sklearnはデータ分割する時くらいしか使わないなあって思って
188デフォルトの名無しさん (アウアウウー Saa1-Zm8m)
垢版 |
2018/08/28(火) 15:19:13.14ID:+GOrwNtLa
>>186
tensorflowも一緒に。
189デフォルトの名無しさん (ラクッペ MMed-NdIa)
垢版 |
2018/08/28(火) 15:25:32.48ID:DCHZu+I+M
>>188
グローバルなんちゃらイニシライザーとか長すぎんねん名前
2018/08/28(火) 16:37:58.23ID:y25npp8k0
>>187
ある

なんでもかんでもディープでやればいいってもんじゃない
2018/08/28(火) 17:05:34.81ID:KK7wlqdUa
そもそもディープラーニングは機械学習の中の1つの分野でしかない
192デフォルトの名無しさん (ワッチョイ f923-DNis)
垢版 |
2018/08/28(火) 17:24:23.27ID:6kEMX7h90
>>185
これな
https://twitter.com/1123and0222/status/1034081360904773632
https://twitter.com/5chan_nel (5ch newer account)
2018/08/28(火) 19:39:00.69ID:wzkZgbuEM
>>187
なぜコンペでXGBoostやランダムフォレストが主流で使われているのか?
適材適所というものがあるのだよ。
2018/08/28(火) 21:37:45.20ID:nyQJ+koHa
>>187
仕事で深層学習を付け焼き刃で使ってるけど、特に困ってないよ
2018/08/28(火) 22:52:10.12ID:nisRN7fPM
ドット絵みたいな意味のある形を含む点群があったとして、その点群の中から学習させた意味のある形を検出したいです
なにか良さげなアルゴリズムとかありませんか?
2018/08/28(火) 23:48:29.13ID:/fs3ieZp0
>>195
CNN
197デフォルトの名無しさん (ワッチョイ a54b-c68X)
垢版 |
2018/08/29(水) 00:12:46.00ID:PwHTZQO10
機械学習ブームに乗って、生まれ変わったら異世界のデータサイエンティストだったで電撃に応募する
2018/08/29(水) 00:18:06.21ID:Aqt94EbEM
Kerasって便利なのにあんまし人気ないよね
なんで
2018/08/29(水) 00:20:12.74ID:4x1+Uez8a
>>198
https://trends.google.co.jp/trends/explore?cat=5&;q=keras,chainer
2018/08/29(水) 00:25:13.71ID:iKxOrgLNd
>>198
どこでの話だ、さすがにそれはない。
pytorch が猛追してるけど、tf + keras が圧倒的でしょ
2018/08/29(水) 00:43:28.75ID:J5ZLnez10
ディープラーニングならKeras、他のアルゴはscikit-learn
2018/08/29(水) 01:03:14.99ID:4x1+Uez8a
>>201
情報量も多いし取っ付きやすいし、一番現実的な選択だと思う
203デフォルトの名無しさん (アウアウエー Sa52-F86p)
垢版 |
2018/08/29(水) 04:08:11.80ID:4LmLfDb3a
>>96
多数決システムにすれば良い
204デフォルトの名無しさん (アウアウウー Saa1-Zm8m)
垢版 |
2018/08/29(水) 06:26:09.02ID:UP9EO1Hha
>>201
やはりgoogleのtensorflowだろ。
2018/08/29(水) 07:42:15.00ID:J5ZLnez10
KerasのバックエンドはTensorFlow
2018/08/29(水) 12:46:20.23ID:WJGhptOe0
kerasの作者の本読んだら、
「ディープラーニングで相場の予想は出来ない。やるだけ無駄なので時間を捨てるのは止めとけ」って全否定されてたわ

わざわざ苦言を呈するくらい相場の予想させたいって奴ばっかりなんだろうね
2018/08/29(水) 14:12:36.60ID:slaughny0
相場予測系は詐欺商品多すぎでしょう
2018/08/29(水) 21:49:35.15ID:797j62Wx0
ドーパミンだって

Google、TensorFlowベースの強化学習フレームワーク「Dopamine」を公開
https://mag.osdn.jp/18/08/29/163000
209デフォルトの名無しさん (ワッチョイ db4b-BaxO)
垢版 |
2018/08/30(木) 00:40:05.35ID:D8zsotkh0
まだTensorFlowでゴリゴリ書いてる奴おる?
210デフォルトの名無しさん (ワッチョイ 0580-rkYf)
垢版 |
2018/08/30(木) 00:57:56.81ID:/0YXnEsV0
むしろTensorFlowはモデルが理解できてないヤツには使えない
それ以外のは機械学習がよく分からなくても使えた気になれる
2018/08/30(木) 02:35:27.51ID:DH3FHNZNd
>>209
というか、kerasがtensorflowに統合されたから両方のAPIを使ってる

>>210
まぁそうかもしれない
212デフォルトの名無しさん (アウアウウー Sa19-4azP)
垢版 |
2018/08/30(木) 06:17:31.53ID:3sbg3Riaa
>>210
chainerなんかわかりやすいのに人気ない。
2018/08/30(木) 07:27:24.38ID:sbjDtq1ra
もうchainer はいいよ。日本限定のフレームワークが流行るはずもない。
一時期、業者か何か知らんがくどいほどchainer の書き込みが続いてうんざりしたわ
2018/08/30(木) 07:45:55.05ID:TbxP/gqFd
>>212
今となってはpytorch使えばすむからな

>>213
ある時からレスが完全にピタッと止まって驚いた記憶がある。
業者かはともかく、一人で頑張ってた人がいたんだろうな
2018/08/30(木) 08:20:43.41ID:GsTONwDd0
chainerは日本限定じゃないよ
ドキュメントも英語だし
海外の論文でも実装に使われていたりするし
2018/08/30(木) 08:25:09.80ID:sbjDtq1ra
>>215
全く同じレスを繰り返し見た記憶がある。まだスレ見てたんだな。
前にも書いたけど、例外があることは全く反論にならないからな。現状はトレンド見ろ つ

https://trends.google.co.jp/trends/explore?cat=5&;q=keras,chainer
2018/08/30(木) 08:28:14.13ID:sbjDtq1ra
TensorFlow も含めると つ

https://trends.google.co.jp/trends/explore?cat=5&;q=tensorflow,keras,chainer
2018/08/30(木) 11:29:20.12ID:Aa6QMEJ0p
参考書とか見ながら機械学習の勉強始めて、初めて仕事でデータ分析的なことをやってみたんだけど絶望的に何も結果を出せない
データセットの理解も出来ないしどういうアプローチをしていけば良いのかも思いつかない
そもそも分析と呼べる領域にすら達してない
理解する頭やセンスも必要だと思うし自分も能力が低い人間なのは十分理解してるけど、分析能力はどうやって身につければ良いんだろう
やっぱり数こなすしかないかな?
219デフォルトの名無しさん (ワイーワ2 FF13-jOsm)
垢版 |
2018/08/30(木) 11:38:50.75ID:S/vwwZyFF
ここに書けば親切なみなさんが教えてくれるはず
2018/08/30(木) 12:49:37.88ID:EJNleK6cM
考えるな、感じろ、ちブルースリーグもジェダイマスターも言ってた
2018/08/30(木) 12:55:22.85ID:dpvLtCB6M
>>218
差し支えない範囲で具体的に書いてみ
222デフォルトの名無しさん (ワイーワ2 FF13-jOsm)
垢版 |
2018/08/30(木) 13:25:06.37ID:S/vwwZyFF
Don't use ThinkPad, FUJITSUUUUUUU!!!
2018/08/30(木) 13:41:21.70ID:NY8GEmPq0
>>218
オライリーの「仕事ではじめる機械学習」
って本はどう?
2018/08/30(木) 14:23:58.40ID:7HgxnLgF0
機械学習で重要なのは結果よりも、凄いことやってる感
2018/08/30(木) 14:31:20.51ID:Aa6QMEJ0p
>>221
ほんとはめっちゃ詳しく書きたいけど誰が見てるから分からないから凄く端折ってるけど今はある装置のトラブル要因を調べてる
データは特徴量が200個あって1万レコードくらいある
ただこの装置自体は見たことがなくて装置自体の知見も浅い分野だからデータセットは理解できてない
明らかに要らなそうなデータは消して特徴量を選択して決定木にかけて、重要な特徴量に対してペアプロットを出すところまでは来た
プロットの結果は分類自体がほぼ出来ていなくて、唯一差が見れそうなところに見てみようと思ったんだけど、
結局そこはどこどこの数値が高くなると異常が出やすい、くらいの説明しか出来なくてその値がなぜ高くなるかを見つけ出すべきなんだろうけどデータや機構が分からなくて何から手をつけて良いか分からないってところで止まってる
こんなのは多分現場の人は感覚的に分かってる話だから何の意味もないよね
2018/08/30(木) 14:34:28.66ID:Aa6QMEJ0p
>>223
ありがとう
帰り本屋寄ってみる
ちなみに昨日pythonによるデータ分析入門って買ったんだよな
俺はまだ分析の領域にも行けてないのになw
227デフォルトの名無しさん (アウウィフ FF19-jOsm)
垢版 |
2018/08/30(木) 15:21:00.65ID:RB/VojpjF
民間ロケットかω
2018/08/30(木) 15:56:28.71ID:7HgxnLgF0
機械学習の腕は特徴量を選択するセンス次第
2018/08/30(木) 16:44:08.77ID:NY8GEmPq0
>>225
ああそういう話だとさっきの本は関係ないや
ビジネスの何に使えばいいかわからない
的な意味だと思ったんで
2018/08/30(木) 17:17:26.23ID:lMDVbSRW0
>>225
>データは特徴量が200個あって1万レコードくらいある
直感的に、少なくない?

>ただこの装置自体は見たことがなくて装置自体の知見も浅い分野だからデータセットは理解できてない
それが問題じゃん。装置自体調べろよ。
ていうか物理現象を調べてるのか?
なら機械学習を使う意味があるのかがそもそもわからんな
しいていうなら相関の強いものを上から順に並べるとか
ヒステリシスを持っている可能性を考慮するために、プロット上げる方向と下げる方向を別変数にしたほうがいいかも
2018/08/30(木) 18:48:13.32ID:zHnsz/ji0
>>230
特徴量200って少ないのか…
装置見れれば良いんだけど、身近にある物じゃないから見れなくてさ…
相関関係を見るなら重回帰かなと思って一応やってみたんだけど、言ってくれてる通り物理現象で動きには前回の動きとかも考慮して特徴量増やしたりしなくちゃいけないはずなんだけど結局データセットが分からないから行き詰まってしまった

>>ヒステリシスを持っている可能性を考慮するために、プロット上げる方向と下げる方向を別変数にしたほうがいいかも

これってどういう意味かな…
理解出来なくてごめん
2018/08/30(木) 19:08:50.69ID:lMDVbSRW0
>>231
>特徴量200って少ないのか…
いや、変数200に対してデータ数10000は、
データのほうが少ないのではないか、と

>>ヒステリシスを持っている可能性を考慮するために、プロット上げる方向と下げる方向を別変数にしたほうがいいかも
>これってどういう意味かな…
ヒステリシスを持つ可能性があるため、パラメータは上げる方向と下げる方向、両方測定する
っていう実験物理の基本は知ってるよな?
パラメータ上がる方向と下がる方向は別の変数にしないと区別できないんじゃないか、と
2018/08/30(木) 19:15:05.96ID:QzSJYFXmM
データをアップしてくれないと
よくわからん
2018/08/30(木) 21:14:55.66ID:JFBhQmXO0
ID:Aa6QMEJ0p
特定した。

お前には期待してたのだが、5chでアドバイスを貰おうとは見損なったぞ。
今後の査定を真摯に受け止めるが良い。
2018/08/30(木) 21:35:27.97ID:NQz3sjtC0
>234
マジモンのチームメイトなら少しはサポートしてやれよ。
仮に上司だとして結果が出せない部下を放置って、今の時代ならパワハラ案件だろ。
まぁブラフだろうが。
2018/08/30(木) 22:03:46.63ID:zHnsz/ji0
>>232
ぐ…よく分からん…ごめん
調べてみる…何かつかめるように頑張るよ

>>235
出来が悪い俺がダメだと思うよ
質問するにも何が分からないかすら分からない自分があまりにも無力…!
明日は何か少しでも前進出来るように頑張るよ
2018/08/31(金) 00:11:23.98ID:p6vKiofNd
これで5%返せるとか脳死こいてるバカがまだまだ多いんだな
2018/08/31(金) 01:40:33.97ID:/VjCJv9E0
>>236
説明変数(特徴量?)200と目的変数(トラブル)の
散布図行列を作るところからやってみては?
http://bellcurve.jp/statistics/wp-body/wp-content/uploads/2016/06/scmatrix_g.png
■ このスレッドは過去ログ倉庫に格納されています