X



【統計分析】機械学習・データマイニング20

■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん (アウアウエー Sa5f-Mv1r)
垢版 |
2018/08/07(火) 18:56:37.59ID:sGPH9ejna
機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング19
http://mevius.2ch.net/test/read.cgi/tech/1520586585/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
0171デフォルトの名無しさん (ワッチョイ 668a-wF79)
垢版 |
2018/08/27(月) 16:52:51.31ID:9Rk35fCU0
大学一年レベルの数学→最適化数学→はじパタ本→達人データサイエンティストによる理論と実践
これにプラスで、ゼロから作るdeep learningを読めば、ベースの知識は作れる
0172デフォルトの名無しさん (アウウィフ FFa1-DNis)
垢版 |
2018/08/27(月) 17:38:35.99ID:Q4eMB8PsF
ただしF欄は除く
0173デフォルトの名無しさん (ワッチョイ b65a-/8lv)
垢版 |
2018/08/27(月) 19:28:35.38ID:3tv7gyOX0
>>168
・やさしく学ぶ 機械学習を理解するための数学のきほん
・人工知能プログラミングのための数学がわかる本
・ゼロから作るDeep Learning(2冊)
0174デフォルトの名無しさん (フリッテル MM2e-oIkv)
垢版 |
2018/08/27(月) 22:19:47.74ID:S8OKJlGuM
kerasのLSTMって、まだpeepholeに対応してないの?
0177デフォルトの名無しさん (アウアウウー Saa1-Zm8m)
垢版 |
2018/08/28(火) 05:35:17.79ID:uOZLnoMMa
日本はAI・ロボット化の開発競争に敗れ国際競争力を失い下手をすると2025年あたりには一億総失業になる。
0180デフォルトの名無しさん (ブーイモ MM8e-/8lv)
垢版 |
2018/08/28(火) 08:50:04.97ID:ESzSTJ18M
中身大して変わらないのにタイトルに「機械学習のための〜」とか付けると馬鹿が買ってくれる
0183デフォルトの名無しさん (アウアウウー Saa1-Zm8m)
垢版 |
2018/08/28(火) 10:12:48.93ID:AXaUJqBfa
>>181
石村夫妻が「よくわかる機械学習のための数学」とか長沼伸一郎氏がブルーバックス本を書かないのがおかしい。
0186デフォルトの名無しさん (ラクッペ MMed-NdIa)
垢版 |
2018/08/28(火) 15:15:25.81ID:DCHZu+I+M
pythonとkerasによるディープラーニング買った
これでkeras極めるけどkerasくらいならこの本いらんかったかな…
0187デフォルトの名無しさん (ラクッペ MMed-NdIa)
垢版 |
2018/08/28(火) 15:17:58.39ID:DCHZu+I+M
ディープじゃない機械学習って学ぶ意味ある?
素人の素朴な疑問でごめん
sklearnはデータ分割する時くらいしか使わないなあって思って
0188デフォルトの名無しさん (アウアウウー Saa1-Zm8m)
垢版 |
2018/08/28(火) 15:19:13.14ID:+GOrwNtLa
>>186
tensorflowも一緒に。
0189デフォルトの名無しさん (ラクッペ MMed-NdIa)
垢版 |
2018/08/28(火) 15:25:32.48ID:DCHZu+I+M
>>188
グローバルなんちゃらイニシライザーとか長すぎんねん名前
0197デフォルトの名無しさん (ワッチョイ a54b-c68X)
垢版 |
2018/08/29(水) 00:12:46.00ID:PwHTZQO10
機械学習ブームに乗って、生まれ変わったら異世界のデータサイエンティストだったで電撃に応募する
0203デフォルトの名無しさん (アウアウエー Sa52-F86p)
垢版 |
2018/08/29(水) 04:08:11.80ID:4LmLfDb3a
>>96
多数決システムにすれば良い
0204デフォルトの名無しさん (アウアウウー Saa1-Zm8m)
垢版 |
2018/08/29(水) 06:26:09.02ID:UP9EO1Hha
>>201
やはりgoogleのtensorflowだろ。
0206デフォルトの名無しさん (ワッチョイ 2a23-PcWx)
垢版 |
2018/08/29(水) 12:46:20.23ID:WJGhptOe0
kerasの作者の本読んだら、
「ディープラーニングで相場の予想は出来ない。やるだけ無駄なので時間を捨てるのは止めとけ」って全否定されてたわ

わざわざ苦言を呈するくらい相場の予想させたいって奴ばっかりなんだろうね
0209デフォルトの名無しさん (ワッチョイ db4b-BaxO)
垢版 |
2018/08/30(木) 00:40:05.35ID:D8zsotkh0
まだTensorFlowでゴリゴリ書いてる奴おる?
0210デフォルトの名無しさん (ワッチョイ 0580-rkYf)
垢版 |
2018/08/30(木) 00:57:56.81ID:/0YXnEsV0
むしろTensorFlowはモデルが理解できてないヤツには使えない
それ以外のは機械学習がよく分からなくても使えた気になれる
0212デフォルトの名無しさん (アウアウウー Sa19-4azP)
垢版 |
2018/08/30(木) 06:17:31.53ID:3sbg3Riaa
>>210
chainerなんかわかりやすいのに人気ない。
0218デフォルトの名無しさん (ササクッテロ Spf1-Mm8o)
垢版 |
2018/08/30(木) 11:29:20.12ID:Aa6QMEJ0p
参考書とか見ながら機械学習の勉強始めて、初めて仕事でデータ分析的なことをやってみたんだけど絶望的に何も結果を出せない
データセットの理解も出来ないしどういうアプローチをしていけば良いのかも思いつかない
そもそも分析と呼べる領域にすら達してない
理解する頭やセンスも必要だと思うし自分も能力が低い人間なのは十分理解してるけど、分析能力はどうやって身につければ良いんだろう
やっぱり数こなすしかないかな?
0219デフォルトの名無しさん (ワイーワ2 FF13-jOsm)
垢版 |
2018/08/30(木) 11:38:50.75ID:S/vwwZyFF
ここに書けば親切なみなさんが教えてくれるはず
0222デフォルトの名無しさん (ワイーワ2 FF13-jOsm)
垢版 |
2018/08/30(木) 13:25:06.37ID:S/vwwZyFF
Don't use ThinkPad, FUJITSUUUUUUU!!!
0225デフォルトの名無しさん (ササクッテロ Spf1-Mm8o)
垢版 |
2018/08/30(木) 14:31:20.51ID:Aa6QMEJ0p
>>221
ほんとはめっちゃ詳しく書きたいけど誰が見てるから分からないから凄く端折ってるけど今はある装置のトラブル要因を調べてる
データは特徴量が200個あって1万レコードくらいある
ただこの装置自体は見たことがなくて装置自体の知見も浅い分野だからデータセットは理解できてない
明らかに要らなそうなデータは消して特徴量を選択して決定木にかけて、重要な特徴量に対してペアプロットを出すところまでは来た
プロットの結果は分類自体がほぼ出来ていなくて、唯一差が見れそうなところに見てみようと思ったんだけど、
結局そこはどこどこの数値が高くなると異常が出やすい、くらいの説明しか出来なくてその値がなぜ高くなるかを見つけ出すべきなんだろうけどデータや機構が分からなくて何から手をつけて良いか分からないってところで止まってる
こんなのは多分現場の人は感覚的に分かってる話だから何の意味もないよね
0227デフォルトの名無しさん (アウウィフ FF19-jOsm)
垢版 |
2018/08/30(木) 15:21:00.65ID:RB/VojpjF
民間ロケットかω
0230デフォルトの名無しさん (ワッチョイ 351e-J7KC)
垢版 |
2018/08/30(木) 17:17:26.23ID:lMDVbSRW0
>>225
>データは特徴量が200個あって1万レコードくらいある
直感的に、少なくない?

>ただこの装置自体は見たことがなくて装置自体の知見も浅い分野だからデータセットは理解できてない
それが問題じゃん。装置自体調べろよ。
ていうか物理現象を調べてるのか?
なら機械学習を使う意味があるのかがそもそもわからんな
しいていうなら相関の強いものを上から順に並べるとか
ヒステリシスを持っている可能性を考慮するために、プロット上げる方向と下げる方向を別変数にしたほうがいいかも
0231デフォルトの名無しさん (ワッチョイ 8da5-Mm8o)
垢版 |
2018/08/30(木) 18:48:13.32ID:zHnsz/ji0
>>230
特徴量200って少ないのか…
装置見れれば良いんだけど、身近にある物じゃないから見れなくてさ…
相関関係を見るなら重回帰かなと思って一応やってみたんだけど、言ってくれてる通り物理現象で動きには前回の動きとかも考慮して特徴量増やしたりしなくちゃいけないはずなんだけど結局データセットが分からないから行き詰まってしまった

>>ヒステリシスを持っている可能性を考慮するために、プロット上げる方向と下げる方向を別変数にしたほうがいいかも

これってどういう意味かな…
理解出来なくてごめん
0232デフォルトの名無しさん (ワッチョイ 351e-J7KC)
垢版 |
2018/08/30(木) 19:08:50.69ID:lMDVbSRW0
>>231
>特徴量200って少ないのか…
いや、変数200に対してデータ数10000は、
データのほうが少ないのではないか、と

>>ヒステリシスを持っている可能性を考慮するために、プロット上げる方向と下げる方向を別変数にしたほうがいいかも
>これってどういう意味かな…
ヒステリシスを持つ可能性があるため、パラメータは上げる方向と下げる方向、両方測定する
っていう実験物理の基本は知ってるよな?
パラメータ上がる方向と下がる方向は別の変数にしないと区別できないんじゃないか、と
0235デフォルトの名無しさん (ワッチョイ 351e-zBrR)
垢版 |
2018/08/30(木) 21:35:27.97ID:NQz3sjtC0
>234
マジモンのチームメイトなら少しはサポートしてやれよ。
仮に上司だとして結果が出せない部下を放置って、今の時代ならパワハラ案件だろ。
まぁブラフだろうが。
0236デフォルトの名無しさん (ワッチョイ 8da5-Mm8o)
垢版 |
2018/08/30(木) 22:03:46.63ID:zHnsz/ji0
>>232
ぐ…よく分からん…ごめん
調べてみる…何かつかめるように頑張るよ

>>235
出来が悪い俺がダメだと思うよ
質問するにも何が分からないかすら分からない自分があまりにも無力…!
明日は何か少しでも前進出来るように頑張るよ
0240デフォルトの名無しさん (アウアウウー Sa19-lQkG)
垢版 |
2018/08/31(金) 11:58:13.87ID:8oqZjBEKa
効いてる特徴量見たいだけだったら、ランダムフォレスト かxgboostでモデル作ってFeature Importance見ればいいんでない?
なぜ効いてるかについては別途考察が必要になるけど
0242デフォルトの名無しさん (ワッチョイ a3b3-zJks)
垢版 |
2018/08/31(金) 17:32:55.30ID:xOkTAq7n0
特徴量200だと相関関係にある特徴量同士や結果にまったく影響しない特徴量が多そうだな
そういうのを絞らないとメモリを食うだけで確実な結果が出ないと思う
0243デフォルトの名無しさん (マクド FFe1-J7KC)
垢版 |
2018/08/31(金) 20:20:22.26ID:1Ee7C22hF
>>225
装置の故障に関係のある特徴量を調べたいだけなら
ランダムフォレストではなく、もっと別の識別器を使った方がいいんじゃないか
0244デフォルトの名無しさん (マクド FFe1-J7KC)
垢版 |
2018/08/31(金) 20:35:34.13ID:1Ee7C22hF
ランダムフォレストは不純度の減少に関係ある特徴量を重要度でピックアップしてくれるだけだから
故障の原因を調べるなら、むしろ関係のない特徴量を削ったり、選択したりする方に
機械学習を使うべきだと思うんだ
ロジスティック回帰とか、KNNにSBSを適用するとか
いきなりランダムフォレストでがばっとやってるなら雑過ぎると思う

あと装置について何も知らないなら
分析結果を提出して仕事完了以外に何も出来ない気がするんだけど
0245デフォルトの名無しさん (ワッチョイ 8da5-Mm8o)
垢版 |
2018/09/02(日) 16:06:18.87ID:qpc9/9Oc0
>>225 です
レスくれた人ほんとにありがとう

一応自分では>>240で出した結果から重要度が高いものに対して>>238を出すところまではやってみた
ただ特徴量の選択だったり、自分で特徴量を増やしたりする必要がある可能性があったけどその辺が不十分だから正常時と不良時の変化は捉えきれなかった
急ぎの案件ではないから装置に詳しい人にもっと詳細に聞いてから見直してみる
0246デフォルトの名無しさん (ワッチョイ 8da5-Mm8o)
垢版 |
2018/09/02(日) 16:10:25.31ID:qpc9/9Oc0
>>242
自分なりに考えて削ったところ残ったのは半分くらいだった…選定が不十分だとは思うけど…

>>241
そんな多いんだ…
まだ素人だからその規模扱った事ないけど、データ数が少ないと使い物にならないのかな

>>244
特徴量の選択に機械学習を使うのか…
やったことないし考えたこともなかった
ロジスティック回帰は確率的に予測するモデルだっけ
KNNにSBSとか全然知らないからもっと勉強しないと…

今更だけどレス遅くなってすいません
やっぱ知識的な勉強もしなきゃだし、もっとkaggleみたいなので色々経験踏んだ方が良いのかな…
0247デフォルトの名無しさん (アウウィフ FF19-jOsm)
垢版 |
2018/09/02(日) 16:13:35.40ID:fTJM2v21F
>>238
この図って下三角は無駄やね
0248デフォルトの名無しさん (ワッチョイ e3a5-jo4B)
垢版 |
2018/09/02(日) 18:09:35.27ID:Gf+N3VgJ0
特徴200の例1万で正解ラベル付き、それでなんらかの故障の原因を
少数の特徴から説明をする必要性があるなら
PCAかけてからSVMでいいんじゃね?
ラベルないなら、明らかに異常時の正解ラベルを少数でも集めてから
アノマリーディテクション

それ以外になにかやりようがあるような案件に思えない
0249デフォルトの名無しさん (ファミワイ FF29-zJks)
垢版 |
2018/09/02(日) 22:15:22.45ID:aecTCx63F
ランダムフォレストって入門書で機械学習の勉強をしたら一番最後に習うジャンルじゃないか
理論的にはかなり難しい分類に入るはずなんだけど、最初にやったんかい
入門的な範囲に関していえば、NNなんかよりよほど複雑だよな
0254デフォルトの名無しさん (ワッチョイ 0b8a-J7KC)
垢版 |
2018/09/03(月) 15:29:21.33ID:wK4QWbzI0
割り振られた仕事が酷いだけな気がするんだけど
不良品検知なら機械学習は有用だけど、トラブルの原因の特定とか厳し過ぎるだろ
俺が同じ仕事を課されても出来ない自信がある
まだ今後の仕事に繋がるスキルなら学ぶ気にもなるけど
一回限りの仕事でこれだったら職場を変えたくなるなw
0257デフォルトの名無しさん (ササクッテロレ Spf1-oMiI)
垢版 |
2018/09/03(月) 17:45:38.06ID:wkT01G1zp
>>254
トラブルの原因特定が目的として
機械学習を手段として用いるのは何故?
そう言う指示なのかな
0260デフォルトの名無しさん (ラクッペ MMd1-BaxO)
垢版 |
2018/09/05(水) 12:59:13.40ID:b1qw9eMxM
機械学習の勉強やめるわ
物体検出が目標だったけど難しそうだからやめる
0262デフォルトの名無しさん (ラクッペ MMd1-BaxO)
垢版 |
2018/09/05(水) 14:29:43.54ID:b1qw9eMxM
>>261
お前は物体検出できんの?
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況