X



【統計分析】機械学習・データマイニング19
レス数が950を超えています。1000を超えると書き込みができなくなります。
0001デフォルトの名無しさん (スッップ Sd12-4l6a)
垢版 |
2018/03/09(金) 18:09:45.75ID:WX3plG2ad

機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング17
http://mevius.5ch.net/test/read.cgi/tech/1502032926/
【統計分析】機械学習・データマイニング18
http://mevius.5ch.net/test/read.cgi/tech/1507807291/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
0851デフォルトの名無しさん (JP 0H5b-0+cq)
垢版 |
2018/07/30(月) 12:44:40.83ID:fs6nfZiKH
そりゃあいい気持ちにしておいて
seを確保するためだろ
0852デフォルトの名無しさん (ワッチョイ 168a-J6FL)
垢版 |
2018/07/30(月) 14:04:41.32ID:PzjDsgxi0
DSの底辺の仕事は、汚い前処理をひたすらやらされるポジだよ
高卒でやってる人もおる。そこからでも、がんばれば這い上がれるんだけどね
アルバイトで、未経験どころか知識がなくても受け入れてくれる求人もあるにはあるから
興味があれば突撃してみるといい
0856デフォルトの名無しさん (ブーイモ MM32-e+Og)
垢版 |
2018/07/30(月) 17:43:22.51ID:fEjPcQ0VM
データサイエンティストは、ガチに売上に貢献するネタ見つけたら門外不出扱いになるから、
当たり前だが外部に公開なんて出来ないよ。

上っ面撫でてるような話ばかり取り沙汰されてAIブームとか言われてるけど。
0857デフォルトの名無しさん (ワイーワ2 FF6a-2QVD)
垢版 |
2018/07/30(月) 17:44:22.83ID:sQTL1BwjF
募集の目的は他社に盗られる前に青田買い
0858デフォルトの名無しさん (JP 0H5b-0+cq)
垢版 |
2018/07/30(月) 18:13:21.28ID:fs6nfZiKH
seだとやりたがる人がいないからね。。。
0859デフォルトの名無しさん (アウアウウー Sa43-kJ74)
垢版 |
2018/07/30(月) 18:28:49.66ID:LiRqN/0ra
>>845
前原誠司に怒られるぞ。
0860デフォルトの名無しさん (ワッチョイ e379-lR76)
垢版 |
2018/07/30(月) 21:51:32.60ID:Wg41h7hn0
H'とW'の+1はどこから来たのでしょうか?
実際に数を入れてみたら近い値が出てきました
ちなみにDlの式がないのですが何を表してるのでしょうか?
https://i.imgur.com/zU03Gg6.jpg
0869デフォルトの名無しさん (ワイーワ2 FF6a-2QVD)
垢版 |
2018/07/31(火) 12:04:22.30ID:xRXvz4C9F
両方
0873デフォルトの名無しさん (アウアウエー Saaa-yhWW)
垢版 |
2018/07/31(火) 12:32:32.11ID:eBam6p9Ta
R 面白いじゃん、プログラミングが面倒に感じる人ならいいと思うけどな

… と書いてみたものの、R vs Python 論争は今更かw
好きなのやればいいいんじゃないの、不都合が発生したら両方やればいい
0879デフォルトの名無しさん (ワッチョイ e323-2QVD)
垢版 |
2018/07/31(火) 18:29:15.81ID:Sn2VrW8x0
肩や肘けがしてたら守備も出来ないし打てない罠
0880デフォルトの名無しさん (ワッチョイ 9e4b-513Y)
垢版 |
2018/07/31(火) 18:30:26.13ID:DM/M3TTp0
なんか機械学習の本ポチった
スッキリした
0882デフォルトの名無しさん (ワッチョイ 4b9e-h/lP)
垢版 |
2018/07/31(火) 19:44:45.03ID:M5dn2TAr0
株価でも、何十年も相関関係を調べている

株価は実体経済よりも、半年先行している。
さらに、サザエさんの視聴率は、株価よりも3か月先行しているw

最も早い指標が、サザエさんw

視聴率が下がると、どこかの産業が活発になってきている証拠!
それが後に顕在化する
0883デフォルトの名無しさん (ワッチョイ 9e4b-513Y)
垢版 |
2018/07/31(火) 21:45:47.48ID:DM/M3TTp0
>>881
「すぐに使える! 業務で実践できる! Pythonによる AI・機械学習・深層学習アプリのつくり方」とかいう如何にも怪しい本買ったよ
0885デフォルトの名無しさん (アウアウエー Saaa-2QVD)
垢版 |
2018/07/31(火) 23:18:02.32ID:PrQlt9wca
>>882
サザエ相関は疑似だろ
0887デフォルトの名無しさん (ササクッテロラ Sp47-l354)
垢版 |
2018/08/01(水) 05:36:44.59ID:uYla8EJqp
まずデータをどう集めるのかが大変だよね。

天気予測とかで、日本全国1000箇所ぐらいの温度、湿度、空の写真、海の写真とかを1分に1回計測して学習させたりとかしてみたいけど、国家プロジェクトなレベルの話になりそう。
0892デフォルトの名無しさん (ワッチョイ 1e76-kTp/)
垢版 |
2018/08/01(水) 11:53:55.35ID:dH5aOrd50
個人でやってるったって、
キチガイが勝手に関連付けを発見しているようなものだからな

風呂に入るタイミングでクラクションが鳴るから集団ストーキングされてる、みたいな
0893デフォルトの名無しさん (アウアウウー Sa43-AbI2)
垢版 |
2018/08/01(水) 12:14:30.83ID:qou1K1k2a
>>891
機械学習の大前提となる大量の学習データの入手の難易度が個人か企業などのそこそこ大きく組織かで天と地ほど違う
学習データを要しないプログラムであればむしろ個人の能力が大部分なので自分が優秀ならそれでいい
0894デフォルトの名無しさん (ブーイモ MM0e-Hl5m)
垢版 |
2018/08/01(水) 13:18:07.68ID:QBK7Rh0qM
>>892
その通りだな
データサイエンスにおいて、因果関係の理解されていない相関という科学的に無価値なものにも価値が認められるのは、それが金になる可能性があるから
飯食ってウンコ垂れ流すだけの個人が金を生むデータを入手できるかというと、、
0898デフォルトの名無しさん (アウウィフ FF43-2QVD)
垢版 |
2018/08/01(水) 18:02:53.77ID:q25SMjQYF
>>896
エロ本は入り口右側より左側の方が売れる
0901 ◆QZaw55cn4c (ワッチョイ b260-tjON)
垢版 |
2018/08/01(水) 19:19:33.34ID:6NCuGzpD0
>>900
>いよいよ終焉か
…もう終わってしまうのですか?今からやろうと思っていました
そうだ、今までのブームのなかで出た最良の参考書を教えてください
0902デフォルトの名無しさん (ワッチョイ 4ba5-4aXv)
垢版 |
2018/08/01(水) 19:39:11.85ID:y6yWtOvz0
0,1のようにクラス分けされたものではなく、連続値の要因分析をしたいと(連続値が高い時に効いているであろう要因など)考えた時に検討されるアルゴリズムはどういうものになるのでしょうか?
回帰木なのかな?と考えたのですが知識も浅く決定木くらいしかイメージが付かないのでそう考えたのですが他にはどのようなアルゴリズムを検討すべきでしょうか?
かなり初歩的な質問ですいません
0903デフォルトの名無しさん (ワッチョイ d281-weGb)
垢版 |
2018/08/01(水) 19:44:14.28ID:sYAZbU/60
>>902
それでどう木が関係するのかわかってないが。
2つの関係すべてで類似度を計算すれば似通ったのはわかるが。
0905デフォルトの名無しさん (ワッチョイ 4b9e-h/lP)
垢版 |
2018/08/01(水) 23:14:53.43ID:GZaAdjmn0
Google が良いのは、関連広告

アイドルで検索すれば、アイドルの広告、
プログラミングで検索すれば、プログラミングの広告のように、
その人に必要な広告を表示するから、有益

肉売り場に、焼肉のたれが置いてあるようなもので、便利

例えばギャンブルとか、会議室とか、
ユーザーに関係のない広告を見せられても、邪魔なだけ

自分に関係のない広告など、見ないし
0906デフォルトの名無しさん (ササクッテロル Sp47-l354)
垢版 |
2018/08/01(水) 23:25:23.98ID:1PyFdc1cp
>>905
前まではそういうターゲッティング広告が万能という風潮もあったけど、全くの新規顧客を開拓するのには向いてなくて、今はまたマスの誘導のための広告をどうするかが流行ってきてるってもっぱらの噂だよな
0908デフォルトの名無しさん (ササクッテロル Spc7-UR05)
垢版 |
2018/08/02(木) 05:54:22.94ID:B227jVvFp
そもそも志向性の無い人に、CMを見せて、嗜好を促すという毛色の違うアプローチなのである
0912デフォルトの名無しさん (ササクッテロ Spc7-iaMa)
垢版 |
2018/08/03(金) 08:52:59.24ID:xDtr0cWxp
単体の決定木の可視化は作成出来たのですが、ランダムフォレストは可視化可能なのでしょうか?
ランダムフォレストの資料は沢山あるのですが可視化について書かれているものが見当たらないので質問させて頂きました
何百という木を作るので可視化しても意味が捉えにくいから可視化させないのかそもそも出来ないのかどちらなのでしょうか?
0916デフォルトの名無しさん (ササクッテロ Spc7-iaMa)
垢版 |
2018/08/03(金) 11:50:06.15ID:xDtr0cWxp
>>913
>>914
>>915

ありがとうございます
単体の決定木は見れたのでランダムフォレストのような大量の木はどんな風に見えるのか気になったのでやってみたかったのです
export_graphvizを使おうとするとエラーが出て、その内容で検索してみると不可能だという記事も見つかりました
0917デフォルトの名無しさん (ガックシ 067f-Xflc)
垢版 |
2018/08/03(金) 13:53:04.88ID:LaSZsIIq6
>>916
多分pythonのsklearn使ってるんだと思うけどできるよ。
ただ、見てどうするんだろうとは思う。

from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.tree import export_graphviz

X, y = load_iris(return_X_y=True)
cls = RandomForestClassifier()
cls.fit(X, y)

for i, t in enumerate(cls.estimators_):
  export_graphviz(t, "tree_%02d.dot" % i)
0923デフォルトの名無しさん (ワッチョイ ff81-9e/1)
垢版 |
2018/08/03(金) 18:52:06.33ID:Gm6P5pEe0
AIとトレードを結び付けないほうが良い。
ここで前も書いた気がするが、株価はAIでも、どんな手段でも予測できない可能性がある。
効率的市場仮説というやつだが。
0924デフォルトの名無しさん (ワッチョイ ff81-9e/1)
垢版 |
2018/08/03(金) 18:56:03.53ID:Gm6P5pEe0
正しいなら、いかなる手段でも予測できない事になるからAIですら無意味。


効率的市場仮説(こうりつてきしじょうかせつ)
現時点での株式市場には利用可能なすべての新たな情報が直ちに織り込まれており、超過リターンを得ることはできず、株価の予測は不可能であるという学説である。
ランダム・ウォークを説明する考え方になるが、科学的に証明はされてはおらず、確からしいという仮説の域を出ていない。
効率的市場仮説の下、株価指数連動型インデックスファンドとETF(上場投資信託)が誕生し、目覚ましく普及してきた。

https://www.nomura.co.jp/terms/japan/ko/A02426.html
0925デフォルトの名無しさん (アウアウエー Sadf-10BI)
垢版 |
2018/08/03(金) 19:05:59.42ID:o/XiGXrOa
株の目的は予測することじゃない
儲けることだ
0926デフォルトの名無しさん (ワッチョイ ff81-9e/1)
垢版 |
2018/08/03(金) 19:09:08.19ID:Gm6P5pEe0
システムが一切、予測できてないのに、儲かるんだったら運でしか無い。
0929デフォルトの名無しさん (ワッチョイ bfdc-QB3m)
垢版 |
2018/08/03(金) 21:29:57.30ID:kwdB/2Jf0
AIを使っているヘッジファンドが高リターンを出しているのは事実だし、
開発メンバーは、GoogleやIBMの最前線からヘッドハントされた精鋭揃い。

データに隠れている情報を引っ張り出し、
AIとして活用できることが出来る人間は、本当に、ごく僅かしか存在しないと思われる。

日本国内のポイントカード各社が、
6,000万〜8,000万件の顧客の購買データを持っていながら、
広告ぐらいしか活かせていないのに象徴されるように
0936デフォルトの名無しさん (ワッチョイ 6f4b-OyLg)
垢版 |
2018/08/04(土) 07:10:35.49ID:ewOxlyTI0
ちょっと待って
PyTorch神じゃね?
0939デフォルトの名無しさん (ワッチョイ 6f8a-QB3m)
垢版 |
2018/08/04(土) 18:59:36.68ID:zUmnSns20
日本にいる限り、機械学習の論文をスクラッチで実装できるレベルになっても
大していい収入は得られないみたいだなあ
まあ。海の向こうでも5000万とかもらっているのは、
機械学習で新しいビジネスを開拓できる一部の人間だけみたいだけど
0943デフォルトの名無しさん (ワッチョイ ff81-9e/1)
垢版 |
2018/08/04(土) 20:08:07.01ID:nHU/2XY40
AIが詐欺ってそもそもアホな考えだぞ。
グーグルのアルファ碁でAIの実力が示されてて有効だ。
AIが、人間がプログラムするよりも、人間のプロよりも強くなった。
0944デフォルトの名無しさん (アウアウウー Saa7-Eno9)
垢版 |
2018/08/04(土) 20:18:25.50ID:J/YPNUP2a
>>943
うん。AIすごいね。で、どうやって金を生み出すの?
そう聞かれて相手に夢を見せられるような回答ができる?
それがコンサル力だよ
実際に利益が出るかどうかは問題じゃないし、問題にしてはいけない
そこに自ら手を突っ込んでしまうと一気に泥臭くなって単価が下がる
0947デフォルトの名無しさん (ブーイモ MM67-Eno9)
垢版 |
2018/08/04(土) 23:07:24.74ID:4Skl9eF4M
>>945
君はもちろん払わないだろうけど、基本的にデータ分析やAI系の商売相手ってITについて素人同然のユーザー企業だからね
流行りだからなんかやってみることになったけどよくわかんないんだよね〜予算あるけど何やったらいいのかな〜くらいの意識よ
で金取ってPoCして「やれることはやった。期待したほどの効果が出なかったのは、お前らが選定したテーマとデータが悪いから。」で客に押し付けて逃げる
それがAIビジネス
0948デフォルトの名無しさん (ワッチョイ 639b-nsui)
垢版 |
2018/08/04(土) 23:08:37.31ID:MoT3gojY0
データ突っ込んだら必要な前処理と
最適な学習手法と
最適な評価指標を自動で教えてくれるツールが欲しいわ。
0949デフォルトの名無しさん (ワッチョイ 639b-U9Mv)
垢版 |
2018/08/05(日) 02:02:53.14ID:/+V808ky0
1銘柄の株価上下を予測するのが精度はでなくても、
1000銘柄くらい一気に同時学習させて
好調な上位10銘柄を出力させてそれらに
分散投資すればいいのではないだろうか。
問題は売却タイミングだな。
1度買ってしまったものはその銘柄の上下を
予測しなけりゃならんからな。
となると1ヶ月後に株価の増分が最大になる銘柄の
上位10を予測させて1ヶ月後に必ず売却すれば
いいのか。
テスト精度がそれなりに良くて、
勿論時系列データのSARIMAXを考慮すれば上手く
行きそうな気もするが…
0951デフォルトの名無しさん (ワッチョイ a31e-QB3m)
垢版 |
2018/08/05(日) 05:40:51.48ID:wuEISNZU0
>「やれることはやった。期待したほどの効果が出なかったのは、お前らが選定したテーマとデータが悪いから。」で客に押し付けて逃げる
それがAIビジネス
請負ならそれでいいんだろうけどね
レス数が950を超えています。1000を超えると書き込みができなくなります。

ニューススポーツなんでも実況