X



【統計分析】機械学習・データマイニング20

■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん (アウアウエー Sa5f-Mv1r)
垢版 |
2018/08/07(火) 18:56:37.59ID:sGPH9ejna
機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング19
http://mevius.2ch.net/test/read.cgi/tech/1520586585/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
0401デフォルトの名無しさん (ワイーワ2 FFdf-rUn3)
垢版 |
2018/09/13(木) 19:03:22.94ID:l9KSlvFSF
>>398
書こうと思って思い留まった
0409デフォルトの名無しさん (ササクッテロレ Sp8b-47pW)
垢版 |
2018/09/14(金) 10:52:49.98ID:6Ydm1GfUp
参考書見ながら勉強してて、教師あり学習はなんとなくイメージ湧くんだけど教師なし学習の部分に入ってから急に難しくて理解しにくい…
主成分分析とか特にややこしいんだけどこういう技術はやっぱり頻繁に使われるのかな?
0410デフォルトの名無しさん (ワッチョイ ff81-WjPf)
垢版 |
2018/09/14(金) 10:59:03.56ID:36F6j8Uf0
やっぱり頻繁に使われる
0413デフォルトの名無しさん (ワッチョイ d7f8-xwwK)
垢版 |
2018/09/14(金) 14:37:37.68ID:tCA/H0VE0
PCAはできなきゃ可視化できねーから必須だろう
0415デフォルトの名無しさん (ワッチョイ 77a5-47pW)
垢版 |
2018/09/14(金) 22:05:30.13ID:exBB8l6d0
低学歴超初心者のゴミの俺が機械学習の勉強して5ヶ月
今更だけど統計の知識って避けて通れない気がしてきた
ここの人達はそういう知識も持ってるのかな…
機械学習でいっぱいいっぱいだけどやれるか俺…
0418デフォルトの名無しさん (ワッチョイ 9780-9b2l)
垢版 |
2018/09/14(金) 23:16:28.78ID:fXySkelb0
機械学習でビッグデータを扱うなら
最低でも正方行列でない行列を扱う対応分析や
疎な行列を計算機で扱うための知識が必要
0422デフォルトの名無しさん (ササクッテロレ Sp8b-47pW)
垢版 |
2018/09/15(土) 00:34:19.96ID:ls8ZnII1p
>>409 です
PCAを使うのはあくまで可視化がメインなの?
特徴量抽出とかも書いてあってこんがらがってる
例えば20個の特徴量がある100点のデータがあって、それを2次元にしたい場合20個の特徴量からなる各データ(100点)から分散が大きい線?保持する
ってイメージなんだけど、2次元にした時点で色んなデータが削ぎ落とされて、20個の特徴量をぜんぶ引っくるめたデータの主成分だけが残って素の特徴量の概念は消えてると思うんだけどそこから特徴量を抽出って????ってなってる
日本語おかしくてごめん
自分の理解が完全に間違ってたり的外れな事言ってるのは十分理解してます…
0424デフォルトの名無しさん (ワッチョイ 57eb-+ow7)
垢版 |
2018/09/15(土) 01:49:47.53ID:81XKWb5c0
情報系の学科でプログラムはそこそこ勉強してて
機械学習ライブラリを全く使ったことないんですがちょっと勉強したくて
機械学習入門ライブラリって何がおすすめですか

うまくいくかどうかは別にして
株とかFSみたいな時系列グラフの予測したり
将棋や囲碁みたいなゲームAIを作ってみたいです
0431デフォルトの名無しさん (ワッチョイ 57eb-+ow7)
垢版 |
2018/09/15(土) 12:42:28.61ID:81XKWb5c0
たとえば時系列データの配列があったとして
なんてライブラリにどういう設定で実行すればいいかっていうのがわからない

どういうことをやるかっていうアルゴリズムの概論説明ばかりで
プログライミングの入門サイトみたいなのがあんまりなくて
何をインストールしてどうかけばいいかのプログラムサンプルを出してくれるサイトがあんまり見つからない
0433デフォルトの名無しさん (ワッチョイ bf67-pekm)
垢版 |
2018/09/15(土) 13:20:09.75ID:tpcXcC8D0
>>431
分類ならIrisとかベンチマークで使われるデータセットがあるので具体的な使い方も分かると思う。
君のやりたい事が何のアルゴリズムで実現できるかは、自分で概論一通り勉強しないと決まらないと思うのよね。
0434デフォルトの名無しさん (ワッチョイ 57eb-+ow7)
垢版 |
2018/09/15(土) 14:02:42.28ID:81XKWb5c0
>>433
ありがとうございます

irisていうの使ってみます

機械学習って行列から結果ベクトルを生成する関数をつくるもので
教師データとして入力出力ペアを与えたらそれに近い答えを出す関数が作られて
未知のデータを流し込んでもそれなりに答えが出るみたいなイメージだったから
ライブラリでやることってたいした違いはないのかと思ってた
0435CRFs (ワッチョイ 9780-9b2l)
垢版 |
2018/09/15(土) 15:42:38.45ID:KIanXBkQ0
TensorFlow使ったほうがいい
くさるほどサンプルがある
0436デフォルトの名無しさん (ワッチョイ 9780-9b2l)
垢版 |
2018/09/15(土) 15:47:56.06ID:KIanXBkQ0
CRFもTensorFlow使えばきっと余裕でできるハズ
0437デフォルトの名無しさん (ワッチョイ 57eb-+ow7)
垢版 |
2018/09/15(土) 16:08:00.97ID:81XKWb5c0
>>433
Iris 機械学習 で検索してブログ2,3よんでみたけど
これってあやめの画像を認識するだけにしか使えないの?

画像認識はいまのとこ興味なくて

時系列データ予測(株とかよりはシーズン途中でのペナントレースの優勝予測とか)
ゲームAIとか
ツイッター上で知識獲得や自動応答
とかそのへんをやってみたいんだけど

>>435,436
TensorFlowはきいたことあるかも
次はそれ調べてみます
ありがとうございます
0438デフォルトの名無しさん (ワッチョイ 9ffe-Crbm)
垢版 |
2018/09/15(土) 16:10:06.41ID:+gRFgMvM0
自由度、将来性、普及率考えればtensorflow一択
日本語資料多めで取っつきやすいのはchainer
とりあえず動かしてみたいkeras
最近の論文の実装例多めでやや将来性ありpytorch
0442デフォルトの名無しさん (アウアウエー Sadf-HwcP)
垢版 |
2018/09/15(土) 16:57:36.10ID:VTJ0VoCAa
>>441
計算は確定的に同じ結果を得られるけど?
0444デフォルトの名無しさん (アウアウエー Sadf-HwcP)
垢版 |
2018/09/15(土) 17:10:33.80ID:VTJ0VoCAa
>>443
既存のクラスとかライブラリを一切使わないってこと?

コレクションとか配列とかもいちいち自分で管理するの?
もし仮にそうだとしたらそれを扱うような機能や関数を自分で作ってそれを利用するけどね

そこら辺は既存のライブラリ使っても結果への影響はほとんど変わらない
0445デフォルトの名無しさん (ワッチョイ 9780-9b2l)
垢版 |
2018/09/15(土) 17:12:19.17ID:KIanXBkQ0
あいかわらず頭悪いは
モデルというのはドカタが使うモデルの話じゃないからな
0446デフォルトの名無しさん (ワッチョイ 9780-9b2l)
垢版 |
2018/09/15(土) 17:13:35.25ID:KIanXBkQ0
ココが低学歴知恵遅れの限界
うんよくわかる
0447デフォルトの名無しさん (アウアウエー Sadf-HwcP)
垢版 |
2018/09/15(土) 17:16:25.26ID:VTJ0VoCAa
>>445
既存のAPIってなんのことを言ってる?
従来のプログラムがその既存のAPIを使うだけで完成するっていう認識は正しいの?
0450デフォルトの名無しさん (アウアウエー Sadf-HwcP)
垢版 |
2018/09/15(土) 17:27:07.77ID:VTJ0VoCAa
試行錯誤が必要って意味なら
そんなの当たり前の事じゃね

テレビのシステムとか
携帯電話の通信システムとか作るのに
試行錯誤が必要なかったとでも?

自動車や飛行機でも同様
0451デフォルトの名無しさん (ワッチョイ 9780-9b2l)
垢版 |
2018/09/15(土) 17:30:38.30ID:KIanXBkQ0
数理モデルの話だからな

コーディングの話なんかココでは一切関係ない

まずやりたいことを
まずどういった数理モデルで実現するかという話になる

数理モデルでの実現方法をきめたら
次は、なにもわかってない低学歴底辺ドカタどもが作業するときに
どういった実装モデルにすれば一番コストを抑えることができるか
という話だからな

ぜんぜんかみあってないワケ

わかった?
0452デフォルトの名無しさん (ワッチョイ 9780-9b2l)
垢版 |
2018/09/15(土) 17:37:18.38ID:KIanXBkQ0
で、TensorFlowはその数理モデルを
組み立てるためのライブラリが充実している

当然、数理モデルがわかってないと
そんなライブラリは使いこなすことはできない
0453デフォルトの名無しさん (アウアウエー Sadf-HwcP)
垢版 |
2018/09/15(土) 17:45:46.95ID:VTJ0VoCAa
>>451

数理モデルの所が物理モデルだったりするけど
やってることは同じようなものだ

それは普通に行われて来たこと
0454デフォルトの名無しさん (アウアウエー Sadf-HwcP)
垢版 |
2018/09/15(土) 17:52:05.55ID:VTJ0VoCAa
>>451
で結局何を言いたいかって事だけど
期待した結果を得られなくて大変だ
と言いたいの?

まぁガンバレ
0455デフォルトの名無しさん (ワッチョイ 9780-9b2l)
垢版 |
2018/09/15(土) 17:53:12.18ID:KIanXBkQ0
物理はちゃんと現在もっとも有力な仮説があるからな
その仮説にあてこむだけですむ

検証可能で検証可されてるサイエンスの成果をそのままテクノロジーに反映する土台ができあがってる
そういった成果は、バカでもチョンでも利用することができる

AIにはそういうもんがない
形而上学の世界だからな

低学歴知恵遅れにはこの意味がわかることはないと思うわ
車程度ならニュートン力学で十分だしな
0456デフォルトの名無しさん (アウアウエー Sadf-HwcP)
垢版 |
2018/09/15(土) 18:01:04.76ID:RyZhDvOSa
>>455
それが実現できないことに対する言分かな

他の組織で実現できたら
その時はどんな言分を考えるのかな

まぁ大変だろうけどガンバレ
0458デフォルトの名無しさん (ワッチョイ 9780-9b2l)
垢版 |
2018/09/15(土) 18:04:21.99ID:KIanXBkQ0
このスレの低学歴知恵遅れたちは
まず数学は文系であることを理解することが先
0459デフォルトの名無しさん (ワッチョイ 37c3-okpm)
垢版 |
2018/09/15(土) 18:28:11.11ID:aDVtzTM20
数学、プログラミングは論理学なのか?
少なくとも数学はそうかもね。プログラミングはハードの知識も必要だから工学の要素があるけど
0460デフォルトの名無しさん (ワイーワ2 FFdf-cC+K)
垢版 |
2018/09/15(土) 18:35:36.27ID:AVfR6YnTF
スレチ
0463デフォルトの名無しさん (ワッチョイ 57eb-+ow7)
垢版 |
2018/09/15(土) 21:41:23.44ID:81XKWb5c0
捨て台詞のつもりはないんですが…
自分のレスがきっかけでスレの流れがよくなかったのでやめたほうがいいのかなと思って
なんかすごく感じ悪く受け取られちゃってますね
ほんとに申し訳ないです

TensorFlowを教えてもらったので使い方ぐらいは自分で調べてみます
ほんとは使ってる人にききながらやったほうが絶対早いと思うんですが…
0473デフォルトの名無しさん (ブーイモ MMbf-hiXp)
垢版 |
2018/09/16(日) 14:08:29.73ID:Xvs/hqWSM
その教えて君を追い払う役目の自称高学歴有識者のお前らのコメントも、いかにもブラックボックスから出た答えを鵜呑みにしてそうな抽象的なものばかり。
類は友を呼ぶ。
0480デフォルトの名無しさん (ワッチョイ ff8a-mEkm)
垢版 |
2018/09/18(火) 20:40:14.73ID:k7v+ymOu0
ubuntuにjupyterをインストールしようとしたけど、これもう無理だな
英語コミュニティでも、ちゃんとは内容を理解できないけど、みんなで無理だのなんだの言ってる感じ
pythonのパッケージを管理するためだけに
linuxについてをここ二週間ずっと勉強してきたのに初手でつまずいてしまった
0481デフォルトの名無しさん (ワッチョイ ff8a-mEkm)
垢版 |
2018/09/18(火) 20:42:18.85ID:k7v+ymOu0
あっ、condaを使ってしまえば話は別ね
0482デフォルトの名無しさん (ワッチョイ 37c3-okpm)
垢版 |
2018/09/18(火) 20:49:20.88ID:S3XkALSh0
どういうこと?Jupyter Notebookがブラウザで立ち上がるだけじゃダメなの?
0483デフォルトの名無しさん (ワッチョイ 579b-lJg0)
垢版 |
2018/09/18(火) 20:52:03.60ID:Jydth2ea0
時系列解析の自己回帰(AR)モデルについて教えてください
「AR(1) = Rt = μ + Φ1Rt-1 + εt」という式で
次数1の時「Rt: 今回の値」は「Rt-1: 1つ前の値」から推定される
という式ですが、この「1つ前の値」は実測値ですか?
それとも「Rt-2」を使って算出された予測値を説明変数と
するのでしょうか?
前者が正しいなら1つ前の実測値がないと予測できない事になりますが、
後者が正しいなら何時点か前の初期値1つだけで何時点も後の
値を予測可能だと思うんですが、どちらでしょうか?
0484デフォルトの名無しさん (ブーイモ MM9b-e9IP)
垢版 |
2018/09/18(火) 21:40:22.66ID:5LJPbrObM
>>487
何を分析するかに依るけど
一般的には実測値だと思う
0485デフォルトの名無しさん (ワッチョイ 579b-lJg0)
垢版 |
2018/09/18(火) 21:54:26.20ID:Jydth2ea0
>>484
ありがとう。株価だよ。
すげえ悩んでたから助かったよ。
0486デフォルトの名無しさん (ワッチョイ 579b-lJg0)
垢版 |
2018/09/18(火) 21:56:59.45ID:Jydth2ea0
>>484
ごめん、正確には収益率。
0487デフォルトの名無しさん (ワッチョイ 9776-/EHZ)
垢版 |
2018/09/18(火) 21:58:14.97ID:3M7OTvKW0
>>482
せっかくのLINUX環境なのに、CLIで起動できない実行環境なんて悲しすぎる

なんて思ったけど、jupyterlabなら簡単にインストールできた
コレ、次世代すぎて使いこなせる気がしないけど
今ぱっと動かした感じだとpycharmの更に上を行くほど更に凄いな
てか今年の春にjupyter notebookの使用方法をマスターしたのに
もう上位互換が出るのかよ。やってらんねーよ
0489デフォルトの名無しさん (ワッチョイ 9f20-xwwK)
垢版 |
2018/09/19(水) 00:03:09.71ID:qfGEDKPk0
単純なデイトレゲームと仮定した場合

株:できる、しかし実際には法律でアウトになるのでできない
見せ板を多用した相場誘導や短時間での注文&キャンセル処理でAPIに負荷かけた時点で
法律的にアウト

仮想通貨:できる
株ではできない見せ板を多用した相場誘導が基本的に無制限で法律で取り締まられてもいない
取引所に負荷かけすぎて怒られたりBANされることは多々あり
具体的には、板を出しているのが人間かそうでないかを見分けることで
肉入りから証拠金を巻き上げるような動きが可能になる

長期的嫌気判断として見た場合

株:できる
実際に行われているのは上場企業の役員のTwitterチェックなど
マイナスやトラブルを引き起こすような発言があったとシステムが判断した場合
(要するに異常検知の一種で炎上を検知している)
AIによって一斉に売られたりする
よくマイナス異常検知のターゲットになってるのはイーロン・マスクと関連企業
マイナスの異常でなくプラスの異常検知でも同じ
ニュースに対する反応なども見る

仮想通貨:できる
しかも風説の流布の取り締まりなどが行われていない為やりたい放題できる
大手仮想通貨メディアを裏で操る人々は、この手の手法で荒稼ぎしているだろう
直近で言えば、ゴールドマン・サックスの仮想通貨トレードデスク開設中止報道etc...


まぁちょっと勉強すれば誰でも思いつくよな
仮想通貨はこんな各国の法整備状況で、ビットコインETF承認なんてされたらある意味祭り
0490デフォルトの名無しさん (ワッチョイ ff81-WjPf)
垢版 |
2018/09/19(水) 00:12:36.78ID:2H97zkt+0
取引方法がはじめからわかってたら、高速なシステムトレードやるだけだろ。
株価じたいではなく、ニュースからデータ仕入れて、何に反応するかの部分のAI化ってことか。
0492デフォルトの名無しさん (アウアウエー Sadf-HwcP)
垢版 |
2018/09/19(水) 08:01:29.20ID:K7UZA9LYa
予想の値を出すことは可能
だけどそれで目標の利益を得られるかは別じゃね?
一度上手く利益を得られたとしても
トータルでは違う結果になるかもしれない
0496デフォルトの名無しさん (ワッチョイ 9f20-xwwK)
垢版 |
2018/09/19(水) 12:56:40.73ID:qfGEDKPk0
荒れるっていうか実際やってる人達が他のやつもみんなやりだすと稼げないからな
仮想通貨のデイトレゲーは大資本ないと厳しい(ただし、手数料フリーの取引所は例外)
深層異常検知の自動取引なんてすごいお手軽にリスクを最小化できる

まぁこの程度はネタバレにすらならん
大手はみんなやってることだろ
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況