【統計分析】機械学習・データマイニング20
■ このスレッドは過去ログ倉庫に格納されています
機械学習とデータマイニングについて何でもいいので語れ若人
※ワッチョイだよん
次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね
■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76
■前スレ
【統計分析】機械学習・データマイニング19
http://mevius.2ch.net/test/read.cgi/tech/1520586585/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured GANで300x300ピクセル以上の自然なフルカラーRGBを24時間以内に生成するには、
幾らぐらいのGPUを買えば良いですか? >>395
Teslaって時点で、個人で買うものじゃないだろ >>395
FP16が速いようだけど、FP16で学習を安定化させるためには少し工夫が必要
できればおそらく学習も速くできる >>404
去年のGTC JAPAN の資料
ttps://www.nvidia.com/content/apac/gtc/ja/pdf/2017/1055.pdf
論文も出てる たぶんTITAN V買った方が幸せになれる
値段もそんなに変わらないだろうし くそ〜おまいらの会話が分からないぜ。プレモル読んでくるノシ 参考書見ながら勉強してて、教師あり学習はなんとなくイメージ湧くんだけど教師なし学習の部分に入ってから急に難しくて理解しにくい…
主成分分析とか特にややこしいんだけどこういう技術はやっぱり頻繁に使われるのかな? 低学歴超初心者のゴミの俺が機械学習の勉強して5ヶ月
今更だけど統計の知識って避けて通れない気がしてきた
ここの人達はそういう知識も持ってるのかな…
機械学習でいっぱいいっぱいだけどやれるか俺… 機械学習に統計学の知識なんて必要ないよ
統計学は応用数学として高度な数学を必要とするが
機械学習に数学はいらない 機械学習でビッグデータを扱うなら
最低でも正方行列でない行列を扱う対応分析や
疎な行列を計算機で扱うための知識が必要 10〜1000個ぐらいのパラメータを2〜3軸ぐらいで見るためには必須です。 方法の一つとしてはそうだけど、基礎技術って言われると、んー?って思う。基礎的な技術だけど。 >>409 です
PCAを使うのはあくまで可視化がメインなの?
特徴量抽出とかも書いてあってこんがらがってる
例えば20個の特徴量がある100点のデータがあって、それを2次元にしたい場合20個の特徴量からなる各データ(100点)から分散が大きい線?保持する
ってイメージなんだけど、2次元にした時点で色んなデータが削ぎ落とされて、20個の特徴量をぜんぶ引っくるめたデータの主成分だけが残って素の特徴量の概念は消えてると思うんだけどそこから特徴量を抽出って????ってなってる
日本語おかしくてごめん
自分の理解が完全に間違ってたり的外れな事言ってるのは十分理解してます… 統計検定2級レベルぐらいは機械学習に限らず解析とかするのに使えるから勉強しておくといい 情報系の学科でプログラムはそこそこ勉強してて
機械学習ライブラリを全く使ったことないんですがちょっと勉強したくて
機械学習入門ライブラリって何がおすすめですか
うまくいくかどうかは別にして
株とかFSみたいな時系列グラフの予測したり
将棋や囲碁みたいなゲームAIを作ってみたいです >>421
それはなぜそう思う?
PCAの結果って、数学的にニューラルネットのオートエンコーダの結果と一致する。
機械学習の本にそう書いてあるだろ? ニューラルネットから入門すればPCA に言及してるとは限らんだろ。そんなことも分からんのかw 測定を概論として知ってるといいよ
測定知らないと数理工学の理解が浅くなると思う 測定ってはじめてきいたかも
回帰分析とか線形代数は最低限はわかると思います >>428
測定ってmeasure(測度)のこと? たとえば時系列データの配列があったとして
なんてライブラリにどういう設定で実行すればいいかっていうのがわからない
どういうことをやるかっていうアルゴリズムの概論説明ばかりで
プログライミングの入門サイトみたいなのがあんまりなくて
何をインストールしてどうかけばいいかのプログラムサンプルを出してくれるサイトがあんまり見つからない >>431
分類ならIrisとかベンチマークで使われるデータセットがあるので具体的な使い方も分かると思う。
君のやりたい事が何のアルゴリズムで実現できるかは、自分で概論一通り勉強しないと決まらないと思うのよね。 >>433
ありがとうございます
irisていうの使ってみます
機械学習って行列から結果ベクトルを生成する関数をつくるもので
教師データとして入力出力ペアを与えたらそれに近い答えを出す関数が作られて
未知のデータを流し込んでもそれなりに答えが出るみたいなイメージだったから
ライブラリでやることってたいした違いはないのかと思ってた TensorFlow使ったほうがいい
くさるほどサンプルがある CRFもTensorFlow使えばきっと余裕でできるハズ >>433
Iris 機械学習 で検索してブログ2,3よんでみたけど
これってあやめの画像を認識するだけにしか使えないの?
画像認識はいまのとこ興味なくて
時系列データ予測(株とかよりはシーズン途中でのペナントレースの優勝予測とか)
ゲームAIとか
ツイッター上で知識獲得や自動応答
とかそのへんをやってみたいんだけど
>>435,436
TensorFlowはきいたことあるかも
次はそれ調べてみます
ありがとうございます 自由度、将来性、普及率考えればtensorflow一択
日本語資料多めで取っつきやすいのはchainer
とりあえず動かしてみたいkeras
最近の論文の実装例多めでやや将来性ありpytorch >>437
やりたいことが明確なのはいいけどそこからアーキテクチャを勉強せずに実装に移るのは無理がある >>439
そうなんですね
まずはプログラムを動かしてから
パラメータをかえていって使い方を覚えるみたいな感じで勉強してきたので…
とりあえず動かしてみたかったんですけど 決まったレスポンスが期待出来るWebやOSのAPI呼んで行く従来のプログラミングとは違いますな >>441
計算は確定的に同じ結果を得られるけど? 使うデータやモデル決めて実装するのも自分だもの。誰かが用意してくれた既存のAPI呼ぶプログラミングとは違うでしょ >>443
既存のクラスとかライブラリを一切使わないってこと?
コレクションとか配列とかもいちいち自分で管理するの?
もし仮にそうだとしたらそれを扱うような機能や関数を自分で作ってそれを利用するけどね
そこら辺は既存のライブラリ使っても結果への影響はほとんど変わらない あいかわらず頭悪いは
モデルというのはドカタが使うモデルの話じゃないからな >>445
既存のAPIってなんのことを言ってる?
従来のプログラムがその既存のAPIを使うだけで完成するっていう認識は正しいの? >>444
ライブラリを使っても自分の実装範囲が広いから、簡単なチュートリアル中々ないよね。って言いたかったんだ これでも何か行ってくるようなら446の人におまかせするわ 試行錯誤が必要って意味なら
そんなの当たり前の事じゃね
テレビのシステムとか
携帯電話の通信システムとか作るのに
試行錯誤が必要なかったとでも?
自動車や飛行機でも同様 数理モデルの話だからな
コーディングの話なんかココでは一切関係ない
まずやりたいことを
まずどういった数理モデルで実現するかという話になる
数理モデルでの実現方法をきめたら
次は、なにもわかってない低学歴底辺ドカタどもが作業するときに
どういった実装モデルにすれば一番コストを抑えることができるか
という話だからな
ぜんぜんかみあってないワケ
わかった? で、TensorFlowはその数理モデルを
組み立てるためのライブラリが充実している
当然、数理モデルがわかってないと
そんなライブラリは使いこなすことはできない >>451
数理モデルの所が物理モデルだったりするけど
やってることは同じようなものだ
それは普通に行われて来たこと >>451
で結局何を言いたいかって事だけど
期待した結果を得られなくて大変だ
と言いたいの?
まぁガンバレ 物理はちゃんと現在もっとも有力な仮説があるからな
その仮説にあてこむだけですむ
検証可能で検証可されてるサイエンスの成果をそのままテクノロジーに反映する土台ができあがってる
そういった成果は、バカでもチョンでも利用することができる
AIにはそういうもんがない
形而上学の世界だからな
低学歴知恵遅れにはこの意味がわかることはないと思うわ
車程度ならニュートン力学で十分だしな >>455
それが実現できないことに対する言分かな
他の組織で実現できたら
その時はどんな言分を考えるのかな
まぁ大変だろうけどガンバレ このスレの低学歴知恵遅れたちは
まず数学は文系であることを理解することが先 数学、プログラミングは論理学なのか?
少なくとも数学はそうかもね。プログラミングはハードの知識も必要だから工学の要素があるけど プログラム板なのにプログラムの話NGだったんですね
失礼しました 捨て台詞を吐いて、その程度で諦めるていどのモノなのか? 捨て台詞のつもりはないんですが…
自分のレスがきっかけでスレの流れがよくなかったのでやめたほうがいいのかなと思って
なんかすごく感じ悪く受け取られちゃってますね
ほんとに申し訳ないです
TensorFlowを教えてもらったので使い方ぐらいは自分で調べてみます
ほんとは使ってる人にききながらやったほうが絶対早いと思うんですが… あほでも使えるAIの学習済みライブラリが、すぐに出てくるかと思ってたけど、出ないな
実用に達していないレベルなら有るけど
https://dev.smt.docomo.ne.jp/?p=docs.api.index >>463
TensorFlowのラッパーのKerasがやさしい。
サンプルは幾らでもある。
まずMNISTでもやってみなさい。 株の予想とかペナントレースの予想とか、AIの使いみちが全然わかってないなw AIじゃなくて人間の知能だって未来の予測は難しいわw その教えて君を追い払う役目の自称高学歴有識者のお前らのコメントも、いかにもブラックボックスから出た答えを鵜呑みにしてそうな抽象的なものばかり。
類は友を呼ぶ。 >>473
では正解サンプルとしてお手本を示してください。 ubuntuにjupyterをインストールしようとしたけど、これもう無理だな
英語コミュニティでも、ちゃんとは内容を理解できないけど、みんなで無理だのなんだの言ってる感じ
pythonのパッケージを管理するためだけに
linuxについてをここ二週間ずっと勉強してきたのに初手でつまずいてしまった どういうこと?Jupyter Notebookがブラウザで立ち上がるだけじゃダメなの? 時系列解析の自己回帰(AR)モデルについて教えてください
「AR(1) = Rt = μ + Φ1Rt-1 + εt」という式で
次数1の時「Rt: 今回の値」は「Rt-1: 1つ前の値」から推定される
という式ですが、この「1つ前の値」は実測値ですか?
それとも「Rt-2」を使って算出された予測値を説明変数と
するのでしょうか?
前者が正しいなら1つ前の実測値がないと予測できない事になりますが、
後者が正しいなら何時点か前の初期値1つだけで何時点も後の
値を予測可能だと思うんですが、どちらでしょうか? >>487
何を分析するかに依るけど
一般的には実測値だと思う >>484
ありがとう。株価だよ。
すげえ悩んでたから助かったよ。 >>482
せっかくのLINUX環境なのに、CLIで起動できない実行環境なんて悲しすぎる
なんて思ったけど、jupyterlabなら簡単にインストールできた
コレ、次世代すぎて使いこなせる気がしないけど
今ぱっと動かした感じだとpycharmの更に上を行くほど更に凄いな
てか今年の春にjupyter notebookの使用方法をマスターしたのに
もう上位互換が出るのかよ。やってらんねーよ 株価って機械学習で予測できるの?
こないだ質問したら人間ができないことはできないっていってなかった? 単純なデイトレゲームと仮定した場合
株:できる、しかし実際には法律でアウトになるのでできない
見せ板を多用した相場誘導や短時間での注文&キャンセル処理でAPIに負荷かけた時点で
法律的にアウト
仮想通貨:できる
株ではできない見せ板を多用した相場誘導が基本的に無制限で法律で取り締まられてもいない
取引所に負荷かけすぎて怒られたりBANされることは多々あり
具体的には、板を出しているのが人間かそうでないかを見分けることで
肉入りから証拠金を巻き上げるような動きが可能になる
長期的嫌気判断として見た場合
株:できる
実際に行われているのは上場企業の役員のTwitterチェックなど
マイナスやトラブルを引き起こすような発言があったとシステムが判断した場合
(要するに異常検知の一種で炎上を検知している)
AIによって一斉に売られたりする
よくマイナス異常検知のターゲットになってるのはイーロン・マスクと関連企業
マイナスの異常でなくプラスの異常検知でも同じ
ニュースに対する反応なども見る
仮想通貨:できる
しかも風説の流布の取り締まりなどが行われていない為やりたい放題できる
大手仮想通貨メディアを裏で操る人々は、この手の手法で荒稼ぎしているだろう
直近で言えば、ゴールドマン・サックスの仮想通貨トレードデスク開設中止報道etc...
まぁちょっと勉強すれば誰でも思いつくよな
仮想通貨はこんな各国の法整備状況で、ビットコインETF承認なんてされたらある意味祭り 取引方法がはじめからわかってたら、高速なシステムトレードやるだけだろ。
株価じたいではなく、ニュースからデータ仕入れて、何に反応するかの部分のAI化ってことか。 予想の値を出すことは可能
だけどそれで目標の利益を得られるかは別じゃね?
一度上手く利益を得られたとしても
トータルでは違う結果になるかもしれない 荒れるっていうか実際やってる人達が他のやつもみんなやりだすと稼げないからな
仮想通貨のデイトレゲーは大資本ないと厳しい(ただし、手数料フリーの取引所は例外)
深層異常検知の自動取引なんてすごいお手軽にリスクを最小化できる
まぁこの程度はネタバレにすらならん
大手はみんなやってることだろ 震災後は地震になると猛烈に先物を売る地震アルゴとかあったけど、
全戦全敗で撤退した >深層異常検知の自動取引なんてすごいお手軽にリスクを最小化できる
それってどうやって性能評価してんの? ■ このスレッドは過去ログ倉庫に格納されています