X



【統計分析】機械学習・データマイニング22

レス数が1000を超えています。これ以上書き込みはできません。
0001デフォルトの名無しさん (ワッチョイ f6da-BIu2)
垢版 |
2019/01/13(日) 09:13:37.19ID:lpjZ4t830

機械学習とデータマイニングについて語れ若人


■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング21
https://mevius.5ch.net/test/read.cgi/tech/1541309676/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
0910デフォルトの名無しさん (ササクッテロル Spbd-/vCN)
垢版 |
2019/02/26(火) 10:37:18.94ID:fq9lYmyMp
>>896 です
レス頂いた方ありがとうございます
>>905
自分も同じ手順を試してみたいと思います
もし良ければ参考にされた資料や記事などはありますでしょうか?
Kerasを使おうかと思うのですが始めて使用するので何から手をつけて良いか分からなくて…
0914デフォルトの名無しさん (ワッチョイ 79a5-dS/9)
垢版 |
2019/02/26(火) 11:38:20.51ID:w3X5x8760
>>911
Colaboratory使えばなんとでもなるさ

二値分類を複数のモデルでやってみたことある
画像サイズを480にしてあげると
Xception だと で89%
Inception_resnet_v2 で86%
この2つのモデルから推測させて、
・両方NGならダメ
・片方NGなら要検証
・両方OKなら通過
ていう感じで悪くない感じにはなってる

というか問題は組込される側じゃね?
試しにinception_resnet_v2で分類させてみたんだけど、
学習済みモデルのロードだけでメモリ4.5G食う
RaspberryPiとかでどうやって運用するんだろう
でかいスワップ使ってSSDでも遅いだろうし・・・
0917デフォルトの名無しさん (ササクッテロル Spbd-/vCN)
垢版 |
2019/02/26(火) 13:19:26.30ID:fq9lYmyMp
>>913
ありがとうございます
短くまとまってるので是非参考にさせていただきます
kerasの関数や使い方も合わせて調べてみます

あと、すごく初歩的な質問なのですがリンク先のコードを軽くみたところ出力層が2クラス分類問題なのに1つになってるのが気になります
良品、不良品とふたつの出力層が必要ではないのでしょうか?
0918デフォルトの名無しさん (ササクッテロ Spbd-4fA7)
垢版 |
2019/02/26(火) 15:45:31.82ID:11Fco3L7p
>>917
二値分類の問題は出力は一つでOK
例えば不良品にラベルを0、良品にラベルを1と付けたとする
活性化関数にSigmoidを使うと、入力した画像が0なのか1なのかを確率で返してくれる
0.5付近なら判別できていない

もし二つの出力でやりたいなら活性化関数にSoftmaxを使う
こちらは他クラス分類に使用する
良品レベルを5段階に分けて学習させるような場合に使う
0919デフォルトの名無しさん (ワッチョイ 5e66-erI5)
垢版 |
2019/02/26(火) 20:43:24.25ID:DUz4HSDe0
>>871
すみません、そのページを読んでみたのですが、まだ理解できません。

a に添字 b を下付きしたものを a_b と表すとして、
state-value function v_π(s) = E_π [G_t | S_t = s] を私は次のように式変形しました。

v_π(s) = E_π[R_(t+1) + γG_(t+1) | S_t = s]
v_π(s) = E_π[R_(t+1) | S_t = s] + E_π[γG_(t+1) | S_t = s]

私が分からないのは第2項の期待値の計算です。

E_π[γG_(t+1) | S_t = s] = Σ_a π(a|s) Σ_s'r p(sr', r|s, a) (γG_(t+1))

このように展開できると思うのですが違いますか?
0920デフォルトの名無しさん (ワッチョイ 3dad-2CcH)
垢版 |
2019/02/27(水) 03:08:09.73ID:qf2btets0
chainerを使ってたけど
tensorflowを使ったみようと思ってインストールしてみたら、
変なエラーばかり出てなかなか動かなかったけど、
MINSTがやっと実行できた。
うれしい!
0922デフォルトの名無しさん (ワッチョイ 2a01-T7le)
垢版 |
2019/02/27(水) 06:50:22.32ID:OtL3sL+V0
>>910 >参考にされた資料や記事などは
http://aidiary.hatenablog.com/entry/20170108/1483876657
(犬|猫)と花x17の練習問題はそのまま使える。

ここでやってるのはFrancois の本そのもの 本には
5%くらい精度落ちるけどGPUなしで高速に学習する方法も記載あり。
https://www.amazon.co.jp/Deep-Learning-Python-Francois-Chollet/dp/1617294438
0924デフォルトの名無しさん (ワッチョイ 3dad-2CcH)
垢版 |
2019/02/27(水) 11:05:10.77ID:qf2btets0
>>921
ありがとうございます!
動くまでいろいろと試行錯誤していました。
バージョンや環境に依存する部分も大きいのでしょうか?

僕が結局のところうまくいったのは以下のサイトの、
仮想環境を作ってからインストールするという手順です。

https://qiita.com/dddmm/items/9e4d9e08a071cfa4be83

このサイトの下に書いてある、

> 「(keras_work) conda install jupyter」でインストールして、
> カーネルを再登録して
> 「(keras_work) ipython kernel install --user 、、、」、
> jupyter-notebookを立ち上げなおしたら、正常に動作しました。

というのも実行したら、動作しました。
ここではkeras_workという名前になってますが、まだkerasはインストールして
いないのですが、仮想環境を作らなければ動作しなかった
ということは、何か僕の環境が悪かったのだと思います。

まあ、とりあえずtensorflowが動くようになりましたので、
いろいろサンプルを探して動かしながら、使い方を学びたいと思います。
0925デフォルトの名無しさん (ワッチョイ 797c-BftX)
垢版 |
2019/02/27(水) 12:18:00.05ID:+TCpifLa0
脳科学が明らかにする
「あなたの隣のサイコパス」

ありえないようなウソをつき、常人には考えられない不正を働いても、平然としている。
ウソが完全に暴かれ、衆目に晒されても、全く恥じるそぶりさえ見せず、堂々としている。
それどころか、「自分は不当に非難されている被害者」
「悲劇の渦中にあるヒロイン」であるかのように振る舞いさえする。

残虐な殺人や悪辣な詐欺事件をおかしたにもかかわらず、まったく反省の色を見せない。
そればかりか、自己の正当性を主張する手記などを世間に公表する。

外見は魅力的で社交的。トークやプレゼンテーションも立て板に水で、抜群に面白い。
だが、関わった人はみな騙され、不幸のどん底に突き落とされる。
性的に奔放であるため、色恋沙汰のトラブルも絶えない。

経歴を詐称する。過去に語った内容とまるで違うことを平気で主張する。
矛盾を指摘されても「断じてそんなことは言っていません」と涼しい顔で言い張る。

(略)
見過ごせないのは、この種の人間を擁護する人が少なくないことです。
(略)
時には「信者」であるかのような崇敬を示す人までいます。
そうした人たちは、きっと知らないのでしょう。
彼/彼女らが、高い確率で「サイコパス」だということを。
(脳科学者・中野信子さん)

AI的にはこういう子が育つ可能性はあるの?

●添とか●エモンとか百合子とかちょんとか
0926デフォルトの名無しさん (ワッチョイ 797c-kEY9)
垢版 |
2019/02/27(水) 12:22:19.72ID:+TCpifLa0
>>908
人事採用で応募して来た人間が不良かどうか判定したい
0927デフォルトの名無しさん (アウアウエー Sa52-281i)
垢版 |
2019/02/27(水) 12:49:52.22ID:yvpNGOcva
>>926
Amazonがそれやったけど女性差別するように学習して辞めたよね
0929デフォルトの名無しさん (ワッチョイ 2a81-nbQA)
垢版 |
2019/02/27(水) 13:30:32.39ID:kYCsLobN0
既存ツール、ソフトを利用する立場なら専門家の議論についてかなくていい
0931デフォルトの名無しさん (ワッチョイ 3dad-2CcH)
垢版 |
2019/02/27(水) 14:40:17.34ID:qf2btets0
P言語しか使えないプログラマって
CPUがどうやって動いているか知らないですもん。

知らなくても仕事でちゃんとプログラム作ってますから、
データ分析も全部知る必要ないと思います。

知らないけどちゃんと使えてる・動かしている、
というのは世の中にいくらでもありますよね。
0942デフォルトの名無しさん (ワッチョイ 6db3-/Zgv)
垢版 |
2019/02/27(水) 23:50:14.09ID:1rcJPNKd0
>>938
これはよくある「前日に近い値を出力しているだけ」では?
0943デフォルトの名無しさん (ワッチョイ 57b3-48YA)
垢版 |
2019/02/28(木) 00:08:09.21ID:CuUM5r410
株予測にMSEを使うとやらかしやすいミス
0944デフォルトの名無しさん (アウアウエー Sadf-Hr0W)
垢版 |
2019/02/28(木) 00:10:37.70ID:kXTPZ8gSa
数値データの変動だけからの予測は限度がありそうだな
社会情勢やニュースも考慮できたら精度が上がりそう
0945デフォルトの名無しさん (ワッチョイ 57b3-48YA)
垢版 |
2019/02/28(木) 00:19:05.22ID:CuUM5r410
株価だけだと
テクニカル分析を信じる人の割合+それに乗っかる人の割合
くらいでしか当たらないからね
0946デフォルトの名無しさん (ワッチョイ 9f7c-3oSp)
垢版 |
2019/02/28(木) 01:14:47.99ID:OOAd9HkA0
>>868
重み更新を行わないステップがあると、lossとかのmetricsが全部nanになる
強化学習でフレームスキップをした時によくハマってた

そうじゃなかったら、loss functionの使い方を根本的に間違えてるとか?
0947デフォルトの名無しさん (ワッチョイ bf66-UbqP)
垢版 |
2019/02/28(木) 09:07:56.62ID:yERzO5rQ0
>>938
須山敦志 Suyama Atsushi? @sammy_suyama
不確実性を無視して予測を「精度良く当てにいく」というのはあまり有用じゃないです。例えば株価の上昇をピンポイントで当てにいくよりも、「暴落しないこと」が言えた方がずっと有用。
https://twitter.com/sammy_suyama/status/1090399628841803778
https://twitter.com/5chan_nel (5ch newer account)
0948デフォルトの名無しさん (アウアウイー Sa0b-Topk)
垢版 |
2019/02/28(木) 09:42:57.67ID:3dEKXnvYa
>>947
ポートフォリオ理論、30年以上前のクォンツの時代から、
本来はヘッジのために考えられ、その有効性が盛んに叫ばれても
みなさん運用(儲け)側にしか走らなかった。

分ってはいるが、そうやって使ってくれないという悩み。
焼き直しにすぎないのですが、価値が無いわけじゃないんだよな。
0949デフォルトの名無しさん (アウアウイー Sa0b-Topk)
垢版 |
2019/02/28(木) 09:52:42.58ID:3dEKXnvYa
>>938
国内でも機械学習を用いて、自己資金で運用というのが
15年前から3年近く前まで、運用実績をWebサイトでずっと公開されて方がいた。

実際に相当に資産を増やされていたが、本業ではないので株についてのアルゴリズム
の見直しは本格的にされていなかったので、現在(2年か3年前から)は、為替に
主力を移して良いパフォーマンスをだされてますよ。

昔から興味のある方々にとっては有名なサイトでした。サイトは閉じられましたが
現在もPC7台使って自動運用中です。
ちなみに、リアルタイム取引ではないです。
0950デフォルトの名無しさん (ワッチョイ 57b3-48YA)
垢版 |
2019/02/28(木) 11:08:48.92ID:CuUM5r410
ヘッジに使わていないとかどこの世界の人なのか
ヘッジャーとスペキュレーターとアービトラージャーは業務が別なだけ
0951デフォルトの名無しさん (ワッチョイ d7ad-+tcs)
垢版 |
2019/02/28(木) 12:28:54.67ID:6I4J9Bo20
米証券会社大手ゴールドマン・サックスには500名の
トレーダーが在籍していたが、AIトレードの普及で
今ではAIエンジニア3名に置き換わってしまったのは
有名な話ですよね。

先日、恩師によばれて大学のゼミ生たちに
プログラミングを教えに行ったら、
全員が機械学習で株価を予想しててマジで笑いましたw
0953デフォルトの名無しさん (ワッチョイ 377c-vuRV)
垢版 |
2019/02/28(木) 12:42:47.63ID:yyOtWed30
>>948
みんながそれ使うとゼロサムになるって証明されちゃったとか?
0954デフォルトの名無しさん (ワッチョイ 9f8c-TvSP)
垢版 |
2019/02/28(木) 12:44:05.80ID:fW6l9fVu0
>>947
暴落しない事を当てるなんて不可能だろ
エンジニア風情は何でこうも市場の効率性に無知で自信過剰なんだ

>>951
置き換わってるのは内外問わず「執行」の部分
実際の投資戦略では線形回帰分析が主流どころかほぼ全て
0955デフォルトの名無しさん (ワッチョイ d7ad-+tcs)
垢版 |
2019/02/28(木) 12:49:06.81ID:6I4J9Bo20
>>952
Pythonで基礎的なアルゴリズムの実装を教えに行きました。
まあ、初心者向きですね。

学生連中が株価予測に使ってるのは、
主にSVR、ランダムフォレスト、ディープラーニング
などですけど、線形のSEMを使ってる学生もいました。
0956デフォルトの名無しさん (ワッチョイ d7ad-+tcs)
垢版 |
2019/02/28(木) 12:51:18.51ID:6I4J9Bo20
>>952
あなたはどんな言語でどういう方法で
予測をやってるんですか?
0961デフォルトの名無しさん (ワッチョイ d7ad-+tcs)
垢版 |
2019/02/28(木) 13:24:35.42ID:6I4J9Bo20
>>958
全く違います。
基礎を教えて行っただけです。

で、基礎を教えに行ってみて
学生と話をしたら
株価の予想にのめりこんでる奴らばかりだった、
という話です。

それを全部説明すると話が長くなるので
なにをどのように教えたのかははしょっただけです。

株価の予想をやってないなら
聞かないでくださいよ。
馬鹿なんですか?
0962デフォルトの名無しさん (ワッチョイ d7ad-+tcs)
垢版 |
2019/02/28(木) 13:25:40.58ID:6I4J9Bo20
>>958
質問ばかりで何も役に立つ話がないので
聞きますが、どういう機械学習をどういう会社で何年ぐらい
やってるんですか?
細かく説明してください。

まさかただの馬鹿院生ですか?
0964デフォルトの名無しさん (ワッチョイ 7fd5-We7c)
垢版 |
2019/02/28(木) 13:40:08.80ID:nHopElSs0
東京大学理学部数学科に入りたい。
0974デフォルトの名無しさん (アウアウイー Sa0b-Topk)
垢版 |
2019/02/28(木) 15:15:49.79ID:C/bUcPIZa
それ以外に、個人では手数料の問題が大きんですよ。
株にしても為替にしても。
0975デフォルトの名無しさん (アウアウイー Sa0b-Topk)
垢版 |
2019/02/28(木) 15:18:15.78ID:C/bUcPIZa
>>950
業務分担の話ではなく、多くの機関投資家の興味が儲けに偏っているということ。
業務的に両面あるのは当たり前の話。
0977デフォルトの名無しさん (エムゾネ FFbf-vuRV)
垢版 |
2019/02/28(木) 15:31:52.63ID:4Fcnv2BBF
>>973
手数料取られるから儲からない
0978デフォルトの名無しさん (アウアウイー Sa0b-Topk)
垢版 |
2019/02/28(木) 15:39:48.77ID:C/bUcPIZa
>>977
実際に取引している人だと、必ずその問題が前面に出てくる
0979デフォルトの名無しさん (ワッチョイ 1792-Ak6H)
垢版 |
2019/02/28(木) 15:48:51.72ID:IoveUA5w0
機械学習だのデータマイニングだのは所詮、純粋数学ができなかった落ちこぼれがやる分野でしかない。
もっと言うと、計算機科学自体が、純粋数学ができなかった落ちこぼれのやる分野だなw
真の天才は純粋数学、そしてその中で最も難しいと言われている数論幾何学を勉強する。
俺は物心ついた時から平均を遥かに下回るぐらいの超絶ド底辺クラスの頭の悪さだったけど、
なんとかして頑張って猛烈に勉強しまくって東京大学理学部数学科に入り、
そして、数論幾何学を勉強し、優越感に浸りたい。
ちなみに高校も超絶ド底辺高校出身です。
0980デフォルトの名無しさん (アウアウイー Sa0b-Topk)
垢版 |
2019/02/28(木) 16:10:08.37ID:wN+Z8nnVa
>>979
いいんじゃない、頑張って!
一つだけ言えば、人を気にしないで生きてください。
0982デフォルトの名無しさん (ワッチョイ 1792-Ak6H)
垢版 |
2019/02/28(木) 16:14:08.34ID:IoveUA5w0
http://www.kurims.kyoto-u.ac.jp/~motizuki/papers-japanese.html

超絶天才数学者、望月新一氏の論文。

これはヤバイな・・・・。
0984デフォルトの名無しさん (ワッチョイ 1792-Ak6H)
垢版 |
2019/02/28(木) 16:25:16.53ID:IoveUA5w0
思索というか妄想していて疑問に思ったことがあるのですが、
無限大の破壊力を誇る超強力な武器があったとして、
無限大の空間に対してその武器を発動したら、どうなるのでしょうか?
無限大と無限大のぶつかり合いですが、結果はどうなりますか?
0985デフォルトの名無しさん (ワッチョイ 57b3-48YA)
垢版 |
2019/02/28(木) 16:29:31.19ID:CuUM5r410
濃度は?
0986デフォルトの名無しさん (アウアウイー Sa0b-Topk)
垢版 |
2019/02/28(木) 16:29:52.54ID:wN+Z8nnVa
結果として、宗教家が生まれてきそうだ
0988デフォルトの名無しさん (ワッチョイ 1792-Ak6H)
垢版 |
2019/02/28(木) 16:32:57.99ID:IoveUA5w0
>>985
どういうこと?
0990デフォルトの名無しさん (ワッチョイ 57b3-48YA)
垢版 |
2019/02/28(木) 16:37:22.97ID:CuUM5r410
>>988
無限と無限を比較するなら濃度の大小を明らかにしないと
0991デフォルトの名無しさん (ワッチョイ 1792-Ak6H)
垢版 |
2019/02/28(木) 16:38:48.44ID:IoveUA5w0
>>990
じゃあ、無限の濃度が同じだとしたら結果はどうなりますか?
0994デフォルトの名無しさん (ワッチョイ 1792-Ak6H)
垢版 |
2019/02/28(木) 17:50:52.11ID:IoveUA5w0
>>992
不可能だと、具体的にどんな感じになるのでしょうか?
0995デフォルトの名無しさん (JP 0H3b-MRyn)
垢版 |
2019/02/28(木) 18:04:52.94ID:Fk7RDmJAH
望月のabc予想、微妙じゃん
0997デフォルトの名無しさん (ワッチョイ 1792-We7c)
垢版 |
2019/02/28(木) 18:57:16.10ID:IoveUA5w0
>>996
濃度が同じなのに宇宙が破滅して無の世界が訪れるの?
それじゃあ武器が勝ったってことになるじゃん。
1000デフォルトの名無しさん (ワッチョイ 3754-Mn0V)
垢版 |
2019/02/28(木) 19:57:31.99ID:Oi+wqBZw0
あと、ゴールドマンサックスのような投資銀行では、普通、確率予想によりリスク計算を厳格に
行なっているので不確実性には投資しない。投資が実行となるのは100%近い、収益性が予測さ
れる場合のみ。この場合、100%の収益性が保証されるプログラムトレーディングとは、
high-frequency tradingという手法をいう。HFTでもっとも一般的な手法は、市場に影響を与える
ニュースをマイクロセカンドの単位で早く入手して、その確実な情報に基づき、他者に先駆けて
トレードを実行してしまうというものとなる。Bloombergは、顧客に対して専用回線で、オープン
アクセスの自社ニュースサイトよりもコンマ数秒の単位で情報を先出しすることをやっており、
HFTを実装している業者は、こうしたニュースソースを利用して、例えば雇用統計の中身がが市
場予想と大きく異なる場合には、予想と反対のトレードを自動実行して利益を出すようなことを
やっている。例えば日本市場の場合、日経平均は、日経新聞社が5秒間隔で更新している。この場合、
東証の直結回線から取引データ利用して日経平均をリアルタイムで算出することができれば、
最大5秒先の未来の日経平均の情報を入手できることとなり、5秒先の未来の日経平均の変化率が
大きな場合は、大きな利益を得られることとなる。ゴールドマンでやってることはこういうこと。
レス数が1000を超えています。これ以上書き込みはできません。

ニューススポーツなんでも実況