【統計分析】機械学習・データマイニング18

2017/10/12(木) 20:21:31.89

機械学習とデータマイニングについて何でもいいので語れ
人工知能考察は未来技術板の技術的特異点スレで語れ

※ワッチョイ

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング17
http://mevius.5ch.net/test/read.cgi/tech/1502032926/

VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured

2018/02/26(月) 07:17:19.11

>>906
何を学習させてるの？

2018/02/26(月) 07:32:54.83

>>897
Juliaにしろ。

2018/02/26(月) 07:37:16.76

Juliaって使いにくいんだよな
matlabのコマンドウインドウをそのままpython対応にしてほしいわ

2018/02/26(月) 16:52:46.96

機械学習の基礎って1週間で学べる？

2018/02/26(月) 16:58:29.55

楽勝

2018/02/26(月) 20:08:09.42

tensorflowからkerasに移行したけどもっと早くに変えとくべきだったわ
kerasの楽さになれたら戻れんな

2018/02/26(月) 20:44:10.33

ケラケラ

2018/02/27(火) 00:11:37.36

chainerはtrainerに投げるまでのパッケージが何段階もあって面倒
kerasはモデル作ってコンパイルしてフィットするだけだから分かりやすい

2018/02/27(火) 00:47:26.28

pyTorch…

2018/02/27(火) 01:32:16.56

>>915
TFは別格にしても、pytorchもかなり流行ってきてるな

2018/02/27(火) 01:46:37.32

>>914
そんなことはみんな知ってるけど、信者が荒れるから避けてきてるんだよ

>>915 >>916
FB が頑張ってるからな

2018/02/27(火) 08:21:03.94

kerasは抽象化進んでるからこまい部分いじろうとしたらtf

2018/02/27(火) 15:55:02.38

モデルだけkerasで作って、訓練はtfに投げるっていう手もある

2018/02/28(水) 00:19:42.85

>>917
ﾜｯﾁｮｲにしてから問題ないよ～

>>918 >>919
そういう使い方いいな

2018/03/01(木) 10:34:42.63

あるモデルの予測性能に低下が見られた場合
トレーニングに使ったデータが既に手元にない時は
何をもとにチューニングをすれば良いのでしょうか

2018/03/01(木) 10:44:25.07

想像力

2018/03/01(木) 10:47:59.02

解決しました。ありがとうございます。

2018/03/01(木) 13:41:44.13

>>921
トレーニングに使ったデータを用いた予測と
直近のデータに差が生じた。
＝＞トレーニングに使ったデータでは差が出る
＝＞直近のデータでチューニングする
じゃないの？

**デフォルトの名無しさん** (JP 0Hbf-9qkV) · 2018/03/01(木) 16:42:02.06

学習モデル無いのにどこをどうチューニングするんだろう

2018/03/01(木) 17:32:30.43

エアー

2018/03/01(木) 18:24:10.61

オンライン学習でいいんじゃないの
トレーニング用のデータはない、新しいデータもない場合は無理な話だけどバリデーション用のデータがあるから性能評価できてるんだろうし

2018/03/01(木) 19:25:38.83

サポートベクター回帰について質問があるんだけど、
ここでいいの？

2018/03/01(木) 21:46:38.46

>>927
新しいデータがないとすると
チューニングが必要かどうかも
分からないと思うんだけど

2018/03/01(木) 22:57:30.16

オンライン学習を使わない場合は
モデルを継続的にメンテナンスするのに
モデル作成時とそれ以降のトレーニングデータを
延々と保持し続ける必要があるということ？
実務ではどうやっているのだろう

2018/03/02(金) 00:05:23.29

時系列的に変化してゆくものなら
初期モデルを保持する必要はないでしょう
初期状況がスタートになるデータと、
そうでないデータがあるなら
両者保持してそれぞれに適用する。
後者は動的に変化させてもいいし初期を引きずる
必要もない。

ま、置かれた状況に寄りということになるでしょうね。

2018/03/02(金) 00:11:29.37

ロバスト性の維持を必要とするかしないか
今のAIはその辺りの思考は適当かもしれない

2018/03/02(金) 01:49:20.06

CNTKってどうなん？

2018/03/02(金) 02:06:55.75

意外に悪くないよ

2018/03/02(金) 08:10:24.81

例えば手書き文字認識で最初に1万件のトレーニングデータで判別モデルを構築
その後新たに2万件のデータが入手できてそれをモデルに学習させるという場合
合わせて3万件のデータで適切なパラメータを探してテストしてモデルを構築することになるのかな

これはモデルを新しく構築するのと変わらないように思えるけど
つまり「学習≒モデルの新規作成」ということなのかな

これを続けるといずれはリソース不足になるけど
それを防ぐために最新の3万件を使ってモデルを構築するしくみにすると
切り捨てた古いデータから得られた知見はモデルに反映されないということになるのかな

2018/03/02(金) 09:04:33.85

サポートベクター回帰のことで質問。
目的関数や判別関数のなかにΣ(a-a*)っていう項がある。
a*は何を指していて、どうやって計算すればいいのだろうか。
ひょっとして、回帰曲線より上にあるデータに関してはaを計算し、
下にあるのはa*を計算するっていう風にするのかな？
もしそうだとすると、学習中は回帰曲線が変化していくのに合わせて、
aかa*かを変えていくってことなのかな？

実際の数式は、例えば↓のP.11
ttp://datachemeng.com/wp-content/uploads/supportvectorregression.pdf

2018/03/02(金) 09:11:06.56

>>935
オンライン学習だね
ディープ系だとあとから追加された教師データの影響が限定的な気がする
あとから追加された教師データで別のモデル作って、旧モデルとのアンサンブルを蒸留したほうが実用的には良い気がする

2018/03/02(金) 09:17:42.49

eラーニング

2018/03/02(金) 13:24:22.11

>>935
単純に最新の２万件だけとかにすると
同じデータばっかり連続して入ってくると
馬鹿になってしまう

2018/03/02(金) 13:47:26.85

いつのまにかkerasがCNTKに対応してたんだけど、やっぱりwindowsだとCNTKのほうが相性よかったりするんだろうか

2018/03/02(金) 14:40:53.80

>>940
CNTK の Keras 対応はまだベータのままだと思うよ

2018/03/03(土) 01:23:22.40

>>936
どや顔で答えるけど複素共役
重み係数に実数じゃなくて複素数使用することで重みの大きさだけじゃなくて、通信遅れみたいな取得波形のズレ具合みたいなものも相関取れる

2018/03/03(土) 01:33:49.21

しもた
どや顔してまちがえてしまた
ただの同じ種類の変数やん。

2018/03/03(土) 01:38:13.25

それぞれただの重みです。

2018/03/03(土) 09:02:30.36

>>944
重みというか、重みに関係するラグランジュ乗数だよ。
各学習データに乗数が２つあると考えるのかな？
あと、ついでに、この乗数を計算する更新式を知らないかな？
SVMの学習に使う更新式は見つかるんだけど、SVRの更新式が見つからない。

2018/03/03(土) 12:11:55.96

これらは筆者独特の説明のためにαとα*に分けただけ
本来はα-α*＝A、α+α*＝A'とでもおけばよい
ついでに言うとどうでもいいことだがこれらは本来のラグランジュの未定乗数法の定数ではない
筆者は何か定義を間違えてるのでは？

2018/03/03(土) 12:18:15.24

リンク先の資料ではなく
他の参考書なりネットで落ちてる他のものを見たほうがいいと思うけど。
基本的には重みを変化させて評価関数が小さくなるように重みを更新したらいいだけ。その方法は勾配法なり何でもよい

2018/03/03(土) 12:23:10.66

というか後半は二次形式になるから評価関数を偏微分して＝0とし、重みに関する行列つくって逆行列求めて終わり

2018/03/03(土) 12:58:57.79

>>946
他の資料をいくつも見てるけど、数式は同じだよ。
だから、筆者独自の考えではないと思う。

>>947
評価関数を最小にするよう重みを求めるのは分かるんだけど、
そのための常套手段というか効率のいい手法があれば教えて欲しい。
ないのかな。

>>948
俺の頭が追いつかなくて、全然理解できない。
逆行列を計算することで、最適解が解析的に得られるってこと？
色んな資料を見てると、そうではないようなんだよ。
あるいは、数学的には可能なんだけど、計算量が膨大なのかもしれない。

2018/03/03(土) 13:18:42.05

>>949
いやだからリンク先の資料は説明のための式変形だってば。意味を見いだすためだけの式展開。

方法は単純に中点法なりランダム法とかでよい。ただの凸関数だし。
適当に重みを2パターン用�ﾓして2点の評価関数を計算。さらに重みをそれぞれの中点求めてその値での評価関数も計算。一番評価関数が小さいものを更新。それでいける。

そもそも評価関数が重み定数の二次形式になってるから、最適解は一つしかなく、評価関数を重みベクトルの行列で表すとry

2018/03/03(土) 13:25:34.13

>>950
そこまでわかってるやつなら機械学習しなくても
直接方程式解いて最適解求めるプログラム書いた方が早くね

2018/03/03(土) 13:29:17.06

いや逆行列いっぱつで終わり

2018/03/03(土) 13:30:38.75

その辺がカーネル法のいいところですな

2018/03/03(土) 14:07:43.34

>>952
逆行列を求めるっていうのは、↓の式（７）を求めることに相当する？
ttp://cl-www.msi.co.jp/reports/svm.pdf

2018/03/03(土) 14:17:53.69

イエス
行列Qが正定値のときは書いてあるね

2018/03/03(土) 14:53:16.81

まあ一回偏微分してからな

2018/03/03(土) 15:31:05.81

>>955
じゃあ、>>954の方針でやってみるよ。
いろいろありがとう。

2018/03/03(土) 18:33:17.84

逆行列を計算する方法知ってるかいな？次元は知らんけど

2018/03/03(土) 21:51:51.31

>>954
なつかしいサイトや

2018/03/05(月) 23:12:50.88

カーネル法は応用が効くのに何で流行らないんだろ？

2018/03/06(火) 03:28:02.01

企業の仕事だと上司も客もTFを求めるから

2018/03/06(火) 03:50:25.33

ちげえよ。
ニューラルネットの性能のほうが圧倒的になった今、もはや過去の産物が必要とされないから

2018/03/06(火) 08:19:13.07

バカほど盲信するディープラーニング

2018/03/06(火) 08:43:23.79

そもそもカーネル法は単体の技術じゃない。
他の手法と併用出来る応用性の高い技術。応用先はサポートベクトルマシンに限らない。

2018/03/06(火) 08:54:58.40

ディープラーニングにもカーネル法は当然応用できるが、単純にただ併用するだけでは意味がない。
恐らくもうすでに誰かがやってると思われるが、その結果だけでカーネル法ダメダメと決めつけるのは勿体ない。
もう一工夫取り入れると‥‥

2018/03/06(火) 08:57:56.39

ってところまで誰かやってくんないかな～。
業種が違うから表に出せる機会がない

2018/03/06(火) 10:13:56.02

理論的、究極的にはにはそういう前処理すら必要ないのがニューラルネットだけどね
その操作が本当に判別に有効ならそういう処理を行う層が学習されるだけだし

**デフォルトの名無しさん** (ｽﾌｯ Sdff-mvGf) · 2018/03/06(火) 11:05:05.51

ニューラルネットは前処理いるじゃねえの？今は違うのか？

2018/03/06(火) 11:42:04.46

前処理用とは誰も言ってないのだが‥

2018/03/06(火) 11:42:45.34

メインで使用できると言ってる

2018/03/06(火) 11:44:24.56

>>968
昔も今も変わらない。
>>967の方が、なにか大きな勘違いをされているだけ

2018/03/06(火) 11:46:04.12

空間を一度別空間に写像してから‥
なんてイメージが付いちゃってるから>>967みたいな発想になるんだろうね。
ほんと勿体ない

2018/03/06(火) 12:01:17.98

ニューラルネットだけ別スレにしたほうがいいんだけどな

>>962
ド素人 www

>>963
同意。

2018/03/06(火) 12:06:24.48

尿意

2018/03/06(火) 16:11:33.02

PRMLもすっかり過去の本になってしまった

2018/03/06(火) 16:14:04.73

何が新しいの？

2018/03/06(火) 18:40:12.76

究極的にはって書いたけどそれでも違うの？
理論上は無限層重ねたNNはいかなる関数近似もできると思ってたけど

2018/03/06(火) 19:04:40.81

仮にNN中で汎化性能維持するのにカーネル法使うにしても「もうひと工夫」がなにしたいのかもわからん状態じゃなんとも…

2018/03/06(火) 19:48:16.11

3層でもいかなる関数も近似できるよ。理論上はねｗ

2018/03/06(火) 21:48:30.74

>>977,978
それはぜひご想像してください。
というか、以前のスレ追いかければ言いたいことは追えるかと
>>979
３層というか‥

2018/03/07(水) 04:26:14.78

そういえば皆さん中間層1つのNNって何層NNって読んでるの
全結合処理に重点おいて2層って言う人と、ノードに重点おいて3層って言う人がいる印象

2018/03/07(水) 05:46:26.41

タイトルに初心者スレと入れた方が良いね
というか次スレはいらねぇだろ

2018/03/07(水) 08:14:57.15

http://www.itmedia.co.jp/business/spv/1802/27/news121.html
これて使い道あんのかね

2018/03/07(水) 08:19:35.33

>>977
適切にデータが用意されていれば（前処理されていれば）
という条件の元

2018/03/07(水) 08:41:47.69

>>983
俺も同じ疑問を持った。まぁ実験すると言ってるだけだしw

2018/03/07(水) 17:07:00.30

類似度というか近接距離は？
https://dotup.org/uploda/dotup.org1479217.jpg

2018/03/07(水) 17:41:15.89

ベクトルのコサインが1.0

2018/03/08(木) 12:13:52.00

今更ながらランダムフォレストを勉強中なのですが、木の深さと木の数はどのくらいの値にすれば良いのでしょうか？
また、木の数を増やしていくのと、木の深さを上げていくのではどっちがオススメですか？数十万個のデータから決定木を生成したいのですが

2018/03/09(金) 13:37:49.59

>>988
分類か回帰かで違うみたいだけど、普通分類なら深さは制限しない。
木の数を増やしていくと汎化性能は上がるけど、その分計算時間がかかるようになるので
OOBエラーなんかを見ながら木の数を決定するのが一般的かなぁ。

2018/03/09(金) 16:34:08.41

さや
https://www.youtube.com/watch?v=GCICGJhfjM0

2018/03/09(金) 18:10:46.21

次
【統計分析】機械学習・データマイニング19
http://mevius.5ch.net/test/read.cgi/tech/1520586585/

2018/03/09(金) 22:39:16.52

992

2018/03/09(金) 22:39:40.92

993

2018/03/09(金) 22:40:03.10

994

2018/03/09(金) 22:40:29.94

995

2018/03/09(金) 22:40:54.39

996

2018/03/09(金) 22:41:29.76

997

2018/03/09(金) 22:41:54.54

998

2018/03/09(金) 22:42:16.45

999

2018/03/09(金) 22:42:38.42

1000

**1001** · Over 1000

このスレッドは１０００を超えました。
新しいスレッドを立ててください。
life time: 148日 2時間 21分 7秒