X



【統計分析】機械学習・データマイニング20
■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん (アウアウエー Sa5f-Mv1r)
垢版 |
2018/08/07(火) 18:56:37.59ID:sGPH9ejna
機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング19
http://mevius.2ch.net/test/read.cgi/tech/1520586585/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
0774デフォルトの名無しさん (アウアウイー Sa9b-9ozk)
垢版 |
2018/10/16(火) 18:17:43.89ID:LVmCdvc6a
>>772
すいませんちょっと質問の仕方を変えさせていただきます。
入力画像に対して「犬」、「猫」、「それ以外」の3クラスで分類を行いたい場合、
「それ以外」のクラスとしてどのようなデータセットを与えるべきでしょうか?
0775デフォルトの名無しさん (アウウィフ FFeb-NsMu)
垢版 |
2018/10/16(火) 18:25:20.10ID:YLHbxnbGF
one
near
threeee
0777デフォルトの名無しさん (アウアウエー Sa9f-Zhpk)
垢版 |
2018/10/16(火) 19:13:11.22ID:mtK6WYc4a
cifar-10やimagenetの犬猫以外のクラスを与えたら?
0781デフォルトの名無しさん (オッペケ Sr9b-Zhpk)
垢版 |
2018/10/16(火) 20:00:36.96ID:BMUJGI05r
>>779
確率として解釈出来なくなるから
犬 100
猫 010
他 001
とすべき
0782デフォルトの名無しさん (アウアウイー Sa9b-9ozk)
垢版 |
2018/10/16(火) 20:07:12.15ID:Yv68lSL8a
>>777
与えた結果よい成果を生んだ参考文献か何かはありますでしょうか?
直感ですと特徴を捉えきれないと思うのですが上手く作用したりするのですかね。

>>779
そんなラベルの付け方もあるのですか??
出力層の正規化はどうやるのでしょうか?
0783デフォルトの名無しさん (アウアウエー Sa9f-Zhpk)
垢版 |
2018/10/16(火) 22:36:45.28ID:mtK6WYc4a
>>782
文献は知らないけど
スクラッチで学習するんじゃなくGoogLeNetとかをファインチューニングしたらどうかな
0787デフォルトの名無しさん (ワッチョイ 7f08-w7rM)
垢版 |
2018/10/17(水) 18:06:30.59ID:c6ApCslj0
実験結果
CPU使用

MNISTでソフトマックス関数使ってやってみた結果
100エポック
92%

フィードフォワードネットワーク利用
300エポック
98%

MNISTぐらいならCPUでもそこまで時間かからないな
人工知能用にPC買う予定だけど
GPU使用が楽しみだ
0788デフォルトの名無しさん (アウアウエー Sa9f-Zhpk)
垢版 |
2018/10/17(水) 20:25:47.05ID:aGL7TZ3Ma
>>786
分類やりたいだけなのにわざわざ検出アルゴリズム持ち出すのって大仰過ぎないか
0792デフォルトの名無しさん (ワッチョイ 67b3-3xFn)
垢版 |
2018/10/17(水) 23:52:28.66ID:bpF2/qnc0
>>787
適当に3~4階層で作ったので
MNIST87%行ったから
DLチョロいじゃんとか思って
Karasの他のapplicationに手を出したら
学習終わるまで300時間とか言われて泣きが入って
RTX2080Ti買おうと思ったら高過ぎワロタ
0795デフォルトの名無しさん (アウアウイー Saf3-AyP3)
垢版 |
2018/10/18(木) 18:29:04.82ID:WjJlstdVa
>>786
yoloから検出機能を取ったようなネットワークがあれば良いのですが・・
最悪全クラスに対して識別器を作ってもいいので、
犬の画像が入力された時だけ発火して1を返すようなネットワークでもいいのですがそんなのありませんかね?

>>789
多クラス分類のためソフトマックス正規化を使っているので0,0にはならないですね。
この例で言うと0.5,0.5になってくれると大万歳なのですが大体そうはなりません。
上の人が言ってるようにどっちか推して来やがります。

>>792
そこまで高いの買わなくても、
サブ機に1050Ti積んでますけど
inceptionv3の199層〜のファインチューニングでも
32000枚を100エポック回して大体5時間で終わりますよ
低価格でいろいろ試すには悪くない性能だと思うので検討してみてはいかがでしょうか。
0797デフォルトの名無しさん (アウアウウー Sa9f-Wo3P)
垢版 |
2018/10/18(木) 21:08:27.70ID:3WNLz9C3a
>>795
ソフトマックスを使う限り、出力が[0.5, 0.5]というのは犬の確率と猫の確率が同程度であるという意味しか持たない
同程度に高いのかもしれないし同程度に低いのかもしれないわけだが、この両者は分離できなければならない
ということで出力層にソフトマックスは使わずに例えば単にシグモイドを使えば出力される2つの数はそれぞれ犬・猫の確率を独立に算出したものとなる
適当な閾値を決めて一方のみが大きければ犬or猫と判定、共にゼロ近くならどちらでもないと判定すればいい
それ以外の中途半端な出力が頻発するならそもそも犬猫の特徴を学習できていないので出力層を工夫したところで無駄であり、学習データを増やしたり出力層以前の層の構造を改良するしかない
0798デフォルトの名無しさん (アウアウエー Sae2-6bZA)
垢版 |
2018/10/18(木) 22:55:11.05ID:E8jILIgaa
>>789
犬猫だけで分類学習したネットワークにそれ以外のデータを入力することがナンセンス
学習した分布から外れたデータだから出力がどうなるかは分からない
犬でも猫でもない画像だとしても高い確度でどちらかに分類され得る
0799デフォルトの名無しさん (ワッチョイ 53c3-+WKx)
垢版 |
2018/10/19(金) 01:42:27.71ID:heGbLBdq0
>>798
最近傍距離でやったらそうなるよね.
本当にナンセンスと言うことに同意.
0800デフォルトの名無しさん (ワッチョイ 53c3-+WKx)
垢版 |
2018/10/19(金) 01:51:18.44ID:heGbLBdq0
>>795
元々の目的が人か否かを検出したいんだよね?
yoloを使えば良いと思うけど,それを使いたくないなら
>>760 の通りの方法でも汎化性能は悪くなるはずだけど行けなくもない(実運用はやめてね)

人のように見えるオブジェクトを誤検出するだろうし,人のポスターを人と判断するだろうし
多クラス分類にして,より確率の高い分類器xを選ぶじゃ駄目なの?2値分類は汎化性能という意味では極端に弱いから自動運転に関しては辞めた方が良いと思うよ
0801デフォルトの名無しさん (ワッチョイ 53c3-+WKx)
垢版 |
2018/10/19(金) 01:55:24.05ID:heGbLBdq0
>>760
言い忘れたけど,人以外の物体が何を指すのかよく分からないけど
人が写って無い道路の画像で学習させるのが一般的だと思うよ.
それ以外の画像だと潜在空間における人とotherの距離が不明になるし辞めた方がいいよ
0804デフォルトの名無しさん (ワッチョイ 53c3-+WKx)
垢版 |
2018/10/19(金) 06:33:27.67ID:heGbLBdq0
研究を議論したいなあ,だれかスレ作って
0808デフォルトの名無しさん (アウアウイー Saf3-AyP3)
垢版 |
2018/10/19(金) 13:50:41.29ID:R1ndva0Ba
>>797
なるほど、凄く答えに近いこと聞いた気がします。
アクティベートをシグモイドにするだけでその挙動が得られるのですか?
条件反射でソフトマックス使ってたので盲点でした。
少し試してみます。
0809デフォルトの名無しさん (アウアウイー Saf3-AyP3)
垢版 |
2018/10/19(金) 13:56:34.41ID:R1ndva0Ba
>>798
なるほどそういうものなのですね。
しかし疑問なのが、どうして犬を検出する検出器は学習させることが出来るのに
犬の画像が入力された時だけ1を返すネットワークを学習させることができないかです。
明らかに後者の方が簡単なように思うのですが。。
お詳しそうなのでよければ教えていただけませんか?
0811デフォルトの名無しさん (スップ Sd2a-uXI1)
垢版 |
2018/10/19(金) 14:15:57.11ID:gl4kTOSHd
>>809
機械学習の一般論として、なにかを判定するには教師データとして正例と負例をおなじ数だけ与えるのが基本でしょう
「googleが猫を検出するDNNを作った」事例がよく取り上げられるけど、あれだって大量の猫画像とそうでない画像を与えている
0813デフォルトの名無しさん (オッペケ Srb3-6bZA)
垢版 |
2018/10/19(金) 15:33:05.18ID:pogP5zPXr
>>809
前者は1000クラスの分類器がベースになってる
日常的に身の回りにある物は大体この1000クラスに含まれるので犬を(も)検出できる
当然その1000クラス以外が入力された時にどうなるか保証はない
後者は犬以外のどんな画像が入力されても0を返すのが難しい
これは犬以外に対応する潜在空間が圧倒的に広いから

でもまあ実用的には1000クラス分類器の流用で十分な気もするな
0814デフォルトの名無しさん (ワッチョイ 7bd2-Pr2h)
垢版 |
2018/10/19(金) 15:55:18.03ID:7FKkwhq/0
>>805

> AIっていかに論文をたくさん読んで、どれだけパクるかの勝負じゃん

ということは、AIが何か知っているんか?
じゃ、AIとは何か言ってみ?
0817デフォルトの名無しさん (アウアウイー Saf3-AyP3)
垢版 |
2018/10/19(金) 16:54:39.13ID:R1ndva0Ba
>>813
なるほど。。
それなら素人考えですと、
imagenetの画像を犬とそれ以外の2クラスに分けて
2クラス分類で学習させたネットワークは
その検出器と比べて認識力ではほぼ等価と見なせますか?
0818デフォルトの名無しさん (アウアウイー Saf3-AyP3)
垢版 |
2018/10/19(金) 16:59:37.79ID:R1ndva0Ba
>>811
なるほど。
ではそのように猫だけを検出するネットワークを作りたいとしたら、
ネガティブとしてどんな画像を与えるのですか?
上の方も言ってる通り潜在空間が広すぎると思うのですが、
例えばimagenetの猫以外の画像を全てネガティブとして1クラスに押し込んで特徴って捉えれるのですか?
0819デフォルトの名無しさん (オッペケ Srb3-6bZA)
垢版 |
2018/10/19(金) 17:18:26.23ID:pogP5zPXr
>>817
普通にそれをやると犬以外のデータが圧倒的に多いので多分上手くいかない
何も考えず全て犬以外に分類するだけで正解率99.9%を達成できるので、単純に分類誤差最小化で学習するとそうなる
学習済みネットワークの出力を加工するかファインチューニングするのがいいと思う
0820デフォルトの名無しさん (アウアウイー Saf3-AyP3)
垢版 |
2018/10/19(金) 17:38:40.69ID:R1ndva0Ba
>>819
なるほど、、ためになります。
そういう実用的な事が書いてある書籍か何かありませんか?
ディープラーニングの本いろいろみて回ったのですが、
理論(数式)責めでドヤってる本か、
ネット見れば分かる程度の初歩的な実装方法書いたような本しかなくて困ってるのですが・・
欲しいのは数式でもチュートリアルでもなく実用性のあるものなのですが。
これ1冊あれば数式読まなくてもモデル選定からチューニングのコツまで分かるみたいな本ないですか?
0821デフォルトの名無しさん (オッペケ Srb3-6bZA)
垢版 |
2018/10/19(金) 17:55:39.31ID:pogP5zPXr
>>820
そんなうまい話ないぞ
学習したいデータや問題毎に色々な試行錯誤がある
仮に望むような本があって表面だけなぞったとしても同じ悩みにぶつかるよ
0825デフォルトの名無しさん (ワッチョイ 2a23-ZrT7)
垢版 |
2018/10/19(金) 21:18:55.91ID:TlirwEgq0
>>818
そういうこと(猫画像とそれ以外画像とに分ける)で学習してる例が多いと思うけどね。ただ指摘があるように正例と負例の数は揃えないと。
あなたが実際にその分類器を使う段階になって、猫以外の画像としてどういうものが入力されるのか? それに近い分布のものを負例としなきゃ

「仕事ではじめる機械学習」あたり読んでみては(自分は読んでないけどw)
0831デフォルトの名無しさん (アウアウウー Sa9f-S/Dd)
垢版 |
2018/10/20(土) 00:58:23.13ID:2DsZDK0Sa
正例と負例の訓練データ数が全く桁違いの場合って割と多いと思うんだけど
例えば機械の故障判定とか製品の不良判定とか、正常データが大量にあって異常データは僅かになるのが典型的
その場合全て正常と判定するモデルの正解率は高くなるが、混同行列見たりF1値を評価指標にすればそんなのは非常に悪い学習結果と判断できるから排除できる
0834デフォルトの名無しさん (アウアウイー Saf3-AyP3)
垢版 |
2018/10/20(土) 16:36:17.04ID:d68y9Vxsa
>>830
理解出来ない訳では無いですけど無駄手間じゃないですか?
ただツールとして使いたいだけで理論を開発しようって訳ではないので(そもそも数式には興味ない)、
数式見るのは研究者がやればいいと思うのですが。
ガウシアンぼかしの式すら知らない素人でもリファレンス見て試行錯誤で華麗にフォトショップ使いこなしますよね?
あんな感じに早くなればいいと思うこの頃です
0837デフォルトの名無しさん (ワッチョイ 1adc-+WKx)
垢版 |
2018/10/20(土) 16:58:22.99ID:yNArAPz00
特定のものを認識させて物理空間上の位置(座標)を出力値とする場合って
SSDやYoloのような物体認識を使った方が早いかな?

>>883
882が何のライブラリを使ってるか知らんけど、tensorflowのMac版はCPUしか対応してない
0838デフォルトの名無しさん (アウアウウー Sa9f-yEbU)
垢版 |
2018/10/20(土) 17:04:33.60ID:V8iNamHla
最先端の研究結果の数式が必ずしも理解できる必要はないが
機械学習の基礎になる線形回帰、ロジスティック回帰、ニューラルネットワークの全結合層の原理程度は分かっていなければ厳しい
これが理解できていなければ自分の手持ちデータで何かやろうにもどんな手法を使うべきか見当も付けられず、
名前を知ってるものを適当に使ってみて精度が良かった・悪かった、と錬金術的にやるしかなくなる
0839デフォルトの名無しさん (ワッチョイ f380-tM5n)
垢版 |
2018/10/20(土) 17:09:48.35ID:gp/trlhl0
機械学習ではな
自分よりお利口なもんはできない

まず自分がなんでバカで頭悪いかを考えたほうが有意義だからな

バカのくせになんで自分よりお利口なもんができると思うのか
そこが不思議でならない
0840デフォルトの名無しさん (ワッチョイ f380-tM5n)
垢版 |
2018/10/20(土) 17:17:07.08ID:gp/trlhl0
バカでなければ
どうやったら自分が効果的に学習できるか考えるからな

自分が効果的な学習ができないのに
計算機で効果的な学習とかまずムリ
0842デフォルトの名無しさん (アウアウエー Sae2-6bZA)
垢版 |
2018/10/20(土) 18:39:36.65ID:AUqXYm6Fa
>>834
フォトショップを知識がなくても使いこなせるのはアルゴリズムが成熟していて大半の処理は裏方で自動でこなしてくれてるから
機械学習では自動で問題毎に自動で最適な処理をできる技術がまだ確立されていないから、ツール的に軽く触っただけで良い結果を得るのは難しいよ
0843デフォルトの名無しさん (ワッチョイ f380-tM5n)
垢版 |
2018/10/20(土) 18:49:17.27ID:gp/trlhl0
知識って。。。
画像処理ソフトとか画像データのピクセル加工やってるだけやんけ

で、見た目がそうなってる
とりあえず見た目こんな感でいいや

コレを機械学習と同じと思ってる時点でもうね
0844デフォルトの名無しさん (アウアウイー Saf3-AyP3)
垢版 |
2018/10/20(土) 20:39:27.85ID:k0LrzqP2a
>>836
本質を理解しようとはあまり思っていませんね。
とりあえずツールとしてラクチンに使えたらそれだけでよいので・・
>>837
そうだったんですね、自分winでブートしてるのでそれは知りませんでした。
>>838
そうなんですよ、そこなのです。
だから手持ちデータとやりたいこと等から使うべき手法やモデルを教えてくれる本とかがあればいいんですけどねえ
0845デフォルトの名無しさん (アウアウイー Saf3-AyP3)
垢版 |
2018/10/20(土) 20:44:45.92ID:k0LrzqP2a
>>842
そうですよね。
だから最適な処理を見つけるためのバイブル的なものがあればなあと思っています。

>>843
本質的にはあまり変わらないと思うのですが。
上の人が言っている通り自動化する技術が確立されていないだけで、
学習自体はデータに対して同じ処理を繰り返してるだけですし、
フォトショップでいう見た目=テストaccなりlos、という感じで使えても悪くないと思いますし
最近でいうならそれこそGANなんて見た目だけの話なのでとりあえずこんな見た目でいいや、で解決すると思います。
0847デフォルトの名無しさん (ワッチョイ 6ad2-CW5R)
垢版 |
2018/10/21(日) 03:09:43.34ID:yA/rLZti0
まあ発展途上よな
実用も含めて
0848デフォルトの名無しさん (ワッチョイ 53c3-+WKx)
垢版 |
2018/10/21(日) 05:50:34.84ID:MsXt9/J70
>>845
>だから最適な処理を見つけるためのバイブル的なものがあればなあと思っています。
これは最先端の研究なので論文を読んでパラメータの設定はどうするとか学ぶ必要がある.
いくら機械学習の出版が早いとはいえ待ってたら2,3年は遅れた知識になる.

後結局手法はAutoMLとかで大体今でも自動化できてるんだけど,データから推定した結果の解釈とかの問題もあるし,
全部が全部バイブル通り行くとは行かないのが現実.「全てのモデルは間違ってる.完全なる解釈はない」というのが統計学の鉄則だよ
0849デフォルトの名無しさん (ワッチョイ 53c3-+WKx)
垢版 |
2018/10/21(日) 05:53:12.18ID:MsXt9/J70
赤池先生の経歴をと尊敬を持って機械学をやるべきだと僕は思ってる.

汎化誤差の最小化だけじゃあまりにもつまらないし.最近のAmazonの差別AIみたいなのができるのが落ち.
未来はどうなるか分からないけど数式から逃げることはできないと覚悟した方が良いと思う.
0857デフォルトの名無しさん (ワイーワ2 FFa2-T/6m)
垢版 |
2018/10/21(日) 11:29:45.72ID:sjXodBVwF
>全部が全部バイブル通り行くとは行かないのが現実.「全てのモデルは間違ってる.完全なる解釈はない」

ほんそれ
0858デフォルトの名無しさん (アウアウイー Saf3-AyP3)
垢版 |
2018/10/21(日) 13:35:30.75ID:Ya81v9Q1a
>>848
最先端のネットワークはモチロンそうでいいと思うのですが、
DropoutやらReLUとか組み込んだCNNならもう流行りだして2,3年は経ってると思うので
それくらいの構造のCNNでimagenetのような分類タスクしようと思った時にモデル選定とかどうチューニングしたらいいとかある程度まとめてくれてるような書物があったらいいなと思いました。
0859デフォルトの名無しさん (ワッチョイ 53c3-+WKx)
垢版 |
2018/10/21(日) 14:04:50.88ID:MsXt9/J70
>>858
あるのでは
0860デフォルトの名無しさん (ワッチョイ 53c3-+WKx)
垢版 |
2018/10/21(日) 14:07:48.83ID:MsXt9/J70
最近の書籍だと直感ディープラーニングとか
0866デフォルトの名無しさん (オッペケ Srb3-6bZA)
垢版 |
2018/10/22(月) 14:37:01.74ID:zvg+yeJrr
CEATECでPFNが出してた片付けロボットすごいよな
0868デフォルトの名無しさん (ササクッテロ Spb3-Mv/o)
垢版 |
2018/10/22(月) 19:35:15.84ID:M3H01wI/p
>>866
物体検出、物体判別、位置特定は他の所でも出来るんじゃね?
その正確さとかが実用になるかどうかだろうけど
0869デフォルトの名無しさん (アウアウエー Sae2-6bZA)
垢版 |
2018/10/22(月) 19:59:52.03ID:8nbAtIu2a
>>868
それらを現実世界のロボットの動作に結びつけるのは難しい
あと口頭で指示も出せるらしい
0870デフォルトの名無しさん (アウアウウー Sa9f-BwMv)
垢版 |
2018/10/22(月) 22:45:23.68ID:IVZcl8cFa
PFNロボのアピールポイント:
・衣類の画像認識ができる(衣類、布は置き方によって形状が大きく変わるため難度が高かった)
・対象によって掴む位置、掴み方を変える(けん玉は棒の部分を掴むなど)
・日本語の命令に従い行動できる
・ラフな言い方、ジェスチャーを認識できる(指差しながら「あそこに片付けて」で認識できる)
・展示会の騒音、変化する照明環境で1日連続稼働できる
0871デフォルトの名無しさん (ササクッテロ Spb3-SqDF)
垢版 |
2018/10/23(火) 09:47:19.57ID:ruDoWt35p
どこもかしこも画像データを扱う事を前提として文章書いてるから嫌になってくる
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況