X



【統計分析】機械学習・データマイニング20

レス数が900を超えています。1000を超えると表示できなくなるよ。
0001デフォルトの名無しさん (アウアウエー Sa5f-Mv1r)
垢版 |
2018/08/07(火) 18:56:37.59ID:sGPH9ejna
機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング19
http://mevius.2ch.net/test/read.cgi/tech/1520586585/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
0825デフォルトの名無しさん (ワッチョイ 2a23-ZrT7)
垢版 |
2018/10/19(金) 21:18:55.91ID:TlirwEgq0
>>818
そういうこと(猫画像とそれ以外画像とに分ける)で学習してる例が多いと思うけどね。ただ指摘があるように正例と負例の数は揃えないと。
あなたが実際にその分類器を使う段階になって、猫以外の画像としてどういうものが入力されるのか? それに近い分布のものを負例としなきゃ

「仕事ではじめる機械学習」あたり読んでみては(自分は読んでないけどw)
0831デフォルトの名無しさん (アウアウウー Sa9f-S/Dd)
垢版 |
2018/10/20(土) 00:58:23.13ID:2DsZDK0Sa
正例と負例の訓練データ数が全く桁違いの場合って割と多いと思うんだけど
例えば機械の故障判定とか製品の不良判定とか、正常データが大量にあって異常データは僅かになるのが典型的
その場合全て正常と判定するモデルの正解率は高くなるが、混同行列見たりF1値を評価指標にすればそんなのは非常に悪い学習結果と判断できるから排除できる
0834デフォルトの名無しさん (アウアウイー Saf3-AyP3)
垢版 |
2018/10/20(土) 16:36:17.04ID:d68y9Vxsa
>>830
理解出来ない訳では無いですけど無駄手間じゃないですか?
ただツールとして使いたいだけで理論を開発しようって訳ではないので(そもそも数式には興味ない)、
数式見るのは研究者がやればいいと思うのですが。
ガウシアンぼかしの式すら知らない素人でもリファレンス見て試行錯誤で華麗にフォトショップ使いこなしますよね?
あんな感じに早くなればいいと思うこの頃です
0837デフォルトの名無しさん (ワッチョイ 1adc-+WKx)
垢版 |
2018/10/20(土) 16:58:22.99ID:yNArAPz00
特定のものを認識させて物理空間上の位置(座標)を出力値とする場合って
SSDやYoloのような物体認識を使った方が早いかな?

>>883
882が何のライブラリを使ってるか知らんけど、tensorflowのMac版はCPUしか対応してない
0838デフォルトの名無しさん (アウアウウー Sa9f-yEbU)
垢版 |
2018/10/20(土) 17:04:33.60ID:V8iNamHla
最先端の研究結果の数式が必ずしも理解できる必要はないが
機械学習の基礎になる線形回帰、ロジスティック回帰、ニューラルネットワークの全結合層の原理程度は分かっていなければ厳しい
これが理解できていなければ自分の手持ちデータで何かやろうにもどんな手法を使うべきか見当も付けられず、
名前を知ってるものを適当に使ってみて精度が良かった・悪かった、と錬金術的にやるしかなくなる
0839デフォルトの名無しさん (ワッチョイ f380-tM5n)
垢版 |
2018/10/20(土) 17:09:48.35ID:gp/trlhl0
機械学習ではな
自分よりお利口なもんはできない

まず自分がなんでバカで頭悪いかを考えたほうが有意義だからな

バカのくせになんで自分よりお利口なもんができると思うのか
そこが不思議でならない
0840デフォルトの名無しさん (ワッチョイ f380-tM5n)
垢版 |
2018/10/20(土) 17:17:07.08ID:gp/trlhl0
バカでなければ
どうやったら自分が効果的に学習できるか考えるからな

自分が効果的な学習ができないのに
計算機で効果的な学習とかまずムリ
0842デフォルトの名無しさん (アウアウエー Sae2-6bZA)
垢版 |
2018/10/20(土) 18:39:36.65ID:AUqXYm6Fa
>>834
フォトショップを知識がなくても使いこなせるのはアルゴリズムが成熟していて大半の処理は裏方で自動でこなしてくれてるから
機械学習では自動で問題毎に自動で最適な処理をできる技術がまだ確立されていないから、ツール的に軽く触っただけで良い結果を得るのは難しいよ
0843デフォルトの名無しさん (ワッチョイ f380-tM5n)
垢版 |
2018/10/20(土) 18:49:17.27ID:gp/trlhl0
知識って。。。
画像処理ソフトとか画像データのピクセル加工やってるだけやんけ

で、見た目がそうなってる
とりあえず見た目こんな感でいいや

コレを機械学習と同じと思ってる時点でもうね
0844デフォルトの名無しさん (アウアウイー Saf3-AyP3)
垢版 |
2018/10/20(土) 20:39:27.85ID:k0LrzqP2a
>>836
本質を理解しようとはあまり思っていませんね。
とりあえずツールとしてラクチンに使えたらそれだけでよいので・・
>>837
そうだったんですね、自分winでブートしてるのでそれは知りませんでした。
>>838
そうなんですよ、そこなのです。
だから手持ちデータとやりたいこと等から使うべき手法やモデルを教えてくれる本とかがあればいいんですけどねえ
0845デフォルトの名無しさん (アウアウイー Saf3-AyP3)
垢版 |
2018/10/20(土) 20:44:45.92ID:k0LrzqP2a
>>842
そうですよね。
だから最適な処理を見つけるためのバイブル的なものがあればなあと思っています。

>>843
本質的にはあまり変わらないと思うのですが。
上の人が言っている通り自動化する技術が確立されていないだけで、
学習自体はデータに対して同じ処理を繰り返してるだけですし、
フォトショップでいう見た目=テストaccなりlos、という感じで使えても悪くないと思いますし
最近でいうならそれこそGANなんて見た目だけの話なのでとりあえずこんな見た目でいいや、で解決すると思います。
0847デフォルトの名無しさん (ワッチョイ 6ad2-CW5R)
垢版 |
2018/10/21(日) 03:09:43.34ID:yA/rLZti0
まあ発展途上よな
実用も含めて
0848デフォルトの名無しさん (ワッチョイ 53c3-+WKx)
垢版 |
2018/10/21(日) 05:50:34.84ID:MsXt9/J70
>>845
>だから最適な処理を見つけるためのバイブル的なものがあればなあと思っています。
これは最先端の研究なので論文を読んでパラメータの設定はどうするとか学ぶ必要がある.
いくら機械学習の出版が早いとはいえ待ってたら2,3年は遅れた知識になる.

後結局手法はAutoMLとかで大体今でも自動化できてるんだけど,データから推定した結果の解釈とかの問題もあるし,
全部が全部バイブル通り行くとは行かないのが現実.「全てのモデルは間違ってる.完全なる解釈はない」というのが統計学の鉄則だよ
0849デフォルトの名無しさん (ワッチョイ 53c3-+WKx)
垢版 |
2018/10/21(日) 05:53:12.18ID:MsXt9/J70
赤池先生の経歴をと尊敬を持って機械学をやるべきだと僕は思ってる.

汎化誤差の最小化だけじゃあまりにもつまらないし.最近のAmazonの差別AIみたいなのができるのが落ち.
未来はどうなるか分からないけど数式から逃げることはできないと覚悟した方が良いと思う.
0857デフォルトの名無しさん (ワイーワ2 FFa2-T/6m)
垢版 |
2018/10/21(日) 11:29:45.72ID:sjXodBVwF
>全部が全部バイブル通り行くとは行かないのが現実.「全てのモデルは間違ってる.完全なる解釈はない」

ほんそれ
0858デフォルトの名無しさん (アウアウイー Saf3-AyP3)
垢版 |
2018/10/21(日) 13:35:30.75ID:Ya81v9Q1a
>>848
最先端のネットワークはモチロンそうでいいと思うのですが、
DropoutやらReLUとか組み込んだCNNならもう流行りだして2,3年は経ってると思うので
それくらいの構造のCNNでimagenetのような分類タスクしようと思った時にモデル選定とかどうチューニングしたらいいとかある程度まとめてくれてるような書物があったらいいなと思いました。
0859デフォルトの名無しさん (ワッチョイ 53c3-+WKx)
垢版 |
2018/10/21(日) 14:04:50.88ID:MsXt9/J70
>>858
あるのでは
0860デフォルトの名無しさん (ワッチョイ 53c3-+WKx)
垢版 |
2018/10/21(日) 14:07:48.83ID:MsXt9/J70
最近の書籍だと直感ディープラーニングとか
0866デフォルトの名無しさん (オッペケ Srb3-6bZA)
垢版 |
2018/10/22(月) 14:37:01.74ID:zvg+yeJrr
CEATECでPFNが出してた片付けロボットすごいよな
0868デフォルトの名無しさん (ササクッテロ Spb3-Mv/o)
垢版 |
2018/10/22(月) 19:35:15.84ID:M3H01wI/p
>>866
物体検出、物体判別、位置特定は他の所でも出来るんじゃね?
その正確さとかが実用になるかどうかだろうけど
0869デフォルトの名無しさん (アウアウエー Sae2-6bZA)
垢版 |
2018/10/22(月) 19:59:52.03ID:8nbAtIu2a
>>868
それらを現実世界のロボットの動作に結びつけるのは難しい
あと口頭で指示も出せるらしい
0870デフォルトの名無しさん (アウアウウー Sa9f-BwMv)
垢版 |
2018/10/22(月) 22:45:23.68ID:IVZcl8cFa
PFNロボのアピールポイント:
・衣類の画像認識ができる(衣類、布は置き方によって形状が大きく変わるため難度が高かった)
・対象によって掴む位置、掴み方を変える(けん玉は棒の部分を掴むなど)
・日本語の命令に従い行動できる
・ラフな言い方、ジェスチャーを認識できる(指差しながら「あそこに片付けて」で認識できる)
・展示会の騒音、変化する照明環境で1日連続稼働できる
0871デフォルトの名無しさん (ササクッテロ Spb3-SqDF)
垢版 |
2018/10/23(火) 09:47:19.57ID:ruDoWt35p
どこもかしこも画像データを扱う事を前提として文章書いてるから嫌になってくる
0874デフォルトの名無しさん (ワッチョイ f323-UnLy)
垢版 |
2018/10/23(火) 10:59:29.01ID:2b6Tbph30
メリットが分かりやすい分野で教科書書いたら、参入者が増えるから先行者は嫌がるもの
0878デフォルトの名無しさん (ブーイモ MMd6-9TKK)
垢版 |
2018/10/23(火) 14:47:39.15ID:cio3imcuM
>>876
人の作った定石を覆す一手が生まれる可能性がある
0879デフォルトの名無しさん (オッペケ Srb3-6bZA)
垢版 |
2018/10/23(火) 14:51:30.72ID:gBK/KF1nr
>>876
人にしか出来ないと思われていた高度な処理が可能になった
0880デフォルトの名無しさん (ワッチョイ 7b23-T/6m)
垢版 |
2018/10/23(火) 14:53:00.00ID:yFsvvFWj0
ゲームで定石以外の手を打つAIはいるけど
脳外科手術とかで定石以外の手をAIに指示されて
実際その通りに手術出来る医者っているのかな
0882デフォルトの名無しさん (アウアウイー Saf3-AyP3)
垢版 |
2018/10/23(火) 19:11:15.08ID:BDP8ufz9a
全く同じ条件の学習が上手くいかなくなったんだけど原因は何が考えられますか
1回目やったときは70epochでvalのaccが.95くらいだったのに
2回目やったら1epochからずっとvalのaccが.65前後のままtrainのaccだけが上がり続けるから過学習してると思うんですけど
実行毎に過学習起きたり起きなかったりとかあり得ますか?
0883デフォルトの名無しさん (ワッチョイ f323-UnLy)
垢版 |
2018/10/23(火) 21:06:52.05ID:2b6Tbph30
重みの初期化はどうしてるの?
0886デフォルトの名無しさん (ササクッテロラ Spb3-V5Rj)
垢版 |
2018/10/23(火) 23:35:10.13ID:7LErHcLzp
データ分析の基礎的な部分をちゃんと身につけないとと思って統計の勉強始めた
学のある人なら当たり前に知ってる事なんだろうけど自分には知らない事ばかりで結構面白いって感じた
多分最初だからこう思うだけかもしれないけど
0887デフォルトの名無しさん (アウアウエー Sae2-6bZA)
垢版 |
2018/10/23(火) 23:44:40.12ID:EZC/vVVWa
>>884
特にディープラーニング関連は本になる頃には陳腐化してるからなぁ
ある程度基礎を勉強したらネットで解説記事とかトップカンファレンスの速報まとめとか有名な論文(の解説)とかを読むと良いかも
0890デフォルトの名無しさん (ワイーワ2 FFa2-T/6m)
垢版 |
2018/10/24(水) 14:10:20.50ID:wUNs4a59F
統計は高校で習ったから高卒「でも」充分理解できるもんだと思ってたが
最近の高卒は統計習ってないのもいるんだね
0891デフォルトの名無しさん (オッペケ Srb3-6bZA)
垢版 |
2018/10/24(水) 14:28:42.96ID:+JXZmafPr
>>890
統計っても機械学習だとロジスティック回帰とか主成分分析とかカーネル法あたりだろう
高校じゃまずやらない
0898デフォルトの名無しさん (ブーイモ MMf3-dYvX)
垢版 |
2018/10/25(木) 15:07:49.79ID:qGEaBy7DM
>>895
画像診断。下手な医者より優秀だろう
0900デフォルトの名無しさん (ワッチョイ 69a5-lMT5)
垢版 |
2018/10/26(金) 00:03:05.76ID:HAARiEj70
クラスタリングって教師ラベルがあるデータに対しても行うことってあるの?
職場の人が教師ラベルあるデータに対してクラスタリングするって言ってたんだけどそれは分類とは違うのかな?と思って聞いてたんだけど自分は知識がないから知らないだけで主成分分析みたいに探索的に何か見つけるために使う事も出来るのかな?
0901デフォルトの名無しさん (ワッチョイ 1d80-SUE8)
垢版 |
2018/10/26(金) 00:03:51.15ID:7cGNdWT70
アホたちは
いまのいんちきNNモデルをAIと呼称してんのか
0903デフォルトの名無しさん (ワッチョイ 9fc3-l/Wc)
垢版 |
2018/10/26(金) 05:58:52.27ID:xXrtI3FC0
ラベルが既知なのにクラスタリングっていうのは、聞いたことないしやる意味もないのでは。だってデータの距離空間が定義されてるのにわざわざ別の部分集合に割り当てる意味が分からんな。
次元削減なら分かるけど、クラスタリングなんでしょ?
0907デフォルトの名無しさん (アウアウエー Sa93-resC)
垢版 |
2018/10/26(金) 10:38:04.98ID:XMhrCttAa
>>906
学習の時は計算量かかるけど使うときは大した事ない
理論保証とブラックボックスさだと思う
0909デフォルトの名無しさん (ブーイモ MMa1-l/Wc)
垢版 |
2018/10/26(金) 15:26:11.38ID:6HAQawqDM
>>900
上の人が言うように、基本的にその場合クラスタリングとは呼ばない。クラスタリングは教師なしだから。

それで質問に答えるとしたらあるデータX(Xはベクトル)にラベルがあるとして、X以外のデータが入力されたときに例えばaとする。そのaとXとのユークリッド距離を測り(k近傍法)、どのx_iと近いのかを判定したりはする。
0914デフォルトの名無しさん (ワッチョイ 7d23-qsqE)
垢版 |
2018/10/27(土) 18:17:25.38ID:Rhmyt2K70
こういうのに最初に大金を出した人が美術史を作っていくのや
0920デフォルトの名無しさん (アウアウエー Sa93-resC)
垢版 |
2018/10/28(日) 11:39:15.80ID:EoM4jV8ha
>>913
わかる
0921デフォルトの名無しさん (アウアウエー Sa93-resC)
垢版 |
2018/10/28(日) 11:41:19.59ID:EoM4jV8ha
>>910
そのページ内で結論出てるやん
レス数が900を超えています。1000を超えると表示できなくなるよ。

ニューススポーツなんでも実況