【統計分析】機械学習・データマイニング20

■ このスレッドは過去ログ倉庫に格納されています
2018/08/07(火) 18:56:37.59ID:sGPH9ejna
機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング19
http://mevius.2ch.net/test/read.cgi/tech/1520586585/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
2018/09/06(木) 13:47:17.51ID:aZ3qvCMza
>>278
kaggle
280デフォルトの名無しさん (ワッチョイ e36e-HcYj)
垢版 |
2018/09/06(木) 16:12:49.44ID:eIqRmgxb0
kaggleの一番の問題点は、計算資源は自前調達なこと
2018/09/06(木) 16:49:43.44ID:hpVTS5J7M
普通のPCでカグりたい。svmもこれから勉強(汗
2018/09/06(木) 17:46:24.65ID:n8sIsSj/a
個人で10万円台のPCでkaggleコンペの賞金圏内って狙えるものなの?
2018/09/06(木) 18:22:05.64ID:hpVTS5J7M
仮想通貨の採掘みたいになってくるんか。
2018/09/06(木) 18:33:14.28ID:oTJZiE1f6
初めまして失礼します
最近tensorflowにて機械学習を始めました。参考にしている下記サイトのソースコードを読んでいるのですが
http://docs.fabo.io/tensorflow/model_sequence/rnn_basic.html

このサンプルコード中のどの変数に最終的なテストデータの実行結果が格納されているのでしょうか?
親切に [0,1,2,0,・・・,0,1]のように格納されているのか、はたまた評価関数がsoftmaxなのでargmaxを使って取得するのか・・・分かる方ご教授いただけるとありがたいです。
2018/09/06(木) 19:06:23.57ID:ft00C17ua
>>284
loss_test_ と acc_test_
2018/09/06(木) 19:34:02.13ID:WZQ2BMHpM
>>281
コホーネンこそ至高(嘘)
2018/09/06(木) 19:52:27.22ID:oTJZiE1f6
>>284 追記です
ソースコード中のtf.argmax(pred,1)に実行結果が格納されているのは分かったのですが、
これをどう取得すればいいのかがわかりません
print(pred)やprint(tf.argmax(pred,1))等をsess.close()(ソースコード内の最後の行)の前後に入れてみたりしましたが
Tensor("ArgMax_2:0", shape=(?,), dtype=int64)このような出力がされるだけでした
288デフォルトの名無しさん (ガックシ 0656-QXdG)
垢版 |
2018/09/06(木) 19:53:40.60ID:oTJZiE1f6
>>285
書き込んでいるうちに返答が・・・argmaxの方じゃないのか・・・試してみます
289デフォルトの名無しさん (ガックシ 0656-QXdG)
垢版 |
2018/09/06(木) 19:59:15.30ID:oTJZiE1f6
acc_test_は精度の%表示の方がでてきました。
取得したいのはモデル学習後にテストデータを通した際の出力結果で
文章が足りなかったみたいです、すみません
お分かりになればご教授ください
2018/09/06(木) 20:04:09.83ID:N8vSkMund
>>289
多分 tf の理解不足、テストデータを与えた出力は >>285 さんので合ってる
2018/09/06(木) 21:06:50.37ID:gGQNDXVXd
>>290
外出中につきID変わりまして失礼します
acc_test_をそのままprintするのではなく何かを追記すると出力層の結果もでるのでしょうか?
2018/09/06(木) 21:30:30.68ID:dF1C4l95d
eval()使わないとテンソルの内部は見られないねえ
print(pred.eval())
みたいに書くといいよ
2018/09/06(木) 21:30:42.99ID:8Gs/SO310
>>280
Google Colaboratoryだかって使えないの?
2018/09/06(木) 21:56:39.64ID:gGQNDXVXd
>>292
ありがとうございます
帰宅したら試してみます
2018/09/06(木) 23:13:24.87ID:42ButyNI0
教師なし学習の部分勉強し始めたけどこれまた難しい
主成分分析とかめっちゃややこしい…
詰まりすぎて参考書進まない
2018/09/07(金) 02:43:59.86ID:i5TKiFX30
mfccを特徴量にして深層学習をしようと思ったけどあまり学習しない・・・
たぶんmfccをそのまま使うと値の差が大きすぎるからだろうけどこういう場合の正規化って何が一般的なんだろう?
2018/09/07(金) 03:39:19.22ID:4D0gsWdJ0
音声処理は専門外だけど、
信号処理の一般論として多重に関数通すほど精度低下するからよくないぞ
2018/09/07(金) 22:28:06.25ID:xcgQ57X/a
Courseraのカーネル法の説明、あれで分かる奴おるんか?
299デフォルトの名無しさん (ワッチョイ 0b4b-ydPo)
垢版 |
2018/09/07(金) 23:54:38.38ID:AkwTHGBK0
コーセラ化粧品歌謡ベストテン
2018/09/08(土) 12:29:52.26ID:zjq/iq32d
カーネル法はカーネル法の項目で分けるべきだと思うんだけどな
応用先はサポートベクトルマシンだけでない。
主成分分析、巡回セールスマン問題など多種多様
2018/09/08(土) 13:55:28.59ID:dJjhtWR30
カーネル三打数
2018/09/08(土) 15:15:07.20ID:phMov0/0M
何週間かしたら追いつくからちょっと待っててね♡
2018/09/08(土) 22:11:42.69ID:Mc6Ny40VM
そんなあなたにRANSAC
2018/09/09(日) 08:25:27.74ID:Uy32x6ZT0
最初Octave覚えるのうぜえ、とか思ってたけど、
Octaveに慣れると、numpyの行列表現が面倒くさくてたまらなくなるね
2018/09/09(日) 09:02:42.81ID:eiptmUtyM
ex2のcost関数はiでforループ回してsumしてくしかないのかなあ。octaveなら全データまとめてベクトル演算出来ないかと期待してたんだけど
306デフォルトの名無しさん (ワッチョイ 0b4b-ydPo)
垢版 |
2018/09/09(日) 10:04:24.64ID:13i/0Tbj0
numrubyとかまだですか?
2018/09/09(日) 11:24:58.51ID:Uy32x6ZT0
>>305
forループなしで行けるよ
308デフォルトの名無しさん (スプッッ Sd7a-iA6g)
垢版 |
2018/09/09(日) 11:37:36.75ID:vA+7RJ4hd
AIってなんで言語の意味が理解出来ないの?
309デフォルトの名無しさん (ワイーワ2 FFb2-x/oF)
垢版 |
2018/09/09(日) 11:40:09.66ID:kzlGF2pOF
言語に意味が無いからかも知れないね
2018/09/09(日) 11:40:19.63ID:l6rR/pccM
>>308
プログラミング言語理解してるじゃん
2018/09/09(日) 13:02:46.43ID:qrt/xXSoM
>>307
どうしてもJの値が期待値の3倍になっちゃうので完全ベクトル化は諦めたよ
2018/09/09(日) 15:07:04.37ID:mmYNGw0Ja
courseraの2週目まで来てやっとプログラミング課題始めたけどこれ英語ダメダメな人には結構無駄に時間かかりそうだな
自分はある程度読めるからいいけど英語アレルギーの人には15ページの英文テキストとかハードル高すぎだろう
2018/09/09(日) 15:30:17.72ID:l6rR/pccM
突然の英語自慢
2018/09/09(日) 17:05:22.17ID:GZ1hf7rYa
あの程度の英文が読めるというだけのことが自慢と感じてしまう人って・・・
315デフォルトの名無しさん (ワッチョイ 8723-x/oF)
垢版 |
2018/09/09(日) 17:10:44.73ID:5zyWb3dg0
チラシは日記の裏に
2018/09/09(日) 17:11:54.64ID:l6rR/pccM
いや、大学で論文書いてるし講座受けたことないから知らん
2018/09/09(日) 17:20:40.89ID:UfwTkuaF0
会話が成立していない・・・
318デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/09(日) 17:44:28.00ID:V1LakR3i0
まず自身が学習する知能すらないヤツラが
機械学習とかいってるのがな
2018/09/09(日) 17:53:25.90ID:0fxeknbWa
機械を使って能力を補完するのは
誰にでもありそうな要求じゃないのか
320デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/09(日) 17:55:20.90ID:V1LakR3i0
機械学習という強化学習は体罰と同じだからな
つまり体罰は科学的に正しい
321デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/09(日) 17:58:41.37ID:V1LakR3i0
マウスはサッカリンが大好き

エサ箱にサッカリンおくと
マウスはひたすらサッカリンをなめる

そんなマウスに
サッカリンなめると高圧電流を与える
それを繰り返す

するとな
マウスはサッカリンなめなくなる

しばっきんぐを伴う学習は
ものすごく適切な科学的教育メソッドといえる
2018/09/09(日) 18:04:27.61ID:xD81Fsxha
それは単純作業をひたすら行うだけのための教育には最適だろうが自分で考える高度な仕事をできるようになるための教育としては全く機能しない
餌食べると電流来るから餌食べない、ではなく電流を止めるかそんな実験してる者を殴りに行くことが本当は求められる
2018/09/09(日) 18:05:59.59ID:XkNFsZ520
>>320
本当に教育目的ならね
でも実際は自分の言うことを聞かないなどの感情任せで叩いたり
現実の教師には幼稚な人間が多いから体罰を許可するのは難しい
AIによる教育が普及したら体罰の導入もあるかもねw
324デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/09(日) 18:19:48.08ID:V1LakR3i0
人間も刺激を受けて
微弱な電流の電気信号を脳に伝えて(コレが入力)
NNにちかいものを脳みそで構成しながら(コレが処理)
反応してるだけなのは(コレが出力)
ほぼ間違いないからな

キミラはその中でもかなりできそこないの肉塊なワケ
キミラはまずその自覚がないといけない
325デフォルトの名無しさん (ワッチョイ ae67-bLrU)
垢版 |
2018/09/10(月) 09:12:54.23ID:Wzurv1WZ0
何かに例える奴って本質の部分をずらして解釈させようとするから好きじゃない。
2018/09/10(月) 09:33:18.80ID:m4rWRRun0
DLは沈みかけた船である
2018/09/10(月) 09:40:32.89ID:50R16uEf0
>>326
今勉強中なのに〜
2018/09/10(月) 10:12:27.17ID:eJoeF+lzd
>>325
同意ですね。
特にこの分野はそうゆう説明をする人が多すぎる気がします。
2018/09/10(月) 11:29:39.10ID:E/R/CTAA0
ていうかわかってないんだよ
ワイアードの機械学習関係の記事もめちゃくちゃだし。記者も理解してない。
2018/09/10(月) 11:45:38.06ID:iZZh4uSH0
ただの多項式近似じゃだめなんですか
331デフォルトの名無しさん (JP 0Haf-A9RE)
垢版 |
2018/09/10(月) 12:57:17.68ID:9PCR6mO1H
いい場合もある
332デフォルトの名無しさん (ササクッテロル Spab-r7Fj)
垢版 |
2018/09/10(月) 14:59:32.62ID:/bmRPvCfp
>>324
化学物質とか細胞とかも関係している
どの程度の影響かは知らないけど
333デフォルトの名無しさん (ワッチョイ 16e7-8LvS)
垢版 |
2018/09/10(月) 16:07:18.13ID:vhv/YhfM0
海外IT大手勤めかPFNか東大松尾研関連の人のTwitterやスライドは参考になる
あとarxivで論文読んでレビューしてる人達(一次)も参考になる
それに海外にさきがけて論文内容を実装してる人とそのgithub
QiitaでCNN,RNN,LSTM,GANなどのモデルの基礎を詳細に解説してる記事は初心者〜中級者には参考になる

でも日本の情報は大体ここまでだね
日本で画期的なモデル作り出してsota達成してる人なんていないし
業務応用の事例は基本的に社外秘だから表に出てこない
2018/09/10(月) 19:24:21.95ID:ujR9/fQ2d
>>333
そもそも日本人が書いたもんとか読むだけ時間の無駄。元ネタ読むほうがわかりやすい
2018/09/10(月) 19:28:41.58ID:C7NXl1Sfd
海外論文のほとんどは、既存の方法のマイナーチェンジですね。

論文の数で劣っても焦るべきはそこではない
2018/09/10(月) 19:42:40.10ID:7yBcyw9Aa
マイナーチェンジでない新手法の開発数で比較した上でそれを言うならいいけどどうせそんなの調べてないんだろ
2018/09/10(月) 19:52:04.55ID:6ZeiSgzaa
日本なんか遅れまくってるんだから
先進国のペーパー読んだほうがそりゃマシだろw
2018/09/10(月) 20:20:02.48ID:EC/DTJGVM
まつおけんてそんなにいい?
御用達なだけじゃん
339デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/10(月) 20:46:12.02ID:XzQQxj6r0
低学歴知恵遅れは
NNモデルは半世紀以上前からあるモデルの焼き直しなのすらわかってないからな

低学歴知恵遅れに限って基礎も分からずにムダにいきってるワケ
340デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/10(月) 20:48:45.69ID:XzQQxj6r0
NNモデルなんかウンコみたいなエキスパートシステムがはやってた頃からすでに存在する
コレもきっとな同じ道を歩むことになる
予言するわ
2018/09/10(月) 20:57:12.65ID:MuwSsVH00
予言(笑)
342デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/10(月) 21:02:22.48ID:XzQQxj6r0
エキスパートシステムみたいな山盛りのウンコができると
予言してるワケ
2018/09/10(月) 21:08:06.77ID:PkSNOikBM
20年前エキスパートシステムやってた大学の先生がAIメチャメチャdisってたな。講義で学生相手に悲観的なことばっか言ってな。今どうしてんだろ。ヒャッハー?
2018/09/10(月) 21:18:31.46ID:MuwSsVH00
物体認識も人工知能(NNでない奴)だったね
2018/09/10(月) 21:54:13.12ID:KNaZjqz80
>>336
比較した上で一点だそ
2018/09/10(月) 21:59:29.51ID:KNaZjqz80
まあ、一人でよいから飛び抜けた天才がいればよい話
2018/09/11(火) 00:27:02.76ID:NOGFJ9cK0
なんだ俺のことか…
2018/09/11(火) 01:13:57.47ID:CF7cPemC0
中級者向けの記事なんて書いても利益にならんからな
初心者向けなら宣伝になって仕事の依頼がくることも期待できるが
349デフォルトの名無しさん (ワッチョイ ae67-bLrU)
垢版 |
2018/09/11(火) 08:52:46.82ID:iNoPJA0t0
もう少しきれいな言葉で語りませんか?
2018/09/11(火) 10:11:02.09ID:fg41yUTF0
確かにお前ら中華スマホスレ以下
2018/09/11(火) 12:14:16.02ID:4gQtUupo0
割れ鍋に綴じ蓋
2018/09/11(火) 12:30:05.64ID:6r2pdA4Ca
技術記事自体で利益出そうと考えること自体が技術者としての本来の在り方から乖離してるけどね
2018/09/11(火) 12:34:15.31ID:7J4Wi8hoM
技術がカネにならない日本はおかしい。シリコンバレーの後追いしかしてないフリーライダー。
2018/09/11(火) 13:25:38.94ID:QkogAA+k0
技術がないだけの話
355デフォルトの名無しさん (アウウィフ FF77-x/oF)
垢版 |
2018/09/11(火) 14:33:28.09ID:pwo3DQbpF
この本おすすめですか?
https://www.amazon.co.jp/dp/4862464181
2018/09/11(火) 15:52:06.10ID:RLpo6MncM
いいえ
357デフォルトの名無しさん (ワッチョイ 13b3-rySY)
垢版 |
2018/09/11(火) 18:00:10.08ID:yZhXOY2F0
クラス分類できへんねやったら回帰分析しかないんですか?
358デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/11(火) 23:32:24.35ID:i7axZbyN0
1層のNNは回帰分析と同じだからな
2018/09/12(水) 07:04:31.28ID:YcGHenXr0
人間の脳のように学習するって誇大広告じゃね?

中身はロジスティック回帰を何層もやってるだけじゃん
360デフォルトの名無しさん (ササクッテロレ Spab-r7Fj)
垢版 |
2018/09/12(水) 08:09:25.15ID:ViqDYntmp
>>359
そう思うなら一つのロジスティック回帰を再帰的に使って同じ結果を出せるか実験してみたらいいのでは?
2018/09/12(水) 08:13:40.79ID:whXEmiXCM
一つのロジスティック回帰では無理だろ
>>359 はそんな事言ってないし
2018/09/12(水) 12:09:21.11ID:O9T0GfKp0
人間の脳も所詮ロジスチック回帰ってこと。。。
2018/09/12(水) 16:05:15.80ID:qQh33xQPM
クラス外のデータの排除に効率的な方法は何ですか?
例えば、0〜9の数字10クラスのネットワークに「b」の文字を入力する場合を考えた時に
理想的には全クラス10%くらいの確率ラベルを持ってくれたらいいのですが
恐らく結果は6が高確率で帰ってくる気がします。
適当に数字以外の文字を詰め込んで11個目のunknownクラスを作ることは効果があるのですか?
2018/09/12(水) 19:36:37.61ID:YQnfCYrX0
>>363
こっちが専門じゃないだけかもしれないけど、おそろしく何を言ってるのか分からない
deep learningのような分類器で、画像データを10のクラスに仕分けたいけど、
特定のクラスに偏りが生まれるからどうすれば良いかということか

一般論として、deep learningならば、ノイズを混ぜるのは場合によりけりだけど有効だろ
新しいクラスを作るのは、ちょっとわからんなあ
365デフォルトの名無しさん (ワッチョイ ae8a-Y6TH)
垢版 |
2018/09/12(水) 19:40:44.82ID:YQnfCYrX0
データを多く仕分けられるクラスに、データが仕分けられにくくなるように
損失関数に、データ量に比例して増えるペナルティーを追加すればいいんじゃないか
366デフォルトの名無しさん (ワッチョイ ae8a-Y6TH)
垢版 |
2018/09/12(水) 19:47:03.20ID:YQnfCYrX0
一回限りの分析なら、手入力で特定のクラスの損失関数に
手入力でペナルティーを追加して、そのクラスに分類されにくくするのも手だと思うんですよ?
そんなやり方でも、いちおう分析結果は平らにはなるよね。たぶん。わからんけど
2018/09/12(水) 19:54:51.80ID:qQh33xQPM
>>364
(自分なりに)もう少し分かりやすく書き下しますと、

この世のありとあらゆる果物が成ってる木があるとして、
この木の画像の中から、リンゴとミカンとブドウを見つけて自動収穫したいタスクがあるとします。
リンゴとミカンとブドウの画像を学習させて分類器を作ったのですが、青リンゴやデコポンやマスカットが学習させた果物と誤認識されて収穫されてしまいます。
学習せた3つの果物以外は収穫したくないので、認識して欲しくないのですがどうすれば良いですか?ということです。
(分かりにくかったらすみません。)
2018/09/12(水) 20:00:27.22ID:VFbeL2mC0
わかりにくくなったよ
2018/09/12(水) 20:02:57.63ID:hCIGPJ5ma
>>363が言いたいのは数字画像を読み込んで数値を出力したい、ただし入力が数字でない画像だったら数字でないと出力させたいってことだろう
2018/09/12(水) 20:36:27.66ID:WakPudgX0
数字以外の画像を適当に[0.1..0.1]のベクトルになる教師データとして流し込めば
そういう分類器ができるんじゃないの
2018/09/12(水) 20:50:09.10ID:kc7HFSnfa
数字以外の想定し得るあらゆる文字のデータを学習させる必要があるから非現実的だろうね
数字にだけ共通する特徴があるなら最初に数字か数字でないかだけの分類をすればいいけどそんな特徴ないだろうし難しい
372デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/12(水) 21:07:10.31ID:yfKtIfo20
認知機能が低いこのスレいるような低学歴知恵遅れが写真をみると
コレは心霊写真だという

コレは俗に言うシミュラクラ現象になる

ウンコAIに顔認識をさせると
コレと同じような現象が発生してもなにもおかしくない

コレは出力結果としてものすごいおかしいとはいえない
特徴どおりだからな
373デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/12(水) 21:13:35.69ID:yfKtIfo20
文字だけの識別なら数量化I類で十分
数量化I類でもかなりの精度になる
2018/09/12(水) 23:04:27.74ID:agseH4x1F
ひとつの分類器でふたつのことを同時にやらなければいいんじゃね?

@一個の数字画像を、10個のクラスに仕分ける
Aその画像が本当に仕分けられた数字と同じか否かを判定する

このふたつの段階に分けれて、別々の分類器を用意すれば、そんなに難しいことしなくても簡単に組めそう。
@のためのニュートラルネットワークの分類値と、Aのためのクラスごとの分類器を10個用意する必要があるけど、
Aの分類器はたぶん同じようなアルゴリズムで動くから書くの簡単だろ

ただの思いつきだけど、どうだ?
375デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/12(水) 23:12:15.60ID:yfKtIfo20
ぜんぜんわかってないわ
特徴抽出をするのが先だからな

特徴抽出されたデータを学習させない限り
いつまでたっても学習効果なんかない
376デフォルトの名無しさん (アウアウエー Saf2-r7Fj)
垢版 |
2018/09/12(水) 23:42:58.48ID:MXOsLPIga
>>363
まず数字かそれ以外かを分類してみるとか
で数字のものについて0-9のどのクラスに属するか判別する
2018/09/13(木) 00:17:45.77ID:pqzPAQ7ua
数字かそれ以外かで分類しようとしたら結局bは6と判定されるだろうけどね
2018/09/13(木) 00:18:27.43ID:pqzPAQ7ua
正確には、6と扱われることでbは数字に分類されるだろうけどね
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況