X



【統計分析】機械学習・データマイニング20

■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん (アウアウエー Sa5f-Mv1r)
垢版 |
2018/08/07(火) 18:56:37.59ID:sGPH9ejna
機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング19
http://mevius.2ch.net/test/read.cgi/tech/1520586585/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
0299デフォルトの名無しさん (ワッチョイ 0b4b-ydPo)
垢版 |
2018/09/07(金) 23:54:38.38ID:AkwTHGBK0
コーセラ化粧品歌謡ベストテン
0300デフォルトの名無しさん (スプッッ Sdda-7Kzs)
垢版 |
2018/09/08(土) 12:29:52.26ID:zjq/iq32d
カーネル法はカーネル法の項目で分けるべきだと思うんだけどな
応用先はサポートベクトルマシンだけでない。
主成分分析、巡回セールスマン問題など多種多様
0306デフォルトの名無しさん (ワッチョイ 0b4b-ydPo)
垢版 |
2018/09/09(日) 10:04:24.64ID:13i/0Tbj0
numrubyとかまだですか?
0308デフォルトの名無しさん (スプッッ Sd7a-iA6g)
垢版 |
2018/09/09(日) 11:37:36.75ID:vA+7RJ4hd
AIってなんで言語の意味が理解出来ないの?
0309デフォルトの名無しさん (ワイーワ2 FFb2-x/oF)
垢版 |
2018/09/09(日) 11:40:09.66ID:kzlGF2pOF
言語に意味が無いからかも知れないね
0312デフォルトの名無しさん (アウアウウー Sa77-X0d4)
垢版 |
2018/09/09(日) 15:07:04.37ID:mmYNGw0Ja
courseraの2週目まで来てやっとプログラミング課題始めたけどこれ英語ダメダメな人には結構無駄に時間かかりそうだな
自分はある程度読めるからいいけど英語アレルギーの人には15ページの英文テキストとかハードル高すぎだろう
0315デフォルトの名無しさん (ワッチョイ 8723-x/oF)
垢版 |
2018/09/09(日) 17:10:44.73ID:5zyWb3dg0
チラシは日記の裏に
0318デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/09(日) 17:44:28.00ID:V1LakR3i0
まず自身が学習する知能すらないヤツラが
機械学習とかいってるのがな
0320デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/09(日) 17:55:20.90ID:V1LakR3i0
機械学習という強化学習は体罰と同じだからな
つまり体罰は科学的に正しい
0321デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/09(日) 17:58:41.37ID:V1LakR3i0
マウスはサッカリンが大好き

エサ箱にサッカリンおくと
マウスはひたすらサッカリンをなめる

そんなマウスに
サッカリンなめると高圧電流を与える
それを繰り返す

するとな
マウスはサッカリンなめなくなる

しばっきんぐを伴う学習は
ものすごく適切な科学的教育メソッドといえる
0322デフォルトの名無しさん (アウアウウー Sa77-fYFo)
垢版 |
2018/09/09(日) 18:04:27.61ID:xD81Fsxha
それは単純作業をひたすら行うだけのための教育には最適だろうが自分で考える高度な仕事をできるようになるための教育としては全く機能しない
餌食べると電流来るから餌食べない、ではなく電流を止めるかそんな実験してる者を殴りに行くことが本当は求められる
0323デフォルトの名無しさん (ワッチョイ aee8-ydPo)
垢版 |
2018/09/09(日) 18:05:59.59ID:XkNFsZ520
>>320
本当に教育目的ならね
でも実際は自分の言うことを聞かないなどの感情任せで叩いたり
現実の教師には幼稚な人間が多いから体罰を許可するのは難しい
AIによる教育が普及したら体罰の導入もあるかもねw
0324デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/09(日) 18:19:48.08ID:V1LakR3i0
人間も刺激を受けて
微弱な電流の電気信号を脳に伝えて(コレが入力)
NNにちかいものを脳みそで構成しながら(コレが処理)
反応してるだけなのは(コレが出力)
ほぼ間違いないからな

キミラはその中でもかなりできそこないの肉塊なワケ
キミラはまずその自覚がないといけない
0325デフォルトの名無しさん (ワッチョイ ae67-bLrU)
垢版 |
2018/09/10(月) 09:12:54.23ID:Wzurv1WZ0
何かに例える奴って本質の部分をずらして解釈させようとするから好きじゃない。
0331デフォルトの名無しさん (JP 0Haf-A9RE)
垢版 |
2018/09/10(月) 12:57:17.68ID:9PCR6mO1H
いい場合もある
0332デフォルトの名無しさん (ササクッテロル Spab-r7Fj)
垢版 |
2018/09/10(月) 14:59:32.62ID:/bmRPvCfp
>>324
化学物質とか細胞とかも関係している
どの程度の影響かは知らないけど
0333デフォルトの名無しさん (ワッチョイ 16e7-8LvS)
垢版 |
2018/09/10(月) 16:07:18.13ID:vhv/YhfM0
海外IT大手勤めかPFNか東大松尾研関連の人のTwitterやスライドは参考になる
あとarxivで論文読んでレビューしてる人達(一次)も参考になる
それに海外にさきがけて論文内容を実装してる人とそのgithub
QiitaでCNN,RNN,LSTM,GANなどのモデルの基礎を詳細に解説してる記事は初心者〜中級者には参考になる

でも日本の情報は大体ここまでだね
日本で画期的なモデル作り出してsota達成してる人なんていないし
業務応用の事例は基本的に社外秘だから表に出てこない
0339デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/10(月) 20:46:12.02ID:XzQQxj6r0
低学歴知恵遅れは
NNモデルは半世紀以上前からあるモデルの焼き直しなのすらわかってないからな

低学歴知恵遅れに限って基礎も分からずにムダにいきってるワケ
0340デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/10(月) 20:48:45.69ID:XzQQxj6r0
NNモデルなんかウンコみたいなエキスパートシステムがはやってた頃からすでに存在する
コレもきっとな同じ道を歩むことになる
予言するわ
0342デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/10(月) 21:02:22.48ID:XzQQxj6r0
エキスパートシステムみたいな山盛りのウンコができると
予言してるワケ
0343デフォルトの名無しさん (ブーイモ MM97-QmBv)
垢版 |
2018/09/10(月) 21:08:06.77ID:PkSNOikBM
20年前エキスパートシステムやってた大学の先生がAIメチャメチャdisってたな。講義で学生相手に悲観的なことばっか言ってな。今どうしてんだろ。ヒャッハー?
0349デフォルトの名無しさん (ワッチョイ ae67-bLrU)
垢版 |
2018/09/11(火) 08:52:46.82ID:iNoPJA0t0
もう少しきれいな言葉で語りませんか?
0357デフォルトの名無しさん (ワッチョイ 13b3-rySY)
垢版 |
2018/09/11(火) 18:00:10.08ID:yZhXOY2F0
クラス分類できへんねやったら回帰分析しかないんですか?
0358デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/11(火) 23:32:24.35ID:i7axZbyN0
1層のNNは回帰分析と同じだからな
0360デフォルトの名無しさん (ササクッテロレ Spab-r7Fj)
垢版 |
2018/09/12(水) 08:09:25.15ID:ViqDYntmp
>>359
そう思うなら一つのロジスティック回帰を再帰的に使って同じ結果を出せるか実験してみたらいいのでは?
0363デフォルトの名無しさん (アウーイモ MM77-rIyb)
垢版 |
2018/09/12(水) 16:05:15.80ID:qQh33xQPM
クラス外のデータの排除に効率的な方法は何ですか?
例えば、0〜9の数字10クラスのネットワークに「b」の文字を入力する場合を考えた時に
理想的には全クラス10%くらいの確率ラベルを持ってくれたらいいのですが
恐らく結果は6が高確率で帰ってくる気がします。
適当に数字以外の文字を詰め込んで11個目のunknownクラスを作ることは効果があるのですか?
0364デフォルトの名無しさん (ワッチョイ ae8a-Y6TH)
垢版 |
2018/09/12(水) 19:36:37.61ID:YQnfCYrX0
>>363
こっちが専門じゃないだけかもしれないけど、おそろしく何を言ってるのか分からない
deep learningのような分類器で、画像データを10のクラスに仕分けたいけど、
特定のクラスに偏りが生まれるからどうすれば良いかということか

一般論として、deep learningならば、ノイズを混ぜるのは場合によりけりだけど有効だろ
新しいクラスを作るのは、ちょっとわからんなあ
0365デフォルトの名無しさん (ワッチョイ ae8a-Y6TH)
垢版 |
2018/09/12(水) 19:40:44.82ID:YQnfCYrX0
データを多く仕分けられるクラスに、データが仕分けられにくくなるように
損失関数に、データ量に比例して増えるペナルティーを追加すればいいんじゃないか
0366デフォルトの名無しさん (ワッチョイ ae8a-Y6TH)
垢版 |
2018/09/12(水) 19:47:03.20ID:YQnfCYrX0
一回限りの分析なら、手入力で特定のクラスの損失関数に
手入力でペナルティーを追加して、そのクラスに分類されにくくするのも手だと思うんですよ?
そんなやり方でも、いちおう分析結果は平らにはなるよね。たぶん。わからんけど
0367デフォルトの名無しさん (アウーイモ MM77-rIyb)
垢版 |
2018/09/12(水) 19:54:51.80ID:qQh33xQPM
>>364
(自分なりに)もう少し分かりやすく書き下しますと、

この世のありとあらゆる果物が成ってる木があるとして、
この木の画像の中から、リンゴとミカンとブドウを見つけて自動収穫したいタスクがあるとします。
リンゴとミカンとブドウの画像を学習させて分類器を作ったのですが、青リンゴやデコポンやマスカットが学習させた果物と誤認識されて収穫されてしまいます。
学習せた3つの果物以外は収穫したくないので、認識して欲しくないのですがどうすれば良いですか?ということです。
(分かりにくかったらすみません。)
0371デフォルトの名無しさん (アウアウウー Sa77-fYFo)
垢版 |
2018/09/12(水) 20:50:09.10ID:kc7HFSnfa
数字以外の想定し得るあらゆる文字のデータを学習させる必要があるから非現実的だろうね
数字にだけ共通する特徴があるなら最初に数字か数字でないかだけの分類をすればいいけどそんな特徴ないだろうし難しい
0372デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/12(水) 21:07:10.31ID:yfKtIfo20
認知機能が低いこのスレいるような低学歴知恵遅れが写真をみると
コレは心霊写真だという

コレは俗に言うシミュラクラ現象になる

ウンコAIに顔認識をさせると
コレと同じような現象が発生してもなにもおかしくない

コレは出力結果としてものすごいおかしいとはいえない
特徴どおりだからな
0373デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/12(水) 21:13:35.69ID:yfKtIfo20
文字だけの識別なら数量化I類で十分
数量化I類でもかなりの精度になる
0374デフォルトの名無しさん (マクド FF73-Y6TH)
垢版 |
2018/09/12(水) 23:04:27.74ID:agseH4x1F
ひとつの分類器でふたつのことを同時にやらなければいいんじゃね?

@一個の数字画像を、10個のクラスに仕分ける
Aその画像が本当に仕分けられた数字と同じか否かを判定する

このふたつの段階に分けれて、別々の分類器を用意すれば、そんなに難しいことしなくても簡単に組めそう。
@のためのニュートラルネットワークの分類値と、Aのためのクラスごとの分類器を10個用意する必要があるけど、
Aの分類器はたぶん同じようなアルゴリズムで動くから書くの簡単だろ

ただの思いつきだけど、どうだ?
0375デフォルトの名無しさん (ワッチョイ 8b80-f65Y)
垢版 |
2018/09/12(水) 23:12:15.60ID:yfKtIfo20
ぜんぜんわかってないわ
特徴抽出をするのが先だからな

特徴抽出されたデータを学習させない限り
いつまでたっても学習効果なんかない
0376デフォルトの名無しさん (アウアウエー Saf2-r7Fj)
垢版 |
2018/09/12(水) 23:42:58.48ID:MXOsLPIga
>>363
まず数字かそれ以外かを分類してみるとか
で数字のものについて0-9のどのクラスに属するか判別する
0379363 (アウーイモ MM1b-P3CU)
垢版 |
2018/09/13(木) 02:39:06.40ID:r4+4vjzBM
>>369
これがほぼ正解に近いですが、>>371にある通りやはり難しいのですかね。

>>376
数字は例えだったので・・
より実際に近い例えですと、一般物体を「犬、桜、車」の3クラスで認識し、
猫や梅や船のような他の物体なら、3クラスのどれでもないと返して欲しい、というような感じです。
未知の入力の中から、学習させた特定の対象だけを認識することは難しいのでしょうか・・
未知の入力パターンをリジェクトしてくれるような仕組みがないものかなぁと思い質問しました。
0381デフォルトの名無しさん (ササクッテロラ Sp8b-HwcP)
垢版 |
2018/09/13(木) 08:04:53.73ID:iq9KCUrTp
>>379
それも対象となる幾つかとそれ以外に分類してみたらいいのでは?

それか6とbを判別するような判別を後からかけるとか

人間の感覚だと6とbの判別は上側のコーナーの位置と左側の上の交点の位置関係を見ているように思う

それを入力に追加するか学習で獲得させるか
0382デフォルトの名無しさん (ササクッテロラ Sp8b-HwcP)
垢版 |
2018/09/13(木) 08:07:38.47ID:iq9KCUrTp
>>377
それは教師信号とか学習方法とかでも違う結果になるんじゃないの?
厳しすぎて6を検出しなくなるかもしれないけど
それはそれで後から判別する用途に使えるかも知れない
0383デフォルトの名無しさん (ササクッテロラ Sp8b-HwcP)
垢版 |
2018/09/13(木) 08:10:20.78ID:iq9KCUrTp
>>361
一つとカウントするものの認識が違うようだ
ロジスティック回帰を特徴づけるパラメータを引数とする関数を一つと表現している
その関数を再起的に使うことを想定している
0384デフォルトの名無しさん (ワッチョイ 9fe7-fFDB)
垢版 |
2018/09/13(木) 08:52:40.16ID:7kEehjxd0
>>379
犬とそれ以外の2値分類器、桜とそれ以外の2値分類器、車とそれ以外の2値分類器を作って、1番スコアが高いものを答えとする。もし3つのスコア全てが一定の閾値以下であれば該当なしとする。うまくやれば1つのNNでできるかな?
0386デフォルトの名無しさん (アウーイモ MM1b-P3CU)
垢版 |
2018/09/13(木) 11:25:57.39ID:u4Gmb1plM
>>381
初めから6とbが似ているという情報があればそれでもいいのですが・・
どんなものが(特徴量レベルで)6に似ているか分からない時にどうしたらいいでしょうか。
上の例だと、例えばアマゾンの奥地に私達が名前も知らないような犬に似た動物(人が見たら似ているけど犬ではないときちんと判別はできる)がいたとして、それがたまたま入力された時にちゃんとリジェクト出来ればと思うのですが。

>>384
2値分類器にすれば学習データ以外に対するリジェクト率は高くなるのですか?
少し検討してみます。

>>385
はい、もちろんそのつもりではあります。
ただ、あわよくばその他クラスの入力として有効だと知られているデータセットとかないかなと思いまして。
もっと確立された方法があるかと思ったのですが、
意外とあまり一般的な話ではないのかも知れないですね。
0389デフォルトの名無しさん (ササクッテロレ Sp8b-HwcP)
垢版 |
2018/09/13(木) 13:46:19.92ID:qufj2uAPp
>>386
犬に似た動物か犬かは人間も見た目だけでは判別できないのでは?
DNAとかをみて分類するのであればそれを入力として判別するように学習するんだと思う

あくまでも既知の物に近い物の中でどれに近いかを判別するのだと思う

人間も例えば人の名前を聞いた時に
自分が知っている人の中から思い浮かべるはず

名前の文字列から同姓同名の知らない人かどうかは判別できない
0390デフォルトの名無しさん (ササクッテロレ Sp8b-HwcP)
垢版 |
2018/09/13(木) 13:52:05.24ID:qufj2uAPp
つまり似ているけど違うものを正しく判別出来ないときは
判別手法が適切でない可能性だけでなく
入力情報が不足している可能性も考える必要がある

当たり前のことだけど

逆に判別手法は同じでも入力情報を変える事で目的を達成できるかもしれない
0391デフォルトの名無しさん (ワッチョイ d7f8-xwwK)
垢版 |
2018/09/13(木) 13:52:25.76ID:xLrClwyc0
まず大前提として、バイアスが高いとかでなけりゃ
データ数が機械学習のすべて
DNNなら基本的にバイアスが高い状態は無視できるんだから
人が見て判別できる特徴を学習できるほどデータが足りないから誤判別するんだよ
そのデータ数を補い学習を促進させるのがGAN

アウーイモ MM1b-P3CUの問いに対する今最も適当な答えは、GANを組み込めって事だ

もう組み込んでるなら、CNNの前にattentionをぶっ込んで
attention順のtimestepやpositionを特徴に付加した上でCNNで畳み込むモデルを作ったりしろ
ここは先端研究分野だから論文読んで勉強して自分で試せとしか言えない
0392デフォルトの名無しさん (ブーイモ MMbb-fFDB)
垢版 |
2018/09/13(木) 13:56:03.92ID:RXUDxgvEM
>>386
もしかして、教師あり機械学習において、訓練データとして正例だけで(負例は与えずに)判定器を作れるか、という話なのかな?

もしそうであるなら、教師あり学習では出来ないと思うけど。
0393デフォルトの名無しさん (ササクッテロレ Sp8b-HwcP)
垢版 |
2018/09/13(木) 14:02:20.97ID:qufj2uAPp
6とbの例だと
数字を入力する欄に書かれている場合は6の可能性が高い
前後が数字だったらとか文脈情報を付加する事で
正解率を上げることはできると思う

人間も無意識に探索空間を限定していると思うよ
6はアラビア数字空間で見たら6だけど
ローマ数字空間でみたら該当なしが正解
0394デフォルトの名無しさん (ブーイモ MMbb-fFDB)
垢版 |
2018/09/13(木) 14:10:38.03ID:RXUDxgvEM
>>386
で、もし負例を集めるのが大変だという事であれば、学習済みの重みを使って転移学習できるかどうかを検討してみたらどうかな?画像系や言語系なら色々あると思うけど。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況