【統計分析】機械学習・データマイニング24

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん (ワッチョイ 8b01-ZQWL [60.65.176.121])
垢版 |
2019/05/01(水) 10:39:45.57ID:Wg+J+pQH0
機械学習とデータマイニングについて語れ若人

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
Machine Learningを用いた論文一覧2018
https://shiropen.com/seamless/machine-learning/2018
2017年のディープラーニング論文100選
https://qiita.com/sakaiakira/items/f225b670bea6d851c7ea
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング23
https://mevius.5ch.net/test/read.cgi/tech/1551352040/
VIPQ2_EXTDAT: default:vvvvvv:1000:512:----: EXT was configured
69デフォルトの名無しさん (ワッチョイ 9a3c-Xr/9 [219.98.80.75])
垢版 |
2019/05/03(金) 16:03:56.22ID:ONY45VEs0
GoogleのNo Degree組の初任給上限は10万ドルのうち間違え。
70デフォルトの名無しさん (スフッ Sdba-iZva [49.104.12.156])
垢版 |
2019/05/03(金) 16:25:56.77ID:IcNMdQB3d
>>68
たしかにw
わかりやすい的確な例え有難うございます。
2019/05/03(金) 16:27:27.27ID:063VrcVx0
覚醒するかもしれないじゃないか
2019/05/03(金) 16:57:24.66ID:BCys7IrQ0
>>66
この分野勉強して1番強く思ったのがこれ
目とかもすげーんだなって
あとは人間にそういう機能があるって解明した人もすごい
2019/05/03(金) 16:59:13.34ID:mKnPyM5S0
カギはネットワークなのか?
ネットワーク以外の構造ってないのかしらん?
74デフォルトの名無しさん (ワッチョイ 3e82-iZva [113.20.238.175])
垢版 |
2019/05/03(金) 17:15:12.28ID:IgM4uNW80
>>73
生物の情報処理の根源はネットワークではなく
分子の相互作用だと言われている。
2019/05/03(金) 17:42:04.37ID:mKnPyM5S0
それは違う
2019/05/03(金) 19:59:37.88ID:/axHiKT1r
分子の相互作用ってそれ全てそうだろw
すべて弱い力と強い力と電磁気力と重力って言ってるようなもんだぞ
2019/05/03(金) 22:42:06.88ID:Ul59Rvina
複数の分子の相互作用と考えれば
ネットワークになるけどね
2019/05/03(金) 22:59:20.24ID:92XC1giS0
解けないけど
2019/05/03(金) 23:26:58.01ID:FLHS0RWC0
脳の研究は人権無視の中国が頑張ってくれそうだから
地道に時系列問題の解決を目指す
2019/05/04(土) 00:33:23.47ID:mzaDbNsk0
>>79
チュ国は人権軽視の国と勘違いされる事があるようだけどそんな事もないよ
音も葉もないかな
2019/05/04(土) 01:46:36.82ID:uytwPPVV0
この連休数学も統計もついでにwebアプリの作り方もって色々勉強しようと思って手付けたけど全部中途半端で終わりそう
一点集中にするべきだよなぁって連休の度に後悔してる気がする
82デフォルトの名無しさん (ワッチョイ 3e82-iZva [113.20.238.175])
垢版 |
2019/05/04(土) 05:49:15.23ID:PXfzcj9a0
5教科の中で、どの教科が一番大事だと思いますか?
国、社、数、理、英。
2019/05/04(土) 06:39:55.78ID:DhPmwSjc0
>>82
目的は?
なにを目指すかによる
84デフォルトの名無しさん (ワッチョイ b666-fbFq [183.77.216.198])
垢版 |
2019/05/04(土) 06:40:27.81ID:UrLJw2ql0
pytorchとtf、どっちを勉強すべき?
2019/05/04(土) 07:37:49.10ID:7fnHNdb20
>>80
ウィグル人の人権についてはどうですか?
あるいは人体標本の話は?
https://blog.goo.ne.jp/sakurasakuya7/e/0201d90efa00152c5b2ac054bda9ee32
2019/05/04(土) 07:43:40.10ID:T/NdMvRfa
>>84
サンプルプログラムを読んだり、実行してみて、自分が探してるものか評価する。
もしかしたらどっちも合ってないかもしれない。
2019/05/04(土) 11:16:43.18ID:UrLJw2ql0
>>86
自然言語処理したいの
2019/05/04(土) 11:19:24.07ID:l237H6NF0
>>85
日本の外国人労働者問題についてどう思いますか?
http://news.livedoor.com/article/detail/15596666/
2019/05/04(土) 11:37:14.01ID:7fnHNdb20
>>88
外国人技能実習制度の話ですね、技能実習生という名目で使い捨てただ同然で長時間働かせてポイする、というやりかたですね
移民解禁でこの選択を取らない方向に全体がシフトしていくでしょう
2019/05/04(土) 12:39:16.12ID:T/NdMvRfa
>>87
したいことを知ってるのは自分しかいない訳じゃん。それを実現する手段は後から付いてくる。
したいことに近いサンプルプログラムを探して、手を動かしてみては?
2019/05/04(土) 15:45:57.10ID:UrLJw2ql0
全然関係ないけど
見分けがつきにくい野草(トリカブトとニラ、みたいな)を判別できるアプリとか
需要有りそうじゃない?
2019/05/04(土) 15:55:13.32ID:+ZqhEapD0
毒キノコ欲しい
2019/05/04(土) 17:00:03.87ID:WcPeg4KTa
ディープラーニングは精度100%などあり得ないが一般人にはそれが理解不可能なので毒物判定のような命に関わるものを扱うのは危険すぎる
どれだけ丁寧に「開発者は一切責任を負わない」などと書いていても何かあれば叩かれるのは明白だから
2019/05/04(土) 17:03:42.80ID:l237H6NF0
>>93
とはいえ現場でいえば代替案を出せとかめちゃくちゃなことを言われるからな。。
いやそのプロジェクト止めろが代替案だったりするわけだが、大きな金が動くとどうしてもね。
2019/05/04(土) 17:18:19.81ID:+ZqhEapD0
原子力発電はそれで止まってしまったゾイ
2019/05/04(土) 17:24:57.53ID:pXS3gybia
>>91
現実には写真を撮って
「これ食べられる?」
ってツイッターとかにあげるのが
一番の早道
97デフォルトの名無しさん (ラクペッ MMf3-Ka5x [134.180.0.28])
垢版 |
2019/05/04(土) 20:02:55.53ID:biHdzLY3M
あらゆる物を毒物と判定するジョークアプリにすれば良いのさ
2019/05/04(土) 20:54:01.85ID:l237H6NF0
>>95
福島見てりゃ日本人がいざという時誰も何も責任取らんことはよくわかっただろ。
それでもまだ作らせるとかバカか?
99デフォルトの名無しさん (ワッチョイ b666-fbFq [183.77.216.198])
垢版 |
2019/05/05(日) 06:47:27.53ID:YqJW7ihs0
地位と権力を持つ人の
責任感や使命感が
ぼろぼろだね
2019/05/05(日) 07:10:22.65ID:z4ynsVHF0
脳なんて鼻水作ってるだけだぞ
2019/05/05(日) 08:26:54.06ID:3EWrT4Pn0
>>99
世の中は所詮損得勘定で、だれも損なことはやりません
損得勘定でも世の中が回る仕組み(制度設計)を作るしかないかと
戦前の日本は、学府に進む学生は「みどことらがある」として地方の有力者から援助を受けるのが常で、顔の見える他人に恩を受けて学資を支援してもらうため、恩を感じて恩を返すために粉骨砕身で献身したと聞いています
つまり昔はわりとうまくいっていた面もあるとのこと
102デフォルトの名無しさん (アウアウウー Sa47-JISW [106.161.128.166])
垢版 |
2019/05/05(日) 08:41:45.82ID:q/V8WiNga
>>82
国語
103デフォルトの名無しさん (アウアウウー Sa47-JISW [106.161.128.166])
垢版 |
2019/05/05(日) 08:52:36.00ID:q/V8WiNga
>>54
専門分野を持ちコードを書ける奴が一番。
2019/05/05(日) 09:12:42.68ID:3EWrT4Pn0
>>102
私たちが受けてきた国語教育は意味があるのかな?問題が多いのじゃないかな?
私が「国語力」を増進できた授業は英文和訳でした、訳文が日本語として共感できないものだと「横のものを縦に直しただけですか?」とか相当に教官から苛められました…
105デフォルトの名無しさん (ワッチョイ b666-UklA [183.77.216.198])
垢版 |
2019/05/05(日) 09:48:43.61ID:YqJW7ihs0
外国語学部の不要さは異常
2019/05/05(日) 21:12:44.71ID:Hr70XSx80
>>105
お前の方が不要だろ
2019/05/05(日) 21:20:10.38ID:3EWrT4Pn0
>>14
残念、明日を入れても 1800 語レベル/実際に覚えたのは 950 words で終わってしまい、英検準1 級レベルにはとどきませんでした
それに、もう今後は新しい単語は仕入れずにひたすら長期記憶への定着をはからなくてはいけません、ここであきらめては全ては水の泡、これからの定着作業が勝負の分かれ目です
2019/05/05(日) 21:33:26.19ID:NF9r+E0E0
単語集ってどれくらい知ってるかチェックするものであってそれを使って暗記するのは本末転倒。
2019/05/05(日) 21:58:29.31ID:sxcPmh/Y0
それだけ意識高ければ無理やり英語圏に住んだ方が早くね?
2019/05/05(日) 22:09:10.14ID:3EWrT4Pn0
>>108
その意見はよく理解できます、なぜならば、これまでの私の意見でもあったのだから
ISO/IEC9899:1999 を舐めている最中ですが、このまま辞書を引きながらやってもだめなんじゃないか…とふつふつと湧いてくる感想が持論と正反対の行動に駆り立てたようでした、非日常の10日間に、10日間でできる変わったことをしたいなあ、と
2019/05/05(日) 22:59:45.69ID:YqJW7ihs0
あなたのレスの書き方が他の人と違うことに気づいていますか?
気づていないなら教えてあげます
他の人と違っており浮いています
そして私はあなたのレスが嫌いです
バカ丁寧な口調であなたの語りが長々と書かれているスタイルに不快です
改善してください
2019/05/05(日) 23:01:38.54ID:49wX2kj+0
>>111
ブーメランw
縦読みどこよ?
2019/05/05(日) 23:26:13.78ID:3EWrT4Pn0
>>111
専用ブラウザを使ってトリップを無視指定に加えていただければ、そのままで消えますから、それをお試しくださいな…
2019/05/05(日) 23:42:38.32ID:ttVg9mKs0
「QZaw55cn4」を選択してNG処理->NGNameに追加
2019/05/06(月) 00:47:59.82ID:Ou7beXr80
よし(๑•̀ㅂ•́)و✧
英単語云々はスレチだろう
116デフォルトの名無しさん (ワッチョイ b666-UklA [183.77.216.198])
垢版 |
2019/05/06(月) 10:04:30.01ID:QTcMxHJg0
kubeflowを使っている人はいるかしらん?
117デフォルトの名無しさん (ワッチョイ 9a3c-Xr/9 [219.98.80.75])
垢版 |
2019/05/06(月) 19:29:01.25ID:qtehOBS20
>>84
2,3年前まではtf一択だったが、最近の論文発表とかを見るとPyTorchを使ってる例が増えている。
前、mediumに乗ってた両者の定量分析記事だと現在の比率は7:3位。
Google Trendsで見ると解りやすい
https://trends.google.com/trends/explore?date=today%205-y&;geo=US&q=pytorch,tensorflow
多分、あと2年位でPyTorchが追いつくと思う。
したがって、今からやるなら両方使えるのがベスト。順番付けをするなら最初に抑えるべきはtf、次はPyTorch
2019/05/06(月) 19:39:26.74ID:QTcMxHJg0
>>117
practical adviceをありがとう
119デフォルトの名無しさん (アウアウエー Sa52-y53x [111.239.253.26])
垢版 |
2019/05/06(月) 19:59:12.89ID:PCH3H0ata
tensorflowはdefine-and-runでpytorchはdefine-by-runなのでpytorchの方が柔軟
動的に構造が変わるようなネットワークも書きやすい
2019/05/06(月) 21:09:47.27ID:raalM+qTa
tensorflow2.0からはdefine by runがデフォルトになって必要に応じてandの方も選べるハイブリッド型となっている
2019/05/06(月) 21:16:05.57ID:6C8RJLlz0
>>119
ところが今はeager modeでtfでもDefine-by-runで書けるようになってるんだなこれが
2019/05/06(月) 21:23:45.59ID:DF3zK1Xx0
他の計算ユニットに投げる場合はどうせestimatorのインターフェイスになるから
どっちにしろ変わらんよ。
そんな些細なことで躊躇するようならこの分野に手を出さない方が正解。
123デフォルトの名無しさん (アウアウエー Sa52-y53x [111.239.253.26])
垢版 |
2019/05/06(月) 22:19:32.94ID:PCH3H0ata
>>121
えええーそうなんか
2019/05/07(火) 00:28:16.21ID:Ls9L7Q2y0
ライブラリは腐るかも知らんけど、理論は腐らんからちゃんと理論勉強しとくのがいい
2019/05/07(火) 09:32:06.87ID:so8WFHMn0
ブームは終わるけどな20年後ぐらいに役立つよ、たぶん、きっと
2019/05/07(火) 12:03:20.66ID:Y8Vqvjscp
画像分類モデルを作りながら勉強しているのですが、正常と異常を分類したいとして正常画像しか学習用に用意出来なかった場合でも異常を識別するモデルを作ることは出来ますか?
もし可能であればどのようなキーワードや手法の名前で調べると良いでしょうか
初歩的な質問で申し訳ありませんがアドバイス頂けたら幸いです
2019/05/07(火) 13:44:41.49ID:gSUhiuRfd
>>126
前スレでは半教師あり学習、PU learningや能動学習といったキーワードが出ていた
128デフォルトの名無しさん (ワッチョイ 9a3c-Xr/9 [219.98.80.75])
垢版 |
2019/05/07(火) 18:27:21.77ID:U8Di2P9U0
Tensorflowは2.0でほとんど全書き換えをやってる。
そのため、2.0はそれ以前のものとはほとんど別物
(とキャシーは言ってる)
https://hackernoon.com/tensorflow-is-dead-long-live-tensorflow-49d3e975cf04
129デフォルトの名無しさん (アウアウウー Sa47-y53x [106.180.14.231])
垢版 |
2019/05/07(火) 19:30:58.85ID:3Ss1/+q0a
>>126
異常検知
130デフォルトの名無しさん (ワッチョイ 133c-3bTL [219.98.80.75])
垢版 |
2019/05/09(木) 21:01:19.64ID:vusNSi520
Open AIの決算報告書が開示されたので貼っとく。
ポイントは、研究員の平均報酬は約50万ドルくらい。
ここの研究職のレベルは日本だと東大教授とか理化学研究所の上級研究職と同じくらい
なので一般技術者とは比較にはならないが、Redditの書き込みによるとOpen AIは非営利なので、
GoogleとかAppleとか営利は(Goodfellowレベルのトップ研究者には)もっと出してるはずとのこと。
他、全10名程の研究員が使用しているクラウド環境の使用料は年800万ドル
最初のStyleGAN(this person is not existの元ネタ)の論文が発表された際に、推奨動作環境は最低1024TPUv3が必要と示されていたが、
Open AIの環境は正に、最先端のAI研究には膨大なCPU/GPU資源(=資金力)が必要となっていることを示している。
https://regmedia.co.uk/2019/05/02/openai_tax_2017.pdf
2019/05/09(木) 21:10:41.73ID:cNTZPJAY0
openaiの人が年収5000万円でも許せるけど
理研が5000万円はどうかと思う
小保方みたいなチームリーダーのポジションでしょ?
2019/05/10(金) 01:09:02.07ID:qTWC6Bkr0
アメリカは高学歴無職が社会問題化してるのも深刻だが。
極端すぎるんだよ
2019/05/10(金) 08:15:48.01ID:xhrx/m1t0
理研はそんな給料ないやろ
まあだから優秀な人間が流出するんだろうけど
2019/05/10(金) 10:14:09.67ID:4v4gRarW0
理研も東大もそんなにもらってないよw
2019/05/10(金) 10:27:40.96ID:w4MUjXdX0
どこに突っ込めばいいのか、
アメリカは優秀なのにはいくらでも払ってくるだろう
理研も東大も雇用は保証されるが給料は国家公務員なみだろ
>小保方みたいなチームリーダーのポジションでしょ?
アホだろ
2019/05/10(金) 10:48:22.00ID:uAfP9ooZM
機械学習を通じて学んだ知識、ブームが終わっても腐る気がしないんだけど
2019/05/10(金) 12:16:23.21ID:c0REtxLWa
データ突っ込むだけで簡単に結果が出てくるようなソフトが使いこなせるだけというスキルはあっという間に陳腐化するがその根底で動いている仕組みの知識は陳腐化しない
2019/05/10(金) 14:18:15.00ID:k7gY5pMP0
>>136 AI,機械学習は一過性のブームなんかじゃないよ。
ツールは色々変わっていくだろうけど考え方の基本はそれほど大きく変わらないと思う。
2019/05/10(金) 15:45:44.48ID:ILwFZD/AH
>>136
同じく
数学や確率統計の理解、CSの基礎は血肉になってる
2019/05/10(金) 18:00:10.77ID:qCZvktc2M
カーネル主成分分析に関して質問です。

カーネル行列の固有ベクトルaの各成分って高次元への射影後のベクトルの、高次元の世界の主成分軸への射影を固有値で割った値になっていますが、固有値で割るのはどういう意味、効果があると解釈すればいいのでしょうか?

あるテキストだと固有ベクトルを固有値で割ってnormalizeするって書いてあるんですが、固有値は標準偏差の値では無く、分散の値ですよね?よく分かりません。
141デフォルトの名無しさん (スププ Sd33-BnMc [49.98.52.130])
垢版 |
2019/05/10(金) 18:57:29.10ID:7lGnDhFmd
>>140
それ何語?
2019/05/10(金) 21:15:09.75ID:4Zcn3ufG0
>>140
rand関数で生成された乱数は分散であるがその割合がガウス分布として出力されるようになっているのであれば
平均を0としてσの範囲内にあるかないかってことだ
143デフォルトの名無しさん (ワッチョイ 0b82-TFGT [113.20.238.175])
垢版 |
2019/05/10(金) 21:41:00.52ID:AJz30mR40
2030年代の機械学習って
今よりも、どれくらい進歩していると思いますか?
2019/05/10(金) 22:46:21.02ID:q19tRWSj0
量子コンピューターの開発に依存? >>143
145デフォルトの名無しさん (ワッチョイ b140-F0TO [118.104.2.237])
垢版 |
2019/05/11(土) 19:34:31.39ID:FHzVXhI90
素人だけど
学習の高速化 シンボリックを含むこと
モジュール化
構造の自動生成
複雑な構造の解明と作成
こうした研究のその先にあるものでしょ?
やっぱりAGIかなー
2019/05/11(土) 20:48:02.27ID:2v2BzL6t0
>>143
オワコン
2019/05/11(土) 21:09:42.43ID:ew7BdoQp0
機械学習スタートアップシリーズって微妙なやつもあるよね
2019/05/11(土) 21:31:59.53ID:Zt/4qaNAF
その勉強の先に何があるんだ、みたいなほんとうに触りだけの奴も多いな
最初から突き放してあげた方がある意味で良心的
2019/05/12(日) 01:01:48.75ID:k5GhHpRra
理解しました。
これは高次元の世界の主成分軸の単位ベクトルの大きさを1とする制約からくるものですね。
固有値で割らなかった場合は主成分軸ごとに単位ベクトルの大きさが異なるからグラフにしたときに升目の形が長方形になってしまう感じ。
150デフォルトの名無しさん (ワッチョイ 733e-r25I [149.54.201.210])
垢版 |
2019/05/12(日) 02:12:12.70ID:B3ncpqwY0
画像認識で教師なし学習って可能ですか?
例えばネット上の色んな画像をランダムに学習させてあとから犬の画像を抽出できるようにするとか
2019/05/12(日) 02:52:35.06ID:sBOzGE/v0
教師無しと教師有りに本質的な区別はない
2019/05/12(日) 08:08:33.24ID:LAPNzPPAM
>>140
自分の理解だと
高次元空間における主成分軸への射影ではなく、高次元空間に射影した時点で
自動的に主成分分析っぽいことができていて、あとはスカラーを調整するだけだったような
2019/05/12(日) 08:09:57.05ID:Jr9TZlLT0
https://tjo.hatenablog.com/entry/2019/05/10/190000
2019/05/12(日) 08:12:26.96ID:Jr9TZlLT0
>「このまま今の仕事を続けていった場合、一体自分はどこに向かっていくことになるんだろうか?」「10年後に果たして自分の仕事はあるんだろうか?」と不安に駆られるのも無理からぬことだと思います
155デフォルトの名無しさん (ワッチョイ 9b66-tQvV [183.77.216.198])
垢版 |
2019/05/12(日) 08:29:46.27ID:VqhQ+RPw0
長い
2019/05/12(日) 08:51:24.29ID:LAPNzPPAM
キャリアの先が不安だから
データサイエンティストではなくエンジニアの方になったわ
やること多くて反吐が出るけど
2019/05/12(日) 10:19:23.76ID:ICYeSmM7H
高度IT人材が数十万人不足!とか騒いでる側から、現職中堅からこんな声が上がってるとはね
AI、AI!はただの号令で実態はこんなもんなんだろうな
数年後には年間数万人規模の大学出AI人材輩出されるらしいが現場はどうするんやろ
2019/05/12(日) 11:25:59.32ID:z++b3CYg0
結局システム作らないと行けないから、論文書くような人以外は、従来型人材が必要なんでないかしら
2019/05/12(日) 11:38:51.72ID:wIsV6IWRa
50代の偉いポジションの人なんかはメール使うのがやっとというレベルでありその人が考える高度人材だから実際はお前らが想像するほど高度ではない
2019/05/12(日) 12:21:56.49ID:VqhQ+RPw0
松尾豊あたりが入れ知恵してるんだろう
2019/05/12(日) 12:37:03.79ID:z++b3CYg0
svmで分類出来る程度なら勝手に皆成る気がする
2019/05/12(日) 16:34:03.36ID:yphZ1GONp
>>149
理解しているのかしていないのか分からないけども
1. 高次元への写像
2. 主成分分析
という2段階のステップがあり、固有値、すなわち分散で割るのは主成分分析によるもの
次元削減で使う主成分分析も固有値で割るでしょ?

>>152
自動的にできるというのが言い方は微妙だけど
分類できるようにカーネル関数を選択するというのが正しい
2019/05/12(日) 16:38:55.57ID:yphZ1GONp
>>150
分類はできるけどそれが犬であるかどうかは教師が必要
2019/05/12(日) 16:41:47.65ID:yphZ1GONp
>>156
データサイエンティストって言っても多くは前処理要員だと思う
DataRobotにデータを食わせるためのエンジニアに近い
あるいは出てきた結果を偉い人にわかるようにWordやpowerpointに貼って説明する仕事
2019/05/12(日) 18:54:41.11ID:VqhQ+RPw0
偉い人にデータサイエンスブームが来るだけでは?
他人にやらせるより自分でできた方が良いだろ
pl理解するノリでデータサイエンスが必須スキルになるのでは?
2019/05/12(日) 20:57:22.15ID:dyyWf7Fh0
ほにゃらら人材が何万人不足ってのは
「安く使い倒せる人材」が不足って意味だからまともに受け取ると死ぬぞ。
167デフォルトの名無しさん (ワッチョイ 733e-r25I [149.54.201.210])
垢版 |
2019/05/12(日) 21:05:53.21ID:B3ncpqwY0
画像で犬が認識できるようになるには何層辛い必要なんですか?
168デフォルトの名無しさん (ワッチョイ 733e-r25I [149.54.201.210])
垢版 |
2019/05/12(日) 21:06:44.48ID:B3ncpqwY0
何層くらい
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況