【統計分析】機械学習・データマイニング21

■ このスレッドは過去ログ倉庫に格納されています
2018/11/04(日) 14:34:36.02ID:W830XVm1a
機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング20
https://mevius.5ch.net/test/read.cgi/tech/1533635797/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
72デフォルトの名無しさん (ワイーワ2 FFa3-nQo6)
垢版 |
2018/11/08(木) 13:59:26.61ID:2uuB+50RF
DRAMのデータバスのbit順間違って結線してても一応そのまま動くからな
2018/11/08(木) 14:38:17.05ID:o189kGQ6p
>>71
俺もそのうちの1人なんだけどさ
これでは何の意味もないし説得力もないなと思って統計だったり色々勉強し始めて、自分もそうだったけどとりあえずデータ投げてモデル作って結果だしてって雑だし乱暴だよね
2018/11/08(木) 16:04:27.11ID:cbRquK1Y0
顧客もわかってないから大丈夫
2018/11/08(木) 16:10:16.11ID:ad3mAi6zd
統計学の知識って東大赤本程度でいいの?
76デフォルトの名無しさん (ワッチョイ 9123-maPn)
垢版 |
2018/11/08(木) 16:12:37.43ID:zFTwTExl0
目標がどこかによる
2018/11/08(木) 16:42:53.67ID:t+ny6V8X0
リアルはKaggleと違って、何が入力値になるか探すところから始まる。

データへアプローチする為には統計の知識は必須だから、
ライブラリ使いが増えてもAI普及の助けにはならないな
2018/11/08(木) 17:20:49.64ID:Pov5kC23M
>>63
テストも含め学習検証時はkeras内蔵のioライブラリ一本でやってたからね
実用時に一部処理をopencvに任せたらkonozama
テストスコア高い時点で過学習じゃないって気付けよって話だわマジで
79デフォルトの名無しさん (アウアウイー Sa4d-XkOm)
垢版 |
2018/11/08(木) 17:48:59.03ID:BOCzE0W9a
>>75
だめでしょ

でも、AIの利用者はそれを知らなくても使えるところに一つのメリットがある
ともいえるので、なんか微妙なところもある。

数理的には統計の方が難しいし、自動化できない問題がある。
なぜ数理的に難しい部分が出現するかといえば単純なことで、
少ないデータを対象に考えられているため。
2018/11/08(木) 17:58:58.30ID:X0Z+x7SD0
機械学習に数学はいらない
2018/11/08(木) 18:06:12.16ID:QFvA6n6Ua
最近は勝手に分析して特徴量を自動的に作るソフトとかも出てるけど実際使ったことないからどんなものかは分からない
でもその手のソフトが宣伝文句通りに動作するなら片っ端からデータ突っ込むだけでいいんだよね?
82デフォルトの名無しさん (アウアウイー Sa4d-XkOm)
垢版 |
2018/11/08(木) 18:14:44.36ID:BOCzE0W9a
>>81

そう。
まずい飯を入れれば
たくさん残飯が出てくる。
2018/11/08(木) 20:54:11.37ID:+qO5qSu80
AUC高い!って今日同僚がキャッキャ騒いでたけどいつのまにか良いモデルを作る事が目的になってる人結構いるよね
84デフォルトの名無しさん (ワッチョイ 0123-nQo6)
垢版 |
2018/11/09(金) 11:55:37.96ID:p9aTnaT/0
モデル作っちゃったらもう機械学習じゃなくなる
2018/11/09(金) 14:51:34.93ID:axsxYZkQ0
これって応用できればGPUで必死に学習とかいらなくなるの?

「エネルギー関数」を用いてコンピューターに概念を機械学習させる
https://gigazine.net/news/20181108-learning-concepts-with-energy-functions/
>このモデルを使うと、わずか5回のデモンストレーションを行うだけで機械学習が行われ、その成果は2次元だけでなく3次元にも応用が可能であるとされています。
https://i.gzn.jp/img/2018/11/08/learning-concepts-with-energy-functions/00_m.png
2018/11/09(金) 15:18:34.83ID:qXb+j0DR0
問題の次元が低い、おもちゃ(適当)
87デフォルトの名無しさん (JP 0Hb5-I+1O)
垢版 |
2018/11/09(金) 15:21:04.21ID:ayKhAvWSH
いい研究だと思う
2018/11/09(金) 15:25:08.64ID:Bh3NLuzb0
適用できるモデルがかなり限定的

というかそもそも現在の制御技術でも可能なレベル
2018/11/09(金) 15:36:44.39ID:qXb+j0DR0
現実の問題が解けるかどうかの時代にw
2018/11/09(金) 17:19:14.80ID:3gHretYLd
>>85をショボいと理屈を持って断じることができる人材が増えてほしい
2018/11/09(金) 17:20:04.21ID:z1XmYBYXM
是非断じてくれ
2018/11/09(金) 18:04:43.56ID:YbWngQcz0
D-Waveの量子コンピューターで機械学習したらどうなるのかも気になるが、さっぱり解らん
2018/11/09(金) 19:47:59.65ID:Bh3NLuzb0
わざわざD-waveなんて使用する必要はない。
2018/11/09(金) 20:33:39.77ID:hu2LpIp+0
New-Waveで機械学習したらどうなるのかも気になるが、さっぱり解らん
2018/11/10(土) 02:37:03.74ID:HrOFPhGN0
非線形最適化だろうが確率分布のピークが複数あろうが、今のNNならかなり高速に最適化できるからな
2018/11/10(土) 06:11:09.22ID:4NcBJuO5d
>>92
sdk 見てごらん
2018/11/10(土) 10:53:04.28ID:iD5EgjUR0
これはGAN?
https://www.ctpost.com/technology/businessinsider/article/China-created-what-it-claims-is-the-first-AI-news-13377591.php

中国語訛りの英語が自然に合成できてる
2018/11/10(土) 14:02:45.07ID:/iLHit/Sa
量子プログラミングを全然知らないのに
適当なこと書くのは恥ずかしいからやめような。真に受ける人もいるかもしれないんで
99デフォルトの名無しさん (ワッチョイ 1923-nQo6)
垢版 |
2018/11/10(土) 15:54:18.89ID:gwVpzklH0
>そもそも現在の制御技術でも可能なレベル

これ
2018/11/11(日) 10:54:02.52ID:NQdU7XzPM
もう何でもかんでも機械学習とかAIって呼ばれる時代だから仕方ない
101デフォルトの名無しさん (ワッチョイ 2b81-lxgc)
垢版 |
2018/11/11(日) 11:11:42.83ID:/u39Nxx30
ネタないこの世の中において久々に「遊べる感」や「進化感」が感じられる分野だからな
そりゃあ、猫も杓子も機械学習に飛びついて飯を食おうとするわな
2018/11/11(日) 13:03:55.10ID:96wp+TZdF
https://landing.pyq.jp/ml/
2018/11/11(日) 13:27:15.86ID:WDS/Wv9M0
モヒカン族w
マサカリ飛ぶ
2018/11/11(日) 14:00:22.61ID:hdcTIF3m0
猫も杓子も
「禰宜(めこ)も釈子(しゃくし)も」が変化したという説、「女子(めこ)も弱子(じゃくし)も」が変化したという説、または猫や杓子は日常生活において目につきやすいからという説もある
2018/11/11(日) 17:13:47.54ID:vRwqfVkpa
Jupyterをサポートした「Python in Visual Studio Code」10月版がリリース
https://news.mynavi.jp/article/20181109-721502/

今までは別タブでしか結果表示出来なかったんだっけ
これの使い心地良ければブラウザでjupyter notebook編集するよりは楽そう
106デフォルトの名無しさん (ワッチョイ 93d2-um1t)
垢版 |
2018/11/11(日) 18:36:49.04ID:RKZlqPiP0
機械学習って何やって遊べばいいの?
107デフォルトの名無しさん (ワッチョイ 9180-L4Ec)
垢版 |
2018/11/11(日) 19:03:04.33ID:KBFxC5Cm0
トランプでどうやって遊ぶのといわれたら
だれもが自分の好きなトランプの遊びを選択する

そのトランプの遊びがくだらないものであっても
それはその特定のトランプの遊びがつまらないのであって
トランプの遊びすべてがつまらないワケではない

新しいトランプの遊びかたを探すのもありだ
遊びだからな つまり遊びで割り切らないといけない もともとこのインチキな分野にはなんのメリットもない
2018/11/11(日) 19:54:05.93ID:x3SY904PM
まーだインチキとか喚いてる老害おじさんいて草
109デフォルトの名無しさん (アウアウウー Sa05-thJ7)
垢版 |
2018/11/11(日) 21:39:12.85ID:/Wf9OVIEa
>>106
Kaggle
2018/11/11(日) 22:06:33.76ID:4KGbvnyj0
神楽
2018/11/12(月) 00:06:45.67ID:SrOO8xVk0
kaggleこなせば仕事でも活かせる部分ってあるのかね
そもそもkaggleすら出来ない奴は論外なのか
2018/11/12(月) 00:24:16.13ID:2AJGqUNfa
その人のポジションによる
kaggleのメリットはひたすらデータ解析して高スコアモデルの作成の追求に没頭できること
一方でそもそもそんなモデルを作ろうと考えるに至るまでの課題抽出のプロセス、モデル作成のためのデータ取得、
完成したモデルをどう事業に使うか、といった部分は完全に無視することになる
2018/11/12(月) 08:28:34.75ID:dAU023bia
「Splatoon 2」をディープラーニングで攻略してみなイカ? 2018(前編)
http://www.itmedia.co.jp/news/articles/1811/08/news007.html
114デフォルトの名無しさん (トンモー MMb5-EPGN)
垢版 |
2018/11/12(月) 15:33:06.60ID:tl7KhuZQM
kaggleに登録したけど
忙しくてその後何もやってない。

kaggleやるヒマあるならキチンと
統計学の勉強したほうがいいと思う。
2018/11/12(月) 15:46:42.95ID:zfFdas5ga
「きちんと勉強する」の基準が難しくて真面目な人ほど勉強ばかりに熱中して実践的なことが見に付かなくなる
なので理論の勉強しつつ並行して実践するのが一番
kaggleも勉強の一環と考えて上位入賞を意識しすぎなければいい
2018/11/12(月) 15:47:56.04ID:HapbR1cN0
kaggle勉強するより職安へ行け
117デフォルトの名無しさん (トンモー MMb5-EPGN)
垢版 |
2018/11/12(月) 16:56:46.18ID:tl7KhuZQM
俺はもう15年もデータ分析の仕事してる。
実践はやっていける自信持てたけど
理論武装を積み上げないといけないと思ってるところ。
企業で統計学を教えることもあるけど
まだまだ理論は未熟ですよ。
2018/11/12(月) 17:47:16.10ID:yIhe+PMWM
職安より派遣会社の求人見たほうが捗ると思う
2018/11/12(月) 20:21:45.69ID:SrOO8xVk0
>>115
自分が真面目かは分からないけど刺さる言葉だ…
勉強しても不安でずっと参考書見て参考のコード書いてってばかりで実践力みたいなものは皆無だと思う

あと上でも統計学を勉強するべきって言ってくれてる人もいるけど、区間推定とか仮説検定とかそういうのは低レベル過ぎる?
2018/11/12(月) 21:02:02.66ID:3jWw6whwM
理論とかイラネ
そんな無駄ならことする暇あるなら手を動かして一つでも多くデータを集めろ
2018/11/12(月) 22:46:42.91ID:7mkm1h1Ta
>>119
機械学習で使うかと言われると使わない。
ただし、顧客からp値を出せと求められる場合もあるので常識として押さえておいた方がよい。
2018/11/12(月) 23:17:21.18ID:SrOO8xVk0
>>121
なるほど
データ分析が出来る人になりたいなと思うから抑えといた方が良さそうだね
ここに居る人たちは分析メインの人よりシステム作ったりしてる人が多いのかな
123デフォルトの名無しさん (ワッチョイ 89a5-UVTV)
垢版 |
2018/11/12(月) 23:21:52.61ID:kXjsSMnv0
理論分かってた方がどこをどう直せば改善するとかわかるようになるんじゃないの
2018/11/12(月) 23:40:51.12ID:Jl0ra6Fvp
決定木ってデータのスケーリングだったりは必要ないって解説サイトにも書かれてるけど全くやらないのがデフォルトなの?
それとも文字とかはダミー変数とかに置き換える基本はやるべきなの?
2018/11/13(火) 02:10:30.33ID:n0VTath80
>>124
他のモデルと純粋に優劣を図りたい時に条件を揃える目的でスケーリングすることはあるかも知れない(無意味だけど)
カデゴリカル値の変換は決定木の場合もやらなくちゃいけない。変数の数がやたら増えると好ましく無いため、get_dummiesよりはtarget based encodingがいいよという人もいる。
126デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/13(火) 10:17:10.75ID:jDscK74j0
>>120
> 理論とかイラネ
> そんな無駄ならことする暇あるなら手を動かして一つでも多くデータを集めろ

そういう人って、少し景気が悪くなれば必要なくなる。
PCが使えれば高卒でもできるから。

ま、そういうレベルの職場もまだ多いから、
それで食っていけるならいいんじゃないか?

おれはイヤだけどね。
2018/11/13(火) 10:19:11.30ID:Kpp1CQPu0
インフラ系開発からそっち行きたいんだけど中々入り込めぬ
2018/11/13(火) 10:58:04.08ID:yY9+3jiAM
>>126
理論とか高卒の作業以下って言ってるんだけど
上でも誰か言ってるけど課題抽出やどう事業に応用するのかが大事なのであって理論じゃ飯は食えない
129デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/13(火) 10:58:37.62ID:jDscK74j0
最近は、転職するのがとても難しいですね。

良い人材を採用したいといいながら、
人材紹介会社に丸投げですから。

人材紹介会社というのが何をやってるのか
わかりませんけど、そういうのに登録しても、
高学歴で20代でなければ、
ほとんど良い転職は紹介してもらえないようです。

つか、紹介先が人売り企業ばかりです(笑)
そのほうが高く売れるんですよ。
紹介手数料を多くもらえる。

だから、普通の人には下請け企業や
実質的な派遣会社ばかりを紹介してきます。
130デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/13(火) 11:02:10.63ID:jDscK74j0
>>128
実践は俺のもっとも得意とするところ。
ちゃんと書いてあるだろう?
読めないのか?

それに加えて理論ということだ。
日本語読めないか?
131デフォルトの名無しさん (オッペケ Srcd-6kU4)
垢版 |
2018/11/13(火) 11:49:50.60ID:HwiD+z3Er
>>128
課題抽出や応用って理論が無いとできないと思うんだが
理論がいらないのって下請けの単純作業くらいじゃね
132デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/13(火) 13:03:00.51ID:jDscK74j0
客が馬鹿なところでは、
ヒストグラムと折れ線グラフで分析終了ですね。
実際、そういうところ多いです。

だからと言ってそれに甘んじて理論の勉強をサボっていると、
そのうちメシが食えなくなるということでしょう。
2018/11/13(火) 13:48:11.79ID:OJogVv480
ヒストグラムと折れ線グラフか、馬鹿丸出し
2018/11/13(火) 15:05:43.42ID:BS1qZA5ra
それで納得する客が一番馬鹿なんだろ
2018/11/13(火) 15:28:39.07ID:qjyppvvrM
グラフの種類だけで程度を判断する方がバカだろ
136デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/13(火) 15:28:44.21ID:jDscK74j0
>>133
だからさ、日本語読めないなら半島へ帰りなよ。
データ分析専門の会社なんて在日朝鮮人ばっか。
137デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/13(火) 15:30:41.68ID:jDscK74j0
>>135
そうそう。
客が納得する単純なグラフを用意するのも仕事の内ですから。

結局は客の要望で仕事するしかないわけで。
2018/11/13(火) 15:32:06.04ID:a3DOmJPl0
>>136
自己紹介乙
139デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/13(火) 15:32:50.87ID:jDscK74j0
>>133
客の要望が理解できないド素人なんだろうが、
まあ、そういう馬鹿でも今はメシが食える。
いいなあ(笑)
2018/11/13(火) 15:48:01.71ID:i3IpTYWsa
>>132
見極め大変そうだな
普通の客にそんなん出したらバカにしてんのかって怒られるぞ
2018/11/13(火) 18:11:06.97ID:/8tq7XAla
それでも怒らず満足してくれる客がいるってことだろ
30点で満足してくれるのに同じ金で80点取ろうとする必要はない
142デフォルトの名無しさん (アウウィフ FF05-nQo6)
垢版 |
2018/11/13(火) 18:58:44.96ID:90McxFB4F
>>120
どうやって騙して金取るかだからな
2018/11/13(火) 21:32:20.48ID:PhswnKOyM
>>130
その実践のために理論なんてものを覚える暇があるなら1つでもデータ数を増やす方が役に立つという主張ダナ
逆に理論なんて無用の長物がどう実践に役立つのか教えて欲しいもんだわ
あんなの暇人研究者()のオモチャだろ
144デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/13(火) 21:43:39.39ID:jDscK74j0
>>143
言いたいことはわからんでもないけど、
理論でデータを増やる場合があるんだよね。
それが重要だったりするんだよ。

教えてやろうか?
145デフォルトの名無しさん (ワッチョイ 9180-L4Ec)
垢版 |
2018/11/13(火) 21:47:50.36ID:RYrE2D9k0
まずバカは相手がなにをしたいかが読み取れないからな
所詮、ドカタ作業員
146デフォルトの名無しさん (アウアウエー Sa23-6kU4)
垢版 |
2018/11/14(水) 00:16:46.33ID:pC5Ut3Iga
>>143が頭空っぽにしてても実践出来るのはその暇人研究者()のおかげなんだが
2018/11/14(水) 04:32:59.14ID:yIp6NBG4a
>>144
「理論でデータを増やる場合があるんだよね。」って日本語変じゃないか?
148デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/14(水) 12:06:15.39ID:NG7mIW/H0
>>147
ちょいと変だけど意味は通じるだろ?
理解できない?
149デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/14(水) 12:07:28.48ID:NG7mIW/H0
>>147
手を動かしてるだけのFランの馬鹿には理解できないと思う。
だから学歴を書いてくれる?
学歴に応じてわかるように書いてやるから?
2018/11/14(水) 12:28:40.66ID:154n6794M
自分園卒なんで
2018/11/14(水) 12:53:28.20ID:+eDtgQwca
小卒にも分かるように説明して
2018/11/14(水) 12:58:16.43ID:cuzYivzb0
ワシAIなのでAI用にも頼む
2018/11/14(水) 13:01:13.06ID:9WOb/6Su0
ワイ天才チンパンジー「アイちゃん」やで
154デフォルトの名無しさん (ワッチョイ 1397-A2K7)
垢版 |
2018/11/14(水) 14:53:29.30ID:IOAeCUn40
cross-validation: [0.5 0.375 0.71428571 0.8 0.6 ] 0.5978571428571429
交差検証したときにこういうときってどうしたらいいですか?
データ数が少ないってのはあるのですが…
155デフォルトの名無しさん (ガックシ 064b-TAiA)
垢版 |
2018/11/14(水) 14:53:29.46ID:QHJsQvcv6
tensorflowって複素数のデータを使った学習できますか?
実数=複素数*重みみたいな式を作りたいんですけどどうすればいいですかね
156デフォルトの名無しさん (ワイーワ2 FFa3-nQo6)
垢版 |
2018/11/14(水) 15:40:27.76ID:vKfdJ4rAF
マルチンコ
2018/11/14(水) 16:06:50.27ID:CXfW1gLWd
>>155
複素数型はあるからできるんじゃないの
158デフォルトの名無しさん (ガックシ 064b-TAiA)
垢版 |
2018/11/14(水) 16:31:40.43ID:QHJsQvcv6
複素数をcsvから読み込みたいんですけど、
tf.train.string_input_producerの後でデコードする時に
record_defaultsに複素数を定義できません
複素数を読み込むにはどうすればいいですか
2018/11/14(水) 17:13:15.98ID:8qTuaqIj0
客日w
2018/11/14(水) 17:39:13.14ID:0a1Q/5jla
>>158
データ型があるんだから必要なら書き換えればいいだろ
161デフォルトの名無しさん (ワッチョイ 9123-maPn)
垢版 |
2018/11/14(水) 18:10:54.53ID:JI+/JYep0
複素ニューラルネットワークでもやってるんかな
2018/11/14(水) 19:05:46.41ID:nZFpv+kvM
>>144
理論でデータ拡張??
いったい何のことを言っているのか例あげてみてよ

>>146
そりゃそうだろ
あいつら理論で遊んでお金貰ってるんだからそれくらい貢献して当然
2018/11/14(水) 19:41:23.92ID:dhjSggB5a
データ水増し(augmentation)の手法なら色々出てるんだから知りたければ自分で調べればよい
2018/11/14(水) 19:47:24.17ID:EJsl/MsX0
複素ニューラルネットはすでにあるよ
2018/11/14(水) 20:32:11.63ID:T3ZbGMtz0
4元数ニューラルネットが熱い
2018/11/14(水) 21:01:56.21ID:nZFpv+kvM
>>163
誰にもの言ってるのそんなの勿論知ってる
それらのうちの一体どれが理論によってなされてるのか教えてって言ってるんだけど
167デフォルトの名無しさん (アウアウエー Sa23-6kU4)
垢版 |
2018/11/14(水) 21:05:17.69ID:tb9I3vf3a
寂しいね
要る/要らないで切り捨てていったら自分の世界がどんどん狭くなるよ
2018/11/14(水) 21:07:06.84ID:8Jgvo+VQa
理論に依らない手法などそもそもどこにあるのか
2018/11/14(水) 22:36:55.64ID:+eDtgQwca
>>166
知らねえよ誰だよお前
2018/11/15(木) 01:34:28.55ID:mQ1OcAlX0
俺じゃねぇよ
2018/11/15(木) 09:12:40.10ID:XHfBsUWU0
俺でもない
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況