【統計分析】機械学習・データマイニング21

■ このスレッドは過去ログ倉庫に格納されています
2018/11/04(日) 14:34:36.02ID:W830XVm1a
機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング20
https://mevius.5ch.net/test/read.cgi/tech/1533635797/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
2018/11/12(月) 23:17:21.18ID:SrOO8xVk0
>>121
なるほど
データ分析が出来る人になりたいなと思うから抑えといた方が良さそうだね
ここに居る人たちは分析メインの人よりシステム作ったりしてる人が多いのかな
123デフォルトの名無しさん (ワッチョイ 89a5-UVTV)
垢版 |
2018/11/12(月) 23:21:52.61ID:kXjsSMnv0
理論分かってた方がどこをどう直せば改善するとかわかるようになるんじゃないの
2018/11/12(月) 23:40:51.12ID:Jl0ra6Fvp
決定木ってデータのスケーリングだったりは必要ないって解説サイトにも書かれてるけど全くやらないのがデフォルトなの?
それとも文字とかはダミー変数とかに置き換える基本はやるべきなの?
2018/11/13(火) 02:10:30.33ID:n0VTath80
>>124
他のモデルと純粋に優劣を図りたい時に条件を揃える目的でスケーリングすることはあるかも知れない(無意味だけど)
カデゴリカル値の変換は決定木の場合もやらなくちゃいけない。変数の数がやたら増えると好ましく無いため、get_dummiesよりはtarget based encodingがいいよという人もいる。
126デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/13(火) 10:17:10.75ID:jDscK74j0
>>120
> 理論とかイラネ
> そんな無駄ならことする暇あるなら手を動かして一つでも多くデータを集めろ

そういう人って、少し景気が悪くなれば必要なくなる。
PCが使えれば高卒でもできるから。

ま、そういうレベルの職場もまだ多いから、
それで食っていけるならいいんじゃないか?

おれはイヤだけどね。
2018/11/13(火) 10:19:11.30ID:Kpp1CQPu0
インフラ系開発からそっち行きたいんだけど中々入り込めぬ
2018/11/13(火) 10:58:04.08ID:yY9+3jiAM
>>126
理論とか高卒の作業以下って言ってるんだけど
上でも誰か言ってるけど課題抽出やどう事業に応用するのかが大事なのであって理論じゃ飯は食えない
129デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/13(火) 10:58:37.62ID:jDscK74j0
最近は、転職するのがとても難しいですね。

良い人材を採用したいといいながら、
人材紹介会社に丸投げですから。

人材紹介会社というのが何をやってるのか
わかりませんけど、そういうのに登録しても、
高学歴で20代でなければ、
ほとんど良い転職は紹介してもらえないようです。

つか、紹介先が人売り企業ばかりです(笑)
そのほうが高く売れるんですよ。
紹介手数料を多くもらえる。

だから、普通の人には下請け企業や
実質的な派遣会社ばかりを紹介してきます。
130デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/13(火) 11:02:10.63ID:jDscK74j0
>>128
実践は俺のもっとも得意とするところ。
ちゃんと書いてあるだろう?
読めないのか?

それに加えて理論ということだ。
日本語読めないか?
131デフォルトの名無しさん (オッペケ Srcd-6kU4)
垢版 |
2018/11/13(火) 11:49:50.60ID:HwiD+z3Er
>>128
課題抽出や応用って理論が無いとできないと思うんだが
理論がいらないのって下請けの単純作業くらいじゃね
132デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/13(火) 13:03:00.51ID:jDscK74j0
客が馬鹿なところでは、
ヒストグラムと折れ線グラフで分析終了ですね。
実際、そういうところ多いです。

だからと言ってそれに甘んじて理論の勉強をサボっていると、
そのうちメシが食えなくなるということでしょう。
2018/11/13(火) 13:48:11.79ID:OJogVv480
ヒストグラムと折れ線グラフか、馬鹿丸出し
2018/11/13(火) 15:05:43.42ID:BS1qZA5ra
それで納得する客が一番馬鹿なんだろ
2018/11/13(火) 15:28:39.07ID:qjyppvvrM
グラフの種類だけで程度を判断する方がバカだろ
136デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/13(火) 15:28:44.21ID:jDscK74j0
>>133
だからさ、日本語読めないなら半島へ帰りなよ。
データ分析専門の会社なんて在日朝鮮人ばっか。
137デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/13(火) 15:30:41.68ID:jDscK74j0
>>135
そうそう。
客が納得する単純なグラフを用意するのも仕事の内ですから。

結局は客の要望で仕事するしかないわけで。
2018/11/13(火) 15:32:06.04ID:a3DOmJPl0
>>136
自己紹介乙
139デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/13(火) 15:32:50.87ID:jDscK74j0
>>133
客の要望が理解できないド素人なんだろうが、
まあ、そういう馬鹿でも今はメシが食える。
いいなあ(笑)
2018/11/13(火) 15:48:01.71ID:i3IpTYWsa
>>132
見極め大変そうだな
普通の客にそんなん出したらバカにしてんのかって怒られるぞ
2018/11/13(火) 18:11:06.97ID:/8tq7XAla
それでも怒らず満足してくれる客がいるってことだろ
30点で満足してくれるのに同じ金で80点取ろうとする必要はない
142デフォルトの名無しさん (アウウィフ FF05-nQo6)
垢版 |
2018/11/13(火) 18:58:44.96ID:90McxFB4F
>>120
どうやって騙して金取るかだからな
2018/11/13(火) 21:32:20.48ID:PhswnKOyM
>>130
その実践のために理論なんてものを覚える暇があるなら1つでもデータ数を増やす方が役に立つという主張ダナ
逆に理論なんて無用の長物がどう実践に役立つのか教えて欲しいもんだわ
あんなの暇人研究者()のオモチャだろ
144デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/13(火) 21:43:39.39ID:jDscK74j0
>>143
言いたいことはわからんでもないけど、
理論でデータを増やる場合があるんだよね。
それが重要だったりするんだよ。

教えてやろうか?
145デフォルトの名無しさん (ワッチョイ 9180-L4Ec)
垢版 |
2018/11/13(火) 21:47:50.36ID:RYrE2D9k0
まずバカは相手がなにをしたいかが読み取れないからな
所詮、ドカタ作業員
146デフォルトの名無しさん (アウアウエー Sa23-6kU4)
垢版 |
2018/11/14(水) 00:16:46.33ID:pC5Ut3Iga
>>143が頭空っぽにしてても実践出来るのはその暇人研究者()のおかげなんだが
2018/11/14(水) 04:32:59.14ID:yIp6NBG4a
>>144
「理論でデータを増やる場合があるんだよね。」って日本語変じゃないか?
148デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/14(水) 12:06:15.39ID:NG7mIW/H0
>>147
ちょいと変だけど意味は通じるだろ?
理解できない?
149デフォルトの名無しさん (ワッチョイ 01d2-K50l)
垢版 |
2018/11/14(水) 12:07:28.48ID:NG7mIW/H0
>>147
手を動かしてるだけのFランの馬鹿には理解できないと思う。
だから学歴を書いてくれる?
学歴に応じてわかるように書いてやるから?
2018/11/14(水) 12:28:40.66ID:154n6794M
自分園卒なんで
2018/11/14(水) 12:53:28.20ID:+eDtgQwca
小卒にも分かるように説明して
2018/11/14(水) 12:58:16.43ID:cuzYivzb0
ワシAIなのでAI用にも頼む
2018/11/14(水) 13:01:13.06ID:9WOb/6Su0
ワイ天才チンパンジー「アイちゃん」やで
154デフォルトの名無しさん (ワッチョイ 1397-A2K7)
垢版 |
2018/11/14(水) 14:53:29.30ID:IOAeCUn40
cross-validation: [0.5 0.375 0.71428571 0.8 0.6 ] 0.5978571428571429
交差検証したときにこういうときってどうしたらいいですか?
データ数が少ないってのはあるのですが…
155デフォルトの名無しさん (ガックシ 064b-TAiA)
垢版 |
2018/11/14(水) 14:53:29.46ID:QHJsQvcv6
tensorflowって複素数のデータを使った学習できますか?
実数=複素数*重みみたいな式を作りたいんですけどどうすればいいですかね
156デフォルトの名無しさん (ワイーワ2 FFa3-nQo6)
垢版 |
2018/11/14(水) 15:40:27.76ID:vKfdJ4rAF
マルチンコ
2018/11/14(水) 16:06:50.27ID:CXfW1gLWd
>>155
複素数型はあるからできるんじゃないの
158デフォルトの名無しさん (ガックシ 064b-TAiA)
垢版 |
2018/11/14(水) 16:31:40.43ID:QHJsQvcv6
複素数をcsvから読み込みたいんですけど、
tf.train.string_input_producerの後でデコードする時に
record_defaultsに複素数を定義できません
複素数を読み込むにはどうすればいいですか
2018/11/14(水) 17:13:15.98ID:8qTuaqIj0
客日w
2018/11/14(水) 17:39:13.14ID:0a1Q/5jla
>>158
データ型があるんだから必要なら書き換えればいいだろ
161デフォルトの名無しさん (ワッチョイ 9123-maPn)
垢版 |
2018/11/14(水) 18:10:54.53ID:JI+/JYep0
複素ニューラルネットワークでもやってるんかな
2018/11/14(水) 19:05:46.41ID:nZFpv+kvM
>>144
理論でデータ拡張??
いったい何のことを言っているのか例あげてみてよ

>>146
そりゃそうだろ
あいつら理論で遊んでお金貰ってるんだからそれくらい貢献して当然
2018/11/14(水) 19:41:23.92ID:dhjSggB5a
データ水増し(augmentation)の手法なら色々出てるんだから知りたければ自分で調べればよい
2018/11/14(水) 19:47:24.17ID:EJsl/MsX0
複素ニューラルネットはすでにあるよ
2018/11/14(水) 20:32:11.63ID:T3ZbGMtz0
4元数ニューラルネットが熱い
2018/11/14(水) 21:01:56.21ID:nZFpv+kvM
>>163
誰にもの言ってるのそんなの勿論知ってる
それらのうちの一体どれが理論によってなされてるのか教えてって言ってるんだけど
167デフォルトの名無しさん (アウアウエー Sa23-6kU4)
垢版 |
2018/11/14(水) 21:05:17.69ID:tb9I3vf3a
寂しいね
要る/要らないで切り捨てていったら自分の世界がどんどん狭くなるよ
2018/11/14(水) 21:07:06.84ID:8Jgvo+VQa
理論に依らない手法などそもそもどこにあるのか
2018/11/14(水) 22:36:55.64ID:+eDtgQwca
>>166
知らねえよ誰だよお前
2018/11/15(木) 01:34:28.55ID:mQ1OcAlX0
俺じゃねぇよ
2018/11/15(木) 09:12:40.10ID:XHfBsUWU0
俺でもない
172デフォルトの名無しさん (ワッチョイ add2-Wc+1)
垢版 |
2018/11/15(木) 10:18:27.75ID:KWlTqiJ90
>>166
ウソはいかんな。
知らなかったくせに。
ホント馬鹿のくせに「おれは天才だ病」に
かかってる奴は始末におえない。

「おれは馬鹿です」って認めるまで何も教えない。
でも、お前は絶対に認めない。

ヒストグラムと折れ線グラフだけ作ってなさい。
2018/11/15(木) 11:11:22.90ID:DCiYiODPM
>>172
どうやらどこかで調べて理論なんて使ってないって分かったみたいダナ
よく知りもしないのに噛み付くんじゃないゾ
2018/11/15(木) 18:48:01.63ID:9zQYi7BO0
>>172
>>173
ポケモンゲットだぜ!
2018/11/16(金) 11:39:00.25ID:NeZEX1BP0
物体認識(検出)で同一のオブジェクトを再検出したくない場合は、
監視カメラのトラッキングシステムのように対象にIDを採番する方法しか無い?
176デフォルトの名無しさん (ワッチョイ ad23-iFba)
垢版 |
2018/11/16(金) 12:19:01.44ID:9iOixtPe0
>>175
これな
https://twitter.com/R_Nikaido/status/1062874342994849792
https://twitter.com/5chan_nel (5ch newer account)
2018/11/16(金) 16:43:31.67ID:i1XtqtnX0
↓機械学習ブーム終了してた

スイッチ向けにプロセッサーを提供するコンピューター・グラフィックス用半導体メーカーの米エヌビディアは15日、
11月−19年1月期(第4四半期)の売上高は27億ドル(約3070億円)上下2%の見通しと発表。
アナリスト予想の平均34億ドルを下回った。
同社株は時間外取引で急落した。

松井証券の窪田朋一郎シニアマーケットアナリストは、「エヌビディアが好調ではないということは、
スイッチも追加で発注するような状況ではないという連想につながる」と述べた。
2018/11/16(金) 17:19:11.32ID:6gNoWI3x0
特徴選択で単変量統計で選択する場合とランダムフォレストベースで選択する場合で選択され特徴量が全く違うみたいなことってある?
2018/11/16(金) 19:30:53.17ID:ZSBMMnTJM
Tensorflow-gpuてオンボードグラフィックでもうごくのなインテルなのに
CUDAいれるときはGPUつんでたけど
2018/11/16(金) 20:17:05.88ID:28YKar3B0
>>175
objectのlocalizationもしたいんだよね?
画像処理技術の延長だとfmapのvariance分布を追っかけてtraceしてたけどSSDとかを使えばIDなんて要らないと思うよ
要するに無数に切ったDefaultBoxの数と大きさをobjectを囲むBBに合うようにloss計算してるだけ
2018/11/16(金) 20:24:55.93ID:28YKar3B0
なんか質問に対して答えが変なきがするので追伸
検出したBBのfmapのvariance peakをmaskにしてかくvarianceから差っ引いていけば重複なく数えられると思うけど
多重ガウス分布ってfilter波形の線形合成で表現できうるので
2018/11/16(金) 20:57:12.57ID:RbILDIJv0
仮想通貨のマイニングブームが終わった影響じゃね
2018/11/17(土) 09:28:07.28ID:jtHL1PLn0
>>182
マイニングって原理上、投入計算量に対して得られる対価がどんどん減ってくけど、
そのうち誰もマイニングしなくなって、仮想通貨システムの決済処理自体が
立ち行かなくなっちゃったりしないのかね

それともマイニングで儲けた人がちゃんと仮想通貨自体が永らえるように
儲けでなくてもマイニングはし続けて決済処理がちゃんと動き続けるようにするから
大丈夫ってことなのかね
2018/11/17(土) 09:41:36.30ID:kGZHHN0B0
マイナーの損益分岐点になるとさっさと売り払って終了のお知らせだな
使うと減るような種類の仮想通貨もあるから一歩進めて
使うたびに手数料的に減少していけば新規採掘が復活して長期的に運用できるだろうな
そういうのはビットコインにはないみたいだな
2018/11/17(土) 09:44:19.34ID:RvXfWtBW0
マイナーが売りに出した中古のGPU手に入れようとかセコいこと考えてたの思い出した
2018/11/17(土) 09:54:41.35ID:5+y3oyzEa
仮想通貨=マイニング、ではないから
あくまで信用を担保する一つの手段に過ぎない
2018/11/19(月) 03:44:45.57ID:7tD1Zi0/0
これって対応OSはLinux?
ラズパイ程度のハードで使えるのかな?

インテル、第2世代のUSB型AIデバイス「Neural Compute Stick 2」発表
https://japan.zdnet.com/article/35128696/
2018/11/19(月) 15:07:26.49ID:PWIvuQ5W0
https://www.switch-science.com/catalog/4104/
189デフォルトの名無しさん (スププ Sdea-SsFl)
垢版 |
2018/11/19(月) 15:08:45.10ID:Fc1yXpHNd
以下のサイトのAIに意識を持たせる
ロボマインド・プロジェクトをどう思いますか?
https://robomind.co.jp
190デフォルトの名無しさん (ラクペッ MM95-r218)
垢版 |
2018/11/19(月) 16:04:57.55ID:DhS6By/iM
>>189
ウイルス
ISILの首切断画像
2018/11/19(月) 22:38:41.35ID:5u6R6+DF0
>>189
ただの嘘つき
2018/11/19(月) 22:47:46.67ID:8M2nqXSQ0
>>189
グロ
と書くのよん
2018/11/20(火) 05:46:27.74ID:wDih0k1M0
>>188
ありがと
> OS support
>Ubuntu 16.04.3 LTS (64 bit),Windows 10 (64 bit), or CentOS 7.4 (64 bit)
2018/11/20(火) 11:50:34.96ID:WP3U01ry0
>>189
新井教授への苦言は同意

この女教授、袋叩きにあってるな
195デフォルトの名無しさん (トンモー MMb9-MC99)
垢版 |
2018/11/20(火) 12:47:35.12ID:3fX3tYLNM
>>189
どうせ在日系が
パチンコ屋の収益(勿論脱税)にて
作ったIT企業だろ?

在日パチンコ屋ときたら
皆揃って損正義のマネ
196デフォルトの名無しさん (JP 0Hb9-tFKy)
垢版 |
2018/11/21(水) 12:16:14.41ID:44rc7ti9H
元々大した業績もないのに
妙に重宝されてるのが新井某
誰かの愛人?
2018/11/21(水) 19:10:19.36ID:3ezvdPIj0
予算を取る企画をつくるのが超絶に上手い
研究者より商売人のほうが向いてるのでは
2018/11/21(水) 19:30:19.70ID:LJteVHGBd
この分野、日本の研究者なんているのか
2018/11/21(水) 19:54:28.91ID:wvl//PDF0
いることはいるけど数が少なすぎるのとアメリカ様に完全に差をつけられてしまっている
2018/11/21(水) 20:04:41.49ID:hT2VdLLV0
お前らもgoogleブラックホールに飲み込まれますように。健勝を祈る
2018/11/21(水) 20:17:18.64ID:cHcb5oFj0
はなからGOOGLE様の手の中で踊っているだけ
2018/11/21(水) 20:31:26.96ID:KrKtdOIw0
>>187
届いた。2はまだラズパイには対応してない。
IntelのOpenVinoという環境で動作させるが、demoプログラムはintel cpu,intel gpu,Movidius,FPGAを容易に切り替えて試せる。
i3-8100とMovidius2を切り替えて試したがi3が数倍早い。
2018/11/21(水) 21:31:30.23ID:rDv5gjmyd
>>199-201
そうなのか、寂しいね…
2018/11/21(水) 22:01:14.61ID:pdIlKffL0
参考書ばっか読んでて実践らしい事なんもしてなかったからkaggle登録した
きっといい結果出なくて自分の勉強が無に帰す事になりそうで怖いけど頑張るわ
2018/11/21(水) 22:14:36.33ID:dkEaKjFA0
>>199
アメリカ様にっていうか、今の機械学習は大量のデータが必要なのでプラットフォームを押さえてデータを収集してるGAFAが強くなるのは当たり前
もちろんAI研究予算とかの話もあるけどそれ以前の環境作りで負けてる
新井先生は機械学習界隈ではなぜか評判悪いけど日本がアメリカみたく大量のデータを集められることはこれからもないだろう、などちゃんと現状分析して少データから学習できる手法の研究に舵を取るなどしてる
東ロボについて書いた本とか食わず嫌いせずにちゃんと読むと結構納得するところあるよ
2018/11/21(水) 22:24:14.66ID:hT2VdLLV0
東ロボデータセットでレッツチャレンジ!
2018/11/22(木) 00:44:46.72ID:R0V4iNwva
GAFAが強いって言ってもその対象分野は割と限られているので、専門性の高いデータを持っているメーカーならそのメーカーの専門分野での勝負なら十分対抗できる
なのでいわゆるIT系ではなくメーカー所属で機械学習やる方が楽しいと思う
2018/11/22(木) 08:40:58.06ID:8z5F93RV0
それが出来るなら一番面白いだろうね
209デフォルトの名無しさん (ドコグロ MMdf-uNjn)
垢版 |
2018/11/22(木) 10:23:39.44ID:Dp6DNPrbM
初歩的な質問なのですが、
過去のデータから未来を予想するという点で、
統計学と機械学習は似てると思うのですが、
なぜ、皆んな機械学習ばかり取り上げて統計学を取り上げないのですか?
データの豊富な時代だから分析が盛んになる事は分かりますが、
ならば統計学はダメですか?
2018/11/22(木) 10:24:39.28ID:sBqbuYGy0
異常検知ばっかりになりそうな気も
クラスタリングもあるか
2018/11/22(木) 10:42:17.70ID:nCpAPoMI0
>>207
コマツの工事車両が備えたセンサーを通信で収集して異常検知した事例とか、メーカーの工場でセンサーを張り巡らせて歩留まりを向上させるとか、そういうイメージの話?
2018/11/22(木) 10:45:14.87ID:sBqbuYGy0
高速道路の橋脚の疲労具合を動画撮って解析するのもあったね
2018/11/22(木) 11:09:30.23ID:HXxD15nn0
>>209
統計学を理解していないものが作ったモデルの特性を理解出来ないでしょう。統計学は必須スキルだよ。表面的な作業だけ覚えても通用しませんよ。
214デフォルトの名無しさん (トンモー MMe7-jBwB)
垢版 |
2018/11/22(木) 12:43:39.09ID:hODsVz+kM
>>209
機械学習の基本は統計学です。
しかし統計学はとても難しい学問です。
(つまり機械学習もその基本は本当はとても難しい)

現状は、統計学を知らないデータサイエンティストがほとんどです。

ですのでもし勉強できる機会があれば、
将来に備えて少しずつでも統計学を勉強される
ことをおススメします。
独学は難しいので、大学、大学院の授業を
受けたほうが良いです。
215デフォルトの名無しさん (ワッチョイ 83b3-+eFV)
垢版 |
2018/11/22(木) 13:18:52.84ID:hXV3DCtX0
209ですが、統計学を知らないと基礎が分からないということなので、そういう方は既存の機械学習の手法を運用する事しかできず労働市場では評価は頭打ちということですよね?
つまり基礎の仕組みが分かってないから、既存の仕組みの問題点を改善することはできないですし。また、結果の解釈や適応する手法が妥当か分からないわけでしょうし。
216デフォルトの名無しさん (ワイーワ2 FFdf-OXRW)
垢版 |
2018/11/22(木) 13:31:03.32ID:blyr971hF
ベイズ
2018/11/22(木) 13:37:54.86ID:BgqfFBOf0
いわゆる土方止まりかと言えばそうだろうね
ただ客も分かってないからブラックボックスな製品作って機械学習なりAI使ってますって謳えば仕事になるし、客も統計学んでないから結果の解釈もできないし、結果としてこの人は統計学んでるから高い給料払おうという根拠にもならない
2018/11/22(木) 14:51:40.76ID:UaY8qXziM
土方超えるのは論文書いたりしてないといけなさそ
2018/11/22(木) 14:54:04.32ID:GAFVC88E0
ブームが終われば土方は無用
2018/11/22(木) 15:24:50.61ID:nCpAPoMI0
でも統計学学ぶより個々の案件でちゃんとドメイン知識学んだほうが性能上がりそう

両方が望ましいのは当然として
2018/11/22(木) 15:40:15.79ID:wC8dwCsN0
今後、AIの価値を理解して使いこなせるのはSIじゃなくユーザー企業になるんだろうな
https://tech.nikkeibp.co.jp/atcl/nxt/column/18/00454/00012/
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。