【統計分析】機械学習・データマイニング23
■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん (ワッチョイ 4ba5-Gfzz [112.139.183.180])
垢版 |
2019/02/28(木) 20:07:20.50ID:PNBr8RBB0
!extend:on:vvvvvv:1000:512
機械学習とデータマイニングについて語れ若人


■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング22
https://mevius.5ch.net/test/read.cgi/tech/1547338417/
VIPQ2_EXTDAT: default:vvvvvv:1000:512:----: EXT was configured
0636デフォルトの名無しさん (トンモー MMe1-x8An [210.142.95.171])
垢版 |
2019/04/10(水) 08:41:40.81ID:Dtz57xGyM
>>633
禿違
0637デフォルトの名無しさん (JP 0He1-Eqc7 [210.251.91.153])
垢版 |
2019/04/10(水) 10:40:49.77ID:lWLoQ9ihH
anacondaて使っている人は多いの?
最適化されてなさそうで不安なんだけど
0640デフォルトの名無しさん (スップ Sdc3-k9gu [1.72.9.12])
垢版 |
2019/04/10(水) 15:11:40.13ID:aleM+Xhdd
なんか深層学習の凄いアルゴリズムはないですか?
0642デフォルトの名無しさん (ワッチョイ 9d01-1ySe [126.109.69.164])
垢版 |
2019/04/10(水) 19:20:45.40ID:xcPdAU380
画像や動画、音声なんかでdeep learningやろうって話じゃなけりゃscikitlearnで十分だよ。
古いと言えばそうだが逆に言えばライブラリとしては結構枯れてる。
まあただこの仕事に憧れる奴はミーハーだろうからそういうのは好きじゃないんだろうけどな。
0655デフォルトの名無しさん (ワッチョイ 9d01-1ySe [126.109.69.164])
垢版 |
2019/04/10(水) 22:51:35.01ID:xcPdAU380
>>654
そういうツール使ってうまくいくほど世の中のデータベースはスキーマがまともなことはない。
そしてそういう残念な組織ほど一発ツール使って解決しようとしてドツボにはまる。
スキーマがまともな組織な場合はまともなプログラマがいるのでこういうことで悩んだりしないという
ある種のデッドロックツールなんだよ。
0658デフォルトの名無しさん (アウアウウー Sae3-F38n [106.161.116.78])
垢版 |
2019/04/11(木) 05:55:00.73ID:JbjmuqI4a
>>650
役所すらRPAに。
0659デフォルトの名無しさん (エムゾネ FFf2-grM/ [49.106.193.12])
垢版 |
2019/04/11(木) 11:44:01.58ID:bTGeujWNF
pythonは初学者用
もう蛇の時代は終わった
0664デフォルトの名無しさん (トンモー MMfb-Ouf2 [210.142.95.240])
垢版 |
2019/04/11(木) 21:20:07.45ID:OqhcHWodM
>>648
分かる。
ビッグデータ分析といっても
ほとんどの会社では
Excelレべル。

python使ってど一のこ―のってのは
増えてきているが
ツール使うほどじゃない。

ツール使うとキレイな
グラフ描けるというぐらい。

Excel使って月収130万の俺が
言うのだから。
儲かってウハウハ!
0666デフォルトの名無しさん (アウアウイー Saa7-OsDm [36.12.23.55])
垢版 |
2019/04/11(木) 22:46:29.44ID:Fzh9hQBha
そもそも、
利用についての話か
開発についてか
研究についてか
全部がごっちゃになってるので
話があわんよね
0670デフォルトの名無しさん (アウアウエー Sa6a-grM/ [111.239.44.147])
垢版 |
2019/04/12(金) 04:37:48.52ID:S2+S1yfha
ブラックホール観測データからpythonで補間しとった
0671デフォルトの名無しさん (アウアウクー MMa7-QAgd [36.11.224.106])
垢版 |
2019/04/12(金) 04:40:47.15ID:8+fBpsEYM
須山がひよってた
0672デフォルトの名無しさん (アウアウウー Sae3-F38n [106.161.121.189])
垢版 |
2019/04/12(金) 06:48:10.78ID:oYZHGCwYa
>>661 >>659
pythonは遅い。なんでJuliaを使わない。
0673デフォルトの名無しさん (アウアウウー Sae3-F38n [106.161.121.189])
垢版 |
2019/04/12(金) 06:49:02.07ID:oYZHGCwYa
>>667
Flux。
0678デフォルトの名無しさん (アウアウクー MMa7-QAgd [36.11.225.234])
垢版 |
2019/04/12(金) 09:10:07.52ID:rsS9oVcUM
flux?
0680デフォルトの名無しさん (JP 0H02-wT5a [153.145.192.52])
垢版 |
2019/04/12(金) 11:34:48.14ID:Lv2SN3lRH
他言語がpythonと同程度にライブラリやらモジュール群、フレームワークが充実してたらここまでpython一択の状態になってない
てかjulia使ってみたいからjuliaエコシステム構築してけろ
0688デフォルトの名無しさん (ワッチョイ 0682-iXRD [113.20.238.175])
垢版 |
2019/04/14(日) 07:52:58.10ID:hqo19SQo0
フレームワークとライブラリの違いがよくわかりません。
Pythonはフレームワーク?
0690デフォルトの名無しさん (アウアウエー Sa6a-2loy [111.239.216.43])
垢版 |
2019/04/14(日) 08:25:20.18ID:paHu6MVLa
Pythonは言語処理系で、特定のプログラミング言語を解釈して実行する。
フレームワークは文字通り枠組みで、特定のアプリケーションの共通部分
を提供してくれるので、残りの固有の部分を作ればよい。
ライブラリは一般的な機能をまとめたもので、実績のあるものを選ぶことで
ソフトの品質を保ち、テストや開発を効率的する。
敢えて包含関係をつけると Python<ライブラリ<フレームワーク
0691デフォルトの名無しさん (ワッチョイ 0682-iXRD [113.20.238.175])
垢版 |
2019/04/14(日) 08:38:57.40ID:hqo19SQo0
>>684
良さげなサイト。
これを学んだら、G検定合格に結びつく?
0693デフォルトの名無しさん (ササクッテロ Sp67-ngQC [126.33.115.23])
垢版 |
2019/04/14(日) 11:58:50.62ID:AIBmgQB+p
>>692
就活する企業による

既にバリバリ使っていう企業ならもう一歩踏み込んで、どんなモデルで何をやっていたか、ハードウェアはどうしていたのか、なぜPyTorchを選んだのか、など機械学習そのものよりも、どう応用したのかが問われる

一方で全く使っていない企業ではそのレベルでも充分だが、やはり機械学習を使って何をしたのかは問われると思う

ただ、正直新人と機械学習にそこまで期待していないので、インターンとかアルバイトで感触と経験を積むほうが余程良いアピールになる

参考までに自社に機械学習できますで入ってきた新人は
・海外の論文を読んで自分で実装できる
・実際に機械学習で役に立つ何かを作った
・フレームワークの違いを熱く語れる
・FPGAで分類アルゴリズムを実装しました
とレベルは高かったが、入社して活用できているかは疑問
選ぶ会社間違えてないか?と心配になるレベル
0698 ◆QZaw55cn4c (ワッチョイ 7247-yqpC [131.129.112.103])
垢版 |
2019/04/14(日) 14:04:26.57ID:AVvjfIV70
>>696
AI とかは、なんか胡散臭いとどうしても思ってしまっていましたが(そんな人は多いのですかそれとも少ないのですか?)、この記事をみて認識を改めました、まだまだ可能性があると踏んでいる人はいるのですね
0699デフォルトの名無しさん (ワッチョイ 067c-grM/ [113.32.86.138])
垢版 |
2019/04/14(日) 14:11:43.04ID:mqiCDUBh0
「頭の良い人」ほど意外と気付いていないことが多いが
世の中には「AI」より劣る人は大量に存在する
そういうのが一巡して一掃されるまでは続くだろ
0700 ◆QZaw55cn4c (ワッチョイ 7247-yqpC [131.129.112.103])
垢版 |
2019/04/14(日) 14:16:59.66ID:AVvjfIV70
>>699
現在の AI がやっていることよりも少ないことしか考えない人はすくなからずいるってことですか?
たとえば「原発再稼動反対」とか「自衛隊は違憲」の人たちだというのなら、少しだけわかるような気もします
でも私も彼らと似たり寄ったりなのかもしれない、という気もします、なぜなら彼らより考えているという証拠がないから
0705デフォルトの名無しさん (スップ Sd12-iXRD [1.75.0.243])
垢版 |
2019/04/14(日) 16:09:25.55ID:Yn4gqCEld
>>696
見れない。
0715デフォルトの名無しさん (ワッチョイ 6bb0-MiIS [114.164.61.37])
垢版 |
2019/04/14(日) 20:46:53.17ID:ICPBpjQ10
>>714
画像分類なんだけど教師ありと教師なし上司がどっちが良いかも含めて検討しろって言ってた
俺知識が浅いから???ってなったんだけど教師なしで画像分類とかやろうとするとオートエンコーダとか使うんだよね?
多分それのことかなぁ…
0716デフォルトの名無しさん (ワッチョイ 561f-XGqV [153.206.86.82])
垢版 |
2019/04/14(日) 21:06:17.07ID:YhnOXq5E0
>>715
教師ありならラベルの推定をするのが目的だし、教師なしならデータの分布自体を学習したりクラスタリングするのが目的になると思うけど
画像分類っていってるんだからラベルの推定をしたいってことなんだろうね

訓練データに全部ラベルがついているなら教師ありで学習するべきだろうし、
ラベルの付いたデータが少なくてたくさんのラベル無しデータがあるなら
半教師あり学習、PU learningや能動学習を検討すべきじゃないかなと思う
0717デフォルトの名無しさん (ワッチョイ 6bb0-MiIS [114.164.61.37])
垢版 |
2019/04/14(日) 21:36:22.14ID:ICPBpjQ10
>>716
ありがとう
分かりやすい

今はラベル付いてる(自分で付けた)画像で分類出来るか勉強してるんだけど実際現場とかだとNG判別したい画像とかってほぼ取れなくて正常10万枚、不良1枚みたいな割合のデータしか取れないんだけどこういう場合も基本的には教師ありを使うべき?
それとも教師なしみたいな正常と不良の分布とかを学習させた方がいい?
0721デフォルトの名無しさん (スップ Sd12-iXRD [1.75.0.243])
垢版 |
2019/04/15(月) 12:18:17.97ID:64KUE7VLd
機械学習とディープラーニングの違いは
一言で言うと

機械学習は、人間が特徴量を設計しなければいけない。
ディープラーニングは、コンピュータが自動で特徴量を学習する。

これでOKですか?

それで、従来の機械学習は廃れたの?
0722デフォルトの名無しさん (JP 0Hfb-83pk [210.251.91.153])
垢版 |
2019/04/15(月) 12:24:42.63ID:gVz3O2O7H
okじゃないです
0725デフォルトの名無しさん (トンモー MMfb-Ouf2 [210.142.95.250])
垢版 |
2019/04/15(月) 12:49:42.19ID:G98SvtfiM
あまたの分析手法のなかでも
非線形の当てはめチャンピオンが
ディープラーニングと思ってOK?
0727デフォルトの名無しさん (スップ Sd12-iXRD [1.75.0.243])
垢版 |
2019/04/15(月) 17:53:51.19ID:64KUE7VLd
>>726
それなら、SONYのNeural Network Consoleを
使ってみてはどうでしょうか?
0729デフォルトの名無しさん (アウアウエー Sa6a-SPTg [111.239.35.83])
垢版 |
2019/04/15(月) 19:22:34.95ID:zcdYjhdZa
>>721
他の手法も廃れてはいない
ディープラーニングはデータが大量にいるのと精度出すためのチューニングが難しいから
0730デフォルトの名無しさん (ワッチョイ 0682-T1YN [113.20.238.175])
垢版 |
2019/04/15(月) 22:46:58.67ID:uz9dw6bx0
PyTorch、Chainer、Keras、TensorFlow等の
フレームワークとSONYのNNCなら
どちらの方を学んだ方が良いのでしょうか?

また、これらのフレームワークを使っている人から見て
SONYのNNCはどう思われますか?
0731デフォルトの名無しさん (ササクッテロ Sp67-ngQC [126.33.115.23])
垢版 |
2019/04/16(火) 00:07:54.62ID:j2FFrW1Ep
>>730
主観で言うから話半分くらいで聞いてもらえば幸い
SonyのNNCは値段を気にしなくて良いのであれば、かなり良いと思う

例を挙げると、ResnetにSEでバイパスして結果をさらにLSTMに流して〜、なんてのは慣れていてもコードベースだとごちゃごちゃする
また各レイヤーの入出力の次元を常に意識してコード書く必要があるけど、GUIでそのストレスが軽減されるのは大きい
拙いと言われつつも構造最適化機能がありtalos等のパラメータサーチを自分で設定しなくても済むのは便利だ
GUIで線を繋ぐだけなら初心者でも理解可能だけど、kerasだPyTorchだと言うところから始めると敷居が高くとてもそこまでたどり着けない

にも関わらず、なぜ大ブームにならないかと言うと、理由は二つあると考えている
一つは新たなネットワークを設計する業務がそこまで多くない点
もう一つはバックエンドがNNABLAというkerasでもPyTorchでもないマイナーなものである点

ただONNXという共通フォーマットに対応してからしばらく経つのにまだ流行ってないところを見ると、前者のネットワーク設計業務が業務として定着していないのだと思われる
githubで拾ってきたコードを適当に回せばそれなりに仕事として成立するのだろう
0732デフォルトの名無しさん (アウアウカー Sa0f-n39u [182.251.197.177])
垢版 |
2019/04/16(火) 00:36:10.44ID:K2+Uh9uXa
sonyのは素人でもポチポチするだけでできるお手軽ツールだからこれを使いこなすことを目的にしてはならない
なぜなら素人でも使えるものを人よりちょっと使いこなせるのは何の強みにもならないから
何となく雰囲気を掴んで今後更に勉強する前段階とするだけならいいけど
0734デフォルトの名無しさん (アウアウウー Sae3-F38n [106.161.128.161])
垢版 |
2019/04/16(火) 06:46:43.11ID:9W4+pAXwa
初心者ならchainerがおススメ。慣れてからpytorhもkerasもtensorflowもやれ。
0735デフォルトの名無しさん (ワッチョイ 5e66-QAgd [183.77.216.198])
垢版 |
2019/04/16(火) 07:22:30.06ID:eLm86Who0
msのcntkはオワコンなの?
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況