X



【統計分析】機械学習・データマイニング23

■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん (ワッチョイ 4ba5-Gfzz [112.139.183.180])
垢版 |
2019/02/28(木) 20:07:20.50ID:PNBr8RBB0
!extend:on:vvvvvv:1000:512
機械学習とデータマイニングについて語れ若人


■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング22
https://mevius.5ch.net/test/read.cgi/tech/1547338417/
VIPQ2_EXTDAT: default:vvvvvv:1000:512:----: EXT was configured
0693デフォルトの名無しさん (ササクッテロ Sp67-ngQC [126.33.115.23])
垢版 |
2019/04/14(日) 11:58:50.62ID:AIBmgQB+p
>>692
就活する企業による

既にバリバリ使っていう企業ならもう一歩踏み込んで、どんなモデルで何をやっていたか、ハードウェアはどうしていたのか、なぜPyTorchを選んだのか、など機械学習そのものよりも、どう応用したのかが問われる

一方で全く使っていない企業ではそのレベルでも充分だが、やはり機械学習を使って何をしたのかは問われると思う

ただ、正直新人と機械学習にそこまで期待していないので、インターンとかアルバイトで感触と経験を積むほうが余程良いアピールになる

参考までに自社に機械学習できますで入ってきた新人は
・海外の論文を読んで自分で実装できる
・実際に機械学習で役に立つ何かを作った
・フレームワークの違いを熱く語れる
・FPGAで分類アルゴリズムを実装しました
とレベルは高かったが、入社して活用できているかは疑問
選ぶ会社間違えてないか?と心配になるレベル
0698 ◆QZaw55cn4c (ワッチョイ 7247-yqpC [131.129.112.103])
垢版 |
2019/04/14(日) 14:04:26.57ID:AVvjfIV70
>>696
AI とかは、なんか胡散臭いとどうしても思ってしまっていましたが(そんな人は多いのですかそれとも少ないのですか?)、この記事をみて認識を改めました、まだまだ可能性があると踏んでいる人はいるのですね
0699デフォルトの名無しさん (ワッチョイ 067c-grM/ [113.32.86.138])
垢版 |
2019/04/14(日) 14:11:43.04ID:mqiCDUBh0
「頭の良い人」ほど意外と気付いていないことが多いが
世の中には「AI」より劣る人は大量に存在する
そういうのが一巡して一掃されるまでは続くだろ
0700 ◆QZaw55cn4c (ワッチョイ 7247-yqpC [131.129.112.103])
垢版 |
2019/04/14(日) 14:16:59.66ID:AVvjfIV70
>>699
現在の AI がやっていることよりも少ないことしか考えない人はすくなからずいるってことですか?
たとえば「原発再稼動反対」とか「自衛隊は違憲」の人たちだというのなら、少しだけわかるような気もします
でも私も彼らと似たり寄ったりなのかもしれない、という気もします、なぜなら彼らより考えているという証拠がないから
0705デフォルトの名無しさん (スップ Sd12-iXRD [1.75.0.243])
垢版 |
2019/04/14(日) 16:09:25.55ID:Yn4gqCEld
>>696
見れない。
0715デフォルトの名無しさん (ワッチョイ 6bb0-MiIS [114.164.61.37])
垢版 |
2019/04/14(日) 20:46:53.17ID:ICPBpjQ10
>>714
画像分類なんだけど教師ありと教師なし上司がどっちが良いかも含めて検討しろって言ってた
俺知識が浅いから???ってなったんだけど教師なしで画像分類とかやろうとするとオートエンコーダとか使うんだよね?
多分それのことかなぁ…
0716デフォルトの名無しさん (ワッチョイ 561f-XGqV [153.206.86.82])
垢版 |
2019/04/14(日) 21:06:17.07ID:YhnOXq5E0
>>715
教師ありならラベルの推定をするのが目的だし、教師なしならデータの分布自体を学習したりクラスタリングするのが目的になると思うけど
画像分類っていってるんだからラベルの推定をしたいってことなんだろうね

訓練データに全部ラベルがついているなら教師ありで学習するべきだろうし、
ラベルの付いたデータが少なくてたくさんのラベル無しデータがあるなら
半教師あり学習、PU learningや能動学習を検討すべきじゃないかなと思う
0717デフォルトの名無しさん (ワッチョイ 6bb0-MiIS [114.164.61.37])
垢版 |
2019/04/14(日) 21:36:22.14ID:ICPBpjQ10
>>716
ありがとう
分かりやすい

今はラベル付いてる(自分で付けた)画像で分類出来るか勉強してるんだけど実際現場とかだとNG判別したい画像とかってほぼ取れなくて正常10万枚、不良1枚みたいな割合のデータしか取れないんだけどこういう場合も基本的には教師ありを使うべき?
それとも教師なしみたいな正常と不良の分布とかを学習させた方がいい?
0721デフォルトの名無しさん (スップ Sd12-iXRD [1.75.0.243])
垢版 |
2019/04/15(月) 12:18:17.97ID:64KUE7VLd
機械学習とディープラーニングの違いは
一言で言うと

機械学習は、人間が特徴量を設計しなければいけない。
ディープラーニングは、コンピュータが自動で特徴量を学習する。

これでOKですか?

それで、従来の機械学習は廃れたの?
0722デフォルトの名無しさん (JP 0Hfb-83pk [210.251.91.153])
垢版 |
2019/04/15(月) 12:24:42.63ID:gVz3O2O7H
okじゃないです
0725デフォルトの名無しさん (トンモー MMfb-Ouf2 [210.142.95.250])
垢版 |
2019/04/15(月) 12:49:42.19ID:G98SvtfiM
あまたの分析手法のなかでも
非線形の当てはめチャンピオンが
ディープラーニングと思ってOK?
0727デフォルトの名無しさん (スップ Sd12-iXRD [1.75.0.243])
垢版 |
2019/04/15(月) 17:53:51.19ID:64KUE7VLd
>>726
それなら、SONYのNeural Network Consoleを
使ってみてはどうでしょうか?
0729デフォルトの名無しさん (アウアウエー Sa6a-SPTg [111.239.35.83])
垢版 |
2019/04/15(月) 19:22:34.95ID:zcdYjhdZa
>>721
他の手法も廃れてはいない
ディープラーニングはデータが大量にいるのと精度出すためのチューニングが難しいから
0730デフォルトの名無しさん (ワッチョイ 0682-T1YN [113.20.238.175])
垢版 |
2019/04/15(月) 22:46:58.67ID:uz9dw6bx0
PyTorch、Chainer、Keras、TensorFlow等の
フレームワークとSONYのNNCなら
どちらの方を学んだ方が良いのでしょうか?

また、これらのフレームワークを使っている人から見て
SONYのNNCはどう思われますか?
0731デフォルトの名無しさん (ササクッテロ Sp67-ngQC [126.33.115.23])
垢版 |
2019/04/16(火) 00:07:54.62ID:j2FFrW1Ep
>>730
主観で言うから話半分くらいで聞いてもらえば幸い
SonyのNNCは値段を気にしなくて良いのであれば、かなり良いと思う

例を挙げると、ResnetにSEでバイパスして結果をさらにLSTMに流して〜、なんてのは慣れていてもコードベースだとごちゃごちゃする
また各レイヤーの入出力の次元を常に意識してコード書く必要があるけど、GUIでそのストレスが軽減されるのは大きい
拙いと言われつつも構造最適化機能がありtalos等のパラメータサーチを自分で設定しなくても済むのは便利だ
GUIで線を繋ぐだけなら初心者でも理解可能だけど、kerasだPyTorchだと言うところから始めると敷居が高くとてもそこまでたどり着けない

にも関わらず、なぜ大ブームにならないかと言うと、理由は二つあると考えている
一つは新たなネットワークを設計する業務がそこまで多くない点
もう一つはバックエンドがNNABLAというkerasでもPyTorchでもないマイナーなものである点

ただONNXという共通フォーマットに対応してからしばらく経つのにまだ流行ってないところを見ると、前者のネットワーク設計業務が業務として定着していないのだと思われる
githubで拾ってきたコードを適当に回せばそれなりに仕事として成立するのだろう
0732デフォルトの名無しさん (アウアウカー Sa0f-n39u [182.251.197.177])
垢版 |
2019/04/16(火) 00:36:10.44ID:K2+Uh9uXa
sonyのは素人でもポチポチするだけでできるお手軽ツールだからこれを使いこなすことを目的にしてはならない
なぜなら素人でも使えるものを人よりちょっと使いこなせるのは何の強みにもならないから
何となく雰囲気を掴んで今後更に勉強する前段階とするだけならいいけど
0734デフォルトの名無しさん (アウアウウー Sae3-F38n [106.161.128.161])
垢版 |
2019/04/16(火) 06:46:43.11ID:9W4+pAXwa
初心者ならchainerがおススメ。慣れてからpytorhもkerasもtensorflowもやれ。
0735デフォルトの名無しさん (ワッチョイ 5e66-QAgd [183.77.216.198])
垢版 |
2019/04/16(火) 07:22:30.06ID:eLm86Who0
msのcntkはオワコンなの?
0739デフォルトの名無しさん (JP 0Hfb-83pk [210.251.91.153])
垢版 |
2019/04/16(火) 12:55:35.90ID:otCO5u4tH
ディープラーニングでなければならないタスクを抱えている企業は少ないのでは?
0741デフォルトの名無しさん (ワッチョイ 0682-T1YN [113.20.238.175])
垢版 |
2019/04/16(火) 20:36:38.33ID:HdXRcaLp0
日本がAIで勝つために「知の爆縮」を起こす
── 技術は成熟し、コモディティ化する
https://ledge.ai/connectome-design/

なにを言っているのか、さっぱりわからん。

「一気に事業をグロースさせる」とか
「技術はコモディティ化している」とか
「知の爆縮を起こす」とか
なんかそれっぽい言葉をちりばめると
お金が集まる分野なんだろうってことだけはわかる。
0745デフォルトの名無しさん (ワッチョイ d23c-aeu2 [219.98.80.75])
垢版 |
2019/04/17(水) 00:51:28.93ID:nGDWoLvP0
>>731
ネットワーク設計とはどういうことを指摘しているのですか?
0746デフォルトの名無しさん (ササクッテロ Sp67-ngQC [126.33.115.23])
垢版 |
2019/04/17(水) 01:56:35.53ID:UDUN5nb9p
>>745
文字通りニューラルネットワークの設計
新しい課題に適用する場合やチューニングをする際に必要となる

新しい課題では、似たような課題から似たようなニューラルネットワークを組むことから始める
勾配消失してると感じたらバイパスさせたり、過学習に陥りやすいときに適当にdropout挟んだりと、慣れてくるとどこに何をどこに配置すると性能が向上するのかが見えてくる

また上手く行っていたモデルが、入力データが異なると学習がうまくできないことがある
そこでチューニングという作業が発生する
チューニングは前処理を変えたりモデルを変えたりする
モデルを変えたい場合、例えばCNNの畳み込み層とプーリング層を一段深くしてみたり、全結合のニューロン増やしたり、活性化関数をReLUからtanhにしたり、あるいはオプティマイザをadamからadagradに変更したりする
恐ろしいことに、これだけで性能が恐ろしく向上する事が多々あり、理由が分かることのが少ない

このチューニングも含めたビジネスロジックに組み込むための(ニューラル)ネットワークの最終形態を作ることを設計と言っている
0748デフォルトの名無しさん (トンモー MMfb-Ouf2 [210.142.95.77])
垢版 |
2019/04/17(水) 12:50:36.97ID:WckshTj9M
>>734
chainerをやろうとしましたけど、
多変量LSTMのサンプルをいろいろ探しても
いいのが見つかっていません。
どこかアホにも分かるようなサイト教えて下さい!
0749デフォルトの名無しさん (JP 0Hfb-83pk [210.251.91.153])
垢版 |
2019/04/17(水) 19:09:42.27ID:hVcgMCQ3H
データフレームにはベクトルを入れられるの?
0750デフォルトの名無しさん (ワッチョイ 0682-T1YN [113.20.238.175])
垢版 |
2019/04/17(水) 19:38:50.63ID:XEpE4IOT0
以下のブログを読めば
フレーム問題は解決済みと言えますか?

フレーム問題は解決済み −フレーム問題に見る、AI史の闇ー
https://robomind.co.jp/frameproblem/
0755デフォルトの名無しさん (ワッチョイ ff66-emY3 [183.77.216.198])
垢版 |
2019/04/18(木) 05:42:33.05ID:AMebxmaN0
そうなんだ
埋め込みベクトルは各々の要素を次元別のカラムに展開するのが定石なの?
0758デフォルトの名無しさん (ワッチョイ ff66-6QLb [183.77.216.198])
垢版 |
2019/04/18(木) 20:35:14.64ID:AMebxmaN0
>>757
そうなんだ、ありがとう
0760デフォルトの名無しさん (アウアウクー MM33-Yhte [36.11.224.149])
垢版 |
2019/04/20(土) 16:03:21.89ID:uP7F94RHM
lstmは十分ディープラーニング枠でしょ
0763デフォルトの名無しさん (ワッチョイ dfb6-L8f3 [122.255.141.199])
垢版 |
2019/04/20(土) 18:37:47.85ID:tuvQzCfP0
無料ブログは稼げない。稼ぐならオススメはWordPress一択の理由
https://www.youtube.com/watch?v=o8oUe3JS-lg
【初心者向け】稼げるブログの作り方?アクセスを稼げる記事の書き方とSEOの基礎【発信力強化合宿#2】
https://www.youtube.com/watch?v=CMMmuuGCqtQ&;t=1664s
SNSの基礎的な使い方とツイッターフォロワーを増やす方法
https://www.youtube.com/watch?v=M0TtX_gVR6E
ブログで不労所得1億円!?ブログでお金を稼ぐ仕組みを解説〜イケダハヤトさんはブログで年間1.5億円の収入!
https://www.youtube.com/watch?v=eWw-RfbNP1g&;t=517s
【クラウドソーシング】Webライティングで月商100万円まで稼ぐ方法をプロに解説してもらった!
https://www.youtube.com/watch?v=oYoaBwQt0Cg&;t=345s
1年半でライターの地位を確立した営業術!駆け出しフリーランスは要チェック【ニシキドアヤト】
https://www.youtube.com/watch?v=DFtmkhw-lHM
ブログで1000万円稼ぐ人気ブロガーに実態を聞いてみた!
https://www.youtube.com/watch?v=YaZVpckvtZ4
エンジニアブロガーが教える「ブログで稼ぐ」ために絶対理解すべきこと
https://www.youtube.com/watch?v=Zks-uVfY02I&;t=16s
稼げるブログの始め方をブロガーが解説!副業や不労所得を作る
https://www.youtube.com/watch?v=CHn6tNCYAZM&;t=161s
【学生向け】ブログで月1万円を稼いでいる実例をわかりやすく紹介〜ブログやアフィリエイト入門
https://www.youtube.com/watch?v=mjHp2Fqj9OE&;t=205s
ほりえもんのブログでバカでも1000万以上稼ぐ
https://www.youtube.com/watch?v=hiNby1mxgn4
【初心者向け】ブログ、SNS、YouTubeで「最初の1円」を稼ぐ方法を解説。
https://www.youtube.com/watch?v=DHhQPxIU1qA
大学生がやるべきことは「お金稼ぎ」です【時給労働から抜け出そう】
https://www.youtube.com/watch?v=xlNQzqa7jXA
0765デフォルトの名無しさん (アウアウウー Sa23-6cab [106.180.15.89])
垢版 |
2019/04/20(土) 20:18:01.99ID:8/H9xiiDa
>>764
自分はそう思う
定義なんてないが
0768デフォルトの名無しさん (ワッチョイ ff66-emY3 [183.77.216.198])
垢版 |
2019/04/20(土) 20:32:11.55ID:QgvhEh8P0
は?
0777デフォルトの名無しさん (ワッチョイ 5fad-61/s [124.144.197.178])
垢版 |
2019/04/21(日) 04:55:11.58ID:gW8lsVjX0
計算できないからだよ
0778デフォルトの名無しさん (ワッチョイ ff10-nTKY [153.131.102.129])
垢版 |
2019/04/21(日) 08:06:31.60ID:Z7Ny5UGC0
>>774
中間層を増やすだけでも
それを上手く学習される技術がわからなかった
それを解決できた
0779デフォルトの名無しさん (ワッチョイ ff10-nTKY [153.131.102.129])
垢版 |
2019/04/21(日) 08:08:01.74ID:Z7Ny5UGC0
>>776
自分で少ない層のニューラルネットワークを作って
単純に中間層を増やして動かしてみたら良いよ
0780デフォルトの名無しさん (ワッチョイ 5f40-s4yl [118.104.141.4])
垢版 |
2019/04/21(日) 11:40:50.99ID:X66J/yPd0
ディープラーニングの中間層を大脳のようにランダムに配置したり
伝播をカオス化させたりするのはうまくいかないんでしょうか
新しいものが生まれそうな気がするんですが
そういう研究はあると思うのにネットで検索してもでてこない
0781デフォルトの名無しさん (ワッチョイ ff66-PIYw [183.77.216.198])
垢版 |
2019/04/21(日) 12:01:24.17ID:QxBwEbiO0
fasttextを使ってみて驚いた
標準ライブラリだけでこの速度と精度を実現してるの??
0782デフォルトの名無しさん (ササクッテロ Sp33-Ea22 [126.33.115.23])
垢版 |
2019/04/21(日) 14:34:18.10ID:iN8e06dBp
>>780
今のところ一番近いキーワードはベイジアンネットワークかな
一般的には神経科学を計算機で実現する計算神経科学と呼ばれる分野

バックプロパゲーションは脳内では起きていないと言われていて、今のニューラルネットワークはヒトの脳とはどこか違うらしい
0784デフォルトの名無しさん (トンモー MM83-+96b [210.142.95.159])
垢版 |
2019/04/21(日) 14:54:15.94ID:YKRN8m01M
>>782
昨年発見されて話題になったのは違うの?

人間の脳の解明には
少なくともあと100年
かかると言われてる。

それまで俺は生きていないので
困ってるところ。
0786デフォルトの名無しさん (エムゾネ FF9f-ZG7F [49.106.188.33])
垢版 |
2019/04/21(日) 15:17:24.07ID:X+dVpzWxF
人間はミスが多い
錯覚も多い
勘違いも多い
思い込みで暴走しまくる

人間と同じもの人間の延長で造っても仕方ない
人間を模倣するべきではない
0789デフォルトの名無しさん (アウアウカー Sad3-xt/Z [182.251.196.95])
垢版 |
2019/04/21(日) 16:44:48.50ID:16IUzPjsa
ニューラルネットワーク界隈も元々は人間の脳を再現することを目的としていて
どれだけ実用性があるモデルでも学会では脳の機構とはかけ離れているというだけで拒絶されていたが
今やニューラルネットワークは脳を再現することを目的とするものではなくなっている
0790デフォルトの名無しさん (ワッチョイ ff66-PIYw [183.77.216.198])
垢版 |
2019/04/21(日) 17:09:55.18ID:QxBwEbiO0
https://arxiv.org/abs/1904.05391
バックプロパゲーション的なことは実際には起きてるらしいよ
0791デフォルトの名無しさん (ブーイモ MM83-HEWU [210.149.255.84])
垢版 |
2019/04/21(日) 19:35:02.65ID:Advw4iJHM
>>773
「N層ネットワーク」とは通常入力層を除いたものなのでそれだと2層じゃないかな

http://cs231n.github.io/neural-networks-1/#layers
0792デフォルトの名無しさん (アウアウウー Sa23-6cab [106.180.15.78])
垢版 |
2019/04/21(日) 20:24:16.17ID:bh4LIHDZa
>>782
よくそんなに適当な事書けるな
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況