【統計分析】機械学習・データマイニング19

■ このスレッドは過去ログ倉庫に格納されています
2018/03/09(金) 18:09:45.75ID:WX3plG2ad

機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング17
http://mevius.5ch.net/test/read.cgi/tech/1502032926/
【統計分析】機械学習・データマイニング18
http://mevius.5ch.net/test/read.cgi/tech/1507807291/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
2018/03/22(木) 09:42:30.23ID:FQ3BgjEGd
LSTN www
58デフォルトの名無しさん (ワッチョイ f31e-3KaU)
垢版 |
2018/03/22(木) 21:08:47.38ID:cnz2cRXH0
イクッ
59デフォルトの名無しさん (アウウィフ FFc7-OLeD)
垢版 |
2018/03/24(土) 10:30:31.49ID:5hh+Vua5F
インターフェース 2018年5月号 買った人 or 見た人 いる?
2018/03/24(土) 12:36:19.44ID:rGiTAOMN0
トラ技3月号のほうが良かった
2018/03/25(日) 16:08:28.88ID:bspgPbek0
学習用作成したデータの標準化って、要素単位でやるんですよね
配列全体をひとまとめに標準化するんじゃなくて
2018/03/25(日) 16:13:30.28ID:4SsxCrvm0
要素って次元のこと?
2018/03/25(日) 16:14:02.86ID:QFVplulh0
日本語でおk
2018/03/25(日) 16:31:41.77ID:bspgPbek0
次元です(体重、身長、性別(ダミー))とあった場合
体重は体重だけで標準化、身長は身長だけで標準化、ダミーはそのまま
に加工すればいいという感じでしょうか
65デフォルトの名無しさん (アウウィフ FFc7-OLeD)
垢版 |
2018/03/25(日) 16:44:47.42ID:qleen6XJF
計算は要素単位だろうけど標準化は配列全体をひとまとめに扱わないと無理じゃね
66デフォルトの名無しさん (アウアウイー Safb-XrH+)
垢版 |
2018/03/25(日) 20:18:01.15ID:3v6ghT+4a
いや〜あくまで次元単位(変数単位)ですよー
67デフォルトの名無しさん (アウアウウー Sac7-T/rY)
垢版 |
2018/03/26(月) 20:27:20.58ID:9htnWUkpa
黒木玄 Gen Kuroki
‏ @genkuroki
#統計 #Julia言語
#機械学習 の話を調べると、過学習を防ぐために「適当なところで最適化過程を止める」のような「極めて怪しいこと」(笑)をやっているようです。
その「極めて怪しいこと」(笑)の様子を単純なモデルで見てみたかったので、動画を作ってみました。
添付動画は n=64, d=3 の場合
https://twitter.com/genkuroki/status/977913862560165888/photo/1


#統計 #Julia言語 動画1つ当たりの作成時間は約12秒です。

https://gist.github.com/genkuroki/c440bc748ba230921c1a1f3613053b21

http://nbviewer.jupyter.org/gist/genkuroki/c440bc748ba230921c1a1f3613053b21
2018/03/26(月) 20:40:56.60ID:dvRuSlEv0
>>67
過学習なんて、倒立振子の時代から問題になっていましたよ‥別に新しい話題ではないね‥
2018/03/26(月) 21:57:36.14ID:2HAlF+xdd
>>67
宣伝乙
2018/03/27(火) 01:12:23.82ID:SHtV2WZua
>動画1つ当たりの作成時間は約12秒です。

頭に浮かんでから12秒なら凄いけど
2018/03/27(火) 07:23:23.92ID:zMfQcIpl0
wikipediaも自分で書いてそう
72デフォルトの名無しさん (アウアウイー Safb-8l3T)
垢版 |
2018/03/27(火) 07:33:06.76ID:vV8EuPhZa
機械学習における過学習は、機械学習が出てきたときからあるし。
過学習として考えれば別にこの50年で出てきた話題でもない。
スゲー昔からの話
73デフォルトの名無しさん (JP 0H7f-hj1l)
垢版 |
2018/03/27(火) 12:13:00.65ID:XjZTtEz8H
overfittingの歴史ってどこから始まってるの?
2018/03/27(火) 15:38:59.24ID:BLvAxK3CM
坊やがまだパパの金玉の中で尻尾振って泳いでいた頃からさ
75デフォルトの名無しさん (エムゾネ FFba-3KaU)
垢版 |
2018/03/28(水) 13:18:47.89ID:YfKkqZvWF
カスゴミの異常なまでの噛みつき方は過学習の結果かもしれんぬ
2018/03/29(木) 13:29:13.57ID:cPq2jgG9M
過学習さけるなら
ワイはベイズを使う
2018/03/29(木) 14:15:51.54ID:6IJhuxisM
事前確率なんてキンモー☆
78デフォルトの名無しさん (JP 0Hf5-eHYU)
垢版 |
2018/03/29(木) 15:53:16.31ID:M9j0gO7nH
ベイズだと過学習しないんですかあ?
2018/03/30(金) 16:26:12.89ID:INvk5tIRM
ところでお前ら仕事は?
2018/03/30(金) 16:40:46.51ID:TqB3XhjJM
コンピューターがかってに稼いでいるよぉ
2018/03/30(金) 16:55:31.69ID:8JSWoqgK0
掲示板の監視
2018/03/30(金) 16:57:22.08ID:vGjWItk4d
>>79
会社の創立記念日
2018/03/30(金) 17:57:13.08ID:+OinyeqNa
特定した
2018/03/31(土) 04:34:59.46ID:5Kw33orU0
attentionってどうやって実装するの?
85デフォルトの名無しさん (ワッチョイ a11e-HAdz)
垢版 |
2018/04/01(日) 22:08:55.92ID:gioDH3vR0
最近のディープラーニング本で良いのは出たかな?
2018/04/02(月) 09:23:48.39ID:gNr1qMY00
単位が取れるディープラーニング
87デフォルトの名無しさん (アウアウウー Sa45-GTVm)
垢版 |
2018/04/02(月) 09:57:41.70ID:PCwWmODIa
>>86
それぐらいディープラーニング普及してるかな?
まあど素人の俺がtensoflowやchainerやkerasいじっているんだから結構普及しているのもな?
2018/04/02(月) 12:21:50.78ID:tL37NPbv0
すぐわかるディープラーニング
2018/04/03(火) 00:51:21.63ID:CRrW/qfN0
「天才」年収1億円で採用 ゾゾ、先端技術の人材募集
http://www.sankeibiz.jp/business/news/180402/bsc1804021958007-n1.htm
AIやビッグデータ処理、ロボット工学といった技術系を中心に、博士号取得者、研究員などから
年収1千万〜1億円の「天才」枠は最大7人。年収400万〜1千万円の「逸材」枠は最大50人

ゾゾの社長ってこの前62億円の絵画を買った人
90デフォルトの名無しさん (アウアウエー Sa23-HAdz)
垢版 |
2018/04/03(火) 00:59:11.27ID:cU9BUIMsa
博士号取得者、研究員などから
91デフォルトの名無しさん (ワッチョイ a11e-HAdz)
垢版 |
2018/04/03(火) 02:26:45.62ID:GysVjd9F0
逸材が400万かよ。相場だぞ
2018/04/03(火) 07:04:18.68ID:a4DGjJqz0
ちょっと前に
DeNaが儲かっているからってそこに就職するような層が
飛びつくんだろうな
2018/04/03(火) 07:05:13.70ID:cdxCZMeAa
逸材程度で調子に乗るなってことだろ
2018/04/03(火) 07:26:23.24ID:6nr8Epyua
>>92
新興のIT企業の場合そもそも永久就職する前提で就職しない
数年で成果上げて次の職場に進むか起業すればいいから就職先は今さえ儲かっていれば特に問題ない
2018/04/05(木) 02:10:59.76ID:KAa2PFgc0
機械学習がいくら人工知能だと持て囃されても
結局は全部誤差関数を最小化してるだけでベイズ推定とか線形回帰から進化してないんだよな
96デフォルトの名無しさん (ワッチョイ 9d1e-6Vn5)
垢版 |
2018/04/05(木) 05:12:40.32ID:TBCPPalh0
死ね
97デフォルトの名無しさん (アウアウイー Saad-Yntq)
垢版 |
2018/04/05(木) 06:32:01.76ID:hC/Gk2bSa
まあ、機械学習が人工知能というわけじゃないわな。
機械学習を利用して人工知能を作ったというだけで、人工無能もつくれる。
2018/04/05(木) 07:01:28.26ID:GMtlEzTYM
ディープラーニングよりも
線形関数のほうで解決出来るケースが
多い気がするのはワイだけ?
2018/04/05(木) 07:04:43.86ID:KAa2PFgc0
問題設定によるとしか
画像音声自然言語は無理じゃね
2018/04/05(木) 13:26:28.48ID:ioRu1YAR0
>>98
だいたいはそう
しかし事例はまれだか重要なレアケースを拾えなくなる
101デフォルトの名無しさん (アウアウイー Saad-K54g)
垢版 |
2018/04/05(木) 14:25:59.64ID:ixGsU3Y+a
線形にした方が楽は楽だけどね
102デフォルトの名無しさん (アウウィフ FF11-6Vn5)
垢版 |
2018/04/06(金) 12:45:26.20ID:sTfZcU1YF
>>98
モデリングと評価関数が勝負だと思う
103デフォルトの名無しさん (アウアウイー Saad-udMy)
垢版 |
2018/04/06(金) 16:06:04.98ID:j6pN+emAa
>>98
>線形関数のほうで解決出来るケースが多い気が

結果の良し悪しを度外視してみた場合には
扱いも作りも楽だから適用しやすいのでそれは言えるだろう
同じことから汎用性を考えればそういえると思う。

良い結果を求めたいという話(今回はそう書かれていない)になると
話は異なるが、今回は人が線形でという前提になっているので。

もし、計算のアルゴリズム自体をAIが自動的に作成してくれると
なった時には、違うでしょうね。
104デフォルトの名無しさん (ワッチョイ 2d9f-N9PJ)
垢版 |
2018/04/07(土) 09:22:02.22ID:0BcR5Isf0
AmazonML(Amazon Machine Learning)を使っている人いますか?
2018/04/07(土) 10:56:03.90ID:SrnxjvJ5M
おりますん
2018/04/07(土) 11:05:10.37ID:ovt19Khf0
プライム会員ですが何か?
107デフォルトの名無しさん (ワッチョイ 2d9f-X2wr)
垢版 |
2018/04/07(土) 12:41:07.41ID:0BcR5Isf0
使用している方がおられるということなので
ぜひ可能な範囲で教えてください

チュートリアルにモデル構築についてあまり書かれていないのですが
AmazonMLは
・モデル選択不要(最適モデルをAMLから提案)なのでしょうか?
・リアルタイム処理、バッチ処理というのがありますがオンライン学習(逐次学習)にも対応可能でしょうか
・ローカルでRやPythonその他を使った機械学習に比べて使用感はどうでしょうか
・どのような用途で利用しているか(実務 or 学習)
108デフォルトの名無しさん (ブーイモ MM39-yUBe)
垢版 |
2018/04/08(日) 23:43:29.20ID:heOZ9M9MM
ワイの美人と評判の妹も
AmazonMLに興味あるみたいだから
答えて欲しいだ
2018/04/09(月) 00:42:26.88ID:Cpp6LEO80
豊登劇似の妹がナンだって?
110デフォルトの名無しさん (ワッチョイ 2d9f-X2wr)
垢版 |
2018/04/09(月) 08:42:46.61ID:Vi3qrK/c0
これって自前のデータをkaggleにアップロードして分析可能ということかな
しかもタダで
グーグルさんどんだけ太っ腹なんだと

http://blog.kaggle.com/2018/04/03/q1-2018-product-update/
2018/04/09(月) 09:18:12.06ID:6oq5KqBi0
アマゾンのことは荒れ草に聞け
2018/04/10(火) 16:46:27.07ID:hrbxCJ/r0
卒論で1年かけてディープラーニングやることになったんですが
テーマをもらっただけで何から手付けていいかもわからない状態です

入力ベクトルあたえたら出力ベクトル出す予測器があって
出力ベクトルに対して誤差とかスコアを設定すると
予測器の中身の関数がかわっていくみたいな?認識であってますか?

JavaかCしかかけないのでその2つでサンプルコードがあったりしませんか?

pythonでデータをつくってライブラリにおくるだけみたいなコードはよくみるんですが
中身の部分の実装が知りたいです

あと何に応用できるかがよくわかってなくて
とりあえず教師無し学習でネット上の文章から知識獲得して勝手にしゃべるようなAIを作るか
教師あり学習の例として何かパズルゲームをとくようなAIを1年かけてつくりたいなーとなんとなく思っています

たとえばゲームをディープラーニングでとかせようと思ったら
ある局面を入力にして出力にはとりうる行動パターンを設定する感じになるんですか?
最終的にとけた場合にしか評価ができないんですけどどういう風に誤差やスコアを設定すればいいんでしょうか

長文になってしまってすいません
参考になるサイトとかがあれば教えていただけるとうれしいです
113デフォルトの名無しさん (アウウィフ FF11-6Vn5)
垢版 |
2018/04/10(火) 16:58:34.58ID:La3PY+dCF
実装をCとかJavaで造る(車輪の再発明)のが目的なの?
それとも応用する研究?
2018/04/10(火) 17:33:32.31ID:moady95aF
C言語で書かれてるライブラリならdarknetがあるけど、実装が目的なの?
応用にしてもどういうアプリケーションができるか教授と相談した方がいいよ
2018/04/10(火) 17:51:50.43ID:hrbxCJ/r0
>>113,114
卒研なのでそのへんも自分できめていいんだと思いますけど
最悪ライブラリにデータ流し込んでグラフ描いて適当な考察のせておわりでもいいんですけど
1年あるしプログラムかくのがすきなのでできれば中身をかいて理解したいなーと思ってます
2018/04/10(火) 17:53:59.89ID:9QoCk6hTd
ディープラーニングをやるだけじゃ何もテーマ決まってないのと同じだよ
2018/04/10(火) 18:00:43.24ID:KJmepPqW0
ライブラリの中身知りたいならゼロから作るdeep learningがCNNまでをライブラリ無しで実装しているのでオススメ
MLやってる絶対に研究室ならあるだろう

強化学習は結果をもとにそれまでの手の評価を行うから最初モンテカルロになるのは仕方ない
alphagoも同じようにランダムに打って結果から評価してるのは同じだけど
評価関数をあらかじめプロの棋譜で学習してるから途中の手筋である程度の収束させてる
2018/04/10(火) 18:15:43.27ID:hrbxCJ/r0
>>116
画像認識とチャットボットとゲームAIあたりがいまうまくいってるみたいで
何かサンプルプログラムできたらなーってぐらいです

ちょっとゲームAIに応用するならどうなるのかなって考えてるところで
入力の与え方は分かるんですけど
出力と誤差の設定の仕方がわからなくて…

たとえばマインスイーパーをとかせるとかだったら
盤面情報を入力ベクトルにして 出力に開くマス「X,Y」とかを設定すればいいんでしょうか?
その場合フィードバック誤差は爆弾をふんだ時点で-1 クリアまでいったら1とかにすればいいんでしょうか?

プログラムで誤差の逆伝播でニューロン関数のチューニングを実装すれば

利用者は入力出力誤差のエンコードだけやれば
あとニューロンの関数チューニングは勝手にやってくれていつのまにかAIができてるって感じになるはずなんですよね?


>>117
ありがとうございます
書籍なんですね
4000円もするの手が出ないので研究室にないか明日みてみます
なければ図書館さがしてみます
119デフォルトの名無しさん (JP 0H39-yszm)
垢版 |
2018/04/10(火) 18:16:15.47ID:/0MVXGJYH
頭悪そうな卒研。。。
2018/04/10(火) 18:18:09.78ID:hrbxCJ/r0
ごめんなさい
やっぱりちょっと1週間程度できまったテーマでいきなり質問できるレベルじゃなかったかも
数ヶ月ほど勉強してからでなおしてきます
レベル低い質問してすいませんでした
2018/04/10(火) 18:22:48.64ID:11DxGTe30
ゲームのAIはA*アルゴリズムとか習うんじゃね
テーマとしてディープラーニングが与えられるんなら、これまでに機械学習とか人工知能の授業があったろうに、いろいろ設定がおかしいよ
2018/04/10(火) 18:44:00.03ID:hrbxCJ/r0
A*って将棋とか相手のいるゼロサム対戦ゲームで枝狩りする探索アルゴリズムじゃないです?
もちろんルールをコーダーが理解して最適なプログラムくめば一瞬ですけどAIっていうんですか?

ルールを直接コーディングせずにクリアできたかできないかって情報だけで
勝手にルールを理解してとけるようになるってのが機械学習だと思ってました

マインスイーパーを例に出したのは知ってる中ではそこそこお手ごろだったからなので
ディープである必要はないかもしれないです
2018/04/10(火) 18:54:11.42ID:9HXtDByf0
>>112

>>入力ベクトルあたえたら出力ベクトル出す予測器があって
出力ベクトルに対して誤差とかスコアを設定すると
予測器の中身の関数がかわっていくみたいな?認識であってますか?

いんじゃね
2018/04/10(火) 18:56:43.41ID:9QoCk6hTd
ゲームAIは全然詳しくないから全然アドバイスできないけど
Deep Q Networkとか流行りすぎてqiitaにまとめられた記事大量にあるからそれ読んでみたら?
強化学習は使うだけならkeras-rlとかchainer-rlみたいな超便利なライブラリもあるから
2018/04/10(火) 19:24:29.08ID:P62ZV9Ehd
今どきchainer ってw
2018/04/10(火) 20:23:18.13ID:Fy6S2ipf0
卒研の後書き
2chのみなさんに感謝いたします(笑)
2018/04/10(火) 21:52:24.66ID:9HXtDByf0
かつていたが
わざわざ大学入り直してまでやる内容じゃないな
128デフォルトの名無しさん (アウアウエー Sab2-6Vn5)
垢版 |
2018/04/11(水) 01:16:43.90ID:5V3NvSPIa
>>118
上手く行くのが判ってるのをやっても価値がない論文
2018/04/11(水) 05:21:58.71ID:jfPKheqL0
以下はアルゴリズム

ダイクストラ法と、その派生のA*

グラフ/ネットワーク理論系の、NetworkX

計算時間が何百億年も掛かるのが、数秒で解けた
「おねえさんの問題」で有名な、
湊真一の超高速グラフ列挙アルゴリズム ZDD
2018/04/11(水) 06:49:35.77ID:ES2IIxjU0
なんだかんだ言ってちゃんとアドバイスしてくれるのなお前ら

ツンデレかよw
2018/04/11(水) 07:41:24.31ID:5RlOHkDT0
卒研のテーマ与えてやれよ
2018/04/11(水) 09:10:31.26ID:XiDSYsJQH
パーソンオブインタレストに学ぶAI攻撃型AIの設計と実装
2018/04/11(水) 09:46:17.59ID:g6iE9sig0
パーソンオブインタレスト面白かった。もう終わったかな
2018/04/11(水) 22:33:39.26ID:IkpyBl2P0
盤面入力に負値を使うと活性化関数でハマるからおすすめしない
囲碁やオセロなら入力盤面を2枚以上にして、白と黒を別々の盤面の0/1で入力するのが定番だと思う

学習中のAIは重複打ちをすることもあるから、さらに打てる場所用の入力盤面を追加したり
特定の場所に注目する様な盤面を足すこともあると思う
計算処理の実装よりも、モデルやパラメータの作り直しの方が大変かもしれない
2018/04/12(木) 00:27:59.18ID:60CgfxYI0
評価関数の最大化とかではなく少ない計算量で学習させて正解に辿り着くようなアプローチってどっかにないのかな
2018/04/12(木) 08:57:56.93ID:lwgC5/jF0
今まで散々あった
137デフォルトの名無しさん (スププ Sd1f-SNGu)
垢版 |
2018/04/12(木) 18:56:33.45ID:9og11/aSd
機械学習で、おっぱい触らせてとかエロい口説き実装出来ますか?
2018/04/12(木) 19:38:07.95ID:4odEe1Tq0
>>137
>口説き
これはその方法論を知りたいですねえ
2018/04/12(木) 20:29:50.74ID:2UYiGBbD0
物理的に金塊とか見せびらかした方が良さそう
2018/04/13(金) 01:25:28.94ID:tBmigmZW0
>>クソニン
2018/04/13(金) 02:58:25.25ID:4E3ZJNs70
>>137
そのGPUパワーでビットコイン採掘した方が口説ける確率上がると思うw
142デフォルトの名無しさん (アウアウエー Sadf-Mqc2)
垢版 |
2018/04/17(火) 04:00:15.15ID:QMWYQNUea
日経ソフトウェアが別冊付録付きでpython機械学習特集になっとった
143デフォルトの名無しさん (アウアウイー Sa07-1VZ3)
垢版 |
2018/04/18(水) 00:35:10.91ID:a0yVtJaUa
>>141
そういえば、2020年待たずに、ビットコインに絡む電気消費量が
全米の電気消費量を越しちゃうんだって。
ビットコイン無理そうね。
144デフォルトの名無しさん (アウアウエー Sadf-Mqc2)
垢版 |
2018/04/18(水) 00:47:16.95ID:lRwbg5zIa
ほとんどがエアコン代でさ
ロシアみたいな極地の勝利
2018/04/18(水) 00:55:40.56ID:Dd4x2HVr0
量子ドット型コンピュータがあれば一瞬でできる
2018/04/18(水) 04:07:18.73ID:f/lgca7y0
仮装通貨はいずれ規制されそうな予感
147デフォルトの名無しさん (アウアウウー Sae7-dYNq)
垢版 |
2018/04/18(水) 05:51:00.22ID:wynP20yTa
>>146
恐慌来そう。
2018/04/23(月) 22:44:58.44ID:vizp7oCf0
>>147
空売りしようぜ
2018/04/24(火) 13:39:16.09ID:3aoQObwR0
jupyter labとnotebookどっも括弧やクォーテーションの補完が効かないんだけどデフォ?
それともなんかおかしい?
2018/04/24(火) 14:45:08.11ID:QI4dBYy7F
まるちんこ
2018/05/04(金) 01:59:14.34ID:hfkNfFZ10
大学の社会学部で以下のような刷り込みをされた。すなわち、人間関係を非常に重視し、なんでも彼らの中で相談したうえで自身の判断を下すような輩は「他人志向型」で「内面志向型」に比べて程度の低い人間だと。
しかし弱学習器アンサンブルを手中にしている前者の方が正しい判断を下せるのでは?
2018/05/04(金) 02:16:20.57ID:bK3Gh0RP0
知らんがな
153デフォルトの名無しさん (アウアウエー Sa82-XucL)
垢版 |
2018/05/04(金) 02:34:10.65ID:9i+OMC2Ta
前者はAIでも可能
後者が出来るのは人類と宇宙人だけ
2018/05/04(金) 03:04:42.90ID:aUVy4DgX0
ちんちんシュッシュ
155デフォルトの名無しさん (ワッチョイ bb81-a7mP)
垢版 |
2018/05/04(金) 14:26:05.44ID:KcBJq3t70
某中堅の監査法人に勤めていて、1年ほど前から、人工知能を使った業務の自動化を検討して、
私もそのメンバーに選ばれましたが、私も含め周りの人間も手探り状態です。

大学は商学部出身なので、高校数学からやり直し、大学の線形代数、微分積分、確率
とやってきて、今、統計学(学士以上、修士未満、測度論の手前まで)を一通り学び終わったところです。
資格でいうと、統計検定準1級合格レベル(来月受験予定)、品質管理検定1級、アクチュアリー一次試験・数学合格。

ここまでだと、大学のカリキュラムや資格試験の出題範囲に沿って勉強していけばよかったのですが、
このあと、機械学習・データマイニングへと進んでいくには、どういうカリキュラムを組んで良いか途方に暮れています。
何か道しるべになるようなサイトやアドバイスを頂けないでしょうか?
2018/05/04(金) 14:38:42.92ID:6UZD6yO4a
仕事に就けよ
2018/05/04(金) 15:29:34.02ID:Xs/3uOHs0
頭悪い
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況