【統計分析】機械学習・データマイニング19
■ このスレッドは過去ログ倉庫に格納されています
機械学習とデータマイニングについて何でもいいので語れ若人
※ワッチョイだよん
次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね
■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76
■前スレ
【統計分析】機械学習・データマイニング17
http://mevius.5ch.net/test/read.cgi/tech/1502032926/
【統計分析】機械学習・データマイニング18
http://mevius.5ch.net/test/read.cgi/tech/1507807291/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured 目先のお金のために騙すようなことすると、実は大したことやってないとバレた時に信用を失うよ。 2つのデータセットがあって
両方混ぜて学習させるのと片方学習してからもう片方では結果はかなり違う? 進歩はやい分野で昔作ったものをたいしたものじゃなかったと言われても困る 特徴量Xの選択や出力Yの確率分布関数の選択は人間がやっているのに、
それを明確に伝えずに「学習」とだけ素人に言ってしまうと、そこに人間の意志は介在しないと受け止めてしまう。
わかってて伝えていないとしたら、不誠実だよね。 >>41
いやいや14の意見は機械学習の動作原理よく理解していればまともな意見だと思うけど 囲碁将棋でAIに全然勝てないから、俺達の方がバカってことでいいよ 機械学習は単なる統計学の
発展した形っていうのが実情だろよ 『ゼロから作るディープラーニング』のアマゾンレビューを久々に見たが
低評価が目立ってるな…。
あとゼロから作る自然言語処理をテーマにした続編が出るそうだ。 あれは良書だと思ったけど
ハードルを低くしたから変なのが評価しているのかも あーRNN(LSTN)方向にいくんか
kerasでDNNとZQNがよかったな インターフェース 2018年5月号 買った人 or 見た人 いる? 学習用作成したデータの標準化って、要素単位でやるんですよね
配列全体をひとまとめに標準化するんじゃなくて 次元です(体重、身長、性別(ダミー))とあった場合
体重は体重だけで標準化、身長は身長だけで標準化、ダミーはそのまま
に加工すればいいという感じでしょうか 計算は要素単位だろうけど標準化は配列全体をひとまとめに扱わないと無理じゃね 黒木玄 Gen Kuroki
@genkuroki
#統計 #Julia言語
#機械学習 の話を調べると、過学習を防ぐために「適当なところで最適化過程を止める」のような「極めて怪しいこと」(笑)をやっているようです。
その「極めて怪しいこと」(笑)の様子を単純なモデルで見てみたかったので、動画を作ってみました。
添付動画は n=64, d=3 の場合
https://twitter.com/genkuroki/status/977913862560165888/photo/1
#統計 #Julia言語 動画1つ当たりの作成時間は約12秒です。
https://gist.github.com/genkuroki/c440bc748ba230921c1a1f3613053b21 …
http://nbviewer.jupyter.org/gist/genkuroki/c440bc748ba230921c1a1f3613053b21 … >>67
過学習なんて、倒立振子の時代から問題になっていましたよ‥別に新しい話題ではないね‥ >動画1つ当たりの作成時間は約12秒です。
頭に浮かんでから12秒なら凄いけど 機械学習における過学習は、機械学習が出てきたときからあるし。
過学習として考えれば別にこの50年で出てきた話題でもない。
スゲー昔からの話 overfittingの歴史ってどこから始まってるの? 坊やがまだパパの金玉の中で尻尾振って泳いでいた頃からさ カスゴミの異常なまでの噛みつき方は過学習の結果かもしれんぬ >>86
それぐらいディープラーニング普及してるかな?
まあど素人の俺がtensoflowやchainerやkerasいじっているんだから結構普及しているのもな? 「天才」年収1億円で採用 ゾゾ、先端技術の人材募集
http://www.sankeibiz.jp/business/news/180402/bsc1804021958007-n1.htm
AIやビッグデータ処理、ロボット工学といった技術系を中心に、博士号取得者、研究員などから
年収1千万〜1億円の「天才」枠は最大7人。年収400万〜1千万円の「逸材」枠は最大50人
ゾゾの社長ってこの前62億円の絵画を買った人 ちょっと前に
DeNaが儲かっているからってそこに就職するような層が
飛びつくんだろうな >>92
新興のIT企業の場合そもそも永久就職する前提で就職しない
数年で成果上げて次の職場に進むか起業すればいいから就職先は今さえ儲かっていれば特に問題ない 機械学習がいくら人工知能だと持て囃されても
結局は全部誤差関数を最小化してるだけでベイズ推定とか線形回帰から進化してないんだよな まあ、機械学習が人工知能というわけじゃないわな。
機械学習を利用して人工知能を作ったというだけで、人工無能もつくれる。 ディープラーニングよりも
線形関数のほうで解決出来るケースが
多い気がするのはワイだけ? 問題設定によるとしか
画像音声自然言語は無理じゃね >>98
だいたいはそう
しかし事例はまれだか重要なレアケースを拾えなくなる >>98
>線形関数のほうで解決出来るケースが多い気が
結果の良し悪しを度外視してみた場合には
扱いも作りも楽だから適用しやすいのでそれは言えるだろう
同じことから汎用性を考えればそういえると思う。
良い結果を求めたいという話(今回はそう書かれていない)になると
話は異なるが、今回は人が線形でという前提になっているので。
もし、計算のアルゴリズム自体をAIが自動的に作成してくれると
なった時には、違うでしょうね。 AmazonML(Amazon Machine Learning)を使っている人いますか? 使用している方がおられるということなので
ぜひ可能な範囲で教えてください
チュートリアルにモデル構築についてあまり書かれていないのですが
AmazonMLは
・モデル選択不要(最適モデルをAMLから提案)なのでしょうか?
・リアルタイム処理、バッチ処理というのがありますがオンライン学習(逐次学習)にも対応可能でしょうか
・ローカルでRやPythonその他を使った機械学習に比べて使用感はどうでしょうか
・どのような用途で利用しているか(実務 or 学習) ワイの美人と評判の妹も
AmazonMLに興味あるみたいだから
答えて欲しいだ これって自前のデータをkaggleにアップロードして分析可能ということかな
しかもタダで
グーグルさんどんだけ太っ腹なんだと
http://blog.kaggle.com/2018/04/03/q1-2018-product-update/ 卒論で1年かけてディープラーニングやることになったんですが
テーマをもらっただけで何から手付けていいかもわからない状態です
入力ベクトルあたえたら出力ベクトル出す予測器があって
出力ベクトルに対して誤差とかスコアを設定すると
予測器の中身の関数がかわっていくみたいな?認識であってますか?
JavaかCしかかけないのでその2つでサンプルコードがあったりしませんか?
pythonでデータをつくってライブラリにおくるだけみたいなコードはよくみるんですが
中身の部分の実装が知りたいです
あと何に応用できるかがよくわかってなくて
とりあえず教師無し学習でネット上の文章から知識獲得して勝手にしゃべるようなAIを作るか
教師あり学習の例として何かパズルゲームをとくようなAIを1年かけてつくりたいなーとなんとなく思っています
たとえばゲームをディープラーニングでとかせようと思ったら
ある局面を入力にして出力にはとりうる行動パターンを設定する感じになるんですか?
最終的にとけた場合にしか評価ができないんですけどどういう風に誤差やスコアを設定すればいいんでしょうか
長文になってしまってすいません
参考になるサイトとかがあれば教えていただけるとうれしいです 実装をCとかJavaで造る(車輪の再発明)のが目的なの?
それとも応用する研究? C言語で書かれてるライブラリならdarknetがあるけど、実装が目的なの?
応用にしてもどういうアプリケーションができるか教授と相談した方がいいよ >>113,114
卒研なのでそのへんも自分できめていいんだと思いますけど
最悪ライブラリにデータ流し込んでグラフ描いて適当な考察のせておわりでもいいんですけど
1年あるしプログラムかくのがすきなのでできれば中身をかいて理解したいなーと思ってます ディープラーニングをやるだけじゃ何もテーマ決まってないのと同じだよ ライブラリの中身知りたいならゼロから作るdeep learningがCNNまでをライブラリ無しで実装しているのでオススメ
MLやってる絶対に研究室ならあるだろう
強化学習は結果をもとにそれまでの手の評価を行うから最初モンテカルロになるのは仕方ない
alphagoも同じようにランダムに打って結果から評価してるのは同じだけど
評価関数をあらかじめプロの棋譜で学習してるから途中の手筋である程度の収束させてる >>116
画像認識とチャットボットとゲームAIあたりがいまうまくいってるみたいで
何かサンプルプログラムできたらなーってぐらいです
ちょっとゲームAIに応用するならどうなるのかなって考えてるところで
入力の与え方は分かるんですけど
出力と誤差の設定の仕方がわからなくて…
たとえばマインスイーパーをとかせるとかだったら
盤面情報を入力ベクトルにして 出力に開くマス「X,Y」とかを設定すればいいんでしょうか?
その場合フィードバック誤差は爆弾をふんだ時点で-1 クリアまでいったら1とかにすればいいんでしょうか?
プログラムで誤差の逆伝播でニューロン関数のチューニングを実装すれば
利用者は入力出力誤差のエンコードだけやれば
あとニューロンの関数チューニングは勝手にやってくれていつのまにかAIができてるって感じになるはずなんですよね?
>>117
ありがとうございます
書籍なんですね
4000円もするの手が出ないので研究室にないか明日みてみます
なければ図書館さがしてみます ごめんなさい
やっぱりちょっと1週間程度できまったテーマでいきなり質問できるレベルじゃなかったかも
数ヶ月ほど勉強してからでなおしてきます
レベル低い質問してすいませんでした ゲームのAIはA*アルゴリズムとか習うんじゃね
テーマとしてディープラーニングが与えられるんなら、これまでに機械学習とか人工知能の授業があったろうに、いろいろ設定がおかしいよ A*って将棋とか相手のいるゼロサム対戦ゲームで枝狩りする探索アルゴリズムじゃないです?
もちろんルールをコーダーが理解して最適なプログラムくめば一瞬ですけどAIっていうんですか?
ルールを直接コーディングせずにクリアできたかできないかって情報だけで
勝手にルールを理解してとけるようになるってのが機械学習だと思ってました
マインスイーパーを例に出したのは知ってる中ではそこそこお手ごろだったからなので
ディープである必要はないかもしれないです >>112
>>入力ベクトルあたえたら出力ベクトル出す予測器があって
出力ベクトルに対して誤差とかスコアを設定すると
予測器の中身の関数がかわっていくみたいな?認識であってますか?
いんじゃね ゲームAIは全然詳しくないから全然アドバイスできないけど
Deep Q Networkとか流行りすぎてqiitaにまとめられた記事大量にあるからそれ読んでみたら?
強化学習は使うだけならkeras-rlとかchainer-rlみたいな超便利なライブラリもあるから 卒研の後書き
2chのみなさんに感謝いたします(笑) ■ このスレッドは過去ログ倉庫に格納されています