【統計分析】機械学習・データマイニング19
■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん (スッップ Sd12-4l6a)
垢版 |
2018/03/09(金) 18:09:45.75ID:WX3plG2ad

機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング17
http://mevius.5ch.net/test/read.cgi/tech/1502032926/
【統計分析】機械学習・データマイニング18
http://mevius.5ch.net/test/read.cgi/tech/1507807291/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
0101デフォルトの名無しさん (アウアウイー Saad-K54g)
垢版 |
2018/04/05(木) 14:25:59.64ID:ixGsU3Y+a
線形にした方が楽は楽だけどね
0102デフォルトの名無しさん (アウウィフ FF11-6Vn5)
垢版 |
2018/04/06(金) 12:45:26.20ID:sTfZcU1YF
>>98
モデリングと評価関数が勝負だと思う
0103デフォルトの名無しさん (アウアウイー Saad-udMy)
垢版 |
2018/04/06(金) 16:06:04.98ID:j6pN+emAa
>>98
>線形関数のほうで解決出来るケースが多い気が

結果の良し悪しを度外視してみた場合には
扱いも作りも楽だから適用しやすいのでそれは言えるだろう
同じことから汎用性を考えればそういえると思う。

良い結果を求めたいという話(今回はそう書かれていない)になると
話は異なるが、今回は人が線形でという前提になっているので。

もし、計算のアルゴリズム自体をAIが自動的に作成してくれると
なった時には、違うでしょうね。
0104デフォルトの名無しさん (ワッチョイ 2d9f-N9PJ)
垢版 |
2018/04/07(土) 09:22:02.22ID:0BcR5Isf0
AmazonML(Amazon Machine Learning)を使っている人いますか?
0107デフォルトの名無しさん (ワッチョイ 2d9f-X2wr)
垢版 |
2018/04/07(土) 12:41:07.41ID:0BcR5Isf0
使用している方がおられるということなので
ぜひ可能な範囲で教えてください

チュートリアルにモデル構築についてあまり書かれていないのですが
AmazonMLは
・モデル選択不要(最適モデルをAMLから提案)なのでしょうか?
・リアルタイム処理、バッチ処理というのがありますがオンライン学習(逐次学習)にも対応可能でしょうか
・ローカルでRやPythonその他を使った機械学習に比べて使用感はどうでしょうか
・どのような用途で利用しているか(実務 or 学習)
0108デフォルトの名無しさん (ブーイモ MM39-yUBe)
垢版 |
2018/04/08(日) 23:43:29.20ID:heOZ9M9MM
ワイの美人と評判の妹も
AmazonMLに興味あるみたいだから
答えて欲しいだ
0110デフォルトの名無しさん (ワッチョイ 2d9f-X2wr)
垢版 |
2018/04/09(月) 08:42:46.61ID:Vi3qrK/c0
これって自前のデータをkaggleにアップロードして分析可能ということかな
しかもタダで
グーグルさんどんだけ太っ腹なんだと

http://blog.kaggle.com/2018/04/03/q1-2018-product-update/
0112デフォルトの名無しさん (ワッチョイ 4deb-lfby)
垢版 |
2018/04/10(火) 16:46:27.07ID:hrbxCJ/r0
卒論で1年かけてディープラーニングやることになったんですが
テーマをもらっただけで何から手付けていいかもわからない状態です

入力ベクトルあたえたら出力ベクトル出す予測器があって
出力ベクトルに対して誤差とかスコアを設定すると
予測器の中身の関数がかわっていくみたいな?認識であってますか?

JavaかCしかかけないのでその2つでサンプルコードがあったりしませんか?

pythonでデータをつくってライブラリにおくるだけみたいなコードはよくみるんですが
中身の部分の実装が知りたいです

あと何に応用できるかがよくわかってなくて
とりあえず教師無し学習でネット上の文章から知識獲得して勝手にしゃべるようなAIを作るか
教師あり学習の例として何かパズルゲームをとくようなAIを1年かけてつくりたいなーとなんとなく思っています

たとえばゲームをディープラーニングでとかせようと思ったら
ある局面を入力にして出力にはとりうる行動パターンを設定する感じになるんですか?
最終的にとけた場合にしか評価ができないんですけどどういう風に誤差やスコアを設定すればいいんでしょうか

長文になってしまってすいません
参考になるサイトとかがあれば教えていただけるとうれしいです
0113デフォルトの名無しさん (アウウィフ FF11-6Vn5)
垢版 |
2018/04/10(火) 16:58:34.58ID:La3PY+dCF
実装をCとかJavaで造る(車輪の再発明)のが目的なの?
それとも応用する研究?
0115デフォルトの名無しさん (ワッチョイ 4deb-lfby)
垢版 |
2018/04/10(火) 17:51:50.43ID:hrbxCJ/r0
>>113,114
卒研なのでそのへんも自分できめていいんだと思いますけど
最悪ライブラリにデータ流し込んでグラフ描いて適当な考察のせておわりでもいいんですけど
1年あるしプログラムかくのがすきなのでできれば中身をかいて理解したいなーと思ってます
0117デフォルトの名無しさん (ワッチョイ 1551-9DAQ)
垢版 |
2018/04/10(火) 18:00:43.24ID:KJmepPqW0
ライブラリの中身知りたいならゼロから作るdeep learningがCNNまでをライブラリ無しで実装しているのでオススメ
MLやってる絶対に研究室ならあるだろう

強化学習は結果をもとにそれまでの手の評価を行うから最初モンテカルロになるのは仕方ない
alphagoも同じようにランダムに打って結果から評価してるのは同じだけど
評価関数をあらかじめプロの棋譜で学習してるから途中の手筋である程度の収束させてる
0118デフォルトの名無しさん (ワッチョイ 4deb-lfby)
垢版 |
2018/04/10(火) 18:15:43.27ID:hrbxCJ/r0
>>116
画像認識とチャットボットとゲームAIあたりがいまうまくいってるみたいで
何かサンプルプログラムできたらなーってぐらいです

ちょっとゲームAIに応用するならどうなるのかなって考えてるところで
入力の与え方は分かるんですけど
出力と誤差の設定の仕方がわからなくて…

たとえばマインスイーパーをとかせるとかだったら
盤面情報を入力ベクトルにして 出力に開くマス「X,Y」とかを設定すればいいんでしょうか?
その場合フィードバック誤差は爆弾をふんだ時点で-1 クリアまでいったら1とかにすればいいんでしょうか?

プログラムで誤差の逆伝播でニューロン関数のチューニングを実装すれば

利用者は入力出力誤差のエンコードだけやれば
あとニューロンの関数チューニングは勝手にやってくれていつのまにかAIができてるって感じになるはずなんですよね?


>>117
ありがとうございます
書籍なんですね
4000円もするの手が出ないので研究室にないか明日みてみます
なければ図書館さがしてみます
0119デフォルトの名無しさん (JP 0H39-yszm)
垢版 |
2018/04/10(火) 18:16:15.47ID:/0MVXGJYH
頭悪そうな卒研。。。
0120デフォルトの名無しさん (ワッチョイ 4deb-lfby)
垢版 |
2018/04/10(火) 18:18:09.78ID:hrbxCJ/r0
ごめんなさい
やっぱりちょっと1週間程度できまったテーマでいきなり質問できるレベルじゃなかったかも
数ヶ月ほど勉強してからでなおしてきます
レベル低い質問してすいませんでした
0121デフォルトの名無しさん (ワッチョイ cab0-iub2)
垢版 |
2018/04/10(火) 18:22:48.64ID:11DxGTe30
ゲームのAIはA*アルゴリズムとか習うんじゃね
テーマとしてディープラーニングが与えられるんなら、これまでに機械学習とか人工知能の授業があったろうに、いろいろ設定がおかしいよ
0122デフォルトの名無しさん (ワッチョイ 4deb-lfby)
垢版 |
2018/04/10(火) 18:44:00.03ID:hrbxCJ/r0
A*って将棋とか相手のいるゼロサム対戦ゲームで枝狩りする探索アルゴリズムじゃないです?
もちろんルールをコーダーが理解して最適なプログラムくめば一瞬ですけどAIっていうんですか?

ルールを直接コーディングせずにクリアできたかできないかって情報だけで
勝手にルールを理解してとけるようになるってのが機械学習だと思ってました

マインスイーパーを例に出したのは知ってる中ではそこそこお手ごろだったからなので
ディープである必要はないかもしれないです
0123デフォルトの名無しさん (ワッチョイ c68a-b3Lf)
垢版 |
2018/04/10(火) 18:54:11.42ID:9HXtDByf0
>>112

>>入力ベクトルあたえたら出力ベクトル出す予測器があって
出力ベクトルに対して誤差とかスコアを設定すると
予測器の中身の関数がかわっていくみたいな?認識であってますか?

いんじゃね
0124デフォルトの名無しさん (スッップ Sdea-d6AS)
垢版 |
2018/04/10(火) 18:56:43.41ID:9QoCk6hTd
ゲームAIは全然詳しくないから全然アドバイスできないけど
Deep Q Networkとか流行りすぎてqiitaにまとめられた記事大量にあるからそれ読んでみたら?
強化学習は使うだけならkeras-rlとかchainer-rlみたいな超便利なライブラリもあるから
0128デフォルトの名無しさん (アウアウエー Sab2-6Vn5)
垢版 |
2018/04/11(水) 01:16:43.90ID:5V3NvSPIa
>>118
上手く行くのが判ってるのをやっても価値がない論文
0129デフォルトの名無しさん (ワッチョイ 8680-Wnoo)
垢版 |
2018/04/11(水) 05:21:58.71ID:jfPKheqL0
以下はアルゴリズム

ダイクストラ法と、その派生のA*

グラフ/ネットワーク理論系の、NetworkX

計算時間が何百億年も掛かるのが、数秒で解けた
「おねえさんの問題」で有名な、
湊真一の超高速グラフ列挙アルゴリズム ZDD
0134デフォルトの名無しさん (ワッチョイ 0a23-lfby)
垢版 |
2018/04/11(水) 22:33:39.26ID:IkpyBl2P0
盤面入力に負値を使うと活性化関数でハマるからおすすめしない
囲碁やオセロなら入力盤面を2枚以上にして、白と黒を別々の盤面の0/1で入力するのが定番だと思う

学習中のAIは重複打ちをすることもあるから、さらに打てる場所用の入力盤面を追加したり
特定の場所に注目する様な盤面を足すこともあると思う
計算処理の実装よりも、モデルやパラメータの作り直しの方が大変かもしれない
0137デフォルトの名無しさん (スププ Sd1f-SNGu)
垢版 |
2018/04/12(木) 18:56:33.45ID:9og11/aSd
機械学習で、おっぱい触らせてとかエロい口説き実装出来ますか?
0142デフォルトの名無しさん (アウアウエー Sadf-Mqc2)
垢版 |
2018/04/17(火) 04:00:15.15ID:QMWYQNUea
日経ソフトウェアが別冊付録付きでpython機械学習特集になっとった
0143デフォルトの名無しさん (アウアウイー Sa07-1VZ3)
垢版 |
2018/04/18(水) 00:35:10.91ID:a0yVtJaUa
>>141
そういえば、2020年待たずに、ビットコインに絡む電気消費量が
全米の電気消費量を越しちゃうんだって。
ビットコイン無理そうね。
0144デフォルトの名無しさん (アウアウエー Sadf-Mqc2)
垢版 |
2018/04/18(水) 00:47:16.95ID:lRwbg5zIa
ほとんどがエアコン代でさ
ロシアみたいな極地の勝利
0147デフォルトの名無しさん (アウアウウー Sae7-dYNq)
垢版 |
2018/04/18(水) 05:51:00.22ID:wynP20yTa
>>146
恐慌来そう。
0151デフォルトの名無しさん (ワッチョイ 8a73-zSuG)
垢版 |
2018/05/04(金) 01:59:14.34ID:hfkNfFZ10
大学の社会学部で以下のような刷り込みをされた。すなわち、人間関係を非常に重視し、なんでも彼らの中で相談したうえで自身の判断を下すような輩は「他人志向型」で「内面志向型」に比べて程度の低い人間だと。
しかし弱学習器アンサンブルを手中にしている前者の方が正しい判断を下せるのでは?
0153デフォルトの名無しさん (アウアウエー Sa82-XucL)
垢版 |
2018/05/04(金) 02:34:10.65ID:9i+OMC2Ta
前者はAIでも可能
後者が出来るのは人類と宇宙人だけ
0155デフォルトの名無しさん (ワッチョイ bb81-a7mP)
垢版 |
2018/05/04(金) 14:26:05.44ID:KcBJq3t70
某中堅の監査法人に勤めていて、1年ほど前から、人工知能を使った業務の自動化を検討して、
私もそのメンバーに選ばれましたが、私も含め周りの人間も手探り状態です。

大学は商学部出身なので、高校数学からやり直し、大学の線形代数、微分積分、確率
とやってきて、今、統計学(学士以上、修士未満、測度論の手前まで)を一通り学び終わったところです。
資格でいうと、統計検定準1級合格レベル(来月受験予定)、品質管理検定1級、アクチュアリー一次試験・数学合格。

ここまでだと、大学のカリキュラムや資格試験の出題範囲に沿って勉強していけばよかったのですが、
このあと、機械学習・データマイニングへと進んでいくには、どういうカリキュラムを組んで良いか途方に暮れています。
何か道しるべになるようなサイトやアドバイスを頂けないでしょうか?
0158デフォルトの名無しさん (ササクッテロラ Sp23-XvOm)
垢版 |
2018/05/04(金) 15:32:47.26ID:UrowMpykp
機械学習なんか数学わからなくても適当にライブラリ突っ込めばなんとかなるだろ
0160デフォルトの名無しさん (ワッチョイ bb81-a7mP)
垢版 |
2018/05/04(金) 15:51:29.33ID:KcBJq3t70
>>158-159
着地点は実装ですが、前提として理論はしっかり学んでいきたいと考えています。

以前にも、コンサルティング会社とシステム会社にオブザーバーをお願いして、
内外のツールの選定作業をしましたが、どれも実務上使い物になるものはありませんでした。
0162デフォルトの名無しさん (ワッチョイ de8a-bITk)
垢版 |
2018/05/04(金) 18:51:16.04ID:bK3Gh0RP0
業務の自動化に費やした時間>通常業務時間
となるのが目に見えてるな。

内部の人間しか細かい要求に答えられないと思われるが、システムの継続と保守を考えたら外注するのがコスト的にベストだよ。
需要に合ったものが出来ないのなら、コミュニケーション不足と考えたほうがよい。
0165デフォルトの名無しさん (スププ Sdaa-L/eJ)
垢版 |
2018/05/04(金) 23:23:35.05ID:LjKjJrNYd
システムの継続と保守ってとこが、無限に金吸い込まれて行くブラックホールになるんだよな。
0166デフォルトの名無しさん (ワッチョイ bb81-a7mP)
垢版 |
2018/05/04(金) 23:58:23.94ID:KcBJq3t70
コメントありがとうございます。
内製か外注かという点については、内部でも会議が重ねられましたが、
情報漏洩防止、株主代表訴訟対策、ノウハウの蓄積、コンサル業務への将来的発展性など
もろもろの諸事情を勘案して情報戦略として、内製ということで決まりました。

今は所内で社内SEを育てようと、私も含めてここ1年間はずっと社内・外部研修&自習学習で、
本業からは外れています。経験者採用もやっていますが、なかなかこの分野での研究実績が優れた人は見つからないですね。
0173デフォルトの名無しさん (アウアウウー Sacf-jSIs)
垢版 |
2018/05/05(土) 12:14:35.24ID:5AtpQsf4a
深層学習の畳み込み層の処理は「畳み込み」じゃなかった件
http://tdual.hatenablog.com/entry/2018/05/02/113110
https://twitter.com/tdualdir/status/991505578311667712
正しくは相互相関 なぜConvolutionalと名付けた まあ、ただの名前だし、数学の用語が誤用させるのはよくある

T2@T_Shuke
微分・積分・統計学を学べばconvolutionは幾度も出てくるけど、勉強してこなかったデータサイエンティスト(笑)はcnnで元来の意味とは異なる畳み込みを先に覚えてしまうということか

tdual@情報幾何
おい。畳み込み層の処理は畳み込みじゃないのかよ。
相互相関かよ。

きくらげ@Kiikurage
最近の「CNNは畳み込みじゃない」論争、なにが発端?
0174デフォルトの名無しさん (アウアウウー Sacf-jSIs)
垢版 |
2018/05/05(土) 12:18:21.17ID:5AtpQsf4a
なんかこえー畳み込みおじさんいて笑う

T2 @T_Shuke
微分・積分・統計学を学べばconvolutionは幾度も出てくるけど、勉強してこなかったデータサイエンティスト(笑)はcnnで元来の意味とは異なる畳み込みを先に覚えてしまうということか

T2 @T_Shuke
できない、やらない、聞く耳を持たない、常に上から目線、大企業病の自称大企業の自称データサイエンティストは業界の面汚しだと自覚してほしい


T2 @T_Shuke
データサイエンティストは確率積分方程式とか勉強するの?


T2‏ @T_Shuke
確率論もさることながら統計学もやらないでデータサイエンティストを騙る人が多くて恐ろしい
0179デフォルトの名無しさん (ブーイモ MMc7-hPxN)
垢版 |
2018/05/05(土) 17:19:15.82ID:3Z0P2vrnM
実際、CNNが畳み込みだと思ってる馬鹿が多いことに呆れるだろ
ここにもいるみたいだけど
まあそれだけディープニューラルネットが馬鹿でもそれなりに使えるようになったってことだけださ
0180デフォルトの名無しさん (アウアウエー Sa82-XucL)
垢版 |
2018/05/05(土) 17:53:07.26ID:JV+fv9fZa
あなたは心の病気だよ
相手が誰でも喧嘩を吹っかけて勝った気にならないと落ち着かない症状
しかしそんな事じゃ本質的な解決を避けてるだけだから
いつまでも満たされずにいつも不安になる
そして不安を一時的に誤魔化す為にまた喧嘩してマウント
DLの事など全く関係が無い
少しでも勝てそうなポイントばっかり探して勝とうとするだろ
負けそうになったらすぐ退散か話題をブチ切り
医者に相談するレベルで異常だよ
少なからずあなたのような人はいるけどいつまでもやってると全員にNGされて一人で絶叫するだけ
以前にも指摘されてたろ
こう書いても無視か絶叫だろうが
何らも会話する要素が無い
知らない人はあなたのコメントに惑わされることもあるだろうが
ウンザリ
0185デフォルトの名無しさん (アウアウエー Sa82-XucL)
垢版 |
2018/05/05(土) 18:52:13.33ID:JV+fv9fZa
いいえ
0188デフォルトの名無しさん (ワッチョイ 8ab0-o04W)
垢版 |
2018/05/05(土) 22:12:18.36ID:fg/m/ffT0
この説明もわかりません
「例えば、8,000人の子供がそれぞれ第5希望まで希望を出すと、5の8,000乗通りの組み合わせが出てきます」
保育園の数をnとするとこども1人あたりの希望のパターンは5通りではなくて n x (n-1) x (n-2) x (n-3) x (n-4) 通りになるように思えるのですが
0191デフォルトの名無しさん (アウアウイー Sa63-yf0G)
垢版 |
2018/05/05(土) 23:46:21.20ID:enzOGVxga
>>184
最適化には見えるが、シンプレックス法を使っているかどうかは
だれがみてもわからないでしょ。
0192デフォルトの名無しさん (アウアウウー Sacf-rBcH)
垢版 |
2018/05/06(日) 06:48:12.43ID:Rzf1X+Soa
>>187
最狭義に解釈したら全脳シュミレーション。
0193デフォルトの名無しさん (ワッチョイ 1fe5-yy75)
垢版 |
2018/05/06(日) 21:32:25.66ID:+C0M/Mi80
ある個人が1日に10回体重を計ったデータが100日分あるとしてください
いわゆるディープラーニングでは、その10個のデータを渡せば特徴量間の関係も織り込んだ予想をしてくれるのでしょうか
それとも最大値と最小値の差や標準偏差といったものを算出して特徴量として使うほうがいいのでしょうか?
0199デフォルトの名無しさん (ワッチョイ 1fe5-yy75)
垢版 |
2018/05/07(月) 09:57:51.89ID:WowDb12P0
>>195
ありがとうございますその方向で始めてみます

>>194, 196, 197
すみません例えが悪すぎました
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況