X



【統計分析】機械学習・データマイニング19
■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん (スッップ Sd12-4l6a)
垢版 |
2018/03/09(金) 18:09:45.75ID:WX3plG2ad

機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング17
http://mevius.5ch.net/test/read.cgi/tech/1502032926/
【統計分析】機械学習・データマイニング18
http://mevius.5ch.net/test/read.cgi/tech/1507807291/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
0479 ◆QZaw55cn4c (ワッチョイ d360-EqDK)
垢版 |
2018/06/12(火) 23:07:13.16ID:QT2PgMnm0
>>478
>それをビッグデータから学ばないと、各データを統合で結ぶだけの古典的計算機に過ぎない
なるほど!

>「○○は△△という意味で□□である」っていう関連を一つの型として学習する必要がある
二項関係から三項関係への進化は、今は出来ていないんじゃないかな?
0480デフォルトの名無しさん (アウアウカー Sa2d-abwI)
垢版 |
2018/06/13(水) 00:31:00.31ID:TuGh0Ju3a
Googleが猫の画像を判別させる人工知能を作るだけのために大量の猫画像を必要としたように、
wikiを作るとしたらその1項目毎に猫画像学習と同等かそれ以上の情報をかき集めて学習させる必要があるわけで
話題のcoinhiveみたいに世界中の各人のPCのリソース借りるような方法でもあれば可能かもしれないが特定の企業内だけで実現するには必要な計算資源が膨大すぎる
0481デフォルトの名無しさん (ワッチョイ 935d-EqDK)
垢版 |
2018/06/13(水) 05:39:50.82ID:HxLnaiGF0
Googleが画像から猫を判断させたのは、教師なしのニューラルネットワークによる学習だよ
AIによる学習結果は、その本質を理解しているという意味じゃない
「検索結果の中からざっくり中央値を取る」ようなもんだ
「〇〇について、どこの誰がいつから始めてこういう成り立ちだ」みたいなWikiっぽいレイアウトに
まとめるだけなら、既存のWebページと電子化されてる書籍だけで足りるかと
もともとWkipedia自体、外部サイトでの記述や書籍による出展が求められるわけで
そうした情報がちょいちょい間違ってたりするのも現状と同じ
0485デフォルトの名無しさん (アウアウカー Sa2d-RiuZ)
垢版 |
2018/06/13(水) 09:32:05.58ID:3yG4G9Yqa
高卒派遣で機械設計やっていますが3年やっても年収300がやっとなので機械学習とPythonを学んで年収500万ぐらいになりたいです
0488デフォルトの名無しさん (アウアウウー Saa5-70wb)
垢版 |
2018/06/14(木) 18:38:38.62ID:asb5qNMla
>>487
pythonって日本では需要が無いのでは。
0492デフォルトの名無しさん (マクド FF29-4dYe)
垢版 |
2018/06/14(木) 22:08:55.21ID:IoiZhxx5F
>>485
マセマみたいな簡単な参考書で、線形代数、微分積分、統計学の知識を大学一年生レベルまで習得
これなら分かる最適化数学、言語処理のための機械学習入門、はじパタ本を読む
プログラミングは、書籍だけで勉強する場合、pythonの参考書を最低五冊
また、英語を勉強して、論文を読めるようにするように

DB、クラウドの知識もほしいし、前処理についても独学しておいた方が採用されやすいだろう
カグルにもチャレンジした方がいいかなあ
あと絶対むずかしい参考書に手を出すな! 絶対だぞ!
0496デフォルトの名無しさん (アウアウカー Sa69-vNYU)
垢版 |
2018/06/15(金) 10:19:15.58ID:bwzthQROa
>>492
ご丁寧にありがとうございます
自宅学習がまるでできないのでまずは基本情報を取って自信をつけてみます
0500デフォルトの名無しさん (アウウィフ FFa5-kbLG)
垢版 |
2018/06/15(金) 16:50:32.46ID:OdSPYtBqF
ステマ乙
0504デフォルトの名無しさん (スッップ Sd62-LJYG)
垢版 |
2018/06/15(金) 23:05:51.25ID:CTrwO2f2d
まあぶっちゃけ、自分が思い浮かぶ程度の手法は、エクセル先生でできちゃうし、実務上はそれをわざわざRやらPythonやらでやるインセンティブもないわけで。
ロジスティック回帰とかそこら辺になりゃ意味あるがあまり機会がない。やらんでなんとなく過ごしてる自分が悪いだけ疑惑はあるけどw

https://twitter.com/ikasanma/status/1007588876251160582
0506デフォルトの名無しさん (アウアウエー Sa4a-kbLG)
垢版 |
2018/06/16(土) 06:02:56.78ID:xpvZKcICa
>>501
背景の緑のマトリックスみたいな画像がpython関係なくてダサすぎる
0507デフォルトの名無しさん (ワッチョイ 427f-gP5V)
垢版 |
2018/06/17(日) 12:29:43.65ID:eEWfV0tw0
Excelは昔から統計分析でも使われてきたし変ではない。

今更と言われるくらいにパイソンも昔から存在したが、注目されるほどではなかった。
パイソンがデータ処理に向いているというのは最近流布されるステマの一種だろう。
インタプリタだからパイソンはデータセットが肥大化すると遅くなるよ。

シティー銀行がデータ分析や人工知能しようが、世界は常に変わるからエキスパート
システムのようなアプリケーションは成功しなかったし、株価予測は原理的にランダムであり
予測不可能なのでAIなどやるだけ無駄。
0508デフォルトの名無しさん (アウアウカー Sa69-s84n)
垢版 |
2018/06/17(日) 12:38:37.62ID:ABBB1USMa
データ量肥大化でpython処理が重くなるというならEXCELの場合重くなるどころか開くことすらできなくなるけどね
むしろEXCELとの比較だけで言えばpython使うなら元データを分割して読み込みなど工夫すれば原理的には元データ量に関する限界はなく処理時間もデータ量に比例するだけ
0512デフォルトの名無しさん (ワッチョイ 2e8a-4dYe)
垢版 |
2018/06/17(日) 18:22:10.11ID:G56WHeGt0
まず、エキスパートシステムは部分的には成功しているぞ
成果が世の目に触れにくいだけだ

そして、パイソンの株式予測は、データが増えれば増えるほど成功する
あんなの最適化数学の延長で十分
0513 ◆QZaw55cn4c (ワッチョイ 2260-m0US)
垢版 |
2018/06/17(日) 22:16:10.89ID:mtjEdwIk0
>>512
>株式予測は、データが増えれば増えるほど成功する
株価が上昇するか、それともアンダーウェートか、それだけでも判定できるのなら大いに役に立ちます!
勝率はどれくらいですか?
0515デフォルトの名無しさん (ワッチョイ 2e81-O6T7)
垢版 |
2018/06/18(月) 02:51:16.57ID:3J8E5iEa0
株価は、あらゆる情報を用いたとしても、日経平均などの平均値を超えられないという、予想が信じられてるんだろ。
日経平均を上回る圧倒的パフォーマンスをだしたとしても、一時的であってたとえば100年、1000年とか長期で測れば平均値に落ち着くといった。
0516デフォルトの名無しさん (ワッチョイ 2e81-O6T7)
垢版 |
2018/06/18(月) 03:03:16.56ID:3J8E5iEa0
株価予測が可能かどうかに関する理論・仮説はこれだ。


効率的市場仮説 - Wikipedia

金融経済学における効率的市場仮説とは、市場は常に完全に情報的に効率的であるとする仮説。
効率的市場仮説に従えば、株式取引は株式を常に公正な価格で取り引きしていて、投資家が株式を安く買うことも高く売ることもできないということになる。
すると、銘柄の選定や市場のタイミングから市場の平均以上の実績を得るのは不可能である。

チリジ・マルワラは、市場に人工知能を搭載したコンピューターのトレーダーが増えるほど市場は効率的になっていくため、
人工知能が効率的経済仮説の理論の適用可能性に影響を与えるのではないかと推論した。

ウォーレン・バフェットは効率的経済仮説に反論していて、特に注目に値する1984年のプレゼン「The Supervisers of Graham-and-Doddsville」において、
世界最高レベルの運用投資会社で働く株式投資家の圧倒的多数は、投資家の成功は運で決まるという効率的経済仮説の主張に反論していると述べた。

マルキールは、プロのポートフォリオマネージャーの3分の2が(1996年までの)30年間にわたってS&P 500指数を越える実績を出せていない
(しかも、ある年に実績が高い人とその次の年に実績が高い人の間の相関は殆どない)ことを示している。
0517デフォルトの名無しさん (ワッチョイ 2e81-O6T7)
垢版 |
2018/06/18(月) 03:14:04.36ID:3J8E5iEa0
自分の考えは、株価予測は不可能という効率的市場仮説はほぼ正しいとおもっていて。
ビル・ゲイツとか、孫正義など個人・組織とかの勝手な思い、欲求で大金が動いたとき、
市場の効率性が崩れ、その瞬間だけはチャンスありという理解。
個人の思いは普通は予測できない。本人自身なら分かってるが・・・
しかしそうすると金持ちは大金動かせて、その正確な予測も自身はできてるので常に稼げることになるがどうか。
0519デフォルトの名無しさん (ワッチョイ 9d7f-zq67)
垢版 |
2018/06/18(月) 04:43:25.86ID:Wq9Wtbin0
すまんスレチだが助けてくれ
JavaやろうとJDKをダウンロードしたんだが
インストールパッケージを開くことが出来ませんでした。
パッケージがアクセスできることを確認してください。
またはアプリケーションベンダーに問い合わせ、このパッケージが
有効なwindowsインストラーパッケージであることを確認してくださいと
書いてある。
どうすればJDKを起動できるんや?
0521デフォルトの名無しさん (アウアウウー Saa5-Kcuf)
垢版 |
2018/06/18(月) 11:29:19.22ID:nG54PYo6a
>>495
pythonも増えているぞ。
0522デフォルトの名無しさん (アウアウウー Saa5-Kcuf)
垢版 |
2018/06/18(月) 11:39:09.39ID:nG54PYo6a
>>501
FRBのモデルはJuliaで作られているのにな。日銀はmaltab。pythonすらでない。
0525デフォルトの名無しさん (ワッチョイ 2e81-O6T7)
垢版 |
2018/06/18(月) 13:02:49.40ID:3J8E5iEa0
>>516
考えてみたところ、日経平均やNYダウや為替レートなどいろいろな要素が多く入ってる程、予測できない一方で。
これに反対してるウォーレン・バフェットの理屈も理解できるな。
特に社長個人に注目して、信念とか哲学とか聞いてみるとか、会社見学して社員教育や社員の熱意、やる気を確認するなどすれば、
いずれ(平均以上に)成長できる会社を発見するのはできそうだからな。
そうなると株価予測というより成功者を見つける事になってくるが、これは同一でいいのか。
0527デフォルトの名無しさん (ワッチョイ c2dc-/RsH)
垢版 |
2018/06/18(月) 15:08:02.72ID:f9z9lWG50
これが、全てな気がする。
>>株価に影響を与える全てのパラメータがあればできる

株の予測に限らず、必要なデータの種類や指標が解らないと、AIは作れない。
対象ジャンルにAIエンジニアが、逐次精通していくのは無理ゲー。
0533デフォルトの名無しさん (マクド FF29-4dYe)
垢版 |
2018/06/18(月) 20:41:34.22ID:qM6KyGSOF
株価予想、デイトレード的なものに機械学習を導入するだけなら
本当か嘘かまでは分からないけどアメリカの方で既に浸透しているらしいな
ネットニュースでちょくちょくそういう話が流れてくる
まだ無理なのは長期の予想の方だろう
0534デフォルトの名無しさん (ワッチョイ 825d-m0US)
垢版 |
2018/06/18(月) 21:14:47.28ID:K8OG2zS60
「こういうデータがこう動いたら株価はこうなる」みたいに明示できるなら機械学習なんて不要だろ
そうじゃなくて、全部AIに任せて「理由は分からんけど色んなデータからこれが買いだ」みたいな
説明するとアホみたいな活用が本来の機械学習の強みだろ
「理解」は放棄して「活用」だけするのが正しい姿だ
「株価の上下」という出力を変えて、「株価の変動にどういった要素が組み合わさったか」という部分を
分析するのは可能かもしれんが、それは経済学に寄与することはあっても株取引には不要な要素
0535デフォルトの名無しさん (ワッチョイ 457f-zq67)
垢版 |
2018/06/18(月) 22:25:42.04ID:KBSMs3cJ0
>>519だがwindows10でJDKをダウンロード、ダウンロード後保存されたJDKを
開こうとしても上記のような文が出てきて開けない
ちなみにウィルソフトは一旦OFFにしたり、オフラインでのダウンロードもしたし
Edge以外でfirefoxを使ったりしてもダメだった
0536デフォルトの名無しさん (ワッチョイ ddc3-/RsH)
垢版 |
2018/06/18(月) 22:29:14.34ID:t1Z/cGuQ0
パターン認識と機械学習(PRML)の輪読資料を公開
2018年06月18日 soneoka education, news, readings
C.M.ビショップ他著「パターン認識と機械学習」の輪読資料の一覧を当サイトで公開しました。
詳細はこちらから

http://deeplearning.jp/deep-learning-day18-2/
0537デフォルトの名無しさん (ワッチョイ ddc3-/RsH)
垢版 |
2018/06/18(月) 22:34:16.76ID:t1Z/cGuQ0
実データで学ぶ人工知能講座(AIデータフロンティアコース)
http://learn-ai.org/about

2018-06-18
平成30年度後期の募集につきましては講座について(応募方法)に掲載しました。
募集期間は7/1(日)〜31(火)となっています。
0540デフォルトの名無しさん (アウアウエー Sa4a-kbLG)
垢版 |
2018/06/19(火) 11:35:08.79ID:tjlbsfDKa
うむ
0547デフォルトの名無しさん (アウアウウー Saa5-Kcuf)
垢版 |
2018/06/19(火) 18:25:11.47ID:UoSE2jcWa
>>546
数理工学は工学にあらずですか?
0550デフォルトの名無しさん (ワッチョイ fd23-hhwW)
垢版 |
2018/06/20(水) 06:01:00.41ID:A6qp7T7E0
任意精度で最小二乗フィットをやろうとしてるのですけど、Mathematica以外の選択肢は
無いのでしょうか?
0552550 (ワッチョイ fd23-hhwW)
垢版 |
2018/06/20(水) 06:30:05.30ID:A6qp7T7E0
>>551
leave-one-out 交差検証での(最小二乗フィットの)限界(何次元迄だいじょうぶか)を
調べたくて…。
でも、(元データの精度はどうなのって点は置いといて)最小二乗フィットの結果に疑義
が起きない様に、106ビット相当の精度の最小二乗フィットでleave-one-out 交差検証すると、
Wolfram Programming LabのFree planだと8次が限界ですた。

1個外したデータでFit[]して、外したやつで誤差を計算して2乗して和を取ってるのですけど、
何かズルする手段があったりするのでしょうか?
0553550 (ワッチョイ fd23-hhwW)
垢版 |
2018/06/20(水) 06:50:00.12ID:A6qp7T7E0
「ここ迄やった」変数を用意して、中間結果を書き込んでやれば、
途中からでも計算を再開出来るのか…。←せこい
0555デフォルトの名無しさん (JP 0H6d-Mt9d)
垢版 |
2018/06/20(水) 12:05:32.30ID:atAnqZTpH
専門鬘した素人な質問だな
0556デフォルトの名無しさん (アウアウウー Saa5-Kcuf)
垢版 |
2018/06/20(水) 13:30:53.08ID:9g08F51Pa
numpyでもScipyでもsklearnでも。
0557デフォルトの名無しさん (スップ Sdc2-EDgZ)
垢版 |
2018/06/20(水) 20:47:03.78ID:Ayz8xeLnd
機械学習に興味ある新参者ですがマスター教えてください。パーセプトロンの説明だと入力値と重みの計算値を1か0で出すと思うのですが、多層ニューラルネットワークの場合は計算値を活性化関数で近似してその値を次の層の入力値にする認識でokですか?
0562550 (ワッチョイ 9f23-V0uZ)
垢版 |
2018/06/21(木) 06:41:28.56ID:sLa7NXD40
>>555
偽術者を自任してますw

>>559>>560
500点位の(x,y)のデータ(単調増加)

>>561
Mathematicaで
xl = x^Range[0, 2] /* = {1, x, x^2} */
Fit[data, xl, x]
みたいな感じ(たぶん厳密解法)。
ttp://reference.wolfram.com/language/ref/Fit.html
0565デフォルトの名無しさん (ブーイモ MM63-4Qk4)
垢版 |
2018/06/21(木) 17:23:12.93ID:a9dvkwoRM
みんなは普段どの手法をメインに使ってるの?

ホントはガウシアンプロセスのほうが適切なのに
ディープラーニングが流行ってるから
クライアントからDL使えって要求とかされない?
0569デフォルトの名無しさん (アウアウカー Sa93-UQC1)
垢版 |
2018/06/21(木) 19:42:40.38ID:EXX5yRvla
>>565
自分がコンサル的な立場でないならそのまま客の要求する手法使えばいい
それで精度が悪くなっても適切にプログラミングされているのならその責任は客にある
逆にコンサルとしての働きも求められる立場なら何が最適なのか説明して説得できなければ駄目
0571デフォルトの名無しさん (アウアウエー Sa7f-kvBu)
垢版 |
2018/06/22(金) 09:52:08.37ID:MYEvMa8Ba
最小二乗法
負荷気にするときは線形補間
0572デフォルトの名無しさん (アウアウウー Sae3-r94P)
垢版 |
2018/06/23(土) 06:10:10.69ID:MybviKnda
>>568
マシン語で書こう。
0575デフォルトの名無しさん (ワッチョイ 1f59-E6HK)
垢版 |
2018/06/25(月) 01:29:33.26ID:7VIxx4ne0
法律的な相談になると思うのですが、
今RPGツクールのような、製作者が作ったものを消費者が遊ぶツール郡を作ってます
その制作の際の素材集めを支援するために、DNNによる画像生成機能を作ろうと思っています
そこで質問なのですが、既存の著作物をそっくりな画像が生成された場合、
権利者から民事的に損害賠償請求や公開差し止め請求をされ、それが通ることがあると思われますか?

1)制作時にキーワードから画像を生成して、その画像データを消費者へ届けるケース
これは製作者が注意を払う責任が出てくると思います
例えば「ネズミ」で「ミッキー」似の絵が出てきたら、それは使ってはいけないと思います

2)製作時にキーワードから画像を生成して、そのキーワードを消費者へ届けるケース
これも、製作時に確認した画像が消費時に現れることが分かっているのであれば、ケース1と同じだと思います
ですが、それが保証されないものだとしたらどうでしょうか?

例えばテスト時には何の変哲もないネズミのキャラクターだったのが、
公開直後のプレイヤーのバージョンでは「ミッキー」になり、
その一週間後のバージョンアップで「ミニー」になったらどうでしょうか?

製作時に消費時のことが分からないケースの延長として、制作と消費が完全に切り離されている場合
例えば制作者はただノベルのようなものを書いて、それを自由に適当なプレイヤーで見てくださいと公開した場合
「ネズミ」という文字で「ミッキー」を表示するプレイヤーがあった場合、プレイヤー側が訴えられるのでしょうか?

そうだとした場合、もし「abcネズミ123」、『ミッキーの具体的容姿説明』、「ミッキー」
というキーワードで「ミッキー」の絵を生成した場合は、どれがセーフでどれがアウトに当たるのでしょうか?
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況