【統計分析】機械学習・データマイニング19

2018/06/12(火) 22:41:42.13

>>477
むしろそういう「言及」をデータとして扱わないと機械学習の有効性が意味を持たないと思うよ
「○○は△△という意味で□□である」っていう関連を一つの型として学習する必要がある
それをビッグデータから学ばないと、各データを統合で結ぶだけの古典的計算機に過ぎない

◆QZaw55cn4c (ﾜｯﾁｮｲ d360-EqDK) · 2018/06/12(火) 23:07:13.16

>>478
＞それをビッグデータから学ばないと、各データを統合で結ぶだけの古典的計算機に過ぎない
なるほど！

＞「○○は△△という意味で□□である」っていう関連を一つの型として学習する必要がある
二項関係から三項関係への進化は、今は出来ていないんじゃないかな？

2018/06/13(水) 00:31:00.31

Googleが猫の画像を判別させる人工知能を作るだけのために大量の猫画像を必要としたように、
wikiを作るとしたらその1項目毎に猫画像学習と同等かそれ以上の情報をかき集めて学習させる必要があるわけで
話題のcoinhiveみたいに世界中の各人のPCのリソース借りるような方法でもあれば可能かもしれないが特定の企業内だけで実現するには必要な計算資源が膨大すぎる

2018/06/13(水) 05:39:50.82

Googleが画像から猫を判断させたのは、教師なしのニューラルネットワークによる学習だよ
AIによる学習結果は、その本質を理解しているという意味じゃない
「検索結果の中からざっくり中央値を取る」ようなもんだ
「〇〇について、どこの誰がいつから始めてこういう成り立ちだ」みたいなWikiっぽいレイアウトに
まとめるだけなら、既存のWebページと電子化されてる書籍だけで足りるかと
もともとWkipedia自体、外部サイトでの記述や書籍による出展が求められるわけで
そうした情報がちょいちょい間違ってたりするのも現状と同じ

2018/06/13(水) 07:37:49.11

教師なしニューラルネットワーク笑

2018/06/13(水) 07:43:29.10

SOMに教師っていたっけ？

2018/06/13(水) 09:03:40.82

教師なしであってる
somでは無い
ttp://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/en//archive/unsupervised_icml2012.pdf

2018/06/13(水) 09:32:05.58

高卒派遣で機械設計やっていますが3年やっても年収300がやっとなので機械学習とPythonを学んで年収500万ぐらいになりたいです

2018/06/13(水) 09:54:44.45

↑ただの雑務係になるのは目に見えて明らかです

2018/06/13(水) 22:49:23.14

付け焼刃の知識は、年収5000万overの人が作った機械学習自動化ツールに置き換えられそうだ。

というか、年収500万ぐらいならpythonだけでも有るだろ

2018/06/14(木) 18:38:38.62

>>487
pythonって日本では需要が無いのでは。

2018/06/14(木) 19:57:01.42

日本の大企業で機械学習やってますと言ってるところはどういう環境で開発してるんだろう？

2018/06/14(木) 21:04:58.22

一口に機械学習といってもいっぱいあるけどね。

2018/06/14(木) 21:55:19.69

自動制御システムを機械学習という人たちもいるからな

2018/06/14(木) 22:08:55.21

>>485
マセマみたいな簡単な参考書で、線形代数、微分積分、統計学の知識を大学一年生レベルまで習得
これなら分かる最適化数学、言語処理のための機械学習入門、はじパタ本を読む
プログラミングは、書籍だけで勉強する場合、pythonの参考書を最低五冊
また、英語を勉強して、論文を読めるようにするように

DB、クラウドの知識もほしいし、前処理についても独学しておいた方が採用されやすいだろう
カグルにもチャレンジした方がいいかなあ
あと絶対むずかしい参考書に手を出すな！絶対だぞ！

2018/06/15(金) 06:16:57.25

日本語の情報乏しいのって出版不況と関係あるよな

2018/06/15(金) 08:54:59.38

むかしから日本は共有知を軽視してきただろ
今更なに言ってんだ

2018/06/15(金) 10:14:10.38

Ｃ言語入門ならいっぱいあるだろうｗ

2018/06/15(金) 10:19:15.58

>>492
ご丁寧にありがとうございます
自宅学習がまるでできないのでまずは基本情報を取って自信をつけてみます

2018/06/15(金) 10:25:03.32

「〇〇入門」は山ほどあるのにその先を教えるものになると日本語の情報は激減するよな

2018/06/15(金) 14:10:20.02

どうせ、価値ある一次情報は国外からしか出ないから、まず、英語で良い。

新井女史が人工知能の最高峰な国、Japan。
https://booklive.jp/review/list/title_id/493315/vol_no/001

2018/06/15(金) 14:36:03.53

新井女史ｗ

2018/06/15(金) 16:50:32.46

ステマ乙

2018/06/15(金) 20:40:24.15

アナリストの履歴書、シティが高く評価する言語は「Python」
https://www.bloomberg.co.jp/news/articles/2018-06-14/PABKZ66K50XU01

今はやりの言語

2018/06/15(金) 21:30:14.68

>>469
同意。そこらへんのことを本当に知らない人多すぎ。

2018/06/15(金) 21:46:10.67

で、そういう人は具体的に誰？

2018/06/15(金) 23:05:51.25

まあぶっちゃけ、自分が思い浮かぶ程度の手法は、エクセル先生でできちゃうし、実務上はそれをわざわざRやらPythonやらでやるインセンティブもないわけで。
ロジスティック回帰とかそこら辺になりゃ意味あるがあまり機会がない。やらんでなんとなく過ごしてる自分が悪いだけ疑惑はあるけどw

https://twitter.com/ikasanma/status/1007588876251160582

2018/06/16(土) 01:05:12.04

流石にEXCELとPythonは使い道が違いすぎる

2018/06/16(土) 06:02:56.78

>>501
背景の緑のマトリックスみたいな画像がpython関係なくてダサすぎる

2018/06/17(日) 12:29:43.65

Excelは昔から統計分析でも使われてきたし変ではない。

今更と言われるくらいにパイソンも昔から存在したが、注目されるほどではなかった。
パイソンがデータ処理に向いているというのは最近流布されるステマの一種だろう。
インタプリタだからパイソンはデータセットが肥大化すると遅くなるよ。

シティー銀行がデータ分析や人工知能しようが、世界は常に変わるからエキスパート
システムのようなアプリケーションは成功しなかったし、株価予測は原理的にランダムであり
予測不可能なのでAIなどやるだけ無駄。

2018/06/17(日) 12:38:37.62

データ量肥大化でpython処理が重くなるというならEXCELの場合重くなるどころか開くことすらできなくなるけどね
むしろEXCELとの比較だけで言えばpython使うなら元データを分割して読み込みなど工夫すれば原理的には元データ量に関する限界はなく処理時間もデータ量に比例するだけ

2018/06/17(日) 14:39:33.98

Excel推しの人ってみんな言ってることがどこかズレてる印象

2018/06/17(日) 14:50:00.70

無理矢理EXCELでやろうとする奴ほんとアホ

2018/06/17(日) 16:55:01.65

というか、EXCELしか使えないからそれしか選択肢ないんだろう

2018/06/17(日) 18:22:10.11

まず、エキスパートシステムは部分的には成功しているぞ
成果が世の目に触れにくいだけだ

そして、パイソンの株式予測は、データが増えれば増えるほど成功する
あんなの最適化数学の延長で十分

◆QZaw55cn4c (ﾜｯﾁｮｲ 2260-m0US) · 2018/06/17(日) 22:16:10.89

>>512
＞株式予測は、データが増えれば増えるほど成功する
株価が上昇するか、それともアンダーウェートか、それだけでも判定できるのなら大いに役に立ちます！
勝率はどれくらいですか？

2018/06/17(日) 22:59:51.87

株価予測は簡単じゃねえわ
当たり前の話なんだが過去は幾らでも説明できるんだけど
未来は「まだおきていない」ので分からんのだ

2018/06/18(月) 02:51:16.57

株価は、あらゆる情報を用いたとしても、日経平均などの平均値を超えられないという、予想が信じられてるんだろ。
日経平均を上回る圧倒的パフォーマンスをだしたとしても、一時的であってたとえば100年、1000年とか長期で測れば平均値に落ち着くといった。

2018/06/18(月) 03:03:16.56

株価予測が可能かどうかに関する理論・仮説はこれだ。

効率的市場仮説 - Wikipedia

金融経済学における効率的市場仮説とは、市場は常に完全に情報的に効率的であるとする仮説。
効率的市場仮説に従えば、株式取引は株式を常に公正な価格で取り引きしていて、投資家が株式を安く買うことも高く売ることもできないということになる。
すると、銘柄の選定や市場のタイミングから市場の平均以上の実績を得るのは不可能である。

チリジ・マルワラは、市場に人工知能を搭載したコンピューターのトレーダーが増えるほど市場は効率的になっていくため、
人工知能が効率的経済仮説の理論の適用可能性に影響を与えるのではないかと推論した。

ウォーレン・バフェットは効率的経済仮説に反論していて、特に注目に値する1984年のプレゼン「The Supervisers of Graham-and-Doddsville」において、
世界最高レベルの運用投資会社で働く株式投資家の圧倒的多数は、投資家の成功は運で決まるという効率的経済仮説の主張に反論していると述べた。

マルキールは、プロのポートフォリオマネージャーの3分の2が（1996年までの）30年間にわたってS&P 500指数を越える実績を出せていない
（しかも、ある年に実績が高い人とその次の年に実績が高い人の間の相関は殆どない）ことを示している。

2018/06/18(月) 03:14:04.36

自分の考えは、株価予測は不可能という効率的市場仮説はほぼ正しいとおもっていて。
ビル・ゲイツとか、孫正義など個人・組織とかの勝手な思い、欲求で大金が動いたとき、
市場の効率性が崩れ、その瞬間だけはチャンスありという理解。
個人の思いは普通は予測できない。本人自身なら分かってるが・・・
しかしそうすると金持ちは大金動かせて、その正確な予測も自身はできてるので常に稼げることになるがどうか。

2018/06/18(月) 04:10:47.56

株価に影響を与える全てのパラメータがあればできる

2018/06/18(月) 04:43:25.86

すまんスレチだが助けてくれ
ＪavaやろうとＪＤＫをダウンロードしたんだが
インストールパッケージを開くことが出来ませんでした。
パッケージがアクセスできることを確認してください。
またはアプリケーションベンダーに問い合わせ、このパッケージが
有効なwindowsインストラーパッケージであることを確認してくださいと
書いてある。
どうすればＪＤＫを起動できるんや？

2018/06/18(月) 08:54:34.52

>>519
オラクルのサポート契約結べばすぐ解決するよ！

2018/06/18(月) 11:29:19.22

>>495
pythonも増えているぞ。

2018/06/18(月) 11:39:09.39

>>501
FRBのモデルはJuliaで作られているのにな。日銀はmaltab。pythonすらでない。

2018/06/18(月) 12:36:49.05

>>519
まず正確な情報を書く

2018/06/18(月) 12:37:22.66

スレチかｗ

2018/06/18(月) 13:02:49.40

>>516
考えてみたところ、日経平均やNYダウや為替レートなどいろいろな要素が多く入ってる程、予測できない一方で。
これに反対してるウォーレン・バフェットの理屈も理解できるな。
特に社長個人に注目して、信念とか哲学とか聞いてみるとか、会社見学して社員教育や社員の熱意、やる気を確認するなどすれば、
いずれ(平均以上に)成長できる会社を発見するのはできそうだからな。
そうなると株価予測というより成功者を見つける事になってくるが、これは同一でいいのか。

2018/06/18(月) 13:50:29.40

>>525
専スレ立ててそこでやれよ

2018/06/18(月) 15:08:02.72

これが、全てな気がする。
>>株価に影響を与える全てのパラメータがあればできる

株の予測に限らず、必要なデータの種類や指標が解らないと、AIは作れない。
対象ジャンルにAIエンジニアが、逐次精通していくのは無理ゲー。

2018/06/18(月) 15:13:26.33

アメリカのインフレとその後の崩壊に既に仕込んであるのだろうな大手は

2018/06/18(月) 17:28:18.09

データの性質をよく知ってるほど強い
どんな前処理したらいいかわからんし

2018/06/18(月) 17:43:33.58

上海市場なら儲かるかな

2018/06/18(月) 18:51:40.24

株価に影響を与える全てのパラメータがあればって
それあなたインサイダーですわ

2018/06/18(月) 19:17:39.94

確かに、原理的にあらゆる情報があれば予測できるとしても、現実的にはオープンにされたデータのみから予測できなければ合法に使えないな

2018/06/18(月) 20:41:34.22

株価予想、デイトレード的なものに機械学習を導入するだけなら
本当か嘘かまでは分からないけどアメリカの方で既に浸透しているらしいな
ネットニュースでちょくちょくそういう話が流れてくる
まだ無理なのは長期の予想の方だろう

2018/06/18(月) 21:14:47.28

「こういうデータがこう動いたら株価はこうなる」みたいに明示できるなら機械学習なんて不要だろ
そうじゃなくて、全部AIに任せて「理由は分からんけど色んなデータからこれが買いだ」みたいな
説明するとアホみたいな活用が本来の機械学習の強みだろ
「理解」は放棄して「活用」だけするのが正しい姿だ
「株価の上下」という出力を変えて、「株価の変動にどういった要素が組み合わさったか」という部分を
分析するのは可能かもしれんが、それは経済学に寄与することはあっても株取引には不要な要素

2018/06/18(月) 22:25:42.04

>>519だがwindows10でJDKをダウンロード、ダウンロード後保存されたJDKを
開こうとしても上記のような文が出てきて開けない
ちなみにウィルソフトは一旦OFFにしたり、オフラインでのダウンロードもしたし
Edge以外でfirefoxを使ったりしてもダメだった

2018/06/18(月) 22:29:14.34

パターン認識と機械学習（PRML）の輪読資料を公開
2018年06月18日 soneoka education, news, readings
C.M.ビショップ他著「パターン認識と機械学習」の輪読資料の一覧を当サイトで公開しました。
詳細はこちらから

http://deeplearning.jp/deep-learning-day18-2/

2018/06/18(月) 22:34:16.76

実データで学ぶ人工知能講座（AIデータフロンティアコース）
http://learn-ai.org/about

2018-06-18
平成30年度後期の募集につきましては講座について（応募方法）に掲載しました。
募集期間は7/1（日）～31（火）となっています。

2018/06/19(火) 05:43:37.34

宣伝乙

2018/06/19(火) 06:44:01.96

>>536
いいやん、これ

2018/06/19(火) 11:35:08.79

うむ

2018/06/19(火) 13:39:55.91

>>536
SUGEEEEEEEEEEEEEEEEEE!!!
2chなんてくだらないものを見ていて、本当によかった

2018/06/19(火) 16:40:26.36

PRMLで引っかかる人って文系なの？

2018/06/19(火) 16:53:40.38

マウンティング来たー

2018/06/19(火) 16:59:42.02

>>542
自分は数学専攻だけど雑で読みにくい
文系や工学系の人が雰囲気を味わうのに手頃なんだろ

2018/06/19(火) 17:37:00.91

雑ではないだろ、定理証明の形式でないと読めないｗ

2018/06/19(火) 17:43:39.12

微積しか使ってないので工学もへったくれもないｗ

2018/06/19(火) 18:25:11.47

>>546
数理工学は工学にあらずですか？

2018/06/19(火) 18:37:36.67

>>547
たぶん話の文脈を読めてない
工学レベルの数学で十分だろという意味だろ

2018/06/19(火) 19:10:14.07

かぐるたのしい

2018/06/20(水) 06:01:00.41

任意精度で最小二乗フィットをやろうとしてるのですけど、Mathematica以外の選択肢は
無いのでしょうか？

2018/06/20(水) 06:07:26.02

任意精度でフィットって反復解法って意味？

**550** (ﾜｯﾁｮｲ fd23-hhwW) · 2018/06/20(水) 06:30:05.30

>>551
leave-one-out 交差検証での(最小二乗フィットの)限界(何次元迄だいじょうぶか)を
調べたくて…。
でも、(元データの精度はどうなのって点は置いといて)最小二乗フィットの結果に疑義
が起きない様に、106ビット相当の精度の最小二乗フィットでleave-one-out 交差検証すると、
Wolfram Programming LabのFree planだと8次が限界ですた。

1個外したデータでFit[]して、外したやつで誤差を計算して2乗して和を取ってるのですけど、
何かズルする手段があったりするのでしょうか？

**550** (ﾜｯﾁｮｲ fd23-hhwW) · 2018/06/20(水) 06:50:00.12

「ここ迄やった」変数を用意して、中間結果を書き込んでやれば、
途中からでも計算を再開出来るのか…。←せこい

2018/06/20(水) 06:54:22.22

とりあえずＲ使えよ

**デフォルトの名無しさん** (JP 0H6d-Mt9d) · 2018/06/20(水) 12:05:32.30

専門鬘した素人な質問だな

2018/06/20(水) 13:30:53.08

numpyでもScipyでもsklearnでも。

2018/06/20(水) 20:47:03.78

機械学習に興味ある新参者ですがマスター教えてください。パーセプトロンの説明だと入力値と重みの計算値を1か0で出すと思うのですが、多層ニューラルネットワークの場合は計算値を活性化関数で近似してその値を次の層の入力値にする認識でokですか?

2018/06/20(水) 21:40:23.15

おう

2018/06/20(水) 22:47:15.48

何に最少事情でフィットさせるのか分からないことには何とも。

2018/06/20(水) 23:51:58.96

>>552
データ量はどれだけあるの？

2018/06/21(木) 00:12:00.10

あと厳密解法で求めてるの？

**550** (ﾜｯﾁｮｲ 9f23-V0uZ) · 2018/06/21(木) 06:41:28.56

>>555
偽術者を自任してますｗ

>>559>>560
500点位の(x,y)のデータ(単調増加)

>>561
Mathematicaで
xl = x^Range[0, 2] /* = {1, x, x^2} */
Fit[data, xl, x]
みたいな感じ(たぶん厳密解法)。
ttp://reference.wolfram.com/language/ref/Fit.html

2018/06/21(木) 11:09:14.26

>>562
2次多項式にフィッティングさせてるのね。
行列計算で一発で厳密解出るよ。
numpy.polyfit 使えばすぐ計算できる。

2018/06/21(木) 11:12:46.06

あと、leave one outが重い場合はk-fold cross validationする。

2018/06/21(木) 17:23:12.93

みんなは普段どの手法をメインに使ってるの？

ホントはガウシアンプロセスのほうが適切なのに
ディープラーニングが流行ってるから
クライアントからDL使えって要求とかされない？

2018/06/21(木) 17:37:51.71

c++で自作

2018/06/21(木) 19:06:38.32

c++でNN書いたことあるけど不毛だったわ

2018/06/21(木) 19:31:14.49

すまん。Cで書いていたわ
なお、カルマンニューロ本なんてN88BASICで書いてあって
流石に悶絶したわ

2018/06/21(木) 19:42:40.38

>>565
自分がコンサル的な立場でないならそのまま客の要求する手法使えばいい
それで精度が悪くなっても適切にプログラミングされているのならその責任は客にある
逆にコンサルとしての働きも求められる立場なら何が最適なのか説明して説得できなければ駄目

2018/06/22(金) 01:54:46.54

展示会で見たdatarobotってツールが忘れられない

2018/06/22(金) 09:52:08.37

最小二乗法
負荷気にするときは線形補間

2018/06/23(土) 06:10:10.69

>>568
マシン語で書こう。

2018/06/23(土) 06:37:13.07

>>572
アセンブラならともかくマシンコードはオフセット計算が
面倒でな

ef 00 00
c3

2018/06/23(土) 11:33:11.59

>>568
DL（方法論）の指定をしてくる時点で、目的は、結果ではなく、
流行りのAI技術に投資しましたというパフォーマンスでは？

2018/06/25(月) 01:29:33.26

法律的な相談になると思うのですが、
今RPGツクールのような、製作者が作ったものを消費者が遊ぶツール郡を作ってます
その制作の際の素材集めを支援するために、DNNによる画像生成機能を作ろうと思っています
そこで質問なのですが、既存の著作物をそっくりな画像が生成された場合、
権利者から民事的に損害賠償請求や公開差し止め請求をされ、それが通ることがあると思われますか？

１）制作時にキーワードから画像を生成して、その画像データを消費者へ届けるケース
これは製作者が注意を払う責任が出てくると思います
例えば「ネズミ」で「ミッキー」似の絵が出てきたら、それは使ってはいけないと思います

２）製作時にキーワードから画像を生成して、そのキーワードを消費者へ届けるケース
これも、製作時に確認した画像が消費時に現れることが分かっているのであれば、ケース１と同じだと思います
ですが、それが保証されないものだとしたらどうでしょうか？

例えばテスト時には何の変哲もないネズミのキャラクターだったのが、
公開直後のプレイヤーのバージョンでは「ミッキー」になり、
その一週間後のバージョンアップで「ミニー」になったらどうでしょうか？

製作時に消費時のことが分からないケースの延長として、制作と消費が完全に切り離されている場合
例えば制作者はただノベルのようなものを書いて、それを自由に適当なプレイヤーで見てくださいと公開した場合
「ネズミ」という文字で「ミッキー」を表示するプレイヤーがあった場合、プレイヤー側が訴えられるのでしょうか？

そうだとした場合、もし「abcネズミ123」、『ミッキーの具体的容姿説明』、「ミッキー」
というキーワードで「ミッキー」の絵を生成した場合は、どれがセーフでどれがアウトに当たるのでしょうか？

2018/06/25(月) 02:19:48.56

なんか学習データの権利とか色々あったな。なんだっけ

2018/06/25(月) 04:05:51.95

他人の著作物に似たら、ダメ！

ネズミなら、実際のネズミに似ていないと、ダメ

2018/06/25(月) 10:53:51.41

>>575
スレチ、知的所有権は難しい

2018/06/25(月) 22:07:13.51

難しい問題だねえ。国によって違ったりしそう。

2018/06/25(月) 22:07:28.04

大小の３つの○のスタンプを投げてたまたまミッキーになっても誰も罰せられないように
仮にそのスタンプを重ねて75度の角度で初速1m/sで投げると高確率でそうなると分かっていたとしても違法性はないだろうよ

2018/06/25(月) 22:10:07.87

て会社の同僚が言ってた

2018/06/26(火) 10:07:07.27

>>575は、著作権じゃなく、商標権で、結果的でも似たらアウト。

既存の商標シンボルと類似性が高いものが生成されたら、
自動削除するAIを併用すれば良い。
知的財産権違反の自動検閲は、Google Playでも、とっくの昔からやってるし

2018/06/26(火) 10:11:27.58

スレチだといってるだろ、馬鹿なの？

**550** (ﾜｯﾁｮｲ 9f23-Dg4D) · 2018/06/26(火) 21:02:39.82

元データが大体x∈[0,10]なので、xではなくてx-5の多項式で近似してみたら
どうなんだろうと思ってやってみたら、31次式でもleave-one-out 交差検証のMSEが
発散しないよ！(ﾟ∀｡)
原点付近に寄せてから近似するのって重要なのかも(あと、機械精度での計算前の
HornerForm[]化も)。

2018/06/27(水) 00:39:29.28

>>583
スレチと思ってるのは君だけ
ここはゆるい雑談スレ>>1
それが嫌なら黙って他所へ行ってどうぞ

2018/06/27(水) 02:48:10.55

自分もスレチだと思います

2018/06/27(水) 05:45:19.66

#metoo

2018/06/27(水) 11:01:49.72

賛成多数で本案はスレチと可決されました。

2018/06/28(木) 08:30:58.74

>>3
誤差逆伝播法と勾配降下法って役割いっしょなの？
初心者すぎてよくわからん

2018/06/28(木) 08:31:16.89

安価は無視で

2018/06/28(木) 08:50:27.96

次の方

2018/06/28(木) 10:07:28.95

皆さん機械学習やディープラーニングはどのように勉強を進められましたか？
自職場は製造現場なのですが、この手の分野にかなり遅れていましたが今更ですが着手する流れがあり良い機会だと思い勉強を始めようと考えています
pythonの基本的な知識はありますが機械学習やディープラーニングに関してはMNISTを用いた簡単なサンプルなど遊び程度で初歩的な事しかやった事がありません
今はCourseraの機械学習を受講してまずは基礎を学習しています
皆さんの勉強方法など参考に聞かせて頂けたら嬉しいです

2018/06/28(木) 10:49:32.26

読める本を読めば

2018/06/28(木) 10:57:34.80

このスレは世界の頂点に立つ研究者ばかりだから素人さんへのアドバイスは難しい

2018/06/28(木) 16:09:19.42

暇人と大学生くらいしかいない

2018/06/28(木) 23:58:54.60

↑それはない

2018/06/29(金) 10:02:31.78

>>592
https://github.com/arXivTimes/arXivTimes/blob/master/materials/README.md

2018/06/29(金) 10:09:56.63

PRML not recommended. Just kidding!!!

2018/06/29(金) 13:42:02.94

まぁ以前に比べれば過疎ったよね。月一で見れば十分だｗ

2018/06/29(金) 14:09:05.33

ﾆｸｸｴﾆｸﾆｸ

2018/06/29(金) 20:14:45.47

もう機械学習ブームは去った。
ていうか使えて当然の環境がもう整ってるから、どうやって使うの？何ができるの？とかではしゃぐフェーズじゃないんだよな。

2018/06/29(金) 20:46:55.50

AIブームは終わってるな、次は１０年後かな。

2018/06/29(金) 23:27:54.30

市場は広がってる

2018/06/30(土) 14:21:20.84

みんな今の給与水準落としたくないからライバルを支援したくない
でもこのまま行くと日本はAI後進国でオワタ感
というジレンマの中で黙してるんだよ

2018/06/30(土) 14:34:29.66

イミフ

2018/06/30(土) 14:52:39.30

>>604
いやもう、手遅れだからw

2018/06/30(土) 15:52:08.85

第四次AIブーム＝数学の復讐

2018/06/30(土) 17:20:16.10

>>604
別に日本のために生きているわけでも働いているわけでもないので日本オワタだろうが知ったことではない
そんなこと気にするより自分の能力高めて、仮に日本沈没しても別の場所でも生きていけるようにしておく方がよっぽど賢い

2018/07/01(日) 11:31:31.88

ディープラーニング学びたいのですが
数学が苦手で、数式がさっぱりわかりません。
お勧めの書籍はありますか？

2018/07/01(日) 11:34:20.53

数式が分かるようになってから来てください

2018/07/01(日) 12:49:09.66

猫でも分かるディープラーニング

2018/07/01(日) 12:50:47.41

そもそも機械学習に数学は必要ありません

2018/07/01(日) 13:24:34.33

ニュートラルネットワークについて
これ結局は一次関数になるのでこんな複雑に分けれないと思うんですけど?
https://i.imgur.com/9EqRKfx.jpg

2018/07/01(日) 15:04:17.41

会社でtensorflor使ってる所ってestimator使ってるの？

2018/07/01(日) 15:42:03.75

>>613
ノード数次第では

2018/07/01(日) 18:27:05.21

機械学習に向けて高校数学をやり直しています
とりあえず統計検定２級を目標にしようと思いますが、間違っていますでしょうか？

2018/07/01(日) 18:49:24.41

間違ってます

2018/07/01(日) 19:03:54.31

統計学に数学は必要だけど機械学習に数学は必要ありません
だから数学とか言っている時点でもう間違い

2018/07/01(日) 19:12:53.26

機械学習に統計学は不要ですか？

2018/07/01(日) 20:59:28.16

統計学と機械学習は、どういう関係性・違いがあるのでしょうか？
PRMLを読む前の入門本は、どれがお勧めですか？
いっぱい質問してすみません。

2018/07/01(日) 21:05:55.42

ggrks
ggrks

2018/07/01(日) 21:55:23.43

>>>620
統計学と機械学習の線引きはちょっとわかりません．
私は，須山敦志さんのベイズ推論による機械学習入門を読んでからPRMLを読んでいます．
ただ，PRMLは，必要になったときに必要な知識をかいつまむくらいの使い方がいいと思います．
また，２章のガウス分布の部分をしっかり読めば，ガウス分布の結合分布や条件付き分布などの計算になれることができると思います．

2018/07/01(日) 22:03:26.87

そもそも機械学習なんて名前の学習分野がない。

この分野の専門家が勝手に数学の技法持ち寄って纏めて使用してるだけ。
各々の技法を元ネタを辿れば統計学とかに限定されない

2018/07/01(日) 22:37:31.21

自説を披露（誰も聞いていない）

2018/07/01(日) 22:46:03.47

>>自説？？
いやいや普遍的に捉えてもいいぐらいの話だと思うけど

2018/07/01(日) 22:53:39.57

そうムキになるなよ

2018/07/01(日) 22:57:00.73

AI 後進国らしいスレだなぁ

2018/07/01(日) 23:41:38.08

後進国をみんなで認めて
活発に有意義な議論しようぜ

2018/07/02(月) 00:06:04.59

金にならないからな

2018/07/02(月) 00:30:27.28

機械学習なんて統計数理の一つの応用というか枝葉に過ぎないからな

2018/07/02(月) 02:27:14.91

でもその枝の先には果実がいっぱいなってる。

2018/07/02(月) 02:37:07.24

そうでもない

2018/07/02(月) 09:03:05.98

びわ、もも？うまいよね

2018/07/02(月) 16:26:07.43

機械学習すっぞ！！と意気込んで構築手順調べたら、ゲーミングPCクラスのスペックが必要ってことに気付かされて泣きそう。

ワイのmacbookじゃどうしようもない。
俺みたいな人おる？

2018/07/02(月) 16:33:46.72

そんなあなたにランダムフォレスト

2018/07/02(月) 16:56:35.30

tensorflowのサンプルを二時間動かして落ちる？？？メモリ不足でござった{END}

2018/07/02(月) 20:10:48.00

ワイの貧弱PCじゃNIC学習で3日掛かる
GANなんてやろうとしたら何日掛かるやら

2018/07/02(月) 20:25:33.94

政府は、「AI人材の育成」をとか言って、予算を割いているけど、ばら撒き先は、学校。

奴らが育つのを待っていれば、日本は手遅れになるから、
>>637のような奴を救済してやれば良いのに

2018/07/02(月) 23:15:07.18

クラウドでできんの？

2018/07/03(火) 00:32:26.62

そもそも機械学習の仕組み自体が人間の脳を理論的に再現することを放棄してマシンパワーで無理矢理解決してやれ、というものなので
それなりの資金使える組織に属さず個人で最新トレンドに追従するのは無理がある

2018/07/03(火) 03:15:03.16

>>640
その主張は同意できない。

2018/07/03(火) 05:46:58.23

>>638
お前が救済すれば

2018/07/03(火) 06:44:17.54

>>640
脳の再現は全脳エミレーションで。

2018/07/03(火) 06:46:51.41

>>638
高校生までに大学院修士課程までの数学を終わらせろ。

2018/07/03(火) 08:00:05.85

もう、回帰分析で良いよ

2018/07/03(火) 09:23:26.54

https://futuretrade.jp/winning_percentage.php
相場予測で上がるか下がるかの精度50%ってほぼ誤差の範囲じゃん
金融関係ほんとひどいな

2018/07/03(火) 11:11:10.59

>>646
いくら上がる下がる50%で当てると儲かるんじゃない。

2018/07/03(火) 11:59:27.01

二択で50%だぞ

2018/07/03(火) 12:04:30.29

50％で正解+イクラかの情報があれば俺でも儲けられる。

2018/07/03(火) 12:12:39.79

>>646に書いてある日経平均騰落予想AI「F-Trader」っていうもののことなら53.8%と書いてるぞ
50%オーバーってことは放置するだけで自動的に儲かるってことだからな

2018/07/03(火) 12:28:51.76

ある程度のオーバーフィッティングは免れ得ないだろうから
差し引けば完全にランダム

2018/07/03(火) 13:14:45.59

ディープラーニングに必要な線形代数って行列計算のみ？

2018/07/04(水) 04:18:50.52

>>650
騰落幅が当たらないと99%騰落が当たっても儲からないことはある。逆も真だが。

2018/07/04(水) 09:08:11.37

当んなくて儲からないから
当たるという宣伝で手法を売って儲けている

損だけ

2018/07/04(水) 10:47:13.19

競馬の予想屋と同じ（笑）

2018/07/04(水) 12:10:22.60

まあ本当に的中するなら他人が同じことしたら自分の取り分減るだけだしね

2018/07/04(水) 21:18:41.11

AI開発者で一番の高給取りはヘッジファンドで株の売買や投資をやっているわけだから、
予測は可能なんだろう。

毎日、数十億動かしているから、0.1％でも予測精度が上昇すれば、十分儲かるし

2018/07/04(水) 21:49:02.44

PT4

2018/07/04(水) 23:03:41.27

AIファンドが他のファンドに対して有意に差をつけてるかっていうとそうでもないでしょ

と書いて、調べてみたら実はAIヘッジファンドの平均リターンがヘッジファンド全体の平均回ってた
https://i.imgur.com/jkklRVq.png

2018/07/04(水) 23:04:02.94

上回ってた

2018/07/05(木) 01:58:09.26

外国のはまともにやってるとこもあるだろうよ

2018/07/06(金) 09:33:28.27

ゼロから作るDeep Learning 2が出るらしい
https://www.oreilly.co.jp/books/9784873118369/

2018/07/06(金) 09:55:52.63

プレビュー版で読んだ人結構いるみたいね

2018/07/06(金) 10:02:52.94

ああなるほど
サポートページから各章のソースは既に落とせるのか

2018/07/06(金) 10:03:30.34

attentionの項目は読んでみたいけどそれだけのためならいらないなぁ

2018/07/06(金) 12:04:16.31

データを学習させますって当たり前のように書いてあって、いっぱい読み込んだりしてるんだなーくらいのイメージして資料読んでたんだけどそもそも学習ってなにやってるの？
例えば訓練データに動物の写真と犬とか猫ってラベルがあって、犬の画像には犬のラベルですよって学習してるってイメージであってるかな？

テストデータに対するスコアがあまりに高いと過学習ってのは何となく分かるんだけど、犬の画像には犬ってラベル、猫の画像には猫ってラベル、みたいに学習してるのに訓練データに対するスコアが100にならないケースがあるのはどうして？

2018/07/06(金) 12:10:49.34

画像と答えの組み合わせを丸暗記してるわけじゃないから

2018/07/06(金) 12:22:01.00

2次元の2クラス分類のデータで可視化すると良くわかるが、境界がハッキリしてなくて混じってる場合が多い。
機械学習ってのは、そういう、人間が見て、こんなん分類できるわけないやろ……ってデータを学習してる場合がほとんど。
訓練データで100%っていうのは、そういう混じった領域にも無理矢理ギザギザの線引いて対処してる状態なので、
実際のデータに対する性能は低いものになる。

**デフォルトの名無しさん** (JP 0H2b-3y8E) · 2018/07/06(金) 12:42:45.64

ドヤ顔w

2018/07/06(金) 14:25:21.08

ドヤァア！！

2018/07/06(金) 14:51:02.82

どーや

2018/07/06(金) 15:24:22.62

IKEA

2018/07/06(金) 17:10:55.41

このゲームやるべき
https://goo.gl/U5BA1Y

2018/07/07(土) 10:25:40.93

短縮URL全面禁止決定のお知らせ

2018/07/08(日) 10:19:52.83

c++でおすすめの参考書ありますか？
c++で学ぶディープラーニングを考えてます

2018/07/08(日) 10:56:42.00

ない

2018/07/08(日) 11:47:37.49

>>675
Deep Belief Nets in C++ and CUDA C: Volume 1: Restricted Boltzmann Machines and Supervised Feedforward Networks
by Timothy Masters
Link: http://a.co/4gIcuGN