【統計分析】機械学習・データマイニング19
レス数が1000を超えています。これ以上書き込みはできません。
>>477
むしろそういう「言及」をデータとして扱わないと機械学習の有効性が意味を持たないと思うよ
「○○は△△という意味で□□である」っていう関連を一つの型として学習する必要がある
それをビッグデータから学ばないと、各データを統合で結ぶだけの古典的計算機に過ぎない >>478
>それをビッグデータから学ばないと、各データを統合で結ぶだけの古典的計算機に過ぎない
なるほど!
>「○○は△△という意味で□□である」っていう関連を一つの型として学習する必要がある
二項関係から三項関係への進化は、今は出来ていないんじゃないかな? Googleが猫の画像を判別させる人工知能を作るだけのために大量の猫画像を必要としたように、
wikiを作るとしたらその1項目毎に猫画像学習と同等かそれ以上の情報をかき集めて学習させる必要があるわけで
話題のcoinhiveみたいに世界中の各人のPCのリソース借りるような方法でもあれば可能かもしれないが特定の企業内だけで実現するには必要な計算資源が膨大すぎる Googleが画像から猫を判断させたのは、教師なしのニューラルネットワークによる学習だよ
AIによる学習結果は、その本質を理解しているという意味じゃない
「検索結果の中からざっくり中央値を取る」ようなもんだ
「〇〇について、どこの誰がいつから始めてこういう成り立ちだ」みたいなWikiっぽいレイアウトに
まとめるだけなら、既存のWebページと電子化されてる書籍だけで足りるかと
もともとWkipedia自体、外部サイトでの記述や書籍による出展が求められるわけで
そうした情報がちょいちょい間違ってたりするのも現状と同じ 教師なしであってる
somでは無い
ttp://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/en//archive/unsupervised_icml2012.pdf 高卒派遣で機械設計やっていますが3年やっても年収300がやっとなので機械学習とPythonを学んで年収500万ぐらいになりたいです 付け焼刃の知識は、年収5000万overの人が作った機械学習自動化ツールに置き換えられそうだ。
というか、年収500万ぐらいならpythonだけでも有るだろ >>487
pythonって日本では需要が無いのでは。 日本の大企業で機械学習やってますと言ってるところはどういう環境で開発してるんだろう? 自動制御システムを機械学習という人たちもいるからな >>485
マセマみたいな簡単な参考書で、線形代数、微分積分、統計学の知識を大学一年生レベルまで習得
これなら分かる最適化数学、言語処理のための機械学習入門、はじパタ本を読む
プログラミングは、書籍だけで勉強する場合、pythonの参考書を最低五冊
また、英語を勉強して、論文を読めるようにするように
DB、クラウドの知識もほしいし、前処理についても独学しておいた方が採用されやすいだろう
カグルにもチャレンジした方がいいかなあ
あと絶対むずかしい参考書に手を出すな! 絶対だぞ! むかしから日本は共有知を軽視してきただろ
今更なに言ってんだ >>492
ご丁寧にありがとうございます
自宅学習がまるでできないのでまずは基本情報を取って自信をつけてみます 「〇〇入門」は山ほどあるのにその先を教えるものになると日本語の情報は激減するよな どうせ、価値ある一次情報は国外からしか出ないから、まず、英語で良い。
新井女史が人工知能の最高峰な国、Japan。
https://booklive.jp/review/list/title_id/493315/vol_no/001 >>469
同意。そこらへんのことを本当に知らない人多すぎ。 まあぶっちゃけ、自分が思い浮かぶ程度の手法は、エクセル先生でできちゃうし、実務上はそれをわざわざRやらPythonやらでやるインセンティブもないわけで。
ロジスティック回帰とかそこら辺になりゃ意味あるがあまり機会がない。やらんでなんとなく過ごしてる自分が悪いだけ疑惑はあるけどw
https://twitter.com/ikasanma/status/1007588876251160582 流石にEXCELとPythonは使い道が違いすぎる >>501
背景の緑のマトリックスみたいな画像がpython関係なくてダサすぎる Excelは昔から統計分析でも使われてきたし変ではない。
今更と言われるくらいにパイソンも昔から存在したが、注目されるほどではなかった。
パイソンがデータ処理に向いているというのは最近流布されるステマの一種だろう。
インタプリタだからパイソンはデータセットが肥大化すると遅くなるよ。
シティー銀行がデータ分析や人工知能しようが、世界は常に変わるからエキスパート
システムのようなアプリケーションは成功しなかったし、株価予測は原理的にランダムであり
予測不可能なのでAIなどやるだけ無駄。 データ量肥大化でpython処理が重くなるというならEXCELの場合重くなるどころか開くことすらできなくなるけどね
むしろEXCELとの比較だけで言えばpython使うなら元データを分割して読み込みなど工夫すれば原理的には元データ量に関する限界はなく処理時間もデータ量に比例するだけ Excel推しの人ってみんな言ってることがどこかズレてる印象 というか、EXCELしか使えないからそれしか選択肢ないんだろう まず、エキスパートシステムは部分的には成功しているぞ
成果が世の目に触れにくいだけだ
そして、パイソンの株式予測は、データが増えれば増えるほど成功する
あんなの最適化数学の延長で十分 >>512
>株式予測は、データが増えれば増えるほど成功する
株価が上昇するか、それともアンダーウェートか、それだけでも判定できるのなら大いに役に立ちます!
勝率はどれくらいですか? 株価予測は簡単じゃねえわ
当たり前の話なんだが過去は幾らでも説明できるんだけど
未来は「まだおきていない」ので分からんのだ 株価は、あらゆる情報を用いたとしても、日経平均などの平均値を超えられないという、予想が信じられてるんだろ。
日経平均を上回る圧倒的パフォーマンスをだしたとしても、一時的であってたとえば100年、1000年とか長期で測れば平均値に落ち着くといった。 株価予測が可能かどうかに関する理論・仮説はこれだ。
効率的市場仮説 - Wikipedia
金融経済学における効率的市場仮説とは、市場は常に完全に情報的に効率的であるとする仮説。
効率的市場仮説に従えば、株式取引は株式を常に公正な価格で取り引きしていて、投資家が株式を安く買うことも高く売ることもできないということになる。
すると、銘柄の選定や市場のタイミングから市場の平均以上の実績を得るのは不可能である。
チリジ・マルワラは、市場に人工知能を搭載したコンピューターのトレーダーが増えるほど市場は効率的になっていくため、
人工知能が効率的経済仮説の理論の適用可能性に影響を与えるのではないかと推論した。
ウォーレン・バフェットは効率的経済仮説に反論していて、特に注目に値する1984年のプレゼン「The Supervisers of Graham-and-Doddsville」において、
世界最高レベルの運用投資会社で働く株式投資家の圧倒的多数は、投資家の成功は運で決まるという効率的経済仮説の主張に反論していると述べた。
マルキールは、プロのポートフォリオマネージャーの3分の2が(1996年までの)30年間にわたってS&P 500指数を越える実績を出せていない
(しかも、ある年に実績が高い人とその次の年に実績が高い人の間の相関は殆どない)ことを示している。 自分の考えは、株価予測は不可能という効率的市場仮説はほぼ正しいとおもっていて。
ビル・ゲイツとか、孫正義など個人・組織とかの勝手な思い、欲求で大金が動いたとき、
市場の効率性が崩れ、その瞬間だけはチャンスありという理解。
個人の思いは普通は予測できない。本人自身なら分かってるが・・・
しかしそうすると金持ちは大金動かせて、その正確な予測も自身はできてるので常に稼げることになるがどうか。 すまんスレチだが助けてくれ
JavaやろうとJDKをダウンロードしたんだが
インストールパッケージを開くことが出来ませんでした。
パッケージがアクセスできることを確認してください。
またはアプリケーションベンダーに問い合わせ、このパッケージが
有効なwindowsインストラーパッケージであることを確認してくださいと
書いてある。
どうすればJDKを起動できるんや? >>519
オラクルのサポート契約結べばすぐ解決するよ! >>501
FRBのモデルはJuliaで作られているのにな。日銀はmaltab。pythonすらでない。 >>516
考えてみたところ、日経平均やNYダウや為替レートなどいろいろな要素が多く入ってる程、予測できない一方で。
これに反対してるウォーレン・バフェットの理屈も理解できるな。
特に社長個人に注目して、信念とか哲学とか聞いてみるとか、会社見学して社員教育や社員の熱意、やる気を確認するなどすれば、
いずれ(平均以上に)成長できる会社を発見するのはできそうだからな。
そうなると株価予測というより成功者を見つける事になってくるが、これは同一でいいのか。 これが、全てな気がする。
>>株価に影響を与える全てのパラメータがあればできる
株の予測に限らず、必要なデータの種類や指標が解らないと、AIは作れない。
対象ジャンルにAIエンジニアが、逐次精通していくのは無理ゲー。 アメリカのインフレとその後の崩壊に既に仕込んであるのだろうな大手は データの性質をよく知ってるほど強い
どんな前処理したらいいかわからんし 株価に影響を与える全てのパラメータがあればって
それあなたインサイダーですわ 確かに、原理的にあらゆる情報があれば予測できるとしても、現実的にはオープンにされたデータのみから予測できなければ合法に使えないな 株価予想、デイトレード的なものに機械学習を導入するだけなら
本当か嘘かまでは分からないけどアメリカの方で既に浸透しているらしいな
ネットニュースでちょくちょくそういう話が流れてくる
まだ無理なのは長期の予想の方だろう 「こういうデータがこう動いたら株価はこうなる」みたいに明示できるなら機械学習なんて不要だろ
そうじゃなくて、全部AIに任せて「理由は分からんけど色んなデータからこれが買いだ」みたいな
説明するとアホみたいな活用が本来の機械学習の強みだろ
「理解」は放棄して「活用」だけするのが正しい姿だ
「株価の上下」という出力を変えて、「株価の変動にどういった要素が組み合わさったか」という部分を
分析するのは可能かもしれんが、それは経済学に寄与することはあっても株取引には不要な要素 >>519だがwindows10でJDKをダウンロード、ダウンロード後保存されたJDKを
開こうとしても上記のような文が出てきて開けない
ちなみにウィルソフトは一旦OFFにしたり、オフラインでのダウンロードもしたし
Edge以外でfirefoxを使ったりしてもダメだった パターン認識と機械学習(PRML)の輪読資料を公開
2018年06月18日 soneoka education, news, readings
C.M.ビショップ他著「パターン認識と機械学習」の輪読資料の一覧を当サイトで公開しました。
詳細はこちらから
http://deeplearning.jp/deep-learning-day18-2/ 実データで学ぶ人工知能講座(AIデータフロンティアコース)
http://learn-ai.org/about
2018-06-18
平成30年度後期の募集につきましては講座について(応募方法)に掲載しました。
募集期間は7/1(日)〜31(火)となっています。 >>536
SUGEEEEEEEEEEEEEEEEEE!!!
2chなんてくだらないものを見ていて、本当によかった >>542
自分は数学専攻だけど雑で読みにくい
文系や工学系の人が雰囲気を味わうのに手頃なんだろ >>547
たぶん話の文脈を読めてない
工学レベルの数学で十分だろという意味だろ 任意精度で最小二乗フィットをやろうとしてるのですけど、Mathematica以外の選択肢は
無いのでしょうか? >>551
leave-one-out 交差検証での(最小二乗フィットの)限界(何次元迄だいじょうぶか)を
調べたくて…。
でも、(元データの精度はどうなのって点は置いといて)最小二乗フィットの結果に疑義
が起きない様に、106ビット相当の精度の最小二乗フィットでleave-one-out 交差検証すると、
Wolfram Programming LabのFree planだと8次が限界ですた。
1個外したデータでFit[]して、外したやつで誤差を計算して2乗して和を取ってるのですけど、
何かズルする手段があったりするのでしょうか? 「ここ迄やった」変数を用意して、中間結果を書き込んでやれば、
途中からでも計算を再開出来るのか…。←せこい 機械学習に興味ある新参者ですがマスター教えてください。パーセプトロンの説明だと入力値と重みの計算値を1か0で出すと思うのですが、多層ニューラルネットワークの場合は計算値を活性化関数で近似してその値を次の層の入力値にする認識でokですか? 何に最少事情でフィットさせるのか分からないことには何とも。 >>555
偽術者を自任してますw
>>559>>560
500点位の(x,y)のデータ(単調増加)
>>561
Mathematicaで
xl = x^Range[0, 2] /* = {1, x, x^2} */
Fit[data, xl, x]
みたいな感じ(たぶん厳密解法)。
ttp://reference.wolfram.com/language/ref/Fit.html >>562
2次多項式にフィッティングさせてるのね。
行列計算で一発で厳密解出るよ。
numpy.polyfit 使えばすぐ計算できる。 あと、leave one outが重い場合はk-fold cross validationする。 みんなは普段どの手法をメインに使ってるの?
ホントはガウシアンプロセスのほうが適切なのに
ディープラーニングが流行ってるから
クライアントからDL使えって要求とかされない? すまん。Cで書いていたわ
なお、カルマンニューロ本なんてN88BASICで書いてあって
流石に悶絶したわ >>565
自分がコンサル的な立場でないならそのまま客の要求する手法使えばいい
それで精度が悪くなっても適切にプログラミングされているのならその責任は客にある
逆にコンサルとしての働きも求められる立場なら何が最適なのか説明して説得できなければ駄目 展示会で見たdatarobotってツールが忘れられない >>572
アセンブラならともかくマシンコードはオフセット計算が
面倒でな
ef 00 00
c3 >>568
DL(方法論)の指定をしてくる時点で、目的は、結果ではなく、
流行りのAI技術に投資しましたというパフォーマンスでは? 法律的な相談になると思うのですが、
今RPGツクールのような、製作者が作ったものを消費者が遊ぶツール郡を作ってます
その制作の際の素材集めを支援するために、DNNによる画像生成機能を作ろうと思っています
そこで質問なのですが、既存の著作物をそっくりな画像が生成された場合、
権利者から民事的に損害賠償請求や公開差し止め請求をされ、それが通ることがあると思われますか?
1)制作時にキーワードから画像を生成して、その画像データを消費者へ届けるケース
これは製作者が注意を払う責任が出てくると思います
例えば「ネズミ」で「ミッキー」似の絵が出てきたら、それは使ってはいけないと思います
2)製作時にキーワードから画像を生成して、そのキーワードを消費者へ届けるケース
これも、製作時に確認した画像が消費時に現れることが分かっているのであれば、ケース1と同じだと思います
ですが、それが保証されないものだとしたらどうでしょうか?
例えばテスト時には何の変哲もないネズミのキャラクターだったのが、
公開直後のプレイヤーのバージョンでは「ミッキー」になり、
その一週間後のバージョンアップで「ミニー」になったらどうでしょうか?
製作時に消費時のことが分からないケースの延長として、制作と消費が完全に切り離されている場合
例えば制作者はただノベルのようなものを書いて、それを自由に適当なプレイヤーで見てくださいと公開した場合
「ネズミ」という文字で「ミッキー」を表示するプレイヤーがあった場合、プレイヤー側が訴えられるのでしょうか?
そうだとした場合、もし「abcネズミ123」、『ミッキーの具体的容姿説明』、「ミッキー」
というキーワードで「ミッキー」の絵を生成した場合は、どれがセーフでどれがアウトに当たるのでしょうか? なんか学習データの権利とか色々あったな。なんだっけ 他人の著作物に似たら、ダメ!
ネズミなら、実際のネズミに似ていないと、ダメ 大小の3つの○のスタンプを投げてたまたまミッキーになっても誰も罰せられないように
仮にそのスタンプを重ねて75度の角度で初速1m/sで投げると高確率でそうなると分かっていたとしても違法性はないだろうよ >>575は、著作権じゃなく、商標権で、結果的でも似たらアウト。
既存の商標シンボルと類似性が高いものが生成されたら、
自動削除するAIを併用すれば良い。
知的財産権違反の自動検閲は、Google Playでも、とっくの昔からやってるし 元データが大体x∈[0,10]なので、xではなくてx-5の多項式で近似してみたら
どうなんだろうと思ってやってみたら、31次式でもleave-one-out 交差検証のMSEが
発散しないよ!(゚∀。)
原点付近に寄せてから近似するのって重要なのかも(あと、機械精度での計算前の
HornerForm[]化も)。 >>583
スレチと思ってるのは君だけ
ここはゆるい雑談スレ>>1
それが嫌なら黙って他所へ行ってどうぞ >>3
誤差逆伝播法と勾配降下法って役割いっしょなの?
初心者すぎてよくわからん 皆さん機械学習やディープラーニングはどのように勉強を進められましたか?
自職場は製造現場なのですが、この手の分野にかなり遅れていましたが今更ですが着手する流れがあり良い機会だと思い勉強を始めようと考えています
pythonの基本的な知識はありますが機械学習やディープラーニングに関してはMNISTを用いた簡単なサンプルなど遊び程度で初歩的な事しかやった事がありません
今はCourseraの機械学習を受講してまずは基礎を学習しています
皆さんの勉強方法など参考に聞かせて頂けたら嬉しいです このスレは世界の頂点に立つ研究者ばかりだから素人さんへのアドバイスは難しい PRML not recommended. Just kidding!!! まぁ以前に比べれば過疎ったよね。月一で見れば十分だw もう機械学習ブームは去った。
ていうか使えて当然の環境がもう整ってるから、どうやって使うの?何ができるの?とかではしゃぐフェーズじゃないんだよな。 みんな今の給与水準落としたくないからライバルを支援したくない
でもこのまま行くと日本はAI後進国でオワタ感
というジレンマの中で黙してるんだよ >>604
別に日本のために生きているわけでも働いているわけでもないので日本オワタだろうが知ったことではない
そんなこと気にするより自分の能力高めて、仮に日本沈没しても別の場所でも生きていけるようにしておく方がよっぽど賢い ディープラーニング学びたいのですが
数学が苦手で、数式がさっぱりわかりません。
お勧めの書籍はありますか? ニュートラルネットワークについて
これ結局は一次関数になるのでこんな複雑に分けれないと思うんですけど?
https://i.imgur.com/9EqRKfx.jpg 会社でtensorflor使ってる所ってestimator使ってるの? 機械学習に向けて高校数学をやり直しています
とりあえず統計検定2級を目標にしようと思いますが、間違っていますでしょうか? 統計学に数学は必要だけど機械学習に数学は必要ありません
だから数学とか言っている時点でもう間違い 統計学と機械学習は、どういう関係性・違いがあるのでしょうか?
PRMLを読む前の入門本は、どれがお勧めですか?
いっぱい質問してすみません。 >>>620
統計学と機械学習の線引きはちょっとわかりません.
私は,須山敦志さんのベイズ推論による機械学習入門を読んでからPRMLを読んでいます.
ただ,PRMLは,必要になったときに必要な知識をかいつまむくらいの使い方がいいと思います.
また,2章のガウス分布の部分をしっかり読めば,ガウス分布の結合分布や条件付き分布などの計算になれることができると思います. そもそも機械学習なんて名前の学習分野がない。
この分野の専門家が勝手に数学の技法持ち寄って纏めて使用してるだけ。
各々の技法を元ネタを辿れば統計学とかに限定されない >>自説??
いやいや普遍的に捉えてもいいぐらいの話だと思うけど 後進国をみんなで認めて
活発に有意義な議論しようぜ 機械学習なんて統計数理の一つの応用というか枝葉に過ぎないからな 機械学習すっぞ!!と意気込んで構築手順調べたら、ゲーミングPCクラスのスペックが必要ってことに気付かされて泣きそう。
ワイのmacbookじゃどうしようもない。
俺みたいな人おる? tensorflowのサンプルを二時間動かして落ちる???メモリ不足でござった{END} ワイの貧弱PCじゃNIC学習で3日掛かる
GANなんてやろうとしたら何日掛かるやら 政府は、「AI人材の育成」をとか言って、予算を割いているけど、ばら撒き先は、学校。
奴らが育つのを待っていれば、日本は手遅れになるから、
>>637のような奴を救済してやれば良いのに そもそも機械学習の仕組み自体が人間の脳を理論的に再現することを放棄してマシンパワーで無理矢理解決してやれ、というものなので
それなりの資金使える組織に属さず個人で最新トレンドに追従するのは無理がある >>638
高校生までに大学院修士課程までの数学を終わらせろ。 >>646
いくら上がる下がる50%で当てると儲かるんじゃない。 50%で正解+イクラかの情報があれば俺でも儲けられる。 >>646に書いてある日経平均騰落予想AI「F-Trader」っていうもののことなら53.8%と書いてるぞ
50%オーバーってことは放置するだけで自動的に儲かるってことだからな ある程度のオーバーフィッティングは免れ得ないだろうから
差し引けば完全にランダム ディープラーニングに必要な線形代数って行列計算のみ? >>650
騰落幅が当たらないと99%騰落が当たっても儲からないことはある。逆も真だが。 当んなくて儲からないから
当たるという宣伝で手法を売って儲けている
損だけ まあ本当に的中するなら他人が同じことしたら自分の取り分減るだけだしね AI開発者で一番の高給取りはヘッジファンドで株の売買や投資をやっているわけだから、
予測は可能なんだろう。
毎日、数十億動かしているから、0.1%でも予測精度が上昇すれば、十分儲かるし AIファンドが他のファンドに対して有意に差をつけてるかっていうとそうでもないでしょ
と書いて、調べてみたら実はAIヘッジファンドの平均リターンがヘッジファンド全体の平均回ってた
https://i.imgur.com/jkklRVq.png ああなるほど
サポートページから各章のソースは既に落とせるのか attentionの項目は読んでみたいけどそれだけのためならいらないなぁ データを学習させますって当たり前のように書いてあって、いっぱい読み込んだりしてるんだなーくらいのイメージして資料読んでたんだけどそもそも学習ってなにやってるの?
例えば訓練データに動物の写真と犬とか猫ってラベルがあって、犬の画像には犬のラベルですよって学習してるってイメージであってるかな?
テストデータに対するスコアがあまりに高いと過学習ってのは何となく分かるんだけど、犬の画像には犬ってラベル、猫の画像には猫ってラベル、みたいに学習してるのに訓練データに対するスコアが100にならないケースがあるのはどうして? 画像と答えの組み合わせを丸暗記してるわけじゃないから 2次元の2クラス分類のデータで可視化すると良くわかるが、境界がハッキリしてなくて混じってる場合が多い。
機械学習ってのは、そういう、人間が見て、こんなん分類できるわけないやろ……ってデータを学習してる場合がほとんど。
訓練データで100%っていうのは、そういう混じった領域にも無理矢理ギザギザの線引いて対処してる状態なので、
実際のデータに対する性能は低いものになる。 c++でおすすめの参考書ありますか?
c++で学ぶディープラーニングを考えてます >>675
Deep Belief Nets in C++ and CUDA C: Volume 1: Restricted Boltzmann Machines and Supervised Feedforward Networks
by Timothy Masters
Link: http://a.co/4gIcuGN 機械学習を標榜しておいてpythonではなく
javaやC#、C++を募集してる求人多すぎぃ
それはつまり既存の有用なライブラリを全部C系やjavaで実装しなおせってこと?
それとも
「pythonなんぞ高級言語が出来るやつなら余裕やろw
どうせ処理速度上げるラッパーやGUIは高級言語で作るんやしw」
みたいなノリなの? >>682
pythonよりそっちの方が人口多いからとにかくプログラマー集めて教育してpython使えるようにするつもりなんじゃないか? 求人広告の文言なんて人事部やら広告屋やらが間に入ってることくらい分からないのかなぁw 環境で言語決まってるからどうにかしてくれってことでは >>684
ぺちぱーやぶいばが来てもうざいから
魔除けで書いてあるんだろ VB.Net使えるのにC#使えません、なんて人はあまりまともなプログラマーではない可能性高いから相手にしたくないけどな VB.Net使えるのにC#使えません
なんて言うまともじゃない人が多くて困る。 VB.Net使えてもC#使えない人なら応募要項に反してるので首に出来るから都合がいい 応用が必要なAIの開発を請け負っている所って、
専門ベンチャーや大学以外に有るのかな?
富士通やNECは、キラーパスできる下請けがいないから、
前例豊富な案件しか回せ無さそうだ キラーパスできる下請け持ってる会社って何処?俺も下請けに超絶スルーしたい。ちょwQBKみたいな。
NTTデータとか?NECや富士通も似たようなもんじゃないの? Pythonでプロトタイピングして、モデルができたらプロダクションはJavaとかC#で組み込むんだよ Deep Learningの輪読資料を公開
2018年07月12日 soneoka education, news
Ian Goodfellow 他著「Deep Learning」の輪読資料の一覧を当サイトで公開しました。
詳細はこちらから
http://deeplearning.jp/seminar-2/#1515565927378-9a11fdc4-798a 【裏切られた、安保″】 イラン核施設 ←(2010,11)―<サイバー攻撃>―(2011,03)→ 福島原発
http://rosie.5ch.net/test/read.cgi/liveplus/1531447465/l50
アメリカと断交すべき fast.aiのライブラリは既存のライブラリに比べてどう優れているのでしょうか?
速度?精度?メモリ節約? ユニバーサルトランスフォーマーで自然言語は一区切り付いたな
全ベクトル再帰+タイムステップ&ポジション付与
https://arxiv.org/abs/1807.03819 深層学習に仮説など必要ない。膨大なデータがあれば
そのデータを検証するだけでいくらでも有益な結論を導き出せる!
みたいこと言う輩が最近多いなあ
無理なんだけど 深層学習は自分はしたことないけど、勾配消失してるのか結構学習失敗するみたいね。 そもそも入力ベクトルの各成分が独立性・白色性強いと良い結果はほとんど出ないよ AIを株の売買に使って儲けている奴は確かに居るけど、
正しい判断を下す為の道具として使っているだけ。
AIにどれだけ精通しようと、素人が出る幕は無いので、大人しく、投資ファンドに雇って貰おう。 学習機に突っ込む前に恣意的にある程度データ整形する必要があるんだが、
バカはとにかく突っ込めば結果出るんでしょ?とか思ってる。 株は個人で買える金額に限度があるし
仮に限度無く買えるならそもそも相場を支配出来るやろ 限度なく買えるぐらい資金あるならわざわざ運用などしない 私立文系卒エンジニアだけど、機械学習とかデータサイエンス興味ある。
数学力どれくらい必要??? ちなみに自分のスペック
32歳
学歴
ーーー偏差値60程度の私立文系学部卒
実務経験
ーーー汎用機(COBOL開発、保守)エンジニア歴5年半
ーーーエンジニアと無関係の総合職1年
資格
ーーー応用情報技術者
ーーーデータベーススペシャリスト
ーーーネットワークスペシャリスト
スレ見てる感じだと、クラウドとか重要らしいから、ネットワークスペシャリストの勉強通して得た知識役に立つのかな?
面白いから実務にあんま関係ないけど勉強してましたが
機械学習なら活きる??
数学は高校二年で捨ててしまった。
センター数1Aは平均点程度で、数2Bは20点くらいしか取れなかった覚えがある。 >数学力どれくらい必要???
質問の意味がよくわからない そのくらい自分で調べて準備できないなら無理だから諦めろ 研究者になって論文発表するのでなければ、>>719のスペックが理解できる範囲で十分 実際アドホック分析ならExcelとSQLくらいで十分 仕事以外で機械学習勉強された方はいますか?
最近勉強を始めてまずはアルゴリズムの概要や基本的な部分の理解を進めてるのですが、演習みたいな物もやってみたいなと感じているのですが、独学で勉強された方はどのように身につけましたか? >>728
英語が読めればfast.aiやkaggleのtitanicチャレンジ
読めなければQiitaなどで初心者向けにコードを載せている人や
kaggleの解法を解説している人がたくさんいる
手元にExcelぐらいしかなければブラウザでh2oを動かすとか >>728 です
レスくださった方ありがとうございます
courseraは先月始めてみました
スケジュール的には大丈夫かと思ってたら10分の動画ですら理解するまで1時間以上かかって全然進まず、テストも1週目から全然分からずで自分の理解力の無さに絶望しました
kaggleは聞いたことなかったのでQiitaを見ながら進めてみます コーセラやってたけど俺も予定時間よりとんでもなくかかったし何より1週目のテストの問題の意味が分からなくてそこでやめた
動画見たときは分かったつもりだったのにテストは答えられない、質問の意味すら理解出来ないで自分に絶望したわ
いやー無能はつらいっす ♪ コーセーラ、コーセーラ
♪もーひーとーつーコーセーラ 大学行って、嬉しかったが、いつも出てくる講義はコーセラ
今日もコーセラ、明日もコーセラ、是ぢゃ年から年中コーセラ 大学行ってコーセラってどういうこと?
授業料の無駄 教授が書いた教科書買わされた挙げ句、授業がつまらなくて結局サボるより良心的 線形代数ってさ、ベクトルの復習みたいなのから始まって、加法、定数倍とかなんだ簡単じゃんとか
思って進んで行くと、なんか急にわからなくなる断絶感があるんだけどいい本ない? 高校数学向けに洗練された範囲とそうでない範囲の違い >>749
高校数学で固有値固有ベクトルってやったっけ? Courseraの機械学習の有名なやつ、Pythonでやってくれたらいいのに >>747
線型代数 長谷川浩司
線型代数学 佐武一郎 線形代数は大学で講義受けてた頃はひたすら新しい定理を出して証明するような感じだったから意味不明だったけど
要は大量の連立方程式を解くための方法を工夫しているだけだと考えればそれほど難しくはないと思えるようになった 最近PAP-1がPAPPに見えるのが気になって仕方がない >>254
本人に渡るのは3分の1以下が相場じゃないか?
80万で発注してるとしたら、本人に渡るのは27万ぐらいで、税金やらなんやらで手取り20万強といったところ。
だから、使ってるほうは高い金払ってんのになぁ、となり、使われるほうは、大して貰ってないのにあれこれ言われんなぁ、となる。 機械学習に数学は必要だけど、テストじゃないんだから、数式が解けることがゴールじゃない。
数学や物理で博士号持ってる奴は理解度が全く違うと思う。 数学はディープラーニングだからな。
数学は計算して答えが出るようでは駄目で、問題が出ると
答えが勝手に出てくる脳作りが一番大事。 カーブフィッティングか判断するには統計的知識は必要だよな kerasを使い、かつ新たな機械学習モデルを作らないならば
数学は必要なし
それ以外は必要
フィッティングも可視化すれば形式的に判断できるからね
Tensorflowでもkerasの使用を推薦してるから
需要過多の現状、ライブラリ知識だけでもいいんじゃね
どうせそのうち新たなモデル自体をMLで作るようになるしな python+vimキーバインドでデータ解析するための環境を模索してるけど結局ブラウザで実行するjupyter notebookが一番快適だな
pycharmがいいという記事を色々見つけたから試したけどjupyter notebookとの連携ではvim拡張がmarkdownセルで効かなかったりセル間移動に使えなかったりでブラウザ版には敵わない 超初心者だけどkaggleやりたい
どうやって勉強すればいいんだ kaggleやりたいにme tooだ
微積→線形代数→大学一年程度の統計学→
最適化数学の基礎→はじパタ本→自然言語処理の基礎→
pythonの入門書→ゼロから作るdeep learning(now!)
もうそろそろ、kaggleをはじめられますかねえ
アカウント作ってみたけど、とっかかりが分からん
教えてエロい人 kaggleはtitanicが入り口
公開されているkernelで良さげなものをforkするとか
ダウンロードしてローカルまたはクラウド上で
パラメータを変えたり
欠損値の補完の仕方を変えたりすることから
始めてみればいいと思う
titanicの解説は日本語でも掃いて捨てるほどあるし
敷居が高いとは全く思わない >>774
ありがとう。なるようにしかならないし、やるだけやってみるわ 宣伝乙と言われるかもしれないけど
noteで初心者向けtitanicレクチャーみたいなやつ売ってる人いたよ
それだけ本買う金あるなら買ってみたら?
あとド初心者ならSIGNATEの方がおすすめ 大学の数学の内容ほとんど忘れてるレベルなんですが、kaggleとかやってみたいです
スレざっと見たんですが、SIGNATEとかやった方がいいんでしょうか?
一応東大の松尾ラボのGoogle Driveに保存してある、講座があるんですけど、それから始めるべきか?
数学をやり直すべきか?
どっちがいいでしょうか? >>778
カーネル関数も理解できてない癖に死ねよ >>779
お前から先に死ねよ、カーネル関数(笑) カーネル関数って、非線形写像の時に出てくるアレか
線形代数をちょっとかじってればその場で理解できることだし
単語知らないぐらいならなんとかなりそうなもんだけど違うの どっちがいいかとか聞いてる奴は自分で学習効率も測定できないアホ ベクトル解析は必要かな
勾配とかナブラとか、そういう事を漠然とわかっていれば、とりあえず論文は読めるよね
いらない気がするけど自分が大したもんじゃないから実際のところは分からん どうせ証明なんて自分でしないんだから
計算術だけ判ってればOK 機械学習に数学はいらない
ベクトル解析もいらない。そもそも>>786からしてどうみてもベクトル解析理解してないw 機械学習の線形代数なんか単なる計算テクニックに過ぎないわけだが学者さんは難しく考えたがるよね
テクニックじゃなく本質的に重要なのは統計学 >>786
俺もベクトル解析わかってないけど、まあ論文読めるよと言いたかっただけだ
だから必要ないんじゃないかなーと思ってるけど
でも十年後は分からないよね。なんとなく複素解析とか、フーリエ解析とかやっておいた方が良さそうな予感。やったことないけど。でも音声認識とかまだ実務では中々つかえないけど将来的には食える技術な気がする。直観 >>789
例えば問題によっては自分でペナルティ項考えたりしないといけないと思うけど、そういう時にどう計算すればちゃんと解が求まるかとか考えるには線形代数の知識や数値計算のテクニックとかは要るよね ゼロからともう一冊読んだけどディープラーニングは数学はいらないよ。
ディープラーニングは感性で考えられてるからね。 不良などの要因分析によく使われるアルゴリズムを勉強したいのですが、決定木が適しているのかなと感じたのですが、他にはどのようなアルゴリズムがありますか? tensorflow 使うだけなら多変数関数の合成関数の微分だけ知ってりゃ使える。
ただ結果の良し悪しを考えるならガウス分布、大数の原理くらいは知っとかなきゃまずい。 ベンダー企業で研究開発してる奴らなら数学も出来ないと辛いことはあるだろう
逆に、極端な話、機械学習エンジニアとは名ばかりのただの組み込みエンジニアなら
数学どころか理論まわりも分かってなくていいんじゃないか
結局はピンキリ ゼロから読んでtensorflow始めたけどtensorflowの有り難みがよくわからん
sessonとかなんやねん あとゼロから読んでも理解力低くてよくわからん
なんやねん誤差逆伝播 データサイエンス講義に下記のような一文があったけど、
どういう風に数学を勉強したら、これが解るの?
「文脈が持っている特徴を問題として捉え、数学の言葉を使って考え、
自分の知っているアルゴリズムが解こうとしている問題に
どのように対応するかを考えましょう」 >>805
それぞれのレイア―を関数に見立てて考えよう
レイア―1 …… y=f1(x)
レイア―2 …… z=f2(y)
レイア―3 …… o=f3(z)
f1にまずxが入力されて、f3から出力値oがでてくる
さて、いま出力値oを最大値に近づけたい
レイアー3だけ考えよう
f3()に入るzという引数を、いったん定数と置こう
このzに、限りなく0に近い Δz という値を足すと、
f3(z+Δz) = f3(z) + g3×Δzと、出力値oがg3×Δzだけ増える
レイアー2も
yを定数と置いて、Δyをyに足すと、f2(y+Δy)がg2×Δyだけ増える レイアー3も
xにΔxを足すと、f1(x+Δx)がg1×Δxだけ増える
ここで、g1×Δx=Δy , g2×Δy=Δz
だから、g1・g2・g3・Δx = Δo(出力値oの増加分)
このg1・g2・g3がgrad(勾配)の正体だ
誤差逆伝搬では、g3、g2、g1と反対側から各レイヤーの傾きを求めて、
最後に掛け算することで、この勾配の値を算出している
えっ、g3、g2、g1はどうやって求めてるんだって?
偏微分とか(ごにょごにょごにょ……まあ、気にするな
あと最後に言っておく
分かりやすさを優先して説明をはしょったり、捻じ曲げたりしてるから
ネットの落書きなんてあんまり信用するな。がんば 今朝のテレビ朝日系羽鳥慎一モーニングショーで
蚊の研究をしてる元高校生を取り上げて
ノーベル賞とか公式発見とか取り上げてたけど
ただのデータマイニングと最小自乗回帰式出しただけで
夏休みの自由研究レベルだったんだが
ここの人もし見てたら色々言いたいことあると思う >>807
文脈が持っている特徴というのは学習対象に関する知識に基づくものであって、例えば機械の故障予知ならその機械の性質などとなる
つまり対象物に関する知識を持った上で対象物に由来する適切なパラメータを数学的理論に突っ込んでやる必要があるわけで、
数学が不要なのではなくむしろ数学は大前提の知識でありそれに加えて対象物特有の知識も必要だということ >>810
その話は知らないけど、例え簡単な回帰式でも人類の発展に貢献するものならノーベル賞もありうるんじゃないの?
例えば、ガンの発症率と睡眠時間が相関があるとか。
まあイグノーベル賞っぽいけどw 読んでみたら、割と凄い論文だった
きちんと理論武装して学術論文の体裁にすれば評価されるだろうさ
切り口が鋭い奴はなにやっても凄い >>816
斜め読みして見たけど、テレビでやってる科学番組みたいな感じなのが残念だな。ああいう番組を見て育つとこういうのが研究なのだと勘違いしてしてしまうのかもしれない。 まさか、データ分析だけじゃないだろ?
蚊を何百匹も飼育して、自分の血を吸わせて、実験しているのだろ?
大変だろ ノーベル賞は選抜された世界中の研究者からの推薦数で決まるのでそこに強いコネがあるか超有名人かでなければどれだけ内容が優れていてもまず取れない 研究は手法よりもテーマの選び方のセンスってのはあるんだろうな。
手法なんてXGBoostでテキトーに出力してもうまくいくときはうまくいく。 テーマの選び方に余地がなく、上から降って来てなんとかしてくれって言われることが多いです。 >>820
たまたま飼育していた蚊の傾向が判っただけで
同じ遺伝子の蚊だと意味がない気もする
日本中世界中の蚊で試すとか
違う種類の蚊でも試したのかな >>826
こういうのは検証手法を考案し有意な結果を得たこと自体に意義があるんだよ
あとはアース製薬の仕事 なるほど
アースや金鳥やフマキラーが追従して論文書けばノーベル賞か >>821
それだと田中耕一さんの受賞がわからない。
中村修二さんは目立ってたけど。 >>827
論文さらっと読んだ感じだと有意と言えるかどうか分からんけどなあ。
まあ追試して検証する必要あるね。 島津の田中さんみたいな発見や発明型のノーベル賞はすごいと思うけど、重力波とかニュートリノのカミオカンデとかわかってることを確認する型のノーベル賞は若干落ちる気がする
金集めて人使う経営者的能力って感じで
いやそういう能力の人も大切なのはわかるんだけどさ >>831
>重力波とかニュートリノのカミオカンデとかわかってることを確認する型のノーベル賞
いや、実験をはじめた時点では、理論が嘘である可能性を織り込んでいるんだよ
理論が成立しないかもしれない、と思いながら、それでも、その理論を理解し咀嚼し(普通は、嘘かもしれない理論を学ぶ気はしない)、その理論に載って実験器具を設計する
並大抵の覚悟ではできないと思うよ… あとカミオカンデは2回受賞してるけど
一回目のは確認型だけど
二回目のは失敗からの新発見だったかもしれない 安心しろ。偉そうに書いてるだけで書いてる人たちが何かしたわけじゃない 企業のデータ分析なんかコンサル力がないと完全に社内ニートやで 社内ニートで金もらえるならむしろラッキーじゃないか >>839
関西P社?
このスレにそんな実力者がいるとは インターンなんてse代わりに使うには教育コストパフォーマンス悪すぎじゃないか
しかも少ししたら居なくなるわけだし そりゃあいい気持ちにしておいて
seを確保するためだろ DSの底辺の仕事は、汚い前処理をひたすらやらされるポジだよ
高卒でやってる人もおる。そこからでも、がんばれば這い上がれるんだけどね
アルバイトで、未経験どころか知識がなくても受け入れてくれる求人もあるにはあるから
興味があれば突撃してみるといい P社って、データサイエンティスト集めてるけど、AIに力を入れるわけでも無し、
何を企んでいるのだろうか データサイエンティストは、ガチに売上に貢献するネタ見つけたら門外不出扱いになるから、
当たり前だが外部に公開なんて出来ないよ。
上っ面撫でてるような話ばかり取り沙汰されてAIブームとか言われてるけど。 H'とW'の+1はどこから来たのでしょうか?
実際に数を入れてみたら近い値が出てきました
ちなみにDlの式がないのですが何を表してるのでしょうか?
https://i.imgur.com/zU03Gg6.jpg 15mの道に木を5m間隔で植えたら15/5+1本植えられる >>852
まあ実際のデータサイエンティストの仕事ってそんなもんだがな。
9割が前処理コードと実験環境構築。 理学分野じゃないのにサイエンスが入ってるという糞用語つくる時点で営業目的の表現だし
PGをSEってよびかえるのと同じ バスケット分析とかだろ
紙オムツを買う男は、一緒に缶ビールも買うとか、
焼肉のたれは、肉の売り場に置いた方が、よく売れるとか そんな相関さえ見えればいいようなものなら専門家でなくても誰でも半自動ぐらいでできる 機械学習ならpythonとRどっちをマスターすべきかさっさと教えろ >>868
深層学習を中心にやるならpython
機械学習全般ならお好きな方を 今から新規に始める場合、既存のライブラリなどの資産の有無の縛りがないならpythonにしない理由はない R 面白いじゃん、プログラミングが面倒に感じる人ならいいと思うけどな
… と書いてみたものの、R vs Python 論争は今更かw
好きなのやればいいいんじゃないの、不都合が発生したら両方やればいい >>867
だが実際にやるとなるとめんどいんだよ。 Rはマニュアル見て動かせばいいだけだから勉強するってほどのことがない 株価でも、何十年も相関関係を調べている
株価は実体経済よりも、半年先行している。
さらに、サザエさんの視聴率は、株価よりも3か月先行しているw
最も早い指標が、サザエさんw
視聴率が下がると、どこかの産業が活発になってきている証拠!
それが後に顕在化する >>881
「すぐに使える! 業務で実践できる! Pythonによる AI・機械学習・深層学習アプリのつくり方」とかいう如何にも怪しい本買ったよ >>883
ちょっとググったら github にソース置いてあるんだな、今っぽくて悪くはなさそう まずデータをどう集めるのかが大変だよね。
天気予測とかで、日本全国1000箇所ぐらいの温度、湿度、空の写真、海の写真とかを1分に1回計測して学習させたりとかしてみたいけど、国家プロジェクトなレベルの話になりそう。 だから機械学習を個人でやってもチュートリアル以外実用性のあることはほとんどできない
結局どのような組織に所属しているかが最重要 株のファンダでスクリーニングするくらいならそこそこいけるんじゃね
間違ってもテクニカル占いには手を出すなよ >>888
すごく分かる
参考書見ながら独学でやってるけど実戦で役に立つイメージが全くわかない 個人でやってるったって、
キチガイが勝手に関連付けを発見しているようなものだからな
風呂に入るタイミングでクラクションが鳴るから集団ストーキングされてる、みたいな >>891
機械学習の大前提となる大量の学習データの入手の難易度が個人か企業などのそこそこ大きく組織かで天と地ほど違う
学習データを要しないプログラムであればむしろ個人の能力が大部分なので自分が優秀ならそれでいい >>892
その通りだな
データサイエンスにおいて、因果関係の理解されていない相関という科学的に無価値なものにも価値が認められるのは、それが金になる可能性があるから
飯食ってウンコ垂れ流すだけの個人が金を生むデータを入手できるかというと、、 グーグルもtensorflowを無償公開したときに
重要なのは仕組みじゃなくて
どんなデータを持っていてどう使うかのほうが重要と言っていたね 例えば、カルチュアコンビニエンスクラブ(Tポイント)が持っている
データが使えたとして、何を分析し、それを、どう活かす? どんな属性の人がいつどこで何を買いたがるかはあらゆる小売りが欲しがる情報だろ >>896
エロ本は入り口右側より左側の方が売れる 機械学習で何ができないか分かってきた。
機械学習ブームもいよいよ終焉か。 >>900
>いよいよ終焉か
…もう終わってしまうのですか?今からやろうと思っていました
そうだ、今までのブームのなかで出た最良の参考書を教えてください 0,1のようにクラス分けされたものではなく、連続値の要因分析をしたいと(連続値が高い時に効いているであろう要因など)考えた時に検討されるアルゴリズムはどういうものになるのでしょうか?
回帰木なのかな?と考えたのですが知識も浅く決定木くらいしかイメージが付かないのでそう考えたのですが他にはどのようなアルゴリズムを検討すべきでしょうか?
かなり初歩的な質問ですいません >>902
それでどう木が関係するのかわかってないが。
2つの関係すべてで類似度を計算すれば似通ったのはわかるが。 Google が良いのは、関連広告
アイドルで検索すれば、アイドルの広告、
プログラミングで検索すれば、プログラミングの広告のように、
その人に必要な広告を表示するから、有益
肉売り場に、焼肉のたれが置いてあるようなもので、便利
例えばギャンブルとか、会議室とか、
ユーザーに関係のない広告を見せられても、邪魔なだけ
自分に関係のない広告など、見ないし >>905
前まではそういうターゲッティング広告が万能という風潮もあったけど、全くの新規顧客を開拓するのには向いてなくて、今はまたマスの誘導のための広告をどうするかが流行ってきてるってもっぱらの噂だよな 検索実績ないユーザーが新規に何を検索したかを調べればいいだけだな そもそも志向性の無い人に、CMを見せて、嗜好を促すという毛色の違うアプローチなのである 欲しい商品をちょっと調べたりすると同じジャンルの広告ばかり出るようになるよね
もう買ったからその広告出しても意味ないのに、と思うことが多い 単体の決定木の可視化は作成出来たのですが、ランダムフォレストは可視化可能なのでしょうか?
ランダムフォレストの資料は沢山あるのですが可視化について書かれているものが見当たらないので質問させて頂きました
何百という木を作るので可視化しても意味が捉えにくいから可視化させないのかそもそも出来ないのかどちらなのでしょうか? 文字通り森だから無理
富士の樹海の写真でも貼っとけ >>913
>>914
>>915
ありがとうございます
単体の決定木は見れたのでランダムフォレストのような大量の木はどんな風に見えるのか気になったのでやってみたかったのです
export_graphvizを使おうとするとエラーが出て、その内容で検索してみると不可能だという記事も見つかりました >>916
多分pythonのsklearn使ってるんだと思うけどできるよ。
ただ、見てどうするんだろうとは思う。
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.tree import export_graphviz
X, y = load_iris(return_X_y=True)
cls = RandomForestClassifier()
cls.fit(X, y)
for i, t in enumerate(cls.estimators_):
export_graphviz(t, "tree_%02d.dot" % i) >>900
結局、AIブームで儲かったのは
エンジニアにGPUを売ったエヌビディアだけというオチだったな
エヌビディアのGPU買ってAI開発して儲けた話は一つも聞いたことがない 普通に各社webサービス内部などでAI開発の成果が金稼いでるだろ AIで超儲けた!
って話は出ないね
ゴールドマンサックスがトレードに使ってるという公式発表は出たが、どこまで事実か NvidiaのGPU売上はAIブームに乗って2015年以降3倍に増加
株価は10倍化 AIとトレードを結び付けないほうが良い。
ここで前も書いた気がするが、株価はAIでも、どんな手段でも予測できない可能性がある。
効率的市場仮説というやつだが。 正しいなら、いかなる手段でも予測できない事になるからAIですら無意味。
効率的市場仮説(こうりつてきしじょうかせつ)
現時点での株式市場には利用可能なすべての新たな情報が直ちに織り込まれており、超過リターンを得ることはできず、株価の予測は不可能であるという学説である。
ランダム・ウォークを説明する考え方になるが、科学的に証明はされてはおらず、確からしいという仮説の域を出ていない。
効率的市場仮説の下、株価指数連動型インデックスファンドとETF(上場投資信託)が誕生し、目覚ましく普及してきた。
https://www.nomura.co.jp/terms/japan/ko/A02426.html システムが一切、予測できてないのに、儲かるんだったら運でしか無い。 ゴールドラッシュから、同じ事の繰り返しだな
金を掘る人よりも、金を掘る人に道具を売る人が金持ちになる AIを使った投資で儲かるならグーグルがとっくに手を付けて成功しているはず
最先端の技術が真っ先に注ぎ込まれるのは軍事と金融 AIを使っているヘッジファンドが高リターンを出しているのは事実だし、
開発メンバーは、GoogleやIBMの最前線からヘッドハントされた精鋭揃い。
データに隠れている情報を引っ張り出し、
AIとして活用できることが出来る人間は、本当に、ごく僅かしか存在しないと思われる。
日本国内のポイントカード各社が、
6,000万〜8,000万件の顧客の購買データを持っていながら、
広告ぐらいしか活かせていないのに象徴されるように kaggleの電話番号認証のSMSが来ないんだけど
なんでかな?
+818012345678
+81-80-1234-5678
+8180-1234-5678
みたいの全部ダメ GoogleやIBMの最前線からヘッドハントされた精鋭揃い
www 機械学習を使いこなすNetflix社員の年収は5300万円 >>935
どこで誰がいつ何を買ったかまではわかるんじゃないの? 日本にいる限り、機械学習の論文をスクラッチで実装できるレベルになっても
大していい収入は得られないみたいだなあ
まあ。海の向こうでも5000万とかもらっているのは、
機械学習で新しいビジネスを開拓できる一部の人間だけみたいだけど プリファード何とかの人たちは結構もらってると思うけど 論文読んで実装するだけで高級もらえる仕事なんて世界中どこにもねえだろ >>939
いわゆるAI産業って基本的に詐欺だから、コンサルできないと金にはならないだろうな
実業で実質的な大きな利益を出すのはほぼ不可能でしょ AIが詐欺ってそもそもアホな考えだぞ。
グーグルのアルファ碁でAIの実力が示されてて有効だ。
AIが、人間がプログラムするよりも、人間のプロよりも強くなった。 >>943
うん。AIすごいね。で、どうやって金を生み出すの?
そう聞かれて相手に夢を見せられるような回答ができる?
それがコンサル力だよ
実際に利益が出るかどうかは問題じゃないし、問題にしてはいけない
そこに自ら手を突っ込んでしまうと一気に泥臭くなって単価が下がる たいして売上実績もないのに将来性だけで上場したHEROSの社長が一番AIを上手く活用してるよね >>945
君はもちろん払わないだろうけど、基本的にデータ分析やAI系の商売相手ってITについて素人同然のユーザー企業だからね
流行りだからなんかやってみることになったけどよくわかんないんだよね〜予算あるけど何やったらいいのかな〜くらいの意識よ
で金取ってPoCして「やれることはやった。期待したほどの効果が出なかったのは、お前らが選定したテーマとデータが悪いから。」で客に押し付けて逃げる
それがAIビジネス データ突っ込んだら必要な前処理と
最適な学習手法と
最適な評価指標を自動で教えてくれるツールが欲しいわ。 1銘柄の株価上下を予測するのが精度はでなくても、
1000銘柄くらい一気に同時学習させて
好調な上位10銘柄を出力させてそれらに
分散投資すればいいのではないだろうか。
問題は売却タイミングだな。
1度買ってしまったものはその銘柄の上下を
予測しなけりゃならんからな。
となると1ヶ月後に株価の増分が最大になる銘柄の
上位10を予測させて1ヶ月後に必ず売却すれば
いいのか。
テスト精度がそれなりに良くて、
勿論時系列データのSARIMAXを考慮すれば上手く
行きそうな気もするが… >「やれることはやった。期待したほどの効果が出なかったのは、お前らが選定したテーマとデータが悪いから。」で客に押し付けて逃げる
それがAIビジネス
請負ならそれでいいんだろうけどね 自社事業ならそれが社内の部門同士の話に置き換わるだけだよ
AIやる人はコストセンターだから厳格な利益目標を求められる立場ではない
プロフィットでデータやってる人って技術的にはエクセルとBIの職人でしかないよ >>948
DataRobotがそれできるんじゃないの? >949
マジレスすると市場でそれやっている連中の時間軸はms単位やで 株やるならインデックスの対象銘柄をファンダメンタルで半分くらいに絞って、中期くらいで分散投資するのはどうだろう
ベンチマークを少し上回るくらいは難しくなさそうだし、
チャートを学習させるよりは経済の本質的な勉強になるから結果的にダメでも得るものがあるだろう 今更ながらアルファ碁とアルファゼロの論文読んでるけど、
これで碁が強くなるのは分かるけど、将棋まで強くなったってのは眉唾だな
序盤は強くなりそうだけど、中盤と終盤は従来の方法の方が絶対に強そう >>956
そこは俺も引っかかる。
確かモンテカルロサーチはAI将棋やってる人達が色々試したけどあんまり結果出なかったって話だと思った。
というのも将棋は囲碁と違って良い手、悪い手の差が激しいからより深いサーチが有効って
ゲームだから。 >>947
てかユーザーはユーザーで普通にまともにデータを用意できないというか、
そもそもスキーマーがぶっ壊れまくってるのを押し付けてくるユーザーも普通にいて
機械学習以前の問題。
はっきり言ってどっちもどっちで腐りまくってんだよ。 chainerって結構お手軽なんじゃね?
kerasはラップされすぎてよくわからん >>921
100%事実でしょ、特に仮想通貨がやばい
単純なsdf(FXと現物の価格乖離を防ぐシステム)のBOT+AIで
売り板や買い板出してる奴が機械か人間かを
出してる板の枚数と取引のキャンセルスピードなんかで判別できる
成行か指値かも同様に判別できて、sdfの境界を利用して取引命令の更新が遅い人間から
一気に証拠金を搾り取る事が可能になる
一度そいつから絞り取ったら、大資本のAIは基本的にそいつがロスカットされるまで相場を急変はさせない
いまFX(特に仮想通貨の)をやる奴は博打どころかほぼAIに証拠金巻き上げられるってことを理解してやるべき
例外は直後のニュース要素のみだからな なんで日本って投資後進国って言われてるのにFXや仮想通貨は活発なんだろう 仮想通貨の利益の源泉は
株やFXに比べて異常に広いスプレッドと
取引所によって提示価格が大きく違うことが
あるのを利用したサヤ取りだろう
タイミングを見計らってこれらの取引を行うのは
システム取引ではあるけれどAIは無関係と思われる 違うスレで答え貰えないのでちょっと話ずれてるかもしれないですがここで質問させてください
ニューラルネットの質問なんですがバイアスを入力1、重みbとして扱う時に
X=[x1,...,xn,1]
W=[[w11,...,w1k],...[wn1,...,wnk],
[b1,...,bk]]
Y=XW=(1,n+1)
になりますよね
隠れ層がある場合は次の層のバイアスのためにXWの最後の列が出力1になるようにしないといけないと思うのですが
W=[[w11,...,w1k,0],...[wn1,...,wnk,0],
[b1,...,bk,1]]
こうしてもいいのでしょうか 素直に行列の足し算を使って
[XW+B]の形にした方がすっきりすると思う すいません。
肌の領域判定をsklearn使ってやろうと思ってるですけど、識別機でおすすめとかありましたら教えて下さい。 昨晩サイエンスZEROで内視鏡のガン検診で人間の医者より精度良いって言ってたな とりあえず何も考えずxgboostにでも突っ込んどけ。 高卒低学歴だけど機械学習の勉強始めて数学とか分からないまま参考書進めてたけど出てくる結果が全然分からなくて統計の勉強も始めた
めちゃめちゃ遠回りだけど先に繋がると信じたい 実戦データマイニング: AIによる株と為替の予測 単行本 – 2018/6/20
https://www.amazon.co.jp/dp/4274222373/
この本どうなのだろう?
なんかユーザーレビューの評価が極端に悪いのだが AIに、株やFXは向いてないとおもってるが。
上で効率的市場仮説をいってたが。これが成立するならAI無効。
そもそも、システムトレードでAIを使ってるのか?
人間がやる思考、作業を自動化してるだけかもしれない。 実践以前に株やFXで、AIが有効である可能性がある理屈、理論を考えるべき。
有効でない物をいくらいじくっても何もならない。
簡単にいえば確実に勝てる手法ともいえるし、膨大な学習すればそれが可能だったらそれでもいいし。
理屈上、ありえるのか。 ファンダメンタルなら有効でしょ
アドホック色が強くなるし真面目に経済の勉強しなきゃいけないから人気ないけど 株は短期情報戦になったらインサイダー最強なのでムリ
長期の安いトコ拾って塩漬け戦法しかないからAIの出る幕はない 人間のトレーダーは、絶対に、ダウ平均・日経225などの平均株価に勝てない。
人間が取引すると、平均株価を下回る
最も確実なのは、アジアなど新興国の通貨を買うこと
日本円も1ドル、360円が80円になったように、
必ず発展していくと通貨の価値が上がるから
発展途上国の通貨の価値は上がるが、先進国のは下がる。
つまり地球全体が平均化する 新興国通貨も結構なギャンブルに思えるけどね
地政学的リスクとか流動性リスクとか >>976
わろた
ここまでひどいのも珍しいが
きっとひどいんだろ >>976
これはすごいw
カスタマーレビュー
星1つ 100% そのわりに古本高いね
ていうか金融に使われてる機械学習技術みんなひどい もうかりゃだまって実行するだろ。本なんか書くよりはるかに儲かるだろう。 >>987
本で儲かる手法を公開すれば同じシステムに儲けが持って行かれるしな。 投資関係のテクニックや新理論に対して「儲かるなら公開せず発案者が独占するだろ」とよく言われるが、
大資本を持たない場合は大して稼げないので公開してしまって業界内有名人になってセミナーや書籍等で稼ぐ方が効率的だったりする
そもそも非公開にしたってどうせ誰かがその内似たようなのを作るから 理想は買うだけ買って読まれない本
赤旗新聞や朝日新聞や聖教新聞のように 大企業は数学上の重要な発見とかを企業秘密にしているらしいね。 バフェットみたいに超有名になれば自己実現的に儲かる気もするけど >大資本を持たない場合は大して稼げないので公開してしまって業界内有名人になってセミナーや書籍等で稼ぐ方が効率的だったりする
糞セミナーや本を出してるのは
予算だけもってる素人に教えたいから
物を知らない人間には物が売れる 明地文男の3点チャージ投資法は、
本も出てるし、サイトでも公開してるけど、勝ち続けているだろ このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 151日 10時間 25分 19秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。