X



【統計分析】機械学習・データマイニング19
■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん (スッップ Sd12-4l6a)垢版2018/03/09(金) 18:09:45.75ID:WX3plG2ad

機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング17
http://mevius.5ch.net/test/read.cgi/tech/1502032926/
【統計分析】機械学習・データマイニング18
http://mevius.5ch.net/test/read.cgi/tech/1507807291/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
0393デフォルトの名無しさん (ワッチョイ d68a-lkdC)垢版2018/06/05(火) 10:48:23.57ID:4dP1NJWe0
数学+統計+機械学習
+python+DB+クラウド+extra …… これで年収600ぐらいかな
自然言語処理とか、そういう専門領域を身に着けて、給料がすこし増える感じ

年収1000を超えている奴らは普段いったい何をやっとるんだろう
0396デフォルトの名無しさん (ワッチョイ d681-CfZI)垢版2018/06/05(火) 12:27:13.03ID:XrtFx+DZ0
元々そんなに年収高くないサラリーマンやってる前提の話なのか。
その会社にいたままで高所得は難しいのは当然だとおもうが。
転職やフリーは考えないのか。
たとえばテレビ業界とか年収高いほうだろうが、フリーアナウンサーになるのがいるが。
0404デフォルトの名無しさん (ササクッテロ Sp05-cMCF)垢版2018/06/05(火) 19:15:28.45ID:FpfgnXpSp
>>393
この場合の数学+統計+機械学習ってどのくらいのレベルでしょうか
BishopやMurphyのテキストがちゃんと解読できるくらい?
0405デフォルトの名無しさん (ワッチョイ 0e4b-sZ2J)垢版2018/06/06(水) 06:58:46.99ID:NJm/h3bv0
なんで機械学習ってインタプリタ主流なの?
遅いじゃん
0406デフォルトの名無しさん (ワッチョイ 4123-PWQK)垢版2018/06/06(水) 09:41:33.10ID:I9hgDbEz0
https://youtu.be/zYKOL5RpVbo
【大学数学】ベイジアンネットワーク【機械学習】
概出?
0407デフォルトの名無しさん (JP 0Hf1-etJG)垢版2018/06/06(水) 12:33:25.21ID:bWEoegzUH
全然ネットワークじゃないじゃん
0409デフォルトの名無しさん (ササクッテロ Sp05-cMCF)垢版2018/06/06(水) 14:14:23.03ID:r2g/1oegp
>>408
なるほど
あのレベルのテキストだと歯が立たない箇所が多くて
0410デフォルトの名無しさん (アウアウカー Sa5d-wn3A)垢版2018/06/06(水) 17:31:32.85ID:q1bS2rcEa
>>405
Juliaは速いんだけどな。
0412デフォルトの名無しさん (アウアウカー Sa5d-zSKM)垢版2018/06/06(水) 19:38:43.45ID:hS3HWMA0a
実験的にパラメータちょっと弄って変化確認するならインタプリタが最適
その後実運用する段階ではコンパイル型言語使って作り直してコンパイルした方が速度面で有利だろうけど実際のところどうする人が多いのかは知らない
0417デフォルトの名無しさん (ワッチョイ d681-CfZI)垢版2018/06/06(水) 22:34:15.26ID:+qEQXuQ70
>>415
グーグルのアルファ碁からしてわかってないけど発展してるだろ。
別にはなるが、ディープラーニングを広義に学習方法の自動学習法と捉えた場合。
使う手法が、多層ニューラルネットである必要はないわけだが。このへん進んでるか。


ディープラーニング - Wikipedia

しかし、近年、ヒントンらによる多層ニューラルネットワークの学習の研究や、学習に必要な計算機の能力向上、
および、Webの発達による訓練データ調達の容易化によって、充分学習させられるようになった。
その結果、音声・画像・自然言語を対象とする問題に対し、他の手法を圧倒する高い性能を示し、2010年代に普及した。
しかしながら、多層ニューラルネットが高い性能を示す要因の理論的な解明は進んでいない。
0419デフォルトの名無しさん (アウアウカー Sa2d-abwI)垢版2018/06/07(木) 00:41:54.57ID:2mKmeoG5a
機械学習の個々のアルゴリズムには流行り廃りがあるけど統計学に基づく点には変わりないので
最新の機械学習のブラックボックス化された関数使えるより統計学を体系的に学んでいる人の方が長期的には有利
0420デフォルトの名無しさん (ワッチョイ eb81-oLIW)垢版2018/06/07(木) 04:16:51.96ID:EtNPtLaF0
これは?




情報幾何への入門と応用
http://www.sci.osaka-cu.ac.jp/~ohnita/2006/inf_geom/sos_dan/book_0403.pdf


非加法的エントロピーを加法的エントロピーにする方法ーAdS/CFT対応の情報幾何バージョンー
http://www2.itc.kansai-u.ac.jp/~afujioka/talk/tanaka.pdf
0422デフォルトの名無しさん (アウウィフ FFd5-MvoD)垢版2018/06/07(木) 10:15:29.32ID:4mIWw2z0F
>>413
バイトコードにしたからと言ってネイティブ機械語みたく爆速になる訳じゃないよ
for文とかアホみたいに書いてるよりスッキリnumpy使え
0423デフォルトの名無しさん (アウウィフ FFd5-MvoD)垢版2018/06/07(木) 10:17:11.63ID:4mIWw2z0F
>>417
ほんそれ
0424デフォルトの名無しさん (ワッチョイ eb8a-6+Fv)垢版2018/06/07(木) 18:31:54.55ID:Kn/6DS9U0
>>419
いまは実感が湧かないけど、たぶんだけど35歳とか過ぎた頃に違いが出てくるんだろうな
0430デフォルトの名無しさん (ワッチョイ eb8a-6+Fv)垢版2018/06/09(土) 17:15:22.94ID:UJU1F4Hl0
機械学習のブラックボックス化された関数うんぬんというけど
数学わからない癖に機械学習のアルゴリズムを組んでる
文系エンジニア的な奴はそんなにいないよなあ
そんな入口そうそうない
0431デフォルトの名無しさん (アウアウカー Sa2d-abwI)垢版2018/06/09(土) 18:48:56.36ID:yrN1RUIVa
機械学習ブームがここまで盛り上がるなど予想されていなかったので基礎研究からやってる企業を除いて機械学習の専門家を雇っている企業などほとんどない
バリバリの理系出身だとしても大半は専門外の人間が錬金術的にパラメータ調整してたまたま上手くいっているだけで基礎から理解して使えている人はそうそういない
偶然の産物だろうが適切な出力が得られていればそれで構わないが、基礎が分かっていないと今後新しいアルゴリズムが主流になった時も同様に運任せで錬金術することになる
0433デフォルトの名無しさん (ワッチョイ 9323-LHz9)垢版2018/06/10(日) 01:49:54.08ID:Ame7ypF10
だとしたら、アセンブラ出来ない奴、デジタル回路が組めない奴、はみんな基礎が分かってないから
運任せでプログラムを組むべきじゃないなw

要は、各々の世代でどのレイヤーの知識が重視されるか?なんだと思う
今はベクトル数学や統計学のレイヤーとは離れた技術が上の層にどんどん積み重なっていて
そろそろ分業しないと成り立たなくなる時代が来ている様な気がする
0434デフォルトの名無しさん (ワッチョイ b3dc-X4KX)垢版2018/06/10(日) 08:25:10.29ID:7GMv3HHL0
富士通のZinraiとか、金かけて、宣伝しているけど、
国内企業のAIってどのレベル?

某大手企業のを試用した範囲では、ゴミのような出来。
このスレの連中のような趣味でやってるレベルにも達していない。

「偶発的な適切な出力」という表現があるけど、
恐らく、作っている奴は、「適切」の指標すら解っていない。
0437デフォルトの名無しさん (アウアウウー Sad5-sWV6)垢版2018/06/11(月) 09:37:38.76ID:BjFidTNMa
>>436
東芝とNECは会社が危ない。
0440デフォルトの名無しさん (アウアウカー Sa2d-abwI)垢版2018/06/11(月) 10:10:19.21ID:dbmbgvPBa
AIで会社経営を立て直すには過去の大量の成功・失敗の経営情報が詳細な内部情報とセットで必要であり
それは一社及びそのグループ会社程度の規模では量的に足りなさすぎるので実質的に不可能と考えて良い
0444デフォルトの名無しさん (JP 0H05-iGaC)垢版2018/06/11(月) 12:29:12.99ID:fk/EJioNH
BIやっても
それを読み解いて
活用できる経営者が居ないとね
0447デフォルトの名無しさん (マクド FFad-6+Fv)垢版2018/06/11(月) 15:35:31.29ID:izT/KIr3F
機械学習って、統計学の横に色んなジャンルが派生的に発展していて
縦に発展しているようなイメージがないんだが

流行り廃りで、いま学んだ知識の大半が今後は通用しなくなりそうというか
業界の人たちはかなり悲観的だよね
0448デフォルトの名無しさん (ワッチョイ d123-MvoD)垢版2018/06/11(月) 15:53:18.80ID:539MWtkj0
積み重ねだから役に立たなくなるってことはないよ
0449デフォルトの名無しさん (アウアウカー Sa2d-abwI)垢版2018/06/11(月) 17:56:57.83ID:dbmbgvPBa
派生部分しか理解していない人は流行りが終了すれば新しい流行りを1から勉強し直す
根幹となる統計学が理解できていれば新しい流行りの理解も早いはずなので流行り廃りに対応しやすくなる
0450デフォルトの名無しさん (アウアウウー Sad5-sWV6)垢版2018/06/12(火) 06:43:03.81ID:p6iYlMgIa
大学程度の数学と物理をやっとけ。できるなら修士レベル。後は後からどうにでもなる。
0451デフォルトの名無しさん (ワッチョイ eb81-oLIW)垢版2018/06/12(火) 06:45:11.66ID:BglwDZJM0
あとからどうにでもなるなら、高卒でもいいだろ。
機械学習に必要な分だけ勉強すれば。
0454デフォルトの名無しさん (アウアウカー Sa2d-abwI)垢版2018/06/12(火) 07:30:35.71ID:9sJ+Gh1za
>>451
勉強などやる気さえあれば誰でもできるがそもそも高卒という時点で機械学習エンジニアとしての採用はほぼ閉ざされるから
企業のリソース使わず自力で機械学習でビジネス起こす当てがあるなら話は別だが
0458デフォルトの名無しさん (ワッチョイ eb81-oLIW)垢版2018/06/12(火) 09:25:47.15ID:BglwDZJM0
>>456
それほぼ一緒だとおもうが。たとえば、不完全性定理とか数学的抽象度が高いし論理的だろ。



不完全性定理

数学を基盤にし、証明を積み重ねていけば、
いつかは「世界のすべての問題を解決するひとつの理論体系」「世界の真理」に到達できるのではないかと信じられていた。

さて、1930年頃のこと。
数学界の巨匠ヒルベルトは「数学理論には矛盾は一切無く、どんな問題でも真偽の判定が可能であること」
を完全に証明しようと、全数学者に一致協力するように呼びかけた。
これは「ヒルベルトプログラム」と呼ばれ、数学の論理的な完成を目指す一大プロジェクトとして、当時世界中から注目を集めた。

そこへ、若きゲーテルがやってきて、「数学理論は不完全であり、決して完全にはなりえないこと」
を数学的に証明してしまったから、さあ大変。

ゲーデルの不完全性定理とは以下のようなものだった。
1)第1不完全性原理
「ある矛盾の無い理論体系の中に、肯定も否定もできない証明不可能な命題が、必ず存在する」
2)第2不完全性原理
「ある理論体系に矛盾が無いとしても、その理論体系は自分自身に矛盾が無いことを、その理論体系の中で証明できない」

http://noexit.jp/tn/doc/fukanzen.html
0460デフォルトの名無しさん (マクド FFad-6+Fv)垢版2018/06/12(火) 13:20:41.70ID:1274DHP3F
>>454
実は機械学習のエンジニアの求人は学歴不問のところが多い
バイトから入るという裏技もあるから、やる気さえあれば高卒でも余裕でなれる

独学→バイト→正社員→お金を貯めて研究者

理論的には、無理ではない
0461デフォルトの名無しさん (マクド FFad-6+Fv)垢版2018/06/12(火) 13:24:03.36ID:1274DHP3F
あと自分は絶対にやらないけど
上でも言っている人もいる通り、やっぱり物理は出来た方がいいんじゃないか

機械学習+機械工学で年収2000万ぐらいの求人がちらほらある
たぶん自動車でも作ってるんじゃないか
この分野で突き抜けた年収が欲しければ、機械学習ともう一つ専門分野が必要だな
自分のいる世界とは別世界だけど
0464デフォルトの名無しさん (マクド FFad-6+Fv)垢版2018/06/12(火) 16:22:10.97ID:eHyM52fUF
>>463
>>あと物理と機械工学は別だから。
そこらへん詳しくないから適当書いたスマン

でもバイトで職務経験つけて、そのまま正社員になった奴はうちの会社に一人いるぞ
年齢的に、院試を受ければ、研究者にもなれるんじゃないかな
0466デフォルトの名無しさん (ワッチョイ 2923-MvoD)垢版2018/06/12(火) 17:49:47.48ID:bLF3+6cr0
>>451
高卒には越えられない壁がある
よほど貧乏で大学行けなかったとかでなければ
理解できる頭あれば大学卒業(あるいは修士以上)してるはずで
高卒が高卒たる所以
0467デフォルトの名無しさん (マクド FFad-6+Fv)垢版2018/06/12(火) 17:50:17.97ID:eHyM52fUF
言うか!
DS系なんだけど、ぶっちゃけネットでググるとすぐ出る
ただ、バイトをたくさん取ってるわりに、フリーターから定着できたの俺が知る限りひとりだけ
他にもいるのかもしれないけど
0469デフォルトの名無しさん (マクド FFad-6+Fv)垢版2018/06/12(火) 17:58:35.69ID:eHyM52fUF
中高生の時に虐待を受けていたからまともな精神状態で勉強に集中できなかったとか、
まあ色々なパターンがあるよね
高卒から這い上がってくる奴はいることにはいる
そういう奴をまったく見かけないなら、逆にその人が見かけない世界にいるんだろ
0471デフォルトの名無しさん (ワッチョイ 935d-EqDK)垢版2018/06/12(火) 19:13:14.97ID:iAqg3u7f0
そろそろ、wikiみたいな「集合知」って機械学習で置換できちゃうんじゃないかな
どんなマイナージャンルでも、一人が「こういうキーワードでジャンルの情報集積を」って
指定すれば、入門的なハウトゥや歴史的なインデックスまで作れたり
将来的には検索ワードみたいに随時処理でそれらが出力されたりするんだろうけど、
現段階でも、入力された特定キーワードに関する体系立てた知識の集積は可能じゃない?
たとえば、「ホラー題材のギャグ漫画」くらいだと、概要や歴史的サンプルをまとめられたり
0474デフォルトの名無しさん (ワッチョイ 935d-EqDK)垢版2018/06/12(火) 21:31:23.02ID:iAqg3u7f0
>>473
何事かに対して、どういったジャンルに属する話かと判断して、それを総括するフォーマットを
類似記事から引用する学習は可能だと思う
現状でも、Wikiで項目を作る上で「似たような記事」から構成を引用するのが普通だ
そこそこのマイナージャンルでも、テキストとして情報化されてきている
「データ群の前半に集中する情報を要約して『概要』とする」ことや、「年代と頻出で年表的に
フォーマットを形成する」のも可能だと思う
というか、Wikiの各記事においてすでにこういう「情報をまとめる上での構成」ができているんだから
それ自体を機械学習できるはずなんだよ
0475 ◆QZaw55cn4c (ワッチョイ d360-EqDK)垢版2018/06/12(火) 21:46:20.13ID:QT2PgMnm0
>>474
>現状でも、Wikiで項目を作る上で「似たような記事」から構成を引用するのが普通だ
一言で「似ている」というけれども、「犬と似ている」「猫と似ている」は現状の深層学習で実現できるとしても、
「似ているもの同士をまとめる」はまた別ではないか?
このタイプにおける教師データは成立するのだろうか?
0476デフォルトの名無しさん (ワッチョイ 935d-EqDK)垢版2018/06/12(火) 22:16:43.01ID:iAqg3u7f0
>>475
「犬と似ている」と「猫と似ている」は、フォーマットとしてほぼ同じ語り口で記事になってると思う
同じようなフォーマットの記事から、頻出単語や構文を教師データとして、関連する情報として
拾うのは単純に機械学習の範囲だと思うけどなぁ
「同じような単語を同じような語り口で記述している記事」が教師データなわけで
0477 ◆QZaw55cn4c (ワッチョイ d360-EqDK)垢版2018/06/12(火) 22:28:20.05ID:QT2PgMnm0
>>476
>「同じような単語を同じような語り口で記述している記事」が教師データ
メタな構造そのものを教師データにできるものかな?
0478デフォルトの名無しさん (ワッチョイ 935d-EqDK)垢版2018/06/12(火) 22:41:42.13ID:iAqg3u7f0
>>477
むしろそういう「言及」をデータとして扱わないと機械学習の有効性が意味を持たないと思うよ
「○○は△△という意味で□□である」っていう関連を一つの型として学習する必要がある
それをビッグデータから学ばないと、各データを統合で結ぶだけの古典的計算機に過ぎない
0479 ◆QZaw55cn4c (ワッチョイ d360-EqDK)垢版2018/06/12(火) 23:07:13.16ID:QT2PgMnm0
>>478
>それをビッグデータから学ばないと、各データを統合で結ぶだけの古典的計算機に過ぎない
なるほど!

>「○○は△△という意味で□□である」っていう関連を一つの型として学習する必要がある
二項関係から三項関係への進化は、今は出来ていないんじゃないかな?
0480デフォルトの名無しさん (アウアウカー Sa2d-abwI)垢版2018/06/13(水) 00:31:00.31ID:TuGh0Ju3a
Googleが猫の画像を判別させる人工知能を作るだけのために大量の猫画像を必要としたように、
wikiを作るとしたらその1項目毎に猫画像学習と同等かそれ以上の情報をかき集めて学習させる必要があるわけで
話題のcoinhiveみたいに世界中の各人のPCのリソース借りるような方法でもあれば可能かもしれないが特定の企業内だけで実現するには必要な計算資源が膨大すぎる
0481デフォルトの名無しさん (ワッチョイ 935d-EqDK)垢版2018/06/13(水) 05:39:50.82ID:HxLnaiGF0
Googleが画像から猫を判断させたのは、教師なしのニューラルネットワークによる学習だよ
AIによる学習結果は、その本質を理解しているという意味じゃない
「検索結果の中からざっくり中央値を取る」ようなもんだ
「〇〇について、どこの誰がいつから始めてこういう成り立ちだ」みたいなWikiっぽいレイアウトに
まとめるだけなら、既存のWebページと電子化されてる書籍だけで足りるかと
もともとWkipedia自体、外部サイトでの記述や書籍による出展が求められるわけで
そうした情報がちょいちょい間違ってたりするのも現状と同じ
0485デフォルトの名無しさん (アウアウカー Sa2d-RiuZ)垢版2018/06/13(水) 09:32:05.58ID:3yG4G9Yqa
高卒派遣で機械設計やっていますが3年やっても年収300がやっとなので機械学習とPythonを学んで年収500万ぐらいになりたいです
0488デフォルトの名無しさん (アウアウウー Saa5-70wb)垢版2018/06/14(木) 18:38:38.62ID:asb5qNMla
>>487
pythonって日本では需要が無いのでは。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況