X



【統計分析】機械学習・データマイニング21

■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん (アウアウウー Sa4f-YdG1)
垢版 |
2018/11/04(日) 14:34:36.02ID:W830XVm1a
機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング20
https://mevius.5ch.net/test/read.cgi/tech/1533635797/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
0202デフォルトの名無しさん (ワッチョイ cdb3-m7DC)
垢版 |
2018/11/21(水) 20:31:26.96ID:KrKtdOIw0
>>187
届いた。2はまだラズパイには対応してない。
IntelのOpenVinoという環境で動作させるが、demoプログラムはintel cpu,intel gpu,Movidius,FPGAを容易に切り替えて試せる。
i3-8100とMovidius2を切り替えて試したがi3が数倍早い。
0205デフォルトの名無しさん (ワッチョイ 0a23-A+Ur)
垢版 |
2018/11/21(水) 22:14:36.33ID:dkEaKjFA0
>>199
アメリカ様にっていうか、今の機械学習は大量のデータが必要なのでプラットフォームを押さえてデータを収集してるGAFAが強くなるのは当たり前
もちろんAI研究予算とかの話もあるけどそれ以前の環境作りで負けてる
新井先生は機械学習界隈ではなぜか評判悪いけど日本がアメリカみたく大量のデータを集められることはこれからもないだろう、などちゃんと現状分析して少データから学習できる手法の研究に舵を取るなどしてる
東ロボについて書いた本とか食わず嫌いせずにちゃんと読むと結構納得するところあるよ
0207デフォルトの名無しさん (アウアウカー Sa87-NVvz)
垢版 |
2018/11/22(木) 00:44:46.72ID:R0V4iNwva
GAFAが強いって言ってもその対象分野は割と限られているので、専門性の高いデータを持っているメーカーならそのメーカーの専門分野での勝負なら十分対抗できる
なのでいわゆるIT系ではなくメーカー所属で機械学習やる方が楽しいと思う
0209デフォルトの名無しさん (ドコグロ MMdf-uNjn)
垢版 |
2018/11/22(木) 10:23:39.44ID:Dp6DNPrbM
初歩的な質問なのですが、
過去のデータから未来を予想するという点で、
統計学と機械学習は似てると思うのですが、
なぜ、皆んな機械学習ばかり取り上げて統計学を取り上げないのですか?
データの豊富な時代だから分析が盛んになる事は分かりますが、
ならば統計学はダメですか?
0214デフォルトの名無しさん (トンモー MMe7-jBwB)
垢版 |
2018/11/22(木) 12:43:39.09ID:hODsVz+kM
>>209
機械学習の基本は統計学です。
しかし統計学はとても難しい学問です。
(つまり機械学習もその基本は本当はとても難しい)

現状は、統計学を知らないデータサイエンティストがほとんどです。

ですのでもし勉強できる機会があれば、
将来に備えて少しずつでも統計学を勉強される
ことをおススメします。
独学は難しいので、大学、大学院の授業を
受けたほうが良いです。
0215デフォルトの名無しさん (ワッチョイ 83b3-+eFV)
垢版 |
2018/11/22(木) 13:18:52.84ID:hXV3DCtX0
209ですが、統計学を知らないと基礎が分からないということなので、そういう方は既存の機械学習の手法を運用する事しかできず労働市場では評価は頭打ちということですよね?
つまり基礎の仕組みが分かってないから、既存の仕組みの問題点を改善することはできないですし。また、結果の解釈や適応する手法が妥当か分からないわけでしょうし。
0216デフォルトの名無しさん (ワイーワ2 FFdf-OXRW)
垢版 |
2018/11/22(木) 13:31:03.32ID:blyr971hF
ベイズ
0217デフォルトの名無しさん (ワッチョイ ffb0-nwd5)
垢版 |
2018/11/22(木) 13:37:54.86ID:BgqfFBOf0
いわゆる土方止まりかと言えばそうだろうね
ただ客も分かってないからブラックボックスな製品作って機械学習なりAI使ってますって謳えば仕事になるし、客も統計学んでないから結果の解釈もできないし、結果としてこの人は統計学んでるから高い給料払おうという根拠にもならない
0225デフォルトの名無しさん (JP 0He7-9Aa1)
垢版 |
2018/11/22(木) 18:46:37.32ID:lnWnRrZ2H
transformerがrnnじゃないってところがわからない
トークンx_iを次々入力するんじゃないの?
0229デフォルトの名無しさん (ワッチョイ cf81-xbeM)
垢版 |
2018/11/22(木) 23:09:52.28ID:HXxD15nn0
>>228
いちいち頭悪いな。最低でもその程度の教養は必要だって話で十分とはいってない。統計を理解するに越したことはないというだけの話。こーゆうアホが国会で下らん質問するんだよな
0237デフォルトの名無しさん (トンモー MMe7-jBwB)
垢版 |
2018/11/24(土) 07:44:12.04ID:zFN/wXgkM
普通に分析してればべイズになってるから
気にしなくていい
0241デフォルトの名無しさん (アウアウウー Sa27-H+hQ)
垢版 |
2018/11/24(土) 09:04:23.92ID:5t6hm1+Wa
>>240
64ビット買えよ。
0243デフォルトの名無しさん (ワッチョイ d3a5-xszH)
垢版 |
2018/11/24(土) 16:25:02.46ID:qNi2DrAy0
色んな知識を持っとく事は大事だと思うんだよね
上で出てる統計の知識にしてもドメイン側の知識にしてもさ
時間が取れるなら勉強すれば良いと思う
絶対無駄にはならない
ただ仕事だと悠長に出来ないからとりあえずライブラリ使いにとどまってしまうのも分かる
0258デフォルトの名無しさん (トンモー MMe7-jBwB)
垢版 |
2018/11/26(月) 00:20:06.09ID:jbSFfWJpM
大学教授は縁故採用が多い。
公募は形式だけで募集する前から決まってる。
そんなコネ馬鹿教授ばかりだから
新しいものなど認める訳がない!

まず馬鹿だから理解できないし、
新しくて有効なものを認めてしまうと
己の地位低下を招くから。
0260デフォルトの名無しさん (ワッチョイ 6f3b-NMzV)
垢版 |
2018/11/26(月) 01:23:54.55ID:CHI+qQuw0
工学系だとFEMの理論知らなくても解析できるしAIもそんなもんでしょ
0261デフォルトの名無しさん (ワッチョイ 2381-A3/R)
垢版 |
2018/11/26(月) 01:24:22.41ID:avRvugCi0
自然言語処理系に強いツールを紹介してもらえませんか?
とりあえず、文書の分類や意味の解析などをやりたいです。
0263デフォルトの名無しさん (ワッチョイ 2381-A3/R)
垢版 |
2018/11/26(月) 01:58:36.86ID:avRvugCi0
>>262
プログラムを使って色々カスタマイズしたいので、ライブラリーがいいです。
TensorFlowの自然言語処理拡張ライブラリーみたいなものがあれば・・・
0264デフォルトの名無しさん (ワッチョイ cf06-kbBB)
垢版 |
2018/11/26(月) 02:17:09.45ID:cKVEkA6F0
結局、機械学習の専門家ではなく、データを管理してる現場担当の人間がマイニングするのが一番効率がよい

学生らに言いたいがデータサイエンティストなんてなるなよ。企業じゃ使えないから
0267デフォルトの名無しさん (ワッチョイ e323-A3/R)
垢版 |
2018/11/26(月) 13:45:20.79ID:M4lkR7sD0
>>257
ほんそれ
叩いてつぶすのが得意
0269デフォルトの名無しさん (ワッチョイ 83b3-+eFV)
垢版 |
2018/11/26(月) 14:45:35.00ID:7pwlsRQc0
医療に機械学習などデータサイエンスを結び付けて、
効率的な医療を実現するような仕事をしたいと考えている学生ですが、
医学部医学科の学生が(医学の勉強はもちろんやるとして)統計や機械学習などを学ぶことに意味はあると思いますか?
0271デフォルトの名無しさん (ワッチョイ 6f67-/8bD)
垢版 |
2018/11/26(月) 16:13:25.97ID:xGQr/GdK0
医者なら統計は知ってそう。薬学では統計使いまくると思いますよ。
技術者に丸投げしないためにも勉強した方がいいとおもいまふ。
以上、雑魚エンジニアの一般論的意見でした
0272デフォルトの名無しさん (ワッチョイ ff23-wpGg)
垢版 |
2018/11/26(月) 16:57:02.70ID:i08FqW6v0
>>263
本当にDeepな手法でやる必要がある話なのかをまず考えてみては
TF使ってるくらいだからPythonで書いてるんだろうしgensimで実装されてるアルゴリズムを試してはどうだろう
分散表現を作るだけでも役に立つだろうし
0276デフォルトの名無しさん (ワッチョイ bf15-nfAC)
垢版 |
2018/11/27(火) 11:40:07.25ID:ltShiaEd0
花の画像から、花びらやがく、茎などの部位を機械学習で着色する仕組みを考えています

今は手作業で200枚くらい正解データがあって、
花びらを赤、おしべめしべを黄、がくを緑、茎を青といったルールで色づけています
花は身近なタンポポなど野草がほとんどで18種類です
データが圧倒的に足りていないのもわかっているので
特定の花だけに限定して正解データを手作業で作る作業もしています

文字・数字認識や物体検知の課題では、画像と正解ラベルをセットで学習させていますが
私の課題の場合、ピクセル単位でどこが花びら=赤、茎=青、といったデータも作る必要があるのでしょうか?
線画を着色するGANsの仕組みが近いかなとも思い調べたのですが、
着色範囲がぼやっとしていて、私の課題にはそぐわないように感じました

実現可能性が低いのは承知のうえで、こういった課題の場合
どういう仕組みが考えられるのか、お詳しい方アドバイスいただけたらうれしいです
スレ違いでしたらすみません
0280デフォルトの名無しさん (ワッチョイ bf15-nfAC)
垢版 |
2018/11/27(火) 18:32:10.86ID:ltShiaEd0
>>277
キーワードとても助かります
やはりピクセル単位でラベル付けが必要ということでしょうか
道路の白線を教師なし学習でやってみたという事例も読んでみましたが
元画像の色情報が重要ということで、いろいろな色がある花の場合難しいかなという印象でした
とりあえずこのアプローチで試行錯誤してみます
ありがとうございます

>>278
精進いたします
0281デフォルトの名無しさん (アウアウエー Sadf-9GuY)
垢版 |
2018/11/27(火) 19:30:07.16ID:basvWsrHa
>>276
pix2pixでセマンティックセグメンテーションするのはどうだろう?
データが大量になくてもそこそこ出来る(200枚だと流石に少なすぎるかもしれないが)
0282デフォルトの名無しさん (JP 0H87-Kv/S)
垢版 |
2018/11/27(火) 23:10:55.14ID:EAd/1gIZH
>>269

機械学習を活用しようとしている一研究医師としては、意味があるとは思う。

ただ未来ではなく現在の機械学習技術をベースに話をすると、有用な成果を出すためには
機械学習の知識より医療の経験の比重が高い印象。

現在の機械学習技術は活用できる範囲がかなり限定的なため、何でもかんでも医療データを
突っ込めば成果が出るというものではない。

学生なら趣味として機械学習の本のサンプルプログラムを動かしつつ、応用が利く臨床医
となるために医学自体の勉強をより頑張る必要があると思う。
0283デフォルトの名無しさん (ワッチョイ bf15-nfAC)
垢版 |
2018/11/27(火) 23:24:06.87ID:ltShiaEd0
>>281
ありがとうございます
単語で調べたところ、猫が含まれた画像から猫の範囲を抽出する、という事例を見つけました
セマンティックセグメンテーションともに、自分なりに少し時間をかけて理解に努めます
0287デフォルトの名無しさん (ワッチョイ e323-A3/R)
垢版 |
2018/11/28(水) 09:58:25.11ID:zomCLGU30
>>286
ついでに資格も取れる合宿は有りますか
0291デフォルトの名無しさん (トンモー MMe7-jBwB)
垢版 |
2018/11/28(水) 20:16:20.61ID:2i6dC1ZOM
アマゾンのレコメンドシステムが
未だにクソの邪魔ものでしかないのに
クソのような教材に決まってる。
まったく興味ない
0298デフォルトの名無しさん (JP 0Hff-Anpr)
垢版 |
2018/11/29(木) 18:02:48.55ID:lRn1yU1jH
angularとかのほうがわけわからん
0301デフォルトの名無しさん (ワッチョイ 5a97-ad2z)
垢版 |
2018/11/30(金) 02:11:39.26ID:gAFwEIHo0
交差検証についてなんですが、例えばアイリスデータでSVMで3分割の交差検証した時(3分割の平均が)94%〜97%ぐらいばらつきがあると思うのですが3分割の平均をさらに100回の平均とかして評価するって感じでいいんですかね?
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況