【統計分析】機械学習・データマイニング21

■ このスレッドは過去ログ倉庫に格納されています
2018/11/04(日) 14:34:36.02ID:W830XVm1a
機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング20
https://mevius.5ch.net/test/read.cgi/tech/1533635797/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
2018/11/21(水) 20:31:26.96ID:KrKtdOIw0
>>187
届いた。2はまだラズパイには対応してない。
IntelのOpenVinoという環境で動作させるが、demoプログラムはintel cpu,intel gpu,Movidius,FPGAを容易に切り替えて試せる。
i3-8100とMovidius2を切り替えて試したがi3が数倍早い。
2018/11/21(水) 21:31:30.23ID:rDv5gjmyd
>>199-201
そうなのか、寂しいね…
2018/11/21(水) 22:01:14.61ID:pdIlKffL0
参考書ばっか読んでて実践らしい事なんもしてなかったからkaggle登録した
きっといい結果出なくて自分の勉強が無に帰す事になりそうで怖いけど頑張るわ
2018/11/21(水) 22:14:36.33ID:dkEaKjFA0
>>199
アメリカ様にっていうか、今の機械学習は大量のデータが必要なのでプラットフォームを押さえてデータを収集してるGAFAが強くなるのは当たり前
もちろんAI研究予算とかの話もあるけどそれ以前の環境作りで負けてる
新井先生は機械学習界隈ではなぜか評判悪いけど日本がアメリカみたく大量のデータを集められることはこれからもないだろう、などちゃんと現状分析して少データから学習できる手法の研究に舵を取るなどしてる
東ロボについて書いた本とか食わず嫌いせずにちゃんと読むと結構納得するところあるよ
2018/11/21(水) 22:24:14.66ID:hT2VdLLV0
東ロボデータセットでレッツチャレンジ!
2018/11/22(木) 00:44:46.72ID:R0V4iNwva
GAFAが強いって言ってもその対象分野は割と限られているので、専門性の高いデータを持っているメーカーならそのメーカーの専門分野での勝負なら十分対抗できる
なのでいわゆるIT系ではなくメーカー所属で機械学習やる方が楽しいと思う
2018/11/22(木) 08:40:58.06ID:8z5F93RV0
それが出来るなら一番面白いだろうね
209デフォルトの名無しさん (ドコグロ MMdf-uNjn)
垢版 |
2018/11/22(木) 10:23:39.44ID:Dp6DNPrbM
初歩的な質問なのですが、
過去のデータから未来を予想するという点で、
統計学と機械学習は似てると思うのですが、
なぜ、皆んな機械学習ばかり取り上げて統計学を取り上げないのですか?
データの豊富な時代だから分析が盛んになる事は分かりますが、
ならば統計学はダメですか?
2018/11/22(木) 10:24:39.28ID:sBqbuYGy0
異常検知ばっかりになりそうな気も
クラスタリングもあるか
2018/11/22(木) 10:42:17.70ID:nCpAPoMI0
>>207
コマツの工事車両が備えたセンサーを通信で収集して異常検知した事例とか、メーカーの工場でセンサーを張り巡らせて歩留まりを向上させるとか、そういうイメージの話?
2018/11/22(木) 10:45:14.87ID:sBqbuYGy0
高速道路の橋脚の疲労具合を動画撮って解析するのもあったね
2018/11/22(木) 11:09:30.23ID:HXxD15nn0
>>209
統計学を理解していないものが作ったモデルの特性を理解出来ないでしょう。統計学は必須スキルだよ。表面的な作業だけ覚えても通用しませんよ。
214デフォルトの名無しさん (トンモー MMe7-jBwB)
垢版 |
2018/11/22(木) 12:43:39.09ID:hODsVz+kM
>>209
機械学習の基本は統計学です。
しかし統計学はとても難しい学問です。
(つまり機械学習もその基本は本当はとても難しい)

現状は、統計学を知らないデータサイエンティストがほとんどです。

ですのでもし勉強できる機会があれば、
将来に備えて少しずつでも統計学を勉強される
ことをおススメします。
独学は難しいので、大学、大学院の授業を
受けたほうが良いです。
215デフォルトの名無しさん (ワッチョイ 83b3-+eFV)
垢版 |
2018/11/22(木) 13:18:52.84ID:hXV3DCtX0
209ですが、統計学を知らないと基礎が分からないということなので、そういう方は既存の機械学習の手法を運用する事しかできず労働市場では評価は頭打ちということですよね?
つまり基礎の仕組みが分かってないから、既存の仕組みの問題点を改善することはできないですし。また、結果の解釈や適応する手法が妥当か分からないわけでしょうし。
216デフォルトの名無しさん (ワイーワ2 FFdf-OXRW)
垢版 |
2018/11/22(木) 13:31:03.32ID:blyr971hF
ベイズ
2018/11/22(木) 13:37:54.86ID:BgqfFBOf0
いわゆる土方止まりかと言えばそうだろうね
ただ客も分かってないからブラックボックスな製品作って機械学習なりAI使ってますって謳えば仕事になるし、客も統計学んでないから結果の解釈もできないし、結果としてこの人は統計学んでるから高い給料払おうという根拠にもならない
2018/11/22(木) 14:51:40.76ID:UaY8qXziM
土方超えるのは論文書いたりしてないといけなさそ
2018/11/22(木) 14:54:04.32ID:GAFVC88E0
ブームが終われば土方は無用
2018/11/22(木) 15:24:50.61ID:nCpAPoMI0
でも統計学学ぶより個々の案件でちゃんとドメイン知識学んだほうが性能上がりそう

両方が望ましいのは当然として
2018/11/22(木) 15:40:15.79ID:wC8dwCsN0
今後、AIの価値を理解して使いこなせるのはSIじゃなくユーザー企業になるんだろうな
https://tech.nikkeibp.co.jp/atcl/nxt/column/18/00454/00012/
2018/11/22(木) 17:32:09.27ID:Y29WQs9AM
統計検定2級程度までの知識は必須でしょう。
2018/11/22(木) 18:11:00.78ID:UBqnJDX30
機械学習に数学はいらない
統計学は応用数学
機械学習に統計学はいらない
2018/11/22(木) 18:21:39.22ID:K3ZKHggPp
内田裕也かよ
225デフォルトの名無しさん (JP 0He7-9Aa1)
垢版 |
2018/11/22(木) 18:46:37.32ID:lnWnRrZ2H
transformerがrnnじゃないってところがわからない
トークンx_iを次々入力するんじゃないの?
2018/11/22(木) 21:17:06.93ID:uu0y6dgGa
>>222
いや準一級くらいはいる
2018/11/22(木) 21:45:40.69ID:Y29WQs9AM
>>223
モデルの中身理解出来ないオペレーターは要らないから笑
2018/11/22(木) 22:49:40.11ID:cenNNrIsd
どっちにしろ2級程度じゃモデルの中身とやらを理解できない件
2018/11/22(木) 23:09:52.28ID:HXxD15nn0
>>228
いちいち頭悪いな。最低でもその程度の教養は必要だって話で十分とはいってない。統計を理解するに越したことはないというだけの話。こーゆうアホが国会で下らん質問するんだよな
2018/11/22(木) 23:11:09.47ID:HXxD15nn0
>>228
頭の悪いレスはもういらないから。負け惜しみで下らんことほざくなよ?
2018/11/22(木) 23:18:23.54ID:cenNNrIsd
>>229
>>230
何怒ってんの?
2018/11/23(金) 00:09:57.66ID:1KJ0KFwU0
2級しか持ってないんだろう
2018/11/23(金) 09:26:41.15ID:e/aeG8J80
この手の資格は手当ての為だろう、能力とは関係ない
2018/11/23(金) 22:22:50.90ID:S8jBbYhAM
まーた無駄な知識の話してるw
そんなもの必要性皆無なのにw
2018/11/23(金) 23:51:23.89ID:OqByd5h70
ポチポチッとチートシートみて年収400万www
2018/11/24(土) 06:18:41.86ID:Ni8O1Wkdd
>>216
同意。分からんと困りそうなのはベイズ理論くらい
237デフォルトの名無しさん (トンモー MMe7-jBwB)
垢版 |
2018/11/24(土) 07:44:12.04ID:zFN/wXgkM
普通に分析してればべイズになってるから
気にしなくていい
2018/11/24(土) 07:44:50.88ID:beDKyLeQ0
ベイズ理論は基本で十分だろ、その先は難しい
2018/11/24(土) 08:00:43.55ID:X7WRD2d20
最尤法くらいは理解しててほしいな
2018/11/24(土) 08:18:03.34ID:mDVPC/470
Tensorflowを32bit windowsにも対応させてほしい
241デフォルトの名無しさん (アウアウウー Sa27-H+hQ)
垢版 |
2018/11/24(土) 09:04:23.92ID:5t6hm1+Wa
>>240
64ビット買えよ。
2018/11/24(土) 10:29:11.86ID:QDlc1GIX0
必要ないよ、チートシートみて適当にやるオペレーターだもん。
2018/11/24(土) 16:25:02.46ID:qNi2DrAy0
色んな知識を持っとく事は大事だと思うんだよね
上で出てる統計の知識にしてもドメイン側の知識にしてもさ
時間が取れるなら勉強すれば良いと思う
絶対無駄にはならない
ただ仕事だと悠長に出来ないからとりあえずライブラリ使いにとどまってしまうのも分かる
2018/11/24(土) 17:15:27.33ID:QDlc1GIX0
年収400と1000以上の差である。
2018/11/24(土) 17:28:23.12ID:rvJAZP1G0
就職した時点で決まってしまうかね。
ステップアップ出来るのかな
2018/11/24(土) 17:53:09.00ID:CD53DoQna
日本では外資を除けば今いる企業より上位の企業には転職できないルールがあるので無理
2018/11/24(土) 17:56:30.09ID:xNTYJE290
keras使い初めたけどチュートリアルから進めない
なんだこれ難しすぎるゾ
2018/11/24(土) 22:59:40.37ID:rvJAZP1G0
ルールねえ。yahooとか気にしなそうだがどうなんだろ
2018/11/25(日) 00:28:30.55ID:sLi2VwhH0
>>202
>Neural Compute Stick 2
GPUと比べてコスパどうなの?
2018/11/25(日) 01:15:47.57ID:1agksu/K0
>>248
yahooのヤクザ感半端ねーから。あそこはやべーぞ。
2018/11/25(日) 11:29:55.83ID:pe/+W9ct0
国内企業は通年採用だろうが賃金の面でも概ね外れ
実力あるなら外資一択
2018/11/25(日) 11:31:13.61ID:iwFTsSP90
GAFAだ〜
2018/11/25(日) 14:28:38.49ID:F8FHYO9d0
豊田にしなさいw
2018/11/25(日) 15:07:50.57ID:ILlUBUGaM
>>249
単純にコスパだけならGPUかと。
小さく省電力ってところに価値があると思っている。
2018/11/25(日) 16:04:22.36ID:z2TTGkcKa
あくまで貧弱なIoT機器の計算資源を補強する用途だろう
2018/11/25(日) 17:59:52.92ID:y7TBmMip0
せっかくlstmでやってたのに
構文木をだっさく取り入れちゃってどや顔してる日本人研究者カッコ悪い
transformerみたいな発想を産み出せなかったのが残念
2018/11/25(日) 22:47:19.06ID:nlMqs/cba
日本の学術会だと新しいものは評価されない(できない)から仕方ない
既に評価されているものを組み合わせるか、重箱の隅をつつくしかない
258デフォルトの名無しさん (トンモー MMe7-jBwB)
垢版 |
2018/11/26(月) 00:20:06.09ID:jbSFfWJpM
大学教授は縁故採用が多い。
公募は形式だけで募集する前から決まってる。
そんなコネ馬鹿教授ばかりだから
新しいものなど認める訳がない!

まず馬鹿だから理解できないし、
新しくて有効なものを認めてしまうと
己の地位低下を招くから。
2018/11/26(月) 00:57:19.62ID:5qB7B0lnd
講座のボスの言うとおりにしてれば丸く収まるからなw 飽きたらない優秀な人はみんな外に出ちゃう
260デフォルトの名無しさん (ワッチョイ 6f3b-NMzV)
垢版 |
2018/11/26(月) 01:23:54.55ID:CHI+qQuw0
工学系だとFEMの理論知らなくても解析できるしAIもそんなもんでしょ
261デフォルトの名無しさん (ワッチョイ 2381-A3/R)
垢版 |
2018/11/26(月) 01:24:22.41ID:avRvugCi0
自然言語処理系に強いツールを紹介してもらえませんか?
とりあえず、文書の分類や意味の解析などをやりたいです。
2018/11/26(月) 01:49:46.40ID:i08FqW6v0
>>261
GUIのアプリがいいのかなんらかの言語のライブラリがいいのか詳しく
263デフォルトの名無しさん (ワッチョイ 2381-A3/R)
垢版 |
2018/11/26(月) 01:58:36.86ID:avRvugCi0
>>262
プログラムを使って色々カスタマイズしたいので、ライブラリーがいいです。
TensorFlowの自然言語処理拡張ライブラリーみたいなものがあれば・・・
2018/11/26(月) 02:17:09.45ID:cKVEkA6F0
結局、機械学習の専門家ではなく、データを管理してる現場担当の人間がマイニングするのが一番効率がよい

学生らに言いたいがデータサイエンティストなんてなるなよ。企業じゃ使えないから
2018/11/26(月) 05:27:13.22ID:HZN7neUEa
>>263
自然言語処理ライブラリが弱いのが tensorflow の弱点。
そのために pytorch が急伸した経緯がある
2018/11/26(月) 08:18:19.26ID:wKZzDIFE0
>>265
なるほど
267デフォルトの名無しさん (ワッチョイ e323-A3/R)
垢版 |
2018/11/26(月) 13:45:20.79ID:M4lkR7sD0
>>257
ほんそれ
叩いてつぶすのが得意
2018/11/26(月) 14:14:51.69ID:dR1XXfB40
はやりものをありがたがるという意見w
269デフォルトの名無しさん (ワッチョイ 83b3-+eFV)
垢版 |
2018/11/26(月) 14:45:35.00ID:7pwlsRQc0
医療に機械学習などデータサイエンスを結び付けて、
効率的な医療を実現するような仕事をしたいと考えている学生ですが、
医学部医学科の学生が(医学の勉強はもちろんやるとして)統計や機械学習などを学ぶことに意味はあると思いますか?
2018/11/26(月) 15:03:00.03ID:zHfONyFA0
医は算術なり、効率的に点数を稼ぐには重要だろw
2018/11/26(月) 16:13:25.97ID:xGQr/GdK0
医者なら統計は知ってそう。薬学では統計使いまくると思いますよ。
技術者に丸投げしないためにも勉強した方がいいとおもいまふ。
以上、雑魚エンジニアの一般論的意見でした
2018/11/26(月) 16:57:02.70ID:i08FqW6v0
>>263
本当にDeepな手法でやる必要がある話なのかをまず考えてみては
TF使ってるくらいだからPythonで書いてるんだろうしgensimで実装されてるアルゴリズムを試してはどうだろう
分散表現を作るだけでも役に立つだろうし
2018/11/26(月) 17:00:39.11ID:aFGb5aG90
>>269
https://www.amazon.co.jp/dp/447803947X
2018/11/26(月) 17:59:58.13ID:EB0BKrhKa
開業医なら効率的な医療だって何だって自由にやれるんだろうけど、勤務医なら組織が大きければ大きいほど相当偉くなるまでは裁量なんてほぼなさそう
2018/11/26(月) 19:12:58.72ID:Hq53WB0r0
Coloboratory使ってる人いる?
TPU使えるから12時間限定でも問題なさそうだけど
276デフォルトの名無しさん (ワッチョイ bf15-nfAC)
垢版 |
2018/11/27(火) 11:40:07.25ID:ltShiaEd0
花の画像から、花びらやがく、茎などの部位を機械学習で着色する仕組みを考えています

今は手作業で200枚くらい正解データがあって、
花びらを赤、おしべめしべを黄、がくを緑、茎を青といったルールで色づけています
花は身近なタンポポなど野草がほとんどで18種類です
データが圧倒的に足りていないのもわかっているので
特定の花だけに限定して正解データを手作業で作る作業もしています

文字・数字認識や物体検知の課題では、画像と正解ラベルをセットで学習させていますが
私の課題の場合、ピクセル単位でどこが花びら=赤、茎=青、といったデータも作る必要があるのでしょうか?
線画を着色するGANsの仕組みが近いかなとも思い調べたのですが、
着色範囲がぼやっとしていて、私の課題にはそぐわないように感じました

実現可能性が低いのは承知のうえで、こういった課題の場合
どういう仕組みが考えられるのか、お詳しい方アドバイスいただけたらうれしいです
スレ違いでしたらすみません
2018/11/27(火) 12:26:51.02ID:GMLah6fHd
>>276
セマンティックセグメンテーションでググれ
2018/11/27(火) 12:53:54.47ID:A8RhmEtDd
>>276
少しくらい勉強してから人に尋ねるべし
2018/11/27(火) 13:48:25.76ID:9oOGFyKG0
>>269
逃亡、終了
280デフォルトの名無しさん (ワッチョイ bf15-nfAC)
垢版 |
2018/11/27(火) 18:32:10.86ID:ltShiaEd0
>>277
キーワードとても助かります
やはりピクセル単位でラベル付けが必要ということでしょうか
道路の白線を教師なし学習でやってみたという事例も読んでみましたが
元画像の色情報が重要ということで、いろいろな色がある花の場合難しいかなという印象でした
とりあえずこのアプローチで試行錯誤してみます
ありがとうございます

>>278
精進いたします
281デフォルトの名無しさん (アウアウエー Sadf-9GuY)
垢版 |
2018/11/27(火) 19:30:07.16ID:basvWsrHa
>>276
pix2pixでセマンティックセグメンテーションするのはどうだろう?
データが大量になくてもそこそこ出来る(200枚だと流石に少なすぎるかもしれないが)
2018/11/27(火) 23:10:55.14ID:EAd/1gIZH
>>269

機械学習を活用しようとしている一研究医師としては、意味があるとは思う。

ただ未来ではなく現在の機械学習技術をベースに話をすると、有用な成果を出すためには
機械学習の知識より医療の経験の比重が高い印象。

現在の機械学習技術は活用できる範囲がかなり限定的なため、何でもかんでも医療データを
突っ込めば成果が出るというものではない。

学生なら趣味として機械学習の本のサンプルプログラムを動かしつつ、応用が利く臨床医
となるために医学自体の勉強をより頑張る必要があると思う。
283デフォルトの名無しさん (ワッチョイ bf15-nfAC)
垢版 |
2018/11/27(火) 23:24:06.87ID:ltShiaEd0
>>281
ありがとうございます
単語で調べたところ、猫が含まれた画像から猫の範囲を抽出する、という事例を見つけました
セマンティックセグメンテーションともに、自分なりに少し時間をかけて理解に努めます
2018/11/28(水) 00:02:35.74ID:QMbyDd6c0
あくまでメインは専門に重点置いたほうがよい
機械学習はサブ
2018/11/28(水) 02:58:07.34ID:o+VE9J260
統計学の拡張として機械学習の概論を知っておけばいいというだけ。
細かい技術を知る必要は無い。
2018/11/28(水) 09:47:53.02ID:XpXm+Q+K0
点数が付くようになったらセミナー(よくある10万ぐらいで2日の講習)を受けて知識をつければいいんじゃね
287デフォルトの名無しさん (ワッチョイ e323-A3/R)
垢版 |
2018/11/28(水) 09:58:25.11ID:zomCLGU30
>>286
ついでに資格も取れる合宿は有りますか
2018/11/28(水) 11:01:55.70ID:pbJvMZb00
OracleやCADの講習なら100万overがデフォ
2018/11/28(水) 11:50:17.77ID:fukku41A0
>>287
富士山麓でマラソンするやつかw
2018/11/28(水) 18:16:24.09ID:XzZhYEcL0
Amazonが社内用に提供していた機械学習コンテンツ群を無料で公開開始
https://gigazine.net/news/20181127-aws-machine-learning-university-available-free/
291デフォルトの名無しさん (トンモー MMe7-jBwB)
垢版 |
2018/11/28(水) 20:16:20.61ID:2i6dC1ZOM
アマゾンのレコメンドシステムが
未だにクソの邪魔ものでしかないのに
クソのような教材に決まってる。
まったく興味ない
2018/11/28(水) 21:41:20.54ID:DjHHbzX9M
グレースケールの画像を転移学習させたいのですが、良いデータセットないですかね?
グレースケールのはMNISTくらいで他はカラーの画像のデータセットしか知らないのですが
2018/11/29(木) 00:58:15.69ID:+lcOq0Gba
カラーをグレー化すればいいじゃないか
2018/11/29(木) 01:43:19.09ID:1etS0CVPM
Y信号を作れよ
2018/11/29(木) 08:02:16.54ID:Ir4DPNyea
今さらコンポジットかよ
2018/11/29(木) 08:55:20.96ID:EjV+0ygQd
TF probability をやり始めたけどさっぱりわからん… どうすりゃいいのw
2018/11/29(木) 09:23:56.01ID:nN98WmZ90
諦める
298デフォルトの名無しさん (JP 0Hff-Anpr)
垢版 |
2018/11/29(木) 18:02:48.55ID:lRn1yU1jH
angularとかのほうがわけわからん
2018/11/29(木) 18:44:11.79ID:9H8/nb3Ya
angular なんか分からなくないだろw

>>296
pytorch のやつやれ
2018/11/29(木) 20:38:04.37ID:tvwaS2uQ0
angular momentum とは角運動量のことである
2018/11/30(金) 02:11:39.26ID:gAFwEIHo0
交差検証についてなんですが、例えばアイリスデータでSVMで3分割の交差検証した時(3分割の平均が)94%〜97%ぐらいばらつきがあると思うのですが3分割の平均をさらに100回の平均とかして評価するって感じでいいんですかね?
2018/11/30(金) 03:53:30.13ID:ugWmTQyna
データが減ると更にバラツキが増すよ
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況