X



【統計分析】機械学習・データマイニング22
■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん (ワッチョイ f6da-BIu2)
垢版 |
2019/01/13(日) 09:13:37.19ID:lpjZ4t830

機械学習とデータマイニングについて語れ若人


■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング21
https://mevius.5ch.net/test/read.cgi/tech/1541309676/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
0002デフォルトの名無しさん (ワッチョイ 16da-BIu2)
垢版 |
2019/01/13(日) 09:15:39.34ID:lpjZ4t830
【統計分析】機械学習・データマイニング11
http://echo.2ch.net/test/read.cgi/tech/1482227795/
【統計分析】機械学習・データマイニング12
http://echo.2ch.net/test/read.cgi/tech/1485008808/
【統計分析】機械学習・データマイニング13
http://echo.2ch.net/test/read.cgi/tech/1487433222/
【統計分析】機械学習・データマイニング14
http://echo.2ch.net/test/read.cgi/tech/1489636623/
【統計分析】機械学習・データマイニング15
http://mevius.2ch.net/test/read.cgi/tech/1492344216/
【統計分析】機械学習・データマイニング16
http://mevius.2ch.net/test/read.cgi/tech/1498493352/
【統計分析】機械学習・データマイニング17
http://mevius.2ch.net/test/read.cgi/tech/1502032926/
【統計分析】機械学習・データマイニング18
http://mevius.2ch.net/test/read.cgi/tech/1507807291/
【統計分析】機械学習・データマイニング19
http://mevius.2ch.net/test/read.cgi/tech/1520586585/
【統計分析】機械学習・データマイニング20
https://mevius.5ch.net/test/read.cgi/tech/1533635797/
0004デフォルトの名無しさん (アウアウウー Sa89-LFg1)
垢版 |
2019/01/13(日) 11:31:41.80ID:LmF0N6o1a
>>3
乙 Python
0006デフォルトの名無しさん (ワッチョイ 9590-RNo8)
垢版 |
2019/01/14(月) 03:57:48.89ID:tccD9EHa0
>>993
>キューピーみたいにAI使えばいいのに、普及しないな
してるよ。
もう何個か納品しているが、予算が変わるわけではないので何も変化がない。
特に言うべき事がない感じ。客もへーとしか言わん。
0007デフォルトの名無しさん (ファミワイ FF71-Iup+)
垢版 |
2019/01/14(月) 10:53:10.03ID:ZKhJHRcZF
Colorless green ideas sleep furiously.
0008デフォルトの名無しさん (アウアウウー Sa89-pqTR)
垢版 |
2019/01/14(月) 11:11:48.78ID:CIaIM+Sta
日本のIT産業はITドカタが多すぎるせいで工数でしか料金を評価しない風習が強いのが問題だな
何十億も稼げるシステムなら1人月しかかからなくても100人月分ぐらい取ればいい
0010デフォルトの名無しさん (ワッチョイ a5ad-RNo8)
垢版 |
2019/01/14(月) 11:48:13.83ID:J7Dc0qS90
>>8
企業の購買担当者が文系なので
人月計算しかできないんだよ

ひとり100万と決まったら、
もうそれしかダメなんだよ
0012デフォルトの名無しさん (エムゾネ FF9a-Iup+)
垢版 |
2019/01/14(月) 12:12:38.86ID:aPj/koI6F
鮮人バーターの法則
0013デフォルトの名無しさん (ワッチョイ d62c-NvUN)
垢版 |
2019/01/14(月) 13:53:22.65ID:9Cudnq1q0
安い・うまい・速いで、うまいだけは数値化できない。
価格は数値だけど、品質は数値化できない

だから、ドイツ車みたいに、排気ガスの数値をだます奴が出てくる。
品質だけは、簡単に判別できない
0014デフォルトの名無しさん (ワッチョイ 553c-NsAs)
垢版 |
2019/01/14(月) 14:03:37.63ID:rCI3+Rer0
>>13
機械学習向けの問題だと思うわ
If 画像 == りんご
のように
If 品質 == 良好
とできたらね

画像がりんごは誰が見ても分かるけど、品質が良好ってどうやって教師作るんだろうね
0015デフォルトの名無しさん (オッペケ Sr85-jz9p)
垢版 |
2019/01/14(月) 14:43:39.94ID:8beZ9BD2r
>>14
プロが5段階評価とかで付けるしかないんじゃないかなあ
もちろん個人差が出るから複数人で平均取るとかして
0017デフォルトの名無しさん (ワッチョイ 55b3-uMLd)
垢版 |
2019/01/14(月) 16:07:43.88ID:pvmT30y30
5つの味覚を取って美味しさを数値化ってのは既にされてるよ
0019デフォルトの名無しさん (ワッチョイ 19b0-B/A+)
垢版 |
2019/01/14(月) 23:26:18.12ID:wO/JqUkW0
工場なんかの画像処理の工程で画像によってカメラのパラメータを変える必要があるんだけど新しい画像が入力された時に自動的に最適なカメラのパラメータに合わせるような事って実現可能?
0021sage (ササクッテロラ Sp85-PaIb)
垢版 |
2019/01/15(火) 01:35:01.52ID:qj43f8q6p
>>19
それって機械学習じゃなくて制御工学で扱われている課題じゃね?
0022デフォルトの名無しさん (ワッチョイ 55b3-uMLd)
垢版 |
2019/01/15(火) 06:19:34.04ID:zIX5ooIi0
DPとかは機械学習の範疇
0023sage (ササクッテロラ Sp85-PaIb)
垢版 |
2019/01/15(火) 06:28:12.84ID:qj43f8q6p
>>22
どういう分類かはどうでもよくて
制御工学のキーワードで探したら
解決策が見つかるんじゃねって事
0024デフォルトの名無しさん (アウアウイー Sa45-7QjO)
垢版 |
2019/01/15(火) 07:16:07.88ID:PNg+c5Yba
>>23 の言うとおりだと思う。

解決策を考えるべきの話。
手法などが先にありきはナンセンスな話だが
AIを学ぶもののほとんどが、そこを勘違いしているのが実際。

そのアプローチだとあらたな発想の手法すら生まれてこなくなる。
0026デフォルトの名無しさん (JP 0Hbe-mV3e)
垢版 |
2019/01/15(火) 14:52:02.13ID:5XJ4JWHKH
ここ見ていればわかるがそれが多いのが実態。
0028デフォルトの名無しさん (アウアウエー Sa22-jz9p)
垢版 |
2019/01/15(火) 19:31:56.21ID:7dD3Desva
Hinton先生がTwitter始めたらしい
0029デフォルトの名無しさん (JP 0Hbe-wDyS)
垢版 |
2019/01/15(火) 21:01:07.16ID:5XJ4JWHKH
>>27
研究や業務をやっていないと、そうなってしまうでしょうね。
そうすると新たなAI技術が生まれなくなる。

日本の大学からAIや機械学習が生まれて来ないのはそういったことが
原因かもしれない。
0035デフォルトの名無しさん (ワッチョイ 8e68-VK1S)
垢版 |
2019/01/15(火) 23:06:42.50ID:ww9C/aoC0
学習以外のとこでCPUが役立つなんてほんと少ないぞ
めちゃくちゃ重いエクセルファイルを開くとか、バカでかい圧縮ファイルを開閉するとか、ベンチマークで自己満足するとか
グラボ、そしてSSDの恩恵がデカイ

>>30
i5 2400
メモリ16GB
SSD crucialの1TB
GTX1070
マザボは一回壊れたので中古の2000円の物

という構成だけど、機械学習ぶん回してる時は特に問題無い
グラボが8割、メモリが2割ぐらい
CPUはこのレベルで十分だけど、多分このレベルの方が高くつく。とにかくマザボが無い
0037デフォルトの名無しさん (アウアウイー Sa45-7QjO)
垢版 |
2019/01/16(水) 00:58:13.81ID:Y6YhZRdLa
データががたりない、データが多くなれば・・・・・
そういうのはやめましょう。

いつもデータは足りないもの。
知ってはいけないデータもある。

足りない中で考える力を養いましょう。
0040デフォルトの名無しさん (ワッチョイ 8e68-VK1S)
垢版 |
2019/01/16(水) 03:03:07.92ID:mMtrIibT0
>>37
最近は足りなくても学習しきれるようになってきたね
画像データを水増しするライブラリなんかも出てきた

>>38
どんな画像処理してるの?
こないだ学習用に1000ファイルを処理したけど
1000*2000の200kbのjpg→100*200、50hbに再圧縮
5分もかからなかった

フォトショップやイラレもレイヤー50ぐらいなら全く問題ない。
プログラムの立ち上げは数秒かかるけどね
レイヤー1000とか超えると重くなったりする?今の所、そういう本格的なファイルは熱かったことがない

>>39
そこはボトルネック担ってるとは思う
ただ、リソース見る限りはGPUで完結してると思うので、これで良いと思っておくよ
0042デフォルトの名無しさん (ワッチョイ 8e68-VK1S)
垢版 |
2019/01/16(水) 03:50:44.21ID:mMtrIibT0
>>41
そりゃまぁ早ければ早い方が良いのは1005間違いない。
具体的にどういう画像検査で遅くなったりするの?
SSD、メモリが十分な状態で、i5 2400と最新のCPUでどれぐらい差が出るの?
何か例があれば教えてほしい

個人的には、学習前の画像処理が1時間ぐらい変わった所で特に意味は無いかな、と思う
一回だけなら許容範囲だ
0044デフォルトの名無しさん (ワッチョイ d62c-NvUN)
垢版 |
2019/01/16(水) 06:44:35.50ID:Jyszdvyz0
i7 の最新版など、高いCPU では、動画などの最新のコーデックも、ハードウェアで処理できる

3D 処理とか、コンパイルも速くなる。
ゲーム製作のモデラーが使う
0046デフォルトの名無しさん (アウアウイー Sa45-7QjO)
垢版 |
2019/01/16(水) 18:18:16.41ID:Y6YhZRdLa
>>45
その通りと思います。現在客先で見ている限りでは、データなんたらリストの方々
一様に前分析がおろそかになっています。おそらくやり方をご存知ないのかなと
思い始めました。
データが綺麗にそろうことははないので、今あるものからいかに見つけ出すか、
それがないと、じゃ次に綺麗なデータを取るために、どういうデータ収集の
仕組みにしたらいいかにたどり着かないですから。
0047デフォルトの名無しさん (アウアウイー Sa45-7QjO)
垢版 |
2019/01/16(水) 21:14:24.24ID:Y6YhZRdLa
ティスとがリストになってた
0056デフォルトの名無しさん (アウアウイー Sa9d-Qnxu)
垢版 |
2019/01/18(金) 19:19:34.43ID:ZaxSkk9ca
>>55
そりゃユーザーのレベルと、教える方の力量次第だよ。
0059デフォルトの名無しさん (アウアウエー Sa23-qnWR)
垢版 |
2019/01/19(土) 00:54:56.63ID:2Tiw7zAQa
MSのIME辞書って機械学習?
0061デフォルトの名無しさん (アウアウイー Sa9d-Qnxu)
垢版 |
2019/01/19(土) 06:54:57.09ID:sNgIc/IAa
>>59
奇怪学習だとおもう
0062デフォルトの名無しさん (アウアウイー Sa9d-Qnxu)
垢版 |
2019/01/19(土) 07:07:01.96ID:sNgIc/IAa
>>60
いいね。
0065デフォルトの名無しさん (アウアウイー Sa9d-Qnxu)
垢版 |
2019/01/19(土) 10:28:38.51ID:sNgIc/IAa
ハゲタカ学会横行だそうだ。
金さえ払えば海外発表論文になると。

そういえば情報処理学会、今は論文として
カウントしてもらえてるんかな?
0069デフォルトの名無しさん (ワッチョイ 13da-bE95)
垢版 |
2019/01/19(土) 18:56:45.47ID:F9LTFsag0
>>68
妥当な判断でしょうね。
といっても、この辺りのことは審議会からの意見が通った結果と思う
0071デフォルトの名無しさん (アウアウイー Sa9d-Qnxu)
垢版 |
2019/01/19(土) 20:02:48.32ID:sNgIc/IAa
>>70
なんで?
0073デフォルトの名無しさん (ワッチョイ c935-fAiL)
垢版 |
2019/01/19(土) 22:16:36.66ID:DzVVgA5d0
>>71
責任を医者に求めるなら、医者はAIにも精通していないといけない
あのクソ忙しい医者が更に機械学習を学ぶとか、非現実的すぎる
命にかかわるような手術だと、提案を効くにしても使わないだろう。

歯医者や耳鼻科、皮膚科など、基本的に命にかかわらないような所は大幅に楽になるかも
0074デフォルトの名無しさん (アウアウイー Sa9d-Qnxu)
垢版 |
2019/01/19(土) 23:48:03.20ID:EgWzcTTSa
AI側に責任もたせたら、開発者が手を引いちゃうよ
責任取れるわけないし、説明できる手法に変えないと理由づけもできない。

進歩が止まるよ。
0075デフォルトの名無しさん (アウアウイー Sa9d-Qnxu)
垢版 |
2019/01/19(土) 23:49:58.53ID:EgWzcTTSa
>>73
AIに精通の必要はないでしょう。AIからの結果を補助として自分で判断するだけ。
そこにAI知識がといったら、AIの意味自体がない。
0077デフォルトの名無しさん (アウアウイー Sa9d-Qnxu)
垢版 |
2019/01/20(日) 03:19:32.95ID:vMifeOEMa
>>74
患者への説明できないというAI最大の弱点
0078デフォルトの名無しさん (ワッチョイ 1b1f-9A9J)
垢版 |
2019/01/20(日) 03:33:53.05ID:amaA0ydz0
AIはあくまでもパターン認識に基づくリコメンドをして、
それの医学的妥当性の判断は医者がすると考えれば何もおかしくはない。
まあ、町医者なんかだとパターン認識レベルしかできないヤブもいそうだが。
0081デフォルトの名無しさん (アウアウイー Sa9d-Qnxu)
垢版 |
2019/01/20(日) 07:23:03.54ID:vMifeOEMa
>>72
>>76
ん〜〜
あまりに的外れなこと言ってるとおもうぞ
0082デフォルトの名無しさん (ササクッテロレ Sp1d-W1Jf)
垢版 |
2019/01/20(日) 09:27:25.68ID:3coNDWU9p
>>78
どの医者にも得意分野、不得意分野がある
パターン認識くらいしかできないAIでも、実用上、診断は人間ではかなわないレベルに来てる
それを使ったら医者の責任って言われてもね
患者ガチャだわな
0084デフォルトの名無しさん (アウアウイー Sa9d-Qnxu)
垢版 |
2019/01/20(日) 09:52:29.32ID:vMifeOEMa
>>82
それは、話が違う方向になってるよ。
病気かどうかが医師の責任という話ではなく
それは判断材料の一つにつかうだけで、
治療方針などについて患者との間で決定していかないといけない
それについて、なにを判断材料に好かった場合でも医師に責任が
あるという話だから。
0087デフォルトの名無しさん (ワッチョイ 699c-G1wx)
垢版 |
2019/01/20(日) 10:21:39.87ID:jFgz5jql0
診断は投薬や処置などの治療方針につながる。
投薬にはどんなものでも少なくともアレルギーの可能性があり、
単なる点滴でも針の穿刺など傷を付けるなど、医療は基本的に
加害行為になります。

加害行為となり得る医療行為が医師などに許されているのは、
その医療行為によるメリットとデメリットを判断するための
最低限の知識などが、国家試験・国家資格などを通して国に
より一定の基準が保証されていることによります。

そのため、診断を補助する機器に対しても薬機方など様々な
規制が有り、安易に提供できません。
その為、下記の様なソフトでも指摘を受ける場合があります。
(現在は再度公開しているみたいです)

「糖尿病リスク予測ソフト、公開翌日に厚労省「未承認の医療機器」指摘で中止に」
ttps://yomidr.yomiuri.co.jp/article/20181105-OYTET50009/


現在のAIのレベルは特徴量を主体とする単なるパターンマッチングに過ぎず、
遺伝子異常など特定の限定された診断基準に基づくだけでできる診断には有効ですが、
「息苦しい」などの複数の原因が考えられる内容の診断はできません。
「息苦しい」には肺が原因の場合もあれば、喉などの気道の狭窄、心機能の低下、
貧血、疲労、低酸素環境など様々な原因がありますが、これらの全てをパターンとして
学習させるのは無理で、診断の成績も報告の限りでは相当に悪く実用に耐えません。

恐らく現在のAI技術は、診断基準が明確な分野のみに特化して一部使用されることが
今のところ期待されています。
0088デフォルトの名無しさん (アウアウイー Sa9d-Qnxu)
垢版 |
2019/01/20(日) 10:50:54.03ID:vMifeOEMa
>>86
要は、そういう使われ方しないという話ですよ。
他の検査などをやったうえでしか行わない。
今のAIはそこまで進歩もしていないし、患者との対話もできない。
0089デフォルトの名無しさん (ワッチョイ 9bab-hsVO)
垢版 |
2019/01/20(日) 10:53:37.47ID:DckoPus20
>>86
そんなもん医者でもあるんだろ。
AIの言いなりの医者なんて意味ないから責任があるのは当然。
分からなかったら他の医者と相談しろ。
そのための病院組織ってことだ。
至極真当では
0091デフォルトの名無しさん (ワッチョイ f1b5-nEG7)
垢版 |
2019/01/20(日) 14:54:58.33ID:+KrkJl8W0
医師の負担が軽くなって、かつ精度も数値としてきちんと提示できれば、需要はあるんじゃない
ただ医療に関することだから責任の所在をはっきりさせないと、それはね

AI診断で医療ミスが起きて訴訟になったら、やっぱAIベンダーにも責任は問われるかと
0092デフォルトの名無しさん (アウアウウー Sa15-Lb5M)
垢版 |
2019/01/20(日) 15:26:54.01ID:iLYNrFpta
実際に治療を行うのは医者だよ
だから結果がどうなっても責任は医者にしかない
文献を元に治療したけど実は今回の患者は文献で考慮されてなかった例外で本当は真逆の対処をしなければならなかった、間違ったのは文献著者のせいだから責任とれ、なんてあり得ない
0094デフォルトの名無しさん (アウアウエー Sa23-k+Ng)
垢版 |
2019/01/20(日) 15:34:48.46ID:1qyIzvIOa
>>86
誤診なしで100%の診断ができるAIは存在しないから、AI診断を鵜呑みにして処置をするのはあり得ないよね
それで医療が成り立つなら人間の医者の存在意義がなくなる
AIが癌があると言うなら医者もレントゲンを目で見てその上で判断を下すべき
0096デフォルトの名無しさん (ワッチョイ f1da-bE95)
垢版 |
2019/01/20(日) 18:05:07.63ID:DemIoh4r0
だいたい、AIで出た結果自体をAI専門家でさえ、なぜそうなるか理由がわからないのが
今のAIだから、それで最終判断しそのまま処置なんてありえない。
0098デフォルトの名無しさん (ササクッテロレ Sp1d-W1Jf)
垢版 |
2019/01/20(日) 19:27:57.92ID:3coNDWU9p
>>96
ニューラルネットワークだけ考えるとそうかもしれないが、決定木は既存のモデルから確率的に理由付けが可能だよね
定石によって解決可能な病気はコンピュータが医師となって医療行為のGO判断をできるようになると思うんだよね
そういう時代はまだ先ってのは分かるけど、薬の販売が段階的に規制緩和されていったところを見ると、徐々に適用範囲が広がっていくことを見据えて、法律は整備するもんじゃないの?
0099デフォルトの名無しさん (アウアウイー Sa9d-Qnxu)
垢版 |
2019/01/20(日) 19:59:01.80ID:vMifeOEMa
>>98
話しの流れを見てもらえばわかるけど、ここでは決定木とは違う世界の
話を想定した。自動化に近いものの話になっているので、ちと違うので
それとは別ね。

決定木を用いた自動化は金融などでは長く行われているけどね。
どうもそういう話とは違いそうなので。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況