X



【統計分析】機械学習・データマイニング21
■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん (アウアウウー Sa4f-YdG1)
垢版 |
2018/11/04(日) 14:34:36.02ID:W830XVm1a
機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング20
https://mevius.5ch.net/test/read.cgi/tech/1533635797/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
0237デフォルトの名無しさん (トンモー MMe7-jBwB)
垢版 |
2018/11/24(土) 07:44:12.04ID:zFN/wXgkM
普通に分析してればべイズになってるから
気にしなくていい
0241デフォルトの名無しさん (アウアウウー Sa27-H+hQ)
垢版 |
2018/11/24(土) 09:04:23.92ID:5t6hm1+Wa
>>240
64ビット買えよ。
0243デフォルトの名無しさん (ワッチョイ d3a5-xszH)
垢版 |
2018/11/24(土) 16:25:02.46ID:qNi2DrAy0
色んな知識を持っとく事は大事だと思うんだよね
上で出てる統計の知識にしてもドメイン側の知識にしてもさ
時間が取れるなら勉強すれば良いと思う
絶対無駄にはならない
ただ仕事だと悠長に出来ないからとりあえずライブラリ使いにとどまってしまうのも分かる
0258デフォルトの名無しさん (トンモー MMe7-jBwB)
垢版 |
2018/11/26(月) 00:20:06.09ID:jbSFfWJpM
大学教授は縁故採用が多い。
公募は形式だけで募集する前から決まってる。
そんなコネ馬鹿教授ばかりだから
新しいものなど認める訳がない!

まず馬鹿だから理解できないし、
新しくて有効なものを認めてしまうと
己の地位低下を招くから。
0260デフォルトの名無しさん (ワッチョイ 6f3b-NMzV)
垢版 |
2018/11/26(月) 01:23:54.55ID:CHI+qQuw0
工学系だとFEMの理論知らなくても解析できるしAIもそんなもんでしょ
0261デフォルトの名無しさん (ワッチョイ 2381-A3/R)
垢版 |
2018/11/26(月) 01:24:22.41ID:avRvugCi0
自然言語処理系に強いツールを紹介してもらえませんか?
とりあえず、文書の分類や意味の解析などをやりたいです。
0263デフォルトの名無しさん (ワッチョイ 2381-A3/R)
垢版 |
2018/11/26(月) 01:58:36.86ID:avRvugCi0
>>262
プログラムを使って色々カスタマイズしたいので、ライブラリーがいいです。
TensorFlowの自然言語処理拡張ライブラリーみたいなものがあれば・・・
0264デフォルトの名無しさん (ワッチョイ cf06-kbBB)
垢版 |
2018/11/26(月) 02:17:09.45ID:cKVEkA6F0
結局、機械学習の専門家ではなく、データを管理してる現場担当の人間がマイニングするのが一番効率がよい

学生らに言いたいがデータサイエンティストなんてなるなよ。企業じゃ使えないから
0267デフォルトの名無しさん (ワッチョイ e323-A3/R)
垢版 |
2018/11/26(月) 13:45:20.79ID:M4lkR7sD0
>>257
ほんそれ
叩いてつぶすのが得意
0269デフォルトの名無しさん (ワッチョイ 83b3-+eFV)
垢版 |
2018/11/26(月) 14:45:35.00ID:7pwlsRQc0
医療に機械学習などデータサイエンスを結び付けて、
効率的な医療を実現するような仕事をしたいと考えている学生ですが、
医学部医学科の学生が(医学の勉強はもちろんやるとして)統計や機械学習などを学ぶことに意味はあると思いますか?
0271デフォルトの名無しさん (ワッチョイ 6f67-/8bD)
垢版 |
2018/11/26(月) 16:13:25.97ID:xGQr/GdK0
医者なら統計は知ってそう。薬学では統計使いまくると思いますよ。
技術者に丸投げしないためにも勉強した方がいいとおもいまふ。
以上、雑魚エンジニアの一般論的意見でした
0272デフォルトの名無しさん (ワッチョイ ff23-wpGg)
垢版 |
2018/11/26(月) 16:57:02.70ID:i08FqW6v0
>>263
本当にDeepな手法でやる必要がある話なのかをまず考えてみては
TF使ってるくらいだからPythonで書いてるんだろうしgensimで実装されてるアルゴリズムを試してはどうだろう
分散表現を作るだけでも役に立つだろうし
0276デフォルトの名無しさん (ワッチョイ bf15-nfAC)
垢版 |
2018/11/27(火) 11:40:07.25ID:ltShiaEd0
花の画像から、花びらやがく、茎などの部位を機械学習で着色する仕組みを考えています

今は手作業で200枚くらい正解データがあって、
花びらを赤、おしべめしべを黄、がくを緑、茎を青といったルールで色づけています
花は身近なタンポポなど野草がほとんどで18種類です
データが圧倒的に足りていないのもわかっているので
特定の花だけに限定して正解データを手作業で作る作業もしています

文字・数字認識や物体検知の課題では、画像と正解ラベルをセットで学習させていますが
私の課題の場合、ピクセル単位でどこが花びら=赤、茎=青、といったデータも作る必要があるのでしょうか?
線画を着色するGANsの仕組みが近いかなとも思い調べたのですが、
着色範囲がぼやっとしていて、私の課題にはそぐわないように感じました

実現可能性が低いのは承知のうえで、こういった課題の場合
どういう仕組みが考えられるのか、お詳しい方アドバイスいただけたらうれしいです
スレ違いでしたらすみません
0280デフォルトの名無しさん (ワッチョイ bf15-nfAC)
垢版 |
2018/11/27(火) 18:32:10.86ID:ltShiaEd0
>>277
キーワードとても助かります
やはりピクセル単位でラベル付けが必要ということでしょうか
道路の白線を教師なし学習でやってみたという事例も読んでみましたが
元画像の色情報が重要ということで、いろいろな色がある花の場合難しいかなという印象でした
とりあえずこのアプローチで試行錯誤してみます
ありがとうございます

>>278
精進いたします
0281デフォルトの名無しさん (アウアウエー Sadf-9GuY)
垢版 |
2018/11/27(火) 19:30:07.16ID:basvWsrHa
>>276
pix2pixでセマンティックセグメンテーションするのはどうだろう?
データが大量になくてもそこそこ出来る(200枚だと流石に少なすぎるかもしれないが)
0282デフォルトの名無しさん (JP 0H87-Kv/S)
垢版 |
2018/11/27(火) 23:10:55.14ID:EAd/1gIZH
>>269

機械学習を活用しようとしている一研究医師としては、意味があるとは思う。

ただ未来ではなく現在の機械学習技術をベースに話をすると、有用な成果を出すためには
機械学習の知識より医療の経験の比重が高い印象。

現在の機械学習技術は活用できる範囲がかなり限定的なため、何でもかんでも医療データを
突っ込めば成果が出るというものではない。

学生なら趣味として機械学習の本のサンプルプログラムを動かしつつ、応用が利く臨床医
となるために医学自体の勉強をより頑張る必要があると思う。
0283デフォルトの名無しさん (ワッチョイ bf15-nfAC)
垢版 |
2018/11/27(火) 23:24:06.87ID:ltShiaEd0
>>281
ありがとうございます
単語で調べたところ、猫が含まれた画像から猫の範囲を抽出する、という事例を見つけました
セマンティックセグメンテーションともに、自分なりに少し時間をかけて理解に努めます
0287デフォルトの名無しさん (ワッチョイ e323-A3/R)
垢版 |
2018/11/28(水) 09:58:25.11ID:zomCLGU30
>>286
ついでに資格も取れる合宿は有りますか
0291デフォルトの名無しさん (トンモー MMe7-jBwB)
垢版 |
2018/11/28(水) 20:16:20.61ID:2i6dC1ZOM
アマゾンのレコメンドシステムが
未だにクソの邪魔ものでしかないのに
クソのような教材に決まってる。
まったく興味ない
0298デフォルトの名無しさん (JP 0Hff-Anpr)
垢版 |
2018/11/29(木) 18:02:48.55ID:lRn1yU1jH
angularとかのほうがわけわからん
0301デフォルトの名無しさん (ワッチョイ 5a97-ad2z)
垢版 |
2018/11/30(金) 02:11:39.26ID:gAFwEIHo0
交差検証についてなんですが、例えばアイリスデータでSVMで3分割の交差検証した時(3分割の平均が)94%〜97%ぐらいばらつきがあると思うのですが3分割の平均をさらに100回の平均とかして評価するって感じでいいんですかね?
0306デフォルトの名無しさん (ワッチョイ 5a97-ad2z)
垢版 |
2018/11/30(金) 13:00:06.59ID:gAFwEIHo0
例えばkaggleとかなら初めからトレーニングデータとテストデータが分かれててテストデータとの答え合せで数値としての精度を用いてます。
自分で1つのデータを用いて精度を出したいときに、データが少なくてテストデータの選ばれ方にかなり影響を受けるというようなとときにはどういう風な値を用いればいいのかっていうのが聞きたいです。
0308デフォルトの名無しさん (オッペケ Sr3b-3v2C)
垢版 |
2018/11/30(金) 14:10:30.81ID:PfAczbior
バイアス・バリアンスでグクってみな
過学習気味だと思う
0309デフォルトの名無しさん (ワッチョイ 5a97-ad2z)
垢版 |
2018/11/30(金) 16:23:37.26ID:gAFwEIHo0
扱ってるデータの性質上データ数が少ないのは仕方ないのです…
今書いてるコードなんですが、
sklearnのcross_val_scoreでcvパラメータに層化分割を渡してます。(StratifiedKFold(n_splits=3, shuffle=True)
これでfor文で例えば100回回すと3つセットのスコアが100個出てきますよね?それで3値の平均のさらに100個の平均って感じで評価基準にしてます。3つセットのスコアの分散がそこそこ大きいのは仕方ないと思ってます。
これで良いのですかね。
0310デフォルトの名無しさん (トンモー MMff-zdpJ)
垢版 |
2018/11/30(金) 20:22:51.78ID:1rBmpsWQM
もしかしてデータ数は変数より少ない?
0316デフォルトの名無しさん (ワッチョイ 23d2-hzet)
垢版 |
2018/12/02(日) 12:37:35.98ID:DCWKzkdC0
>>314
そのアニメおかしくないか?
その方向にガッ!とかいってひっかかるかな?
0317デフォルトの名無しさん (ラクペッ MMf3-Q8V8)
垢版 |
2018/12/02(日) 15:13:17.02ID:0nNccsdOM
おかしいのはこれがアニメに見える目の方やで
0318デフォルトの名無しさん (ワッチョイ 23d2-hzet)
垢版 |
2018/12/02(日) 15:26:02.69ID:DCWKzkdC0
確かに。
おれは疲れているんだよ。
おれはおかしくなってる。
0320デフォルトの名無しさん (トンモー MMff-zdpJ)
垢版 |
2018/12/03(月) 07:56:04.08ID:YQ9o3EMnM
新しい理論ではないけど、
計算機の進化で計算できるようになったのと、
データ分析が役に立つことが認識された
ことが大きいと思う。

理論として21世紀に出てきたものは
ほとんどない。
DLなんて50年前の理論たし。
0324デフォルトの名無しさん (ワッチョイ 2323-C97y)
垢版 |
2018/12/03(月) 12:44:09.72ID:/cKWkF1j0
>>320
ほんそれ
0325デフォルトの名無しさん (ワッチョイ 2323-C97y)
垢版 |
2018/12/03(月) 12:45:53.17ID:/cKWkF1j0
>>323
今後はエクソソームだな
0326デフォルトの名無しさん (スププ Sdba-ECGE)
垢版 |
2018/12/03(月) 13:03:16.97ID:gJnDW9G3d
ディープラーニングのG検定ってどうよ?
公式テキスト買って読んでるわ。
0328デフォルトの名無しさん (オッペケ Sr3b-3v2C)
垢版 |
2018/12/03(月) 14:00:36.39ID:lgEDnwL/r
G検定でバーニーおじさんのルールってのが出たらしいけど、ググってもG検定関連の記事しか出ない
バーニーおじさんの出所ってどこなん
0329デフォルトの名無しさん (スププ Sdba-ECGE)
垢版 |
2018/12/03(月) 15:16:45.90ID:gJnDW9G3d
>>328
たしか、テキストに出てたわw
0330デフォルトの名無しさん (ササクッテロラ Sp3b-IeF4)
垢版 |
2018/12/03(月) 20:49:11.45ID:TieFIiIUp
>>233
落ちた人と比べたら受かった人はそれなりに理解していることが判るだろ
2級に合格した人が1級の能力を持っていないとは言えないけど
2級の能力を持っていることは判る

何も受けていない人は何も判らない
ゼロかもしれないし1級を超えているかもしれないし
判断する側からしたら区間推定の範囲を狭めることができる
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況