X



【統計分析】機械学習・データマイニング21
■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん (アウアウウー Sa4f-YdG1)
垢版 |
2018/11/04(日) 14:34:36.02ID:W830XVm1a
機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング20
https://mevius.5ch.net/test/read.cgi/tech/1533635797/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
0306デフォルトの名無しさん (ワッチョイ 5a97-ad2z)
垢版 |
2018/11/30(金) 13:00:06.59ID:gAFwEIHo0
例えばkaggleとかなら初めからトレーニングデータとテストデータが分かれててテストデータとの答え合せで数値としての精度を用いてます。
自分で1つのデータを用いて精度を出したいときに、データが少なくてテストデータの選ばれ方にかなり影響を受けるというようなとときにはどういう風な値を用いればいいのかっていうのが聞きたいです。
0308デフォルトの名無しさん (オッペケ Sr3b-3v2C)
垢版 |
2018/11/30(金) 14:10:30.81ID:PfAczbior
バイアス・バリアンスでグクってみな
過学習気味だと思う
0309デフォルトの名無しさん (ワッチョイ 5a97-ad2z)
垢版 |
2018/11/30(金) 16:23:37.26ID:gAFwEIHo0
扱ってるデータの性質上データ数が少ないのは仕方ないのです…
今書いてるコードなんですが、
sklearnのcross_val_scoreでcvパラメータに層化分割を渡してます。(StratifiedKFold(n_splits=3, shuffle=True)
これでfor文で例えば100回回すと3つセットのスコアが100個出てきますよね?それで3値の平均のさらに100個の平均って感じで評価基準にしてます。3つセットのスコアの分散がそこそこ大きいのは仕方ないと思ってます。
これで良いのですかね。
0310デフォルトの名無しさん (トンモー MMff-zdpJ)
垢版 |
2018/11/30(金) 20:22:51.78ID:1rBmpsWQM
もしかしてデータ数は変数より少ない?
0316デフォルトの名無しさん (ワッチョイ 23d2-hzet)
垢版 |
2018/12/02(日) 12:37:35.98ID:DCWKzkdC0
>>314
そのアニメおかしくないか?
その方向にガッ!とかいってひっかかるかな?
0317デフォルトの名無しさん (ラクペッ MMf3-Q8V8)
垢版 |
2018/12/02(日) 15:13:17.02ID:0nNccsdOM
おかしいのはこれがアニメに見える目の方やで
0318デフォルトの名無しさん (ワッチョイ 23d2-hzet)
垢版 |
2018/12/02(日) 15:26:02.69ID:DCWKzkdC0
確かに。
おれは疲れているんだよ。
おれはおかしくなってる。
0320デフォルトの名無しさん (トンモー MMff-zdpJ)
垢版 |
2018/12/03(月) 07:56:04.08ID:YQ9o3EMnM
新しい理論ではないけど、
計算機の進化で計算できるようになったのと、
データ分析が役に立つことが認識された
ことが大きいと思う。

理論として21世紀に出てきたものは
ほとんどない。
DLなんて50年前の理論たし。
0324デフォルトの名無しさん (ワッチョイ 2323-C97y)
垢版 |
2018/12/03(月) 12:44:09.72ID:/cKWkF1j0
>>320
ほんそれ
0325デフォルトの名無しさん (ワッチョイ 2323-C97y)
垢版 |
2018/12/03(月) 12:45:53.17ID:/cKWkF1j0
>>323
今後はエクソソームだな
0326デフォルトの名無しさん (スププ Sdba-ECGE)
垢版 |
2018/12/03(月) 13:03:16.97ID:gJnDW9G3d
ディープラーニングのG検定ってどうよ?
公式テキスト買って読んでるわ。
0328デフォルトの名無しさん (オッペケ Sr3b-3v2C)
垢版 |
2018/12/03(月) 14:00:36.39ID:lgEDnwL/r
G検定でバーニーおじさんのルールってのが出たらしいけど、ググってもG検定関連の記事しか出ない
バーニーおじさんの出所ってどこなん
0329デフォルトの名無しさん (スププ Sdba-ECGE)
垢版 |
2018/12/03(月) 15:16:45.90ID:gJnDW9G3d
>>328
たしか、テキストに出てたわw
0330デフォルトの名無しさん (ササクッテロラ Sp3b-IeF4)
垢版 |
2018/12/03(月) 20:49:11.45ID:TieFIiIUp
>>233
落ちた人と比べたら受かった人はそれなりに理解していることが判るだろ
2級に合格した人が1級の能力を持っていないとは言えないけど
2級の能力を持っていることは判る

何も受けていない人は何も判らない
ゼロかもしれないし1級を超えているかもしれないし
判断する側からしたら区間推定の範囲を狭めることができる
0333デフォルトの名無しさん (ワッチョイ 5f08-RrwQ)
垢版 |
2018/12/03(月) 21:12:21.84ID:B/BM1MCl0
資格は座学だからなぁ
本当にAI実技が出来るのかと

どっちかというと「会社で○年間人工知能の実務してました〜」
のほうが面接受け良いぞ

あとコラボラトリーやっと動かせた
思ったより簡単だったが
アップロードが少しめんどいな
0335デフォルトの名無しさん (アウアウエー Sa52-IeF4)
垢版 |
2018/12/04(火) 08:05:16.33ID:V4nQvbKaa
>>334
自分で判ってると勘違いや自己暗示をかけているだけかもしれない
0336デフォルトの名無しさん (アウアウカー Sa43-vOkL)
垢版 |
2018/12/04(火) 08:42:28.96ID:EiTIheNPa
暗記しなくても調べれば分かるんだからいいっていうのは稀にしか使わないような複雑な公式とかならそれでいいんだけど
例えば統計検定2級までのような基礎的な内容に関してはそれではいけないだろう
0338デフォルトの名無しさん (トンモー MMff-zdpJ)
垢版 |
2018/12/04(火) 20:22:10.65ID:NC+/7ITGM
DLの検定はサンプルみただけでイヤになった、
と理論の先生が言ってた。
0340デフォルトの名無しさん (ワッチョイ 1723-C97y)
垢版 |
2018/12/05(水) 16:28:35.00ID:kX9gokKe0
>>331
ほんそれ
0341デフォルトの名無しさん (ワッチョイ 1723-C97y)
垢版 |
2018/12/05(水) 16:29:14.67ID:kX9gokKe0
>>334
むしろ後者の方が大事
0343デフォルトの名無しさん (ワッチョイ 33dc-Tbne)
垢版 |
2018/12/06(木) 21:05:12.09ID:bu2uD6C50
優れたAI開発者とは何ぞやと問いに対して、
海外では、アルゴリズムを開発できる人、Kaggleで上位を取れるような分析者、に加えて、
課題解決の為にAIを実装できる人というのが入ってくるが、
日本企業は、要件定義と開発は別物だという認識が強いのか最後のが出てこない。

つか、提案できるやつを引き抜いてくれないので、
導入事例が豊富なモデルの二番煎じしか出来ないのはつまらん
0349デフォルトの名無しさん (ワッチョイ 0123-GoBb)
垢版 |
2018/12/07(金) 15:08:02.31ID:lkrG/qbb0
>>342
このテのものは現れては消えるな
0350デフォルトの名無しさん (ワッチョイ 0123-GoBb)
垢版 |
2018/12/07(金) 15:09:15.97ID:lkrG/qbb0
>>344
プライドωが許さないんだろうωω
0353デフォルトの名無しさん (ワッチョイ 611e-nOOm)
垢版 |
2018/12/09(日) 05:39:24.92ID:A2Qb+vpb0
知らないうちにクロームの翻訳機能進化してんな 機電系技術記事みたいな簡単な英語ならほとんど問題ないくらいに訳せてる
0359デフォルトの名無しさん (ワッチョイ 31b3-Lqyf)
垢版 |
2018/12/11(火) 23:44:44.51ID:Nam5p+1w0
>>352
あった、あったw
確率で区別するって意見が大体だったっけ
自分もそれでいいじゃんって思ってた

リンク先読んでもよくわからなかったけど
そんな単純な話じゃないみたいだね
0361デフォルトの名無しさん (ワッチョイ 0108-+wPc)
垢版 |
2018/12/12(水) 01:28:26.70ID:0ODlcIYd0
最近お仕事で機械学習しなきゃいけなくなってkaggleとかで勉強してるんだけどなんかものすごくもやもやする
ブラックボックスをいじって結果だけ出てくるの眺めてまたいじって改良されたらそれで良しみたいな……
プログラミングの問題みたいにきっちり正解があるとか、システムにこういう機能が必要だからそれを満たすコードを考えるとかならすっきりするのさ
なんていうか正解に至る道を自分で見通せない気持ち悪さみたいな
0363デフォルトの名無しさん (ワッチョイ 611e-nOOm)
垢版 |
2018/12/12(水) 02:29:18.56ID:nO92IoUy0
データには固有の性質があって、それを長く扱っている技術者だけがそういうことを知ってる。 kaggleで匿名化されてるデータやってても知見として得られるものないよ。 kaggleはそのへんが問題なんだよね
0366デフォルトの名無しさん (アウアウカー Sa9d-RNrf)
垢版 |
2018/12/12(水) 10:26:06.15ID:EtDWiiCfa
100%的中させる必要などそもそもない
人間だってミスして例えばメーカーでの検査ミスなら不良品を流通させてしまう
機械学習システムによって人間より十分に精度や実行速度が上がったりするなら明らかにメリットがある
にも関わらず人間より圧倒的に少ないミスを過剰に問題視する方がおかしい
また、ミスの原因がはっきりしないのが問題だと言う意見もあるが人間のミスの方が
どう考えても原因は曖昧であり、現在導入されている機械学習システムは所詮回帰分析を複雑化したものに過ぎず、
その係数を正確に知れる分だけよっぽど論理的に説明ができる
0368デフォルトの名無しさん (ワッチョイ e123-8cnn)
垢版 |
2018/12/12(水) 10:51:40.00ID:AKkFwy3+0
規定の不良率に収まるように学習すれば良いだけ
0373デフォルトの名無しさん (ワッチョイ e123-8cnn)
垢版 |
2018/12/12(水) 18:35:23.09ID:AKkFwy3+0
仕事を増やせる優秀な公務員が考えました
0375デフォルトの名無しさん (トンモー MM47-LhEE)
垢版 |
2018/12/13(木) 08:28:05.50ID:IBjveTF2M
>>361
時間があれば
確率論→統計学→機械学習
と進めるべきなんでしょうね。

でも今どきはいきなりPythonですからね。
ま、客も分かってる人いないから。

もやもや解消には仕事を辞めて
6年間ほど死ぬほど勉強する必要あります。
0392デフォルトの名無しさん (スップ Sd4a-0493)
垢版 |
2018/12/14(金) 09:01:46.14ID:ngdg7HQOd
完備な距離空間作るために測度論が必要ってとこだけ理解できればもう要らない。同様の理由で確率論も要らない。
あと入りそうなのは確率微分方程式とかるまんふぃるたぐらいか。まあ、後者はリースの表現定理を理解できれば十分。
0397デフォルトの名無しさん (アウアウカー Sa6b-c9wy)
垢版 |
2018/12/14(金) 12:12:47.64ID:z+6X6PDpa
本当の一流なら例えば料理人だとラーメン作るのに小麦畑の土から拘るからな
単に腹を満たすためならそんなの不要だが本気でトップ狙うならそこまで考える必要がある
0400 ◆QZaw55cn4c (ワッチョイ aa60-D8NS)
垢版 |
2018/12/14(金) 20:10:48.33ID:+oZBuxlP0
そんな難しい話は私には縁がありません
ひたすらお願いすることといえば、やさしい解析学ともっとやさしい線形代数の教科書を教えてほしい、ということです、ちなみに佐武で撃沈しています…
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況