【統計分析】機械学習・データマイニング20

■ このスレッドは過去ログ倉庫に格納されています
2018/08/07(火) 18:56:37.59ID:sGPH9ejna
機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング19
http://mevius.2ch.net/test/read.cgi/tech/1520586585/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
2018/09/19(水) 14:27:41.75ID:cOJ83uNip
今日休みだから勉強してたけど5時間で参考書4ページくらいしか進んでない…
時間かけたからって理解したわけじゃないし…
ビニングとか交互作用とか多項式とか概要はまだしもなんでこれをやる必要があるのか全然分からん
2018/09/19(水) 17:46:00.61ID:kf9wev3s0
俺はもう一冊読破したよ
コツは実践しながら読むこと
501デフォルトの名無しさん (ワッチョイ bf1e-+ow7)
垢版 |
2018/09/19(水) 18:05:00.19ID:vTJ3S9KO0
>>489
でも野村證券とか大手はAPIに負荷かけまくりじゃん?
おかしいよね?

見せ板も出しまくりだよね?
2018/09/19(水) 18:32:49.69ID:rc2jjf3P0
JUPYTERLAB、まじで統合開発環境になっていやがるな
機能が一気に増えたけど、余計なことまで出来るようになるのは吉か凶か

DSモドキ、機械学習エンジニア(笑)たちの御用達ツールって感じじゃなくなったな
本当にIDEだ。pythonを使って、チームで本格的な開発を行う人たちの強力なプラットホームだわ
2018/09/19(水) 19:09:37.45ID:uTNvKAU6a
jupyterlabはvim拡張がnotebookと比べて貧弱だったから使ってなかったけど今は進化したかな?
2018/09/19(水) 19:48:23.18ID:cOJ83uNip
>>500
一冊終えるのに何ヶ月もかかるわ
だからって完全に理解してるわけじゃないし時間かかった分どんどん忘れていくし…
実際コード書きながらやるんだけど参考書の説明が分からないと先に進めず考えこむんだけど分からなくても先にとりあえず進んだ方が良いのかなぁ
2018/09/19(水) 20:10:53.74ID:aiIpKBDGM
>>495
よーし、裏山に生えてたニラでも食うかー
506デフォルトの名無しさん (ワッチョイ 7f5a-NMPr)
垢版 |
2018/09/19(水) 21:33:48.11ID:kwGXfZ/C0
>>495
実物見りゃすぐ分かるよ
2018/09/19(水) 21:40:24.46ID:GiAtsVA80
>>504
いちいち立ち止まって考えるのも、無理やり先に進むのも、どっちも正解だろ
どういうやり方をしてもすぐに忘れるんだから
ただ、表面的な知識を忘れても、なにか身についているような状態にするのが理想なんじゃないかなとは思う

数学、統計学、機械学習の理論、情報科学の基本的な考え方
プログラマー的な物作りの直感や、WEB系なら文系的な能力などなど
そういうものが最も大切で、ライブラリやプログラムの文法、ツールの使い方なんかは
適当にそのつどそのつどで調べながら身につければOKなんじゃないか

最近、ツール関連は流行り廃りが激しいから、使い方をいっぱんに覚えるより
使い方がわからないツールを、英語ドキュメントを読みながら、なんとなく動かして
作業をちんたらちんたら進められる能力のほうが貴重な気がしてきた
2018/09/19(水) 23:21:12.82ID:Ev5NTVKN0
>>499
細かく読み進める前に、学ぶ意義付けを見直した方がいいんじゃないか。
入門書であれば章の始めなどに「何のためにこの章を学習するか」という意義付けが示されるはずだし、
示されないのであればあまり入門者向けの本ではないからもっと簡単な本から学んだ方がいい
509デフォルトの名無しさん (アウアウカー Sae9-Sybn)
垢版 |
2018/09/20(木) 10:23:59.56ID:gnTuzcyga
TF2、高レベルに進化するんだな
数年後にkeras消えてそう

https://www.hellocybernetics.tech/entry/2018/09/20/001259
510デフォルトの名無しさん (アウアウウー Sa25-V+nN)
垢版 |
2018/09/20(木) 11:30:12.09ID:M2lBgQHaa
>>509
tensorflowとpytorchか?新しいの出てくるのか?
2018/09/20(木) 12:23:04.74ID:o2DcsKoW0
開発元同じだから
2018/09/20(木) 12:23:46.76ID:zlEb4gGt0
覚えるの大変だから、これ以上新しいものは出さないでほしい
513デフォルトの名無しさん (ワイーワ2 FF8a-wH+P)
垢版 |
2018/09/20(木) 12:30:15.73ID:7WHuQIEOF
おまいの脳は退化してる
2018/09/20(木) 14:26:41.94ID:X9J+trAU0
脳が学習を拒否してるだけだろ
2018/09/20(木) 20:04:23.98ID:5NSt/ZF+0
その機械学習の勉強意味あるんですか?
何か後に繋がるの?って言われた

そんなこと俺が聞きてぇよ!
何も知らない分からないとこから始めて勉強方法だって手探りだしやってる内容があってるか分からんし内容だって難しいしイメージ湧かないしで本人が一番不安だわ(;ω;)
なんだよちくしょう…(;ω;)
2018/09/20(木) 21:53:45.68ID:lp9E2ptbd
>>515
向いてない、無理してやることない
2018/09/20(木) 23:50:09.61ID:sVm7S3su0
我々の代わりにニューロンが学習してくれるのさ
2018/09/21(金) 17:00:40.03ID:2t2lIB8da
>>509
消えるも何も TF に統合されて普通に使われてるんだが…
2018/09/21(金) 17:58:59.29ID:MMpIEkeV0
俺にも機械学習を学んだ後のゴールが見えない
2018/09/21(金) 18:09:41.64ID:KMw7nMvLa
目的がないのに無理して学んでもしょうがないんじゃない?
受託分析の会社に就職したいとかこういうプロダクト作りたいとか、何かしらゴールを設定しないと学んだ事も役に立たないと思う。
2018/09/21(金) 18:27:13.56ID:2t2lIB8da
同意。もう素人がちょっと勉強してどうにかなるレベルじゃないし
2018/09/21(金) 19:46:22.75ID:egkcJrwz0
仕事に付けばゴールが設定されるんでは
2018/09/21(金) 20:31:40.71ID:y+ZygFeU0
何となく流行ってるからオライリーのディープラーニング本買ったけど、
私立文系非職業プログラマが趣味で手を出せる感じじゃない?
2018/09/21(金) 20:34:15.20ID:Hsxyb3Kxd
趣味でやるならいいんじゃないの。ゆっくり基礎から楽しめばいい
525デフォルトの名無しさん (ササクッテロ Sp71-/e2F)
垢版 |
2018/09/21(金) 20:36:04.02ID:LuvXm+Whp
deepで回帰やってる人ほとんど殆ど見ないし明らかに回帰問題な物もクラス分類に置き換えてやってるの見る限り回帰よりも分類の方がハードル低いんですかね
2018/09/21(金) 20:36:50.09ID:81NIT4ig0
当たり前だろ
計算コストも高い
2018/09/21(金) 22:11:23.45ID:MMpIEkeV0
>>523
いや、理論が分からないんじゃなくて、
膨大なデータと強力な計算装置がないと、たいした物は作れない。

つまり、個人がチマチマと何かを作る用途には向かない
2018/09/22(土) 00:13:45.94ID:ZacBjrxHa
個人でもアイデア次第で面白いもの作れると思うけどな。
計算資源は趣味でやるレベルならクラウドサービス借りればいいし、
画像分類系ならImageNetのファインチューニングである程度は精度上げられる。
ラーメン二郎識別の人も、ベースの画像は自作のクローラーで集めた3万枚くらいでデータ拡張やGANで増やして精度を上げたと聞く。

サービスとして提供するレベルを目指すなら企業の力がいるけど、それは機械学習に限ったことではないし、
個人で楽しむ環境は自力で十分に用意できると思う。
2018/09/22(土) 00:38:25.15ID:l1Z1a/8Ia
AzureとかGCPとか使いたいけど無料でやりたくてもカード登録必須で無料枠越えたら勝手に課金されるのが怖い
勝手に課金せず無料枠越えたら問答無用でストップしてくれればいいのに
530デフォルトの名無しさん (アウアウエー Sa4a-nL3Z)
垢版 |
2018/09/22(土) 00:40:04.67ID:K4iJB0qOa
教師なしでできる事やればいいのに
強化学習とかさ
2018/09/22(土) 00:50:07.29ID:uHslz/QL0
できるかよ
どれだけ借りるつもりだ
2018/09/22(土) 00:51:12.19ID:7+L6lvEZ0
>>529
GCPは無課金枠使い切ったらクレカ開始するまでワンステップあるよ。
使い切った時点でサービスが一度止まるはず
533デフォルトの名無しさん (ワッチョイ 6db6-p9eM)
垢版 |
2018/09/22(土) 02:23:42.00ID:MAFBmZ+e0
ヒカキンの年収が10億超え!?明石家さんま・坂上忍も驚愕の総資産とは??
https://logtube.jp/variety/28439
HIKAKIN(ヒカキン)の年収が14億円!?トップYouTuberになるまでの道のりは?
https://youtuberhyouron.com/hikakinnensyu/
なぜか観てしまう!!サバイバル系youtuberまとめ
http://tokyohitori.hatenablog.com/entry/2016/10/01/102830
あのPewDiePieがついに、初心YouTuber向けに「視聴回数」「チャンネル登録者数」を増やすコツを公開!
http://naototube.com/2017/08/14/for-new-youtubers/
27歳で年収8億円 女性ユーチューバー「リリー・シン」の生き方
https://headlines.yahoo.co.jp/article?a=20170802-00017174-forbes-bus_all
1年で何十億円も稼ぐ高収入ユーチューバー世界ランキングトップ10
https://gigazine.net/news/20151016-highest-paid-youtuber-2015/
おもちゃのレビューで年間12億円! 今、話題のYouTuberは6歳の男の子
https://www.businessinsider.jp/post-108355
彼女はいかにして750万人のファンがいるYouTubeスターとなったのか?
https://www.businessinsider.jp/post-242
1億円稼ぐ9歳のYouTuberがすごすぎる……アメリカで話題のEvanTubeHD
https://weekly.ascii.jp/elem/000/000/305/305548/
専業YouTuberがYouTubeでの稼ぎ方具体的に教えます。ネタ切れしない方法は〇〇するだけ。
https://www.youtube.com/watch?v=Co9a9fHfReo
YouTubeで稼げるジャンルは〇〇動画です。YouTube講座
https://www.youtube.com/watch?v=_Nps8xb5czQ
2018/09/22(土) 10:37:32.71ID:IfrUT1bl0
GTX1080 一枚くらいなら個人買うけど、何すべえ
535デフォルトの名無しさん (ワッチョイ c980-yqSl)
垢版 |
2018/09/22(土) 11:17:23.77ID:PGp2AKzL0
低学歴知恵遅れが独学で機械学習を学習しても
一向に学習効果があがらない
このスレみてればよくわかるだろ

それと同じだからな

まずバカは勉強のしかたや努力のしかたが分かってない
だからバカはバカのまま

さらにバカはバカの自覚がない
だからバカはバカのまま

もうカンペキなレス
536デフォルトの名無しさん (アウアウエー Sa4a-nL3Z)
垢版 |
2018/09/22(土) 11:25:37.78ID:K4iJB0qOa
流行りのディープラーニングやりたいのはわかるけどさ
データ集めるのもチューニングするのも難しいから、初心者が自前のデータでやるのは難しいと思うよ

まずはSVMとか決定木みたいな古典的な手法から入るべき
データが少なくてもそこそこ上手くいくから
537デフォルトの名無しさん (アウアウエー Sa4a-nL3Z)
垢版 |
2018/09/22(土) 11:26:26.13ID:K4iJB0qOa
ディープラーニングだけが機械学習じゃないよ
2018/09/22(土) 11:28:18.51ID:IfrUT1bl0
自分はそのつもりっす。方式による計算量の多寡の検討もつかないのでまずは一通り遊んでみる
2018/09/22(土) 13:26:53.70ID:fcKY0ssXa
このスレってnlp ネタ殆ど出ないよな。あんまやってる人いないのかな。
allennlp 使いたいけど評判どう? 知ってたら教えて
2018/09/22(土) 13:47:27.41ID:+pucmWord
>>539
このスレは超初心者救済スレだから。LSTMもattentionもまったく出てこないw
AllenNLPは良くできてるけど少しハードル高いかも、仕様の把握が面倒
541デフォルトの名無しさん (ワイーワ2 FF8a-wH+P)
垢版 |
2018/09/22(土) 13:48:31.14ID:xOVRbYWfF
nipless
2018/09/22(土) 13:51:54.80ID:IfrUT1bl0
ダジャレスレ
2018/09/22(土) 13:56:57.15ID:fcKY0ssXa
>>540
サンクス、そう言えば rnn の話し見ませんね。
やっぱドキュメント読まないとダメか… pytorchもわからんとダメ?
544デフォルトの名無しさん (ワッチョイ 6220-Mczu)
垢版 |
2018/09/22(土) 17:59:22.10ID:QjN0TaMB0
ここに書いても無駄だろうけど
Attentionした時間順を特徴に埋め込んでから
CNNでその時間を考慮しつつ、初期層含め各層の時間情報を参照しながら畳み込む
ってモデルさっさとでないかなぁ
sota必至だから早く論文出てほしい

脳はやってる
https://www.eurekalert.org/pub_releases/2018-08/nuos-hyb082818.php

でも既存の機械学習では、初期の特徴に時間を付与することはほとんどやってない
RNNやLSTMが上手くいってないのは、初期から時間情報を連続的に把握して時間変化率を学習できないからだよ
いくら微分しても変化率とっても、初期状態からの時間情報を連続的に把握できないから学習できてない

一方、音声を特徴とする場合、ほとんどシークタイムが特徴に自動的に含まれるから
処理はクソ重くなるけど、高品質な結果が得られる

人間に置き換えても一緒
感覚器官は注意と畳み込みを同時に行いながら、それらの順でシーケンスを伝えて
脳はこの順番を記憶している
2018/09/22(土) 18:13:18.49ID:tW/Yy4gZ0
機械学習もいいが、センサーにはかなわん
ブラックボックスの中のものを重さや振った時の音で予測する・・・なんて回りくどいぜ
X線撮影で確認しろ
未来予測ならワームホール望遠鏡だ!
2018/09/22(土) 19:40:46.36ID:fcKY0ssXa
長崎は勝たないと脱落するぞ
2018/09/22(土) 19:41:06.05ID:fcKY0ssXa
ごめん、誤爆 orz
2018/09/22(土) 21:29:54.41ID:2qFIpkAdd
>>543
ドキュメントをなぞるだけなら不要
549デフォルトの名無しさん (ワッチョイ 6976-uN3A)
垢版 |
2018/09/22(土) 22:34:55.25ID:z+m4dANi0
>>503
デフォルト設定は貧弱
カスタマイズありきで拡張性は高いんだけど、使いこなせないなら、旧版をずっと使い続けた方がよさそう
こんなツールの設定コマンドを覚える暇があったら他にやらなければならないこと五万とあるだろ
俺は覚えるつもりだけど・・・
2018/09/23(日) 12:44:56.23ID:bLvK9Iso0
俺みたいな雑魚はまずnumpyとpandasとmatplotlibを使いこなせるように頑張るとこからだな
2018/09/23(日) 15:05:02.43ID:/sY9qa+Ta
>>550
的を得てるけど、深層学習が目的なら keras のサンプルでも動かすとモチベーションが保ちやすい

>>548
了解。ボチボチ覚えるつもりではいます
2018/09/24(月) 02:46:29.51ID:igBDxXXr0
>>544
カプセルネットワークみたいにベクトルに拡張して空間情報とするのは?
553デフォルトの名無しさん (ワッチョイ 69c3-onpN)
垢版 |
2018/09/24(月) 04:22:26.78ID:6dcTB1Rg0
>>544
マルコフ連鎖をモデルの中に組み込めば良いんじゃ無い?
でも微分で消えてしまうのかな.
554デフォルトの名無しさん (アウアウウー Sa25-V+nN)
垢版 |
2018/09/24(月) 09:09:25.13ID:ekT6BbXIa
>>551
chainerのサンプルコードの方が楽。
2018/09/24(月) 12:16:47.58ID:lNNMZfDzd
>>554
まだ使ってる人いるのか
2018/09/24(月) 12:26:29.26ID:VhNQr7Aka
>>554
オワコンの名前をあげていちいち絡むな
https://trends.google.co.jp/trends/explore?cat=5&;q=tensorflow,chainer
557デフォルトの名無しさん (ワッチョイ c252-Mczu)
垢版 |
2018/09/24(月) 16:12:04.69ID:6L+7kJR10
>>552
カプセルネットワークの手法だと
各層で獲得した特徴同士の空間的相対位置は正確になるけれど
それでは汎用性がない
脳は空間的相対位置を崩す事もできる

これは記憶している各時間情報を参照して相対位置すら入れ替え可能だからできる
注目した部分の特徴だけを切り取って、別物として貼り付けるのではなく
一定の連続的時間情報部分を切り取って、その部分の特徴を別の連続した時間情報の一部分をキーとして
完全に連結させることができる
だから本当の汎用性を獲得するためには、時間情報の連続的把握が絶対に必要になる

>>553
マルコフ性はこの場合適さない
何故ならば、脳と同様の構造を獲得するためには
過去、現在、未来すべての情報を参照する必要性があるから
2018/09/24(月) 16:27:32.53ID:5edCpy4L0
過去・現在・未来の区別は単なる幻想にすぎない アインシュタイン
559デフォルトの名無しさん (エムゾネ FF62-wH+P)
垢版 |
2018/09/24(月) 17:28:14.05ID:Kttr1loZF
そうやね
560デフォルトの名無しさん (アウアウエー Sa4a-nL3Z)
垢版 |
2018/09/24(月) 18:08:33.46ID:G1aPepRna
>>558
マルコフ連鎖的なレスやな
2018/09/24(月) 18:51:54.57ID:FnEn+Nhsa
>>557
解き方知ってるんじゃないの? 自分で論文を書いた方が早いのでは。
562デフォルトの名無しさん (ワッチョイ c980-yqSl)
垢版 |
2018/09/24(月) 19:11:49.55ID:Kxio7RVg0
https://qph.fs.quoracdn.net/main-qimg-f5ea2024de1c0fc8c5b0830450deba7e
2018/09/24(月) 21:11:14.88ID:gWQCW5YD0
隠れマルコフモデルを覚える前にマルコフモデルを覚えましょう。
2018/09/24(月) 21:12:22.33ID:gWQCW5YD0
ついでに言うとウィナー過程とマルチンゲールも知っとけ
565デフォルトの名無しさん (ワッチョイ c980-yqSl)
垢版 |
2018/09/24(月) 21:12:23.12ID:Kxio7RVg0
じゃあ待ち行列の勉強から
2018/09/24(月) 21:42:12.44ID:lJZK7+QF0
連休に行楽地へ行って体験しよう
567デフォルトの名無しさん (アウアウエー Sa4a-nL3Z)
垢版 |
2018/09/24(月) 22:10:45.88ID:G1aPepRna
>>556
どっちも使った事なさそう
2018/09/24(月) 23:18:47.49ID:OwMqA+EG0
初歩的な質問なんだけど、tensorflowやkeras、pytorchの違いは文法的な作法だけ?
機械学習の本1冊目だけど実践しながら読み終えて完全に理解はしてないけど深層学習も興味あるしやってみたいなと思うんだけど、みんながフレームワーク選ぶ基準教えてほしい
2018/09/25(火) 00:45:33.33ID:G04XkrxS0
・define and runとdefine by run、まあこの違いはなくなりつつある
・分野によって使われやすいのが違う気がする、arXivみてそんな気がしてるだけで統計とかはないけど
570デフォルトの名無しさん (ワッチョイ c252-Mczu)
垢版 |
2018/09/25(火) 01:01:38.10ID:Rmy45yvb0
>>561
論文を書くためには結果が必要だけど
この手法は脳の構造模倣だけに凄まじい量のデータが必要になるのは明白
つまり現実的には、この畳込みモデルを適用したGANも組み込む必要があって
作業量的にも計算量的にも個人ではまず無理
2018/09/25(火) 03:35:03.53ID:LXnmrKE+0
割込も体験するべき
2018/09/25(火) 04:07:52.14ID:IDRi2Kjza
>>570
仮に他人の論文があっても実現はできないと言ってるように聞こえる。
個人でできる範囲で成果を取った方が有益かもね。
2018/09/25(火) 14:23:16.83ID:NL395plNa
回帰における学習でデータ正規化を行った上で得られたモデルを使う場合は学習時の正規化で使った平均・標準偏差を使って入力値を変換しなければいけないと思うんだけど、
scikit-learnの使い方紹介記事とか読むとtrain_test_splitで訓練・テストデータ分離して各々別々にfit_transformで正規化している記事が大半で訓練・テストデータが異なる値で正規化されてしまうことになる
これは訓練・テストデータが大量にあればどうせ平均・標準偏差は変わらないだろうというだけの認識でいいの?
2018/09/25(火) 17:49:12.68ID:kAi0n2pKa
ごめん、見た記事では多分最初だけfit_transformして次では単にtransformしてたっぽい
それなら何の問題もないな
575デフォルトの名無しさん (アウアウエー Sa4a-3cGd)
垢版 |
2018/09/25(火) 18:05:19.79ID:MY+XQBfWa
>>570
相対性理論とか実証は別の人がやることだってあり得る
論文を出すのはできるんじゃね
それが認められるかどうかは内容次第だし
本当に有益ならリソースを持つ組織が実証するし
必要ならその組織に所属すればいいだけ
576デフォルトの名無しさん (アウアウエー Sa4a-3cGd)
垢版 |
2018/09/25(火) 18:09:03.58ID:MY+XQBfWa
>>573
実際に応用として使用する時に上手く行くかどうかじゃね?
学習に使うサンプルが偏ってたらその値を使って正規化すると
実際に使うときに期待する結果にならないんじゃね?

期待する結果に有意差がなければどっちでも良いんじゃないの?
577デフォルトの名無しさん (ササクッテロ Sp71-/e2F)
垢版 |
2018/09/25(火) 22:06:17.44ID:niBQlr5vp
最近回帰問題解くのがキツすぎて無理やり0〜1に正規化して分類みたいにやるのがいい気がしてきた
2018/09/25(火) 22:39:44.81ID:u+oxJT9H0
>>577
層を厚くすればなんとかなるんじゃないの?
2018/09/26(水) 00:52:49.34ID:OKJKpWkba
そろそろ PyTorch が無視できなくなってきたな つ
https://www.kdnuggets.com/2018/09/deep-learning-framework-power-scores-2018.html
2018/09/26(水) 08:37:33.11ID:SJU9UbCQM
画像データを分類して教師データを作ろうとしてるんだけど、荒くでいいから自動で分類してくれるソフトないかな。
2018/09/26(水) 10:44:59.92ID:3yW6iUgn0
SOM
582デフォルトの名無しさん (ササクッテロル Sp71-/e2F)
垢版 |
2018/09/26(水) 11:01:18.29ID:UoU/Uwygp
>>578
わからないです
画像の生成モデルで出てきた問題みたいに支配的な領域に適合して細かい構造を予測できないので、分類にしてダイス係数を使おうかと考えていました
2018/09/26(水) 12:18:49.20ID:5WxjrnKia
>>580
自動分類できないから機械学習使おうとしてるのにその前に自動分類してくれとは
2018/09/26(水) 13:07:40.99ID:SJU9UbCQM
>>583
最終的には自分で見なきゃいけないのは承知してるんだけど、荒く自動分類した後に人が修正って考えてます。

何とか教師データの作成を楽したい。
2018/09/26(水) 13:09:08.33ID:SJU9UbCQM
>>581
ちょっと調べてみます。
2018/09/26(水) 14:20:02.13ID:iQ/1ta8NM
>>584
qtクラスタリングとかどうよ?
2018/09/26(水) 14:48:10.49ID:nIEdWeYp0
画像にキャプション付けてくれるサービス探したらありそうだけど
2018/09/26(水) 17:42:13.90ID:/NSmYwyE0
googleが人間にゴリラってタグ付けてたの思い出した
2018/09/26(水) 18:41:51.88ID:IVfMWxLtM
>>588
当欠だな
2018/09/26(水) 18:42:16.88ID:IVfMWxLtM
s/当欠/凍結/
591デフォルトの名無しさん (ワッチョイ c923-Czqz)
垢版 |
2018/09/26(水) 23:13:11.78ID:Lv/+nPmY0
あの画像なら人間でも間違えるから仕方ない
2018/09/26(水) 23:34:16.52ID:KPLU+0tA0
SVCのモデルを作る時にMinMaxscalerでスケール変換して、GridSearchCVでインスタンス作って、それに対してスケール変換した訓練データを使って学習させるって事をやったんだけど、これはダメらしいんだけど前処理の前に交差検証しろっていうのがよく分からない。

交差検証の過程では分割されたデータの一部が訓練用、残りがテスト用になって、訓練用となった部分を用いてモデルを学習させて、テスト用はモデルに対しての評価に使われる。
ここまでは大体分かる

しかし実はスケール変換する際にテスト用となった部分に含まれてる情報を使ってしまってる。
このようなデータはモデルに対してまったく新しいデータとは本質的に異なる。
???訓練用の一部がテスト用になるから??
2018/09/27(木) 09:27:07.99ID:sw1sA5ZZ0
>>592
スケール変換の際にテストデータの情報を使ってしまったら、そのテストデータは「まったく新しいデータ」とは言えない。
2018/09/27(木) 11:10:18.48ID:TDX1lgSt0
qiitaは機械学習の良い記事があっても全然ランキング入らなくなったな
ニワカが飽きたのか
595デフォルトの名無しさん (ブーイモ MMbf-wjEJ)
垢版 |
2018/09/27(木) 11:20:21.49ID:je3kizhWM
>>568
pythonはプログラム言語でtensorflowやkerasは効率よく機械学習するためのライブラリ。
2018/09/27(木) 12:14:59.19ID:PZBFougTa
>>594
それならいい記事見つけたらここにでもURL貼ってほしい
qiitaはタイムラインから良記事探すのが難しい
2018/09/27(木) 22:08:27.94ID:wuMHpvCna
>>594
飽きたというよりも具体的な恩恵が得られないからモチベーションが続かないのでしょう
趣味でやっている人たちばかりじゃないから
598デフォルトの名無しさん (ワッチョイ 5723-qD32)
垢版 |
2018/09/27(木) 22:17:45.69ID:JFP1gXlP0
英語で検索した方が有用な情報多いよ
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況