【lgb,t-sne】カグラーたちのチラ裏【R,OpenCV】

**デフォルトの名無しさん** · 2019/09/15(日) 11:26:50.12

Kaggleの手法やコンペンションについて"具体的"に語るスレ

カグル以外の話題、特にAI全般や業界事情などについては別スレでお願いします

**デフォルトの名無しさん** · 2019/09/15(日) 11:29:21.04

google-colabにドライブをマウントして使っているんだけど
先日なぜかファイルから読み込みはできても書き込みできないという状況になった
コードを書き直したりいろいろと試してみて、最後に原因がわかった
無料で使えるドライブの容量、15GBをオーバーしてた

……さっさと気づけよ、オレ……

**デフォルトの名無しさん** · 2019/09/15(日) 16:44:43.01

要領足りててもwriteエラーは多い

**デフォルトの名無しさん** · 2019/09/16(月) 01:48:45.12

欠損値が多いからLGBばかり使われているtableのコンペンションで
連続変数の欠損値をすべて特徴量ごとにコードを書いて埋めてNNで回したら、
わりとLGBの結果に近い精度を得られた

これは暇人にしか出来ない手だな

**デフォルトの名無しさん** · 2019/09/16(月) 01:52:37.53

ついでに紹介しておこう
このライブラリは相当つかえる。Focallossに対応してる

Imbalance-XGBoost

**デフォルトの名無しさん** · 2019/09/16(月) 02:27:40.99

GMEANの結果をkernelに挙げて、いいねを稼いでる奴ら、いったい何がしたいんだろうな

**デフォルトの名無しさん** · 2019/09/16(月) 10:54:57.34

NNやロジスティック回帰を想定
・特徴量を多めに作っておく
・すべての特徴量を使って学習・テスト
・特徴量を順番にひとつずつ抜いて学習・テスト
精度を比較して、向上していれば、その特徴量は次回から使わない
kernelで拾ったアルゴリズムけど、これ普通に実務でも使えるな

**デフォルトの名無しさん** · 2019/09/19(木) 14:09:15.38

あぶねー。検証とテストの乖離をかるく見過ごしたまま、
パブリックスコアの上昇ばかり追い求めてた
これ最終日にやられるパターン。気がついてよかった

**デフォルトの名無しさん** · 2019/09/21(土) 02:12:56.74

sheckupが怖い怖いマジ怖い

**デフォルトの名無しさん** · 2019/09/21(土) 02:31:48.55

shakeupか。スペルぜんぜん違った

**デフォルトの名無しさん** · 2019/09/23(月) 21:02:28.04

不拮抗データのダウンサンプリング超つええ

**デフォルトの名無しさん** · 2021/01/24(日) 13:37:07.28

OpenCVのUNICODE(対応ω)の実装が想像以上にカスだったでござるωωω