【統計分析】機械学習・データマイニング29

■ このスレッドは過去ログ倉庫に格納されています
2020/08/20(木) 09:16:43.41ID:Av1Lrhjm0
!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
↑すれたてる毎に1行ずつ減るので、減ってたら3回に増やしてたてること。

機械学習とデータマイニングについて語れ若人

*機械学習に意識・知能は存在しません。
  人の意識に触れたい方はスレ違いです。

■前スレ
【統計分析】機械学習・データマイニング28
https://mevius.5ch.net/test/read.cgi/tech/1588293154/
-EOF-
VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured
74デフォルトの名無しさん (ワッチョイ 9dda-yOpk [114.182.59.118])
垢版 |
2020/09/03(木) 21:01:30.17ID:qNk1tjNB0
kerasではなくpytorchのほうがいいのかな
face book嫌いだから使いたくないけど
2020/09/03(木) 21:05:35.93ID:2cBStg5R0
kerasのサンプルあるよね?
2020/09/03(木) 21:08:09.53ID:oPPXaQOW0
attentionて普通に組んだら計算コスト洒落にならなそう。
2020/09/03(木) 21:31:54.12ID:nez+JOaA0
うお、KerasにAttentionレイヤー用意されてたのか
tf.keras.layers.Attention
いつの間に
78デフォルトの名無しさん (アウアウウー Sa69-7b63 [106.154.139.120])
垢版 |
2020/09/03(木) 21:34:25.70ID:H4JjWibDa
>>74
坊主憎けりゃ、だな
お前が使ってもfacebookは1ミクロンも得しないから安心して使え
2020/09/04(金) 02:46:34.87ID:JFyn8ysD0
エロ動画のモザイク取り除くai作りたい、てかなんで誰も発売しないんだ
2020/09/04(金) 03:47:31.78ID:mDofFZHor
それはAI界最大級の難しいテーマだからな。
コンピューターには性欲がないからw
81デフォルトの名無しさん (ワッチョイ 6501-JFwp [60.86.178.93])
垢版 |
2020/09/04(金) 07:19:00.27ID:jvrr6lZ70
>>79-80の流れに朝からワロラサレターヨ(・∀・)
2020/09/04(金) 07:50:08.83ID:4FjIUW730
発想が童貞みたい
2020/09/04(金) 08:02:56.49ID:WvWinIJxM
>>79

https://i.imgur.com/Lysnw37.jpg
2020/09/04(金) 09:56:18.30ID:VQ6sIcSE0
>>79
あるよ
85デフォルトの名無しさん (JP 0H29-yOpk [202.216.106.142])
垢版 |
2020/09/04(金) 10:27:07.17ID:3vk4X+ZOH
あるにはあるけど、エロ画像だけ学習させて商品として提供してる会社がなくないか
昔の全然とれないモザイクリムーバーみたいに売れば大ヒットだとおもうんだけどなあ
2020/09/04(金) 11:29:39.09ID:lHqiid/jM
活性化関数は出力を得るためにかけるんだよね?
dropoutはどの層で有効にすればいいの? 中間層すべて?
2020/09/04(金) 12:30:33.71ID:zd548qQ8M
顔消しモザ消そうとしてちんこが生えたらどうするんだ
2020/09/04(金) 14:01:51.90ID:jvrr6lZ70
>>86
上:せやな
下:やりすぎても、やらなさすぎてもうまくいかず、さじ加減が職人芸だときいている
2020/09/04(金) 14:47:29.83ID:GIOuj/3d0
>>68
数学や統計を極めても、上2つは難しくね?
2020/09/04(金) 14:59:55.37ID:lHqiid/jM
>>88
ありがと
そっかー、うーむ🤔
91デフォルトの名無しさん (アウウィフ FF69-th+2 [106.171.75.10])
垢版 |
2020/09/04(金) 15:03:17.37ID:l2EHvy2iF
りんごちゃんとはるな愛の区別が出来ないんだけど過学習かな
2020/09/04(金) 16:54:52.03ID:QJTIc14X0
>>89
上2つが適切に設定されていないと、結論の妥当性が示せない。
2020/09/04(金) 17:16:08.49ID:Nh0NQvHOH
>>68
モデルゴリゴリ以前の問題なのでは
2020/09/04(金) 18:22:35.09ID:5pEEdWxD0
>>86
中間層すべてにかけるのが普通かな
出力層にもかける流派もあるらしいが
ドロップアウト率は入力層に近い方を高く、遠い方を低くするもんらしい
2020/09/04(金) 19:15:53.20ID:HIGqzVjC0
非線形関数を通さないと線型結合を繰り返すだけになるんじゃないか?
あと微分しても一定の値だからバックプロパゲーションも出来ないのでは?
2020/09/04(金) 19:35:31.74ID:lHqiid/jM
>>94
ヒントンの論文だと
全中間層でdropoutかけてる図がでてたんだよね

悩む🤔
2020/09/05(土) 10:16:29.80ID:Az39CCC60
GeForce RTX 3090はFP32性能が36TFLOPSか、すげーな
しかしせっかくTensorCoreが載ってるのに、これって学習には使えないのね
FP16しか対応してないからかな? 確かにFP16じゃBPがうまく進まなそうだが
性能半分でいいから、FP32対応してくれればいいのに
せっかくの汎用マトリクス演算ユニットなのにもったいない
2020/09/05(土) 11:20:16.92ID:DwFJQw5i0
個人で買えるかわからないけどこんなのもあるな
https://jpn.nec.com/hpc/sxauroratsubasa/features/index.html
2020/09/05(土) 11:36:28.67ID:ebgs5EyIM
>>97
どこでそんなマヌケな情報を手に入れたんだよ
2020/09/05(土) 11:41:53.99ID:lXaWPRh70
>>98
XEON PHIより難易度高そうだけど
THX
2020/09/05(土) 11:42:29.92ID:0NWRwchU0
それはスパコンでは?
2020/09/05(土) 12:01:56.16ID:CjkYIT6R0
>>97
ggたけどそれらしい情報がないが
2020/09/05(土) 12:12:25.16ID:0NWRwchU0
>>102
出てるよ
fp16だと71tflopsだってさ
2020/09/05(土) 12:26:15.00ID:Az39CCC60
nVidiaのTensorCoreはFP32には対応していない
いちおう、TensorflowなんかでもFP16設定にすればTensorCoreも学習に使ってくれるみたいね
もっとも試してみた人のブログとか見てるとやっぱFP16じゃ精度が悲惨なことになるらしい
ttps://qiita.com/kuroyagi/items/e70c55cbc88fc0ed0220
そういう意味じゃやっぱ推論専用という捉え方でいいんじゃないかな
71Tflopsとか夢があるけどなあ
2020/09/05(土) 12:45:27.03ID:Az39CCC60
× nVidiaのTensorCoreはFP32には対応していない
〇 GTX/RTXのTensorCoreはFP32には対応していない

A100とかだとFP32/64も対応してる。学習アクセラレータなんだからそりゃそうだ
グラボに載ってるTensorCoreは対応してなくて推論専用って話ね
2020/09/05(土) 12:47:02.54ID:0NWRwchU0
そうそう
107デフォルトの名無しさん (ワッチョイ 0502-biH0 [118.154.96.7])
垢版 |
2020/09/05(土) 13:09:00.94ID:Az39CCC60
RTX 30シリーズはSSDから直接グラフィックデータを読み込めるらしいが
たぶんDLの学習データ転送にも使えるよね
flopsもメモリ帯域も上がってるしDL用途にも別次元の速さが実感できそうだ
2020/09/05(土) 15:27:22.54ID:71ZWev/Z0
>>103
例えばどれ?
2020/09/05(土) 15:57:37.62ID:Az39CCC60
>>108
103じゃないが、↓によると238Tensor-TFLOPSとなってるな
https://pc.watch.impress.co.jp/docs/news/1274381.html
Tensor-TFLOPSってのがよくわからんがFP16の性能かな?

FP16までしか対応してないソースは↓
https://www.nvidia.com/ja-jp/data-center/tensor-cores/
「サポートされている Tensor コア精度」に書いてある
Turingまでしか記載がないが、AmpereもFP32に対応したなんて発表はないし、
推論専用という位置づけは変わらないので一緒だろう
2020/09/05(土) 16:04:23.39ID:71ZWev/Z0
>>109
ありがとん
2020/09/05(土) 16:33:54.61ID:Az39CCC60
Tensor-TFlopsについて自己レス
Tflopsは普通ベクトル演算性能を指すが、TensorCoreは固定サイズのマトリクス演算なので
こういう書き方をしてるらしい
ピーク性能は238Tflopsなんだろうけど(FP16)、計算粒度が大きいんでよほどタスクが都合のいい
サイズでないと無駄が大きくなってしまう、と。
2020/09/05(土) 16:37:01.69ID:lXaWPRh70
普通に個人が使うならスリッパがベストかのう
2020/09/05(土) 17:09:43.08ID:Az39CCC60
17万円のThreadripper 3960Xで5Tflops
11万円のRTX 3080で30Tflops

DL専用ならやっぱRTXでは
まあCPUの汎用性も捨てがたいけど
昔よりCPUの並列化が進んで差が縮まってるから悩むな
2020/09/05(土) 18:13:07.70ID:Az39CCC60
[RTX3090]
CUDA Core : 35.7Tflops
TensorCore : 285Tflops
RT Core : 69Tflops

これだけポテンシャルがあるのにDLで使えるのはCUDAの35.7Tflopsだけ
なんか虚しくなってくるな
ゲーム用に売れてるおかげで安く買えるわけだから仕方ないと思わんといかんのか
2020/09/05(土) 22:07:46.07ID:lXaWPRh70
THX
3960Xかな
116デフォルトの名無しさん (ワッチョイ 9dda-yOpk [114.182.59.118])
垢版 |
2020/09/05(土) 23:55:05.96ID:ySUioB0H0
seq2seqのembeddingレイヤーに事前学習させたword2vecの重みを用いるとき、デコーダの文章を生成する合図につかう<EOS>の取り扱いはどうすればいいんだ
word2vecにEOSを学習させてベクトル化しなきゃいけないんだけど、学習データの最後の行に適当に付け足しとけばいいのか?
それとも学習データの行末すべてにEOSを付け足せばいいのか
2020/09/06(日) 02:41:40.34ID:6+iElI6k0
word2vecをembeddingレイヤにぶっこんだけど、リソース不足でバッチ数を下げざる負えなくなった
ヒカキンの持ってる1tbメモリmacが憎い
2020/09/06(日) 07:49:06.02ID:28nY3XQR0
>>116
「word2vec 追加 学習」で検索してみるとしあわせに

>>117
あいつそんなものもってるのか!

そうそう
自然言語の機械学習って
なんかしらんが(?)最後の段階あたりでくっそメモリ食う
2020/09/06(日) 08:02:00.79ID:fnIXCpSw0
gpu用意すればいいじゃん
120デフォルトの名無しさん (ラクッペペ MM4b-I/wA [133.106.90.74])
垢版 |
2020/09/06(日) 08:27:37.29ID:M4KtJHw+M
fasttextってゴミなの?
2020/09/06(日) 09:09:53.49ID:fnIXCpSw0
ごみじゃないよ(笑)
122デフォルトの名無しさん (ワッチョイ 23ad-svb1 [125.12.149.140])
垢版 |
2020/09/06(日) 10:20:49.37ID:y7ovSoOJ0
> お前は毎朝起きるたびに俺に負けたことを思い出すよ^^

あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!

クソチョンw

Pythonさえろくにできないバカチョンのくせに
できるとほざくクソチョンw

日本で強姦と窃盗を繰り返す
犯罪者在日のクソチョンw
2020/09/06(日) 12:07:37.08ID:4rkiTQ6J0
自宅でGPU回し続けたら電気代がかかりそうやね…
2020/09/06(日) 12:15:42.57ID:v5JhsKrg0
>>104 AI ではFP16 じゃ使い物にならないから、bfloat16 というフォーマットが出て来た。

bfloat16 形式は、符号ビットが 1 つ、指数ビットが 8 つ、仮数ビットが 7 つ、暗黙の仮数ビットが 1 つの [1:8:7] の形式です。これに対し、標準の 16 ビット浮動小数(fp16)形式は [1:5:10] です。
2020/09/06(日) 12:19:11.43ID:28nY3XQR0
>>119
入力がおおおおおいと何をどうやっても最終段階でメモリくっそ食うのだが
gpuで解決できるのんけ?
だとしたら大発見w

>>123
どこでやっても電気代は誰かが払っている
2020/09/06(日) 12:50:46.70ID:fnIXCpSw0
gpt-3は国内の研究機関だったら訓練不可能かな
設備的に
127デフォルトの名無しさん (ブーイモ MM6b-svb1 [163.49.211.220])
垢版 |
2020/09/06(日) 13:47:45.63ID:V9VDH8fJM
在日朝鮮人は死ね
128デフォルトの名無しさん (ワッチョイ 9dda-yOpk [114.182.59.118])
垢版 |
2020/09/06(日) 15:24:15.87ID:6+iElI6k0
メモリ食いすぎるし、バッチサイズ小さくしたら会話にならなくなったのでword2vecを組み込むことは断念。
ただこのままだと、語彙数が少なすぎるし、だれか名大会話コーパス以外でいい会話コーパス知ってる人いません?
できればURLも欲しいです
2020/09/06(日) 18:05:49.43ID:6+iElI6k0
赤外線撮影って昔流行ってたけど、普通の写真と赤外線写真を学習させれば、写真から下着を透かせるaiが出来上がるのでは?
2020/09/06(日) 18:06:47.64ID:6+iElI6k0
赤外線撮影って昔流行ってたけど、普通の写真と赤外線写真を学習させれば、普通の写真から下着を透かせるaiが出来上がるのでは?
2020/09/06(日) 18:10:42.46ID:YMHA2nFQp
>>117 周辺まで含めて800万円と言うから気狂いだな。
というか羨ましすぎる。
2020/09/06(日) 18:34:56.29ID:YMHA2nFQp
ヒカキンの動画って初めて見たけど人を惹きつけるテクニックを持ってるね。
2020/09/06(日) 18:59:56.26ID:Bdj7AItn0
>>130
大事なこと…なのか?
2020/09/06(日) 19:09:27.59ID:TeCejoUU0
赤外線に何を求めるかだろうなぁ

マンモグラフィの写真は嫌という程見たが
ちっとも興奮しない。まぁX線写真に欲情
するのは立派な変態だと思うが

昔 hirax でやっていたMR/AR技術を
使った巨乳Vision(生乳テクスチャをマッピング)
は是非実用化してもらいたいものである
2020/09/06(日) 19:22:15.71ID:uumzb8Gwa
>>130
普通の写真に写るものに下着の色・形・柄と相関のある情報がないから単に学習データで過学習されるだけ
136デフォルトの名無しさん (アウアウウー Sa69-Bf8w [106.154.139.224])
垢版 |
2020/09/07(月) 00:50:36.34ID:y2mIvMwCa
>>130
赤外線「風」写真は作れるだろう
本当に着ている下着とは全く関係なく
137デフォルトの名無しさん (ワッチョイ 9dda-yOpk [114.182.59.118])
垢版 |
2020/09/07(月) 01:08:15.13ID:B4Oclp/r0
>>136
これをなんちゃら坂46だのの写真に使えば売れそうじゃないか?
youtubeでPhotoshop使ってアイドルの下着すかしてるのがまあまあ再生稼いでたし、ヒカキンつぶせそうじゃね
2020/09/07(月) 07:27:48.84ID:X4wk0IcB0
アイコラ自動生成みたいなもんか
2020/09/07(月) 16:38:41.61ID:DIQIv4n60
悲報、ついにAIバブル崩壊

【技術】AIが衰退期に 機械学習エンジニアが職を失う [雷★]
https://asahi.5ch.net/test/read.cgi/newsplus/1599463955/
2020/09/07(月) 18:58:36.59ID:B4Oclp/r0
今からai研究してる大学を受験しようってのにどうすればいいんだよ
141デフォルトの名無しさん (アウアウウー Sa69-Bf8w [106.154.137.86])
垢版 |
2020/09/07(月) 19:01:34.03ID:kGNS9k6ua
露頭に迷うのは「自分を機械学習エンジニアだと思い込んでいる単純作業者」だろう
2020/09/07(月) 19:01:56.04ID:urAYf+snM
別にちゃんと勉強すればいいよ
学んだ統計もプログラミングも潰し効くでしょ
2020/09/07(月) 19:03:38.18ID:urAYf+snM
数学や物理の人気が落ちてるならそっち行くのもいいぞ
CSより普遍的だからね
2020/09/07(月) 19:17:50.66ID:AOlpWZnE0
物理学科の人ってどこに就職するの?
2020/09/07(月) 19:25:36.16ID:onbFH33j0
公務員じゃろ
2020/09/07(月) 19:27:01.46ID:AOlpWZnE0
夢がないね
2020/09/07(月) 19:49:35.03ID:urAYf+snM
コンサルかな。この世の全てをコンサル出来る。
あ、女心は無理だな
2020/09/07(月) 19:55:24.18ID:1xvy5dX80
物理はメーカーの研究とか行ってたよ
半導体とか電波とか
2020/09/07(月) 20:25:46.67ID:DIQIv4n60
高校の教員
2020/09/07(月) 21:11:47.74ID:onbFH33j0
>>147
コンサルみたいなチャラいものに思考が行く時点で物理学科にうからんか、
うかっても卒業できんと思われ。
2020/09/07(月) 22:28:07.52ID:98DMqs9Ga
>>139
https://asahi.5ch.net/test/read.cgi/newsplus/1599463955/49
2020/09/07(月) 22:49:45.76ID:VeYCBawpM
>>150
ワイの頃は研究所目指して玉砕してSIerに行ってしまうのが多かったな
ロスジェネだもの
2020/09/07(月) 23:21:05.78ID:OpQZP/1E0
データーサイエンス科とか作っちゃった大学はどうすんだろうね
そこで習いそうなことは数学科や物理科が上位互換してるし
2020/09/07(月) 23:29:43.76ID:VeYCBawpM
電気工学も元祖データサイエンスぽい気がするな
電気工学科もいいと思うぞ
2020/09/08(火) 00:26:34.96ID:A6dn5A1Y0
XGBoostにデータ入れて一丁あがりだもんね
156デフォルトの名無しさん (ワッチョイ 9dda-yOpk [114.182.59.118])
垢版 |
2020/09/08(火) 01:26:18.86ID:bm1dsOff0
seq2seqにattentionつけたら全然損失関数が下がらなくなったんだけどこれって実装方法間違えた?
誰か実装させた時がある人教えてください。
いままで30エポックぐらいで済んだのが1000ぐらい必要になってる
157デフォルトの名無しさん (ワッチョイ 9dda-yOpk [114.182.59.118])
垢版 |
2020/09/08(火) 01:29:09.01ID:bm1dsOff0
長い文章に対する精度はいいけど短い文が来ると同じ単語を連発して無限に繰り返すんだけど、どうなってるんだこれ?
158デフォルトの名無しさん (ササクッテロ Sp81-Rc4v [126.33.213.177])
垢版 |
2020/09/08(火) 02:10:46.39ID:9u9SXy9bp
sklearnって毎度fitしなきゃいけないんですか?
159デフォルトの名無しさん (ワッチョイ 9dda-yOpk [114.182.59.118])
垢版 |
2020/09/08(火) 02:43:53.99ID:bm1dsOff0
concat忘れてただけでしたすいません。
2020/09/08(火) 07:33:01.40ID:M5LonfGoH
kerasでgrad-camやろうとしたんだけどsequentialモデルじゃだめってほんと?
2020/09/08(火) 07:42:20.41ID:XuwxWqdD0
>>157
翻訳?
2020/09/08(火) 09:47:02.46ID:MF9+OIay0
>>154
アホっぽい気がする
2020/09/08(火) 10:21:54.30ID:MF9+OIay0
>>151
笑いが欲しいの、皮肉?
2020/09/08(火) 11:43:54.33ID:LjI6avtoM
>>162
気がするだけで奴らが日本のモノ作りを支えてきたわけで、CSもDSも分野が違うからってバカにしたらいかんと思うのよ
2020/09/08(火) 12:33:31.98ID:MF9+OIay0
>>164
それはハードだろ、DLはソフトだが、論理のすり替え失敗
2020/09/08(火) 12:51:34.46ID:LjI6avtoM
そうかな、制御の話とかソフトじゃないかい?
まー、言いたいことは機械学習が突然出てきたわけじゃ無いから、ブームが去っても機械学習を支える周辺分野も勉強しておけば食えるでしょう。
2020/09/08(火) 13:07:17.40ID:PMotKbJga
社会統計なりwebサイトのアクセス記録なり装置の稼働データなり、各分野の何らかのデータがあって初めてそれを分析したいという動機が生まれるのであって
そういう応用分野の専門を持たない純粋データサイエンティストというのは極めて高度な研究をする場合を除いてほぼ無価値なんだよ
2020/09/08(火) 13:52:56.07ID:+D5vNSTHM
そういう意味ではサイエンティストいうよりもデータエンジニアかな
2020/09/08(火) 16:58:12.79ID:bm1dsOff0
>>161
チャットボット
2020/09/08(火) 16:58:54.60ID:bm1dsOff0
lstmの出力次元数256って少ないのかな
512まで上げたほうがいい?
2020/09/08(火) 16:59:00.12ID:A6dn5A1Y0
科学的手法そのものがdata-drivenだと思うんだけど、data scienceって何なんでしょ?
2020/09/08(火) 16:59:55.88ID:nmMozHDf0
>>171
データだけ見て現実を見ない泥縄なのが味噌
2020/09/08(火) 17:04:01.83ID:LjI6avtoM
広告やマーケの昔は、データ見ずに勘と思惑で企画立ててた人達がデータ使うようになったという理解
2020/09/08(火) 17:14:35.58ID:nmMozHDf0
>>173
それはデータサイエンスっちゅーかビッグデータ()とかいうムーブメント()のほうじゃね?
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況