【統計分析】機械学習・データマイニング29

■ このスレッドは過去ログ倉庫に格納されています
2020/08/20(木) 09:16:43.41ID:Av1Lrhjm0
!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
↑すれたてる毎に1行ずつ減るので、減ってたら3回に増やしてたてること。

機械学習とデータマイニングについて語れ若人

*機械学習に意識・知能は存在しません。
  人の意識に触れたい方はスレ違いです。

■前スレ
【統計分析】機械学習・データマイニング28
https://mevius.5ch.net/test/read.cgi/tech/1588293154/
-EOF-
VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured
2020/09/05(土) 11:36:28.67ID:ebgs5EyIM
>>97
どこでそんなマヌケな情報を手に入れたんだよ
2020/09/05(土) 11:41:53.99ID:lXaWPRh70
>>98
XEON PHIより難易度高そうだけど
THX
2020/09/05(土) 11:42:29.92ID:0NWRwchU0
それはスパコンでは?
2020/09/05(土) 12:01:56.16ID:CjkYIT6R0
>>97
ggたけどそれらしい情報がないが
2020/09/05(土) 12:12:25.16ID:0NWRwchU0
>>102
出てるよ
fp16だと71tflopsだってさ
2020/09/05(土) 12:26:15.00ID:Az39CCC60
nVidiaのTensorCoreはFP32には対応していない
いちおう、TensorflowなんかでもFP16設定にすればTensorCoreも学習に使ってくれるみたいね
もっとも試してみた人のブログとか見てるとやっぱFP16じゃ精度が悲惨なことになるらしい
ttps://qiita.com/kuroyagi/items/e70c55cbc88fc0ed0220
そういう意味じゃやっぱ推論専用という捉え方でいいんじゃないかな
71Tflopsとか夢があるけどなあ
2020/09/05(土) 12:45:27.03ID:Az39CCC60
× nVidiaのTensorCoreはFP32には対応していない
〇 GTX/RTXのTensorCoreはFP32には対応していない

A100とかだとFP32/64も対応してる。学習アクセラレータなんだからそりゃそうだ
グラボに載ってるTensorCoreは対応してなくて推論専用って話ね
2020/09/05(土) 12:47:02.54ID:0NWRwchU0
そうそう
107デフォルトの名無しさん (ワッチョイ 0502-biH0 [118.154.96.7])
垢版 |
2020/09/05(土) 13:09:00.94ID:Az39CCC60
RTX 30シリーズはSSDから直接グラフィックデータを読み込めるらしいが
たぶんDLの学習データ転送にも使えるよね
flopsもメモリ帯域も上がってるしDL用途にも別次元の速さが実感できそうだ
2020/09/05(土) 15:27:22.54ID:71ZWev/Z0
>>103
例えばどれ?
2020/09/05(土) 15:57:37.62ID:Az39CCC60
>>108
103じゃないが、↓によると238Tensor-TFLOPSとなってるな
https://pc.watch.impress.co.jp/docs/news/1274381.html
Tensor-TFLOPSってのがよくわからんがFP16の性能かな?

FP16までしか対応してないソースは↓
https://www.nvidia.com/ja-jp/data-center/tensor-cores/
「サポートされている Tensor コア精度」に書いてある
Turingまでしか記載がないが、AmpereもFP32に対応したなんて発表はないし、
推論専用という位置づけは変わらないので一緒だろう
2020/09/05(土) 16:04:23.39ID:71ZWev/Z0
>>109
ありがとん
2020/09/05(土) 16:33:54.61ID:Az39CCC60
Tensor-TFlopsについて自己レス
Tflopsは普通ベクトル演算性能を指すが、TensorCoreは固定サイズのマトリクス演算なので
こういう書き方をしてるらしい
ピーク性能は238Tflopsなんだろうけど(FP16)、計算粒度が大きいんでよほどタスクが都合のいい
サイズでないと無駄が大きくなってしまう、と。
2020/09/05(土) 16:37:01.69ID:lXaWPRh70
普通に個人が使うならスリッパがベストかのう
2020/09/05(土) 17:09:43.08ID:Az39CCC60
17万円のThreadripper 3960Xで5Tflops
11万円のRTX 3080で30Tflops

DL専用ならやっぱRTXでは
まあCPUの汎用性も捨てがたいけど
昔よりCPUの並列化が進んで差が縮まってるから悩むな
2020/09/05(土) 18:13:07.70ID:Az39CCC60
[RTX3090]
CUDA Core : 35.7Tflops
TensorCore : 285Tflops
RT Core : 69Tflops

これだけポテンシャルがあるのにDLで使えるのはCUDAの35.7Tflopsだけ
なんか虚しくなってくるな
ゲーム用に売れてるおかげで安く買えるわけだから仕方ないと思わんといかんのか
2020/09/05(土) 22:07:46.07ID:lXaWPRh70
THX
3960Xかな
116デフォルトの名無しさん (ワッチョイ 9dda-yOpk [114.182.59.118])
垢版 |
2020/09/05(土) 23:55:05.96ID:ySUioB0H0
seq2seqのembeddingレイヤーに事前学習させたword2vecの重みを用いるとき、デコーダの文章を生成する合図につかう<EOS>の取り扱いはどうすればいいんだ
word2vecにEOSを学習させてベクトル化しなきゃいけないんだけど、学習データの最後の行に適当に付け足しとけばいいのか?
それとも学習データの行末すべてにEOSを付け足せばいいのか
2020/09/06(日) 02:41:40.34ID:6+iElI6k0
word2vecをembeddingレイヤにぶっこんだけど、リソース不足でバッチ数を下げざる負えなくなった
ヒカキンの持ってる1tbメモリmacが憎い
2020/09/06(日) 07:49:06.02ID:28nY3XQR0
>>116
「word2vec 追加 学習」で検索してみるとしあわせに

>>117
あいつそんなものもってるのか!

そうそう
自然言語の機械学習って
なんかしらんが(?)最後の段階あたりでくっそメモリ食う
2020/09/06(日) 08:02:00.79ID:fnIXCpSw0
gpu用意すればいいじゃん
120デフォルトの名無しさん (ラクッペペ MM4b-I/wA [133.106.90.74])
垢版 |
2020/09/06(日) 08:27:37.29ID:M4KtJHw+M
fasttextってゴミなの?
2020/09/06(日) 09:09:53.49ID:fnIXCpSw0
ごみじゃないよ(笑)
122デフォルトの名無しさん (ワッチョイ 23ad-svb1 [125.12.149.140])
垢版 |
2020/09/06(日) 10:20:49.37ID:y7ovSoOJ0
> お前は毎朝起きるたびに俺に負けたことを思い出すよ^^

あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!

クソチョンw

Pythonさえろくにできないバカチョンのくせに
できるとほざくクソチョンw

日本で強姦と窃盗を繰り返す
犯罪者在日のクソチョンw
2020/09/06(日) 12:07:37.08ID:4rkiTQ6J0
自宅でGPU回し続けたら電気代がかかりそうやね…
2020/09/06(日) 12:15:42.57ID:v5JhsKrg0
>>104 AI ではFP16 じゃ使い物にならないから、bfloat16 というフォーマットが出て来た。

bfloat16 形式は、符号ビットが 1 つ、指数ビットが 8 つ、仮数ビットが 7 つ、暗黙の仮数ビットが 1 つの [1:8:7] の形式です。これに対し、標準の 16 ビット浮動小数(fp16)形式は [1:5:10] です。
2020/09/06(日) 12:19:11.43ID:28nY3XQR0
>>119
入力がおおおおおいと何をどうやっても最終段階でメモリくっそ食うのだが
gpuで解決できるのんけ?
だとしたら大発見w

>>123
どこでやっても電気代は誰かが払っている
2020/09/06(日) 12:50:46.70ID:fnIXCpSw0
gpt-3は国内の研究機関だったら訓練不可能かな
設備的に
127デフォルトの名無しさん (ブーイモ MM6b-svb1 [163.49.211.220])
垢版 |
2020/09/06(日) 13:47:45.63ID:V9VDH8fJM
在日朝鮮人は死ね
128デフォルトの名無しさん (ワッチョイ 9dda-yOpk [114.182.59.118])
垢版 |
2020/09/06(日) 15:24:15.87ID:6+iElI6k0
メモリ食いすぎるし、バッチサイズ小さくしたら会話にならなくなったのでword2vecを組み込むことは断念。
ただこのままだと、語彙数が少なすぎるし、だれか名大会話コーパス以外でいい会話コーパス知ってる人いません?
できればURLも欲しいです
2020/09/06(日) 18:05:49.43ID:6+iElI6k0
赤外線撮影って昔流行ってたけど、普通の写真と赤外線写真を学習させれば、写真から下着を透かせるaiが出来上がるのでは?
2020/09/06(日) 18:06:47.64ID:6+iElI6k0
赤外線撮影って昔流行ってたけど、普通の写真と赤外線写真を学習させれば、普通の写真から下着を透かせるaiが出来上がるのでは?
2020/09/06(日) 18:10:42.46ID:YMHA2nFQp
>>117 周辺まで含めて800万円と言うから気狂いだな。
というか羨ましすぎる。
2020/09/06(日) 18:34:56.29ID:YMHA2nFQp
ヒカキンの動画って初めて見たけど人を惹きつけるテクニックを持ってるね。
2020/09/06(日) 18:59:56.26ID:Bdj7AItn0
>>130
大事なこと…なのか?
2020/09/06(日) 19:09:27.59ID:TeCejoUU0
赤外線に何を求めるかだろうなぁ

マンモグラフィの写真は嫌という程見たが
ちっとも興奮しない。まぁX線写真に欲情
するのは立派な変態だと思うが

昔 hirax でやっていたMR/AR技術を
使った巨乳Vision(生乳テクスチャをマッピング)
は是非実用化してもらいたいものである
2020/09/06(日) 19:22:15.71ID:uumzb8Gwa
>>130
普通の写真に写るものに下着の色・形・柄と相関のある情報がないから単に学習データで過学習されるだけ
136デフォルトの名無しさん (アウアウウー Sa69-Bf8w [106.154.139.224])
垢版 |
2020/09/07(月) 00:50:36.34ID:y2mIvMwCa
>>130
赤外線「風」写真は作れるだろう
本当に着ている下着とは全く関係なく
137デフォルトの名無しさん (ワッチョイ 9dda-yOpk [114.182.59.118])
垢版 |
2020/09/07(月) 01:08:15.13ID:B4Oclp/r0
>>136
これをなんちゃら坂46だのの写真に使えば売れそうじゃないか?
youtubeでPhotoshop使ってアイドルの下着すかしてるのがまあまあ再生稼いでたし、ヒカキンつぶせそうじゃね
2020/09/07(月) 07:27:48.84ID:X4wk0IcB0
アイコラ自動生成みたいなもんか
2020/09/07(月) 16:38:41.61ID:DIQIv4n60
悲報、ついにAIバブル崩壊

【技術】AIが衰退期に 機械学習エンジニアが職を失う [雷★]
https://asahi.5ch.net/test/read.cgi/newsplus/1599463955/
2020/09/07(月) 18:58:36.59ID:B4Oclp/r0
今からai研究してる大学を受験しようってのにどうすればいいんだよ
141デフォルトの名無しさん (アウアウウー Sa69-Bf8w [106.154.137.86])
垢版 |
2020/09/07(月) 19:01:34.03ID:kGNS9k6ua
露頭に迷うのは「自分を機械学習エンジニアだと思い込んでいる単純作業者」だろう
2020/09/07(月) 19:01:56.04ID:urAYf+snM
別にちゃんと勉強すればいいよ
学んだ統計もプログラミングも潰し効くでしょ
2020/09/07(月) 19:03:38.18ID:urAYf+snM
数学や物理の人気が落ちてるならそっち行くのもいいぞ
CSより普遍的だからね
2020/09/07(月) 19:17:50.66ID:AOlpWZnE0
物理学科の人ってどこに就職するの?
2020/09/07(月) 19:25:36.16ID:onbFH33j0
公務員じゃろ
2020/09/07(月) 19:27:01.46ID:AOlpWZnE0
夢がないね
2020/09/07(月) 19:49:35.03ID:urAYf+snM
コンサルかな。この世の全てをコンサル出来る。
あ、女心は無理だな
2020/09/07(月) 19:55:24.18ID:1xvy5dX80
物理はメーカーの研究とか行ってたよ
半導体とか電波とか
2020/09/07(月) 20:25:46.67ID:DIQIv4n60
高校の教員
2020/09/07(月) 21:11:47.74ID:onbFH33j0
>>147
コンサルみたいなチャラいものに思考が行く時点で物理学科にうからんか、
うかっても卒業できんと思われ。
2020/09/07(月) 22:28:07.52ID:98DMqs9Ga
>>139
https://asahi.5ch.net/test/read.cgi/newsplus/1599463955/49
2020/09/07(月) 22:49:45.76ID:VeYCBawpM
>>150
ワイの頃は研究所目指して玉砕してSIerに行ってしまうのが多かったな
ロスジェネだもの
2020/09/07(月) 23:21:05.78ID:OpQZP/1E0
データーサイエンス科とか作っちゃった大学はどうすんだろうね
そこで習いそうなことは数学科や物理科が上位互換してるし
2020/09/07(月) 23:29:43.76ID:VeYCBawpM
電気工学も元祖データサイエンスぽい気がするな
電気工学科もいいと思うぞ
2020/09/08(火) 00:26:34.96ID:A6dn5A1Y0
XGBoostにデータ入れて一丁あがりだもんね
156デフォルトの名無しさん (ワッチョイ 9dda-yOpk [114.182.59.118])
垢版 |
2020/09/08(火) 01:26:18.86ID:bm1dsOff0
seq2seqにattentionつけたら全然損失関数が下がらなくなったんだけどこれって実装方法間違えた?
誰か実装させた時がある人教えてください。
いままで30エポックぐらいで済んだのが1000ぐらい必要になってる
157デフォルトの名無しさん (ワッチョイ 9dda-yOpk [114.182.59.118])
垢版 |
2020/09/08(火) 01:29:09.01ID:bm1dsOff0
長い文章に対する精度はいいけど短い文が来ると同じ単語を連発して無限に繰り返すんだけど、どうなってるんだこれ?
158デフォルトの名無しさん (ササクッテロ Sp81-Rc4v [126.33.213.177])
垢版 |
2020/09/08(火) 02:10:46.39ID:9u9SXy9bp
sklearnって毎度fitしなきゃいけないんですか?
159デフォルトの名無しさん (ワッチョイ 9dda-yOpk [114.182.59.118])
垢版 |
2020/09/08(火) 02:43:53.99ID:bm1dsOff0
concat忘れてただけでしたすいません。
2020/09/08(火) 07:33:01.40ID:M5LonfGoH
kerasでgrad-camやろうとしたんだけどsequentialモデルじゃだめってほんと?
2020/09/08(火) 07:42:20.41ID:XuwxWqdD0
>>157
翻訳?
2020/09/08(火) 09:47:02.46ID:MF9+OIay0
>>154
アホっぽい気がする
2020/09/08(火) 10:21:54.30ID:MF9+OIay0
>>151
笑いが欲しいの、皮肉?
2020/09/08(火) 11:43:54.33ID:LjI6avtoM
>>162
気がするだけで奴らが日本のモノ作りを支えてきたわけで、CSもDSも分野が違うからってバカにしたらいかんと思うのよ
2020/09/08(火) 12:33:31.98ID:MF9+OIay0
>>164
それはハードだろ、DLはソフトだが、論理のすり替え失敗
2020/09/08(火) 12:51:34.46ID:LjI6avtoM
そうかな、制御の話とかソフトじゃないかい?
まー、言いたいことは機械学習が突然出てきたわけじゃ無いから、ブームが去っても機械学習を支える周辺分野も勉強しておけば食えるでしょう。
2020/09/08(火) 13:07:17.40ID:PMotKbJga
社会統計なりwebサイトのアクセス記録なり装置の稼働データなり、各分野の何らかのデータがあって初めてそれを分析したいという動機が生まれるのであって
そういう応用分野の専門を持たない純粋データサイエンティストというのは極めて高度な研究をする場合を除いてほぼ無価値なんだよ
2020/09/08(火) 13:52:56.07ID:+D5vNSTHM
そういう意味ではサイエンティストいうよりもデータエンジニアかな
2020/09/08(火) 16:58:12.79ID:bm1dsOff0
>>161
チャットボット
2020/09/08(火) 16:58:54.60ID:bm1dsOff0
lstmの出力次元数256って少ないのかな
512まで上げたほうがいい?
2020/09/08(火) 16:59:00.12ID:A6dn5A1Y0
科学的手法そのものがdata-drivenだと思うんだけど、data scienceって何なんでしょ?
2020/09/08(火) 16:59:55.88ID:nmMozHDf0
>>171
データだけ見て現実を見ない泥縄なのが味噌
2020/09/08(火) 17:04:01.83ID:LjI6avtoM
広告やマーケの昔は、データ見ずに勘と思惑で企画立ててた人達がデータ使うようになったという理解
2020/09/08(火) 17:14:35.58ID:nmMozHDf0
>>173
それはデータサイエンスっちゅーかビッグデータ()とかいうムーブメント()のほうじゃね?
2020/09/08(火) 17:48:16.29ID:LjI6avtoM
>>174
ビックデータの延長にデータサイエンスが来てるんじゃね
リクルートとかとか
176デフォルトの名無しさん (ワッチョイ 2355-XrX+ [59.147.205.222])
垢版 |
2020/09/08(火) 18:14:39.87ID:TtOfyEm40
×ビックデータ
○ビッグデータ

×ザ・ビック
○ザ・ビッグ

?ビッグカメラ
○ビックカメラ
2020/09/08(火) 20:27:56.44ID:rebF/AgE0
県内屈指の秀才とかならまだしも
そんな無理して大学に行かなくてもいいだろう
経済も技術も日本は行き詰まる
高卒で料理人とか美容師とか土木とかそっちに行けばいいんだよ
複雑な動作に知識、推論、創造力が必要で
尚且つ速度が問われるような仕事に関してはAI+ロボットで対応しにくいだろう
今の若い奴は親元で金貯めて家を建て直したり、家を買ったり、安い土地でも買って暇な時に野菜でも作ってた方がいいだろ
仕送り+学費なんかに投資するゆとりがあるのか?
日本がトップに君臨していた
おっさん、爺さん達の時代じゃないんだし
2020/09/08(火) 22:21:11.56ID:ZehSSBBxH
>>177
黒船来襲して外国人に使われる日本人の絵が見える
2020/09/09(水) 00:53:42.90ID:O6YYMv+fa
>>163
https://asahi.5ch.net/test/read.cgi/newsplus/1599463955/55
180デフォルトの名無しさん (ワイーワ2 FF63-e6VR [103.5.140.168])
垢版 |
2020/09/09(水) 11:18:31.18ID:9MEEjZyTF
>>178
意外と日本人に使われるより外国人に使われる方が幸せかも知れないよ?
2020/09/09(水) 11:22:36.71ID:AAgI2VwYM
中国に占領されたら困るよお
子供埋めなくされて徐々に漢民族に置き換えられる未来
2020/09/09(水) 15:51:11.14ID:xKAj3HUS0
>>179
自分の言葉で語れない馬鹿かw
183デフォルトの名無しさん (ワッチョイ c1da-psz/ [114.182.59.118])
垢版 |
2020/09/09(水) 18:16:53.13ID:2Gc2qv3L0
tensorflowをインポートしたりするときになんか英語がめっちゃ表示されるけど、どうすれば表示しないようにできるんだ
2020/09/09(水) 18:52:02.52ID:2e3wUOdx0
うましかには無理
2020/09/09(水) 22:55:10.39ID:VEmnK6Spa
>>182
俺のレスなんだが。
2020/09/10(木) 01:18:05.46ID:DdQy3pPE0
機械学習に限らず、大多数のプログラマは提供されたソフトウェアを組み合わせてるだけじゃない?
OS、コンパイラ、RDB、webフレームワークとか。
高給取りではないけど普通に食べていけるかと。
2020/09/10(木) 01:30:40.02ID:IENeFRwH0
>>186
それらを開発している人達もいるしスイッチとかストレージとか基地局とかの制御ソフトを作っている人達もいる
2020/09/10(木) 01:36:22.45ID:IENeFRwH0
医者に例えると研究する人と臨床医みたいな感じかもしれない
新しい治療方法を開発する人と
それらを選択して使って実際に患者の治療をする人
2020/09/10(木) 07:20:44.31ID:Iuk9Y12Ra
https://asahi.5ch.net/test/read.cgi/newsplus/1599463955/65,67,78
2020/09/10(木) 14:31:26.47ID:DdQy3pPE0
よく見るやりとり

発表者「ディープラーニングを使って売上〇〇円達成しました!」
質問者「ルールベースのような単純な手法を使うと売上はどれくらいなの?」
発表者「わかりません…」

おわり
2020/09/10(木) 14:35:01.64ID:zhGyZOUIM
どこで見られるの?そのやり取り
2020/09/10(木) 15:21:53.97ID:mwQ926Mt0
>>190の脳内
2020/09/11(金) 00:35:00.43ID:p6Qx+Sqoa
>>192
http://asahi.5ch.net/test/read.cgi/newsplus/1599697393/
2020/09/11(金) 14:04:42.35ID:c4qh56HO0
その種の失敗談は普通は表に出てこないからな。
表に出してる企業があったら結構信頼できる企業と思っていい。
2020/09/11(金) 14:15:08.24ID:eKsL/19+0
>>190
そら、やってみないとわからんじゃろ>単純ルールベースだとどうなるか
「(これまで、担当者のカンと経験でしか)やってみたことないからわからない」は正直じゃろ
2020/09/11(金) 17:03:14.59ID:vrzz2PIYa
>>195
DL有りきが問題って事だと思う
ルールベースの方が良い結果を得られるならそっちを採用するし
比較しないでDLを選択しているのはDL有りきって事
2020/09/11(金) 17:29:26.31ID:6LRfvasd0
>>193
https://egg.5ch.net/test/read.cgi/river/1595679271/
2020/09/11(金) 17:45:46.39ID:eKsL/19+0
>>196
まあそうなんだが
ちゃんと比較検証しようとおもったらマンドクサがる・とりまはやりにのってみよう
でやっちまうのが
世の中のおおぜいらしいぞ
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況