【統計分析】機械学習・データマイニング30

■ このスレッドは過去ログ倉庫に格納されています
2021/01/01(金) 09:10:55.46ID:a+OQlEaa0
!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
↑すれたてる毎に1つずつ減るので、減ってたら3回に増やしてたてること。

機械学習とデータマイニングについて語れ若人

*機械学習に意識・知能は存在しません。
  人の意識に触れたい方はスレ違いです。

■前スレ
【統計分析】機械学習・データマイニング29
https://mevius.5ch.net/test/read.cgi/tech/1597882603/
-EOF-
VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured
2021/07/11(日) 16:21:15.31ID:lbKLD5N+F
日本のアカデミアは逆に数理的な論理だけで実際のアルゴリズムとあまりに乖離した理論だけのものが多いわ。
PFNの Spectral Normalization はそういう意味じゃ相当例外的な結果だと思う。
2021/07/11(日) 17:12:41.04ID:vkK4ARJEd
今さらかもしれんが、BERTの事前訓練てみんな何GBくらいの日本語データでやってるの?
2021/07/11(日) 18:11:26.19ID:VPF0Yi9q0
>>767
統計数理なんとかや情報学なんとかは理論が多いイメージ
2021/07/11(日) 18:17:17.14ID:SI3qf1fFH
fbはやってみた系が多い印象
2021/07/14(水) 11:30:20.54ID:Qje4eblG0
fbのnlpは提案系が多い
2021/07/16(金) 19:08:30.21ID:fn0ZIWtp0
>>766
なんで
2021/07/19(月) 11:33:23.50ID:kR6nsJZd0
scikit-learnをproductionレベルで使う人はいるの?
774デフォルトの名無しさん (ワッチョイ ab10-KFGP [153.243.43.6])
垢版 |
2021/07/19(月) 14:18:58.09ID:hZcLaJMP0
>>773
むしろ何故使わないと思ったのか
2021/07/19(月) 14:31:07.73ID:kR6nsJZd0
>>774
学習用かなと思ったの
776デフォルトの名無しさん (ワッチョイ ab10-KFGP [153.243.43.6])
垢版 |
2021/07/19(月) 14:48:30.86ID:hZcLaJMP0
>>775
そんなことないんだよ
でもまぁ、名前がね
2021/07/19(月) 17:46:13.87ID:qeRTyGb80
machine learningの "learn" じゃないの?
ロジスティック回帰みたいな簡単なモデルで済ませるときは便利よね
778デフォルトの名無しさん (ワッチョイ ab10-KFGP [153.243.43.6])
垢版 |
2021/07/19(月) 18:06:16.98ID:hZcLaJMP0
Pipelineなんかもscikit-learnが標準となっているし
実務では利用するんだけど
最近は代替品で便利なものがいろいろあるので、使い所さんが減ってるね
2021/07/19(月) 18:59:04.55ID:kR6nsJZd0
>>776
thx
2021/07/20(火) 01:56:58.80ID:0qs55fcM0
最近は個別のライブラリを使うことが増えた気がするな
汎用的でなんでもできるライブラリはどうしても使いにくくなりがち
2021/07/29(木) 09:29:37.96ID:buw+HjWzM
g検定の教科書って無料のやつ無いの?

テキストなんだからそれくらい無料で公開してくれていいじゃん
2021/07/29(木) 12:49:34.05ID:SQNMznWca
検定ビジネスとはそういうもの
2021/07/29(木) 13:04:31.41ID:buw+HjWzM
(*´·ω·)(·ω·`*)ネー
784デフォルトの名無しさん (スッップ Sd22-IBNK [49.98.162.153])
垢版 |
2021/07/29(木) 17:28:33.69ID:Acg6zJkFd
あの検定って何か役立つの?
2021/07/29(木) 19:38:11.84ID:buw+HjWzM
基礎知識はあるんだねー、くらい
2021/07/29(木) 20:26:37.52ID:mwMdCY8S0
巣ごもり需要w
2021/07/30(金) 08:51:20.27ID:2Y+/gCJv0
チューリングテストの反論としての中国語の部屋って難癖だよな

知的なタスクに心や意識は必須じゃないだろ
ずれてんだよ

ジョンサール調べたらセクハラ爺でバークリー追放されてて草
2021/07/30(金) 14:34:47.12ID:kqIr/KL00
>>787
私に心があるかどうかを(他人ではなく)私自身が知る方法はありますか?
2021/07/30(金) 15:03:23.67ID:IRxxscHTa
心を定義して、その定義に当てはまったらあるとわかる
2021/07/30(金) 16:57:51.45ID:x18JmFZD0
>>788
我思う、故に我あり
それが当時の哲学
2021/07/30(金) 17:22:40.69ID:DDie3fXt0
>>788
お前に心はない
2021/07/30(金) 17:25:07.20
>>788
こいつC++スレとか鍵盤楽器板荒らしてる固定ハンドルだよ
あえてコテ外して書き込んだりしてる悪質な荒らし
しかもここに来てRoninで書き込んでるの確定か

スルー推奨
793デフォルトの名無しさん (ワッチョイ 7f10-X9IN [153.243.43.6])
垢版 |
2021/07/30(金) 17:29:32.45ID:4wTn620G0
うちのAIによると
心というのは
観測できた事象から導出した関数では計算できない特異点であるとのことです
2021/07/30(金) 17:57:10.45ID:2Y+/gCJv0
心の存在は証明できないからね
2021/07/30(金) 17:57:28.12ID:kqIr/KL00
>>792
なぜローニンにで書き込んだら駄目なんですか?
あと荒らしではなく話題提供といってほしいですね‥‥

>>791
最近そんな気がしてきました‥‥
2021/07/30(金) 23:33:54.49ID:YChIKAsMM
ai人材が足らないってウソだと思う

逼迫してるなら無料でテキスト公開したり講義をyoutubeで流したりすりゃ独学できるし資格が欲しい人だけ試験を有料で受ければいい

この資格を持った人材が欲しいわけでもないんだろうな
人材が多く欲しいんなら独学しやすい環境を整えればいいのにそうしてないし

結局資格ビジネスか
2021/07/30(金) 23:36:01.49ID:e1ZnWCW50
新キャラ登場しててワロタ
2021/07/31(土) 01:14:14.07ID:RH+1LJfN0
>>796
「〇〇講座で勉強して月〇〇万円稼ぐことが出来ました」って言う
CMも結局そのCMのview数で稼いでるんだろ?確か
そうやって稼ぐことを勧められるとかで
2021/07/31(土) 01:38:02.68ID:RH+1LJfN0
AIブームが来た時
機械学習の勉強するのにそれなりの値段のGPUを買っただろ?
そこで機械学習の勉強をしたのがそもそもの間違いで
すぐ諦めてマイニングをしないといけなかったんだな
そこが吸われる人と吸われない人の差で
真面目な人は結局吸われる道に行ってしまうんだな
2021/07/31(土) 02:57:25.03ID:harX6WqtM
流行ると思う?https://gigazine.net/amp/20210730-triton
2021/07/31(土) 08:45:00.18ID:2YYaq23L0
>>800
ドキュメントが増えて、コミュニティが成熟したら(というかこれで実装されたNNフレームワークで書かれたモデルが増えてきたら)流行るだろうね。それを使わざるを得なくなるし
今のPythonでは限界はきてるし、CUDAで書くのも難しいから、なにかブレークスルーは欲しかった
2021/07/31(土) 10:13:29.77ID:JAp7kdn00
>>800
tritonの下側でcudaが動いてんの?

流行んないんじゃない?
803デフォルトの名無しさん (ワッチョイ 075f-QWHR [106.73.78.34])
垢版 |
2021/07/31(土) 13:26:01.70ID:7sKxPxG80
Pytorchでモデルを実装してCUDAは利用するけど、
CUDAの動作について特別なことはしたことない
既存のフレームワークを使ってない人用?
2021/07/31(土) 13:56:54.00ID:JAp7kdn00
無料で使えるPythonドキュメントオープンプロジェクトが10月より公開
https://news.yahoo.co.jp/articles/24ec3d856956027b50dec14eef4c22213a1e7b01

これはいい試み
でもai関連の肝心の松尾豊周りは金の亡者か
805デフォルトの名無しさん (ワッチョイ 075f-t7lQ [106.185.144.184])
垢版 |
2021/07/31(土) 16:44:31.30ID:LRA0vGhm0
NHKがからむとろくなことにならない
2021/07/31(土) 17:01:39.24ID:pKR1/4470
>>804
pythonの開発団体に寄付もしないのに金儲けばっか
2021/07/31(土) 17:37:09.17ID:fJIX/2MW0
>>799
勉強にGPUは必須じゃなかったので、そこから間違ってる
もっとも、マイニングしなくとも転売すれば8割方戻ってくるけど
2021/07/31(土) 21:04:02.33ID:FpbTKfM30
aiの人材は足りないと思うよ
ただちょっと勉強をした人とが欲しいんじゃなくて
問題の構造を考えて、チューニングまできちっとできる人が欲しい
そんだけ能力がある人はそうそういない
資格で保障される能力よりもはるか先の能力が要求される
809デフォルトの名無しさん (ワッチョイ 7f10-JKPI [153.131.102.129])
垢版 |
2021/07/31(土) 21:52:11.51ID:L9W+TEZq0
そんな能力を持っている人かどうかを誰がどうやって判断できるのか
どうやったらその能力を得られるのか
能力を持つ人がAI関係で仕事するより他の仕事の方に魅力を感じるかもしれないし
810デフォルトの名無しさん (ワッチョイ 075f-QWHR [106.73.78.34])
垢版 |
2021/08/01(日) 00:02:55.11ID:Gp5rJK860
だいぶ敷居が下がったから論文のモデルを実装して実データに適用する程度ならAI専門家じゃなくてもできるしね。
自分の部署だと普段物理シミュレーションメインにやってるような人らが、実験データやシミュレーションデータに対して機械学習適用して解析したりしてるわ。
2021/08/01(日) 12:53:10.29ID:ekL5DYUO0
>>809
判断できる人が面接をしないとそのプロジェクトはうまくいかないことは明白
812デフォルトの名無しさん (ワッチョイ 7f10-JKPI [153.131.102.129])
垢版 |
2021/08/01(日) 13:09:16.08ID:7IgnAuQw0
>>811
で、どうやったら適切に判断できるのかは判らないと
上手く行ったプロジェクトと失敗プロジェクトでどんな人がいたらどうなるのかをAIで分析したら良いんじゃね?
それもできない人がこんな人材が良いとか言っても説得力はない
2021/08/01(日) 21:43:51.48ID:dQpg7mz50
先行事例でうまくいったパターンをなぞるのであれば
成功する確率も高いけど(それでもノウハウとか制約とかいろいろある)
未知の分野で試すのはそもそも挑戦的だからなあ
2021/08/01(日) 22:09:27.90ID:LCRIsaK60
前例主義、失敗しない方法を追求する旧来の日本的思考だとうまくいかないだろうね
2021/08/02(月) 00:36:33.98ID:bh8r62Gt0
>>796
「〜人材が足りない」ていうのは日本では「(安く使える)〜人材が足りない」て意味だぞ
2021/08/02(月) 00:53:17.93ID:rjrf8ee/0
GAFA3社が採用内定の理系日本人へ「年収6000万円」のオファー、「AI人材の争奪戦」 | AVILEN AI Trend

新卒で年収3000万円も!激化する高度人材争奪戦 | 就活最前線 | ダイヤモンド・オンライン

富士通「年収3500万円」の衝撃 ソニー、NECも戦々恐々の「グローバル採用競争」  - ITmedia ビジネスオンライン
2021/08/02(月) 01:59:57.33ID:3glCL8ZB0
「新卒でも年収1000万円可!」とか言われても、
既存社員の年収データ見せてもらわないと信用できないよね
2021/08/02(月) 07:10:17.43ID:msdUmDej0
新卒でも年収1000万円可=できるやつには金をやる。できないやつはクビ。
2021/08/02(月) 07:13:09.28ID:TbpUnEHVa
できない奴がクビになるのは極めて健全な組織だと思う
2021/08/02(月) 08:04:32.49ID:8E4hF4AB0
できる人に多く払うのは健全
と同時にそれほどでもない人にもほどほど払い
できない人に会社のできる範囲で最低額払うのも健全だと思う
だから大企業こそできない人を多く雇うべきかと
2021/08/02(月) 12:19:31.45ID:Zes70fJva
大企業も近頃(っていうかバブル崩壊以降)経営が苦しいので
余計な人は切りたいのですよ
2021/08/02(月) 12:44:33.86ID:hopXEvEra
それほどでもない人は派遣で事足りるのでわざわざ直接雇用する必要性がない
2021/08/02(月) 18:59:16.39ID:8E4hF4AB0
ミニバッチのサイズはどう決めたらいいの?
824デフォルトの名無しさん (スッップ Sdff-QWHR [49.98.162.153])
垢版 |
2021/08/02(月) 19:07:16.40ID:zmsv2joPd
メモリが耐えうるまで
2021/08/03(火) 01:06:18.62ID:oOwKRL/U0
>>822
そういえば今
大卒、院卒で都心1人暮らしで派遣やってる人っているの?
吸われまくりじゃないか
ホリエモンやらひろゆきやらが固定費高いところに住んでいる奴は馬鹿だとか
田舎に行った方が給料安くてもゆとりが出来る
どうせ家に帰ってもやるのはゲーム、映画、youtubeでしょ
とか言いまくってるけど
2021/08/03(火) 13:09:41.89ID:aIk7WbzI0
optimizerって色々あるけど
時間か許せるならsgdで十分?
827デフォルトの名無しさん (ワッチョイ 7f10-X9IN [153.243.43.6])
垢版 |
2021/08/03(火) 14:00:05.16ID:6vJGvI2N0
>>826
はい
2021/08/03(火) 14:13:31.63ID:tooGDD4E0
>>826
今ほぼ使われてないです
2021/08/03(火) 16:53:25.25ID:aIk7WbzI0
>>827
>>828
えっ、どっち?
830デフォルトの名無しさん (ワッチョイ 7f10-X9IN [153.243.43.6])
垢版 |
2021/08/03(火) 17:09:33.69ID:6vJGvI2N0
>>829
別に矛盾はせんやろ
2021/08/03(火) 17:20:30.37ID:rD80CIFeH
https://arxiv.org/pdf/2105.04339.pdf

sentence-roberta-largeの結果を出してなくて草
たぶん差がでなかったんだろうな
2021/08/04(水) 00:32:37.20ID:GsUzM+NY0
脳死adamが強すぎてsgdは勉強しているときにお世話になった程度だな
ちなみにadamの計算まったくわからん!
833デフォルトの名無しさん (ワッチョイ df3b-By/s [163.221.128.67])
垢版 |
2021/08/04(水) 10:21:46.29ID:iQcHbH250
動画像の過去の数フレームを使って将来のフレームを予測するみたいな研究でうまくいってるやつってないのかね
2021/08/04(水) 11:32:00.70ID:djLthEM60
adamでうまくいったとか過学習ぽくて実際に使うのは不安残るわ
2021/08/04(水) 12:16:33.20ID:CTWLjTDBM
>>833
うまく行ってるの基準が分からんが、研究はあるでしょ

>>834
adamは収束速くなるだけじゃないの?
2021/08/04(水) 13:37:42.82ID:djLthEM60
>>835
そんな単純ではない。deepの汎化性能がどこから来るかはいまだに謎。
learning rateだけでも何がいいか結論出てないが変に速い収束が問題視されてるのは事実。
2021/08/05(木) 00:36:56.29ID:6USKtEeL0
>>836
多様体の変な極小点にハマりやすいかもしれない、ってことかな?
ユークリッド空間に埋め込んだときに何百万次元にもなってしまう多様体の形を求めるってのは普通に簡単じゃない感じするもんなあ。
2021/08/05(木) 04:05:50.17ID:4Jcsl2iC0
>>833
深層強化学習がまさにそれでしょ
ゲームの自動攻略とか
2021/08/05(木) 12:04:21.61ID:Lxx97Kw00
多様体上のアルゴリズムってあるの?
2021/08/05(木) 12:10:08.37ID:XONwOmCI0
>>837
それってディープラーニングというより最適化問題?
2021/08/05(木) 12:40:57.09ID:YkYCYNc40
>>837
それもあるし、
そもそもトレーニングデータにおける最適解が汎化性能が高いかどうかもわかってない。
2021/08/05(木) 13:18:44.73ID:pKPfjq5zM
>>840
ディープラーニングは最適化問題とかぶる部分かなりあるでしょ
2021/08/05(木) 13:20:43.08ID:pKPfjq5zM
>>839
質問が漠然としすぎていて、何をもってあるといえるのかわからないが、
スイスロールデータセットの次元圧縮がうまくできるように工夫しているアルゴリズムは多様体らしいアルゴリズムじゃないかね?
2021/08/05(木) 15:14:43.80ID:Lxx97Kw00
>>843
この質問は多様体上で解いてる前提でしょ、だから聞いてみた
>多様体の変な極小点にハマりやすいかもしれない、ってことかな?
2021/08/05(木) 15:16:19.67ID:Lxx97Kw00
>>843
曲面の上の話に過ぎないと思うが
846デフォルトの名無しさん (オッペケ Sr5b-i/eU [126.166.243.251])
垢版 |
2021/08/05(木) 15:32:28.42ID:1Daamf/ur
>>839
次元圧縮は多様体仮説の上で成り立っている
2021/08/05(木) 16:38:46.82ID:Lxx97Kw00
>>846
なるほど
2021/08/05(木) 16:44:30.35ID:Lxx97Kw00
多様体学習という用語があるんだ
2021/08/05(木) 16:54:01.39ID:XONwOmCI0
スイスロールすき
2021/08/06(金) 00:20:19.84ID:c29VWanS0
>>845
曲面は多様体じゃないって意味の発言?
2021/08/06(金) 00:23:09.93ID:c29VWanS0
>>844
多様体の形を推定することも、多様体の形を決めるパラメータ群を多様体としてとらえれば多様体上の最適化問題になると言う意味ね
2021/08/06(金) 00:55:06.00ID:juvnr80E0
多様体言いたいだけ
853デフォルトの名無しさん (ワッチョイ abad-64Ij [42.146.70.31])
垢版 |
2021/08/06(金) 09:08:23.67ID:3JKbI2Z00
それでも精度に有意差がつかない機械学習コンペティションに躍起になる香具師よりまし
2021/08/06(金) 10:31:56.33ID:eF3TWJ3i0
曲面しか扱っていないのに多様体といったら話盛ってるだろうw
2021/08/06(金) 13:22:10.03ID:/Dyrl6Iq0
君たち「多様体の基礎」ぐらい読んでから喋ってる?
俺は教科書指定されたけど挫折した
856デフォルトの名無しさん (ワッチョイ 6b5f-aD9w [106.73.78.34])
垢版 |
2021/08/06(金) 13:27:08.97ID:FN7kYlvy0
あーあのラノベ?
昔のラノベってレベル高いね
2021/08/06(金) 13:35:17.72ID:W4CwI8Ep0
「多様体の基礎」でわからなきゃもう無理だろ。
でも実際はテンソルの変換の計算するだけだから多様体を考える必要はほとんどないけど。
2021/08/06(金) 14:25:37.37ID:7P/+UMXla
二次元で理解して
それが高次元になっているのね
という理解で十分
859デフォルトの名無しさん (ワッチョイ abad-64Ij [42.146.70.31])
垢版 |
2021/08/06(金) 16:58:50.71ID:3JKbI2Z00
>>858
その理解だと関係式になってない関数は多様体で取り扱えなくなってしまうのでは?
関係式の例として単位円の方程式、x^2+y^2=1はxが定まればyも即座に定まるからその理解でもいいけど、
関係式ではない正規分布の母数のように平均が定まっても標準偏差は即座に定まらないから、統計多様体で矛盾が生じてしまう
やっぱりちゃんと多様体を理解した方がいいと思うよ
ただし、自民党政権下ではどんなに数学頑張っても無駄だと思う
法人税の特別減税措置を大量に作って大手ばかり優遇し、富の再分配と真逆の行いをしてビジネスの世界から本質が消えてしまった
内部留保ばかり増えて労働者の平均賃金も長年上がってない
労働者は共に現政権にNOを突きつけ、IT業界に蔓延する「今だけ、金だけ、自分だけ」の考え方を変え、本質を取り戻そう!
数学の勉強はその後、皆んなで一緒にすればいい
2021/08/06(金) 17:04:16.10ID:El/YE1LI0
どっかいい政党あったら教えてくれ
861デフォルトの名無しさん (ワッチョイ 4610-DdKv [153.131.102.129])
垢版 |
2021/08/06(金) 17:16:47.29ID:JGIT2rTS0
2次元多様体は3次元で見ると曲面になるから
n次元多様体はn+1次元でみたら曲面になるんじゃね?
その曲面上で損失が最小になる点を見つけるのが学習だと思うけどな
2021/08/06(金) 17:48:36.83
非線形学習の基礎概念じゃん
何を長々やってんの
2021/08/06(金) 17:56:15.73ID:c29VWanS0
>>855
流石に読んでるぞ
てか読まなきゃ多様体が何だかわかんないじゃん
864デフォルトの名無しさん (ワッチョイ 6b5f-aD9w [106.73.78.34])
垢版 |
2021/08/06(金) 18:22:31.29ID:FN7kYlvy0
最近多様体のお勉強でもして、お話ししたくなったのかな?
2021/08/06(金) 18:57:54.44ID:3CuQyvuTM
多様体言いたいだけ
2021/08/06(金) 19:00:20.98ID:eF3TWJ3i0
多様体
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況