【統計分析】機械学習・データマイニング30

レス数が900を超えています。1000を超えると表示できなくなるよ。
2021/01/01(金) 09:10:55.46ID:a+OQlEaa0
!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
↑すれたてる毎に1つずつ減るので、減ってたら3回に増やしてたてること。

機械学習とデータマイニングについて語れ若人

*機械学習に意識・知能は存在しません。
  人の意識に触れたい方はスレ違いです。

■前スレ
【統計分析】機械学習・データマイニング29
https://mevius.5ch.net/test/read.cgi/tech/1597882603/
-EOF-
VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured
2021/08/01(日) 12:53:10.29ID:ekL5DYUO0
>>809
判断できる人が面接をしないとそのプロジェクトはうまくいかないことは明白
812デフォルトの名無しさん (ワッチョイ 7f10-JKPI [153.131.102.129])
垢版 |
2021/08/01(日) 13:09:16.08ID:7IgnAuQw0
>>811
で、どうやったら適切に判断できるのかは判らないと
上手く行ったプロジェクトと失敗プロジェクトでどんな人がいたらどうなるのかをAIで分析したら良いんじゃね?
それもできない人がこんな人材が良いとか言っても説得力はない
2021/08/01(日) 21:43:51.48ID:dQpg7mz50
先行事例でうまくいったパターンをなぞるのであれば
成功する確率も高いけど(それでもノウハウとか制約とかいろいろある)
未知の分野で試すのはそもそも挑戦的だからなあ
2021/08/01(日) 22:09:27.90ID:LCRIsaK60
前例主義、失敗しない方法を追求する旧来の日本的思考だとうまくいかないだろうね
2021/08/02(月) 00:36:33.98ID:bh8r62Gt0
>>796
「〜人材が足りない」ていうのは日本では「(安く使える)〜人材が足りない」て意味だぞ
2021/08/02(月) 00:53:17.93ID:rjrf8ee/0
GAFA3社が採用内定の理系日本人へ「年収6000万円」のオファー、「AI人材の争奪戦」 | AVILEN AI Trend

新卒で年収3000万円も!激化する高度人材争奪戦 | 就活最前線 | ダイヤモンド・オンライン

富士通「年収3500万円」の衝撃 ソニー、NECも戦々恐々の「グローバル採用競争」  - ITmedia ビジネスオンライン
2021/08/02(月) 01:59:57.33ID:3glCL8ZB0
「新卒でも年収1000万円可!」とか言われても、
既存社員の年収データ見せてもらわないと信用できないよね
2021/08/02(月) 07:10:17.43ID:msdUmDej0
新卒でも年収1000万円可=できるやつには金をやる。できないやつはクビ。
2021/08/02(月) 07:13:09.28ID:TbpUnEHVa
できない奴がクビになるのは極めて健全な組織だと思う
2021/08/02(月) 08:04:32.49ID:8E4hF4AB0
できる人に多く払うのは健全
と同時にそれほどでもない人にもほどほど払い
できない人に会社のできる範囲で最低額払うのも健全だと思う
だから大企業こそできない人を多く雇うべきかと
2021/08/02(月) 12:19:31.45ID:Zes70fJva
大企業も近頃(っていうかバブル崩壊以降)経営が苦しいので
余計な人は切りたいのですよ
2021/08/02(月) 12:44:33.86ID:hopXEvEra
それほどでもない人は派遣で事足りるのでわざわざ直接雇用する必要性がない
2021/08/02(月) 18:59:16.39ID:8E4hF4AB0
ミニバッチのサイズはどう決めたらいいの?
824デフォルトの名無しさん (スッップ Sdff-QWHR [49.98.162.153])
垢版 |
2021/08/02(月) 19:07:16.40ID:zmsv2joPd
メモリが耐えうるまで
2021/08/03(火) 01:06:18.62ID:oOwKRL/U0
>>822
そういえば今
大卒、院卒で都心1人暮らしで派遣やってる人っているの?
吸われまくりじゃないか
ホリエモンやらひろゆきやらが固定費高いところに住んでいる奴は馬鹿だとか
田舎に行った方が給料安くてもゆとりが出来る
どうせ家に帰ってもやるのはゲーム、映画、youtubeでしょ
とか言いまくってるけど
2021/08/03(火) 13:09:41.89ID:aIk7WbzI0
optimizerって色々あるけど
時間か許せるならsgdで十分?
827デフォルトの名無しさん (ワッチョイ 7f10-X9IN [153.243.43.6])
垢版 |
2021/08/03(火) 14:00:05.16ID:6vJGvI2N0
>>826
はい
2021/08/03(火) 14:13:31.63ID:tooGDD4E0
>>826
今ほぼ使われてないです
2021/08/03(火) 16:53:25.25ID:aIk7WbzI0
>>827
>>828
えっ、どっち?
830デフォルトの名無しさん (ワッチョイ 7f10-X9IN [153.243.43.6])
垢版 |
2021/08/03(火) 17:09:33.69ID:6vJGvI2N0
>>829
別に矛盾はせんやろ
2021/08/03(火) 17:20:30.37ID:rD80CIFeH
https://arxiv.org/pdf/2105.04339.pdf

sentence-roberta-largeの結果を出してなくて草
たぶん差がでなかったんだろうな
2021/08/04(水) 00:32:37.20ID:GsUzM+NY0
脳死adamが強すぎてsgdは勉強しているときにお世話になった程度だな
ちなみにadamの計算まったくわからん!
833デフォルトの名無しさん (ワッチョイ df3b-By/s [163.221.128.67])
垢版 |
2021/08/04(水) 10:21:46.29ID:iQcHbH250
動画像の過去の数フレームを使って将来のフレームを予測するみたいな研究でうまくいってるやつってないのかね
2021/08/04(水) 11:32:00.70ID:djLthEM60
adamでうまくいったとか過学習ぽくて実際に使うのは不安残るわ
2021/08/04(水) 12:16:33.20ID:CTWLjTDBM
>>833
うまく行ってるの基準が分からんが、研究はあるでしょ

>>834
adamは収束速くなるだけじゃないの?
2021/08/04(水) 13:37:42.82ID:djLthEM60
>>835
そんな単純ではない。deepの汎化性能がどこから来るかはいまだに謎。
learning rateだけでも何がいいか結論出てないが変に速い収束が問題視されてるのは事実。
2021/08/05(木) 00:36:56.29ID:6USKtEeL0
>>836
多様体の変な極小点にハマりやすいかもしれない、ってことかな?
ユークリッド空間に埋め込んだときに何百万次元にもなってしまう多様体の形を求めるってのは普通に簡単じゃない感じするもんなあ。
2021/08/05(木) 04:05:50.17ID:4Jcsl2iC0
>>833
深層強化学習がまさにそれでしょ
ゲームの自動攻略とか
2021/08/05(木) 12:04:21.61ID:Lxx97Kw00
多様体上のアルゴリズムってあるの?
2021/08/05(木) 12:10:08.37ID:XONwOmCI0
>>837
それってディープラーニングというより最適化問題?
2021/08/05(木) 12:40:57.09ID:YkYCYNc40
>>837
それもあるし、
そもそもトレーニングデータにおける最適解が汎化性能が高いかどうかもわかってない。
2021/08/05(木) 13:18:44.73ID:pKPfjq5zM
>>840
ディープラーニングは最適化問題とかぶる部分かなりあるでしょ
2021/08/05(木) 13:20:43.08ID:pKPfjq5zM
>>839
質問が漠然としすぎていて、何をもってあるといえるのかわからないが、
スイスロールデータセットの次元圧縮がうまくできるように工夫しているアルゴリズムは多様体らしいアルゴリズムじゃないかね?
2021/08/05(木) 15:14:43.80ID:Lxx97Kw00
>>843
この質問は多様体上で解いてる前提でしょ、だから聞いてみた
>多様体の変な極小点にハマりやすいかもしれない、ってことかな?
2021/08/05(木) 15:16:19.67ID:Lxx97Kw00
>>843
曲面の上の話に過ぎないと思うが
846デフォルトの名無しさん (オッペケ Sr5b-i/eU [126.166.243.251])
垢版 |
2021/08/05(木) 15:32:28.42ID:1Daamf/ur
>>839
次元圧縮は多様体仮説の上で成り立っている
2021/08/05(木) 16:38:46.82ID:Lxx97Kw00
>>846
なるほど
2021/08/05(木) 16:44:30.35ID:Lxx97Kw00
多様体学習という用語があるんだ
2021/08/05(木) 16:54:01.39ID:XONwOmCI0
スイスロールすき
2021/08/06(金) 00:20:19.84ID:c29VWanS0
>>845
曲面は多様体じゃないって意味の発言?
2021/08/06(金) 00:23:09.93ID:c29VWanS0
>>844
多様体の形を推定することも、多様体の形を決めるパラメータ群を多様体としてとらえれば多様体上の最適化問題になると言う意味ね
2021/08/06(金) 00:55:06.00ID:juvnr80E0
多様体言いたいだけ
853デフォルトの名無しさん (ワッチョイ abad-64Ij [42.146.70.31])
垢版 |
2021/08/06(金) 09:08:23.67ID:3JKbI2Z00
それでも精度に有意差がつかない機械学習コンペティションに躍起になる香具師よりまし
2021/08/06(金) 10:31:56.33ID:eF3TWJ3i0
曲面しか扱っていないのに多様体といったら話盛ってるだろうw
2021/08/06(金) 13:22:10.03ID:/Dyrl6Iq0
君たち「多様体の基礎」ぐらい読んでから喋ってる?
俺は教科書指定されたけど挫折した
856デフォルトの名無しさん (ワッチョイ 6b5f-aD9w [106.73.78.34])
垢版 |
2021/08/06(金) 13:27:08.97ID:FN7kYlvy0
あーあのラノベ?
昔のラノベってレベル高いね
2021/08/06(金) 13:35:17.72ID:W4CwI8Ep0
「多様体の基礎」でわからなきゃもう無理だろ。
でも実際はテンソルの変換の計算するだけだから多様体を考える必要はほとんどないけど。
2021/08/06(金) 14:25:37.37ID:7P/+UMXla
二次元で理解して
それが高次元になっているのね
という理解で十分
859デフォルトの名無しさん (ワッチョイ abad-64Ij [42.146.70.31])
垢版 |
2021/08/06(金) 16:58:50.71ID:3JKbI2Z00
>>858
その理解だと関係式になってない関数は多様体で取り扱えなくなってしまうのでは?
関係式の例として単位円の方程式、x^2+y^2=1はxが定まればyも即座に定まるからその理解でもいいけど、
関係式ではない正規分布の母数のように平均が定まっても標準偏差は即座に定まらないから、統計多様体で矛盾が生じてしまう
やっぱりちゃんと多様体を理解した方がいいと思うよ
ただし、自民党政権下ではどんなに数学頑張っても無駄だと思う
法人税の特別減税措置を大量に作って大手ばかり優遇し、富の再分配と真逆の行いをしてビジネスの世界から本質が消えてしまった
内部留保ばかり増えて労働者の平均賃金も長年上がってない
労働者は共に現政権にNOを突きつけ、IT業界に蔓延する「今だけ、金だけ、自分だけ」の考え方を変え、本質を取り戻そう!
数学の勉強はその後、皆んなで一緒にすればいい
2021/08/06(金) 17:04:16.10ID:El/YE1LI0
どっかいい政党あったら教えてくれ
861デフォルトの名無しさん (ワッチョイ 4610-DdKv [153.131.102.129])
垢版 |
2021/08/06(金) 17:16:47.29ID:JGIT2rTS0
2次元多様体は3次元で見ると曲面になるから
n次元多様体はn+1次元でみたら曲面になるんじゃね?
その曲面上で損失が最小になる点を見つけるのが学習だと思うけどな
2021/08/06(金) 17:48:36.83
非線形学習の基礎概念じゃん
何を長々やってんの
2021/08/06(金) 17:56:15.73ID:c29VWanS0
>>855
流石に読んでるぞ
てか読まなきゃ多様体が何だかわかんないじゃん
864デフォルトの名無しさん (ワッチョイ 6b5f-aD9w [106.73.78.34])
垢版 |
2021/08/06(金) 18:22:31.29ID:FN7kYlvy0
最近多様体のお勉強でもして、お話ししたくなったのかな?
2021/08/06(金) 18:57:54.44ID:3CuQyvuTM
多様体言いたいだけ
2021/08/06(金) 19:00:20.98ID:eF3TWJ3i0
多様体
2021/08/07(土) 23:07:23.06ID:S6UZnCNm0
チビタレビ接続、アルファ接続なんて使用しません
2021/08/08(日) 01:36:39.38ID:QRxRLgxLM
実務未経験、kaggle初挑戦でソロゴールド取れたけど転職活動で評価されますかね
kaggleやる前は経験がないという理由でさんざん落とされまくった
masterまで取ってしまった方が評価高まるんかな
grandmasterまで取れたら引く手あまた?
2021/08/08(日) 09:58:13.80ID:/p80N7+xa
実務はkaggleみたいに整備された環境ではないのでkaggle実績など実務経験としてカウントされません
実務でデータサイエンスやっている人が転職時にアピールポイントとして使うならまだ分かる
2021/08/08(日) 12:13:58.31ID:KSDEV/p50
>>868
DeNAがkaggle経験重視してるから受けてみたら?
2021/08/08(日) 13:13:50.96
Kagglewwwwwwwww
競プロer笑と同レベルって気付け
872デフォルトの名無しさん (オッペケ Srff-/xw2 [126.167.123.236])
垢版 |
2021/08/08(日) 13:34:01.94ID:FLwcAWgNr
実務マウントもイタイよな
2021/08/08(日) 14:34:01.87ID:4QdLr3Tg0
>>868
今の会社でデータ分析の部署に転属させてもらうか、プロジェクトに参加させてもらったら?
部長クラスに相談すれば悪いようにはならないかと。
2021/08/08(日) 15:35:49.38ID:APy0xH+W0
>>868
数多ではないだろうがある程度評価はされると思うからそのままグラマスまでやれ
2021/08/08(日) 22:18:53.80ID:vFD24uPRr
転職サイトでkaggleで検索すると何件かヒットするよ
2021/08/09(月) 11:23:28.16ID:YrRw0eGAM
ありがとう

データ分析の職種もいろいろあるね
研究開発もあればコンサルもあったり、データの活用方法の立案から任せたいところもあれば、データを集めるところからやらせたいところもある
この違いのせいで人によって言うことが全然違うというのは面接でも経験した

kaggleのような精度出しを重視するのは研究開発なのかな

grandmasterまでは少し時間かかりそうだから考えてしまう
ソロ金取れたからあとはチーム組みまくればさくっと取れるのかもしれないけど
2021/08/09(月) 11:36:38.45ID:YrRw0eGAM
>>873
今の会社のデータ分析やってる部署は機械学習の仕事は2割しかないらしい
古典的な統計手法がほとんどなんだとか
試しに社内公募で面接受けてみたら機械学習についてまったく質問されなかったから辞退した
業界はAIを活用し始めてるし会社もビッグデータを持ってるんだけど、そこの部長が機械学習に疎いようだから社外に出た方がよいと判断した
2021/08/09(月) 12:05:10.95ID:8AhcXF4R0
kaggleなんて初めて知った
2021/08/09(月) 12:34:48.65ID:Gz+/uc5A0
>>877
まずはその部署で実務経験を積めばよかったのに。
機械学習プロジェクトでも古典的な統計手法は使うよ。
880デフォルトの名無しさん (ワッチョイ 6b5f-aD9w [106.73.78.34])
垢版 |
2021/08/09(月) 12:49:06.77ID:rKb0Niaj0
俺もそう思う
データサイエンスなんて実際は本当に泥くさい仕事だよ
2021/08/09(月) 12:50:30.94ID:EJdTKpSKa
>>879
いやまあそれだけじゃなくてあの部長とは反りが合わないと思った。

面接でケーススタディやらされたんだけど、こっちの解答が不正解で扱われたから模範解答を聞いてみて、
その模範解答間違ってるよと間違ってる理由を言ったら、間違ってないの一点張りで、根拠を聞いても今後の採用でも同じ問題使うから答えられないと。
いや出題ミス隠蔽のうえに間違った問題を使い続けるって…
人事に話したが俺の言い分は正しいように思うが人事は試験問題には立ち入れないんだと。何のための人事なんだか。

とりあえずこの人の下では働きたくないと思った。

今の仕事も統計関連ではあるから古典的な分析手法を異動してまで経験する必要はないかな。
2021/08/09(月) 12:51:41.18ID:EJdTKpSKa
>>880
どの仕事もそうだね。今の仕事もそうだから想像はつく。
2021/08/09(月) 13:48:53.19ID:jlOW9NPh0
>>868
kaggleのことよく知らないんだけどソロゴールドってどういう状態なの?
2021/08/09(月) 13:54:33.72ID:PID/W7Dkr
機械学習だけでなく古典的統計もちゃんとわかってる方が価値あると思うなぁ
2021/08/09(月) 14:43:49.71ID:ABArYxqcM
皆さんが言う古典的統計って、計量経済のこと?
2021/08/09(月) 15:05:05.53ID:xK6XOXuS0
全く違う
そもそも古典的統計なんて言葉ほとんどつかわない
2021/08/09(月) 15:15:37.04ID:3bscJFtj0
ナイチンゲール?
2021/08/09(月) 15:18:02.99ID:xELB7YY70
この発想はないわ、経済屋さんか?
>古典的統計って、計量経済のこと?
2021/08/09(月) 15:28:53.04ID:xK6XOXuS0
むしろ経済とは無縁の人の発想だろ
2021/08/09(月) 15:32:54.86ID:xELB7YY70
計量経済という言葉自体経済をかじってないとしらないだろ
2021/08/09(月) 16:07:47.57ID:ABArYxqcM
古典的統計って単語でt値とかp値とか連想して質問してみました
2021/08/09(月) 16:29:06.17ID:yT1rK/qm0
p値や帰無仮説の類いは、統計分析で使われているが、本来は検定では?
古典的統計って、古典的統計分析の省略形?
2021/08/09(月) 16:48:39.03ID:ABArYxqcM
そうなんです、私は仮説検定で育ってきて最近機械学習を勉強し始めたところで、二つの世界観の違いに少なからず戸惑っておりまして、漠然とした質問を投げて、何かヒントを頂けたらと思った次第です
894デフォルトの名無しさん (ワッチョイ 4610-ZFfB [153.243.43.6])
垢版 |
2021/08/09(月) 17:14:20.50ID:/DAK4ORS0
機械学習でinsightを得て、統計的検定で確認するもんじゃろ
どこの現場もそうやっとるじゃろ?
2021/08/09(月) 19:50:41.35ID:ABArYxqcM
その感覚がわからなくて。tks
896デフォルトの名無しさん (ワッチョイ 4610-ZFfB [153.243.43.6])
垢版 |
2021/08/09(月) 19:55:34.56ID:/DAK4ORS0
tksとは珍しい略語を使うのう
2021/08/09(月) 21:20:56.44ID:WuaDW8MIM
古典的というのは別に用語ってわけでなくて比較的最近流行の的になっている機械学習以外の昔ながらのデータ分析手法という意味で言ったつもり。
セグメンテーションとか主成分分析とかいろいろあると思うけどデータ分析業界でどういう言葉が使われてるのか分からないので深く突っ込まず察してほしい。

ところでスレ違い申し訳ないけどひとつお聞きしたい。
皆さんとこのデータサイエンティストの女性率は何割くらいだろう?
うちの会社のその部署は部長(男)の下に4人の女性と3人の男性が所属していて、それぞれデータサイエンティストまたはデータエンジニアの肩書きが付いている。
しかしこの仕事を志望する人の大半は男性だと思う。ネットで調べても9割は男性だと出る。
意図的に女性を優遇して採用しない限り部署の過半数が女性になることは考えにくいと思うのだけど、この感覚は皆さんも一緒だろうか?

その部長はデータ分析部署立ち上げ当初から採用に関わっているらしい。
なんだかものすごく気持ち悪く感じた。合理的理由なく女性優遇してるとしたら法律違反でもある。
2021/08/09(月) 21:34:44.42ID:xELB7YY70
ベイズ推定勉強すれば
2021/08/09(月) 21:58:25.58ID:GSmZJeae0
女性の割合をクォータ制とかで割合を決めたりするところもあるから違法とは言えないんじゃね?
海外では国会議員の割合とか会社役員の割合とかクォータ制導入してるとこもあるだろうし

人事のことは会社の人事権限を持つ人が決めることで
成果の責任を取るのも責任者になるはず
何故かそうならないこともあるけどな

自分のやりたいことをしたいのなら出世するか独立したら良い
2021/08/09(月) 22:04:18.62ID:xELB7YY70
成果は俺の物、失敗は部下の物w
2021/08/09(月) 22:27:09.99ID:5XVoQDhV0
>>877
某メーカーの中で少し働いたことがあるがコテコテの統計学だったよ
それこそt検定とかF検定
しかも秘伝のタレと化した自前Fortranのライブラリを使わなきゃダメだった
2021/08/10(火) 00:32:57.08ID:uO0ANz+Ga
>>897
>しかしこの仕事を志望する人の大半は男性だと思う。ネットで調べても9割は男性だと出る。

そりゃ現状大半が男性で構成される環境を志望する女性はレアなんだから仕方ないだろう
2021/08/10(火) 08:47:35.51ID:2xiLGjmP0
>>901
秘伝のタレは継ぎ足していくもの。
改良されない数値計算ライブラリは、秘伝のタレではなく単なる化石?
2021/08/10(火) 13:51:45.49ID:BpbHj/DY0
>>903
社内の業務フローに組み込まれてるだろうから変えられないんだと思う
製品開発に直結するからね
2021/08/10(火) 14:48:04.03ID:CtWJxJTj0
>>904
並行して別のシステムを作っていけば
出来上がってから切り替えられるし
品質管理なら適用する製品を選べば良いように思う

例えば新製品は新システムで品質管理するとか
906デフォルトの名無しさん (ブーイモ MM7e-T+mJ [163.49.207.255])
垢版 |
2021/08/10(火) 16:38:57.39ID:QOeLlU4qM
> お前は毎朝起きるたびに俺に負けたことを思い出すよ^^

あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!

クソチョンw
2021/08/10(火) 20:17:47.53ID:pEvUaaVHd
まあ実際の仕事はkaggleで高得点出すことじゃなくて
kaggleがコンテストするためにやってるように、データ整備やコンテスト形式を整備する部分なんだよね。
2021/08/11(水) 08:52:04.34ID:SA7xwrWpM
rnnを試してるけど学習が安定しない
想定どおりに学習できることもあるしできないこともある
こんな感じだっけ?
909デフォルトの名無しさん (ワッチョイ 4610-ZFfB [153.243.43.6])
垢版 |
2021/08/11(水) 09:57:19.51ID:LaezIcyQ0
>>908
いいえ
2021/08/11(水) 13:14:47.40ID:lYh86/4uM
>>909
(o´・ω・`o)何が良くないんだろう
911デフォルトの名無しさん (ワッチョイ 4610-ZFfB [153.243.43.6])
垢版 |
2021/08/11(水) 13:26:42.69ID:LaezIcyQ0
>>910
基本的な知識の得方
レス数が900を超えています。1000を超えると表示できなくなるよ。
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況