【統計分析】機械学習・データマイニング24

2019/05/01(水) 10:39:45.57

機械学習とデータマイニングについて語れ若人

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
Machine Learningを用いた論文一覧2018
https://shiropen.com/seamless/machine-learning/2018
2017年のディープラーニング論文100選
https://qiita.com/sakaiakira/items/f225b670bea6d851c7ea
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング23
https://mevius.5ch.net/test/read.cgi/tech/1551352040/

VIPQ2_EXTDAT: default:vvvvvv:1000:512:----: EXT was configured

2019/05/01(水) 12:56:16.08

AIブーム終わっちゃったね

2019/05/01(水) 13:56:27.20

中小企業ですらAI言ってる時点で
もうｵﾜﾀ

2019/05/01(水) 16:25:43.51

いやいやまだまだAIの時代だよ

2019/05/01(水) 17:07:41.25

AIと一口に言ってもそこには大きく以下の3種類の仕事が存在する
2と3はブームが過ぎても使い道があるが、1しかできない人はマジで使い道がなくなる
1.誰でも使えるお手軽AI構築ソフトをポチポチするだけの簡単なお仕事
2.AIの開発環境や実行環境を(主にクラウド環境として)構築する仕事
3.AIというよりもより具体的に(今であれば深層学習などの)数学的側面を理解して適切なモデルを構築する仕事

2019/05/01(水) 17:15:22.12

1は、データの更新に合わせてモデルをポチポチ再構築するお仕事として残ったりしそう
CAEのメッシュ切りみたいに

2019/05/01(水) 17:51:27.02

AIってモデルはかんたんに作れるけど其の周辺のシステムを構築する仕事がメインだと思う

2019/05/01(水) 18:14:52.39

CAEのメッシュ切り、てなに？

2019/05/01(水) 18:19:13.02

勉強進まない
2時間やって参考書10ページも進まないとか…
連休中に一冊終わらせようと思ったけど無理だな…

2019/05/01(水) 18:39:39.46

>>9
まぁ実行時間かかるしね、しょうがないね

2019/05/01(水) 18:44:01.37

>>6
すぐ自動化されそう

2019/05/01(水) 19:05:15.36

>>10
数秒で実行出来る内容なんだけどね…
情けない話だわ

2019/05/01(水) 20:06:09.40

ネットワークモデルの考案は最も難しく研究者が行うことだ
技術者は適切なモデル選定して学習させるだけ

◆QZaw55cn4c (ﾜｯﾁｮｲ 3a47-HJzg [131.129.112.103]) · 2019/05/01(水) 20:42:42.21

>>9
何を思ったか、私は受験用英単語集(2000語レベル）を買って頭から一日50 words （ただし自分の知らないものに絞る）ずつやって GW 中に 2000 語レベルを仕上げるべく、他のことは放擲してまで熱中しています
今 1000 語を超えましたが、GW の残りの半分で全部仕上げるためにはペースアップしないといけない、と考え始めています
とりあえず一日 100 words、使う時間も倍にする予定です
https://www.amazon.co.jp/gp/product/4791624076/

2019/05/01(水) 21:16:13.07

CAEでメッシュ切るのも未だ完全自動じゃあないよ
すべてコンピュータに任せればおかしなメッシュが出来るからチェックが必要

2019/05/01(水) 22:21:24.25

今後10?20年の間に最も必要とされる仕事
https://rikunora.hatenablog.com/entry/20170217/p1

2019/05/01(水) 23:55:44.59

>>15
仕事で使ってるけど、商用ソフトでは完全自動になってるよ。
メッシュがおかしくなることはほぼ無い。

2019/05/02(木) 01:41:45.73

>>14
偉いなぁ
2、3時間だらだらやってNetflixに逃げる俺とは大違いだ

2019/05/02(木) 01:52:01.97

ところで組み込み系の開発ってどういう意味ですか？

◆QZaw55cn4c (ﾜｯﾁｮｲ ba47-R0y6 [131.129.112.103]) · 2019/05/02(木) 08:00:25.85

>>18
何か意味のあることをしたい、と思っただけです、英語がいくつになっても必要であることはこの業界であればいつも痛感するのです
こういう馬鹿みたいな訓練も、ときにはお勧めです、次のお盆か正月やすみにでもいかかでしょうか？

◆QZaw55cn4c (ﾜｯﾁｮｲ ba47-R0y6 [131.129.112.103]) · 2019/05/02(木) 08:01:32.38

>>16
翻訳者、でしょうね

2019/05/02(木) 12:36:51.10

令和時代に汎用人工知能は実現できそう？

2019/05/02(木) 13:04:29.95

>>22
あと３つくらい改元しないと無理だと思う

2019/05/02(木) 13:07:27.61

そもそも汎用人工知能とやらを本気で求めている人ってどれだけいるの？
会話に反応してくれるのはSiriやPepperがもう少し賢くなれば十分だし
金儲けのためなら汎用ではなく特定用途に特化したものがあればいいし

2019/05/02(木) 13:22:08.06

のび太くん。あ、セワシくんが切実

2019/05/02(木) 13:27:08.21

汎用人工知能ってつまり人間の仕事を１００％肩代わりさせることができるってことだよな
人工知能に人間が生かされる時代がいずれくるんだろな

◆QZaw55cn4c (ﾜｯﾁｮｲ ba47-R0y6 [131.129.112.103]) · 2019/05/02(木) 13:37:52.82

>>26
それは人間の能力を低く見すぎではないかと
今の AI は過去の延長線上でしかモノを考えません（傑出しているのは将棋とか囲碁くらい）が、人間はある日突然、これまでに存在しなかったものを実現化・実在化しますよね

2019/05/02(木) 13:43:15.50

>>27
汎用人工知能ってもうできてんの？

2019/05/02(木) 13:50:30.37

>>27
それは一握りの天才だけじゃない？
大多数の人間はAIと同じく過去の延長線上でしか考えられない。
ていうか延長すら出来ない人がほとんど。

画像認識だって人の目視よりAIの方が精度高い場合もあるみたいだし、囲碁将棋だけってのはちょっと情報古くないかな。
実際自分も仕事で使ってるけど、回帰で高精度叩き出してるよ。

2019/05/02(木) 13:52:56.17

人間がコンピューターの使い方を学習しだした気がするよ
Excel滅びろ

◆QZaw55cn4c (ﾜｯﾁｮｲ ba47-R0y6 [131.129.112.103]) · 2019/05/02(木) 14:02:53.48

>>29
＞画像認識だって人の目視よりAIの方が精度高い場合もある
教師あり学習の場合は、シベリアンハスキーとエスキモー犬を分別するとか、とかはうまくいっていますよね
個人的に感動したのは「超解像度」や CycleGANです、それは多いに認めています

ただ、

>>28
1000年たっても「心」や知性の実現＝機械証明（証明支援ではない）は無理だと思っています

2019/05/02(木) 14:05:34.86

factorization machinesの論文を出した人、一時期日本にいたのね
なんでそういう人材を手放すかなあ

2019/05/02(木) 14:23:57.71

そんな高度な人材は日本の企業・組織には使いこなせない
その分野の発展にとっても本人にとっても出ていくのが最適解

2019/05/02(木) 15:57:49.26

日本はIT土方とかいう表現が生まれるくらいSEがブラック扱いされてたのが良くない

2019/05/02(木) 16:20:35.15

pytorch難しいんじゃ…
こんな難しいの人気にしてはいけない😡

2019/05/02(木) 16:24:44.34

心や知性は機械的なアルゴリズムでは実現不可能って思ってる人って人間の脳をどういう仕組みで動いてると思ってんだろ
霊的な何かとか物理の常識を超越した現象かなにかだと思ってるのかな

2019/05/02(木) 16:28:00.90

俺今お腹すいてるけど何食べたいか分からないんだよね
そもそもお腹空いてるのかすら疑問なんだけどそういうのもいつか理解してくれるアルゴリズムも出来るのかな

2019/05/02(木) 16:31:37.05

心や魂なんて無いのにな。
脳を階差機関と交換してない野蛮人はこれだから困る。

2019/05/02(木) 16:40:47.31

>>36
それらしいものが出来たとしても確かめる術がない

2019/05/02(木) 16:44:13.65

>>34
だからどうしたｗ

◆QZaw55cn4c (ﾜｯﾁｮｲ ba47-R0y6 [131.129.112.103]) · 2019/05/02(木) 16:47:41.01

>>38
そんなことを言っているようでは今の若い者に期待はできないですな
「心」や「魂」に一対一に対応する実体を求めているわけではないのですよ
むしろ、我々人間が「心」や「魂」を存在するものとして扱っている事実に注目することが重要なんです
我々人間が、こいつには「心」や「魂」が存在するに違いない、と錯覚させるだけの「なにものか」を装備することが必要かつ十分なんです

2019/05/02(木) 16:55:32.23

>>36
物理の常識では心や知性をどう解釈するの？

2019/05/02(木) 17:01:29.46

>>42
知能や心はまだ解明されてないよ

2019/05/02(木) 17:08:50.94

>>43
お前自分の書いた文章読んでみろよ、アホ？

2019/05/02(木) 17:10:29.29

記憶がどうやって保存されてるかも分かってないと思ったけど

2019/05/02(木) 17:17:27.25

完全解明には至ってないけど
少しずつ明らかにはなっているかと

2019/05/02(木) 17:19:58.81

猫飼ってたけど奴にはには自我があると思ったよ。
あざとくないアイボはよはよ

2019/05/02(木) 17:32:40.55

彼らなりの評価関数はあるだろうから
最適化を目指す行動を観察すれば
自我があるように見えるかもね

2019/05/02(木) 17:51:05.49

シナプスの最小単位回路が六方格子状ってのは解明されたからその機能が積み重なって自我ができてるんだろうね、わからんけど

2019/05/02(木) 18:22:37.26

>>44
読んだけど何一つ矛盾が見つからないけどなんかある？

2019/05/02(木) 19:56:07.65

>>50
馬鹿よ永遠なれ

2019/05/02(木) 21:46:36.64

>>40
情報系進もうとする学生が減るじゃん
アメリカは金持ちで格好いいシリコンバレー
日本はIT土方でブラック生活
そりゃ差がつくでしょ

2019/05/02(木) 21:49:04.03

そんなにシリコンバレーがいいなら外資行けばいいだけだし何ならシリコンバレーに行ってしまってもいい
日本企業に就職する必要などどこにもない

2019/05/02(木) 21:51:27.91

その辺に詳しくない高校生が大学の学部選択するときの話をしてるんだけどね
自分は別の分野で博士とったけどSEのイメージがもうちょっとよかったら情報系行ってたかもしれないし

2019/05/02(木) 22:01:15.10

>>51
馬鹿はお前だ
ひとまず汎用性のある人工知能は実現可能なんだろうけどお前には関係のない話って事だな

2019/05/02(木) 22:03:58.14

おっさん世代だと情報系はバカが行く、数物系こそ至高だったぞい

2019/05/02(木) 22:06:21.65

>>55
実現してから言えよ馬鹿

2019/05/02(木) 22:17:57.30

>>57
なんでこいつ切れてんだ？
なんか嫌なことでもあったのか？
人工知能の授業で先生に怒られたとか？
あ、お前中卒だから関係ないか

2019/05/02(木) 22:37:05.39

>>58
自己紹介乙

2019/05/02(木) 23:11:37.61

せっかくの楽しい連休に喧嘩するなよ！

2019/05/02(木) 23:16:31.35

人工知能同士が喧嘩しているとは、この時まだ誰も気づいていなかったのである

2019/05/02(木) 23:44:05.28

>>59
ばーか

2019/05/03(金) 09:28:51.15

日本のITも土方でやってける時代も終わってきてる
これからはどうなるかな

2019/05/03(金) 13:34:34.46

いまのところ人間どころかネズミほどの知能も実現できてないんだよなぁ

2019/05/03(金) 14:26:48.22

ん? すでに7割方の人間の能力はすでに上回っているわけだが
コストは人間を雇った方が安いので、人間が仕事をしていることが多いが

2019/05/03(金) 15:54:26.01

汎用知能を実現させている人間の脳って凄いよね。
脳は手の平に乗る程の大きさなのに、解明されていないとか不思議。

2019/05/03(金) 15:58:43.30

Googleの場合、雇用はPh.D取得組（平均初任給20万ドル）とNo Degree組（初任給上限1万）の2つのグループに2極化が進行している。
東大とか日本の有名大学の理系修士の採用であっても、No Degree組に入ると初任給は大体800万円くらいになる。
Googleはこの2極化戦略を更に進め、No DegreeをRed Badgeと呼ばれる派遣社員で置き換える動きも進めている。
派遣社員で採用となった場合は、1年契約で、最大契約期間は2年で3年以上の契約更新はない。
というと、Red Badgeの条件は悪いように思えるが、正規の平均在職期間は大体1年10ヶ月くらいで2年以上残れる社員は半数以下。
給与条件で現在のアメリカのIT業界で頂点に位置するのは、Uber Advanced TechnologiesとWaymo。
Waymoとかは、分社化以前は、平均給与が100万ドルとか、ありえない条件で雇用していたが、
運営費が膨大になりすぎたため、新会社（Waymo）を設立して従業員を全て新会社で新規雇用することで、雇用条件を一旦リセットした。
Googleで初任給20万ドルを取れるのは、このWaymoとGoogle Brain採用組がメイン。
有名大のPhD（一般人枠）で高給を狙うのだったら、FacebookかAmazonの方がいい。
ただし、Amazonとかは、全生活を会社に貢献することを求められる位、仕事はハード。

2019/05/03(金) 15:58:50.50

>>66
そうだね
仮に300年前の人類に親指サイズの半導体製品与えても同じように解明は難しいだろうね

2019/05/03(金) 16:03:56.22

GoogleのNo Degree組の初任給上限は10万ドルのうち間違え。

2019/05/03(金) 16:25:56.77

>>68
たしかにw
わかりやすい的確な例え有難うございます。

2019/05/03(金) 16:27:27.27

覚醒するかもしれないじゃないか

2019/05/03(金) 16:57:24.66

>>66
この分野勉強して1番強く思ったのがこれ
目とかもすげーんだなって
あとは人間にそういう機能があるって解明した人もすごい

2019/05/03(金) 16:59:13.34

カギはネットワークなのか？
ネットワーク以外の構造ってないのかしらん？

2019/05/03(金) 17:15:12.28

>>73
生物の情報処理の根源はネットワークではなく
分子の相互作用だと言われている。

2019/05/03(金) 17:42:04.37

それは違う

2019/05/03(金) 19:59:37.88

分子の相互作用ってそれ全てそうだろw
すべて弱い力と強い力と電磁気力と重力って言ってるようなもんだぞ

2019/05/03(金) 22:42:06.88

複数の分子の相互作用と考えれば
ネットワークになるけどね

2019/05/03(金) 22:59:20.24

解けないけど

2019/05/03(金) 23:26:58.01

脳の研究は人権無視の中国が頑張ってくれそうだから
地道に時系列問題の解決を目指す

2019/05/04(土) 00:33:23.47

>>79
チュ国は人権軽視の国と勘違いされる事があるようだけどそんな事もないよ
音も葉もないかな

2019/05/04(土) 01:46:36.82

この連休数学も統計もついでにwebアプリの作り方もって色々勉強しようと思って手付けたけど全部中途半端で終わりそう
一点集中にするべきだよなぁって連休の度に後悔してる気がする

2019/05/04(土) 05:49:15.23

5教科の中で、どの教科が一番大事だと思いますか？
国、社、数、理、英。

2019/05/04(土) 06:39:55.78

>>82
目的は？
なにを目指すかによる

2019/05/04(土) 06:40:27.81

pytorchとtf、どっちを勉強すべき？

◆QZaw55cn4c (ﾜｯﾁｮｲ ba47-R0y6 [131.129.115.141]) · 2019/05/04(土) 07:37:49.10

>>80
ウィグル人の人権についてはどうですか？
あるいは人体標本の話は？
https://blog.goo.ne.jp/sakurasakuya7/e/0201d90efa00152c5b2ac054bda9ee32

2019/05/04(土) 07:43:40.10

>>84
サンプルプログラムを読んだり、実行してみて、自分が探してるものか評価する。
もしかしたらどっちも合ってないかもしれない。

2019/05/04(土) 11:16:43.18

>>86
自然言語処理したいの

2019/05/04(土) 11:19:24.07

>>85
日本の外国人労働者問題についてどう思いますか？
http://news.livedoor.com/article/detail/15596666/

◆QZaw55cn4c (ﾜｯﾁｮｲ ba47-R0y6 [131.129.115.141]) · 2019/05/04(土) 11:37:14.01

>>88
外国人技能実習制度の話ですね、技能実習生という名目で使い捨てただ同然で長時間働かせてポイする、というやりかたですね
移民解禁でこの選択を取らない方向に全体がシフトしていくでしょう

2019/05/04(土) 12:39:16.12

>>87
したいことを知ってるのは自分しかいない訳じゃん。それを実現する手段は後から付いてくる。
したいことに近いサンプルプログラムを探して、手を動かしてみては?

2019/05/04(土) 15:45:57.10

全然関係ないけど
見分けがつきにくい野草（トリカブトとニラ、みたいな）を判別できるアプリとか
需要有りそうじゃない？

2019/05/04(土) 15:55:13.32

毒キノコ欲しい

2019/05/04(土) 17:00:03.87

ディープラーニングは精度100%などあり得ないが一般人にはそれが理解不可能なので毒物判定のような命に関わるものを扱うのは危険すぎる
どれだけ丁寧に「開発者は一切責任を負わない」などと書いていても何かあれば叩かれるのは明白だから

2019/05/04(土) 17:03:42.80

>>93
とはいえ現場でいえば代替案を出せとかめちゃくちゃなことを言われるからな。。
いやそのプロジェクト止めろが代替案だったりするわけだが、大きな金が動くとどうしてもね。

2019/05/04(土) 17:18:19.81

原子力発電はそれで止まってしまったゾイ

2019/05/04(土) 17:24:57.53

>>91
現実には写真を撮って
「これ食べられる?」
ってツイッターとかにあげるのが
一番の早道

2019/05/04(土) 20:02:55.53

あらゆる物を毒物と判定するジョークアプリにすれば良いのさ

2019/05/04(土) 20:54:01.85

>>95
福島見てりゃ日本人がいざという時誰も何も責任取らんことはよくわかっただろ。
それでもまだ作らせるとかバカか？

2019/05/05(日) 06:47:27.53

地位と権力を持つ人の
責任感や使命感が
ぼろぼろだね

2019/05/05(日) 07:10:22.65

脳なんて鼻水作ってるだけだぞ

◆QZaw55cn4c (ﾜｯﾁｮｲ ba47-R0y6 [131.129.115.141]) · 2019/05/05(日) 08:26:54.06

>>99
世の中は所詮損得勘定で、だれも損なことはやりません
損得勘定でも世の中が回る仕組み（制度設計）を作るしかないかと
戦前の日本は、学府に進む学生は「みどことらがある」として地方の有力者から援助を受けるのが常で、顔の見える他人に恩を受けて学資を支援してもらうため、恩を感じて恩を返すために粉骨砕身で献身したと聞いています
つまり昔はわりとうまくいっていた面もあるとのこと

2019/05/05(日) 08:41:45.82

>>82
国語

2019/05/05(日) 08:52:36.00

>>54
専門分野を持ちコードを書ける奴が一番。

◆QZaw55cn4c (ﾜｯﾁｮｲ ba47-R0y6 [131.129.115.141]) · 2019/05/05(日) 09:12:42.68

>>102
私たちが受けてきた国語教育は意味があるのかな？問題が多いのじゃないかな？
私が「国語力」を増進できた授業は英文和訳でした、訳文が日本語として共感できないものだと「横のものを縦に直しただけですか？」とか相当に教官から苛められました…

2019/05/05(日) 09:48:43.61

外国語学部の不要さは異常

2019/05/05(日) 21:12:44.71

>>105
お前の方が不要だろ

◆QZaw55cn4c (ﾜｯﾁｮｲ ba47-R0y6 [131.129.115.141]) · 2019/05/05(日) 21:20:10.38

>>14
残念、明日を入れても 1800 語レベル／実際に覚えたのは 950 words で終わってしまい、英検準1 級レベルにはとどきませんでした
それに、もう今後は新しい単語は仕入れずにひたすら長期記憶への定着をはからなくてはいけません、ここであきらめては全ては水の泡、これからの定着作業が勝負の分かれ目です

2019/05/05(日) 21:33:26.19

単語集ってどれくらい知ってるかチェックするものであってそれを使って暗記するのは本末転倒。

2019/05/05(日) 21:58:29.31

それだけ意識高ければ無理やり英語圏に住んだ方が早くね？

◆QZaw55cn4c (ﾜｯﾁｮｲ ba47-R0y6 [131.129.115.141]) · 2019/05/05(日) 22:09:10.14

>>108
その意見はよく理解できます、なぜならば、これまでの私の意見でもあったのだから
ISO/IEC9899:1999 を舐めている最中ですが、このまま辞書を引きながらやってもだめなんじゃないか…とふつふつと湧いてくる感想が持論と正反対の行動に駆り立てたようでした、非日常の10日間に、10日間でできる変わったことをしたいなあ、と

2019/05/05(日) 22:59:45.69

あなたのレスの書き方が他の人と違うことに気づいていますか？
気づていないなら教えてあげます
他の人と違っており浮いています
そして私はあなたのレスが嫌いです
バカ丁寧な口調であなたの語りが長々と書かれているスタイルに不快です
改善してください

2019/05/05(日) 23:01:38.54

>>111
ブーメランｗ
縦読みどこよ?

◆QZaw55cn4c (ﾜｯﾁｮｲ ba47-R0y6 [131.129.115.141]) · 2019/05/05(日) 23:26:13.78

>>111
専用ブラウザを使ってトリップを無視指定に加えていただければ、そのままで消えますから、それをお試しくださいな…

2019/05/05(日) 23:42:38.32

「QZaw55cn4」を選択してNG処理->NGNameに追加

2019/05/06(月) 00:47:59.82

よし(๑•̀ㅂ•́)و✧
英単語云々はスレチだろう

2019/05/06(月) 10:04:30.01

kubeflowを使っている人はいるかしらん？

2019/05/06(月) 19:29:01.25

>>84
2,3年前まではtf一択だったが、最近の論文発表とかを見るとPyTorchを使ってる例が増えている。
前、mediumに乗ってた両者の定量分析記事だと現在の比率は7:3位。
Google Trendsで見ると解りやすい
https://trends.google.com/trends/explore?date=today%205-y&;geo=US&q=pytorch,tensorflow
多分、あと2年位でPyTorchが追いつくと思う。
したがって、今からやるなら両方使えるのがベスト。順番付けをするなら最初に抑えるべきはtf、次はPyTorch

2019/05/06(月) 19:39:26.74

>>117
practical adviceをありがとう

2019/05/06(月) 19:59:12.89

tensorflowはdefine-and-runでpytorchはdefine-by-runなのでpytorchの方が柔軟
動的に構造が変わるようなネットワークも書きやすい

2019/05/06(月) 21:09:47.27

tensorflow2.0からはdefine by runがデフォルトになって必要に応じてandの方も選べるハイブリッド型となっている

2019/05/06(月) 21:16:05.57

>>119
ところが今はeager modeでtfでもDefine-by-runで書けるようになってるんだなこれが

2019/05/06(月) 21:23:45.59

他の計算ユニットに投げる場合はどうせestimatorのインターフェイスになるから
どっちにしろ変わらんよ。
そんな些細なことで躊躇するようならこの分野に手を出さない方が正解。

2019/05/06(月) 22:19:32.94

>>121
えええーそうなんか

2019/05/07(火) 00:28:16.21

ライブラリは腐るかも知らんけど、理論は腐らんからちゃんと理論勉強しとくのがいい

2019/05/07(火) 09:32:06.87

ブームは終わるけどな２０年後ぐらいに役立つよ、たぶん、きっと

2019/05/07(火) 12:03:20.66

画像分類モデルを作りながら勉強しているのですが、正常と異常を分類したいとして正常画像しか学習用に用意出来なかった場合でも異常を識別するモデルを作ることは出来ますか？
もし可能であればどのようなキーワードや手法の名前で調べると良いでしょうか
初歩的な質問で申し訳ありませんがアドバイス頂けたら幸いです

2019/05/07(火) 13:44:41.49

>>126
前スレでは半教師あり学習、PU learningや能動学習といったキーワードが出ていた

2019/05/07(火) 18:27:21.77

Tensorflowは2.0でほとんど全書き換えをやってる。
そのため、2.0はそれ以前のものとはほとんど別物
（とキャシーは言ってる）
https://hackernoon.com/tensorflow-is-dead-long-live-tensorflow-49d3e975cf04

2019/05/07(火) 19:30:58.85

>>126
異常検知

2019/05/09(木) 21:01:19.64

Open AIの決算報告書が開示されたので貼っとく。
ポイントは、研究員の平均報酬は約50万ドルくらい。
ここの研究職のレベルは日本だと東大教授とか理化学研究所の上級研究職と同じくらい
なので一般技術者とは比較にはならないが、Redditの書き込みによるとOpen AIは非営利なので、
GoogleとかAppleとか営利は（Goodfellowレベルのトップ研究者には）もっと出してるはずとのこと。
他、全10名程の研究員が使用しているクラウド環境の使用料は年800万ドル
最初のStyleGAN(this person is not existの元ネタ)の論文が発表された際に、推奨動作環境は最低1024TPUv3が必要と示されていたが、
Open AIの環境は正に、最先端のAI研究には膨大なCPU/GPU資源（=資金力）が必要となっていることを示している。
https://regmedia.co.uk/2019/05/02/openai_tax_2017.pdf

2019/05/09(木) 21:10:41.73

openaiの人が年収5000万円でも許せるけど
理研が5000万円はどうかと思う
小保方みたいなチームリーダーのポジションでしょ？

2019/05/10(金) 01:09:02.07

アメリカは高学歴無職が社会問題化してるのも深刻だが。
極端すぎるんだよ

2019/05/10(金) 08:15:48.01

理研はそんな給料ないやろ
まあだから優秀な人間が流出するんだろうけど

2019/05/10(金) 10:14:09.67

理研も東大もそんなにもらってないよｗ

2019/05/10(金) 10:27:40.96

どこに突っ込めばいいのか、
アメリカは優秀なのにはいくらでも払ってくるだろう
理研も東大も雇用は保証されるが給料は国家公務員なみだろ
>小保方みたいなチームリーダーのポジションでしょ？
アホだろ

2019/05/10(金) 10:48:22.00

機械学習を通じて学んだ知識、ブームが終わっても腐る気がしないんだけど

2019/05/10(金) 12:16:23.21

データ突っ込むだけで簡単に結果が出てくるようなソフトが使いこなせるだけというスキルはあっという間に陳腐化するがその根底で動いている仕組みの知識は陳腐化しない

2019/05/10(金) 14:18:15.00

>>136　AI,機械学習は一過性のブームなんかじゃないよ。
ツールは色々変わっていくだろうけど考え方の基本はそれほど大きく変わらないと思う。

2019/05/10(金) 15:45:44.48

>>136
同じく
数学や確率統計の理解、CSの基礎は血肉になってる

2019/05/10(金) 18:00:10.77

カーネル主成分分析に関して質問です。

カーネル行列の固有ベクトルaの各成分って高次元への射影後のベクトルの、高次元の世界の主成分軸への射影を固有値で割った値になっていますが、固有値で割るのはどういう意味、効果があると解釈すればいいのでしょうか?

あるテキストだと固有ベクトルを固有値で割ってnormalizeするって書いてあるんですが、固有値は標準偏差の値では無く、分散の値ですよね?よく分かりません。

2019/05/10(金) 18:57:29.10

>>140
それ何語？

2019/05/10(金) 21:15:09.75

>>140
rand関数で生成された乱数は分散であるがその割合がガウス分布として出力されるようになっているのであれば
平均を0としてσの範囲内にあるかないかってことだ

2019/05/10(金) 21:41:00.52

2030年代の機械学習って
今よりも、どれくらい進歩していると思いますか？

2019/05/10(金) 22:46:21.02

量子コンピューターの開発に依存？ >>143

2019/05/11(土) 19:34:31.39

素人だけど
学習の高速化　シンボリックを含むこと
モジュール化
構造の自動生成
複雑な構造の解明と作成
こうした研究のその先にあるものでしょ？
やっぱりAGIかなー

2019/05/11(土) 20:48:02.27

>>143
オワコン

2019/05/11(土) 21:09:42.43

機械学習スタートアップシリーズって微妙なやつもあるよね

2019/05/11(土) 21:31:59.53

その勉強の先に何があるんだ、みたいなほんとうに触りだけの奴も多いな
最初から突き放してあげた方がある意味で良心的

**140** (ｱｳｱｳｳｰ Sad5-1vRR [106.147.172.23]) · 2019/05/12(日) 01:01:48.75

理解しました。
これは高次元の世界の主成分軸の単位ベクトルの大きさを1とする制約からくるものですね。
固有値で割らなかった場合は主成分軸ごとに単位ベクトルの大きさが異なるからグラフにしたときに升目の形が長方形になってしまう感じ。

2019/05/12(日) 02:12:12.70

画像認識で教師なし学習って可能ですか？
例えばネット上の色んな画像をランダムに学習させてあとから犬の画像を抽出できるようにするとか

2019/05/12(日) 02:52:35.06

教師無しと教師有りに本質的な区別はない

2019/05/12(日) 08:08:33.24

>>140
自分の理解だと
高次元空間における主成分軸への射影ではなく、高次元空間に射影した時点で
自動的に主成分分析っぽいことができていて、あとはスカラーを調整するだけだったような

2019/05/12(日) 08:09:57.05

https://tjo.hatenablog.com/entry/2019/05/10/190000

2019/05/12(日) 08:12:26.96

＞「このまま今の仕事を続けていった場合、一体自分はどこに向かっていくことになるんだろうか？」「10年後に果たして自分の仕事はあるんだろうか？」と不安に駆られるのも無理からぬことだと思います

2019/05/12(日) 08:29:46.27

長い

2019/05/12(日) 08:51:24.29

キャリアの先が不安だから
データサイエンティストではなくエンジニアの方になったわ
やること多くて反吐が出るけど

2019/05/12(日) 10:19:23.76

高度IT人材が数十万人不足！とか騒いでる側から、現職中堅からこんな声が上がってるとはね
AI、AI！はただの号令で実態はこんなもんなんだろうな
数年後には年間数万人規模の大学出AI人材輩出されるらしいが現場はどうするんやろ

2019/05/12(日) 11:25:59.32

結局システム作らないと行けないから、論文書くような人以外は、従来型人材が必要なんでないかしら

2019/05/12(日) 11:38:51.72

50代の偉いポジションの人なんかはメール使うのがやっとというレベルでありその人が考える高度人材だから実際はお前らが想像するほど高度ではない

2019/05/12(日) 12:21:56.49

松尾豊あたりが入れ知恵してるんだろう

2019/05/12(日) 12:37:03.79

svmで分類出来る程度なら勝手に皆成る気がする

2019/05/12(日) 16:34:03.36

>>149
理解しているのかしていないのか分からないけども
1. 高次元への写像
2. 主成分分析
という2段階のステップがあり、固有値、すなわち分散で割るのは主成分分析によるもの
次元削減で使う主成分分析も固有値で割るでしょ？

>>152
自動的にできるというのが言い方は微妙だけど
分類できるようにカーネル関数を選択するというのが正しい

2019/05/12(日) 16:38:55.57

>>150
分類はできるけどそれが犬であるかどうかは教師が必要

2019/05/12(日) 16:41:47.65

>>156
データサイエンティストって言っても多くは前処理要員だと思う
DataRobotにデータを食わせるためのエンジニアに近い
あるいは出てきた結果を偉い人にわかるようにWordやpowerpointに貼って説明する仕事

2019/05/12(日) 18:54:41.11

偉い人にデータサイエンスブームが来るだけでは？
他人にやらせるより自分でできた方が良いだろ
pl理解するノリでデータサイエンスが必須スキルになるのでは？

2019/05/12(日) 20:57:22.15

ほにゃらら人材が何万人不足ってのは
「安く使い倒せる人材」が不足って意味だからまともに受け取ると死ぬぞ。

2019/05/12(日) 21:05:53.21

画像で犬が認識できるようになるには何層辛い必要なんですか？

2019/05/12(日) 21:06:44.48

何層くらい

2019/05/12(日) 21:12:41.78

>>166
第五世代の頃もそう言われていて騙されたｗ

2019/05/12(日) 21:24:13.42

>>167
CNNを3つ、すなわち畳み込み層とプーリング層を3つずつで6層かませて、その出力を全結合でうけたら結局最低7層くらいじゃないかね？

2019/05/12(日) 21:35:29.92

>>156
まぁ部署がなくなったりするよりはいいだろうw

2019/05/12(日) 21:45:49.32

>>170
そんなもんで行けるんですね
思ったよりコスト低かったです
ありがとうございました

**140=149** (ﾌﾞｰｲﾓ MM33-1vRR [49.239.69.231]) · 2019/05/12(日) 21:48:32.58

>>162

しつこくてすみませんが、通常の主成分分析で固有値で割るっていうのが分からないです。
例えば3次元のテストデータ100個を主成分解析で2次元にする場合、

1. テストデータ(100X3)を標準化(平均0化＆標準偏差で割る)する
2. 共分散行列を求める(3X3)
3. 共分散行列の固有方程式を解く
4. 固有値が大きい順に対応する固有ベクトル2つを並べた行列(3X2)を作る(※固有ベクトルの大きさは1)
5. 標準化したテストデータ(100X3)と4.で計算した行列(3X2)の積を計算する

の手順だと思いますが、どこで固有値で割る計算をする必要がありますか？はじめに標準偏差で割るのと関係しています？

2019/05/12(日) 22:16:58.32

>>173
単なる次元削減だとその通りで固有値で割るプロセスはないよ
PCAの出力をさらに分類に用いているから固有値で割る意味がある

2019/05/12(日) 22:41:24.92

共分散行列の寄与度の話が横割で入ってるからややこしくなってる
きよど＝対象軸の固有値÷行列のトレース(固有値の総和)

2019/05/12(日) 22:46:24.16

固有値大きいものの軸を残すのだから
寄与度も見とけという話

2019/05/12(日) 22:49:17.14

>>175
今は寄与度の話ではなく正規化の話です

機械学習で分類をさせる場合に、最初の前処理として正規化します

PCAで座標系変換したので、新しい座標軸で正規化をしただけです

難しいことは言っていないですよ

2019/05/12(日) 22:50:54.86

>>140を呼んでなかったな
固有ベクトルを1に規格化してるだけじゃね？
変換行列をユニタリ行列にした方が扱い易くなるし

2019/05/12(日) 23:32:08.32

>>178
同じく質問を正しく理解してなかったかも
もしかしてこういう回答が欲しかったのかな

分散共分散行列 Σ
ある固有値λ=σ^2 固有ベクトルx

質問: 固有ベクトルの正規化はx/σではなくてx/σ^2はなぜですか？
回答: Σ=XX’で次元はσ^2だから。実際対角成分は分散が並ぶ。

**140=149** (ﾌﾞｰｲﾓ MM33-1vRR [49.239.71.108]) · 2019/05/13(月) 00:06:31.85

レス下さった方ありがとうございます。

2019/05/13(月) 01:04:21.95

>>150
ネコは可能だけど犬はどうかな

有名なヤツ
http://zellij.hatenablog.com/entry/20130608/p1

2019/05/13(月) 01:58:58.24

文科省が○○万人不足！って騒ぎ出したらたいてい作りすぎで失業者の海になる

2019/05/13(月) 02:06:03.05

余って値崩れするくらいがちょうど良いんだよ。
経団連的には。

2019/05/13(月) 02:18:59.07

役所の肝いり人材増やそうとした業界は地雷だから進路をとるのはオススメしないところになる

2019/05/13(月) 06:18:49.06

>>184
ホンコレ

2019/05/13(月) 07:40:01.60

AI人材の給料は新卒でも800万以上からスタートと聞いたけど違うの⁉

2019/05/13(月) 08:02:05.44

>>186
米国の話しね。
日本のサラリーマンは
まだ年功序列賃金が根強いので。

2019/05/13(月) 08:27:47.74

日本ではどんなスキル持ってても新卒は300～400万スタートで固定

2019/05/13(月) 09:07:05.39

>>188
パナだっけスキルがあれば1000万払いたいって記事みたけど。

2019/05/13(月) 09:36:36.91

給与に期待したければ素直に外資行く

NTTも高度人材には1500万以上出すとか言ってたけど、
内部調整が上手くいかずに形骸化
日本企業で現場が管理職より高給を貰うと内紛が起きる

2019/05/13(月) 09:48:09.30

ノーベル賞取る社員が出ても変わらんのな

2019/05/13(月) 15:24:45.95

コーディング(java or python,SQL,フレームワーク)
設計(デザインパターン,UML図)
数学(線形代数,微分積分,最適化数学)
統計学(大学一年レベル)
基本的なアルゴリズム(ロジスティック回帰,SVM,ランダムフォレスト,決定木,カーネル化)
DeepLearningの基礎(ニューラルネットワーク,RNN,CNN)

最低限、この程度のことをわかっていれば業界に入れる気がする
やってみれば簡単だし、すごい人材だとは思わないけど、どこにでも転がってるわけじゃないよなあ

2019/05/13(月) 15:30:30.94

>>192
業界に入れても金にならない

2019/05/13(月) 15:38:16.99

俺なら初期ステこのぐらいで20代前半だったら全力で育てるけどな

2019/05/13(月) 16:00:15.71

そのステでどういう仕事あるんだろ。雑用の予感しかしない。
若ければいいけど

2019/05/13(月) 16:03:46.52

>>194
お前を使うほうに就職してるよ

2019/05/13(月) 16:09:58.77

>>195
エンジニアにするしかないからPGからじゃない

2019/05/13(月) 16:11:56.88

>>195
web系（大手）かSIerに就職だろ

2019/05/13(月) 16:17:44.83

どっちかというと、業務用webアプリケーションを開発しているところの、
機械学習エンジニアの求人にひっかかりそう

2019/05/13(月) 16:20:05.85

ほぼワイのステだからね。ですよねーって感じだ。