人工知能ディープラーニング機械学習のための数学 [無断転載禁止]©2ch.net

レス数が900を超えています。1000を超えると表示できなくなるよ。
1デフォルトの名無しさん
垢版 |
2016/12/27(火) 12:09:04.01ID:MgmqZKtO
人工知能ディープラーニング機械学習のための数学
2018/10/24(水) 19:23:11.47ID:Tp5xd7NK
数学は万物を定量化して表すもの

数学に出来ないのはヒルベルトのように、解く方法が解らない問題と
世界の誰も未だに気づいていない問題
2018/10/24(水) 20:38:49.03ID:JHmeQiWz
NS方程式w
2018/10/25(木) 01:53:03.16ID:DXNVkP/m
そのうち人工知能の性能や危険性を監査する方法が必要になる
監査もAIにして相互に進化させる
人間のはるか上を行くAIになりそう
2018/10/25(木) 08:07:04.46ID:yGYVJ0zR
>>806
>監査もAIにして相互に進化させる
こういう自己学習はすべてのAIにて有効とは限らない、と思いますが
808デフォルトの名無しさん
垢版 |
2018/10/25(木) 11:25:06.41ID:5Cy/pQlU
単にラグランジュとか●次スプラインとかで全点通す多項式作るようにしてるんだろうけど
こういうのって機械学習でも同じパラメータが出現するのだろうか
https://pbs.twimg.com/media/Dp8U1ioVYAEsXf3.jpg
https://twitter.com/yori_shirou/status/1053611678292570113
https://twitter.com/yori_shirou/status/1053611678292570113/photo/1
(そういう学習させればそうなるんだろう)
https://twitter.com/5chan_nel (5ch newer account)
809デフォルトの名無しさん
垢版 |
2018/11/27(火) 10:18:08.02ID:Rh+mKowB
NNのパラメータが十分多ければSGDでも多項式時間で最適解に収束する事が証明されたな
https://arxiv.org/abs/1811.03962
810デフォルトの名無しさん
垢版 |
2018/11/30(金) 20:30:28.58ID:1rBmpsWQ
十分多ければwww
2018/11/30(金) 22:07:26.54ID:aXieu+F/
自然な仮定だろ?
812デフォルトの名無しさん
垢版 |
2018/12/01(土) 12:32:12.07ID:ddsFX+Ib
ε-δ論法での「十分小さければ」みたいによくある表現だよね
2018/12/01(土) 14:53:57.91ID:ESkZNxmJ
t分布で自由度が十分大きければ正規分布になるとか、割とあちこちで十分大きければ論法は使われる
「十分大きい」というのが現実的なサイズなら何の問題もないし非現実的なサイズなら机上の空論というだけのこと
814デフォルトの名無しさん
垢版 |
2018/12/01(土) 18:36:48.82ID:vZu4rQev
誤差曲面には極小値や鞍点が無数にあるにも関わらず、SGDで最適解に辿り着けてしまうのは自明では無い
経験的に知られていたが謎だった事が理論的に解明された事に価値がある
あと(指数ではなく)多項式時間と分かった事も大きいと思う
815デフォルトの名無しさん
垢版 |
2018/12/05(水) 18:35:39.05ID:kX9gokKe
こっちだったか
http://www.itmedia.co.jp/news/articles/1710/10/news040.html
816デフォルトの名無しさん
垢版 |
2018/12/12(水) 22:46:51.99ID:0lKVJ1Zp
初歩的なもので申し訳ありませんが
ゼロから作るDeep Learningの中の数式の変形で以下のような変形がありました。
どう変形したらこうなるのはわからないのですがどなたか教えていただけないでしょうか?

c exp(x) = exp(x + log c)
2018/12/12(水) 22:56:13.04ID:+Sf0mSLh
定義から追っていけばわかるだろ?

expてのはeを何回掛けたか
logはその逆

exp(log c) = cはcが特殊な値でない限り常になりたつ。

exp(a)exp(b)はeをa回掛けたものにさらにeをb回掛けることになる
これはexp(a+b)に等しい
818デフォルトの名無しさん
垢版 |
2018/12/12(水) 23:11:36.04ID:0lKVJ1Zp
>>817
ありがとうございます。
言われてみればなんで気づかなかったんだろってレベルでした。
819デフォルトの名無しさん
垢版 |
2018/12/12(水) 23:22:27.88ID:1Fc61En1
ln 左辺
 = ln (c * e^x)
 = ln c + ln e^x
 = ln c + x
ln 右辺
 = ln e^(x + ln c)
 = x + ln c

高校の算数で分かる
2018/12/13(木) 00:31:25.96ID:mMIcaeGH
>>816
c = exp(log (c))

まずこれを理解して

c・exp(x) = exp(x)・exp(log(c))
= exp(x + log(c))
2018/12/13(木) 09:30:18.60ID:MB2eDcb0
>>816
exp(x + log c)=exp(x)*exp(logc) 指数法則:exp(x+y)=exp(x)exp(y)
=exp(x)*c expとlogは互いに逆関数なので順番に作用させると元に戻る:x=exp(logx)
822デフォルトの名無しさん
垢版 |
2018/12/13(木) 12:19:59.72ID:zFPTCGev
c exp(x) = exp(x + log(c))
log(c exp(x)) = log(exp(x + log(c)))
log(c) + log(exp(x)) = log(exp(x + log(c)))
log(c) + x = x + log(c)
823デフォルトの名無しさん
垢版 |
2018/12/17(月) 22:36:41.36ID:hRfkLohO
ゼロから作るDeep Learningの中のAffineレイヤの部分で
行列の積 
X・W
をXで微分したものが
Wの転置行列
になっており、
X・W
をWで微分したものが
Xの転置になっていますがこの辺の説明がないためなぜそうなるのかわかりませんでした。
この辺は数学のどの部分をやれば理解できますでしょうか?いい参考書があれば教えてほしいです。

後同じAffineレイヤのバッチ対応版で、バイアス部分がすべてのバッチ分の加算になっていますが
これってどう解釈すればいいのでしょうか?
いまいちなぜすべてを加算するのか理解できませんでした。
824デフォルトの名無しさん
垢版 |
2018/12/18(火) 00:08:54.26ID:Eo+uoiII
線形代数
825デフォルトの名無しさん
垢版 |
2018/12/18(火) 11:30:12.35ID:/M0/bFGF
物理
826デフォルトの名無しさん
垢版 |
2018/12/18(火) 13:30:30.43ID:Y4LQpz29
魔法
2018/12/18(火) 13:50:22.43ID:DOEC5j1K
チート能力
2018/12/18(火) 14:11:41.15ID:lzU2ET1j
ggr能力
2018/12/18(火) 15:55:00.86ID:7JS3qwaJ
行列の積が分かれば微分するだけなのだがw
830デフォルトの名無しさん
垢版 |
2018/12/18(火) 15:56:23.56ID:fQ2wN9mx
テンソルやろ
2018/12/18(火) 17:38:07.86ID:Mqjic+u0
アホやろ
832デフォルトの名無しさん
垢版 |
2018/12/18(火) 17:39:32.22ID:owoWX2Rf
アホは読めないだろ
2018/12/18(火) 20:42:10.22ID:w60GoDWR
>>823
行列 (i,j) 成分が
\sum_k( x_{i,k}*w_{k,j} )
になってる事から一つ一つ計算しな。
834デフォルトの名無しさん
垢版 |
2018/12/19(水) 19:39:29.81ID:hcWIkGDA
DeepLearningを試しにやってみたいけど
Chainerあたりが手軽なの?

ちなみに文系の馬鹿です。
回帰分析とSVMを
Pythonで試したことあります。
2018/12/19(水) 22:00:08.49ID:EddF3XVK
そんだけやってればこのスレのほとんどの人より先に行ってるぞ
2018/12/20(木) 11:07:48.66ID:j9ekUJ01
ほんとだもう姿が見えないw
837デフォルトの名無しさん
垢版 |
2018/12/23(日) 20:43:59.69ID:AV3blzZs
ディープラーニングやろうとしたらこのくらいの性能のPCは必須?
http://masagutti.hatenablog.com/entry/new_pc
2018/12/24(月) 11:08:35.14ID:VHPkyyz+
>>837
マジレスするとクラウドのがコスパいい
睡眠も妨げない
839デフォルトの名無しさん
垢版 |
2018/12/24(月) 11:14:29.35ID:YXqLjtll
>>838
無料?
2018/12/24(月) 11:18:32.15ID:VHPkyyz+
>>839
無料がいいならGoogle Colaboratory行っとけ
速度はイマイチだがCPUだけよりはかなりマシ
2018/12/24(月) 11:18:38.69ID:vT24CsmW
PCだって無料じゃないんやで
2018/12/30(日) 18:20:09.19ID:BP599Ljk
アルファ碁ゼロってどっかで対戦できる?
843デフォルトの名無しさん
垢版 |
2018/12/30(日) 20:45:03.59ID:PVnIIL/g
>>838
どのクラウドがいいの?
2019/01/04(金) 00:56:54.65ID:WfC+XEH3
>>843
用途による
一般用途はAmazon、サクラ、google、Azure等

あとはサービス連携
ワトソンとか使いたいならIBM Bluemix
TPUで爆速機械学習とかならGoogle Cloud Platform

個人的な意見で申し訳ないが
使いやすいのはamazon aws
価格が安いのはGoogle、IBM
サクラは官公庁とかで従量課金NGとかでも相談に乗ってくれる
845デフォルトの名無しさん
垢版 |
2019/01/04(金) 11:37:58.62ID:7pi2aX1x
>>844
ありがとうございます。
取引先は機械学習するのにAzuzeにしたのですが
利用料金が予想以上に高いと言ってました。
いろいろ検討してみます。
2019/01/04(金) 11:49:22.59ID:vo1XafK4
値段はAwsでもそう変わらんちゃう
Googleはちょい安そう
2019/01/04(金) 17:09:49.70ID:ByJNYGiG
本業の問題解決にディープラーニングを利用するかディープラーニング自体を本業とするかでクラウド使うべきかは変わる
GPUぶん回すのは学習時ぐらいなので前者なら実際は学習以外の仕事が大半を占めるのでクラウドの方が安く、後者なら学習させまくるのだろうからハード買った方が安い
2019/01/04(金) 20:33:58.41ID:2CE/kmBd
>>847
何気に無視できないのはデータ量
訓練データや最終出力に大量のデータを保存する必要があるときはクラウドが高くつく
GPUのランニングコストはさほどでもない
2019/01/05(土) 20:59:49.07ID:DJKkY02/
さくらの高火力コンピューティングとかめちゃ高いよな。
あれ誰が使うんだろ?
850デフォルトの名無しさん
垢版 |
2019/01/06(日) 08:27:02.11ID:sqll98Te
>>848
大量のデータって数量的には何TB?
2019/01/06(日) 19:18:45.26ID:r6TnJvb+
>>845
利用料金、これからの課題やで

機械学習はこれからビジネスの世界になる
機械学習で精度はあがっても、その精度を出すためのコストが問題されるようになる
大半の用途ではコストがかさんで機械学習をする意味がない
(コストにはデータを集めるためのコストも含含まれる)

もう少ししたら、これが問題視されるようになる
2019/01/06(日) 19:56:09.20ID:/LWkk3mV
>>850
1TBのディスクはAmazon EBSの場合、帯域幅にもよるけど月当たり数千円から数万円。どのくらいを大容量というかは学習とのバランスによる。

GPUはEC2 P3でV100を使って一番安いオプションで24時間使い続けたとして月額25万くらい。実際にはこの1/3くらいだから月8万円としよう。

そうするとランニングコストのうち10%前後はストレージの容量に払うことになる。これを計算機コストに置き換えるとクラウドのストレージが如何に高いか分かる。

V100搭載の計算機は200万円くらい、かつ24時間回しっ放しだと電気代が月々数万円かかる。かりに1/3だとしても1〜2万円くらいだろうか。

※このクラスだと納期に最低2週間、必要なら電源工事、さらには固定資産税が掛かるが今は置いておこう。

大雑把な計算だと、GPU計算機の購入費用はクラウド換算では2.5年間くらいに相当する。2.5年もすると計算機の大幅な性能向上も見込まれるので、クラウドの有用性が分かるだろう。

一方1TBのSSDが2万円切る中、同じ容量のストレージをクラウド上で保持しようと思うと、1〜3ヶ月程度しか持たない。もちろんサービス用の高いストレージを使うのもありだが学習用途なのであまり意味がない。
2019/01/06(日) 19:56:29.21ID:huSbSCC8
だからGANsが流行ってるんだろ??
2019/01/06(日) 21:06:59.54ID:r6TnJvb+
>>852
コストは掛かるのはわかるが、それによって
なにが得られるかだよな

コストを掛けた以上の利益が得られなければやる意味がない

まあ今はまだ検証段階でそこまで考えられる所まで来てないんだろうけど
いいよな。結果が出なくても良い段階っていうのはw
855デフォルトの名無しさん
垢版 |
2019/01/06(日) 21:07:13.61ID:sqll98Te
>>852
ストレージは利用者に提供した分は必ず確保して使えるようにするから占有だけど
GPUは隙間時間を別の人が使ったりできる点は違うんじゃね
856デフォルトの名無しさん
垢版 |
2019/01/26(土) 14:56:07.98ID:yVAkGzul
不正統計ω
2019/01/26(土) 15:04:17.59ID:b14plJpJ
不正統計δ
858デフォルトの名無しさん
垢版 |
2019/01/27(日) 16:49:33.49ID:jpJeg/KH
仕事で国の統計データ使うこと多いのに
マジで勘弁して欲しいぞ
2019/01/27(日) 17:23:27.82ID:G3HzVCxI
計算し直せばいいだけだろ。他責なんだから
860デフォルトの名無しさん
垢版 |
2019/01/27(日) 17:55:29.03ID:jpJeg/KH
計算できるようにデータを
纏めるのが大変なんじゃ!
2019/01/27(日) 17:57:03.48ID:DIPYZuxb
この地域にはこういう属性の人が多いからこういう戦略で行こうとビジネスの意思決定に使ってた国のデータが嘘だった場合、
これからのことは正しいデータで計算し直せば済むが過去の莫大な機会損失も補償してくれなければ意味がない
2019/01/27(日) 18:26:06.36ID:G3HzVCxI
以後、気をつけるように
2019/01/27(日) 18:48:58.10ID:G3HzVCxI
国相手に損害賠償訴訟を起こす手もあるぞ
864デフォルトの名無しさん
垢版 |
2019/01/28(月) 01:34:18.93ID:/GIsMIPT
ディープラーニング×暗号通貨
http://masagutti.hatenablog.com/entry/bitcoin_raspberrypi
865デフォルトの名無しさん
垢版 |
2019/01/28(月) 12:43:29.94ID:ji//xT0N
ほんとにまともなAIなら
学習の結果として
不正な統計データが入力されたら
受け付けずに突っ返す動作にするのが理想だな
2019/01/28(月) 15:04:36.07ID:P7GqkI/F
>>865
それは不正統計を判定するために学習させた場合であって普通は誰もそんなもの作らないから
2019/01/28(月) 15:12:52.73ID:DqvraBYP
危機管理だろ、データが不正の場合当社は責任をもちませんと契約書に入れておくとか
2019/02/02(土) 19:33:24.61ID:LdV/hXf4
V100搭載の計算マシンが2〜3ドル/hてのがクラウドの相場
2019/02/18(月) 22:53:58.26ID:j1D9Boia
安そうに見えて結構高いよね実は?
24時間回したら俺は生活できないorz
870デフォルトの名無しさん
垢版 |
2019/02/20(水) 17:51:51.87ID:/eXmn/gb
クラウド企業は大儲け!

クラウド使う意味が分からん?
2019/02/21(木) 02:07:39.79ID:v648uLkH
ディープラーニングは最小二乗法」で物議
慶應義塾大学経済学部の小林慶一郎教授がAI技術について解説
https://www.itmedia.co.jp/news/articles/1902/20/news141.html

さすがにこれはあかん、引退推奨レベル
872デフォルトの名無しさん
垢版 |
2019/02/22(金) 13:14:44.17ID:PtH+29Wq
だれを相手に書いてるかが問題で

「日経の経済教室」

なら
あっそう
でおわり
873デフォルトの名無しさん
垢版 |
2019/02/22(金) 13:27:59.38ID:mJNXNf/+
でも出力と教師信号の差を小さくするっていう点では
最小二乗法と同じじゃね?

多層にする事でより精度よく
複雑な問題に対応可能になっているけど
もっとシンプルな構造で
同様の出力をできれば
学習の計算力も少なくて済む
874デフォルトの名無しさん
垢版 |
2019/02/22(金) 13:46:43.30ID:1tWgvkMd
別に、理解している人からすれば
どうでもいい話しだよね。
2019/02/22(金) 15:06:08.21ID:9D6v3kso
別に最小二乗法である必要性はないし教師と予測の差を測る何かしらがあればいいだけなので全く本質的ではない
876デフォルトの名無しさん
垢版 |
2019/02/22(金) 15:13:01.54ID:mJNXNf/+
>>875
短い言葉で判りやすく伝えるにはどういう表現がいい?
2019/02/22(金) 15:15:14.63ID:GY5Hgnhe
お前には無理
2019/02/22(金) 15:18:26.65ID:9C0ENtC1
深く考えてくれるAIなんです
だからディープなんです
な、なるほど!
2019/02/22(金) 16:49:59.36ID:27TGUzSj
ディープってのは単に中間層が複数あるということを言ってるだけだぞ
2019/02/22(金) 17:46:31.58ID:el9/87PC
>>873
ディープラーニングを一言で説明しろって言われて
A. 最小二乗法みたいなもの
B. ニューラルネットワークを沢山繋げたもの
のどっちの説明が適切かだな

実際はAの最適化の要素とBの深いネットワークの要素のどちらも重要だから、片方だけ説明すると片手落ちになって突っ込まれる
881デフォルトの名無しさん
垢版 |
2019/02/22(金) 17:54:08.28ID:PtH+29Wq
小学生に説明するときと猿に説明するときで説明の仕方変えるだろ
臨機応変に出来ない方が馬鹿
2019/02/22(金) 18:02:57.51ID:9C0ENtC1
猿に教えてるところを録音されて晒し者にされたのが今回の事案。
「猿が相手だったので猿向けに説明してたんです」とは相手もいる以上言えんわなw
2019/02/22(金) 18:18:14.42ID:GY5Hgnhe
「片手落ち」は使ってはいけない表現じゃなかったか?
884デフォルトの名無しさん
垢版 |
2019/02/22(金) 19:05:45.63ID:mJNXNf/+
>>880
ニューロンを沢山繋げたもの
って言われてそれで何ができるの?って思うけどな

炭素を沢山繋げたもの
って言われても価値があるものなのかわからない
炭なのかダイヤモンドなのか
885デフォルトの名無しさん
垢版 |
2019/02/22(金) 19:08:13.79ID:mJNXNf/+
>>884
結局は聞く側が何を知りたいのかによる
それによってどんな観点で説明するか変わる
2019/02/22(金) 19:09:07.81ID:DNXK9Hwq
あしたはJDLA/Eか
2019/02/22(金) 19:58:44.79ID:KXSRl5z4
ディープラーニングが何者か一言で説明しろと言われて一言で説明したらそれじゃ分からんと言われ、厳密に説明しようとしたらそんな難しい話理解できないと言われ
2019/02/22(金) 21:05:11.06ID:GY5Hgnhe
聞く馬鹿に答える馬鹿
2019/02/22(金) 21:07:54.35ID:iIlfqM05
これは辞任しかないww
890デフォルトの名無しさん
垢版 |
2019/02/23(土) 12:37:31.13ID:+DV3f+Dk
単純労働はもう人間がやる時代じゃなくなった
DLが判らない人は職を失います
DLが判る人は信用を失います
2019/02/23(土) 12:43:45.09ID:aRr2CtyI
データによって関数近似するだけですと答えりゃ良いんだよ。
deepが今までの機械学習と違うのは関数を表すパラメータが多いだけ。
(まあ多いからそれなりの学習法が必要になるってことではあるのだが。)
892デフォルトの名無しさん
垢版 |
2019/02/23(土) 12:47:45.21ID:+DV3f+Dk
確かに「関数って何?」ってレベルの相手に「最小二乗法」とか言っても伝わらんよな
2019/02/23(土) 13:05:49.57ID:9M6azXgX
そもそも最小二乗法知らないレベルの人がディープラーニングの意味を知ったところでその知識に使い道などない
2019/02/23(土) 14:02:48.73ID:YsidP2kG
>>891
パラメーターの多さは本質的じゃない
他のモデルでも増やすだけならいくらでも増やせるし
2019/02/23(土) 14:27:17.84ID:aRr2CtyI
>>894
本質か本質でないかはわからんといったところだろ。
例えば混合ガウス分布のパラメータをdeep learning並にしてSGDで学習みたいなことを
実験した結果とかみたことないし、どれくらい差が出るのかは誰にもわからん。
896デフォルトの名無しさん
垢版 |
2019/02/23(土) 16:02:59.35ID:lNz7SHfN
幅が効いてるのか深さが効いてるのか判らんぬ
2019/02/23(土) 16:11:49.78ID:lefeMdOl
入力データ入れたら、出力データを返す装置を作ってるだけ

それだけの話
2019/02/23(土) 16:13:33.97ID:lefeMdOl
AIとか言ってるからこじれてる
899デフォルトの名無しさん
垢版 |
2019/02/23(土) 16:19:13.67ID:44PmOqBU
>>883
そうやな
ちゃんと片端って言わないとな
2019/02/23(土) 16:19:56.88ID:lefeMdOl
AIという名称を使ったおかげで
大きな予算が降りやすくなった
901デフォルトの名無しさん
垢版 |
2019/02/23(土) 16:26:26.19ID:smDG7LGU
>>896
深さが効いている
NNの深さは表現力に対して指数的に効くが、幅は多項式的
だから「ディープ」ラーニングがここまで流行った
902デフォルトの名無しさん
垢版 |
2019/02/23(土) 16:29:50.37ID:lNz7SHfN
>>901
なるほど
まつおっさんはそこを説明し忘れたと
2019/02/23(土) 17:13:34.69ID:qQy3QKMA
わざわざ"ディープ"ラーニングだと言ってるのに今更「深さが重要だよ」程度の説明までしてやらなきゃならないのか
無知というのは本当に面倒だな
レス数が900を超えています。1000を超えると表示できなくなるよ。
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況