X



【統計分析】機械学習・データマイニング26
レス数が1000を超えています。これ以上書き込みはできません。
0001デフォルトの名無しさん (ワッチョイ efda-zBa2 [223.217.165.150])
垢版 |
2019/09/15(日) 09:23:06.34ID:bjsiNRs40

機械学習とデータマイニングについて語れ若人

*機械学習に意識・知能は存在しません。
人の意識に触れたい方はスレ違いです

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
Machine Learningを用いた論文一覧2018
https://shiropen.com/seamless/machine-learning/2018
2017年のディープラーニング論文100選
https://qiita.com/sakaiakira/items/f225b670bea6d851c7ea
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング23
https://mevius.5ch.net/test/read.cgi/tech/1551352040/
-
【統計分析】機械学習・データマイニング25
https://mevius.5ch.net/test/read.cgi/tech/1561568018/

【統計分析】機械学習・データマイニング24
https://mevius.5ch.net/test/read.cgi/tech/1556674785/
-
VIPQ2_EXTDAT: checked:vvvvvv:1000:512:----: EXT was configured
VIPQ2_EXTDAT: checked:vvvvvv:1000:512:: EXT was configured
0002デフォルトの名無しさん (ワッチョイ bd7c-+dKN [122.215.159.99])
垢版 |
2019/09/15(日) 09:59:37.11ID:tu3q64lr0
O2
0006デフォルトの名無しさん (ワッチョイ 2388-9GzD [131.147.201.232])
垢版 |
2019/09/25(水) 08:15:33.35ID:CV7fPBbD0
>>5 最近機械学習始めたバカだけど、ベイズ統計のほうが圧倒的に役立つ気がする。
0007デフォルトの名無しさん (ワントンキン MMe3-ubMc [153.236.16.185])
垢版 |
2019/09/25(水) 08:37:12.96ID:1+OtauDZM
須山がすっきりわかる本を出せばいいのに出さないのが悪い
0008デフォルトの名無しさん (オッペケ Sr99-8lXu [126.200.118.202])
垢版 |
2019/09/25(水) 09:16:10.18ID:78OcKefnr
>>5
最尤推定はベイズなの?
0009デフォルトの名無しさん (アウアウクー MM19-BK4p [36.11.224.221])
垢版 |
2019/09/25(水) 09:54:14.76ID:MmbVy9zrM
前処理→頻度統計(ここでの意味は、一昔前の統計学)
機械学習の理論→ベイズ統計

前処理がうまくなると、精度が上がるだけでなく、モデルの安定性が格段に増す
理論が分かると、個別の問題設定に対応した黒魔術が出来るようになる

結論、どっちも大切
0013デフォルトの名無しさん (ワントンキン MMe3-ubMc [153.236.16.185])
垢版 |
2019/09/25(水) 14:09:59.84ID:1+OtauDZM
みんなはどうやって環境構築してるの
anacondaを使ってやるのがセオリー?
0016デフォルトの名無しさん (ワントンキン MMe3-ubMc [153.236.16.185])
垢版 |
2019/09/25(水) 18:40:09.58ID:1+OtauDZM
環境構築は今アホみたいに簡単になってるのね
参入障壁下がったなー
0019デフォルトの名無しさん (アウアウエー Sa13-9GzD [111.239.39.77])
垢版 |
2019/09/25(水) 21:30:03.73ID:P5XKQ29wa
うbyにもcondaがあればな
gemじゃだめだ
0023デフォルトの名無しさん (ワッチョイ 9b66-vFU9 [183.77.218.93])
垢版 |
2019/09/26(木) 07:08:44.02ID:GjmPRA6D0
>>pipかコンテナ

コンテナっていうのはanacondaとかvirtualenvのこと?
0024デフォルトの名無しさん (トンモー MMf9-tbXw [210.142.95.204])
垢版 |
2019/09/26(木) 08:47:24.45ID:/HqP+5MIM
簡単だから
ついアナコンダ使って
インスコしてしまうw
0025デフォルトの名無しさん (ワントンキン MMa3-MfK0 [153.236.16.185])
垢版 |
2019/09/26(木) 09:10:37.91ID:qqF5D8YZM
重いコンダラ
0027デフォルトの名無しさん (ワントンキン MMa3-MfK0 [153.236.16.185])
垢版 |
2019/09/26(木) 17:08:15.06ID:qqF5D8YZM
dockerかーそっかー
0029デフォルトの名無しさん (ワッチョイ 9b66-MfK0 [183.77.218.93])
垢版 |
2019/09/26(木) 21:15:34.59ID:GjmPRA6D0
mklのインストールもすんなり行くけどね
0031デフォルトの名無しさん (ササクッテロ Sp81-kDWV [126.35.130.245])
垢版 |
2019/09/27(金) 00:37:37.36ID:Rn9jKya4p
機械学習だけか分からんけど、英語論文に出てくるmotivationってどういう意味なの?直訳動機付けなんだけど…
0032デフォルトの名無しさん (ワッチョイ 8d90-srNF [112.139.91.58])
垢版 |
2019/09/27(金) 05:01:55.83ID:WHTSWUXA0
機械学習に見切り付けるよ。サヨウナラ
客の懐事情が悪い。
0034デフォルトの名無しさん (ワッチョイ 0552-MfK0 [118.243.197.18])
垢版 |
2019/09/27(金) 08:02:21.46ID:FC76HeOJ0
へー
0036デフォルトの名無しさん (トンモー MMf9-tbXw [210.142.95.17])
垢版 |
2019/09/27(金) 09:00:45.67ID:vVIjh5fvM
画像処理は世界共通だからね。
ベトナムの企業に依頼すると
日本の10分の1で済んでしまう
0037デフォルトの名無しさん (ワントンキン MMa3-MfK0 [153.236.16.185])
垢版 |
2019/09/27(金) 14:41:02.85ID:wZU7EPf1M
dockerを使ったら
pipでもanacondaでもどちらでもよくね?
0038デフォルトの名無しさん (ワッチョイ 2b7c-wGQq [113.32.86.138])
垢版 |
2019/09/27(金) 16:07:12.55ID:bGFj4S5H0
ちょっと酷いよね
https://toolmania.info/post-9815/
0039デフォルトの名無しさん (アウアウクー MM01-8aXa [36.11.224.38])
垢版 |
2019/09/27(金) 16:24:04.32ID:2DQWdxIUM
画像処理は仕事がまだあるけど、需要と供給が拮抗しはじめて以前ほどボロくない
あとカメラ業界が儲からなくなって、若く優秀なエンジニアが画像処理に転職してくてるから、
全体のレベルは跳ね上がって別の意味でも辛い
0040デフォルトの名無しさん (ワントンキン MMa3-MfK0 [153.236.16.185])
垢版 |
2019/09/27(金) 17:04:54.88ID:wZU7EPf1M
cudnnて何でCUDA toolkitと一緒に入れてくれないんだろう
あと、なんて読むのだろう
クゥドゥン?
0042デフォルトの名無しさん (ワッチョイ 8d90-srNF [112.139.91.58])
垢版 |
2019/09/27(金) 23:53:42.50ID:WHTSWUXA0
>あとカメラ業界が儲からなくなって、若く優秀なエンジニアが画像処理に転職してくてるから、
カメラメーカーからソフト屋に転職してきてるのか・・・最悪だな
0044デフォルトの名無しさん (ワッチョイ 8d90-srNF [112.139.91.58])
垢版 |
2019/09/28(土) 01:39:26.59ID:ec95vgaT0
カメラのメーカーにもプログラマーはいる
0045デフォルトの名無しさん (ワッチョイ 233d-8aXa [219.104.75.160])
垢版 |
2019/09/28(土) 06:53:25.01ID:ubKeWw8E0
カメラメーカーでCのコードを叩いてるエンジニアは、能力的には上の上でも給料的には並だったりするんだよね

BtBの画像処理は光学やカメラに対する知識の方が画像処理より重要だったりするんだけど、
奴らはそれを理解しているから機械学習を勉強して転職してくる
生粋のソフト屋より有能
0046デフォルトの名無しさん (ワッチョイ 9b66-MfK0 [183.77.217.122])
垢版 |
2019/09/28(土) 06:58:42.45ID:gG4VWWHP0
妄想じゃん
0047デフォルトの名無しさん (ワッチョイ 233d-8aXa [219.104.75.160])
垢版 |
2019/09/28(土) 06:59:47.47ID:ubKeWw8E0
プログラマーがカメラメーカーに就職してメカトロ勉強するのマジ辛いけど
向こうからこっちくるの超簡単じゃん。それでお給料がボンッ、ボンッと増えるんだから
侵略しにくるでしょ。俺達では太刀打ちできない
0049デフォルトの名無しさん (ワッチョイ 8d90-srNF [112.139.91.58])
垢版 |
2019/09/28(土) 07:01:35.44ID:ec95vgaT0
噂じゃねえか
0051デフォルトの名無しさん (アウアウウー Sa69-3AID [106.161.125.54])
垢版 |
2019/09/28(土) 12:29:51.89ID:VkgXlNvUa
>>35
人間こき使ってコスパで負けるようになって機械学習を使う。
0052デフォルトの名無しさん (ワッチョイ 234b-srNF [61.116.12.29])
垢版 |
2019/09/28(土) 17:00:38.83ID:ATQt8OTo0
>>35
派遣社員っていう会社にとって都合のいい社員も存在するしな
誰があんなものを作ったのか中国やアメリカの派遣社員より相当緩い仕組みになっているし
漫画家とか技術者もそうだが中間で採取されて制作している人にはお金が行かないようになっている
全体的に上に行っても負担が増すぶん給料は上がらないんで上昇志向はどの国よりも低く
今の若い奴等は年金が支払われる前に痴呆症になってるんじゃないかっていうぐらいまで働かないといけないっていう
0055デフォルトの名無しさん (トンモー MMf9-tbXw [210.142.95.147])
垢版 |
2019/09/28(土) 17:46:59.71ID:uMRmbRaFM
そうそう
儲けたほうが勝ち!
楽しんだほうが勝ち!
0061デフォルトの名無しさん (ワッチョイ 9b66-MfK0 [183.77.217.122])
垢版 |
2019/09/28(土) 19:50:07.20ID:gG4VWWHP0
卑怯な手で勝つ奴がいるからだろ
0063デフォルトの名無しさん (アウアウウー Sa69-SUCl [106.154.130.195])
垢版 |
2019/09/28(土) 20:57:19.58ID:y9sf8/a7a
自分が考え付かなかった=卑怯
0067デフォルトの名無しさん (ワッチョイ e34b-srNF [211.131.39.123])
垢版 |
2019/09/28(土) 23:13:39.09ID:DqaXwl5j0
採取する側に立ったとして人生の貴重な時間を若い頃から費やしている訳で
お金で幸せは買えないが、時間で幸せは買えるとか
時間を重視する派の方が金を重視する派より仕事の満足度も幸福度も高いとかっていう
統計的結果が出ている中、仕事に没頭してガッツリ税金を納めている訳だから
それはそれで代価を支払っている訳で
何もかも手にしている訳では無いわけだけど
0069デフォルトの名無しさん (ワッチョイ e34b-srNF [211.131.39.123])
垢版 |
2019/09/28(土) 23:38:21.63ID:DqaXwl5j0
>>68
そう思っている分野って意外に年取った奴も多く居たりしてないか?
若い奴しか居ない分野より本当に大変なのか?っていう
0072デフォルトの名無しさん (アウアウウー Sa69-3AID [106.161.118.233])
垢版 |
2019/09/29(日) 01:11:21.55ID:rU7Oj6HSa
RPAで事務職がほとんど減ってないじゃないか?
0073デフォルトの名無しさん (ワッチョイ 8d90-srNF [112.139.91.58])
垢版 |
2019/09/29(日) 02:45:48.79ID:eYrcqGBM0
rpa以前から事務職なんてほぼ消えている
0074デフォルトの名無しさん (アウアウウー Sa69-3AID [106.161.118.142])
垢版 |
2019/09/29(日) 08:06:29.75ID:r79SZfxpa
>>73
公務員。
0077デフォルトの名無しさん (トンモー MMf9-tbXw [210.142.95.147])
垢版 |
2019/09/29(日) 10:32:16.40ID:T3oTPEq3M
>>70
AWSやGCPって便利だけど
使ってみたら料金の高さに唖然・呆然!
直ぐに解約した。

あの金額をプログラマに払えば
かなりプログラマは裕福になると思う。

社内にサーバー設置して
AWS風のクラウドを構成
すればいいだけ。
簡単だよ。
0082デフォルトの名無しさん (ワッチョイ e34b-srNF [211.131.0.45])
垢版 |
2019/09/29(日) 13:23:03.81ID:NshXf8dJ0
海外でも変わった国として見られているからね

「日本は暴力・薬物事件も少なく殺人件数も低く就業率も高いがいまだに貧困率が高い」と海外で報じられる
https://gigazine.net/news/20190731-japan-poverty/
0084デフォルトの名無しさん (トンモー MMf9-tbXw [210.142.95.193])
垢版 |
2019/09/29(日) 13:37:18.52ID:PCo7gGCmM
>>81
大型サーバーってなに?
何も知らん技術ないやつらが
AWSスゲーとか
いってんのは分かった
0085デフォルトの名無しさん (トンモー MMf9-tbXw [210.142.95.193])
垢版 |
2019/09/29(日) 13:42:52.93ID:PCo7gGCmM
>>81
電源とかPCとかググってみろと
いっても理解できんだろ?
ま、50万くれたら
都内なら1日だけ時間作って
基本を教えにいってやりたい!

しかし今はアルバイトできないのよ
今の契約終わったら教えにいつてやる。
スパルタ教育だで。
殴ったりしないが馬鹿には容赦しない
罵声浴びせるから精神鍛えておけ!
0087デフォルトの名無しさん (スププ Sd43-gkNv [49.96.35.221])
垢版 |
2019/09/29(日) 14:32:31.08ID:XhdeSoMmd
全くの初心者が初めてディープラーニングを学ぶのに
お勧めの書籍を教えて下さい。
『ゼロから作るディープラーニング』でしょうか?
0088デフォルトの名無しさん (アウアウウー Sa69-3AID [106.161.124.204])
垢版 |
2019/09/29(日) 16:02:35.79ID:jzbsOTsxa
>>76
じゃ今まで社内失業者を飼っていただけの話だったのか?
富士通だけでなくNTT・NEC・東芝と併せて7万。
3メガバンで3万。3メガバンは10万やれるんだが金融庁がストップをかけたとか?
メガバンより酷いのが地銀以下、地銀以下の合併をやってリストラをやらんといかんのだが、
地銀以下の主導権争いによって全然進まない上に、せっかく当事者と金融庁まではまとまったのに公取委が独占禁止法を盾に待ったをかけたとか言う事例まで。
0091デフォルトの名無しさん (アウアウクー MM01-8aXa [36.11.225.16])
垢版 |
2019/09/29(日) 16:24:05.36ID:x0FBieicM
データサイエンス系の機械学習エンジニアの要求スペックが高止まりして、
この業界に必要なスキルがだいたい明らかになったな

物凄く要約すると、
機械学習+自然言語処理or画像処理+クラウドアプリケーション開発
これをひとりでこなせる奴が、アメリカにはゴロゴロいる

日本はまだちょっとぬるいからスキル上げるなら今のうちだわ
0093デフォルトの名無しさん (スププ Sd43-gkNv [49.96.35.221])
垢版 |
2019/09/29(日) 16:32:37.60ID:XhdeSoMmd
>>90
ありがとうございます。
ちなみに以下のサイトとどちらがお勧めですか?
どちらが良いか迷っています。
よろしくお願いします。

https://tutorials.chainer.org/ja/tutorial.html
0095デフォルトの名無しさん (ワッチョイ 8302-X8w6 [101.142.8.160])
垢版 |
2019/09/29(日) 16:50:14.91ID:t4KppL3o0
>>91
機械学習+アプリケーション開発
AIをシステムとして展開する為には、このセットが重要だけど、後者は未だに軽視

分析は出来るけどシステム設計できない新卒を青田刈りするより
現役のSEに機械学習覚えさせたほうが使い勝手が良い
0096デフォルトの名無しさん (ワッチョイ 9b66-MfK0 [183.77.217.122])
垢版 |
2019/09/29(日) 19:20:29.17ID:zYOYSMRY0
は?
何が言いたいの?
0097デフォルトの名無しさん (ワッチョイ 8597-i9+B [182.171.246.142])
垢版 |
2019/09/29(日) 20:58:32.01ID:nT1w560I0
>>95
SI屋のSEがアプリケーション開発を重視してるとは思えないけどなぁ。
人海戦術でなんとか動くものをギリギリ作ってるだけでは重視と言えないだろ。
0102デフォルトの名無しさん (ワッチョイ e5ad-tbXw [124.144.197.178])
垢版 |
2019/09/30(月) 01:24:18.06ID:IzG9ESU60
>>101
いいかげんなこと書くなよFラン
0104デフォルトの名無しさん (アウアウウー Sa69-3AID [106.161.128.41])
垢版 |
2019/09/30(月) 08:53:58.05ID:MFpp3sz0a
>>103
金にならないプログラマーってことですね。
0105デフォルトの名無しさん (アウアウクー MM01-8aXa [36.11.225.16])
垢版 |
2019/09/30(月) 09:31:29.28ID:8e9MDvd5M
bigqueryでデータ管理して、pythonで分析、ダッシュボードで可視化
という最小単位のシステムなら、ひとりで組めるしそういう知識もいらないけどね

スマホ連携やら組み込みやらでやることが増えると、
クラウドの外側で昔ながらのスキルが要求されるようになっていく
0106デフォルトの名無しさん (アウアウクー MM01-8aXa [36.11.225.16])
垢版 |
2019/09/30(月) 10:52:05.24ID:8e9MDvd5M
ローカルなシステム開発も中途半端なところは
技術をプログラミングの民主化や、フレームワークの進歩に吸収されていくから、
組み込みでシステム開発をやってるような、振り切ってるところ以外は
生き残れる確率が低いと思う
0108デフォルトの名無しさん (ワッチョイ 2b7c-wGQq [113.32.86.138])
垢版 |
2019/09/30(月) 13:56:04.38ID:FnsAlH7P0
>>80

2013年度 NHK会長、副会長、経営委員長等の給料(年)

NHK会長 3800万円/手当込
副会長   3370万円/手当込
常務理事  3020万円/手当込
理事     2856万円/手当込
経営委員長(常勤)3792万円/手当込
NHK社員  1780万円/手当込


※総理大臣、国会議員の給料
総理大臣 2727万円
国会議員 1842万円

【予算規模の比較】
海上保安庁 2177億5345万7000円
警察庁 3420億8472万9000円
環境省 3459億4527万4000円
NHK 7547億7700万円
0110デフォルトの名無しさん (ワントンキン MMa3-MfK0 [153.148.100.146])
垢版 |
2019/09/30(月) 15:17:21.06ID:RcGMqML5M
blocksはオワコンかしら?
0111デフォルトの名無しさん (ワッチョイ 3501-srNF [126.25.130.254])
垢版 |
2019/09/30(月) 20:55:03.50ID:m19D9tLr0
プロト書かせても汚過ぎたらリファクタリングはできんし、
リファクタリングする方もある程度の理屈はわかってないとできん。
tensorflow なんかとくにモジュールがぐっちゃになってて、
結局両方わかるやつがいないとどうにもならんということになる。
0113デフォルトの名無しさん (ワッチョイ 8d90-srNF [112.139.91.58])
垢版 |
2019/10/01(火) 01:45:26.93ID:iqt4HZRA0
>AIで初のカラー化 
何年も前にモノクロ映画のカラー化ってやったじゃん
別にって感じだよ
0114デフォルトの名無しさん (ワッチョイ 9d2c-pgcN [114.161.70.250])
垢版 |
2019/10/01(火) 03:55:33.18ID:yPgD2oOI0
全くの知識ゼロは何から勉強すればいいの
0115デフォルトの名無しさん (トンモー MMf9-tbXw [210.142.95.214])
垢版 |
2019/10/01(火) 08:47:56.00ID:+UPFCPY9M
マジレスするとExcelの使い方から。
データ整理でよく使うんだよ。
0116デフォルトの名無しさん (ワンミングク MMa3-WiWq [153.234.115.46])
垢版 |
2019/10/01(火) 11:08:22.62ID:gKinUVIwM
クレクレ君かよ
0117デフォルトの名無しさん (スププ Sd43-gkNv [49.96.35.221])
垢版 |
2019/10/01(火) 12:40:44.98ID:yogeS95od
>>113
伊勢湾台風の映像が初のカラー化ってことでしょ。
0118デフォルトの名無しさん (スププ Sd43-gkNv [49.96.35.221])
垢版 |
2019/10/01(火) 12:41:12.18ID:yogeS95od
>>114
ゼロから作るディープラーニング
0120デフォルトの名無しさん (スププ Sd43-gkNv [49.96.35.221])
垢版 |
2019/10/02(水) 10:11:48.00ID:hWitUTMNd
>>119
そんな書籍あるの?
0124デフォルトの名無しさん (ワッチョイ 917c-MsYi [122.215.159.99])
垢版 |
2019/10/05(土) 10:12:00.74ID:g+cVNt8G0
画像を入力してキャッサバとマンジョカの違いを見分けられるかな
0126デフォルトの名無しさん (ワッチョイ 7b66-y1nD [183.77.216.215])
垢版 |
2019/10/06(日) 14:04:07.98ID:3Bwj9Rk40
猫の種類を識別できてるからねえ
0129デフォルトの名無しさん (エムゾネ FF33-WcZE [49.106.192.108])
垢版 |
2019/10/06(日) 17:14:50.01ID:pvG0vkV+F
片栗粉白玉粉8:2のとマンジョカとキャッサバとタピオカを全部一緒だと判定するかな
0137デフォルトの名無しさん (トンモー MM8d-2TCp [210.142.95.118])
垢版 |
2019/10/07(月) 12:51:32.67ID:wQEZJZvJM
でも美人とブスは判別できないだろ?
教えてやらないと。
俺は教わらなくても、立つほうが美人だとわかるからな。
AIは、立つ部分がないから
0139デフォルトの名無しさん (エムゾネ FF33-PqvS [49.106.193.23])
垢版 |
2019/10/07(月) 13:39:13.16ID:nnDn0jE7F
色盲とか弱視のひとは
色を見分けられないんじゃなくて
特定の色には激しく反応出来るので
普通の人では観えないものが観えたりする
0144デフォルトの名無しさん (ワンミングク MMd3-y1nD [153.234.115.46])
垢版 |
2019/10/07(月) 18:59:23.04ID:fNQWuTFbM
シンメトリー具合が客観的かと思われるけど
美醜は基準が変わるだろ
0150デフォルトの名無しさん (アウアウウー Sa9d-mxGY [106.154.130.99])
垢版 |
2019/10/07(月) 22:27:15.98ID:XIT3E9Qaa
>>147
データの次元が増える程、外殻部の密度が高くなり中心部は疎になる
次元の呪いの現れ
0153デフォルトの名無しさん (ワッチョイ 99ad-2TCp [124.144.197.178])
垢版 |
2019/10/08(火) 01:24:12.36ID:yvLQ2KO90
だからさ、立つ写真と縮んでしまう写真を
集めて学習させるのさ。
0154デフォルトの名無しさん (ワンミングク MMd3-y1nD [153.234.115.46])
垢版 |
2019/10/08(火) 13:08:31.09ID:pQwzHIwwM
ヒューズの現象と次元の呪いって違うの?
0156デフォルトの名無しさん (オッペケ Src5-mxGY [126.255.135.228])
垢版 |
2019/10/08(火) 17:22:33.79ID:73qw8B0jr
>>155
何の、何に対するエントロピー?
0158デフォルトの名無しさん (ワッチョイ 93f1-y1nD [157.107.8.150])
垢版 |
2019/10/09(水) 04:18:18.15ID:+iZUlLJa0
そりゃーブサが平均に寄れば綺麗に見えるわ
0159デフォルトの名無しさん (ワッチョイ 9359-o6K/ [157.14.225.51])
垢版 |
2019/10/09(水) 12:43:17.12ID:DoX5+3oi0
機械学習やるなら、Cかjavaかpythonだよなあ

データサイエンティストおよびクラウド系のデータエンジニアならpython
大規模開発およびローカル系のデータエンジニアならjava
ローカル系および組み込みならC

javaの領域は今後すこしずつ縮小していく見通しだから、
新規で入るならpythonかCがオススメ
0163デフォルトの名無しさん (トンモー MM8d-2TCp [210.142.95.200])
垢版 |
2019/10/09(水) 19:06:25.13ID:/Xo+Y8M3M
統計学の勉強を本気で始めたら
恐ろしく難しいということがわかってきた
どうしたらいい?
0166デフォルトの名無しさん (ワンミングク MMd3-y1nD [153.234.115.46])
垢版 |
2019/10/09(水) 19:19:32.23ID:4X2jyJQLM
古典統計学とベイズ統計学をちゃんと学びたい
0171デフォルトの名無しさん (ワッチョイ 93f1-y1nD [157.107.8.150])
垢版 |
2019/10/09(水) 22:40:50.59ID:+iZUlLJa0
わかんない
0178デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.200])
垢版 |
2019/10/10(木) 02:31:31.78ID:eF+ihzDEM
グレブナー基底は重要だな
0179デフォルトの名無しさん (アウアウクー MMe1-o74w [36.11.224.230])
垢版 |
2019/10/10(木) 06:52:08.55ID:H/x/U9NKM
>>160
勉強のためにスクラッチで書くならpythonがオススメ。ネットに情報が多いから
仕事のためならC一択
0180デフォルトの名無しさん (アウアウクー MMe1-o74w [36.11.224.230])
垢版 |
2019/10/10(木) 06:53:03.85ID:H/x/U9NKM
>>169
何故そこでcolabが出さない
0181デフォルトの名無しさん (アウアウカー Sa51-CdT3 [182.251.153.117])
垢版 |
2019/10/10(木) 10:19:46.41ID:xGOoNgUAa
統計学を理解できていないのに理解したと思い込んだ人はこういう頓珍漢なことを平気で言い出す

@Inetgate:
@usukutilife @u874072e 一般的な統計処理において、標本数が30を超える場合には正規分布を仮定できますが、
えん さんが調べた結果だと全然正規分布になってないので、食べログの数値操作疑惑、真っ黒じゃねーかと。

https://twitter.com/Inetgate/status/1181488204068749312
https://twitter.com/5chan_nel (5ch newer account)
0186デフォルトの名無しさん (ワイーワ2 FF93-1wBF [103.5.142.122])
垢版 |
2019/10/10(木) 18:50:01.66ID:i+8+28k+F
前走の結果より血統でやった方が良いって先輩は言ってた
0190デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/11(金) 08:18:38.76ID:mCGV3tUv0
>>184
中心極限定理の話しで
標本数を30にした平均値の分布は
元の分布に関係なく正規分布とみなせるって事だよな

食べログの分布もその分布から標本を30取り出して
平均値を求める操作を10000回繰り返して
平均値の分布を描くと正規分布に近くなるはず
0191デフォルトの名無しさん (ワッチョイ 0da5-X53N [42.127.86.111])
垢版 |
2019/10/11(金) 11:53:47.65ID:BrwAZKhG0
>>186
血統も絡めてるよていだけど、前走も大事かなと思いまして。

>>187
前走ではAの馬に負けてるから今回も厳しそう、とかの特徴を抽出したいなと思いまして、順序はそれなりに大事なのかなと考えています。

>>189
巷にあるコードよりも、より順序を重視する方法が無いものかなと。

数値やカテゴリーなどの特徴ではなく、多次元特徴を一つの特徴量として扱うことができないかなという感じです。
0192デフォルトの名無しさん (ワイーワ2 FF93-1wBF [103.5.142.233])
垢版 |
2019/10/11(金) 11:58:01.09ID:hkXt1GtmF
重量ハンデは?
0193デフォルトの名無しさん (アウアウクー MMe1-o74w [36.11.225.81])
垢版 |
2019/10/11(金) 14:41:23.78ID:uWNk0GcMM
アルバイトでデータ解析やってる人間の意見としては、
とにかく役立ちそうな特徴量を選択せずにぶち込めるだけぶち込んで、
一度xgbかcgbを回してみればいいんじゃない
そうすれば重要な特徴量が何か抽出できるでしょ
話はそれからよ

勝ち馬をよく当てる人が何を大切にしているか調べることからはじめるべき
0195デフォルトの名無しさん (ワッチョイ 653c-b92j [118.240.95.156])
垢版 |
2019/10/13(日) 00:20:47.58ID:kaSZg9r20
>>184
すでに指摘されているが、母集団の分布は正規分布である必要はない

>>190
中心極限定理の話(前半の話)はそうだけども、後半の部分は何が言いたいのかよく分からない

食べログの評点は一人当たり整数値の1~5を付けられる(ある店舗における点数分布をAとする)
各店舗は添付ごとにN人の評価の平均を平均点として算出する(各店舗の平均点分布をBとし、これが話題となっている分布)

Aの採点を行うのが一般人であると仮定すると、各店舗は同一の母集団確率分布に従うものと仮定でき、各店舗の確率変数X1, X2, …, XNは同一の母集団確率分布からのランダムサンプルと考えられる
大数の法則により、標本平均(分布Bのこと)は母集団の平均に近づき正規分布になる

標本数30以上というのはNが30以上ということで、この部分は残念ながら自明ではない
ある焼肉屋の評価は67件から構成されているが、別の焼肉屋は2件となっている

つまり最大限「食べログ」を擁護するのであれば、標本数が30以上ではないため前提条件が間違っている、ということだろうか
0198デフォルトの名無しさん (アウアウウー Sac9-KA+R [106.161.128.168])
垢版 |
2019/10/13(日) 06:54:46.01ID:ObLeezZqa
>>159
Juliaでしょう。
0199デフォルトの名無しさん (アウアウウー Sac9-KA+R [106.161.128.168])
垢版 |
2019/10/13(日) 06:56:55.49ID:ObLeezZqa
>>160
Flux
0200デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/13(日) 07:21:13.99ID:Fxu1r5BT0
>>195
大数の法則は標本数を増やすと標本平均が母平均に近づくということ

中心極限定理は平均値の分布に関する定理
食べログの評価の数が30になった時点で平均値を計算して
一度リセットするのを繰り返す
その平均値の分布は正規分布に近づく

今の評価の分布がその店に行く人の評価の分布を表している
のであれば今の評価分布から30標本を取って平均値を求める
操作を復元抽出で繰り返しても同じような結果になるだろう
0201デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/13(日) 07:23:54.12ID:Fxu1r5BT0
ある店の評価分布は標本数が多くなっても正規分布になるとは言えない
分散が広くなるのはその店のサービスや品質が安定していない事が原因になりうる
その店の特徴が分布に反映される

同様に店を評価する側の特徴も反映されるだろう
0202デフォルトの名無しさん (ブーイモ MM89-ToAo [202.214.125.165])
垢版 |
2019/10/13(日) 07:58:04.98ID:S6cUkNQoM
深層学習の凄いことのひとつは特徴量を人が設計する必要がない、と本とかに書いてありますが、どう理解すればいいのか分からず教えてください!

ここでいう深層学習とはニューラルネットのことですか?(線形回帰やSVMと違って説明変数を人間が決めてないから? )
0204デフォルトの名無しさん (ワッチョイ 653c-3Hkb [118.240.95.156])
垢版 |
2019/10/13(日) 08:55:43.76ID:kaSZg9r20
>>201
言ってることの一つ一つは正しいことは理解できるんだけど、何が言いたいのか理解できないんだ

食べログが評価を操作しているかどうか、は今説明してくれた事を駆使すれば判別できるんだろうか?

あるいは、Twitterの書き込みのおかしさ、は今説明してくれた事を駆使すれば、ココがおかしいと指摘されるんだろうか
0206デフォルトの名無しさん (アウアウカー Sa51-CdT3 [182.251.154.80])
垢版 |
2019/10/13(日) 10:08:21.52ID:uKg8mtfTa
中心極限定理はあくまで「同一の母集団から得た独立な確率変数であれば、十分な数の平均値を集めたものの分布が正規分布に近似できる」というもの
全店舗の採点者が同一の基準に従う採点を行うという前提が成り立たなければ成立しない定理
0207デフォルトの名無しさん (ワッチョイ 653c-3Hkb [118.240.95.156])
垢版 |
2019/10/13(日) 10:56:42.24ID:kaSZg9r20
>>206
個々の採点者が同じ基準でないのに中心極限定理を持ち出しているのがおかしいと主張しているわけか、なるほど

同じ基準ではないにしろ、少し幅をつけてみよう
個々の採点者はある得点を中心に正規分布で配点する、もしくは一様分布で採点する、あるいは同じ点数しかつけないものとする

正規分布で採点する者は、正規分布の合成が正規分布になることから、平均値の分布もまた正規分布
一様分布で採点する者は、分布関数の底上げにはなるが平均値には影響を与えない
同じ点数しかつけない者も、平均値そのものをずらす事にはなるが正規分布の形は歪めない

つまるところ上記の前提が成り立つ場合には、平均値の分布は厳密に正規分布になる
毎回1点で、たまに4点をつけるような人が大量にいないと、この評点と言う平均値分布を正規分布から歪めるのは難しいように思う
0209デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/13(日) 12:41:16.37ID:Fxu1r5BT0
>>205
平均値についても同様の事が言える
仮に評価する側が同じだとしても
店舗の特徴によって分布の形は変わる
分布の形を見る事で店舗の特徴を把握してその店を利用するかどうかを事前に利用者が判断できるようにするサービス
が本来目標としたものかもしれない

分布を意図的に操作する事で金儲けに利用しようとした疑いが上がっているという問題だと思う
0210デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/13(日) 12:44:15.71ID:Fxu1r5BT0
>>207
評価尺度はただの順序尺度で間隔尺度ではないだろう
0211デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.4])
垢版 |
2019/10/13(日) 12:53:02.60ID:sm0sVhGqM
>>159
大規模ですけどC、C++、アセンブラです。
現在、全部で数百万ステップです
0212デフォルトの名無しさん (ワッチョイ 653c-b92j [118.240.95.156])
垢版 |
2019/10/13(日) 13:19:59.66ID:kaSZg9r20
いかん、ラーメン屋の得点とスイーツ屋の得点を合わせて平均するとか謎なことをしていた
改めてデータに立ち戻ろう

3.6にピークがあるのは、とりあえず4に入れておこう層が2/3くらいいて、残りの1/3がとりあえず3に入れておこうということ4*2/3+3*1/3=11/3=3.67で説明できそうだ
逆に言えば、ここにピークが立つのは「とりあえず3か4に入れとけ層」が一定数いるということで、これは直感と合うのであまり怪しくはなさそうだ

次に3.8にギャップがある理由を考えてみる
元のデータを見た所、2つのガウス関数の和で表現できそうだ
一つは平均3.6で3σが0.3にあるピーク、もう一つは平均3.75で3σが0.05のピーク
こう仮定すると3.8にギャップができているのは、この2つ目のガウス関数の裾野に原因がある

この2つのガウス関数が意味するところは
ラーメン屋に通う「オヤジ層」とスイーツ屋に行く「レディー層」の違いを表すのか、
あるいは「関東に住んでいる層」と「関西に住んでいる層」を地域差表すのか、
はたまた疑惑の「操作されていない層」と「操作されている層」の人為操作の違いを表すのか

ラーメン屋だけの分布、特定地域だけの分布は作れそうだが、疑惑の操作に辿り着くのは難しそうだ
0213デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/13(日) 13:25:37.35ID:Fxu1r5BT0
操作がなかったという帰無仮説を棄却できるかどうかじゃね?
0214デフォルトの名無しさん (ワッチョイ 653c-b92j [118.240.95.156])
垢版 |
2019/10/13(日) 13:39:33.29ID:kaSZg9r20
>>202
まぁ>>208でも言っているけど画像をCNNで処理することを汎用化して言ってる気はするなぁ
少し古いけど

https://deepage.net/deep_learning/2016/11/07/convolutional_neural_network.html

にある

CNNはこういった特徴を抽出するための検出器であるフィルタのパラメータを自動で学習していく

ということなんだろう
RNNでも同じ話はあるので画像だけってことはないけど、なんでもかんでも特徴量を自動抽出ってことではないよ
0216デフォルトの名無しさん (ワッチョイ e394-P4H7 [115.37.73.212])
垢版 |
2019/10/13(日) 14:17:08.81ID:25TC8kRG0
3.8を超えた評価を3.6に落としてるって仮定したらほぼ同じヒストグラムになる
https://i.imgur.com/NrNIWrn.jpg
平均3.8標準偏差0.5で正規分布を生成して、3.8を超えた評価値を90%の確率で平均3.6標準偏差0.01の正規分布で取り直す操作をした(N=1000)
ただ同じだからと言って>>212のように元データの特徴量ごとの性質の違いを反映しているだけかもしれない
0217デフォルトの名無しさん (アウアウエー Sa13-P4H7 [111.239.178.130])
垢版 |
2019/10/13(日) 14:21:02.62ID:qY0pTgmia
>>213
操作がないという帰無仮説について仮説検定の方法で検証するには操作がない場合の点数の理想的な分布を知っていなければならない
その理想分布に基づいて実際の分布がどの程度ずれているのかを確認するのが仮説検定なのだから
しかしそんなもの知り得ないので検定のしようがない
0218デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6])
垢版 |
2019/10/13(日) 14:23:09.86ID:llG9wcVha
>>215
出来ないのは2層
3層にすると一度高次元空間に写してからシンプルな境界で分離出来る
0220デフォルトの名無しさん (ワッチョイ 653c-b92j [118.240.95.156])
垢版 |
2019/10/13(日) 15:01:05.43ID:kaSZg9r20
>> 215

細かいけど、まず層の数え方から
入力層は層に数えないので、ANDとORは1層で、XORは2層で表現できる

次にXORはなぜ2層で表現可能か
単純に、AND(正確にはNAND)とORの出力をANDで受ければXORが作れるから

ググったら以下のような図を見つけた
https://www.infiniteloop.co.jp/blog/wp-content/uploads/2017/12/XOR.png

>>218の回答はエレガントだけども、少し説明を加えると
(0, 0) → 0
(0, 1) → 1
(1, 0) → 1
(1, 1) → 0
を分ける直線は2次元平面内では書けないけど、3次元に拡張して
(0, 0, a) → 0
(0, 1, b) → 1
(1, 0, c) → 1
(1, 1, d) → 0
を分ける平面はa,b,c,dを適当に決めれば作れる(例えばa=d=0, b=c=1としてz=0.5の平面)

a,b,c,dを適当に決めて分離できるってそんなんアリかよ!?って最初は思うかもしれないけど
そんな純粋な気持ちは最初だけで、どうせa, b, c, dは見ないし分離できたら何でもOKになる
0222デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/13(日) 18:43:34.64ID:Fxu1r5BT0
>>217
諦めたらそこで試合終了ですよ
目の前にヒントが転がっていても見えなくなる
0223デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/13(日) 18:44:48.26ID:Fxu1r5BT0
>>218
線型結合してる層を増やすとなぜ高次元になるのかを直感的に判るように説明して
0224デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6])
垢版 |
2019/10/13(日) 19:30:49.94ID:llG9wcVha
>>221
層を増やす方が効率が高い

ニューラルネットの近似能力は層を増やすと指数的に向上するが、中間層のニューロン数に対しては多項式的にしか上がらない
0225デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6])
垢版 |
2019/10/13(日) 19:32:44.25ID:llG9wcVha
>>223
一旦中間層のニューロン数だけの次元を持つ空間を経由できるから
0226デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/13(日) 20:04:55.16ID:Fxu1r5BT0
>>225
線型結合して関数を通して
また線型結合して関数を通して
の繰り返しでなぜ高次元になるの?

関数によって非線形になるなら判るけど
0227デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6])
垢版 |
2019/10/13(日) 20:33:11.99ID:llG9wcVha
>>226
非線形な活性化関数噛ませるでしょ普通

自然に高次元になるんじゃなくてそうなる様にしてるんだよ、ニューロン数は自由に決められるから
0228デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.69])
垢版 |
2019/10/13(日) 20:44:50.78ID:/3kPh57iM
ディープキスのほうがいい!
舌をからませるの
立つよね!
0229デフォルトの名無しさん (ワッチョイ 9501-qBpa [126.25.131.86])
垢版 |
2019/10/13(日) 20:48:48.51ID:P1vmVh210
>ニューラルネットの近似能力は層を増やすと指数的に向上するが、中間層のニューロン数に対しては多項式的にしか上がらない
こんなことを示した論文などない。
よくこんなことをさも証明されたことの如く言えるな。
0230デフォルトの名無しさん (ワッチョイ 653c-b92j [118.240.95.156])
垢版 |
2019/10/13(日) 21:28:26.53ID:kaSZg9r20
>>221
本質的な質問が来た
これについては俺も明確な答えは持ってないなぁ

直感的には、多層の方が中間層に保持できるパラメータ数が多く
そこには活性化関数を通した非線形の効果も含まれているので
ほどほどにノイズが消されていて抽象的な状態を保持できるから

と思うんだが、本当かどうかは分からない
0231デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6])
垢版 |
2019/10/13(日) 21:37:08.64ID:llG9wcVha
>>229
Montufar, Guido F., et al. "On the number of linear regions of deep neural networks." Advances in neural information processing systems. 2014.

NIPSの論文だが
何を根拠に「こんなことを示した論文などない(キリッ」なんて言えたのか
0232デフォルトの名無しさん (ワッチョイ 653c-b92j [118.240.95.156])
垢版 |
2019/10/13(日) 21:45:22.38ID:kaSZg9r20
>>226
ちょうどいいので>>220で示したXORを例に説明しよう

入力が2次元である(x1, x2)を拡張して3次元の(x1, x2, x3)にしようと思う
つまり
(0, 0, a) → 0
(0, 1, b) → 1
(1, 0, c) → 1
(1, 1, d) → 0
が出来て(a, b, c, d) = (0, 1, 1, 0)を設定できれば、平面z=0.5で2つの領域に分離できる

すなわちx3をx1, x2から作れれば良いので

a = w11・x1 + w12・x2
b = w21・x1 + w22・x2
c = w31・x1 + w32・x2
d = w41・x1 + w42・x2

として(w11, w12) = (1, 1), (w21, w22) = (1, 1), (w31, w32) = (1, 1), (w41, w42) = (1, -1)のような重みを設定する
a, b, c, dの式をよく見てみると、これは2個のニューロンを1層分増やした式そのものである
つまり層を1層増やすということは、次元を増やすことと同値である
0233デフォルトの名無しさん (ワッチョイ 653c-b92j [118.240.95.156])
垢版 |
2019/10/13(日) 21:46:31.38ID:kaSZg9r20
>>226
ちょうどいいので>>220で示したXORを例に説明しよう

入力が2次元である(x1, x2)を拡張して3次元の(x1, x2, x3)にしようと思う
つまり
(0, 0, a) → 0
(0, 1, b) → 1
(1, 0, c) → 1
(1, 1, d) → 0
が出来て(a, b, c, d) = (0, 1, 1, 0)を設定できれば、平面z=0.5で2つの領域に分離できる

すなわちx3をx1, x2から作れれば良いので

a = w11・x1 + w12・x2
b = w21・x1 + w22・x2
c = w31・x1 + w32・x2
d = w41・x1 + w42・x2

として(w11, w12) = (1, 1), (w21, w22) = (1, 1), (w31, w32) = (1, 1), (w41, w42) = (1, -1)のような重みを設定する
a, b, c, dの式をよく見てみると、これは2個のニューロンを1層分増やした式そのものである
つまり層を1層増やすということは、次元を増やすことと同値である
0235デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.69])
垢版 |
2019/10/13(日) 22:18:18.69ID:/3kPh57iM
>>221
〉二層あれば大抵の関数は模倣できる

その『大抵』とは、どの程度なんですか?
それが示されてないのですから
まったく意味をなさないですよね?

>>230
その意味をなさない書き込みに、
本質的とかって、
レベル低すぎですね。
0240デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/14(月) 07:16:20.36ID:KQ95R8h/0
>>232
それだと
x1, x2の入力を受けるニューロンと
それからx3を計算するニューロンを並列に並べたら良い

x1-x1\
x2-x2-out
\x3/
みたいに

次元を増やすの意味として変数増加とx^2などと混同しやすい
これらを区別する言い方は何?
変数増加→高次元
x^2など→非線形
とか?
0241デフォルトの名無しさん (スププ Sd43-IE9o [49.96.34.97])
垢版 |
2019/10/14(月) 12:29:28.91ID:utYACZDud
前に『ゼロから作るディープラーニング』買ったけど
これ3千円はする高額な本だけど、計算や式の意味がわからず挫折したなあ…。

やっぱノートに書いて解き方や意味を学習するしかないと思うねん。
0242デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.69])
垢版 |
2019/10/14(月) 12:54:25.27ID:syyLl6c1M
>>241
ならば『excelでわかるディープラーニング超入門』がオススメ
続編もある
0245デフォルトの名無しさん (オッペケ Sr61-B2ag [126.255.17.59])
垢版 |
2019/10/14(月) 14:01:22.69ID:htBbaZR2r
機械学習に数学はいらないよおじさん「機械学習に数学はいらないよ」
0246デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.69])
垢版 |
2019/10/14(月) 14:23:44.68ID:syyLl6c1M
ソフト使うだけなら数学いらんわね
0248デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6])
垢版 |
2019/10/14(月) 14:31:10.41ID:JdA0BOgta
>>247
そういう仕事は既にAutoMLに取られつつあるね
0250デフォルトの名無しさん (ワッチョイ 653c-b92j [118.240.95.156])
垢版 |
2019/10/14(月) 14:40:16.73ID:VuPQ6UMJ0
>>240
並列に並べるために(x1, x2)からx3を作るための層が最低1つ必要なんだ
0か1かのような2値分類は、つまるところ出力層と全く同じ出力をする新しい次元を作って、その次元に直行する超平面で分類する作業なので

言い方は高次元や非線形で良いと思うけど、次元についてはニューロンの数が、非線形については活性化関数が深く関係している

もう少し詳しく説明しよう
より一般的な関数があったとして、入力が(x1, x2)のとき、最後の出力層への入力としては

(f1(x1, x2), f2(x1, x2), f3(x1, x2), …, fN(x1, x2)) … (1)

となっている
Nは最後の隠れ層のニューロンの数なので、次元と読んでいるのはニューロンの数だということが分かる

(1)を如何にして作るのかが重要になり、層を深くして(1)を作らなくても、ニューロン増やせばいいんじゃね?となる
隠れ層1層と出力層1層の2層あれば大抵の関数は模倣できると指摘している>>221はかなり鋭くて実にその通り

それでもなんで層を深くするのかというと>>224の効率が良いというのが一般な回答なんだが、Deep Learningを回している人なら実感があると思うけど、第一層のニューロンの数がある一定数ないと学習がうまくいかないことが往往にしてある
単に層を深くすればよいというのは明らかに直感と異なり、そうすると「どの層にどれだけのニューロンを配置すると良いか」という問題になり、これに対して自分なりの回答はまだ全然持っていない
0251デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.69])
垢版 |
2019/10/14(月) 14:42:39.82ID:syyLl6c1M
最初から土方しかいないから。
今もほとんど土方。
できる人は研究者か大学教員になってる。
0253デフォルトの名無しさん (スププ Sd43-IE9o [49.96.34.97])
垢版 |
2019/10/14(月) 15:08:32.93ID:utYACZDud
>>242
ありがとう。調べてみます。
0257デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.69])
垢版 |
2019/10/14(月) 16:12:47.05ID:syyLl6c1M
博士号持ちといってもピンキリ

天才的な人もいるし、
とんでもない馬鹿もいる。

2、3枚の感想文のようなレポートで
博士号取れる院も
日本にある。
そこは博士号とりたい中国人ばかりが
留学生としてやってくる。
日本の恥!
0258デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6])
垢版 |
2019/10/14(月) 17:26:03.50ID:JdA0BOgta
>>257
例えばどこの院
0259デフォルトの名無しさん (ワッチョイ ab82-IE9o [113.20.238.175])
垢版 |
2019/10/14(月) 18:51:16.60ID:/yNf4ic50
>>255
DSって何ですか?
0260デフォルトの名無しさん (エムゾネ FF43-1wBF [49.106.193.20])
垢版 |
2019/10/14(月) 18:55:58.36ID:ljIrzJ7BF
Deta
Saiensu
0262デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.57])
垢版 |
2019/10/14(月) 20:18:41.61ID:DQ9Yh+dwM
>>258
知り合いが現在
そこの教員やってるので
大学名は書かないけど
博士論文は国会図書館に
全て収蔵されるので
みればすぐわかる。

ヒントとしては、
なんと中国語でレポート2枚ぐらいの
博士論文がある!
日本の恥!
抹殺したい!
0263デフォルトの名無しさん (ワッチョイ ab82-IE9o [113.20.238.175])
垢版 |
2019/10/14(月) 21:29:45.45ID:/yNf4ic50
ディープラーニング発明した人に
ノーベル賞やるべきだと思う。
0265デフォルトの名無しさん (アウアウクー MMe1-o74w [36.11.225.237])
垢版 |
2019/10/14(月) 21:35:46.34ID:lAL0R9ntM
メダル獲れなかったkaggle用のnoteをgithubに載せてしまった。はずかしー
これで就活だあ〜。おーッ!
0266デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6])
垢版 |
2019/10/14(月) 23:09:10.36ID:JdA0BOgta
>>263
チューリング賞はとった
0268デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.57])
垢版 |
2019/10/15(火) 02:28:14.05ID:KLW/euVzM
甘利さんか?
0271デフォルトの名無しさん (アウアウカー Sa51-KA+R [182.251.40.158])
垢版 |
2019/10/15(火) 07:35:51.98ID:5lPGjOaaa
>>269
田倉寛史は失業するな。
0272デフォルトの名無しさん (ワントンキン MMa3-Hjv8 [153.154.213.244])
垢版 |
2019/10/15(火) 09:11:20.62ID:CGH1vHQcM
競馬って予想して勝てるゲームなの?
0276デフォルトの名無しさん (アウアウウー Sac9-KA+R [106.161.117.54])
垢版 |
2019/10/15(火) 10:31:23.58ID:YjTx8zIDa
佐々木洋佑の予想。
0280デフォルトの名無しさん (オッペケ Sr61-uMWA [126.255.149.234])
垢版 |
2019/10/15(火) 12:32:17.34ID:2+ahF6drr
>>221
層が多いほうが表現力が高い
教師データ数に対して異常に多いパラメータは、なんで性能が伸びるかよく分からない。

パラメータの中にはあたりくじがあるのかもという、宝くじ仮設なるものがあるけれどどうなのでしょう?
0282デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.57])
垢版 |
2019/10/15(火) 13:13:25.51ID:KLW/euVzM
テーブルデータってなーに?
0283デフォルトの名無しさん (オッペケ Sr61-B2ag [126.255.17.59])
垢版 |
2019/10/15(火) 16:36:14.39ID:OfiTiE/Hr
>>221
深くする程損失関数が凸関数に近くなり最適解に辿り着きやすくなるかも知れないことが最近の理論研究で判明してきている
0284デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/15(火) 23:48:10.86ID:1HOx40aj0
層を増やすと普通にバックプロパゲーションだけでは上手く学習できないんじゃね
どうするんだっけ
0285デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.4])
垢版 |
2019/10/16(水) 07:22:30.93ID:399vjxSUM
甘利さんに聞く
0286デフォルトの名無しさん (スププ Sd43-IE9o [49.96.34.97])
垢版 |
2019/10/16(水) 12:21:07.84ID:KK2SmrYwd
ドロップアウトって
実際に人間の脳でも行われているのでしょうか?
0290デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.48])
垢版 |
2019/10/16(水) 13:17:05.59ID:YrOVtgjKM
>>287
当たり前のことすぎて
どう反応していいかわからんよ。
どういうレスが欲しかったの?
0293デフォルトの名無しさん (スフッ Sd43-v2l4 [49.104.18.87])
垢版 |
2019/10/16(水) 18:25:30.68ID:mV5OOZvVd
>>292
ドロップアウトは過学習を抑制するためにやるやつだし
記憶の結び付きとは違うだろ
0297デフォルトの名無しさん (ワッチョイ c501-e/MC [60.86.178.93 [上級国民]])
垢版 |
2019/10/16(水) 21:07:54.87ID:dCHq3Ix40
>>295
>一度見た画像をぼんやりとしか覚えてない
そもそも観察メッシュが雑(現物→キャッシュ的なところ の時点で情報がだいぶ落ちてしまう)なヤツの場合・・・
0306デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/19(土) 11:27:09.87ID:O4F+zYXc0
ググってると、ときどき尾崎隆のブログが検索結果に出てくる。
みなさんもご存じ(?)の、
 「渋谷駅前で働くデータサイエンティストのブログ」というやつ。

名前を公開して堂々とブログを書いているのであるから、
間違いがあっても、実名でよく書いた!ほめてあげよう。
だって、5chなんて匿名だから批判とか妬みとか罵詈雑言ばかりだもんな。

尾崎は偉いと思う。実名で書いてるから。
ちょっと自信過剰すぎて、ブログの間違いを見つけるたびに
笑えるけどそれもまたいい!
尾崎はいいやつ!
これからもブログをどんどん書いてくれ!
0307デフォルトの名無しさん (ワッチョイ 2fe6-sprL [14.3.161.84])
垢版 |
2019/10/19(土) 12:29:08.69ID:RpavgoGg0
自信過剰
0309デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/19(土) 14:19:40.09ID:O4F+zYXc0
>>302
> きみたちSparkとかHadoopとか使ってるの?

使っていない。
仕事でAzureとAWSを使っていて
もはやHadoopとか必要ねーじゃんとか思ってる
何か使う理由がある?
0318デフォルトの名無しさん (ワッチョイ f67c-4dmd [113.42.68.218])
垢版 |
2019/10/20(日) 00:03:48.28ID:tuWSj+Lu0
>>315
セキュリティが心配なんだろうと思う
0321デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/20(日) 03:49:01.05ID:zXnrxtUW0
>>320
word2vec一択とはどゆ意味なのかわからんけど、
それだけでは人と会話できないじゃん?
0322デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/20(日) 03:50:55.76ID:zXnrxtUW0
うちではword2vecは使ってないよ
0323デフォルトの名無しさん (ワッチョイ 2fe6-hjwr [14.3.161.84])
垢版 |
2019/10/20(日) 06:36:34.16ID:RLBjETOG0
自然言語処理スレで聞け
0324デフォルトの名無しさん (ワッチョイ f67c-4dmd [113.42.68.218])
垢版 |
2019/10/20(日) 06:51:17.93ID:tuWSj+Lu0
>>319
データを抜かれるのはセキュリティの脅威の一つ
0327デフォルトの名無しさん (アウアウカー Saa7-KB0K [182.251.151.218])
垢版 |
2019/10/20(日) 10:15:03.52ID:WLZPVulDa
セキュリティ万全と言いながら音声認識の音声データを勝手に社員が聞いていたりという事例もあるわけで
物理的にデータが相手側に置かれる以上はいくらでもこっそり悪用できるし内部告発以外でそれに気付くことは不可能だからな
扱うデータの性質にもよるが大企業ならすぐ炎上し得るので慎重になるのは当然だろう
0328デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/20(日) 10:18:01.24ID:zXnrxtUW0
クラウドとローカルと、うまく使い分ければいいだけの話
言語論争と同じで、その仕事に適しているものを使うというだけの話
0330デフォルトの名無しさん (アウアウクー MMff-V+wO [36.11.225.214])
垢版 |
2019/10/20(日) 10:41:10.83ID:006B6SYsM
中小でローカルサーバーを利用したがるのは、
社員たちのITに対する理解度が底辺で、データをネットに接続しただけで、
情報漏洩のリスクが発生するからだったり…
奴ら、機械学習用のPCにwinny入れちゃうとかデフォだから
0334デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/20(日) 12:45:28.09ID:zXnrxtUW0
データ基盤はNTTデータであっても
ぐちゃぐちゃになってますね。

データ分析が始まって、
何もわからないところから、
その時その時に良いと思う方法で
構築して結合するので、
現在は、もうそれはそれは恐ろしい
暗黒構造となってます。

資料を作るひまもなく付け加えるので、
資料無しのぐちゃぐちゃです。
終わってます。
0336デフォルトの名無しさん (アウアウウー Sa9b-KXk8 [106.154.130.6])
垢版 |
2019/10/20(日) 13:00:42.05ID:xbXJ4T7Ga
>>335
深すぎるとoverfittingする可能性がある
0337デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/20(日) 13:03:01.09ID:zXnrxtUW0
>>335
いいえ、違います。
オートエンコーダを使って何をするのかにもよりますけど、
結局のところ次元圧縮を「適切に」やりたいわけです。

基本的には中間層から取り出した「圧縮」されたデータを
分析に利用するわけですから、
その分析として実現したいことによって、
「適切な意味が残存している」データを中間層から
取り出したいわけです。
よって適切な層の数はやりたいことによって変わります。

ただ、オートエンコーダの応用はいろいろ発展中ですので、
どういうことをやっているのか具体体に書いていただければ
よりよいアドバイスができると思います。
0339デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/20(日) 13:25:54.53ID:zXnrxtUW0
> オートエンコーダは入力と出力が同じ

原始的なNNとして使ってるだけなんだな
しかし入力と出力が同じとはどういう意味なんだ?
0340デフォルトの名無しさん (アウアウウー Sa9b-KXk8 [106.154.130.6])
垢版 |
2019/10/20(日) 13:52:06.21ID:xbXJ4T7Ga
>>338
教師データだけ丸暗記して、テストデータは復元出来なくなる
0341デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/20(日) 14:05:16.23ID:zXnrxtUW0
データサイエンティスト名乗るやつって
みんな馬鹿だと確信できたよ
0342デフォルトの名無しさん (ブーイモ MM73-vzCu [210.148.125.64])
垢版 |
2019/10/20(日) 14:06:19.35ID:pEDMITRJM
>>337
すみません。お返事もらってたのに見逃してました
本で理論を学んでいてオートエンコーダの層の深さは多い方がいいのか少ない方がいいのか書いていなかったので、知識浅いのに質問してみました…
適切な意味が残存するようにということで一歩ですが少し分かった気がします。具体例を色々見てみたいと思います

>>340
>>339
教師データ入れて教師データで評価するとか考えてしまって書き込んでしまったのですが、教師データとテストデータはありますよね、ありがとうございます
0344デフォルトの名無しさん (スフッ Sd42-FVSl [49.106.220.168])
垢版 |
2019/10/20(日) 16:55:57.67ID:5FKWmxq9d
DCGANによる画像生成について質問。
色んな文章の画像データを学習させたら
LSTMのように画像データとして、文章生成は可能ですか?

あと、4コマ漫画をDCGANで学習させて
意味のある4コマ漫画を生成することは可能ですか?
0348デフォルトの名無しさん (アウアウウー Sa9b-83DY [106.154.130.6])
垢版 |
2019/10/20(日) 20:45:32.57ID:xbXJ4T7Ga
>>344
不可能とは言わないが、出来たらトップカンファレンス通るレベル
0349デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/20(日) 22:12:40.67ID:zXnrxtUW0
>>344
難しいとは思うがやってみたらいい。
なんでもチャンレンジしておくと、
どゆのが難しいのかわかってくる。
人にとって意味のあるものを生成するということが
どれほど困難かわかると思う。

不可能と思えることにチャレンジすることを
無駄と思うか、勉強と思うか、馬鹿にするか、
それは人それぞれ。

やらないでおいて、
「できやしないよ。」
「それ不可能だから」
「それ単なる判別だから」
なんて批判するのは簡単。どんな馬鹿でも低能でも言えること。

何を言われようとチャレンジするのがいいと思う。
あとあと財産になると思う。
0353デフォルトの名無しさん (ワッチョイ c610-4dmd [153.131.102.129])
垢版 |
2019/10/21(月) 07:33:53.00ID:LkDkCGmw0
>>325
正規アクセス権限を持つ人の管理を自社でできない
正規アクセス権限を持つ人だからその気になればアクセスするのは容易
0354デフォルトの名無しさん (ワッチョイ c610-4dmd [153.131.102.129])
垢版 |
2019/10/21(月) 07:40:58.63ID:LkDkCGmw0
>>337
オートエンコーダによる次元削減と
主成分分析による次元削減とは
どんな関係?
条件が揃うと両者の結果は一致する?
どんな条件でとか判明している?
0356デフォルトの名無しさん (ワントンキン MM73-hjwr [210.132.8.232])
垢版 |
2019/10/21(月) 09:02:29.55ID:VyV3rznyM
オートエンコーダっていうけど
古くない?
0357デフォルトの名無しさん (アウアウウー Sa9b-83DY [106.154.130.161])
垢版 |
2019/10/21(月) 09:07:45.09ID:HKPBZHRea
最近の手法でもネットワークの一部にオートエンコーダーが使われていたりはする
0358デフォルトの名無しさん (ワントンキン MM73-hjwr [210.132.8.232])
垢版 |
2019/10/21(月) 10:35:25.87ID:VyV3rznyM
どんな奴?

ビッグデータ言うけど
中身的にはknnになってそうで怖い
どの程度未知データに対応できるのか知りたいのに
0360デフォルトの名無しさん (スププ Sd42-Mkdf [49.98.63.11])
垢版 |
2019/10/22(火) 10:09:07.31ID:lFIH7itId
ディープラーニングで星空を学習させて、星空の画像を生成させようとしたら
ノイズのような糞画像が生成されたというツイートです。

https://mobile.twitter.com/aki202/status/1185695506703384576

どうしてこうなったの?
原因を調べようにも、ブラックボックスでわからないのでしょうか?
https://twitter.com/5chan_nel (5ch newer account)
0361デフォルトの名無しさん (アウアウウー Sa9b-83DY [106.154.131.92])
垢版 |
2019/10/22(火) 14:58:07.65ID:NFYmLoNWa
学習できてない
0362デフォルトの名無しさん (ワッチョイ 2fe6-hjwr [14.3.161.84])
垢版 |
2019/10/22(火) 16:15:33.91ID:hH4hu+Bb0
ganでやってんでしょ
足りてない
0366デフォルトの名無しさん (ワントンキン MM73-hjwr [210.132.8.232])
垢版 |
2019/10/23(水) 10:28:52.26ID:/wjqUoilM
やってみた系
Qiitaにありそう
何でこういうツイートをどや顔でするんだろう
高度なことをしているアピール?
実際は無知を晒してるだけなのに。。。
0368デフォルトの名無しさん (ワイーワ2 FF9f-Tlcr [103.5.142.120])
垢版 |
2019/10/24(木) 10:22:21.30ID:ABhN6CSmF
所詮はバカッター
失敗や無恥を曝す方がリツイートも良いねも増える世界
アフィ厨と一緒でフォロワー増やす目的
相手にするとつけあがる
0370デフォルトの名無しさん (ワッチョイ e390-MZfN [112.139.91.58])
垢版 |
2019/10/24(木) 15:39:10.85ID:h4TZRS470
IT系は客の懐具合で予算が決まる
衰退する業界を客にしてると共倒れだ
0372デフォルトの名無しさん (ワントンキン MMd7-seY4 [210.132.8.232])
垢版 |
2019/10/24(木) 20:18:37.50ID:mJmionkaM
まだまだ先じゃないの
0374デフォルトの名無しさん (アウアウカー Sa37-CWnN [182.251.150.186])
垢版 |
2019/10/25(金) 11:19:29.75ID:qkKvohBNa
>>366
既存の事例や良書の下位互換でしかなくても記事にまとめることで理解が深まる
別に君に見せるために書いているわけではないので興味がないなら黙って閉じればよい
「何でツイートするの?」とか言ってるだけ時間と労力の無駄だろう
0375デフォルトの名無しさん (ワントンキン MMd7-seY4 [210.132.8.232])
垢版 |
2019/10/25(金) 14:02:38.91ID:lQl0zV4qM
何で公開すんの?
見て欲しいからでしょ?
注目を浴びたいんでしょ?
0378デフォルトの名無しさん (ワッチョイ 33e6-eGmw [14.3.161.84])
垢版 |
2019/10/25(金) 20:13:24.49ID:zctARNqM0
                  ヽ人人人人人人人人人人人人人人人ノ
         / ̄(S)~\  <                      >
       / / ∧ ∧\ \<  嫌なら見るな! 嫌なら見るな! >
       \ \( ゚Д,゚ ) / /<                      >
         \⌒  ⌒ /  ノ Y´`Y´`Y´`Y´`Y´`Y´`Y´`Y´`Y´`Yヽ
          )_人_ ノ  
          /    /
      ∧_∧ ■□ (    ))
     (   ; )■□  ̄ ̄ヽ
   γ⌒   ⌒ヽ  ̄ ̄ノ  ノ
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄|
0381デフォルトの名無しさん (ワッチョイ e3dd-seY4 [122.249.72.219])
垢版 |
2019/10/25(金) 23:30:25.15ID:zY1ZO0SR0
チラシの裏に書け
0386デフォルトの名無しさん (ワッチョイ 33e6-seY4 [14.3.161.84])
垢版 |
2019/10/26(土) 10:04:19.57ID:sMyP0ohJ0
YouTubeでpvだと思って見たら
素人のカラオケだったときの失望に似ている

上手いなら感心してみるけど
ド下手が上げてんじゃねえよ、と
0389デフォルトの名無しさん (ワッチョイ ff02-kwV+ [101.142.8.160])
垢版 |
2019/10/26(土) 23:08:34.54ID:I3o5RH8v0
>>387
機械学習案件の未経験者の採用指標って、
マトモなところだと大学の学部と専攻、
SESのようなアホ営業が間に入る商流だとPythonの経験年数 みたいな感じ?

作業の大半は前処理とデータクレンジングだから後者でも間違いでは無いが
0392デフォルトの名無しさん (ワッチョイ 337c-uGyE [14.193.216.182])
垢版 |
2019/10/27(日) 03:00:05.93ID:yje76TNI0
>>387
未経験で機械学習の仕事掴みたいならkaggleで結果出してアピるのが早いんじゃないか
早いつっても一朝一夕じゃいかないけどな
色んな機械学習のタスク解いてみ
あと勉強して理解したことを客観的な指標とともにちゃんと表現するといい
0393デフォルトの名無しさん (アウアウウー Sa97-G9/M [106.154.130.173])
垢版 |
2019/10/27(日) 06:50:07.36ID:Qb9Ns76Ya
>>387
チュートリアル完了
0394デフォルトの名無しさん (アウアウカー Sa37-CWnN [182.251.145.244])
垢版 |
2019/10/27(日) 10:23:08.48ID:Sdc+cFVla
mnistを高精度で当てるモデルができたとしてもネット上の他人の知識を寄せ集めただけで理屈はよく分かっていないのか、
何らかの根拠に基づくモデリングを行って精度が上がった(=高精度の理由を自分で数学的に説明できる)のかで全く異なる
前者であればそんな人間は山ほどいるので何の自慢にもならない
0395デフォルトの名無しさん (ワッチョイ 3f4b-MZfN [219.67.175.245])
垢版 |
2019/10/27(日) 11:06:47.77ID:a+EgGKKD0
>>387
就職することを考えているなら知識の移り変わりが少なくて派遣が蔓延してなくて年寄りが居るところにした方がいいだろう
中国の殺し屋が下請けを雇って5次請けまで行って3000万の案件が末端で150万になり
「150万で殺しなくない」ってことで死んだフリした写真を送って終わらせようとしたニュースが出てて
それ日本のIT業界じゃねーか!突っ込まれてたけど
こんな構造が当たり前になっているところもちょっと
0397デフォルトの名無しさん (アウアウクー MM77-kwV+ [36.11.225.155])
垢版 |
2019/10/27(日) 20:36:55.06ID:hG9pDBcOM
発注元の社内における地位によって、そこらへんの閾値の調整が違うんだよなあ
発注元が閾値に対して責任を負っている人だと、閾値を調整する機能を持たないシステムの方が好まれる
実務経験がある人にしかわからんだろうけど
0405デフォルトの名無しさん (ワッチョイ 3f7d-kwV+ [219.102.155.117])
垢版 |
2019/10/28(月) 02:12:02.65ID:pZrpoGAC0
逆に初心者向けでない機械学習を扱ってる本って何か知っていたら教えて欲しい
中級以上、実務レベルって言っても差し支えないやつ
わりと超初心者or初心者を対象にした本が多い気がする

本でなかったら、サイトとかでも
0409デフォルトの名無しさん (ワッチョイ e359-kwV+ [122.222.204.39])
垢版 |
2019/10/28(月) 14:40:54.62ID:/femDpxA0
>>400
いや、さすがに量子コンピューターうんぬんはもののたとえだけど
勾配ブースティングが出てきて業務が変わったように
ツールの知識は流行り廃りが激しいから、深いところで知識や技術を蓄えないと
エンジニアとして時代に押し流される
0414デフォルトの名無しさん (ワントンキン MMdf-seY4 [153.237.134.243])
垢版 |
2019/10/29(火) 18:36:46.47ID:KCHCOTCfM
実務をどれだけやったかじゃね?
0416デフォルトの名無しさん (ワッチョイ 33e6-seY4 [14.3.161.84])
垢版 |
2019/10/29(火) 22:14:12.17ID:32UpIEvm0
知識って言語モデルで良いの?
0421デフォルトの名無しさん (アウアウウー Sa97-ubyV [106.161.118.117])
垢版 |
2019/10/30(水) 17:13:08.55ID:3aN27z+Ma
>>404
chainerもpytorchもやれ。
0422デフォルトの名無しさん (アウアウウー Sa97-G9/M [106.154.130.51])
垢版 |
2019/10/30(水) 17:26:33.89ID:DV87KhQta
ランダムドットを入力して星空に変換出来たら面白そうだなあ
0423デフォルトの名無しさん (ワントンキン MMdf-seY4 [153.237.134.243])
垢版 |
2019/10/30(水) 18:57:53.97ID:OxfqAVssM
単一画像からのスタイルganみたいなやつが
まさにコピペ自動機だった
0424デフォルトの名無しさん (ワッチョイ 5301-CkuB [60.86.178.93 [上級国民]])
垢版 |
2019/10/31(木) 11:13:06.25ID:JglnROWD0
>>422
星空は、まったくランダムじゃなくて
けっこうな粗密のむらっけ&見た目の大小(明るいくらい)があるから、
テキトーに1dotの点々を何個かうってもらった画像を初期値として
そこから準備しておいた数式でごにょごにょーごにょーして
適度に粗密と大小をつけた星空ふいんきの画像を出す。
っていうのつくったら、
カネにはならんだろうが
やったったです!デモにはいいだろうな。

機械学習は、
全天サーベイの写真あたりをインプットにして、
「初期値からいいかんじにごにょってくれる数式」を製作するところに使ってくれ。
0425デフォルトの名無しさん (ワントンキン MM2a-4Ncq [153.237.134.243])
垢版 |
2019/11/01(金) 16:25:10.67ID:GsymoNAsM
却下
0426デフォルトの名無しさん (アウウィフ FFb7-DOEl [106.171.80.130])
垢版 |
2019/11/01(金) 16:29:45.45ID:4VV6x0MuF
星団
星雲
天の川
あたりをだしたければ重力シミュレーションも必要
0427デフォルトの名無しさん (ワッチョイ 5301-CkuB [60.86.178.93 [上級国民]])
垢版 |
2019/11/01(金) 17:28:42.59ID:qSHo2rpn0
>>426
うーんどうだろう?

天の川を0から現在まで作るには、
「2400億粒くらいの星を撒いて重力シミュレーション」らしいけど

星空っぽい柄を生成しちゃるぞー
程度だったら
天の川銀河(銀河系)のざっくり図・・・星がある確率の地図を作っておいて
あとは地球のどこからみると、どっちがどんだけみえるー
くらいのデータがあれば
ええんでないのかなー

入力も、
dotをいくつか打ってもらうんじゃなくって
メルカトル図的な真っ黒四角の中に、
どこか1点でいいような。
季節とか時刻はめんどうだから春分の夜@ロンドン固定とかで。


星団・星雲はトッピング的なもんで、
肉眼でもわかるぞー!っていうのはマジ数少ないから、
「星空柄の壁紙つくっちゃる」くらいだったら
とりまホーチでおk。
どーしてものせたいのなら、確率地図に大小マゼラン雲くらいは書き足しておk。
0429デフォルトの名無しさん (ワッチョイ c7dd-4Ncq [122.249.72.219])
垢版 |
2019/11/04(月) 14:20:31.61ID:6UHCWlqh0
嘘臭い
0431デフォルトの名無しさん (アウアウウー Sab7-qHxX [106.161.128.195])
垢版 |
2019/11/04(月) 18:20:52.91ID:PQlPE2ZKa
>>416
BART?
0432デフォルトの名無しさん (ワッチョイ bb27-iPBx [164.70.253.210])
垢版 |
2019/11/04(月) 19:05:13.23ID:F/trr2gA0
修士論文で2次元アニメ画像の顔をたくさん読み込ませて
平均顔みたいなのをAIで自動生成するみたいな課題を割り振られたんですが
何から手を付けていいか分かりません

まず顔認識の場合ラスター画像そのままよりもベクター画像に変換したほうがよさそう
(とくにアニメ画像の場合髪色がまちまちぃだったりするので)
と思うんですが詳しい方いませんか?

その場合顔の画像を与えると境界情報をベクトル化して抽出してくれるようなライブラリってないでしょうか
髪型を特徴量として表すのはかなり難しいとおもってるので
まずは顔全体の外接円、あごからほおの輪郭、目の位置、鼻の位置 あたりをベクトル化して
大量画像をディープラーニングで流し込んで顔データを自動生成して
髪型だけは既存のものを適当にあてはめて可愛い画像ができました
あたりをおとしどころで論文にしようかなとおもってます

機械学習は大学の講義レベルの知識しかないので
それじゃあだめだろとか改良点とかあったら
みなさまのプロのご意見をおききしたいです
0433デフォルトの名無しさん (アウアウウー Sab7-Tw1J [106.154.131.133])
垢版 |
2019/11/04(月) 19:57:54.46ID:b7XfuRK5a
「平均顔みたいなの」というのがよく分からないが、あなたの考えるベクター画像に変換するメリットをもっとkwsk
0435デフォルトの名無しさん (ワッチョイ bb27-iPBx [164.70.253.210])
垢版 |
2019/11/04(月) 21:00:39.11ID:F/trr2gA0
>>433
かわいいとおもった画像の特徴を平均化すれば
万人受けするもっとかわいい画像が作れるんじゃないかっておもってますが
そこは別に商業じゃないので結果うまく行きましたでも修論レベルなら十分かなとおもってます

あとラスターだとかなり周辺広く見ないとどこの部分なのか認識するのが難しいから
特徴量が多くなりすぎてかなり深いニューラルネット組まないと
そもそも顔として認識するのが難しいんじゃないかっていう印象です

見当外れだったらすみません

>>434
そうなんですね

リアルの写真は難しそうですが
2次元アニメ画像ぐらいなら境界周出するのってそんな難しくないかなと
なんとなくおもってました

そこがすでにすでに難しいなら
大量の画像の顔部分だけ手動で輪郭や目とかをトレスして
そのペンのストロークを座標に記録してベクトル化するようなプログラムを作ってから
そのベクトルに対してディープラーニングを行ったほうが良さそうですね

アドバイスありがとうございます
0436デフォルトの名無しさん (ワッチョイ 5301-CkuB [60.86.178.93 [上級国民]])
垢版 |
2019/11/04(月) 21:34:46.65ID:l8jF+acj0
>>435うえはんぶん
('A`) おう べんきょうもっとがんばれよ

>まんなからへん
ラスタ画像っつか写真の顔認識は、ぐっぐるが結構昔から販売してるぞ。

それとはたぶん独立に、
近頃のプリクラマシンの
デブスだって日本人受けしやすくカワイい方へガツンと盛ってくれる補正技術はすごいから、
カワイイをきわめるつもりなら、
勉強する価値があるとおもう。

>したからにばんめ
二次元はいわゆる人外カラーの髪や瞳の色が壁になると思う
まぁがんがれ

>いちばんした
機械学習くんを調教できるほど手を動かすなら
努力したで賞で修士・・・でるのか・・・・・・?
理学じゃ努力しまくってても失敗データじゃ修士でないんだが。
0437デフォルトの名無しさん (ワッチョイ bb27-iPBx [164.70.253.210])
垢版 |
2019/11/05(火) 02:25:13.35ID:WGM3y/GM0
>>436
販売なんですね
有名なんだったら普通に研究室で買ってそうなのできいてみます

>プリクラマシンの補正技術
調べてみます!

> 二次元はいわゆる人外カラーの髪や瞳の色が壁
そうなんですよね
3次元用の顔認識アルゴリズムをそのままラスター画像に適用して
うまく肌以外の色相自由度を認識してグループ化してくれるか分からないです

いろいろアドバイスありがとうございます!
0444デフォルトの名無しさん (ワッチョイ 23da-DOEl [118.21.135.8])
垢版 |
2019/11/05(火) 16:10:59.42ID:mbkTm92O0
>>432
宿題は宿題スレで
0445デフォルトの名無しさん (ワッチョイ 5301-ANgw [60.86.178.93])
垢版 |
2019/11/05(火) 17:32:52.03ID:4ZvLZxny0
>>437
どこの研究室でもライセンス買っつるであろう、Officeみたいなものじゃない件。
しっかりパッケージされて売ってるわけではないぞw > 顔認識システム

>色相自由度を認識
人外カラーの髪や瞳だけじゃなく、
スキンカラー問題だの、
いわゆる色トレス線を境界だと誤認識するだの、ありそうだぞ。

インターネッツに、日本語で、
自分で顔写真を顔写真だと認識するプログラム組んだったw

黄色人種以外に非対応な人種差別っぷりよ…(´・ω・`)

改良したった!
っていう話をのっけてくれてるブログが転がってるはずだから
がんばってしらべろ。

二次元絵じゃないほうの、
リアル写真からの顔認識については、
おさえておくべき特徴点とか、
年齢・性別・人種を分類するためのポイントとかまでもう研究されてるから、
そっちをしっかり勉強してから、
二次元に挑んだ方がいいのかもわからん。

あー
続きは宿題スレを占拠されても困るんで
指導教員なり同様の課題をやってる先輩にききんしゃー
0446デフォルトの名無しさん (ワッチョイ 5301-ANgw [60.86.178.93])
垢版 |
2019/11/05(火) 17:43:51.24ID:4ZvLZxny0
>>439
なにやってても押し出し(追い出し)てもらえるなんざ、
戦前から平成一杯くらいまで続いてた研究室(たぶん200人以上卒業生がいる)の中でも
1名しかいないレベルの
特大ハズレ大馬鹿うんこ野郎だけの特権だw

>>442
そんなに枯れちゃってるのこの業界?

おれは正直いって結構オワコンな分野の所属だったけど
学部で配属後最初の1か月分のデータでレター書いて、
学部の残りのデータあわせて1報書いて、
修士で全く違うジャンルだけどやっぱもう廃れてきてる分野に引っ越して
1から?勉強しなおしになったけど、
(こっちはハゲタカとまではいかないがまずまずのマニアック誌にしか載らなかったが)1報書けたぞ・・・
博士過程のことと、某大職員時代については・・・きくなよwwwだけど。。。
0450デフォルトの名無しさん (アウアウクー MM2b-6BDJ [36.11.225.146])
垢版 |
2019/11/05(火) 21:48:30.86ID:FS2CN9rWM
C言語で画像処理してる会社をクビになって
(その会社に入社する時に、面接官にいわれた方便程度の優しい嘘がささって
バタフライ効果で周りの人間にさっさと会社を辞めた方がいいと諭されまくった挙句、
心が棒人間になって仕事を続けられなくなった。人間関係の板挟みって複雑。。。)
Kaggleちょっとやって、メダル獲れなかったけどいい線いったから
元から行きたかった自然言語処理の方面へ応募してみようかな〜みたいな感じでフラフラしてるんだが
自然言語処理に行きたい!とこっちがいくらいっても、逆求人で画像処理の奴ばっか来るのな。くるなー、くるなー!
やっぱ画像処理の方が簡単に就職できるのかな。それともOpenCVを独学でやっちまったからか
0452デフォルトの名無しさん (アウアウクー MM2b-6BDJ [36.11.225.146])
垢版 |
2019/11/05(火) 21:53:50.28ID:FS2CN9rWM
>>451
板違い? すまん、感情のほとばしりがやばかったわ
0453デフォルトの名無しさん (ワッチョイ 2e10-5RI4 [153.131.102.129])
垢版 |
2019/11/05(火) 22:16:09.83ID:S4fXfghv0
>>432
pcaとかautoencoderとか使えるかも
あとはパーツ毎に学習して
パーツ毎に生成したものを組み合わせるとか

パーツの位置、配置や大きさでも変わってくるだろう

可愛いキャラは目の位置が上下中央辺りとか
目の大きさが顔に占める割合が大きいとか
0455デフォルトの名無しさん (アウアウクー MM2b-6BDJ [36.11.225.146])
垢版 |
2019/11/06(水) 00:32:15.90ID:YRVde36bM
>>454
だな。別にNLPに固執してるわけでもないんだがアプリでも作るわ
次は失敗しないように頑張ろう
0460デフォルトの名無しさん (ワッチョイ 8347-hvvP [150.249.206.28])
垢版 |
2019/11/06(水) 16:41:33.50ID:q549CorC0
次、どこに行こうかね。。。
0461デフォルトの名無しさん (ワッチョイ 7702-DaD1 [106.166.50.77])
垢版 |
2019/11/07(木) 18:39:39.86ID:KASF5ywG0
人間が現場作業をしつつアノテーションが同時に出来る(撮影しておいて、
右手を伸ばして目標物体を掴んだ時に左手で数値などを入れてラベリングする)機械を作れば
色んな作業がどんどん自動化されるのかなあ
0462デフォルトの名無しさん (ワッチョイ 9701-msxt [60.86.178.93])
垢版 |
2019/11/07(木) 19:19:45.16ID:i5KqlsP00
>>461
3Dスキャナとさわるほうの手につけるタイプのセンサーグローブを用意して、
初期位置合わせをがんがれば、
3次元の座標入力と応力(弾性)入力くらいは
今よりはかどりんぐ!になりそうだが、
だからといって
いろいろなんでも自動化ハッピー☆とはならんと思うぞ。。。

そんなことより
3Dプリンタのz軸の動きをもっと精度よくして
積層段差うんとちいさくするなり、
大きめにうちだしておいて自動であとから削って精密に仕上げるテクノロジー

シリコーンみたいなエラストマー樹脂を積層するように、素材開発

はよ
0467デフォルトの名無しさん (ワッチョイ ff10-Lc5z [153.131.102.129])
垢版 |
2019/11/08(金) 07:13:35.28ID:LWIqGPHS0
>>466
クラウドソーシングじゃね
0471デフォルトの名無しさん (ワントンキン MM7f-qVE0 [153.154.54.55])
垢版 |
2019/11/08(金) 17:14:11.10ID:HpQs1W/gM
できるね
0474デフォルトの名無しさん (ワントンキン MM7f-qVE0 [153.154.54.55])
垢版 |
2019/11/08(金) 17:56:01.28ID:HpQs1W/gM
金谷センセだな
0475デフォルトの名無しさん (アウアウウー Sa5b-CSR4 [106.154.138.79])
垢版 |
2019/11/08(金) 19:07:52.56ID:CSR+2ZkJa
>>470
撮影地点の座標と三脚の高さがしっかりきっぱり分かってないからスッとできないんじゃね?
0478デフォルトの名無しさん (ワッチョイ d7e6-qVE0 [14.3.161.84])
垢版 |
2019/11/09(土) 07:23:02.53ID:R+fonfJU0
歩道を歩いてない奴が事故っただけじゃん

無罪
0481デフォルトの名無しさん (ワッチョイ f790-QzFo [112.139.91.58])
垢版 |
2019/11/09(土) 10:28:42.03ID:ZM4bFDeE0
AI技術者ってマジで急激に増えたな
それも大学で体系的に教育されてきたやつが。
まぁ三年もあれば修士くらい量産できるしな
0487デフォルトの名無しさん (ワッチョイ f790-QzFo [112.139.91.58])
垢版 |
2019/11/09(土) 16:06:33.78ID:ZM4bFDeE0
必要精度に到達できるかどうかのリスクを請負で抱え込んじゃってる会社もあるらしい。
開発のリスク背負うんだったら販売契約だろ
0488デフォルトの名無しさん (ワッチョイ 1f02-QzFo [101.142.8.160])
垢版 |
2019/11/09(土) 16:30:27.99ID:dihGWiYo0
>>487
その条件で請け負っている時点でAI技術なさげ

でも、客も解ってなさそうだから、過学習させたインチキ精度で逃げるか?
0489デフォルトの名無しさん (アウアウクー MMcb-QzFo [36.11.224.64])
垢版 |
2019/11/09(土) 17:11:58.21ID:u+nAgAfJM
インチキ精度で逃げる。でもそういう仕事は黒か白かではないから、あながちインチキとも呼べない
たとえば、もともと人間がやっても精度が出ていなかった仕事で
建前上だけ検査しているという話にして、その仕事に関わっているひと皆がおかしいとは思ってるけど
仕事が回らないから誰も何もいわない〜みたいな仕事が世の中にはいっぱいある
そういう仕事を機械に置き換えるような場合、名目上の目標の精度がでなくても
前の精度を実質上回っていれば迷わず開発するでしょ
発注元も、精度が目標を下回っていたところで、見て見ぬフリをする
0496デフォルトの名無しさん (ワッチョイ ff10-Lc5z [153.131.102.129])
垢版 |
2019/11/09(土) 21:38:40.63ID:1ZolsRQG0
>>489
その場合は人件費より安く前と同程度の結果が出せれば依頼者側としては大きな問題ではないかもしれない
0498デフォルトの名無しさん (ワッチョイ ff10-Lc5z [153.131.102.129])
垢版 |
2019/11/09(土) 21:40:09.82ID:1ZolsRQG0
>>491
データを得られないんじゃね?
0499デフォルトの名無しさん (ワッチョイ ff10-Lc5z [153.131.102.129])
垢版 |
2019/11/09(土) 21:41:20.60ID:1ZolsRQG0
>>493
AIは手段だよな
0501デフォルトの名無しさん (アウアウクー MMcb-QzFo [36.11.224.64])
垢版 |
2019/11/09(土) 21:50:16.84ID:u+nAgAfJM
>>496
そそ。俺の前にいた会社なんて
C言語で画像処理やってたんだけど、電機や半導体などの簡単な仕事ばかり請け負って、その道の専門という体裁で仕事を集めてたんだ
全部なんでもやれますというより、これがうちの強味って売り出し方した方が強い
千葉はそういう会社がいっぱいある。中小企業が多いからじゃん
0507デフォルトの名無しさん (ワッチョイ 9f9c-G+r6 [61.125.210.189])
垢版 |
2019/11/10(日) 01:37:00.28ID:eARvZr/10
ついにバブルが完全に弾ける要素が出たなあ
まあこれから地に足ついた現実的な路線に戻るだろなあ
普通にまずは業務プロセスを改善するということに使って欲しい
それ以上のことはあまりにも現実的ではない
0509デフォルトの名無しさん (ワッチョイ bfda-TAVf [223.217.165.240])
垢版 |
2019/11/10(日) 03:52:17.75ID:j8ULpgDb0
>>476への1つの打開策としてAI保険基金でも作るしかないかなー。
AI車が事故った場合、AI車の管理者が責任を有する。そのときのお金はAI保険に入っていれば保険やさんが出す。

そもそもの事故回避の問題点は消えないままだが。。
0512デフォルトの名無しさん (ワッチョイ 7702-DaD1 [106.166.50.77])
垢版 |
2019/11/10(日) 09:15:41.41ID:vAvO6oJv0
>>508
これ以外に、株やFXの相場のろうそくチャートから
次に上がるか下がるかを90%以上の確率で予測できた
なんてのもあるねえ

更にどこぞの高速コンピュータがそれを上回る精度で予測し
しかも1秒に100万回の売買可能!なんて言ってやがるw
実際には証券取引所の方で制限が掛かりそうだな

(0.01%の利益率しか無くても、取引手数料を考慮しないなら
1秒で1万倍以上に軽くなるわけだ(実際には大赤字))
0516デフォルトの名無しさん (ワッチョイ f790-QzFo [112.139.91.58])
垢版 |
2019/11/10(日) 12:23:39.77ID:i7RQ4O9k0
松尾研は変なやつが集まりすぎだよ
yentaでも松尾研のやつ見たぞ
0518デフォルトの名無しさん (アウアウエー Sadf-vPHs [111.239.179.36])
垢版 |
2019/11/10(日) 13:37:21.47ID:uUiSn9Z5a
そもそもG検定なんて文章の読み取り能力を問うような国語の試験になってしまっているので
あんなの合格しても「素人でもわかるAI」系の本の内容を理解している程度の評価にしかならない
E資格ならまだマシだけどそれでも費用が高すぎるので、勤務先が全額出してくれるなら取ってもいいんじゃね?というレベル
0523デフォルトの名無しさん (ワッチョイ ff10-Lc5z [153.131.102.129])
垢版 |
2019/11/10(日) 15:49:21.14ID:iNYMutj60
>>511
静止しているから衝突しないとそのモデルは判断していたんじゃね?
本当は静止していなかったから認識ミス、識別ミスだな
ドライバーが動画を見ずに前を見ていたら停止できたと思う
ドライバーの契約がどうなっていたかわからないけど
事故を予防する役割もあったとしたらアメリカなら訴えるだろうな
あくまでも事後処理の役割しかなかったのかな
0524デフォルトの名無しさん (ワッチョイ ff10-Lc5z [153.131.102.129])
垢版 |
2019/11/10(日) 16:08:28.16ID:iNYMutj60
>>513
事故の確率とかがわかれば保険料率とか決められるんじゃないの?
病気とかその発生メカニズムとかを説明できなくても保険はあるし
0527デフォルトの名無しさん (ワッチョイ ff10-Lc5z [153.131.102.129])
垢版 |
2019/11/10(日) 17:14:27.32ID:iNYMutj60
>>525
人間が車を運転しても死亡事故は発生する
自動運転の方が死亡事故率が低い事が分かったら
自動車保険で自動運転の場合の保険料が安くなるだろう

社会的な影響は理解できる
だから実証実験のドライバーが動画を見ていて良かったのかが疑問
0529デフォルトの名無しさん (アウアウカー Sa2b-Rqls [182.251.150.62])
垢版 |
2019/11/10(日) 17:58:05.20ID:si2lOYY4a
自分が自動運転アルゴリズムの開発責任者なら何があっても全責任をユーザー(とユーザーが契約した保険会社)が負う条件でないと販売できないな
何故ならバグ皆無のプログラムなど存在しないのだからそれを了解した上で使えよとしか考えられない
で、そんな条件で自動運転車を使おうとする人がいるのかどうか
0543デフォルトの名無しさん (ワントンキン MM7f-qVE0 [153.154.54.55])
垢版 |
2019/11/11(月) 15:28:27.51ID:6RvD5GOFM
モデルだけ再利用?
よく分からん
0545デフォルトの名無しさん (ワントンキン MM7f-qVE0 [153.154.54.55])
垢版 |
2019/11/11(月) 19:19:21.18ID:6RvD5GOFM
これだったら
小さい工場でも気軽に導入できるね?
0547デフォルトの名無しさん (ワントンキン MM7f-qVE0 [153.154.54.55])
垢版 |
2019/11/12(火) 15:52:52.24ID:5J5yqkZqM
hackerxてなんのイベントなの?
0550デフォルトの名無しさん (ワッチョイ fde6-iZ7S [14.3.161.84])
垢版 |
2019/11/15(金) 08:48:30.37ID:y4RyaYdh0
gpt-2の発表は変だった
期待外れ

あの大袈裟な発表は
イーロンマスクが入れ知恵したからなのかな
0551デフォルトの名無しさん (ワッチョイ 8d82-IR5O [124.40.110.128])
垢版 |
2019/11/17(日) 21:27:39.70ID:Qw4Ltt1k0
形式ニューロンとパーセプトロンの違いがよくわかりません。
0552デフォルトの名無しさん (ワッチョイ 2b10-k7Fv [153.131.102.129])
垢版 |
2019/11/18(月) 07:41:28.00ID:9aN5YyV+0
>>551
ニューロンは一つの素子で
ニューロンを層状の2層構成にしたのがパーセプトロンじゃないかな
0557デフォルトの名無しさん (ワイーワ2 FF13-/nAh [103.5.142.235])
垢版 |
2019/11/19(火) 12:20:05.56ID:8naC8O/UF
過学習で馬鹿になるパターンは人間でもよく居るよな
0559デフォルトの名無しさん (ササクッテロ Spc9-k7Fv [126.35.69.142])
垢版 |
2019/11/19(火) 19:12:20.06ID:s40irKmEp
>>555
運用中に処理対象になるデータが
開発中に扱ったデータと違う分布になっているとか
開発中のデータがもともとたりなかったってことじゃ無いの?
0560デフォルトの名無しさん (ササクッテロ Spc9-+iTV [126.33.37.160])
垢版 |
2019/11/19(火) 20:25:28.12ID:Ag+TvSO9p
ここで聞くのもなんなんですがdeep learningの手法とかテクニック系を話してる板はどこでしょうか?
0561デフォルトの名無しさん (ワッチョイ 8d82-IR5O [124.40.110.128])
垢版 |
2019/11/19(火) 20:31:02.32ID:nEj8UkU30
どうしたらディープラーニングで言語理解出来るようになりますか?
0567デフォルトの名無しさん (ササクッテロラ Spc9-wN32 [126.182.127.28])
垢版 |
2019/11/20(水) 00:19:44.54ID:fEAcQWwmp
すいません。まったくのど素人なのですが、質問させてください。

システム構築というか、コンピュータに望むような動きをさせるため、どのプログラムをどのように組んだらいいのか、ってことについて勉強をしていきたいと思ってます。

アルゴリズムや機械学習などの基本知識を学んだ上で、プログラミングを勉強していけばいいでしょうか。

よくわからないなりに考えたので、何を言ってるのかわからないかもしれませんが、何をすべきか、ご教示ください。
0568デフォルトの名無しさん (ワッチョイ fde6-iZ7S [14.3.161.84])
垢版 |
2019/11/20(水) 07:06:48.48ID:zvVE5hEg0
>>567
こういうのをやってみたら?
https://www.codexa.net/
0571デフォルトの名無しさん (ワッチョイ fd7c-M13G [14.193.216.182])
垢版 |
2019/11/20(水) 09:45:01.14ID:hrstG49p0
>>570
システム構築をゼロから学ぶつもりってこと?
どこかの情報工学科のシラバス一回見てみるとか
習得範囲が広すぎるような気もするので、とりあえず望んだプログラム動かすまでとか範囲決めるといいかも
あとは身近で詳しい人捕まえて素人質問たくさんぶつけた方がよさそう
0572デフォルトの名無しさん (ワンミングク MMe3-f9Up [153.235.108.33])
垢版 |
2019/11/20(水) 11:54:50.74ID:8uwrhbuIM
東大に入ればいいんじゃない?
0576デフォルトの名無しさん (ワッチョイ 56bb-tIGp [217.178.3.78])
垢版 |
2019/11/23(土) 11:06:54.12ID:EMpawcHE0
>>567
>「コンピュータに望むような動きをさせるため」

その『望むもの』を自分で先に見つけ出したほうがいい
これ自体はコンピューターと直接の関係はない。
まずは、コンピュータにとらわれない実務に触れてみたら
ヒントがでてくるんじゃないかな。
じゃないと、何やっていいかすらわからないから、
何から覚えるかもわからないことになる。
0578デフォルトの名無しさん (アウアウカー Sacf-gxaT [182.251.146.53])
垢版 |
2019/11/23(土) 14:52:00.77ID:UeAxjNOJa
大澤昇平 :: AI 救国論 🇺🇳 @Ohsaworks:

AI の場合は単に精度が高ければ何でもいいんですよ。
設計時に人間が主観(「事前分布」といいます)として差別的な情報入れたら NG ですけど、
ラーニングの結果として差別が生まれるのであれば、それは単なる自然の摂理です。
https://twitter.com/rysyrys/status/1197764388691689472
https://twitter.com/5chan_nel (5ch newer account)
0587デフォルトの名無しさん (ワッチョイ ff82-CqbB [124.40.110.128])
垢版 |
2019/11/26(火) 19:32:56.95ID:xV5ChpD10
文章から画像を生成するGANがあるけど
例えば「机の上にリンゴが1個あります」という文章から画像が生成されたら

機械は人間のように、言葉の意味を理解したと言えるのでしょうか?
0588デフォルトの名無しさん (ワッチョイ d610-b4Py [153.131.102.129])
垢版 |
2019/11/26(火) 19:36:56.31ID:cmZeJbzH0
>>587
机、りんご、上、1個、ある
とかの個別の概念と
それらの関係を人間が意図したのと同じように
解釈して図示できたら
通信ができたことになるのではないでしょうか?

通信が出来ることを理解すると解釈するなら
理解したことになりそうな気はします
0589デフォルトの名無しさん (ワッチョイ d610-b4Py [153.131.102.129])
垢版 |
2019/11/26(火) 19:38:45.07ID:cmZeJbzH0
xmlとかでちゃんと書いてやればコンピュータでも解釈できると思う
画像からXMLなりを生成するのもできそうな気はするな
0590デフォルトの名無しさん (ワッチョイ d610-b4Py [153.131.102.129])
垢版 |
2019/11/26(火) 19:41:33.35ID:cmZeJbzH0
センター試験か何かを解かせたとかニュースになってた気がするけどな
一応問題文を理解して答えを見つけられるようにはある程度なってるんじゃないの?
0594デフォルトの名無しさん (ワンミングク MM82-Gedh [153.235.108.33])
垢版 |
2019/11/27(水) 14:25:38.08ID:pvWhqXzvM
curriculum learningてどうよ?
効果を感じないんだが。。。
0595デフォルトの名無しさん (ワッチョイ bf01-qZD/ [60.86.178.93])
垢版 |
2019/11/27(水) 14:44:38.10ID:R3eAH8fN0
>>594
にんげんさまが指示してやらねばならん部分・・・
階段の刻み方(どういう方法で難しさを順位付けするか)
が悪いんでね?

あるいは
これもやっぱりにんげんさまが指示してやらねばならん部分・・・
レベル1の勇者にいきなりたまにはぐれメタルエンカウントさせちゃう的な、
試練の与え方が悪いか。
0596デフォルトの名無しさん (ワンミングク MM82-Gedh [153.235.108.33])
垢版 |
2019/11/27(水) 14:50:18.75ID:pvWhqXzvM
nlpなんだけど
ミニバッチ作るときに自然にもうcurriculum learning的になっているのかな?
0599デフォルトの名無しさん (ワッチョイ 5fad-q7p1 [110.130.184.72])
垢版 |
2019/11/29(金) 00:17:47.54ID:lLJmxOHf0
Kaggleとかの機械学習コンペで主催者(依頼者)が持ってるマシンよりも参加者(優勝者)がコンペで使ったマシンのほうが性能良いってことあったりするの?
0602デフォルトの名無しさん (アウアウクー MM33-O/Gm [36.11.225.189])
垢版 |
2019/11/29(金) 09:49:10.05ID:gYWo3w4cM
Deep Learning散々騒いだ割には結局テーブルデータじゃGBDTにボロ負けな現状なんとかならんの
せいぜいGBDT様にお情けでensembleさせて頂く程度
0603デフォルトの名無しさん (ワンミングク MMdf-LjR8 [153.235.108.33])
垢版 |
2019/11/29(金) 12:49:35.84ID:9onQejqxM
つ適材適所
0607デフォルトの名無しさん (ワンミングク MMdf-LjR8 [153.235.108.33])
垢版 |
2019/11/29(金) 19:18:55.66ID:9onQejqxM
えーまた同じ間違いを?
0612デフォルトの名無しさん (アウアウウー Sa23-29PW [106.154.127.208])
垢版 |
2019/11/30(土) 09:52:40.58ID:vuvC9RZIa
>>609
モデルの劣化って汎化能力が低いってこと?
0614デフォルトの名無しさん (アウアウウー Sa23-nO0S [106.154.136.36])
垢版 |
2019/11/30(土) 10:53:06.13ID:xqSKATFaa
>>611
それもNNの規模次第でゎ。。。
0615デフォルトの名無しさん (アウアウウー Sa23-nO0S [106.154.136.36])
垢版 |
2019/11/30(土) 10:54:38.50ID:xqSKATFaa
>>609
劣化が早いってどゅこと?
モデルって腐るの。。。?
0618デフォルトの名無しさん (アークセー Sx33-O/Gm [126.149.48.137])
垢版 |
2019/11/30(土) 12:58:50.37ID:YcFQTR8Rx
なんか悪かった
どう考えてもGBDTの方が精度出る案件でクライアントがでぃいぷらあにんぐ使いたいですってほざくから
むしゃくしゃしてやっただけなんだ

NGBoostは学習も推論も遅いし予測分布も分類じゃそんなに嬉しくないし結局LightGBM/CatBoostは超えられなさそうだよなぁ
0619デフォルトの名無しさん (ワッチョイ 5f01-d0qP [60.86.178.93])
垢版 |
2019/11/30(土) 13:03:41.07ID:OO2kPiiB0
>>618
> どう考えてもGBDTの方が精度出る案件でクライアントがでぃいぷらあにんぐ使いたいですってほざく
発注元の責任で このでぃーぷするとです って
明文化しとけよw
あとから責任おっかぶせられそうになると
ブチ切れちゃうぞw
0624デフォルトの名無しさん (ワッチョイ 7f3d-YC6P [219.104.75.160])
垢版 |
2019/11/30(土) 17:12:57.03ID:369/mHN+0
パンピーには関係ない話だけど、
Kaggleで賞金狙えるレベルの人の中には、稀にNNでGBと大差ない精度を出す者もおるんだ
これはたびたびカーネルに出る話題だから間違いない
GBで特徴量を400程度使って出す精度と、ほぼ同等の精度を特徴量20~50程度で出すらしい
NNは前処理もパラメーター調整もシビアだけど、この少ない特徴量でモデルを組めれば、
実装後にデータの傾向が多少変わっても、GBDTよりは精度が落ちない
0627デフォルトの名無しさん (アークセー Sx33-O/Gm [126.149.48.137])
垢版 |
2019/11/30(土) 18:09:44.73ID:YcFQTR8Rx
実務上は精度追い求めるよりFeature Importanceが出せるかどうかの方が重要なんだよなぁ
0629デフォルトの名無しさん (ワッチョイ 5f01-YC6P [126.25.131.86])
垢版 |
2019/11/30(土) 18:40:26.81ID:Uqy6J8Cl0
>GBで特徴量を400程度使って出す精度と、ほぼ同等の精度を特徴量20~50程度で出すらしい
そりゃ20~50にうまく特徴量を絞れたらそうだろ。それが難しいんだっつーの。
それを半自動でやりたいってのがそもそもの機械学習の目的だろうに。
0632デフォルトの名無しさん (アークセー Sx33-O/Gm [126.149.48.137])
垢版 |
2019/11/30(土) 19:06:06.12ID:YcFQTR8Rx
大体4000件しかないデータで何すんだよ
Titanicじゃねーんだぞ
0634デフォルトの名無しさん (スフッ Sd9f-DWOz [49.104.6.183])
垢版 |
2019/12/01(日) 09:32:45.02ID:loLKdL8Wd
このソニーのニューラルネットワーク関連の解説動画どうよ?
https://www.youtube.com/channel/UCRTV5p4JsXV3YTdYpTJECRA

良い動画だと思うんだけど、このスレの人たちの意見を聞きたいです。
0635デフォルトの名無しさん (ワッチョイ df02-R3ru [106.166.50.77])
垢版 |
2019/12/01(日) 09:34:39.98ID:YoP0MD/80
アノテーションツールとしてVoTTとlabelImgが紹介されているが
VoTTの方が楽かな
ただしtag名を入力してから、最後にエンターキーを押さないと
それが確定しない、という事を知っておかないと
いつまで経ってもtagすら作れないw

labelImgはpythonのpyqtから作るからワクワク感があるが、
自分の落として来たバージョンがミスっていたのか、プログラム内のimportファイルの書き方に
3ヶ所エラーがあって、自分で「こんな行き当たりばったりの治し方で良いのかなあ?」
と直したら、とりあえずユーザーフォームが開く所までは動いた
だがまだ肝心なアノテーションを試してないなあ
ボロボロだったりして
0637デフォルトの名無しさん (ワンミングク MMdf-LjR8 [153.235.108.33])
垢版 |
2019/12/04(水) 16:29:35.31ID:9sxYmTh0M
knnをneural netでやるのって無意味?
0638デフォルトの名無しさん (ワッチョイ 5f01-YC6P [126.94.220.36])
垢版 |
2019/12/04(水) 16:54:35.12ID:vhuKISsK0
コリアン・ニュース・ネットワーク。
0645デフォルトの名無しさん (ワッチョイ a102-V35x [106.166.50.77])
垢版 |
2019/12/06(金) 04:01:13.87ID:1/Pn3P+Y0
何といっても深層学習の数学的な枠組みが分かってないと
使いにくいのがChainerとPyTorch
だが細かくカスタマイズし易いのがChainer&PyTorch

kerasは「何かこのタイミングでこれっぽい事したら上手く動くんじゃね?」ぐらいの理解でも
何とか動いてくれる
でも細かなカスタマイズは出来ないからTensorflow丸ごと弄ることになって、
そうなるとChainer&PyTorchより更に上のレベルの数学的な理解と
そのプログラミング上の実装を知っておく必要が出来てしまう
0650デフォルトの名無しさん (アウアウカー Sa8d-wxxp [182.251.144.43])
垢版 |
2019/12/07(土) 09:58:04.39ID:xi7Cj8Cta
ツールが使えるだけで機械学習や統計を理解した気になっている人は危険だと言うことだ
本当に理論から理解していれば多少記法が変わったところですぐ順応できるが、特定のフレームワークを使った単なる作業者だとそのフレームワークが下火になった時に移行するのにかなりの労力が必要
0652デフォルトの名無しさん (ワッチョイ 4d01-MVf8 [126.25.131.86])
垢版 |
2019/12/07(土) 12:39:37.05ID:ZsYnLuoj0
ハードウェアサポートが広い方を使いたいからtensorflowって感じになってる。
分散環境での学習とか、クライアント機でどれだけ動くのかがこれからの焦点なんじゃないかね。
コード内容自体はどっちも大して変わらん。バカは大騒ぎするけど。
0655デフォルトの名無しさん (ワッチョイ bd54-DV35 [180.235.0.69])
垢版 |
2019/12/07(土) 16:41:02.63ID:8POX1SPh0
あ、はい
0660デフォルトの名無しさん (ワッチョイ 5a3d-MVf8 [219.104.75.160])
垢版 |
2019/12/08(日) 09:09:03.18ID:d61YKsOU0
>>659
好き
0662デフォルトの名無しさん (ワッチョイ 6190-MVf8 [42.126.56.69])
垢版 |
2019/12/08(日) 13:55:46.22ID:KMc7Z1Fn0
chainerは単純に人員が足りてなかったと思う
リリース版にバグがあるままリリースしてる
リリース版の更新が多すぎ
で離れて使わなくなった
0663デフォルトの名無しさん (ワンミングク MM6a-DV35 [153.235.108.33])
垢版 |
2019/12/08(日) 15:40:26.42ID:dxbVA0b4M
いうてtfもバグなしじゃないだろ
0665デフォルトの名無しさん (ワンミングク MM6a-DV35 [153.235.108.33])
垢版 |
2019/12/08(日) 16:11:39.81ID:dxbVA0b4M
automlで適当に調整してくれるしな
0667デフォルトの名無しさん (アウアウカー Sa8d-wxxp [182.251.141.126])
垢版 |
2019/12/08(日) 17:15:40.02ID:S4ZYhJQRa
ハイパーパラメータ調整ツール自体の調整能力まで把握した上で使うならいいが
理論も分からない、ツールがどうやって調整したのかも分からないだと困るな
「どうしてこのハイパーパラメータが最適なのか?」の質問に対して「ツールがそう算出したから」「論文に書いていたから」を回答にせず説明できるなら問題ないとは思う
0670デフォルトの名無しさん (ワッチョイ 6190-MVf8 [42.126.56.69])
垢版 |
2019/12/08(日) 19:49:05.17ID:KMc7Z1Fn0
pfnってなんか仕事はしてるだろ
トヨタとの共同研究ってまだ続いてるんじゃないの
0672デフォルトの名無しさん (ワッチョイ f610-DJoW [153.131.102.129])
垢版 |
2019/12/08(日) 20:59:04.48ID:wWaHJEbO0
>>667
試した中で一番いい結果だから
じゃダメなんですか?
0674デフォルトの名無しさん (ワッチョイ 6190-MVf8 [42.126.56.69])
垢版 |
2019/12/08(日) 22:44:35.51ID:KMc7Z1Fn0
googleは元々広告で食ってるだろ
0676デフォルトの名無しさん (ワッチョイ 6190-MVf8 [42.126.56.69])
垢版 |
2019/12/08(日) 23:30:34.77ID:KMc7Z1Fn0
いちいち公開してないだけで色々案件はやってるだろ
0679デフォルトの名無しさん (ワッチョイ b5e3-mnWA [220.219.149.102])
垢版 |
2019/12/09(月) 13:00:46.54ID:cQNHGZkd0
機械学習で日本の人名を生成したい
どうすればできる?

当方しがないエンジニアでpythonはできるが、
機械学習周辺のキーワードがわからなくて調べられずに困っている
GANとかいうのは画像用だから使えないんだよな?程度の知識
0680デフォルトの名無しさん (アウウィフ FF79-MVf8 [106.171.79.171])
垢版 |
2019/12/09(月) 13:09:35.22ID:RLwtKsqpF
日本の人名は戸籍に使える文字が決まってるから
そこから選べ
0684デフォルトの名無しさん (アウウィフ FF79-MVf8 [106.171.79.171])
垢版 |
2019/12/09(月) 15:14:40.70ID:RLwtKsqpF
条件後出しは失格
0685デフォルトの名無しさん (ワッチョイ bd54-8zr5 [180.235.0.69])
垢版 |
2019/12/09(月) 16:25:34.13ID:HdYgf83V0
ああ、同人誌みたいなライトノベルみたいなどうしようもないやつに使いたいのね
乱数でいいんじゃね?
0688デフォルトの名無しさん (ワッチョイ 5aad-CqlS [27.139.41.170])
垢版 |
2019/12/10(火) 04:20:23.19ID:0gRjlhkw0
デスノートのいじめが発生しないようにって配慮スゲーって思ったな
0689デフォルトの名無しさん (アウウィフ FF79-MVf8 [106.171.67.227])
垢版 |
2019/12/10(火) 14:05:49.73ID:48kVELqAF
阿部進次郎
0690デフォルトの名無しさん (ペラペラ SDe5-MVf8 [110.163.140.118])
垢版 |
2019/12/11(水) 19:37:08.57ID:LCchQiSlD
ご質問なのですが、機械学習の回帰問題において、教師信号が特定の範囲内にある時の重みを重くするような損失関数はありますでしょうか?

私が解きたい問題においては、教師信号の値が0~1の間の値を取るように基準化しているのですが、
例えば、RMSEを下記のようにカスタマイズした損失関数を使用したいのです。

False Positive:学習器の出力は0〜0.2の範囲だが、教師信号は0.2より大きい or
学習器の出力は0.8〜1の範囲だが、教師信号は0.8未満

False Negative:教師信号の出力は0〜0.2の範囲だが、学習器の出力は0.2より大きい or
教師信号は0.8〜1の範囲だが、学習器の出力は0.8未満  

とTrue negativeとFalse Negativeの場合にのみ損失関数を計算するか、重みを大きくした損失関数を使いたいのです。

もしご存じでしたら、この損失関数を使用可能な学習器やライブラリなどを教えていただけますでしょうか。
ライブラリなどが無くても最悪論文などがあればそれでもかまいません。何卒ご教示をお願いいたします。
0691デフォルトの名無しさん (ワッチョイ bd54-8zr5 [180.235.0.69])
垢版 |
2019/12/11(水) 21:41:26.98ID:DwgG6llj0
わかんない
0695デフォルトの名無しさん (スッップ Sdba-c9yC [49.98.151.148])
垢版 |
2019/12/12(木) 00:35:12.72ID:XDEaLtEed
>>690
まず教師信号とはなに?ベクトル?時系列?
>教師信号が特定の範囲内にあるとき…
ヘビサイト関数(ステップ関数)の重ね合わせで表現可能

>RMSE
二乗平均?(RMS)
よくわからん。一般的でない。

>false positive, false negative…
応答だけ書かれてもわからん。±で4パターンあるだけ?
0697デフォルトの名無しさん (ワッチョイ 5b54-OFkf [180.235.0.69])
垢版 |
2019/12/12(木) 07:02:30.85ID:x0loQ0xU0
理解してない人が繰り出す小手先の改善ほど効果のないものはない
0701690 (ペラペラ SD4b-uKDx [110.163.140.118])
垢版 |
2019/12/12(木) 12:56:19.08ID:qy4ltjlBD
皆さん、お忙しい中返信をありがとうございます。

>>698
知りたいです。是非教えてください。
>一つはサンプルをいじる方法、もう一つは関数をいじる方法だけどもっと詳しく聞きたい?
0702デフォルトの名無しさん (スップ Sdba-HVu8 [49.97.96.198])
垢版 |
2019/12/12(木) 17:43:51.02ID:xvtH/KsFd
>>701
サンプルをいじる方は2パターンあって、重みを付けたい範囲のデータを水増しして増やすか、逆に重みを付けたくない方のデータを間引くかのどちらかを行う

関数をいじる方は、使ってるライブラリのオプションにweightみたいなのがたぶんあるはず。無ければ自分で実装しかないんじゃないかな
0710690 (ペラペラ SD4b-bWwy [110.163.140.118])
垢版 |
2019/12/13(金) 00:07:11.37ID:ztjeN6RTD
>>702
ありがとうございます。私が阿保でした…。色々と難しいことを考えていましたが、普通に分類問題における不均衡データの扱いと同じように考えれば良いのですね…。
0717デフォルトの名無しさん (アウウィフ FFc7-EbeN [106.171.69.81])
垢版 |
2019/12/13(金) 11:10:40.03ID:V90d9jYdF
前者
0719デフォルトの名無しさん (ワッチョイ 5b54-OFkf [180.235.0.69])
垢版 |
2019/12/15(日) 11:27:48.03ID:qAhsyicK0
どうせ無理
0721デフォルトの名無しさん (ワントンキン MM86-OFkf [123.216.161.18])
垢版 |
2019/12/17(火) 17:57:23.97ID:IOLSzPnMM
neuripsは、にゅうりっぷす、でいいの?
0725デフォルトの名無しさん (ワントンキン MMab-BqQa [123.216.161.18])
垢版 |
2019/12/19(木) 19:13:19.10ID:7bTJNhmPM
攻殻機動隊は?
0727デフォルトの名無しさん (ワッチョイ 2154-BqQa [180.235.0.69])
垢版 |
2019/12/19(木) 20:36:41.48ID:2pi3DA5F0
コミックです。。。
0748デフォルトの名無しさん (ワッチョイ 212f-+Tiu [180.24.80.238])
垢版 |
2019/12/22(日) 22:11:05.54ID:Ens8Pa2w0
ライブラリ比較サイトで勉強してきました。
直近のしごとはsklearnで事足りそうだし、
Deep Learningとかの勉強はPytorch使ってみようかと思います。
Tensorflow+Kerasも気になるけど、Tensorflow2.0の情報が出てから勉強したほうが、
効率良さそうな気がしてきました。
0750デフォルトの名無しさん (ワッチョイ 1302-4eo+ [27.81.114.231])
垢版 |
2019/12/23(月) 01:08:38.23ID:VfWxGDyD0
修士持ってて5ちゃんで入門書の情報収集かよ
てかネタだよな?
0751デフォルトの名無しさん (ワッチョイ 2154-SJkM [180.235.0.69])
垢版 |
2019/12/23(月) 07:02:49.05ID:C376Wcca0
neural machine translationを試してるけど
ユーザー辞書を指定する方法が分からない

誰か教えて
0752デフォルトの名無しさん (ワッチョイ c101-Rp4x [126.243.47.200])
垢版 |
2019/12/23(月) 07:57:44.83ID:OGRagDqQ0
print('Hello World')
0755デフォルトの名無しさん (ワッチョイ 4f54-ieRt [180.235.0.69])
垢版 |
2019/12/29(日) 10:57:12.10ID:qpN3wIzL0
NICTはなぜオープンソースで公開しないんだろう

MSやGoogleやFacebookはGitHubにアカウントを持っていて
研究成果を公開しているのに

NICTもそれらのオープンソースを利用しているくせに公開しない
0756デフォルトの名無しさん (ワッチョイ df10-YTym [153.131.102.129])
垢版 |
2019/12/29(日) 11:57:05.52ID:qLN9wlkm0
企業は収益を得る手段がほかにあるけど
研究機関は違うのも関係あるように思う
0758デフォルトの名無しさん (アウアウエー Sa5f-/WEI [111.239.173.156])
垢版 |
2019/12/29(日) 13:53:29.86ID:TN/x0Ru2a
現代のIT企業は研究成果をオープンにすることで世界中からフィードバックを貰うことで超速で進化しているんだけど
日本の古典的大企業や研究機関は研究成果を隠すことで他と差別化できると思い込んでいる
GAFA躍進前の時代なら日本式もそれなりに良い方針だったかもしれないが
今の時代ならその隠した研究成果と同等かそれ以上のものがその内GAFAから生まれるだろうから無意味
研究機関がGAFAのようにオープンにした成果を利用した金儲けができないことが問題なのであれば
金儲けできるように日本のローカルルールを変更すればいいだけ
0761デフォルトの名無しさん (ブーイモ MMdf-Wq+o [49.239.65.2])
垢版 |
2019/12/29(日) 20:25:01.95ID:by75XqYfM
研究スピードがどうしても海外より劣るから、モノを公開しちゃうと置いてかれるんだよ。
日本の研究機関の風土の問題じゃなくて、研究以外もこなさなきゃいけない人達が合間を縫って研究するしかない
日本の科学技術に対する制度設計の問題。
0765デフォルトの名無しさん (ワッチョイ 4f54-2tmj [180.235.0.69])
垢版 |
2019/12/29(日) 23:56:49.13ID:qpN3wIzL0
実装公開するのが世界標準
0767デフォルトの名無しさん (ワイーワ2 FFdf-v1fK [103.5.142.234])
垢版 |
2019/12/30(月) 12:19:39.72ID:WAqdspciF
>>762
国民の財産で私服を肥やすNHKはもっと悪質
0768デフォルトの名無しさん (ワッチョイ 6fab-T8LE [39.111.85.105])
垢版 |
2019/12/30(月) 12:43:25.39ID:cr0/Lsx50
公開出来るレベルのソース書けてるか、ライブラリ設計する能力があるか、も問題になりそうだけど、その辺も磨くと、ワイのような暇してる野良開発者もOSSなら協力出来るという特典はあるね
正直、研究系のITの仕事はパートタイムの30年前のサーバ管理みたいなのが多くて手伝えん
0771デフォルトの名無しさん (ワッチョイ 77dd-2tmj [122.249.73.11])
垢版 |
2019/12/30(月) 15:54:00.51ID:iq/klXJD0
古い日本人の陰湿さだよな結局
0773デフォルトの名無しさん (ワッチョイ 77dd-2tmj [122.249.73.11])
垢版 |
2019/12/30(月) 16:21:10.72ID:iq/klXJD0
産総研、JST、NICT、理研あたりは実装公開しろ
0774デフォルトの名無しさん (オッペケ Sr1f-6GiO [126.255.57.149])
垢版 |
2019/12/30(月) 17:47:06.43ID:hVGBluVVr
>>770
んなこたーない
スパゲッティなコード書かれたら検証も追実験もやりにくくなる
機械学習の論文の再現性がないのは大きな問題になっている
0775デフォルトの名無しさん (アウアウカー Sa5f-m3Y+ [182.251.146.214])
垢版 |
2019/12/30(月) 17:47:44.68ID:8pRHoXtUa
研究報告の本質は再現性の有無を確認してもらうことだ
機械学習分野で言えば都合のいい学習データ、テストデータを使っていて実用上そんな状況あり得ないとか、ハイパーパラメータどう決めたのかとか疑おうと思えばいくらでも疑える点は出てくる
それを払拭する唯一の方法は実際に書いたソースそのものを出すこと
そのソースは最早論文の一部なのだから書いた人にしか分からない滅茶苦茶なものを公開して「公開したのだからこれでいいだろ」などというのはあり得ない
0776デフォルトの名無しさん (ワッチョイ df10-YTym [153.131.102.129])
垢版 |
2019/12/30(月) 17:58:08.77ID:U5SCa4jH0
>>775
ソースコード出しても他のデータでの
汎化誤差が小さいかどうか判らなくね?
0779デフォルトの名無しさん (ワッチョイ ff4b-VnBs [211.131.185.17])
垢版 |
2019/12/30(月) 22:05:07.58ID:lxiCJ2Yf0
企業もIT云々と言われた時代から金を掛けないし人を育てようともして無かったんで伸びないだろ
AIについてソフトバンクの孫が日本は遅れていると吠えてたけどまともな人材すら流れて来てないんじゃないか
企業にとっては若者をいかに騙して利益を吸い取るかっていう分野だろう
日本ではIT土方より土方の方が将来性ある
0780デフォルトの名無しさん (ワッチョイ ef1d-uaPE [143.189.31.12])
垢版 |
2019/12/30(月) 23:34:55.91ID:HsGQHO6z0
stanとかPyMCって明らかに統計解析向きでシステムに組み込みづらいけど、
明らかにNNよりベイズの枠組みで変数間の関係を記述する方が優れているので、数学弱者でも自力でアルゴリズムを導出する事なく、kerasみたいにシステムに組み込めるようになる日は来るんだろうか。
0785デフォルトの名無しさん (オッペケ Sr1f-6GiO [126.255.57.149])
垢版 |
2019/12/31(火) 09:51:08.49ID:rB5IKPkdr
>>782
そして誰もいなくなった
0786デフォルトの名無しさん (オッペケ Sr1f-6GiO [126.255.57.149])
垢版 |
2019/12/31(火) 09:52:45.34ID:rB5IKPkdr
>>783

> 情報系の研究はソースコード公開してても読むやつほぼいないよ

どうやって調べたの
0791デフォルトの名無しさん (ワッチョイ 4f54-2tmj [180.235.0.69])
垢版 |
2019/12/31(火) 13:56:00.88ID:NUJAOpc70
日本の論文だけなんだよ実装がないのって
海外のは下の脚注にgithubで公開してるぜとある
0792デフォルトの名無しさん (アウアウエー Sa5f-/WEI [111.239.172.205])
垢版 |
2019/12/31(火) 15:39:29.45ID:K5ePzvxLa
機械学習分野なんて玉石混交の論文が日々大量に出回っているのに読みやすさを無視して「有益なら読む人はいるだろ」
という態度で書いたものを読んでもらえるのなんて既に実績上げているごく一部の人だけなんだよな
0796デフォルトの名無しさん (アウアウエー Sa3f-UAPS [111.239.68.176])
垢版 |
2020/01/01(水) 03:50:18.57ID:Bw/I0Y2Fa
ソース公開しないのは発展性がない論文だからだよ
要は書き逃げ。そこから次々に論文が出てくるようなら
否応ざるにコードもちゃんと書かなければいけなくなる
それをしないということはその論文はゴミ、あるいは捏造
0806デフォルトの名無しさん (ワッチョイ 6b05-g2RO [116.94.174.100])
垢版 |
2020/01/01(水) 16:47:20.30ID:YftyIXIv0
>>803
お前はバカなんだから黙ってろ
0808デフォルトの名無しさん (アウアウカー Sacf-EDwQ [182.251.144.16])
垢版 |
2020/01/01(水) 17:17:44.38ID:Q+lm5ndma
>>805
公開情報のみから判断した人に捏造と疑われても仕方がないということ
>>801は「ソース公開されないと実行できないとかいうレベルの人向けに書いてるわけじゃない」と言っているが論文をいくら読み込んでも必要な全情報が含まれないことなどザラにあるのだから実行して確認したくてもできないことが多い
だったら最初からソース丸ごと公開しろよ、ということ
その方が無駄な疑いに基づく手探りの検証過程などすっ飛ばして早く自分の成果を認めてもらえるのだから
0812デフォルトの名無しさん (ワッチョイ 6b54-BJMr [180.235.0.69])
垢版 |
2020/01/01(水) 19:32:55.99ID:2Yvb+gk50
だから日本は遅れてる
何とかしろよ
0814デフォルトの名無しさん (ワッチョイ ab01-FlZP [126.25.131.86])
垢版 |
2020/01/01(水) 19:52:14.44ID:AV+0j7FA0
連日報道でもされん限り問題になってないとか思っちゃうバカ?
何をもって問題になってるなってないというかによるとしか言いようがない。
使ってなけりゃ社会的な問題にはならんだろうし。
少なくとも「まるっきり信じてやったら上手くいきませんでしたー俺は悪くありません」
とか言い出す奴は、自分の職場では大問題だわ。
0816デフォルトの名無しさん (ワッチョイ cb01-uetj [60.86.178.93])
垢版 |
2020/01/01(水) 20:50:13.15ID:W/LYnAl/0
>>809
> 結果が疑わしかったり論拠があやふやな論文はさすがに査読で落とされていると信じたい
希望論でつねわかります

>>815
実験系だと
論文の結果そのものは
往々にしてミラクルなオリンピックレコード的な伺か
って暗黙の了解なんだけどぬ・・・
0820デフォルトの名無しさん (ワッチョイ 6b54-hZl1 [180.235.0.69])
垢版 |
2020/01/02(木) 07:41:44.81ID:abNQ9/EA0
まともな論文はオープンなデータを使うか
実験に使ったデータを公開してる

JST、産総研、NICT、理研、NTTあたりはこれらもやってない
0822デフォルトの名無しさん (ワッチョイ 3b02-pIXJ [58.70.65.108])
垢版 |
2020/01/02(木) 11:12:59.42ID:VAl9vceh0
データの選択によって再現性が失われているなら、抽出データが偏ってるし、
普通は検証段階で確認する

しかし、精度の高いモデル作りました→実践投入
で、新規データを食わせたら精度が右肩下がりって良くある光景
0824デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/02(木) 14:23:33.66ID:CkITwvFM0
>>822
よく言われる過学習になってると思う
過学習かそうでないかは未知データで訓練と同程度の性能が出るかどうか以外の判別方法ある?
0828デフォルトの名無しさん (ワッチョイ 6b54-BJMr [180.235.0.69])
垢版 |
2020/01/02(木) 23:09:33.24ID:abNQ9/EA0
日本の研究期間は
本当の意味で研究に寄与してない

松尾豊あたりがちゃんと言わなきゃダメだろ
0831デフォルトの名無しさん (アウウィフ FF0f-p4uH [106.171.76.178])
垢版 |
2020/01/03(金) 11:57:25.32ID:lHIykz7yF
>>827
ほんそれ
日本の教育構造の欠陥だな
0832デフォルトの名無しさん (ワッチョイ ab01-CjBp [126.161.32.147])
垢版 |
2020/01/03(金) 15:30:23.04ID:W71Q+2T/0
>>831
主語デカ
0843デフォルトの名無しさん (ワッチョイ 6b54-hZl1 [180.235.0.69])
垢版 |
2020/01/04(土) 08:10:20.67ID:0FWfySRB0
PFNの連中でもいいけど
日本のAIベンチャー(笑)から建設的な意見が出てこないのも悲しい

やっぱり山師なんだろう
0846デフォルトの名無しさん (ワッチョイ 3bdd-BJMr [122.249.73.11])
垢版 |
2020/01/04(土) 11:41:58.28ID:ENDwxYLV0
公開するのってキリスト教的な考えなのかな
寄付みたいな

日本はどうも閉鎖的
0847デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/04(土) 11:42:29.12ID:j2BUyZ6N0
複数のデータセットでエラー率を測定して
その母比率を区間推定して
下限値が要求するレベルを超えているかどうかで
そのモデルを採用するか否か判別する方法はどうか

エラー率を他の指標にしてもいいかもしれない
0848デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/04(土) 11:43:40.22ID:j2BUyZ6N0
過学習しているモデルなら
エラー率の分散が大きくなると予想して
区間推定の区間が広くなって
下限値が下がると思う
0852デフォルトの名無しさん (アウウィフ FF0f-p4uH [106.171.67.82])
垢版 |
2020/01/04(土) 12:31:23.41ID:trUJS7QSF
線形代数が難しいって言ってる人に聴きたいんだが
具体的にどの辺で詰まってるの?
0855デフォルトの名無しさん (アウアウウー Sa0f-CjBp [106.154.136.90])
垢版 |
2020/01/04(土) 13:12:18.47ID:lipfO/3va
>>844
イメージも一緒に公開するまでだ
0856デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/04(土) 13:20:23.20ID:j2BUyZ6N0
>>849
訓練に必要なデータ数はどの程度か目安を計算する式ある?
テスト用ならそれよりもっと少なくていいんじゃね?
0857デフォルトの名無しさん (ワッチョイ 9fb3-Hx/H [125.173.52.11])
垢版 |
2020/01/04(土) 14:13:41.19ID:CQ4m6M+L0
教育やってるけど難しいと言ってる人は大抵固有値問題で引っかかる
0862デフォルトの名無しさん (ワッチョイ 6b54-BJMr [180.235.0.69])
垢版 |
2020/01/04(土) 17:12:16.04ID:0FWfySRB0
じゃなくて
研究者としての矜持くらい持てよ
0865デフォルトの名無しさん (エムゾネ FFbf-37P1 [49.106.174.144])
垢版 |
2020/01/04(土) 19:20:25.08ID:mrNm0sQkF
ロジック/ロジカルシンキング/論理的思考と一般的に呼ばれるもので物事を解決しようとすると、基本的な問題解決のための方法は
帰納法によるアプローチ
演繹法によるアプローチ

この二つの何れかのアプローチに分けられる。
0875デフォルトの名無しさん (ワッチョイ 9fb3-Hx/H [125.173.52.11])
垢版 |
2020/01/04(土) 19:52:14.75ID:CQ4m6M+L0
公衆無線LANで何寒いこと書いてるねん
0876デフォルトの名無しさん (ワッチョイ 3bdd-BJMr [122.249.73.11])
垢版 |
2020/01/04(土) 20:19:20.64ID:ENDwxYLV0
ねー
文系出身のワナビーだろう

直感はどちらに分類されるのだろうね
0879デフォルトの名無しさん (アウアウエー Sa3f-UAPS [111.239.66.98])
垢版 |
2020/01/04(土) 20:52:46.32ID:YBqf4hfGa
日本での研究者の評価というと、真っ先に思い浮かぶのが科研費
過去の論文の数を基に、今後の計画を立てて予算申請する
一応審査しているのは専門家
専門性の高い論文を書いているかどうかが評価の基準
情報公開は・・・評価されるのかな?
そういうのを書く項目がないような気がする
0881デフォルトの名無しさん (ワッチョイ ab01-FlZP [126.25.131.86])
垢版 |
2020/01/04(土) 22:06:24.08ID:NL29rqkc0
>>856
そんなものはない。
あってもVC次元使った奴とかバウンドが実際のデータ数よりも圧倒的に多いものしか計算できなくて
全く使い物にならん。
テストデータのサンプル数も何回か試して精度が安定する個数に設定するってのが現状。

この仕事、やってない奴ほど理論でなんとかなると思ってんだよな。
そこが実際とのギャップになってめんどくさい議論を増やしてる。
0892デフォルトの名無しさん (ワッチョイ ab27-eg9S [164.70.253.210])
垢版 |
2020/01/05(日) 06:22:18.52ID:+jir1/5X0
自然言語処理のツールの使い方を覚えたいんですが
具体例のあるブログ記事ってないでしょうか

keras とか ALBERT とか tensorflow とかでてくるんですが
どれもインストール方法とかの説明はあるんですが
はじめからセットしてあるモデルに対して精度を出力して終わりみたいなブログ記事ばかりで
実際に日本語で質問文を投げてAIが返答するようなプログラムの書き方みたいなのが一切出てこないです

どうやって勉強すればいいんでしょうか

情報系の大学院生でプログラムはそこそこ経験があるんですが
AIに関しては原理を講義でならっただけでtensorflow すら使ったことがないレベルです
もうじき就活がはじまるのでAIが使えるってだけで有利になるらしいので
サンプルシステムを作ってみたいと思ってます
0893デフォルトの名無しさん (ワッチョイ 0f63-bcBw [153.218.137.102])
垢版 |
2020/01/05(日) 06:28:31.48ID:kv6ApXZt0
それは世間的には基礎的かもしれないが
現行のAIはそこまで対応してないだろ
文書の内容を機械が理解するのは高度
とりあえず日本→英語の翻訳を実装してみれば手がかり、オリジナリティを得られるのでは?
一般的な、唯一の手法はないという前提だが、じぶんがしらないだけかもしれないが
0894デフォルトの名無しさん (ワッチョイ 0f63-bcBw [153.218.137.102])
垢版 |
2020/01/05(日) 06:35:30.27ID:kv6ApXZt0
2019/08/19 05:01
AI翻訳が人間超え、言葉の壁崩壊へ
1人に1台、自動翻訳機、多言語“通訳”がポケットに
第1部:市場動向
https://tech.nikkeibp.co.jp/atcl/nxt/mag/ne/18/00046/00001/



2019/08/20 05:02
AI翻訳が人間超え、言葉の壁崩壊へ
トランスフォーマー時代到来、翻訳技術から汎用言語系AIに
第2部:技術動向
https://tech.nikkeibp.co.jp/atcl/nxt/mag/ne/18/00046/00002/
0895デフォルトの名無しさん (ワッチョイ 0f63-bcBw [153.218.137.102])
垢版 |
2020/01/05(日) 06:41:07.68ID:kv6ApXZt0
総務省・NICT主催「多言語音声翻訳アイデアコンテスト」(第2回)優秀賞決定!
多言語音声翻訳コンテスト運営事務局 2019年12月19日

総務省と国立研究開発法人情報通信研究機構(NICT)は、12月14日(土)TEPIAホールにて、
多言語音声翻訳技術の更なる普及や多種多様な翻訳サービスの出現を加速するため、
世界の「言葉の壁」をなくす新しいアイデアを募集する「多言語音声翻訳アイデアコンテスト」(第2回)審査会及び表彰式を開催いたしました。
https://prtimes.jp/main/html/rd/p/000000002.000050519.html
0897デフォルトの名無しさん (ワッチョイ ab27-eg9S [164.70.253.210])
垢版 |
2020/01/05(日) 07:05:39.44ID:+jir1/5X0
>>893
ツールを使うだけではBOT同志で会話するっていうのは無理で
かなり高度なチューニングの知識?がいるってことなんでしょうか

ライブラリに適当な文章大量に流し込めば勝手に知識獲得してしゃべりだすものかと思ってました
0898デフォルトの名無しさん (ワッチョイ 0f63-bcBw [153.218.137.102])
垢版 |
2020/01/05(日) 07:15:11.42ID:kv6ApXZt0
人工知能が2019年センター試験の英語筆記本試験で185点を獲得 2019年11月19日

人工知能プロジェクト「ロボットは東大に入れるか」の一環として、大学入試センター試験の英語筆記科目に挑戦した結果、185点(偏差値64.1)の成績を収めた。

NTTコミュニケーション科学基礎研究所(NTT CS研)ではこのプロジェクトを自然言語処理および知識処理の基礎研究を進めるベンチマークとして捉え、自動解答に関する知見を積み重ねてきた。

近年は深層学習に基づく文書読解技術が進展しており、そのなかの最新技術であるXLNetは、大規模テキストによる事前学習をベースモデルに、問題の性質に合わせた移転学習を施すことで、異なる種類の問題を比較的少量のデータから効率的に解くことを可能にした。

しかし、学習に利用できるデータが大きく不足している問題や、解答に辞書的な情報が不可欠な問題では、十分な精度の解答が得られなかった。
今回NTT CS研は以下の点で改善を施し、過去3年間のセンター本試験/追試験に対して適用した結果、安定して偏差値60以上を達成したという。

不要文除去問題の高精度化
機械学習は正解と不正解のデータの両方を入力して学習するが、文章から不要な文を見つける比較的新しい「不要文除去問題」には適用できない。
というのも、通常の文章には不要な文が含まれておらず、学習に用いるデータを集めることが難しいためだ。このため従来のAIでは、本試験/追試験で15問中6問しか正解できなかった。

そこで、不要文を含まない通常の文章から、文の順序を組み替えて擬似的に不自然な流れを作成することで、大量の不要文除去問題を自動作成する手法を考案。
これにより15問すべて正答できたという。また、過去問や独自作成問題からなるベンチマークデータにおいても、正答率を60%から86%までに高められた。

https://pc.watch.impress.co.jp/docs/news/1219388.html
0899デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/05(日) 13:14:15.07ID:5vFDsLtv0
>>881
ないならつくるのが研究者の課題じゃ無いのかな?
0900デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/05(日) 13:16:19.91ID:5vFDsLtv0
科学って帰納的に仮説を立てて実証することの繰り返しじゃね?
その仮説を立てたりどんな実証方法があるかを考えたりするのにこれまでに判っている事を演繹的に適用して論理展開する
両方の思考が必要だと思う
0901デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/05(日) 13:17:44.79ID:5vFDsLtv0
>>882
時間や空間が絶対的なものではなくて光の速さが絶対的だと言う仮定を元に演繹的に論理展開していったものだと理解している
0902デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/05(日) 13:19:41.39ID:5vFDsLtv0
>>890
あなたはそうかもしれないけど世の中的には
実験で確認されて初めてノーベル賞もらったりしてるけどな
ヒッグス粒子もそうだったし
0906デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/05(日) 14:55:53.83ID:5vFDsLtv0
>>904
湯川博士とか理論物理で進展した領域もあると思う
実験で確認されないとただの仮説だけど
0907デフォルトの名無しさん (ワッチョイ cb01-uetj [60.86.178.93])
垢版 |
2020/01/05(日) 15:01:35.73ID:Xx30ZH0k0
>>897
(ヾノ・∀・`)ナイナイ

大量に話しかけてやれば
そのうち
それっぽい応答するようになる、かもしれない
日本語対応Python3系のコードっていうと
ちょっと古いが、
unmoっていうのがある。
探して読んでインスコして遊んでみれ。
0908デフォルトの名無しさん (ワッチョイ ef1d-iOMu [143.189.31.12])
垢版 |
2020/01/05(日) 15:38:21.14ID:rjC1FbEm0
ガチ勢はフツーの線形代数じゃなくて、行列の微分が自然に出てくる領域で、
一般相対論とスキルセットで親和性が高かったりする。
0909デフォルトの名無しさん (ブーイモ MMbf-eGyC [49.239.69.93 [上級国民]])
垢版 |
2020/01/05(日) 17:38:18.20ID:qqN6BGPlM
>>906
もちろん理論も大事なんだけど、物理の場合は理論がいくら発展しても実験で確かめられないと意味がないという風潮があるよ
電磁気力、弱い核力、強い核力を統一する大統一理論の有力候補の超対称性理論ってやつも、多分理論としてはかなり綺麗にまとまってるんだと思うけど、超対称性粒子が全然実験で検出されないからなかなか立場的に厳しいみたい
重力まで統一する万物の理論に関しては、例えば超弦理論なんかだと決めるべきパラメータが多すぎて、また実験も惑星規模の加速器を作ったりしなきゃいけないらしく、現実的にこの世界に適合する超弦理論が得られるかというと怪しいみたいで、物理学の仮説として取り扱うのすら反対意見があるらしいよ
0911デフォルトの名無しさん (ワッチョイ efda-37P1 [223.217.162.112])
垢版 |
2020/01/05(日) 18:08:53.21ID:qL+E1kAs0
実験検証でのデメリットとしては、実験でよい結果が得られた⇒だから正しい⇒終わり
としてしまう人が発生すること。

たまたま偶然よい結果がでただけの可能性を疑わない人がいるんですよね。

○-○aveなんかはその最たる例ですね
0912デフォルトの名無しさん (アウアウウー Sa0f-qQU+ [106.154.126.11])
垢版 |
2020/01/05(日) 19:11:04.25ID:aadHI+RPa
アニーリング方式は100%最適解が求まる類のものではないんじゃないの?
量子の振る舞いの結果を計算結果とみなすってことだろうし
量子ゲート方式なら論理演算ができるのかもしれないけど

ノイマン型でも誤り訂正とかしないとミスは起きるし
量子ビットも誤り訂正とかの技術が確立されてきたらエラー率が下がるんじゃないかな
0913デフォルトの名無しさん (ワッチョイ efda-37P1 [223.217.162.112])
垢版 |
2020/01/05(日) 19:22:52.95ID:qL+E1kAs0
>アニーリング方式は100%最適解が求まる類のものではないんじゃないの?

そのとおり。量子アニーリングで得た結果は最適解である保証はありません。

結果だけ切り取った結果、無駄な投資を生んでしまい、日本の量子コンピュータ検討の邪魔する結果となってしまいました。
0916デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/05(日) 20:06:43.95ID:5vFDsLtv0
組合せ最適化問題を解ければ判別問題の学習結果を
より早くより正確に得られるようになるんじゃね?
0921デフォルトの名無しさん (ワッチョイ 0f63-bcBw [153.218.137.102])
垢版 |
2020/01/06(月) 06:54:23.54ID:KyZp9b9y0
いよいよ人間超え、AI最新事情 文章読解でもAIがついに人間超え、グーグルの「BERT」発表から1年で急成長
2019/11/13

文章読解でもAIがついに人間超え、グーグルの「BERT」発表から1年で急成長

かつてはディープラーニング(深層学習)の適用が難しいと言われていた自然言語処理の分野でも、人工知能(AI)が人間の認識精度を上回るようになった。

グーグルが2018年10月に発表したBERTは、文章の「言語らしさ」を予測する言語モデルを「Transformer」というニューラルネットワークを多段に重ねて実装したものである。
言語らしさの予測は、AIが単語や文章を理解したり自然な文章を生成したりするうえで必要不可欠な要素である。

言語モデルの応用先としては、機械翻訳や機械読解、質問応答、言葉の言い換え(換言)、表現が異なる2つの文章の意味が同じかどうかの判断(含意関係認識)などがある。
グーグルのBERTは自然言語処理の世界に衝撃を与え、論文の発表からわずか1年で2200件以上も他の論文に引用されるほどになった。
これは、BERTが応用に関するベンチマークで人間の精度を上回る成果を上げたからだ。

文章読解のスコアで人間超え

具体的には機械読解のベンチマークである「SQuAD 1.1」で人間の精度を上回った。
SQuAD 1.1は米スタンフォード大学が作ったベンチマークで、「Wikipedia」の中にある140単語ほどの文章を読み解かせて、その文章に関する質問に回答させる。
正答は元の文章の中にフレーズとして存在する。正答の部分を正しく抜き出せるかどうかがポイントとなる。

SQuAD 1.1はタスクとして単純すぎるという指摘もある。
SQuAD 1.1よりタスクの難易度が高いベンチマークは「SQuAD 2.0」や「GLUE」など他にもあり、そうしたより難しいベンチマークではBERTは人間を上回れなかった。
しかしBERTが一部でも人間をスコアで上回ったことから、この分野の研究が一気に加速し、今ではBERTを改善した手法が、より難しいベンチマークでも人間超えを果たすようになった。

https://tech.nikkeibp.co.jp/atcl/nxt/column/18/01056/111200002/
0922デフォルトの名無しさん (ワッチョイ 3bdd-BJMr [122.249.73.11])
垢版 |
2020/01/06(月) 16:22:20.03ID:7M4Z0nKv0
この手のテストに和文が無いからいまいちよくわからん
0923デフォルトの名無しさん (ワッチョイ 6b54-hZl1 [180.235.0.69])
垢版 |
2020/01/06(月) 19:21:10.07ID:SSsR6M4H0
MSRの連中が描いた本(pdf)だってさ

Foundations of Data Science
https://www.cs.cornell.edu/jeh/book.pdf

日本の研究者はなーんもしない
0924デフォルトの名無しさん (アウウィフ FF0f-p4uH [106.171.87.46])
垢版 |
2020/01/07(火) 15:50:31.93ID:2Dq0zKSWF
>>868
1 + 1 は 2 にはならんよ
大抵の場合 2 未満で 1.5 とか 1.0 とか
酷い時には 1 未満になることの方が多い
0925デフォルトの名無しさん (ワッチョイ 4f7c-I5PR [113.32.86.138])
垢版 |
2020/01/07(火) 16:00:42.05ID:8esPW0SX0
>>908
<・∇・>ニダ
0929デフォルトの名無しさん (ワイーワ2 FF13-Eg5K [103.5.142.233])
垢版 |
2020/01/09(木) 11:42:39.35ID:0RBXSUPhF
https://hayabusa9.5ch.net/test/read.cgi/news/1578536733/
NVIDIA製GPUドライバーに深刻な脆弱性、いますぐIntelオンボードを利用に切り替えてください
0931デフォルトの名無しさん (ワッチョイ 5bda-2fhw [223.217.162.112])
垢版 |
2020/01/10(金) 02:20:32.44ID:xMwSVvEb0
まあ、学生さんはデータナンちゃらリストなんてうつつ抜かしてないで、各専門の基礎教科の習得に励みましょう。

機械学習なんてあくまで多数ある問題解決手段の1ツールに過ぎない。そもそも機械学習の習得なんて社会人からでも十分。
0933デフォルトの名無しさん (ワッチョイ fddd-fF6T [122.249.73.11])
垢版 |
2020/01/10(金) 11:21:21.64ID:dy6nGdDz0
数年後には無くなってそう>>データサイエンティスト
0937デフォルトの名無しさん (ワッチョイ 6501-ErPi [126.242.217.97])
垢版 |
2020/01/10(金) 12:35:48.58ID:K/lWprnk0
秀吉はデータサイエンティスト。
0938デフォルトの名無しさん (アウアウウー Sa19-8whf [106.180.2.62])
垢版 |
2020/01/10(金) 12:47:28.71ID:ap2klRr+a
技術者にはもともとデータサイエンティスト的な要素があったのに、それだけが妙に持ち上げられた
そのうち、訳もわからずデータをライブラリにぶち込むだけの人をデータサイエンティストと蔑むことになるよ
0940デフォルトの名無しさん (ワントンキン MMa3-fF6T [153.248.186.192])
垢版 |
2020/01/10(金) 14:59:12.98ID:jdArXowMM
マクロかexcelにツールがついて終わり
0941デフォルトの名無しさん (ワッチョイ 239c-fZro [61.125.210.189])
垢版 |
2020/01/10(金) 16:48:37.09ID:3HDQydXj0
若手の自称データサイエンティストと話すと
linuxわかりませんとか言う人マジで多くて嫌になる
どこがのスクール出身なのか?
クラウドのjupyter notebook上でしかコード書いたことないらしい
マジで基礎がガバガバ
そこを身につけるのは地味で退屈だから最近の人はやりたがらないのはわかるが
0951デフォルトの名無しさん (ワントンキン MMa3-fF6T [153.248.186.192])
垢版 |
2020/01/10(金) 19:00:13.93ID:jdArXowMM
msの技術力を侮ってはいけない
いずれexcelに付くよ
0953デフォルトの名無しさん (ワッチョイ 0b10-xl+7 [153.131.102.129])
垢版 |
2020/01/10(金) 19:16:19.21ID:9TebhQDM0
>>943
少し前にexcelのマクロ言語にPythonを採用するとか言う噂が上がってたけどな
今はその話は無くなってPythonからexcelを操作してくれってことになってると思う
0954デフォルトの名無しさん (ワッチョイ 0b10-xl+7 [153.131.102.129])
垢版 |
2020/01/10(金) 19:19:06.71ID:9TebhQDM0
>>949
社内ルール的なものはマニュアル作れば解決する問題だと思うけど
その判らない人に作るように言って判らないところは仮で書いてもらって訂正すればいいのでは?
0955デフォルトの名無しさん (ワッチョイ 0b10-xl+7 [153.131.102.129])
垢版 |
2020/01/10(金) 19:20:16.63ID:9TebhQDM0
>>952
表示の更新とか完了するまで再計算を停止するとスピード上がる
0956デフォルトの名無しさん (ワッチョイ 0b10-xl+7 [153.131.102.129])
垢版 |
2020/01/10(金) 19:22:21.42ID:9TebhQDM0
ピボットテーブルとかはexcelの方が作業効率良くない?
GUIで操作できるし
0959デフォルトの名無しさん (アウアウウー Sa19-vCMi [106.154.137.133])
垢版 |
2020/01/10(金) 19:55:10.38ID:hc3qGoBHa
>>933
誰でもタイピングする様になってタイピストが居なくなったように、データサイエンティストもなるかもね
0961デフォルトの名無しさん (ワッチョイ 5b1d-3ULX [143.189.31.12])
垢版 |
2020/01/10(金) 20:24:48.47ID:eyebCCoV0
filemakerとかkintoneの流れでexcellって消えていくのかと思ってた。
pythonも使えるようになってるっぽいし、pandasとかRとGUIが融合したみたいになっていくのか。
0962デフォルトの名無しさん (ワッチョイ 6501-ErPi [126.242.217.97])
垢版 |
2020/01/11(土) 01:41:29.68ID:r5wulSj/0
Linux板でよくExcel対スパコンみたいな話してるけどな。
Excelはスパコンより性能が低いからもうWindows使わないみたいな。
0964デフォルトの名無しさん (アウアウエー Sa93-rY/a [111.239.175.136])
垢版 |
2020/01/11(土) 11:41:24.42ID:vkWme/+ta
Excelはあくまでデータとビューが同時に確認できることがメリット
明らかに一画面に収まらないぐらい大量のデータや大量のグラフが必要になるものをExcelで処理している時点で使い道を誤っている
一画面に収まらないなら素直にデータとビューを分離できる仕組みで処理すべき
0968デフォルトの名無しさん (ワッチョイ 0bbb-ZJ4Y [217.178.3.78])
垢版 |
2020/01/12(日) 03:23:49.39ID:gh55rPFY0
>>965
そんで、最終的に
Excelでレポートにする

単に、適材適所と思わん?
0969デフォルトの名無しさん (ワッチョイ 0bbb-ZJ4Y [217.178.3.78])
垢版 |
2020/01/12(日) 03:26:42.09ID:gh55rPFY0
ライブラリ使わずに自分でAIプログラム書きました
といわれても、プログラムが信用できへんで
0970デフォルトの名無しさん (ワッチョイ 6501-ErPi [126.242.217.97])
垢版 |
2020/01/12(日) 04:33:11.51ID:Uj5X0q1W0
Excelのシートは業務のノウハウそのものなので、使われてきたシートのせいでシステム化が出来ないというのなら、インテグレータとして失格だと思うというか、普段なんでお金貰えてるの?と不思議に思う。
OAと言ってた頃はまさに詐欺で飯食ってたけど。
いま同じことしたら普通に詐欺で訴えられると思う。
0971デフォルトの名無しさん (ワッチョイ 5501-ErPi [220.56.102.222])
垢版 |
2020/01/13(月) 00:58:09.24ID:HVnwH/nI0
≪株式会社学情 調査≫
『2020年卒 就職人気企業ランキング【速報】』
http://service.gakujo.ne.jp/files/7415/5374/1191/2020_ranking.pdf

IT・ソフトウェアの最上位
26位 アマゾンジャパン

AIとか若い奴は興味ないんだろうな
0973デフォルトの名無しさん (ワッチョイ 5501-ErPi [220.56.102.222])
垢版 |
2020/01/13(月) 01:08:04.53ID:HVnwH/nI0
>>970
まー日産っていう大きい会社のカリスマ経営者と言われている英雄ですら
ペテン師みたいなもんだからな
大量に解雇して金をこっそり奪い取るんだ!ぐらいの気持ちが無いと
金持ちにはなれんぞ
0974デフォルトの名無しさん (ワッチョイ 5501-ErPi [220.56.102.222])
垢版 |
2020/01/13(月) 01:21:36.71ID:HVnwH/nI0
>>972
日本企業の IT・ソフトウェアで人気なのは52位のSkyだな
次が54位の楽天
次が99位のLINE
0977デフォルトの名無しさん (アウアウウー Sa19-0CUc [106.161.116.215])
垢版 |
2020/01/13(月) 07:31:56.91ID:8RyNzpcha
>>975
Arayaは?
0978デフォルトの名無しさん (アウアウウー Sa19-0CUc [106.161.116.215])
垢版 |
2020/01/13(月) 07:35:28.69ID:8RyNzpcha
>>972
イオヌッツは修士出てなかったが。
ちなみにイオヌッツは断った。
0981デフォルトの名無しさん (アウアウウー Sa19-vCMi [106.154.130.228])
垢版 |
2020/01/13(月) 12:35:20.31ID:uorRSC+xa
ノーベル賞にCS分野はないぞ
チューリング賞ならGAFAから出てるじゃないか
0982デフォルトの名無しさん (アウアウウー Sa19-vCMi [106.154.130.228])
垢版 |
2020/01/13(月) 12:38:02.23ID:uorRSC+xa
むしろGAFAは目先の金に囚われずに基礎研究にもかなり注力している印象だが
0985デフォルトの名無しさん (ワッチョイ 5501-tgR8 [220.56.102.222])
垢版 |
2020/01/13(月) 13:48:22.96ID:HVnwH/nI0
>>976
頭が良くなったんじゃないか?
使い捨ての知識を植え付けられ会社の為
一時の利益に貢献させられるより
食いっぱぐれない食品関係に長く居た方がいいっていう
起業と言っても大半は失敗する訳で
その中の本当にごく僅かな人が運的要素により成功しているが
そんな割にも合わないものにチャレンジするより安定して長く居られる会社に就職した方がいいっていう
10011001
垢版 |
Over 1000Thread
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 120日 11時間 20分 29秒
10021002
垢版 |
Over 1000Thread
5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。


───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────

会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。

▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/

▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
レス数が1000を超えています。これ以上書き込みはできません。

ニューススポーツなんでも実況