【統計分析】機械学習・データマイニング26

レス数が1000を超えています。これ以上書き込みはできません。
2019/09/15(日) 09:23:06.34ID:bjsiNRs40

機械学習とデータマイニングについて語れ若人

*機械学習に意識・知能は存在しません。
人の意識に触れたい方はスレ違いです

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
Machine Learningを用いた論文一覧2018
https://shiropen.com/seamless/machine-learning/2018
2017年のディープラーニング論文100選
https://qiita.com/sakaiakira/items/f225b670bea6d851c7ea
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング23
https://mevius.5ch.net/test/read.cgi/tech/1551352040/
-
【統計分析】機械学習・データマイニング25
https://mevius.5ch.net/test/read.cgi/tech/1561568018/

【統計分析】機械学習・データマイニング24
https://mevius.5ch.net/test/read.cgi/tech/1556674785/
-
VIPQ2_EXTDAT: checked:vvvvvv:1000:512:----: EXT was configured
VIPQ2_EXTDAT: checked:vvvvvv:1000:512:: EXT was configured
2デフォルトの名無しさん (ワッチョイ bd7c-+dKN [122.215.159.99])
垢版 |
2019/09/15(日) 09:59:37.11ID:tu3q64lr0
O2
2019/09/24(火) 23:47:17.70ID:gKQtLd2vr
XGBoostが諸刃の剣になっちまった
2019/09/25(水) 00:19:36.48ID:BREdOFJe0
前スレ>>992
べイズ統計学ってなーに?
分かりやすく教えて!
2019/09/25(水) 07:14:40.74ID:tY/xHREXM
>>4
https://to-kei.net/bayes/basic/

頻度論
パラメータが定数、データが変数(確率変数)

ベイズ統計
パラメータが変数(確率変数)、データが定数
6デフォルトの名無しさん (ワッチョイ 2388-9GzD [131.147.201.232])
垢版 |
2019/09/25(水) 08:15:33.35ID:CV7fPBbD0
>>5 最近機械学習始めたバカだけど、ベイズ統計のほうが圧倒的に役立つ気がする。
7デフォルトの名無しさん (ワントンキン MMe3-ubMc [153.236.16.185])
垢版 |
2019/09/25(水) 08:37:12.96ID:1+OtauDZM
須山がすっきりわかる本を出せばいいのに出さないのが悪い
8デフォルトの名無しさん (オッペケ Sr99-8lXu [126.200.118.202])
垢版 |
2019/09/25(水) 09:16:10.18ID:78OcKefnr
>>5
最尤推定はベイズなの?
2019/09/25(水) 09:54:14.76ID:MmbVy9zrM
前処理→頻度統計(ここでの意味は、一昔前の統計学)
機械学習の理論→ベイズ統計

前処理がうまくなると、精度が上がるだけでなく、モデルの安定性が格段に増す
理論が分かると、個別の問題設定に対応した黒魔術が出来るようになる

結論、どっちも大切
2019/09/25(水) 10:52:23.26ID:tY/xHREXM
>>8
最尤推定推定は最尤推定、ベイズ推定とは別と理解している。

深層学習とかで使う、対数尤度の式を展開するときベイズから展開する時があるような?
2019/09/25(水) 13:19:04.63ID:OmIBYJEg0
>>6
最近始めたばかりのやつがどちらが役立つかなんてわかるわけねーだろ
2019/09/25(水) 13:30:28.23ID:PT03VQPIM
でも勉強を進める上でどっち先にやればつまらないかってのはあるんじゃない
理論よりならベイズ、実務よりなら頻度だろうな
13デフォルトの名無しさん (ワントンキン MMe3-ubMc [153.236.16.185])
垢版 |
2019/09/25(水) 14:09:59.84ID:1+OtauDZM
みんなはどうやって環境構築してるの
anacondaを使ってやるのがセオリー?
2019/09/25(水) 15:07:16.78ID:PT03VQPIM
anacondaは初心者のうちだけ使う
でも最近はAWSがサポートしてるからまた使いたくなってきたな
2019/09/25(水) 18:36:46.01ID:LyljOph0p
俺、初心者じゃないけどanaconda使うわ

anaconda使うことを否定する派は
1. 昔のトラブル多い時代から触っているヤツ
2. システム環境領域にインストールするヤツ
のどっちか

個人領域にインストールする分には全く問題ない
16デフォルトの名無しさん (ワントンキン MMe3-ubMc [153.236.16.185])
垢版 |
2019/09/25(水) 18:40:09.58ID:1+OtauDZM
環境構築は今アホみたいに簡単になってるのね
参入障壁下がったなー
2019/09/25(水) 19:38:21.27ID:PT03VQPIM
condaは数年前からあるよ
2019/09/25(水) 19:39:44.94ID:PT03VQPIM
数年どころじゃないな。でも日本で広く普及したのは2015年ぐらいからだと思う
その頃にはアプリをダウンロードして解凍すればハイって
状況が整ってた。書籍もいっぱい出てたし
19デフォルトの名無しさん (アウアウエー Sa13-9GzD [111.239.39.77])
垢版 |
2019/09/25(水) 21:30:03.73ID:P5XKQ29wa
うbyにもcondaがあればな
gemじゃだめだ
2019/09/25(水) 21:32:09.14ID:jOSWKpSY0
rubygem
2019/09/25(水) 22:49:49.65ID:J2adDr870
anacondaは今でもPATHの問題はある。
それでも他のpython管理でぐっちゃになるよりかは管理は楽だったりする。
それでも問題ならコンテナ使うなりVM使うのが正解。
2019/09/25(水) 23:40:30.85ID:PT03VQPIM
個人で使うならcondaでもいいけど、
linux環境ならVMでpipかコンテナ、windowsならコンテナを使うほうが主流だと思う

pythonのコミュと、condaのコミュが喧嘩したままなのがすべて悪い
23デフォルトの名無しさん (ワッチョイ 9b66-vFU9 [183.77.218.93])
垢版 |
2019/09/26(木) 07:08:44.02ID:GjmPRA6D0
>>pipかコンテナ

コンテナっていうのはanacondaとかvirtualenvのこと?
24デフォルトの名無しさん (トンモー MMf9-tbXw [210.142.95.204])
垢版 |
2019/09/26(木) 08:47:24.45ID:/HqP+5MIM
簡単だから
ついアナコンダ使って
インスコしてしまうw
25デフォルトの名無しさん (ワントンキン MMa3-MfK0 [153.236.16.185])
垢版 |
2019/09/26(木) 09:10:37.91ID:qqF5D8YZM
重いコンダラ
2019/09/26(木) 15:00:47.07ID:nS47tYDvM
>>23
dockerを想定していた
27デフォルトの名無しさん (ワントンキン MMa3-MfK0 [153.236.16.185])
垢版 |
2019/09/26(木) 17:08:15.06ID:qqF5D8YZM
dockerかーそっかー
2019/09/26(木) 19:20:37.52ID:J18tRDCpp
>>22
気持ちは分かるなぁ

Pythonコミュニティは無償で維持し続けているのに、単なるパッケージャのAnacondaが会社まで建てて儲けまくり

それでもmklを無償で使えたり、Nvidiaのドライバがすんなり入るのはAnacondaチームの政治力だと思うんだ
29デフォルトの名無しさん (ワッチョイ 9b66-MfK0 [183.77.218.93])
垢版 |
2019/09/26(木) 21:15:34.59ID:GjmPRA6D0
mklのインストールもすんなり行くけどね
2019/09/26(木) 23:00:37.89ID:nS47tYDvM
>>28
あの会社、そんなに影響力あるんだ
31デフォルトの名無しさん (ササクッテロ Sp81-kDWV [126.35.130.245])
垢版 |
2019/09/27(金) 00:37:37.36ID:Rn9jKya4p
機械学習だけか分からんけど、英語論文に出てくるmotivationってどういう意味なの?直訳動機付けなんだけど…
32デフォルトの名無しさん (ワッチョイ 8d90-srNF [112.139.91.58])
垢版 |
2019/09/27(金) 05:01:55.83ID:WHTSWUXA0
機械学習に見切り付けるよ。サヨウナラ
客の懐事情が悪い。
2019/09/27(金) 06:28:45.14ID:GCYoetCo0
画像処理か。もうどこも導入が終わって下火だよなあ
34デフォルトの名無しさん (ワッチョイ 0552-MfK0 [118.243.197.18])
垢版 |
2019/09/27(金) 08:02:21.46ID:FC76HeOJ0
へー
2019/09/27(金) 08:39:58.85ID:7AQBen6M0
今の日本は奴隷国家だから機械学習使うよりもたいていは
人間こき使った方が採算獲れるというね。。
36デフォルトの名無しさん (トンモー MMf9-tbXw [210.142.95.17])
垢版 |
2019/09/27(金) 09:00:45.67ID:vVIjh5fvM
画像処理は世界共通だからね。
ベトナムの企業に依頼すると
日本の10分の1で済んでしまう
37デフォルトの名無しさん (ワントンキン MMa3-MfK0 [153.236.16.185])
垢版 |
2019/09/27(金) 14:41:02.85ID:wZU7EPf1M
dockerを使ったら
pipでもanacondaでもどちらでもよくね?
38デフォルトの名無しさん (ワッチョイ 2b7c-wGQq [113.32.86.138])
垢版 |
2019/09/27(金) 16:07:12.55ID:bGFj4S5H0
ちょっと酷いよね
https://toolmania.info/post-9815/
2019/09/27(金) 16:24:04.32ID:2DQWdxIUM
画像処理は仕事がまだあるけど、需要と供給が拮抗しはじめて以前ほどボロくない
あとカメラ業界が儲からなくなって、若く優秀なエンジニアが画像処理に転職してくてるから、
全体のレベルは跳ね上がって別の意味でも辛い
40デフォルトの名無しさん (ワントンキン MMa3-MfK0 [153.236.16.185])
垢版 |
2019/09/27(金) 17:04:54.88ID:wZU7EPf1M
cudnnて何でCUDA toolkitと一緒に入れてくれないんだろう
あと、なんて読むのだろう
クゥドゥン?
2019/09/27(金) 20:29:30.83ID:v6XbQiA90
画像系はとっくにコモディティ化したのかと

GCPは数十枚単位の画像で学習終了
42デフォルトの名無しさん (ワッチョイ 8d90-srNF [112.139.91.58])
垢版 |
2019/09/27(金) 23:53:42.50ID:WHTSWUXA0
>あとカメラ業界が儲からなくなって、若く優秀なエンジニアが画像処理に転職してくてるから、
カメラメーカーからソフト屋に転職してきてるのか・・・最悪だな
2019/09/28(土) 01:00:16.83ID:1q0wGLn+a
カメラ技術者をソフト会社がわざわざ雇う意味あるの?
44デフォルトの名無しさん (ワッチョイ 8d90-srNF [112.139.91.58])
垢版 |
2019/09/28(土) 01:39:26.59ID:ec95vgaT0
カメラのメーカーにもプログラマーはいる
2019/09/28(土) 06:53:25.01ID:ubKeWw8E0
カメラメーカーでCのコードを叩いてるエンジニアは、能力的には上の上でも給料的には並だったりするんだよね

BtBの画像処理は光学やカメラに対する知識の方が画像処理より重要だったりするんだけど、
奴らはそれを理解しているから機械学習を勉強して転職してくる
生粋のソフト屋より有能
46デフォルトの名無しさん (ワッチョイ 9b66-MfK0 [183.77.217.122])
垢版 |
2019/09/28(土) 06:58:42.45ID:gG4VWWHP0
妄想じゃん
2019/09/28(土) 06:59:47.47ID:ubKeWw8E0
プログラマーがカメラメーカーに就職してメカトロ勉強するのマジ辛いけど
向こうからこっちくるの超簡単じゃん。それでお給料がボンッ、ボンッと増えるんだから
侵略しにくるでしょ。俺達では太刀打ちできない
2019/09/28(土) 07:01:07.69ID:ubKeWw8E0
>>46
勉強会で知り合った人がカメラメーカーに務めていて、
彼から話を聞いた。マジ
49デフォルトの名無しさん (ワッチョイ 8d90-srNF [112.139.91.58])
垢版 |
2019/09/28(土) 07:01:35.44ID:ec95vgaT0
噂じゃねえか
2019/09/28(土) 08:03:18.08ID:eyOXXdxS0
そうだとは思うけれど絶対数がかなり少ないだろ
51デフォルトの名無しさん (アウアウウー Sa69-3AID [106.161.125.54])
垢版 |
2019/09/28(土) 12:29:51.89ID:VkgXlNvUa
>>35
人間こき使ってコスパで負けるようになって機械学習を使う。
52デフォルトの名無しさん (ワッチョイ 234b-srNF [61.116.12.29])
垢版 |
2019/09/28(土) 17:00:38.83ID:ATQt8OTo0
>>35
派遣社員っていう会社にとって都合のいい社員も存在するしな
誰があんなものを作ったのか中国やアメリカの派遣社員より相当緩い仕組みになっているし
漫画家とか技術者もそうだが中間で採取されて制作している人にはお金が行かないようになっている
全体的に上に行っても負担が増すぶん給料は上がらないんで上昇志向はどの国よりも低く
今の若い奴等は年金が支払われる前に痴呆症になってるんじゃないかっていうぐらいまで働かないといけないっていう
2019/09/28(土) 17:18:59.65ID:+uNdfll6a
そんなことは就職前から分かりきったことなんだから最初から搾取する側に入ればいいだけのこと
努力せず遊び呆けて働きだしてから「日本は搾取の構造だ!」と叫ぶ馬鹿が多すぎる
2019/09/28(土) 17:35:15.12ID:ATQt8OTo0
>>53
採取する側は叩けば埃の出るような犯罪者っぽいのがほとんど
競争社会を勝ち抜いて行った先にあるのがそれだろ
それに努力すれば金持ちになれるようなルールにはなっていない
55デフォルトの名無しさん (トンモー MMf9-tbXw [210.142.95.147])
垢版 |
2019/09/28(土) 17:46:59.71ID:uMRmbRaFM
そうそう
儲けたほうが勝ち!
楽しんだほうが勝ち!
2019/09/28(土) 17:51:02.93ID:+uNdfll6a
努力して上位大学を卒業するだけで割と簡単に搾取する側になれるルートが誰にも用意されているのに何を言っているのか
2019/09/28(土) 18:07:32.13ID:ATQt8OTo0
>>56
そう思ってるだけで実際は採取されてるんじゃないの?
上位大学ねー
競争意識を利用して国が一番採取する人材を作り出しているところだな
2019/09/28(土) 18:44:22.08ID:hL/dT4I4a
競争に買った側を犯罪者呼ばわりしたり、なんというか惨めな負け組が僻んでいるだけにしか見えない
2019/09/28(土) 19:17:43.06ID:ePVJ8sz30
ここに居るようなAIのプロなら全員自作投資AIで資産を数倍にできるし…
2019/09/28(土) 19:34:03.45ID:SjqW2YAt0
一万円を三万円にするのか
61デフォルトの名無しさん (ワッチョイ 9b66-MfK0 [183.77.217.122])
垢版 |
2019/09/28(土) 19:50:07.20ID:gG4VWWHP0
卑怯な手で勝つ奴がいるからだろ
2019/09/28(土) 20:29:02.97ID:eyOXXdxS0
>>53
こういう馬鹿がさらに搾取構造を強化してるわけだ。
63デフォルトの名無しさん (アウアウウー Sa69-SUCl [106.154.130.195])
垢版 |
2019/09/28(土) 20:57:19.58ID:y9sf8/a7a
自分が考え付かなかった=卑怯
2019/09/28(土) 20:58:01.59ID:ubKeWw8E0
>>50
しっかりした技術力を持ってるところなら大丈夫だろうな
2019/09/28(土) 21:04:22.30ID:hL/dT4I4a
「搾取する側は馬鹿だ!」と騒いだところで搾取される側は搾取され続けるんだがな
2019/09/28(土) 21:12:39.63ID:eyOXXdxS0
搾取側は騒がれるのを一番嫌がってるんだがな。
ワタミも騒がれなくなったら馬鹿が戻ってきやがったw
また地獄行きだよ。
67デフォルトの名無しさん (ワッチョイ e34b-srNF [211.131.39.123])
垢版 |
2019/09/28(土) 23:13:39.09ID:DqaXwl5j0
採取する側に立ったとして人生の貴重な時間を若い頃から費やしている訳で
お金で幸せは買えないが、時間で幸せは買えるとか
時間を重視する派の方が金を重視する派より仕事の満足度も幸福度も高いとかっていう
統計的結果が出ている中、仕事に没頭してガッツリ税金を納めている訳だから
それはそれで代価を支払っている訳で
何もかも手にしている訳では無いわけだけど
2019/09/28(土) 23:31:21.95ID:uo4KGCJsa
むしろ日本では搾取される底辺達用のきつい仕事ほど給料少なくこき使われる傾向なので自由に使える時間もなくなる
69デフォルトの名無しさん (ワッチョイ e34b-srNF [211.131.39.123])
垢版 |
2019/09/28(土) 23:38:21.63ID:DqaXwl5j0
>>68
そう思っている分野って意外に年取った奴も多く居たりしてないか?
若い奴しか居ない分野より本当に大変なのか?っていう
2019/09/29(日) 00:41:09.63ID:w1jKt74TM
プログラマーの仕事も激減するなって分かるな
AWSやGCPがいったい何人のプログラマーの仕事を奪ったか分からない奴は時代感覚がない
2019/09/29(日) 00:41:10.26ID:w1jKt74TM
プログラマーの仕事も激減するなって分かるな
AWSやGCPがいったい何人のプログラマーの仕事を奪ったか分からない奴は時代感覚がない
72デフォルトの名無しさん (アウアウウー Sa69-3AID [106.161.118.233])
垢版 |
2019/09/29(日) 01:11:21.55ID:rU7Oj6HSa
RPAで事務職がほとんど減ってないじゃないか?
73デフォルトの名無しさん (ワッチョイ 8d90-srNF [112.139.91.58])
垢版 |
2019/09/29(日) 02:45:48.79ID:eYrcqGBM0
rpa以前から事務職なんてほぼ消えている
74デフォルトの名無しさん (アウアウウー Sa69-3AID [106.161.118.142])
垢版 |
2019/09/29(日) 08:06:29.75ID:r79SZfxpa
>>73
公務員。
75デフォルトの名無しさん (アウアウウー Sa69-Tii0 [106.161.135.78])
垢版 |
2019/09/29(日) 08:36:26.89ID:Ozq3jCTSa
>>73
富士通、間接部門5千人を営業・SE等に異動…大企業の間接部門 .
https://biz-journal.jp/2018/11/post_25629.html
2019/09/29(日) 08:42:09.86ID:bEy1wMJX0
RPAってただリストラの口実に使ってるだけ。
77デフォルトの名無しさん (トンモー MMf9-tbXw [210.142.95.147])
垢版 |
2019/09/29(日) 10:32:16.40ID:T3oTPEq3M
>>70
AWSやGCPって便利だけど
使ってみたら料金の高さに唖然・呆然!
直ぐに解約した。

あの金額をプログラマに払えば
かなりプログラマは裕福になると思う。

社内にサーバー設置して
AWS風のクラウドを構成
すればいいだけ。
簡単だよ。
2019/09/29(日) 10:34:10.47ID:zYOYSMRY0
そう?
電源確保して
冗長構成して
マシンも定期的にリプレースして
のコストだと思うと妥当じゃない?
2019/09/29(日) 11:33:10.31ID:lvoGL4290
妥当だな。
てかプログラマの負担が減る方向に技術が進歩してるってのに
一向に幸せにならん社会システムの方が問題だろ。
2019/09/29(日) 13:11:38.23ID:zYOYSMRY0
それはマに限らないから・・・
2019/09/29(日) 13:19:58.43ID:Vo7qenMua
AmazonやGoogle並のセキュリティや安定稼働を社内の一部門で保証できる企業なんてほぼないんだから
今更社内に大型サーバー設置するなんて選択肢取るような企業があったら驚きだわ
82デフォルトの名無しさん (ワッチョイ e34b-srNF [211.131.0.45])
垢版 |
2019/09/29(日) 13:23:03.81ID:NshXf8dJ0
海外でも変わった国として見られているからね

「日本は暴力・薬物事件も少なく殺人件数も低く就業率も高いがいまだに貧困率が高い」と海外で報じられる
https://gigazine.net/news/20190731-japan-poverty/
2019/09/29(日) 13:32:48.88ID:o/oUThWCM
久しぶりに来たら頭悪そうなスレになってた
84デフォルトの名無しさん (トンモー MMf9-tbXw [210.142.95.193])
垢版 |
2019/09/29(日) 13:37:18.52ID:PCo7gGCmM
>>81
大型サーバーってなに?
何も知らん技術ないやつらが
AWSスゲーとか
いってんのは分かった
85デフォルトの名無しさん (トンモー MMf9-tbXw [210.142.95.193])
垢版 |
2019/09/29(日) 13:42:52.93ID:PCo7gGCmM
>>81
電源とかPCとかググってみろと
いっても理解できんだろ?
ま、50万くれたら
都内なら1日だけ時間作って
基本を教えにいってやりたい!

しかし今はアルバイトできないのよ
今の契約終わったら教えにいつてやる。
スパルタ教育だで。
殴ったりしないが馬鹿には容赦しない
罵声浴びせるから精神鍛えておけ!
2019/09/29(日) 13:42:58.24ID:Vo7qenMua
(笑)
87デフォルトの名無しさん (スププ Sd43-gkNv [49.96.35.221])
垢版 |
2019/09/29(日) 14:32:31.08ID:XhdeSoMmd
全くの初心者が初めてディープラーニングを学ぶのに
お勧めの書籍を教えて下さい。
『ゼロから作るディープラーニング』でしょうか?
88デフォルトの名無しさん (アウアウウー Sa69-3AID [106.161.124.204])
垢版 |
2019/09/29(日) 16:02:35.79ID:jzbsOTsxa
>>76
じゃ今まで社内失業者を飼っていただけの話だったのか?
富士通だけでなくNTT・NEC・東芝と併せて7万。
3メガバンで3万。3メガバンは10万やれるんだが金融庁がストップをかけたとか?
メガバンより酷いのが地銀以下、地銀以下の合併をやってリストラをやらんといかんのだが、
地銀以下の主導権争いによって全然進まない上に、せっかく当事者と金融庁まではまとまったのに公取委が独占禁止法を盾に待ったをかけたとか言う事例まで。
2019/09/29(日) 16:05:31.75ID:Dbf6PSmZ0
銀行の役目は終わってる、金の借りる企業がない
2019/09/29(日) 16:19:18.91ID:x0FBieicM
>>87
色々と読んだけど、それが一番オススメ。間違いない
1を読み終わったら、自然言語処理に興味がなくても2まで読むといいよ
2019/09/29(日) 16:24:05.36ID:x0FBieicM
データサイエンス系の機械学習エンジニアの要求スペックが高止まりして、
この業界に必要なスキルがだいたい明らかになったな

物凄く要約すると、
機械学習+自然言語処理or画像処理+クラウドアプリケーション開発
これをひとりでこなせる奴が、アメリカにはゴロゴロいる

日本はまだちょっとぬるいからスキル上げるなら今のうちだわ
2019/09/29(日) 16:25:34.32ID:x0FBieicM
ところでクラウド系の仕事は要件定義書を書くスキルがいらなくなるんじゃないかと
思ってるの俺だけ?
まあたぶんそうはならないんだろうけど、そういう感覚はあるよね
93デフォルトの名無しさん (スププ Sd43-gkNv [49.96.35.221])
垢版 |
2019/09/29(日) 16:32:37.60ID:XhdeSoMmd
>>90
ありがとうございます。
ちなみに以下のサイトとどちらがお勧めですか?
どちらが良いか迷っています。
よろしくお願いします。

https://tutorials.chainer.org/ja/tutorial.html
2019/09/29(日) 16:42:32.25ID:lvoGL4290
>>84
とりあえず同じ要件でNTTデータかアクセンチュアにでも頼んでみたら?
もっとバカみたいな見積出してくるからw
2019/09/29(日) 16:50:14.91ID:t4KppL3o0
>>91
機械学習+アプリケーション開発
AIをシステムとして展開する為には、このセットが重要だけど、後者は未だに軽視

分析は出来るけどシステム設計できない新卒を青田刈りするより
現役のSEに機械学習覚えさせたほうが使い勝手が良い
96デフォルトの名無しさん (ワッチョイ 9b66-MfK0 [183.77.217.122])
垢版 |
2019/09/29(日) 19:20:29.17ID:zYOYSMRY0
は?
何が言いたいの?
97デフォルトの名無しさん (ワッチョイ 8597-i9+B [182.171.246.142])
垢版 |
2019/09/29(日) 20:58:32.01ID:nT1w560I0
>>95
SI屋のSEがアプリケーション開発を重視してるとは思えないけどなぁ。
人海戦術でなんとか動くものをギリギリ作ってるだけでは重視と言えないだろ。
2019/09/29(日) 21:48:02.51ID:lvoGL4290
>>95
個人的な印象はどっちも大してコスト変わらんからどっちでもいい。
どっちも結局同じくらい苦労する。
2019/09/29(日) 22:08:25.81ID:Cx80w4FvM
意味もわからずAPI使うだけなら関係ないけど機械学習の理論を知識無しから学ぶのは社会人にはキツイ
大学で理論学んだ人間が社会人になってシステム開発も覚えた方がやりやすそう
2019/09/29(日) 23:58:26.18ID:YuhE+cap0
大学で機械学習の研究やってる人間がまったくコード書かないってことはありえないだろ
そういう人間にプロトタイピングやらせてSI屋がリファクタリングすりゃいいじゃん
2019/09/30(月) 00:22:31.70ID:8e9MDvd5M
大学で理論を学んだけどコード書けない奴は五万といる
そういう人はIT志望じゃないけど
102デフォルトの名無しさん (ワッチョイ e5ad-tbXw [124.144.197.178])
垢版 |
2019/09/30(月) 01:24:18.06ID:IzG9ESU60
>>101
いいかげんなこと書くなよFラン
2019/09/30(月) 07:39:07.01ID:ZQ2jVHqFa
コード書ける書けないの基準による
実験データの処理のようなプログラムであれば誰でも書けるが
ソフト会社で求めるのは複数人開発を前提とした大規模プロダクトの開発のノウハウだがそっちの知識は皆無な人が大半
104デフォルトの名無しさん (アウアウウー Sa69-3AID [106.161.128.41])
垢版 |
2019/09/30(月) 08:53:58.05ID:MFpp3sz0a
>>103
金にならないプログラマーってことですね。
2019/09/30(月) 09:31:29.28ID:8e9MDvd5M
bigqueryでデータ管理して、pythonで分析、ダッシュボードで可視化
という最小単位のシステムなら、ひとりで組めるしそういう知識もいらないけどね

スマホ連携やら組み込みやらでやることが増えると、
クラウドの外側で昔ながらのスキルが要求されるようになっていく
2019/09/30(月) 10:52:05.24ID:8e9MDvd5M
ローカルなシステム開発も中途半端なところは
技術をプログラミングの民主化や、フレームワークの進歩に吸収されていくから、
組み込みでシステム開発をやってるような、振り切ってるところ以外は
生き残れる確率が低いと思う
107デフォルトの名無しさん (ワッチョイ 2b7c-wGQq [113.32.86.138])
垢版 |
2019/09/30(月) 13:48:26.95ID:FnsAlH7P0
伊勢湾台風の被災映像、AIで初のカラー化 CBCが26日番組で公開
https://www.chunichi.co.jp/article/front/list/CK2019092602000075.html

白黒と大して変わらん希ガス
108デフォルトの名無しさん (ワッチョイ 2b7c-wGQq [113.32.86.138])
垢版 |
2019/09/30(月) 13:56:04.38ID:FnsAlH7P0
>>80

2013年度 NHK会長、副会長、経営委員長等の給料(年)

NHK会長 3800万円/手当込
副会長   3370万円/手当込
常務理事  3020万円/手当込
理事     2856万円/手当込
経営委員長(常勤)3792万円/手当込
NHK社員  1780万円/手当込


※総理大臣、国会議員の給料
総理大臣 2727万円
国会議員 1842万円

【予算規模の比較】
海上保安庁 2177億5345万7000円
警察庁 3420億8472万9000円
環境省 3459億4527万4000円
NHK 7547億7700万円
2019/09/30(月) 15:14:36.94ID:5Ydl8i+L0
AIで脱税、いや節税してるのかな?

【企業】純利益1兆円のソフトバンク「法人税ゼロ」を許していいのか
https://egg.5ch.net/test/read.cgi/bizplus/1569822161/
110デフォルトの名無しさん (ワントンキン MMa3-MfK0 [153.148.100.146])
垢版 |
2019/09/30(月) 15:17:21.06ID:RcGMqML5M
blocksはオワコンかしら?
2019/09/30(月) 20:55:03.50ID:m19D9tLr0
プロト書かせても汚過ぎたらリファクタリングはできんし、
リファクタリングする方もある程度の理屈はわかってないとできん。
tensorflow なんかとくにモジュールがぐっちゃになってて、
結局両方わかるやつがいないとどうにもならんということになる。
2019/09/30(月) 21:02:45.96ID:lchn4+U/M
個人的に前処理用の関数や、モデルおよびパラメーター調整用の関数
はコード汚くても全然いい
113デフォルトの名無しさん (ワッチョイ 8d90-srNF [112.139.91.58])
垢版 |
2019/10/01(火) 01:45:26.93ID:iqt4HZRA0
>AIで初のカラー化 
何年も前にモノクロ映画のカラー化ってやったじゃん
別にって感じだよ
114デフォルトの名無しさん (ワッチョイ 9d2c-pgcN [114.161.70.250])
垢版 |
2019/10/01(火) 03:55:33.18ID:yPgD2oOI0
全くの知識ゼロは何から勉強すればいいの
115デフォルトの名無しさん (トンモー MMf9-tbXw [210.142.95.214])
垢版 |
2019/10/01(火) 08:47:56.00ID:+UPFCPY9M
マジレスするとExcelの使い方から。
データ整理でよく使うんだよ。
116デフォルトの名無しさん (ワンミングク MMa3-WiWq [153.234.115.46])
垢版 |
2019/10/01(火) 11:08:22.62ID:gKinUVIwM
クレクレ君かよ
117デフォルトの名無しさん (スププ Sd43-gkNv [49.96.35.221])
垢版 |
2019/10/01(火) 12:40:44.98ID:yogeS95od
>>113
伊勢湾台風の映像が初のカラー化ってことでしょ。
118デフォルトの名無しさん (スププ Sd43-gkNv [49.96.35.221])
垢版 |
2019/10/01(火) 12:41:12.18ID:yogeS95od
>>114
ゼロから作るディープラーニング
2019/10/01(火) 16:32:31.25ID:IzwYx3El0
>>114
猿でも分かる真相学習
120デフォルトの名無しさん (スププ Sd43-gkNv [49.96.35.221])
垢版 |
2019/10/02(水) 10:11:48.00ID:hWitUTMNd
>>119
そんな書籍あるの?
2019/10/03(木) 06:44:24.24ID:mNCtBXnn0
>>120
サルでもわかるディープラーニングでしょ。理論やプログラミングに触れないやつだよ
2019/10/03(木) 08:13:41.26ID:d+Cb0QN6a
機械学習概論〜ディープラーニングGAN、本格的に学べる全20時間の大学講義が無償公開
https://www.atmarkit.co.jp/ait/articles/1910/03/news013.html
2019/10/04(金) 19:27:29.82ID:HvucvIji0
>>122
ありがとう
わかりやすくおもしろい
124デフォルトの名無しさん (ワッチョイ 917c-MsYi [122.215.159.99])
垢版 |
2019/10/05(土) 10:12:00.74ID:g+cVNt8G0
画像を入力してキャッサバとマンジョカの違いを見分けられるかな
2019/10/06(日) 13:50:13.78ID:R4FTujg8r
>>124
キャッサバは芋でマンジュオカは粉

でいいのかな
126デフォルトの名無しさん (ワッチョイ 7b66-y1nD [183.77.216.215])
垢版 |
2019/10/06(日) 14:04:07.98ID:3Bwj9Rk40
猫の種類を識別できてるからねえ
2019/10/06(日) 16:39:42.63ID:O2SqL9Wwa
砂糖と塩は?
2019/10/06(日) 16:45:43.54ID:xEniyG0f0
画像の分類に関しては人間の精度を超えたことになってるから人間ができるものはだいたい識別できるでしょ
129デフォルトの名無しさん (エムゾネ FF33-WcZE [49.106.192.108])
垢版 |
2019/10/06(日) 17:14:50.01ID:pvG0vkV+F
片栗粉白玉粉8:2のとマンジョカとキャッサバとタピオカを全部一緒だと判定するかな
2019/10/06(日) 17:23:27.35ID:vW1W4Flv0
答え タピオカ
2019/10/06(日) 18:02:00.68ID:WtwvCzV0a
人間が見て判別できないぐらい酷似した見た目の画像を用意されても判別は難しいだろう
でも人間にもできないんだから仕方がない
2019/10/06(日) 18:37:58.28ID:7syR3WRm0
紫外線や赤外線、テラヘルツ波など人間の目が捉えていない領域を取得したデータで学習したら区別できるかもね
2019/10/07(月) 01:53:57.56ID:i7jiIDbz0
https://youtu.be/o3LK_rLG_D8
2019/10/07(月) 01:55:32.75ID:i7jiIDbz0
>>132
そんな対象に複素ネットワークをうまく利用したいですね
2019/10/07(月) 07:22:36.56ID:R1WvvUd4r
>>132
このアイデアがあったのか。ありがとう
2019/10/07(月) 07:45:45.80ID:rds9MmBYa
>>132
ただの測定やん!
にならないくらい難しいものを判定しないとな
137デフォルトの名無しさん (トンモー MM8d-2TCp [210.142.95.118])
垢版 |
2019/10/07(月) 12:51:32.67ID:wQEZJZvJM
でも美人とブスは判別できないだろ?
教えてやらないと。
俺は教わらなくても、立つほうが美人だとわかるからな。
AIは、立つ部分がないから
2019/10/07(月) 13:15:17.48ID:R68jeLYK0
親子判別機作りたいんだけどどこかに教師データ無いかな?
139デフォルトの名無しさん (エムゾネ FF33-PqvS [49.106.193.23])
垢版 |
2019/10/07(月) 13:39:13.16ID:nnDn0jE7F
色盲とか弱視のひとは
色を見分けられないんじゃなくて
特定の色には激しく反応出来るので
普通の人では観えないものが観えたりする
2019/10/07(月) 13:59:50.76ID:JTQO9o2aa
>>137
ネット上にたくさん画像がある方が美人なのかもしれない
2019/10/07(月) 14:05:01.74ID:jwAP9iy30
地味にブスの画像を集めるのって苦難の道だよな
ネット上にあるのは奇跡の一枚物ばかりだし
2019/10/07(月) 14:47:53.66ID:1thZo56ha
美醜判定の研究は心理物理実験で人が行って分けた画像に対して特徴を求めるのが一般的
2019/10/07(月) 15:39:41.65ID:i7jiIDbz0
https://youtu.be/UPjmZheyYTk
144デフォルトの名無しさん (ワンミングク MMd3-y1nD [153.234.115.46])
垢版 |
2019/10/07(月) 18:59:23.04ID:fNQWuTFbM
シンメトリー具合が客観的かと思われるけど
美醜は基準が変わるだろ
2019/10/07(月) 19:38:18.06ID:uR6CZd4Z0
顔データならリクルートとかめちゃくちゃ持ってそう
2019/10/07(月) 19:58:20.16ID:R68jeLYK0
リクルートは死ぬべき企業の一つ
2019/10/07(月) 20:53:26.67ID:rCvXE9Ys0
標準的な顔が美男美女だという研究結果が昔あったなあ
2019/10/07(月) 20:58:00.90ID:T0peqJ1N0
>>147
標準的、というか個体差を集めてその中間を取ったという意味の平均顔でしたね
2019/10/07(月) 21:37:55.32ID:mqLxFODTM
Deeplooksとかあったな
150デフォルトの名無しさん (アウアウウー Sa9d-mxGY [106.154.130.99])
垢版 |
2019/10/07(月) 22:27:15.98ID:XIT3E9Qaa
>>147
データの次元が増える程、外殻部の密度が高くなり中心部は疎になる
次元の呪いの現れ
2019/10/07(月) 22:54:06.69ID:WyRvg0cv0
>>150
その解釈があってるかどうか知らんけど面白いね
2019/10/07(月) 23:20:52.55ID:T0peqJ1N0
>>150
ユークリッドノルムは高次元では無意味、という経験ならあります…
153デフォルトの名無しさん (ワッチョイ 99ad-2TCp [124.144.197.178])
垢版 |
2019/10/08(火) 01:24:12.36ID:yvLQ2KO90
だからさ、立つ写真と縮んでしまう写真を
集めて学習させるのさ。
154デフォルトの名無しさん (ワンミングク MMd3-y1nD [153.234.115.46])
垢版 |
2019/10/08(火) 13:08:31.09ID:pQwzHIwwM
ヒューズの現象と次元の呪いって違うの?
2019/10/08(火) 13:38:33.16ID:EX96gh2V0
黄金比が審美医療で使われてるから顔のパーツの比を計測すれば美醜の判別は数値的にできると思う
あとはエントロピーの低い顔は美人なはず
ダウン症などの奇形顔はエントロピー高いから
156デフォルトの名無しさん (オッペケ Src5-mxGY [126.255.135.228])
垢版 |
2019/10/08(火) 17:22:33.79ID:73qw8B0jr
>>155
何の、何に対するエントロピー?
2019/10/08(火) 21:40:37.04ID:kGAGzuS00
平均的な顔がいいっていうデマね。
実際は美人バッカ集めて平均取った方が圧倒的に良かったとかそういう結果。
158デフォルトの名無しさん (ワッチョイ 93f1-y1nD [157.107.8.150])
垢版 |
2019/10/09(水) 04:18:18.15ID:+iZUlLJa0
そりゃーブサが平均に寄れば綺麗に見えるわ
2019/10/09(水) 12:43:17.12ID:DoX5+3oi0
機械学習やるなら、Cかjavaかpythonだよなあ

データサイエンティストおよびクラウド系のデータエンジニアならpython
大規模開発およびローカル系のデータエンジニアならjava
ローカル系および組み込みならC

javaの領域は今後すこしずつ縮小していく見通しだから、
新規で入るならpythonかCがオススメ
2019/10/09(水) 12:57:38.63ID:8Gadabtv0
>>159
出来合いのライブラリを使う話?
スクラッチでつくる暇人はいないか
2019/10/09(水) 16:41:52.12ID:IFGahd8r0
Geforce一択?
2019/10/09(水) 18:03:33.95ID:joEVXQiz0
巷で売れてるkaggle本買いました
これから勉強します
163デフォルトの名無しさん (トンモー MM8d-2TCp [210.142.95.200])
垢版 |
2019/10/09(水) 19:06:25.13ID:/Xo+Y8M3M
統計学の勉強を本気で始めたら
恐ろしく難しいということがわかってきた
どうしたらいい?
2019/10/09(水) 19:07:25.32ID:qJaHnW7l0
参考書を変える
2019/10/09(水) 19:11:04.90ID:fonAqmctr
>>161
amdも意外と使えるらしいけど、情報ないし疲れるよ。動かないとき常にうたがっちやうしね
166デフォルトの名無しさん (ワンミングク MMd3-y1nD [153.234.115.46])
垢版 |
2019/10/09(水) 19:19:32.23ID:4X2jyJQLM
古典統計学とベイズ統計学をちゃんと学びたい
2019/10/09(水) 20:05:21.59ID:K/FCWkI00
>>166
統計論と確率論は違うものですか?
2019/10/09(水) 20:14:54.29ID:fTI0icewa
統計学の中で使われる道具の1つが確率論
2019/10/09(水) 20:23:04.27ID:ZvOECUeE0
>>161
まずはawsかgcpでやってみろ。
はじめからグラボなんか購入しても必ず後悔する。
2019/10/09(水) 21:11:35.20ID:MK+5GX/v0
古典統計とは集合論と位相空間論から測度論に発展して確率論との関係性のあたり?
171デフォルトの名無しさん (ワッチョイ 93f1-y1nD [157.107.8.150])
垢版 |
2019/10/09(水) 22:40:50.59ID:+iZUlLJa0
わかんない
2019/10/09(水) 22:44:05.44ID:zMnGtdTv0
アホ
2019/10/09(水) 22:58:19.23ID:Qjd49VQKa
現実問題として、測度論まで必要になることはあるかなあ?
まずは連続量ではなくて離散量での理解が先かと思われる
それならそんなに難しくないでしょ
2019/10/10(木) 00:11:01.13ID:O5ET7Lyz0
規定関数の概念と関数のノルムさえ理解していればいらん。
2019/10/10(木) 00:11:57.40ID:O5ET7Lyz0
逆にそれがわかってない研究者はくそ
2019/10/10(木) 00:14:30.11ID:O5ET7Lyz0
それ=『規定関数の概念と関数のノルム』な。
2019/10/10(木) 00:17:00.40ID:O5ET7Lyz0
わら。×規定
自分がわかってませんでした。
178デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.200])
垢版 |
2019/10/10(木) 02:31:31.78ID:eF+ihzDEM
グレブナー基底は重要だな
179デフォルトの名無しさん (アウアウクー MMe1-o74w [36.11.224.230])
垢版 |
2019/10/10(木) 06:52:08.55ID:H/x/U9NKM
>>160
勉強のためにスクラッチで書くならpythonがオススメ。ネットに情報が多いから
仕事のためならC一択
180デフォルトの名無しさん (アウアウクー MMe1-o74w [36.11.224.230])
垢版 |
2019/10/10(木) 06:53:03.85ID:H/x/U9NKM
>>169
何故そこでcolabが出さない
2019/10/10(木) 10:19:46.41ID:xGOoNgUAa
統計学を理解できていないのに理解したと思い込んだ人はこういう頓珍漢なことを平気で言い出す

@Inetgate:
@usukutilife @u874072e 一般的な統計処理において、標本数が30を超える場合には正規分布を仮定できますが、
えん さんが調べた結果だと全然正規分布になってないので、食べログの数値操作疑惑、真っ黒じゃねーかと。

https://twitter.com/Inetgate/status/1181488204068749312
https://twitter.com/5chan_nel (5ch newer account)
2019/10/10(木) 10:23:07.08ID:H/x/U9NKM
母集団の分布が正規分布に従うと"仮定"すれば、間違ってない意見だな
仮定すれば
2019/10/10(木) 10:25:56.74ID:H/x/U9NKM
って、もとのグラフをみたらbin数がやばかった・・・
2019/10/10(木) 14:07:25.58ID:9SEfnsqfa
標本抽出の仕方がランダムサンプリングで
母集団が正規分布の時だけに成り立つことを言っているな
2019/10/10(木) 18:30:07.85ID:7gKn5Xz20
競馬あてて見たいんだけど特徴量として前5走を使いたいんだけどどんな実装にすればいいのかな
どなたかヒントいただけないでしょうか
186デフォルトの名無しさん (ワイーワ2 FF93-1wBF [103.5.142.122])
垢版 |
2019/10/10(木) 18:50:01.66ID:i+8+28k+F
前走の結果より血統でやった方が良いって先輩は言ってた
2019/10/10(木) 18:56:00.12ID:cL0M7hVK0
入力で与えるのが出馬一覧とかで順番の意味を無くしたいならPointNetとかの構造を真似したりすればいいんじゃない
2019/10/10(木) 21:27:00.23ID:aZnaY5Is0
>>180
あれ、逆にわかりずらいと思うんだが。
環境設定がすげーわかりずれーわ。
2019/10/10(木) 23:11:06.33ID:bdrwblpoa
>>185
ググればソースコード付きでいろいろ出てくるが
190デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/11(金) 08:18:38.76ID:mCGV3tUv0
>>184
中心極限定理の話しで
標本数を30にした平均値の分布は
元の分布に関係なく正規分布とみなせるって事だよな

食べログの分布もその分布から標本を30取り出して
平均値を求める操作を10000回繰り返して
平均値の分布を描くと正規分布に近くなるはず
2019/10/11(金) 11:53:47.65ID:BrwAZKhG0
>>186
血統も絡めてるよていだけど、前走も大事かなと思いまして。

>>187
前走ではAの馬に負けてるから今回も厳しそう、とかの特徴を抽出したいなと思いまして、順序はそれなりに大事なのかなと考えています。

>>189
巷にあるコードよりも、より順序を重視する方法が無いものかなと。

数値やカテゴリーなどの特徴ではなく、多次元特徴を一つの特徴量として扱うことができないかなという感じです。
192デフォルトの名無しさん (ワイーワ2 FF93-1wBF [103.5.142.233])
垢版 |
2019/10/11(金) 11:58:01.09ID:hkXt1GtmF
重量ハンデは?
2019/10/11(金) 14:41:23.78ID:uWNk0GcMM
アルバイトでデータ解析やってる人間の意見としては、
とにかく役立ちそうな特徴量を選択せずにぶち込めるだけぶち込んで、
一度xgbかcgbを回してみればいいんじゃない
そうすれば重要な特徴量が何か抽出できるでしょ
話はそれからよ

勝ち馬をよく当てる人が何を大切にしているか調べることからはじめるべき
2019/10/12(土) 10:11:52.93ID:UGc1lgsI0
馬を株の銘柄に置き換えてリターンとリスク(分散)を元に
共分散使って有効フロンティアの曲線を引いて
無差別曲線と接する部分の比を見てパーセンテージの高い順に馬を買うってのは?
195デフォルトの名無しさん (ワッチョイ 653c-b92j [118.240.95.156])
垢版 |
2019/10/13(日) 00:20:47.58ID:kaSZg9r20
>>184
すでに指摘されているが、母集団の分布は正規分布である必要はない

>>190
中心極限定理の話(前半の話)はそうだけども、後半の部分は何が言いたいのかよく分からない

食べログの評点は一人当たり整数値の1~5を付けられる(ある店舗における点数分布をAとする)
各店舗は添付ごとにN人の評価の平均を平均点として算出する(各店舗の平均点分布をBとし、これが話題となっている分布)

Aの採点を行うのが一般人であると仮定すると、各店舗は同一の母集団確率分布に従うものと仮定でき、各店舗の確率変数X1, X2, …, XNは同一の母集団確率分布からのランダムサンプルと考えられる
大数の法則により、標本平均(分布Bのこと)は母集団の平均に近づき正規分布になる

標本数30以上というのはNが30以上ということで、この部分は残念ながら自明ではない
ある焼肉屋の評価は67件から構成されているが、別の焼肉屋は2件となっている

つまり最大限「食べログ」を擁護するのであれば、標本数が30以上ではないため前提条件が間違っている、ということだろうか
2019/10/13(日) 00:57:27.47ID:0ePwtCDKa
各店の平均化する前の採点が同一母集団に従うという仮定に無理がありすぎる
例えばラーメン屋とスイーツ店の採点者が同じ傾向の採点するなんて仮定は不自然
2019/10/13(日) 00:59:42.54ID:kaSZg9r20
>>196
すまん、焼肉屋しか見てなかった
実にその通り
198デフォルトの名無しさん (アウアウウー Sac9-KA+R [106.161.128.168])
垢版 |
2019/10/13(日) 06:54:46.01ID:ObLeezZqa
>>159
Juliaでしょう。
199デフォルトの名無しさん (アウアウウー Sac9-KA+R [106.161.128.168])
垢版 |
2019/10/13(日) 06:56:55.49ID:ObLeezZqa
>>160
Flux
200デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/13(日) 07:21:13.99ID:Fxu1r5BT0
>>195
大数の法則は標本数を増やすと標本平均が母平均に近づくということ

中心極限定理は平均値の分布に関する定理
食べログの評価の数が30になった時点で平均値を計算して
一度リセットするのを繰り返す
その平均値の分布は正規分布に近づく

今の評価の分布がその店に行く人の評価の分布を表している
のであれば今の評価分布から30標本を取って平均値を求める
操作を復元抽出で繰り返しても同じような結果になるだろう
201デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/13(日) 07:23:54.12ID:Fxu1r5BT0
ある店の評価分布は標本数が多くなっても正規分布になるとは言えない
分散が広くなるのはその店のサービスや品質が安定していない事が原因になりうる
その店の特徴が分布に反映される

同様に店を評価する側の特徴も反映されるだろう
2019/10/13(日) 07:58:04.98ID:S6cUkNQoM
深層学習の凄いことのひとつは特徴量を人が設計する必要がない、と本とかに書いてありますが、どう理解すればいいのか分からず教えてください!

ここでいう深層学習とはニューラルネットのことですか?(線形回帰やSVMと違って説明変数を人間が決めてないから? )
2019/10/13(日) 08:07:52.14ID:A69S9ntC0
レビューを投稿する行動を取る時点で母集団にサンプルバイアス
2019/10/13(日) 08:55:43.76ID:kaSZg9r20
>>201
言ってることの一つ一つは正しいことは理解できるんだけど、何が言いたいのか理解できないんだ

食べログが評価を操作しているかどうか、は今説明してくれた事を駆使すれば判別できるんだろうか?

あるいは、Twitterの書き込みのおかしさ、は今説明してくれた事を駆使すれば、ココがおかしいと指摘されるんだろうか
2019/10/13(日) 09:26:19.57ID:vNAU+AUMa
>>201
各店舗の分散は各店舗の分布には影響しても全店舗の平均値の分布には影響しないでしょ
2019/10/13(日) 10:08:21.52ID:uKg8mtfTa
中心極限定理はあくまで「同一の母集団から得た独立な確率変数であれば、十分な数の平均値を集めたものの分布が正規分布に近似できる」というもの
全店舗の採点者が同一の基準に従う採点を行うという前提が成り立たなければ成立しない定理
2019/10/13(日) 10:56:42.24ID:kaSZg9r20
>>206
個々の採点者が同じ基準でないのに中心極限定理を持ち出しているのがおかしいと主張しているわけか、なるほど

同じ基準ではないにしろ、少し幅をつけてみよう
個々の採点者はある得点を中心に正規分布で配点する、もしくは一様分布で採点する、あるいは同じ点数しかつけないものとする

正規分布で採点する者は、正規分布の合成が正規分布になることから、平均値の分布もまた正規分布
一様分布で採点する者は、分布関数の底上げにはなるが平均値には影響を与えない
同じ点数しかつけない者も、平均値そのものをずらす事にはなるが正規分布の形は歪めない

つまるところ上記の前提が成り立つ場合には、平均値の分布は厳密に正規分布になる
毎回1点で、たまに4点をつけるような人が大量にいないと、この評点と言う平均値分布を正規分布から歪めるのは難しいように思う
2019/10/13(日) 12:13:54.05ID:pJwii1Hg0
>>202
多分、画像データを深層学習(ニューラルネット)で学習することを念頭に置いてる話だろう。
もっと広い文脈で使えるときもあるがたいていは画像でうまくいった話を誇張して言ってることが多い。
209デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/13(日) 12:41:16.37ID:Fxu1r5BT0
>>205
平均値についても同様の事が言える
仮に評価する側が同じだとしても
店舗の特徴によって分布の形は変わる
分布の形を見る事で店舗の特徴を把握してその店を利用するかどうかを事前に利用者が判断できるようにするサービス
が本来目標としたものかもしれない

分布を意図的に操作する事で金儲けに利用しようとした疑いが上がっているという問題だと思う
210デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/13(日) 12:44:15.71ID:Fxu1r5BT0
>>207
評価尺度はただの順序尺度で間隔尺度ではないだろう
211デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.4])
垢版 |
2019/10/13(日) 12:53:02.60ID:sm0sVhGqM
>>159
大規模ですけどC、C++、アセンブラです。
現在、全部で数百万ステップです
212デフォルトの名無しさん (ワッチョイ 653c-b92j [118.240.95.156])
垢版 |
2019/10/13(日) 13:19:59.66ID:kaSZg9r20
いかん、ラーメン屋の得点とスイーツ屋の得点を合わせて平均するとか謎なことをしていた
改めてデータに立ち戻ろう

3.6にピークがあるのは、とりあえず4に入れておこう層が2/3くらいいて、残りの1/3がとりあえず3に入れておこうということ4*2/3+3*1/3=11/3=3.67で説明できそうだ
逆に言えば、ここにピークが立つのは「とりあえず3か4に入れとけ層」が一定数いるということで、これは直感と合うのであまり怪しくはなさそうだ

次に3.8にギャップがある理由を考えてみる
元のデータを見た所、2つのガウス関数の和で表現できそうだ
一つは平均3.6で3σが0.3にあるピーク、もう一つは平均3.75で3σが0.05のピーク
こう仮定すると3.8にギャップができているのは、この2つ目のガウス関数の裾野に原因がある

この2つのガウス関数が意味するところは
ラーメン屋に通う「オヤジ層」とスイーツ屋に行く「レディー層」の違いを表すのか、
あるいは「関東に住んでいる層」と「関西に住んでいる層」を地域差表すのか、
はたまた疑惑の「操作されていない層」と「操作されている層」の人為操作の違いを表すのか

ラーメン屋だけの分布、特定地域だけの分布は作れそうだが、疑惑の操作に辿り着くのは難しそうだ
213デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/13(日) 13:25:37.35ID:Fxu1r5BT0
操作がなかったという帰無仮説を棄却できるかどうかじゃね?
214デフォルトの名無しさん (ワッチョイ 653c-b92j [118.240.95.156])
垢版 |
2019/10/13(日) 13:39:33.29ID:kaSZg9r20
>>202
まぁ>>208でも言っているけど画像をCNNで処理することを汎用化して言ってる気はするなぁ
少し古いけど

https://deepage.net/deep_learning/2016/11/07/convolutional_neural_network.html

にある

CNNはこういった特徴を抽出するための検出器であるフィルタのパラメータを自動で学習していく

ということなんだろう
RNNでも同じ話はあるので画像だけってことはないけど、なんでもかんでも特徴量を自動抽出ってことではないよ
2019/10/13(日) 13:45:19.51ID:48i2xCpca
三層のニューラルネットワークでは xor を分離できないという問題は
さらに多層になったことで何で解消されたの?
2019/10/13(日) 14:17:08.81ID:25TC8kRG0
3.8を超えた評価を3.6に落としてるって仮定したらほぼ同じヒストグラムになる
https://i.imgur.com/NrNIWrn.jpg
平均3.8標準偏差0.5で正規分布を生成して、3.8を超えた評価値を90%の確率で平均3.6標準偏差0.01の正規分布で取り直す操作をした(N=1000)
ただ同じだからと言って>>212のように元データの特徴量ごとの性質の違いを反映しているだけかもしれない
2019/10/13(日) 14:21:02.62ID:qY0pTgmia
>>213
操作がないという帰無仮説について仮説検定の方法で検証するには操作がない場合の点数の理想的な分布を知っていなければならない
その理想分布に基づいて実際の分布がどの程度ずれているのかを確認するのが仮説検定なのだから
しかしそんなもの知り得ないので検定のしようがない
218デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6])
垢版 |
2019/10/13(日) 14:23:09.86ID:llG9wcVha
>>215
出来ないのは2層
3層にすると一度高次元空間に写してからシンプルな境界で分離出来る
2019/10/13(日) 14:45:50.67ID:TJDkUn5hM
>>208
>>214
ありがとうございます。ほぼCNNのことと思って良さそうなんですね
CNNが凄い!っことを深層学習という言葉に拡大して凄い!って言ってるイメージですね
2019/10/13(日) 15:01:05.43ID:kaSZg9r20
>> 215

細かいけど、まず層の数え方から
入力層は層に数えないので、ANDとORは1層で、XORは2層で表現できる

次にXORはなぜ2層で表現可能か
単純に、AND(正確にはNAND)とORの出力をANDで受ければXORが作れるから

ググったら以下のような図を見つけた
https://www.infiniteloop.co.jp/blog/wp-content/uploads/2017/12/XOR.png

>>218の回答はエレガントだけども、少し説明を加えると
(0, 0) → 0
(0, 1) → 1
(1, 0) → 1
(1, 1) → 0
を分ける直線は2次元平面内では書けないけど、3次元に拡張して
(0, 0, a) → 0
(0, 1, b) → 1
(1, 0, c) → 1
(1, 1, d) → 0
を分ける平面はa,b,c,dを適当に決めれば作れる(例えばa=d=0, b=c=1としてz=0.5の平面)

a,b,c,dを適当に決めて分離できるってそんなんアリかよ!?って最初は思うかもしれないけど
そんな純粋な気持ちは最初だけで、どうせa, b, c, dは見ないし分離できたら何でもOKになる
2019/10/13(日) 18:39:55.88ID:48i2xCpca
二層あれば大抵の関数は模倣できるのに
何でもっと多層が必要なの?
222デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/13(日) 18:43:34.64ID:Fxu1r5BT0
>>217
諦めたらそこで試合終了ですよ
目の前にヒントが転がっていても見えなくなる
223デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/13(日) 18:44:48.26ID:Fxu1r5BT0
>>218
線型結合してる層を増やすとなぜ高次元になるのかを直感的に判るように説明して
224デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6])
垢版 |
2019/10/13(日) 19:30:49.94ID:llG9wcVha
>>221
層を増やす方が効率が高い

ニューラルネットの近似能力は層を増やすと指数的に向上するが、中間層のニューロン数に対しては多項式的にしか上がらない
225デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6])
垢版 |
2019/10/13(日) 19:32:44.25ID:llG9wcVha
>>223
一旦中間層のニューロン数だけの次元を持つ空間を経由できるから
226デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/13(日) 20:04:55.16ID:Fxu1r5BT0
>>225
線型結合して関数を通して
また線型結合して関数を通して
の繰り返しでなぜ高次元になるの?

関数によって非線形になるなら判るけど
227デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6])
垢版 |
2019/10/13(日) 20:33:11.99ID:llG9wcVha
>>226
非線形な活性化関数噛ませるでしょ普通

自然に高次元になるんじゃなくてそうなる様にしてるんだよ、ニューロン数は自由に決められるから
228デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.69])
垢版 |
2019/10/13(日) 20:44:50.78ID:/3kPh57iM
ディープキスのほうがいい!
舌をからませるの
立つよね!
2019/10/13(日) 20:48:48.51ID:P1vmVh210
>ニューラルネットの近似能力は層を増やすと指数的に向上するが、中間層のニューロン数に対しては多項式的にしか上がらない
こんなことを示した論文などない。
よくこんなことをさも証明されたことの如く言えるな。
2019/10/13(日) 21:28:26.53ID:kaSZg9r20
>>221
本質的な質問が来た
これについては俺も明確な答えは持ってないなぁ

直感的には、多層の方が中間層に保持できるパラメータ数が多く
そこには活性化関数を通した非線形の効果も含まれているので
ほどほどにノイズが消されていて抽象的な状態を保持できるから

と思うんだが、本当かどうかは分からない
231デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6])
垢版 |
2019/10/13(日) 21:37:08.64ID:llG9wcVha
>>229
Montufar, Guido F., et al. "On the number of linear regions of deep neural networks." Advances in neural information processing systems. 2014.

NIPSの論文だが
何を根拠に「こんなことを示した論文などない(キリッ」なんて言えたのか
2019/10/13(日) 21:45:22.38ID:kaSZg9r20
>>226
ちょうどいいので>>220で示したXORを例に説明しよう

入力が2次元である(x1, x2)を拡張して3次元の(x1, x2, x3)にしようと思う
つまり
(0, 0, a) → 0
(0, 1, b) → 1
(1, 0, c) → 1
(1, 1, d) → 0
が出来て(a, b, c, d) = (0, 1, 1, 0)を設定できれば、平面z=0.5で2つの領域に分離できる

すなわちx3をx1, x2から作れれば良いので

a = w11・x1 + w12・x2
b = w21・x1 + w22・x2
c = w31・x1 + w32・x2
d = w41・x1 + w42・x2

として(w11, w12) = (1, 1), (w21, w22) = (1, 1), (w31, w32) = (1, 1), (w41, w42) = (1, -1)のような重みを設定する
a, b, c, dの式をよく見てみると、これは2個のニューロンを1層分増やした式そのものである
つまり層を1層増やすということは、次元を増やすことと同値である
2019/10/13(日) 21:46:31.38ID:kaSZg9r20
>>226
ちょうどいいので>>220で示したXORを例に説明しよう

入力が2次元である(x1, x2)を拡張して3次元の(x1, x2, x3)にしようと思う
つまり
(0, 0, a) → 0
(0, 1, b) → 1
(1, 0, c) → 1
(1, 1, d) → 0
が出来て(a, b, c, d) = (0, 1, 1, 0)を設定できれば、平面z=0.5で2つの領域に分離できる

すなわちx3をx1, x2から作れれば良いので

a = w11・x1 + w12・x2
b = w21・x1 + w22・x2
c = w31・x1 + w32・x2
d = w41・x1 + w42・x2

として(w11, w12) = (1, 1), (w21, w22) = (1, 1), (w31, w32) = (1, 1), (w41, w42) = (1, -1)のような重みを設定する
a, b, c, dの式をよく見てみると、これは2個のニューロンを1層分増やした式そのものである
つまり層を1層増やすということは、次元を増やすことと同値である
2019/10/13(日) 22:05:13.10ID:48i2xCpca
五、六層でいいのかと思いきや
ものすごく多層にするよねえ
うまくいくからという説明しかないのか?
235デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.69])
垢版 |
2019/10/13(日) 22:18:18.69ID:/3kPh57iM
>>221
〉二層あれば大抵の関数は模倣できる

その『大抵』とは、どの程度なんですか?
それが示されてないのですから
まったく意味をなさないですよね?

>>230
その意味をなさない書き込みに、
本質的とかって、
レベル低すぎですね。
2019/10/13(日) 22:20:28.84ID:mSmeGM2p0
>>235
完全な関数の導入じゃなくて疑似的な関数が解ればいいから
2019/10/13(日) 22:35:14.55ID:kaSZg9r20
>>235
あんたは性格悪いなぁ・・・
ニューラルネットワークの普遍性についての質問が本質的でないなら何が本質的なんだ?
知ってて聞いてるなら教えてやれよ
2019/10/14(月) 00:26:24.00ID:Xj3JYQcoa
専門的な知識はほとんどなく説明されても理解できる頭も持ってないけどマウントとりたいからとにかく突っかかる癖のある人が多すぎる
2019/10/14(月) 00:50:17.12ID:yAy44Gfva
初等関数?
特殊関数?
240デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/14(月) 07:16:20.36ID:KQ95R8h/0
>>232
それだと
x1, x2の入力を受けるニューロンと
それからx3を計算するニューロンを並列に並べたら良い

x1-x1\
x2-x2-out
\x3/
みたいに

次元を増やすの意味として変数増加とx^2などと混同しやすい
これらを区別する言い方は何?
変数増加→高次元
x^2など→非線形
とか?
241デフォルトの名無しさん (スププ Sd43-IE9o [49.96.34.97])
垢版 |
2019/10/14(月) 12:29:28.91ID:utYACZDud
前に『ゼロから作るディープラーニング』買ったけど
これ3千円はする高額な本だけど、計算や式の意味がわからず挫折したなあ…。

やっぱノートに書いて解き方や意味を学習するしかないと思うねん。
242デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.69])
垢版 |
2019/10/14(月) 12:54:25.27ID:syyLl6c1M
>>241
ならば『excelでわかるディープラーニング超入門』がオススメ
続編もある
2019/10/14(月) 13:19:28.08ID:aq/jCORe0
>>241
あの本は線型代数と微積分の知識は必須だと思う
2019/10/14(月) 13:53:05.51ID:pO8Bz3ni0
機械学習に数学はいらないよ
245デフォルトの名無しさん (オッペケ Sr61-B2ag [126.255.17.59])
垢版 |
2019/10/14(月) 14:01:22.69ID:htBbaZR2r
機械学習に数学はいらないよおじさん「機械学習に数学はいらないよ」
246デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.69])
垢版 |
2019/10/14(月) 14:23:44.68ID:syyLl6c1M
ソフト使うだけなら数学いらんわね
2019/10/14(月) 14:26:05.12ID:daX/fZMnF
適当にデータ放り込んで適当な手法を選択してなんとなく精度が良さそうなのを選ぶだけで成立する仕事なら数学など不要
普通の企業や研究室ではそんなものに金なんて出してくれないがな
248デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6])
垢版 |
2019/10/14(月) 14:31:10.41ID:JdA0BOgta
>>247
そういう仕事は既にAutoMLに取られつつあるね
2019/10/14(月) 14:31:49.76ID:XFqMr8NbM
というかこの世界ももう土方がいるのか
2019/10/14(月) 14:40:16.73ID:VuPQ6UMJ0
>>240
並列に並べるために(x1, x2)からx3を作るための層が最低1つ必要なんだ
0か1かのような2値分類は、つまるところ出力層と全く同じ出力をする新しい次元を作って、その次元に直行する超平面で分類する作業なので

言い方は高次元や非線形で良いと思うけど、次元についてはニューロンの数が、非線形については活性化関数が深く関係している

もう少し詳しく説明しよう
より一般的な関数があったとして、入力が(x1, x2)のとき、最後の出力層への入力としては

(f1(x1, x2), f2(x1, x2), f3(x1, x2), …, fN(x1, x2)) … (1)

となっている
Nは最後の隠れ層のニューロンの数なので、次元と読んでいるのはニューロンの数だということが分かる

(1)を如何にして作るのかが重要になり、層を深くして(1)を作らなくても、ニューロン増やせばいいんじゃね?となる
隠れ層1層と出力層1層の2層あれば大抵の関数は模倣できると指摘している>>221はかなり鋭くて実にその通り

それでもなんで層を深くするのかというと>>224の効率が良いというのが一般な回答なんだが、Deep Learningを回している人なら実感があると思うけど、第一層のニューロンの数がある一定数ないと学習がうまくいかないことが往往にしてある
単に層を深くすればよいというのは明らかに直感と異なり、そうすると「どの層にどれだけのニューロンを配置すると良いか」という問題になり、これに対して自分なりの回答はまだ全然持っていない
251デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.69])
垢版 |
2019/10/14(月) 14:42:39.82ID:syyLl6c1M
最初から土方しかいないから。
今もほとんど土方。
できる人は研究者か大学教員になってる。
2019/10/14(月) 14:47:46.87ID:daX/fZMnF
この分野はむしろ大学より民間の方がやりやすいから本来なら博士行くような人も修士までにしてとっとと成果出せる環境に移ろうとする人が多くなってきた印象
253デフォルトの名無しさん (スププ Sd43-IE9o [49.96.34.97])
垢版 |
2019/10/14(月) 15:08:32.93ID:utYACZDud
>>242
ありがとう。調べてみます。
2019/10/14(月) 15:10:40.92ID:4WTqwCCG0
今ならまだ簡単にデータエンジニア目指せるけど、
早い者勝ちなのかな
すぐベテランにしか仕事がこなくなるよね
2019/10/14(月) 15:13:07.19ID:4WTqwCCG0
>>241
あの本のレベルの数学が分からないと厳しい
数学が分からないと言いながらDSやってる人たちでも理解できる程度の内容
2019/10/14(月) 15:22:52.88ID:drx0D0Vb0
博士持ち or ベテラン < 精度の高い競馬予測モデル開発者

データを集めてくるところが始まるから、Kaggleより難易度高い
257デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.69])
垢版 |
2019/10/14(月) 16:12:47.05ID:syyLl6c1M
博士号持ちといってもピンキリ

天才的な人もいるし、
とんでもない馬鹿もいる。

2、3枚の感想文のようなレポートで
博士号取れる院も
日本にある。
そこは博士号とりたい中国人ばかりが
留学生としてやってくる。
日本の恥!
258デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6])
垢版 |
2019/10/14(月) 17:26:03.50ID:JdA0BOgta
>>257
例えばどこの院
259デフォルトの名無しさん (ワッチョイ ab82-IE9o [113.20.238.175])
垢版 |
2019/10/14(月) 18:51:16.60ID:/yNf4ic50
>>255
DSって何ですか?
260デフォルトの名無しさん (エムゾネ FF43-1wBF [49.106.193.20])
垢版 |
2019/10/14(月) 18:55:58.36ID:ljIrzJ7BF
Deta
Saiensu
2019/10/14(月) 19:22:19.56ID:lAL0R9ntM
サイエンティストな
262デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.57])
垢版 |
2019/10/14(月) 20:18:41.61ID:DQ9Yh+dwM
>>258
知り合いが現在
そこの教員やってるので
大学名は書かないけど
博士論文は国会図書館に
全て収蔵されるので
みればすぐわかる。

ヒントとしては、
なんと中国語でレポート2枚ぐらいの
博士論文がある!
日本の恥!
抹殺したい!
263デフォルトの名無しさん (ワッチョイ ab82-IE9o [113.20.238.175])
垢版 |
2019/10/14(月) 21:29:45.45ID:/yNf4ic50
ディープラーニング発明した人に
ノーベル賞やるべきだと思う。
2019/10/14(月) 21:34:26.95ID:lAL0R9ntM
そんな人おらん
ローゼン・ブラッドからはじまって(もっと前から遡れる?
カナダ人のチームがドロップアウトを考えた時点で弾けたんだ
265デフォルトの名無しさん (アウアウクー MMe1-o74w [36.11.225.237])
垢版 |
2019/10/14(月) 21:35:46.34ID:lAL0R9ntM
メダル獲れなかったkaggle用のnoteをgithubに載せてしまった。はずかしー
これで就活だあ〜。おーッ!
266デフォルトの名無しさん (アウアウウー Sac9-B2ag [106.154.130.6])
垢版 |
2019/10/14(月) 23:09:10.36ID:JdA0BOgta
>>263
チューリング賞はとった
2019/10/14(月) 23:23:40.59ID:Dfy8oKXF0
チューリング賞は賞自体よりも取ってる人のがたいてい有名っていう。。
268デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.57])
垢版 |
2019/10/15(火) 02:28:14.05ID:KLW/euVzM
甘利さんか?
2019/10/15(火) 06:10:05.34ID:I8iXAPqNM
競馬予想みたいにデータ収集含めて特定の領域に特化したモデル作れる人だけが勝つようになるかね、、、全く潰しのきかない職業になりそうですね。
2019/10/15(火) 06:37:37.44ID:7FHw0Vhl0
ゲームの自動生成やりたいから勉強してるけどそういう職業目指してない
271デフォルトの名無しさん (アウアウカー Sa51-KA+R [182.251.40.158])
垢版 |
2019/10/15(火) 07:35:51.98ID:5lPGjOaaa
>>269
田倉寛史は失業するな。
272デフォルトの名無しさん (ワントンキン MMa3-Hjv8 [153.154.213.244])
垢版 |
2019/10/15(火) 09:11:20.62ID:CGH1vHQcM
競馬って予想して勝てるゲームなの?
2019/10/15(火) 09:52:34.15ID:BuCrjnSD0
kerasしかわかんね
2019/10/15(火) 10:04:58.88ID:ST5HgM4Ya
統計学で競馬で食ってる人いる見たいよ
10年くらい前に聞いた話しだけど
2019/10/15(火) 10:08:19.91ID:CpmUKzMvM
統計学やらなくてもきちんと研究すれば勝てるらしいけど
才能の使い方としては空しいな
276デフォルトの名無しさん (アウアウウー Sac9-KA+R [106.161.117.54])
垢版 |
2019/10/15(火) 10:31:23.58ID:YjTx8zIDa
佐々木洋佑の予想。
2019/10/15(火) 10:36:34.51ID:tidBIruUd
控除率25%の競馬で勝とうとするならもっと楽に勝てるとこに注力した方がましやろ
2019/10/15(火) 10:52:22.27ID:AlK2cYWx0
>>277
FXとか?
2019/10/15(火) 11:24:20.27ID:CpmUKzMvM
FXより競馬の方が百倍楽でしょ
勝つために必要なデータを取れればだけど
2019/10/15(火) 12:32:17.34ID:2+ahF6drr
>>221
層が多いほうが表現力が高い
教師データ数に対して異常に多いパラメータは、なんで性能が伸びるかよく分からない。

パラメータの中にはあたりくじがあるのかもという、宝くじ仮設なるものがあるけれどどうなのでしょう?
2019/10/15(火) 13:03:36.76ID:uSQ3MvZ60
テーブルデータの解析って、nnをつかっても2層や3層だから、ぜんぜんdeepじゃないよね
営業の人はそれでもディープラーニングっていうんだろうなあ
282デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.57])
垢版 |
2019/10/15(火) 13:13:25.51ID:KLW/euVzM
テーブルデータってなーに?
283デフォルトの名無しさん (オッペケ Sr61-B2ag [126.255.17.59])
垢版 |
2019/10/15(火) 16:36:14.39ID:OfiTiE/Hr
>>221
深くする程損失関数が凸関数に近くなり最適解に辿り着きやすくなるかも知れないことが最近の理論研究で判明してきている
284デフォルトの名無しさん (ワッチョイ cb10-vzjJ [153.131.102.129])
垢版 |
2019/10/15(火) 23:48:10.86ID:1HOx40aj0
層を増やすと普通にバックプロパゲーションだけでは上手く学習できないんじゃね
どうするんだっけ
285デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.4])
垢版 |
2019/10/16(水) 07:22:30.93ID:399vjxSUM
甘利さんに聞く
286デフォルトの名無しさん (スププ Sd43-IE9o [49.96.34.97])
垢版 |
2019/10/16(水) 12:21:07.84ID:KK2SmrYwd
ドロップアウトって
実際に人間の脳でも行われているのでしょうか?
2019/10/16(水) 12:33:04.35ID:ur38NdBia
インドのリキシャの話は知ってるか?
人間は一度認識すれば多少形は違ってもリキシャだとわかる
おそらく人間は逆で、学習したデータを柔軟に他の認識の補助とすることができる
2019/10/16(水) 12:49:56.91ID:Bk7OFSs90
シミュラクラ現象のことか
2019/10/16(水) 12:55:37.60ID:/VU6ev+W0
kerasで作ったモデルをtfjsで読み込んだんだが
訓練してたときのinputがnp.arrayみたいで
tfjsでpred出来なくて積んだんだが(´・ω・`)

numjsとnumpyって同値じゃないよね?(´・ω・`)
290デフォルトの名無しさん (トンモー MM59-d/3+ [210.142.95.48])
垢版 |
2019/10/16(水) 13:17:05.59ID:YrOVtgjKM
>>287
当たり前のことすぎて
どう反応していいかわからんよ。
どういうレスが欲しかったの?
2019/10/16(水) 15:01:44.54ID:ur38NdBia
>>290
は?誰?どゆこと?w
2019/10/16(水) 18:21:05.32ID:aRt+pAGAp
>>286
どうだろうね
短期記憶が長期記憶に移るときに、移らなかった記憶はドロップアウトされたと考えられなくもないかなぁ
293デフォルトの名無しさん (スフッ Sd43-v2l4 [49.104.18.87])
垢版 |
2019/10/16(水) 18:25:30.68ID:mV5OOZvVd
>>292
ドロップアウトは過学習を抑制するためにやるやつだし
記憶の結び付きとは違うだろ
2019/10/16(水) 20:46:35.90ID:h/NO83zwa
>>286
可塑性を示すものは発見されてるけどシナプス伝達におけるフィードバック機構は見つかってない
神経回路で見ればフィードバックの投射は当たり前に存在するけどそれでは誤差伝播にはなり得ない
2019/10/16(水) 20:46:41.74ID:wE+aWwg30
一度見た画像をぼんやりとしか覚えてない、という奴はドロップアウト臭い
だから>>292には個人的には賛成できるんだけど
ただ長期記憶が短期記憶うんぬんはリカレントNNを連想するから
このスレ的にはわかりにくいわ
2019/10/16(水) 20:48:32.70ID:wE+aWwg30
>>294
これま?
297デフォルトの名無しさん (ワッチョイ c501-e/MC [60.86.178.93 [上級国民]])
垢版 |
2019/10/16(水) 21:07:54.87ID:dCHq3Ix40
>>295
>一度見た画像をぼんやりとしか覚えてない
そもそも観察メッシュが雑(現物→キャッシュ的なところ の時点で情報がだいぶ落ちてしまう)なヤツの場合・・・
2019/10/16(水) 21:15:52.71ID:XUKusm2Pa
BPの話かと思ったらdropoutの方だったすまん
そっちに関連するものは知らん
2019/10/17(木) 08:31:12.53ID:O+QTTbhZr
>>283
KKT条件?
2019/10/17(木) 15:21:49.83ID:lSerOx+kM
違うぞ
2019/10/17(木) 15:30:38.70ID:IoilZ/4vr
mnistのデータをインストール出来なかったから
直接.npz型データを落としてきてこれを.kerasのdatasetsフォルダに入れたら
使えるようになった

こういうのは邪道なのか
2019/10/18(金) 20:19:51.03ID:ohB2HmeFH
きみたちSparkとかHadoopとか使ってるの?
深層学習の理論の話しは出るけども
2019/10/18(金) 22:12:26.25ID:+r0vv9/5M
Sparkは競争に負けたシステムだし、Hadoopはゴミ
2019/10/18(金) 22:12:50.99ID:+r0vv9/5M
>>301
たぶん正道
2019/10/19(土) 10:20:09.74ID:Xn59Im0u0
hadoopなんてまともに使おうとしたらgoogle並みの回線チューニングが必要なんでしょ?
306デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/19(土) 11:27:09.87ID:O4F+zYXc0
ググってると、ときどき尾崎隆のブログが検索結果に出てくる。
みなさんもご存じ(?)の、
 「渋谷駅前で働くデータサイエンティストのブログ」というやつ。

名前を公開して堂々とブログを書いているのであるから、
間違いがあっても、実名でよく書いた!ほめてあげよう。
だって、5chなんて匿名だから批判とか妬みとか罵詈雑言ばかりだもんな。

尾崎は偉いと思う。実名で書いてるから。
ちょっと自信過剰すぎて、ブログの間違いを見つけるたびに
笑えるけどそれもまたいい!
尾崎はいいやつ!
これからもブログをどんどん書いてくれ!
307デフォルトの名無しさん (ワッチョイ 2fe6-sprL [14.3.161.84])
垢版 |
2019/10/19(土) 12:29:08.69ID:RpavgoGg0
自信過剰
2019/10/19(土) 13:48:35.47ID:oy4za/qN0
馬鹿乙
309デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/19(土) 14:19:40.09ID:O4F+zYXc0
>>302
> きみたちSparkとかHadoopとか使ってるの?

使っていない。
仕事でAzureとAWSを使っていて
もはやHadoopとか必要ねーじゃんとか思ってる
何か使う理由がある?
2019/10/19(土) 15:03:04.15ID:5Qr+gv3yF
オンプレ環境でリアルタイムのビックデータ解析やりたいシチュ
データ容量は1TB程度……あんまりないよね
2019/10/19(土) 16:11:23.85ID:6fznObHGa
使いまくるなら圧倒的にローカルで環境構築する方が安いし自由度高いからな
クラウドコンピューティング万能説を説いている人を見ると「それで十分な程度でしか使っていないんだな」という感想しかない
2019/10/19(土) 17:05:53.24ID:MiA7VA63M
安さは開発費込みで圧倒的ではないだろう
自由度は同意
2019/10/19(土) 17:42:12.86ID:3SA6UJOGH
よく知らんけど調達コスト高いのでは
特に期間
2019/10/19(土) 17:52:06.40ID:Xn59Im0u0
クラウド万能とは思わんが数百GB単位でボコボコ組むならまずクラウドで組んだ方がいいと思うがな。
自前のオンプレで組むならかなり正確な見積もりないと怖いわ。
2019/10/19(土) 19:39:02.78ID:TPhFrENC0
最近は大手メーカーがオンプレのGPU買うケースが増えてる
彼らはアンチクラウドだから絶対使わないし
データを外部に置くことを極端に嫌う
2019/10/19(土) 20:33:07.47ID:MiA7VA63M
あくまで自分の肌感覚だけど、最近そういう風潮もなくなってきたというか、
コストカットで見境がなくなってきた印象がある
日本は海外ほどクラウドの導入が進まないけど、そのうち一気にくるだろう
2019/10/19(土) 21:05:40.70ID:/qIJCw1Pr
kerasの経験ばかり増えたが、いきなり生のtensorflowのコードを見たりchainerを見せられたり

日々勉強だなあ
データセットもある日はnpzある日はpkl
318デフォルトの名無しさん (ワッチョイ f67c-4dmd [113.42.68.218])
垢版 |
2019/10/20(日) 00:03:48.28ID:tuWSj+Lu0
>>315
セキュリティが心配なんだろうと思う
2019/10/20(日) 00:44:54.23ID:Ff441XyXM
セキュリティというよりデータを抜かれるのが心配
特に画像処理
2019/10/20(日) 01:42:29.38ID:nq7StZQCa
自然言語処理は近頃 word2vec 一択なの?
321デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/20(日) 03:49:01.05ID:zXnrxtUW0
>>320
word2vec一択とはどゆ意味なのかわからんけど、
それだけでは人と会話できないじゃん?
322デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/20(日) 03:50:55.76ID:zXnrxtUW0
うちではword2vecは使ってないよ
323デフォルトの名無しさん (ワッチョイ 2fe6-hjwr [14.3.161.84])
垢版 |
2019/10/20(日) 06:36:34.16ID:RLBjETOG0
自然言語処理スレで聞け
324デフォルトの名無しさん (ワッチョイ f67c-4dmd [113.42.68.218])
垢版 |
2019/10/20(日) 06:51:17.93ID:tuWSj+Lu0
>>319
データを抜かれるのはセキュリティの脅威の一つ
2019/10/20(日) 08:21:29.15ID:KT5ycvxT0
クラウド=情報漏洩の可能性が高いわけではなく、
社内のアナログ上司の承認が降りないんだろう

データセンターと国内の一般的な企業のセキュリティの堅牢性を比べたら前者が勝ち
2019/10/20(日) 09:51:37.69ID:4HG1pc8w0
データ解析事業なんて当たればデカいけどリスクでかいし、
マイナス査定が通常の企業じゃ社員はやりたがらんだろうね。
クラウドにデータおきたがらないのなんてわかりやすい大企業病の例だわ。
2019/10/20(日) 10:15:03.52ID:WLZPVulDa
セキュリティ万全と言いながら音声認識の音声データを勝手に社員が聞いていたりという事例もあるわけで
物理的にデータが相手側に置かれる以上はいくらでもこっそり悪用できるし内部告発以外でそれに気付くことは不可能だからな
扱うデータの性質にもよるが大企業ならすぐ炎上し得るので慎重になるのは当然だろう
328デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/20(日) 10:18:01.24ID:zXnrxtUW0
クラウドとローカルと、うまく使い分ければいいだけの話
言語論争と同じで、その仕事に適しているものを使うというだけの話
2019/10/20(日) 10:37:24.12ID:006B6SYsM
個人的に、ローカル側を勉強するコストは別のことに回したいかなあ…
2019/10/20(日) 10:41:10.83ID:006B6SYsM
中小でローカルサーバーを利用したがるのは、
社員たちのITに対する理解度が底辺で、データをネットに接続しただけで、
情報漏洩のリスクが発生するからだったり…
奴ら、機械学習用のPCにwinny入れちゃうとかデフォだから
2019/10/20(日) 10:43:19.71ID:4HG1pc8w0
ほとんどの場合、上の自己保身のために下にサーバーメンテのコストを押し付けてるだけだがな。
だから仕事がスケールしねーんだよ。
2019/10/20(日) 11:00:28.67ID:006B6SYsM
良く調べもしないで、"クラウドは怖いから駄目"とか言っちゃう上司か
でもいつかは海外の流れに追随するんじゃないの
2019/10/20(日) 11:15:24.44ID:NNpN8hAvH
このスレにデータ基盤エンジニアはさすがにいないか?
データ基盤回りの技術もなかなか難しいっすね
ご多分に漏れず技術の移り変わり早いし
334デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/20(日) 12:45:28.09ID:zXnrxtUW0
データ基盤はNTTデータであっても
ぐちゃぐちゃになってますね。

データ分析が始まって、
何もわからないところから、
その時その時に良いと思う方法で
構築して結合するので、
現在は、もうそれはそれは恐ろしい
暗黒構造となってます。

資料を作るひまもなく付け加えるので、
資料無しのぐちゃぐちゃです。
終わってます。
2019/10/20(日) 12:57:25.45ID:pEDMITRJM
オートエンコーダについて質問です

計算の負荷を考えないことを前提の場合
層の深さは深いほど良い(もしくは損をすることはない)の理解であってますか?
336デフォルトの名無しさん (アウアウウー Sa9b-KXk8 [106.154.130.6])
垢版 |
2019/10/20(日) 13:00:42.05ID:xbXJ4T7Ga
>>335
深すぎるとoverfittingする可能性がある
337デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/20(日) 13:03:01.09ID:zXnrxtUW0
>>335
いいえ、違います。
オートエンコーダを使って何をするのかにもよりますけど、
結局のところ次元圧縮を「適切に」やりたいわけです。

基本的には中間層から取り出した「圧縮」されたデータを
分析に利用するわけですから、
その分析として実現したいことによって、
「適切な意味が残存している」データを中間層から
取り出したいわけです。
よって適切な層の数はやりたいことによって変わります。

ただ、オートエンコーダの応用はいろいろ発展中ですので、
どういうことをやっているのか具体体に書いていただければ
よりよいアドバイスができると思います。
2019/10/20(日) 13:20:57.38ID:pEDMITRJM
>>336
返信ありがとうございます
オートエンコーダは入力と出力が同じだから過学習とかは考えなくてもいいと思ってたんですがそうでもないんですか?
339デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/20(日) 13:25:54.53ID:zXnrxtUW0
> オートエンコーダは入力と出力が同じ

原始的なNNとして使ってるだけなんだな
しかし入力と出力が同じとはどういう意味なんだ?
340デフォルトの名無しさん (アウアウウー Sa9b-KXk8 [106.154.130.6])
垢版 |
2019/10/20(日) 13:52:06.21ID:xbXJ4T7Ga
>>338
教師データだけ丸暗記して、テストデータは復元出来なくなる
341デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/20(日) 14:05:16.23ID:zXnrxtUW0
データサイエンティスト名乗るやつって
みんな馬鹿だと確信できたよ
2019/10/20(日) 14:06:19.35ID:pEDMITRJM
>>337
すみません。お返事もらってたのに見逃してました
本で理論を学んでいてオートエンコーダの層の深さは多い方がいいのか少ない方がいいのか書いていなかったので、知識浅いのに質問してみました…
適切な意味が残存するようにということで一歩ですが少し分かった気がします。具体例を色々見てみたいと思います

>>340
>>339
教師データ入れて教師データで評価するとか考えてしまって書き込んでしまったのですが、教師データとテストデータはありますよね、ありがとうございます
2019/10/20(日) 15:07:27.96ID:RLBjETOG0
ディープラーニングが流行ってから
汎化性能ってあんまりうるさく言わなくなったよね

SVMあたりのころはやたら言及してたのに
344デフォルトの名無しさん (スフッ Sd42-FVSl [49.106.220.168])
垢版 |
2019/10/20(日) 16:55:57.67ID:5FKWmxq9d
DCGANによる画像生成について質問。
色んな文章の画像データを学習させたら
LSTMのように画像データとして、文章生成は可能ですか?

あと、4コマ漫画をDCGANで学習させて
意味のある4コマ漫画を生成することは可能ですか?
2019/10/20(日) 18:08:28.99ID:+KWnMamE0
>>344
どっちもはげしく調教師の腕前次第。
不可能ではないだろう。
2019/10/20(日) 19:17:37.96ID:2v7IlCoiM
そもそもクラウドはテクニカルタームじゃなくて単なるマーケティング用語だったよな?
AIと同じく結局はビジネス界隈で流行れば官軍ってことか
2019/10/20(日) 20:17:51.88ID:4HG1pc8w0
別に誰も勝者じゃないのに官軍とか馬鹿じゃね?
348デフォルトの名無しさん (アウアウウー Sa9b-83DY [106.154.130.6])
垢版 |
2019/10/20(日) 20:45:32.57ID:xbXJ4T7Ga
>>344
不可能とは言わないが、出来たらトップカンファレンス通るレベル
349デフォルトの名無しさん (ワッチョイ f7ad-V+wO [124.144.197.178])
垢版 |
2019/10/20(日) 22:12:40.67ID:zXnrxtUW0
>>344
難しいとは思うがやってみたらいい。
なんでもチャンレンジしておくと、
どゆのが難しいのかわかってくる。
人にとって意味のあるものを生成するということが
どれほど困難かわかると思う。

不可能と思えることにチャレンジすることを
無駄と思うか、勉強と思うか、馬鹿にするか、
それは人それぞれ。

やらないでおいて、
「できやしないよ。」
「それ不可能だから」
「それ単なる判別だから」
なんて批判するのは簡単。どんな馬鹿でも低能でも言えること。

何を言われようとチャレンジするのがいいと思う。
あとあと財産になると思う。
2019/10/20(日) 22:39:19.56ID:4HG1pc8w0
https://github.com/NVlabs/stylegan
V100を八枚使って3日って世界だけど頑張って!
(ちなみにアマゾンだとこれで約20万円だけど。)
2019/10/21(月) 00:10:30.23ID:0yo3KYqzM
>>347
勝てばという枕詞がつけばそのような含意になるが、この場合はそうではない
そもそも論ズレだよ
2019/10/21(月) 00:56:16.91ID:WYoX45rO0
で、クラウドって言葉がビジネス界隈で流行って何が官軍なん?
353デフォルトの名無しさん (ワッチョイ c610-4dmd [153.131.102.129])
垢版 |
2019/10/21(月) 07:33:53.00ID:LkDkCGmw0
>>325
正規アクセス権限を持つ人の管理を自社でできない
正規アクセス権限を持つ人だからその気になればアクセスするのは容易
354デフォルトの名無しさん (ワッチョイ c610-4dmd [153.131.102.129])
垢版 |
2019/10/21(月) 07:40:58.63ID:LkDkCGmw0
>>337
オートエンコーダによる次元削減と
主成分分析による次元削減とは
どんな関係?
条件が揃うと両者の結果は一致する?
どんな条件でとか判明している?
2019/10/21(月) 07:54:38.23ID:2zFZa7pr0
論文があったと思う
356デフォルトの名無しさん (ワントンキン MM73-hjwr [210.132.8.232])
垢版 |
2019/10/21(月) 09:02:29.55ID:VyV3rznyM
オートエンコーダっていうけど
古くない?
357デフォルトの名無しさん (アウアウウー Sa9b-83DY [106.154.130.161])
垢版 |
2019/10/21(月) 09:07:45.09ID:HKPBZHRea
最近の手法でもネットワークの一部にオートエンコーダーが使われていたりはする
358デフォルトの名無しさん (ワントンキン MM73-hjwr [210.132.8.232])
垢版 |
2019/10/21(月) 10:35:25.87ID:VyV3rznyM
どんな奴?

ビッグデータ言うけど
中身的にはknnになってそうで怖い
どの程度未知データに対応できるのか知りたいのに
2019/10/21(月) 13:31:47.34ID:qqa/WroJa
主成分分析は軸を決めて絞っているイメージ
オートエンコーダはなんとなく絞っているイメージ
360デフォルトの名無しさん (スププ Sd42-Mkdf [49.98.63.11])
垢版 |
2019/10/22(火) 10:09:07.31ID:lFIH7itId
ディープラーニングで星空を学習させて、星空の画像を生成させようとしたら
ノイズのような糞画像が生成されたというツイートです。

https://mobile.twitter.com/aki202/status/1185695506703384576

どうしてこうなったの?
原因を調べようにも、ブラックボックスでわからないのでしょうか?
https://twitter.com/5chan_nel (5ch newer account)
361デフォルトの名無しさん (アウアウウー Sa9b-83DY [106.154.131.92])
垢版 |
2019/10/22(火) 14:58:07.65ID:NFYmLoNWa
学習できてない
362デフォルトの名無しさん (ワッチョイ 2fe6-hjwr [14.3.161.84])
垢版 |
2019/10/22(火) 16:15:33.91ID:hH4hu+Bb0
ganでやってんでしょ
足りてない
2019/10/22(火) 19:14:07.07ID:9wtq+mx60
ガーン
2019/10/22(火) 19:16:27.86ID:5RVdJ+a80
読み方はギャンらしい
2019/10/23(水) 07:33:38.47ID:kl84VSvUr
>>360
星空全体の学習(dcgan?)はむりでないなかあ なにの特徴量をとらえたら良いのか分からない

星、山一つづつを学習して 何らかの方法で合成するとか
366デフォルトの名無しさん (ワントンキン MM73-hjwr [210.132.8.232])
垢版 |
2019/10/23(水) 10:28:52.26ID:/wjqUoilM
やってみた系
Qiitaにありそう
何でこういうツイートをどや顔でするんだろう
高度なことをしているアピール?
実際は無知を晒してるだけなのに。。。
2019/10/24(木) 10:02:19.99ID:apIKxFyCM
>>366
やってみた系やQiitaの記事書くよりもツイートする方が楽だからだろう
368デフォルトの名無しさん (ワイーワ2 FF9f-Tlcr [103.5.142.120])
垢版 |
2019/10/24(木) 10:22:21.30ID:ABhN6CSmF
所詮はバカッター
失敗や無恥を曝す方がリツイートも良いねも増える世界
アフィ厨と一緒でフォロワー増やす目的
相手にするとつけあがる
2019/10/24(木) 10:42:24.24ID:TZ+cyP5wr
アノテーション1日3000個
370デフォルトの名無しさん (ワッチョイ e390-MZfN [112.139.91.58])
垢版 |
2019/10/24(木) 15:39:10.85ID:h4TZRS470
IT系は客の懐具合で予算が決まる
衰退する業界を客にしてると共倒れだ
2019/10/24(木) 19:06:51.87ID:k0n7Q/rX0
時代は量子コンピュータだ(棒)
372デフォルトの名無しさん (ワントンキン MMd7-seY4 [210.132.8.232])
垢版 |
2019/10/24(木) 20:18:37.50ID:mJmionkaM
まだまだ先じゃないの
2019/10/24(木) 23:33:33.42ID:MvRnXylv0
[ビ+]【IT】量子超越「ライト兄弟の業績に匹敵」 Googleが会見
https://headline.5ch.net/test/read.cgi/bbynews/1571927133/
2019/10/25(金) 11:19:29.75ID:qkKvohBNa
>>366
既存の事例や良書の下位互換でしかなくても記事にまとめることで理解が深まる
別に君に見せるために書いているわけではないので興味がないなら黙って閉じればよい
「何でツイートするの?」とか言ってるだけ時間と労力の無駄だろう
375デフォルトの名無しさん (ワントンキン MMd7-seY4 [210.132.8.232])
垢版 |
2019/10/25(金) 14:02:38.91ID:lQl0zV4qM
何で公開すんの?
見て欲しいからでしょ?
注目を浴びたいんでしょ?
2019/10/25(金) 15:03:44.46ID:qkKvohBNa
何で公開したら駄目なの?
見なければいいだけでしょ?
注目しなければいいだけでしょ?
2019/10/25(金) 15:36:22.58ID:DCbb0Eu2r
VOTTを使ったアノテーションで
ver1では動くがver2で全然動かないなあ
タグの設定ができない

Win上で作業

exeファイルでインストールしたが、ソースからやった方がいいのかな
2019/10/25(金) 20:13:24.49ID:zctARNqM0
                  ヽ人人人人人人人人人人人人人人人ノ
         / ̄(S)~\  <                      >
       / / ∧ ∧\ \<  嫌なら見るな! 嫌なら見るな! >
       \ \( ゚Д,゚ ) / /<                      >
         \⌒  ⌒ /  ノ Y´`Y´`Y´`Y´`Y´`Y´`Y´`Y´`Y´`Yヽ
          )_人_ ノ  
          /    /
      ∧_∧ ■□ (    ))
     (   ; )■□  ̄ ̄ヽ
   γ⌒   ⌒ヽ  ̄ ̄ノ  ノ
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄|
2019/10/25(金) 20:29:51.32ID:E+67pbC4a
むしろ自分からわざわざ見に行って「俺の気に入らないものを書くな!」と騒いでるんだよなあ
嫌なら見るな、以外の何物でもない
2019/10/25(金) 22:09:09.25ID:I8iFw1TGa
ならnoindexしといて
381デフォルトの名無しさん (ワッチョイ e3dd-seY4 [122.249.72.219])
垢版 |
2019/10/25(金) 23:30:25.15ID:zY1ZO0SR0
チラシの裏に書け
2019/10/25(金) 23:35:26.50ID:Pxjdzyta0
>>375
アドバイスももらえてるようだし公開したメリットを享受してるっぽいが
何が気に入らないのかわからない
2019/10/25(金) 23:44:56.12ID:6CYskVcia
そもそもTwitterは個人のつぶやきに過ぎないしブログは単なる日記だ
別に君に有用な情報を与えることを目的としていないのに何勝手に期待しちゃってるんだろう
2019/10/26(土) 00:17:17.07ID:D9LzSwkGM
>>378
AVの撮影現場に乱入して「僕、童貞ですから早く服を着てください///」って真っ赤になる感じ
2019/10/26(土) 08:46:36.42ID:NR6i9qZO0
ここは便所の壁
386デフォルトの名無しさん (ワッチョイ 33e6-seY4 [14.3.161.84])
垢版 |
2019/10/26(土) 10:04:19.57ID:sMyP0ohJ0
YouTubeでpvだと思って見たら
素人のカラオケだったときの失望に似ている

上手いなら感心してみるけど
ド下手が上げてんじゃねえよ、と
2019/10/26(土) 22:57:59.97ID:pDakV2RU0
tensorflowでmnistを99%くらい当てられるようになった程度だと
機械学習のお仕事の最底辺辺り?
仕事で機械学習ってどの程度の難易度か全然イメージつかない
2019/10/26(土) 23:06:22.63ID:uMeA1BUs0
ここは機械学習の最底辺どころか
知ったか素人のたまり場だから質問されたって答えられないよ
2019/10/26(土) 23:08:34.54ID:I3o5RH8v0
>>387
機械学習案件の未経験者の採用指標って、
マトモなところだと大学の学部と専攻、
SESのようなアホ営業が間に入る商流だとPythonの経験年数 みたいな感じ?

作業の大半は前処理とデータクレンジングだから後者でも間違いでは無いが
2019/10/27(日) 00:01:55.46ID:MrvuaP/Y0
>>387
mnistは簡単すぎてベンチマークにならない
その程度で十分なこともあるけど、データの素性を理解していないとどうしようもないこともある
2019/10/27(日) 00:08:01.21ID:N1OrUkzdr
>>387
tensorflowだと機械学習でなく深層学習だな

まあ自分でデータセット作ってそれから区別出来るように学習させました、というのが大事だな
2019/10/27(日) 03:00:05.93ID:yje76TNI0
>>387
未経験で機械学習の仕事掴みたいならkaggleで結果出してアピるのが早いんじゃないか
早いつっても一朝一夕じゃいかないけどな
色んな機械学習のタスク解いてみ
あと勉強して理解したことを客観的な指標とともにちゃんと表現するといい
393デフォルトの名無しさん (アウアウウー Sa97-G9/M [106.154.130.173])
垢版 |
2019/10/27(日) 06:50:07.36ID:Qb9Ns76Ya
>>387
チュートリアル完了
2019/10/27(日) 10:23:08.48ID:Sdc+cFVla
mnistを高精度で当てるモデルができたとしてもネット上の他人の知識を寄せ集めただけで理屈はよく分かっていないのか、
何らかの根拠に基づくモデリングを行って精度が上がった(=高精度の理由を自分で数学的に説明できる)のかで全く異なる
前者であればそんな人間は山ほどいるので何の自慢にもならない
2019/10/27(日) 11:06:47.77ID:a+EgGKKD0
>>387
就職することを考えているなら知識の移り変わりが少なくて派遣が蔓延してなくて年寄りが居るところにした方がいいだろう
中国の殺し屋が下請けを雇って5次請けまで行って3000万の案件が末端で150万になり
「150万で殺しなくない」ってことで死んだフリした写真を送って終わらせようとしたニュースが出てて
それ日本のIT業界じゃねーか!突っ込まれてたけど
こんな構造が当たり前になっているところもちょっと
2019/10/27(日) 11:49:41.57ID:/g1/9V530
mnistはもうこれ以上あげても過学習でしかないだろう。
あれ、人間も判別不可な数字もまじっているし、
あえて業務で使うなら「判別不可」を割り当てるのが正しいデータが結構ある。
2019/10/27(日) 20:36:55.06ID:hG9pDBcOM
発注元の社内における地位によって、そこらへんの閾値の調整が違うんだよなあ
発注元が閾値に対して責任を負っている人だと、閾値を調整する機能を持たないシステムの方が好まれる
実務経験がある人にしかわからんだろうけど
2019/10/27(日) 21:53:53.97ID:qLlRYvp1M
将来この分野の仕事したかったら、ゼロからはじめるのフルスクラッチの内容理解するのって意味あるのかな
そんなことに時間使うならテンソルフローとか使ってモデルを多く作った方がためになるのか…
2019/10/27(日) 22:04:32.89ID:hG9pDBcOM
ゼロから作る方がためになる。あなたの年齢にもよるけど
kerasのいま使われている関数は、量子コンピュータですべて吹き飛ぶから
2019/10/27(日) 22:37:18.84ID:MrvuaP/Y0
>>399
適当なことは言わんほうがいい
2019/10/27(日) 22:44:11.08ID:i58DI1ra0
>>399
ゼロから読んだけれどもpythonが量子コンピュータを扱えなければ仕組みを解っていてもキツいっしょ
2019/10/27(日) 22:52:02.49ID:/g1/9V530
>>398
意味はあるがあれはソースコードがヘンテコな副作用を仮定したつくりになってて好きじゃない。
2019/10/27(日) 22:53:54.48ID:/g1/9V530
>>397
くだらん社内政治によってデバッグしずらくなるパターンだな。
あんまりそういうところから機械学習の仕事はしたくねーわ。
2019/10/28(月) 00:25:42.82ID:3pZ+EtQea
ゼロから始めるなんて集中すれば1週間かそこらで終わるんだからtensorflowもどっちもやればいい
所詮は超初心者向けの入門なんだから
2019/10/28(月) 02:12:02.65ID:pZrpoGAC0
逆に初心者向けでない機械学習を扱ってる本って何か知っていたら教えて欲しい
中級以上、実務レベルって言っても差し支えないやつ
わりと超初心者or初心者を対象にした本が多い気がする

本でなかったら、サイトとかでも
2019/10/28(月) 04:23:48.61ID:IQZT4uzj0
DLフレームワーク操るのどこまで突き詰めりゃいんだろ
なんか水ものの知識に思えるんだよな
とはいえ定番は定着してきてるか
他に覚えなきゃいけないこともたくさんあるし
2019/10/28(月) 06:09:29.14ID:GLbWfyQf0
PRML
2019/10/28(月) 14:24:55.48ID:y+5NzS6or
>>377
自己解決
タグを入力してからenterを押してタグ名確定
これだけw
2019/10/28(月) 14:40:54.62ID:/femDpxA0
>>400
いや、さすがに量子コンピューターうんぬんはもののたとえだけど
勾配ブースティングが出てきて業務が変わったように
ツールの知識は流行り廃りが激しいから、深いところで知識や技術を蓄えないと
エンジニアとして時代に押し流される
2019/10/28(月) 17:41:38.53ID:W1nk1vcAM
>>405
理論の中級レベル以上書籍ならPRMLとかカステラ本があるだろうけど、
実務に沿ったMLノウハウを凝縮した本ってまだ出版されてないんじゃないか
コードレベルのものならkaggle漁ればあるだろうけど
2019/10/28(月) 18:35:22.41ID:DGKmppp60
それこそレビュー論文でよくね
2019/10/29(火) 14:12:21.90ID:2H6Dj4B4a
>>405
機械学習に限らず中級以上の本、サイトは需要が少ないので発表されることが少ない。
あえて言えば、マニュアルが中級向け、論文が上級向け
ただし論文はうそも多い
2019/10/29(火) 16:21:48.30ID:kXn8AUyn0
うそ おおげさ まぎらわしい

論文撤回数ランキング上位10名のうち半分が日本人
414デフォルトの名無しさん (ワントンキン MMdf-seY4 [153.237.134.243])
垢版 |
2019/10/29(火) 18:36:46.47ID:KCHCOTCfM
実務をどれだけやったかじゃね?
2019/10/29(火) 21:20:41.60ID:DOUedQO9a
>>405
実務レベルの機械学習の知識なんて企業秘密だらけなので公開されるわけがない
416デフォルトの名無しさん (ワッチョイ 33e6-seY4 [14.3.161.84])
垢版 |
2019/10/29(火) 22:14:12.17ID:32UpIEvm0
知識って言語モデルで良いの?
2019/10/29(火) 22:18:26.97ID:kXn8AUyn0
>>416
やること次第っそ

ひとくちに「ターゲットは言語だ!」といっても、
1バイト分かち書き文法カチカチの場合と
2バイト文法なにそれおいしいのカオスの場合では
必要な知識の量が全く違ってくる品・・・
2019/10/29(火) 22:18:44.23ID:dJZjQrr+0
さすがにそろそろ機械学習でなんとかするみたいな馬鹿案件はなくなってくるだろうな。
それくらい焼き畑したと思うよ。
2019/10/30(水) 13:37:41.45ID:ffNJYAeVp
そうだ!星空(ランダムドット)を学習させれば星空(ランダムドット)が生成されるんじゃないか!?
2019/10/30(水) 13:56:23.63ID:GWmaMiFl0
>>419
やめてさしあげろwwwww
421デフォルトの名無しさん (アウアウウー Sa97-ubyV [106.161.118.117])
垢版 |
2019/10/30(水) 17:13:08.55ID:3aN27z+Ma
>>404
chainerもpytorchもやれ。
422デフォルトの名無しさん (アウアウウー Sa97-G9/M [106.154.130.51])
垢版 |
2019/10/30(水) 17:26:33.89ID:DV87KhQta
ランダムドットを入力して星空に変換出来たら面白そうだなあ
423デフォルトの名無しさん (ワントンキン MMdf-seY4 [153.237.134.243])
垢版 |
2019/10/30(水) 18:57:53.97ID:OxfqAVssM
単一画像からのスタイルganみたいなやつが
まさにコピペ自動機だった
2019/10/31(木) 11:13:06.25ID:JglnROWD0
>>422
星空は、まったくランダムじゃなくて
けっこうな粗密のむらっけ&見た目の大小(明るいくらい)があるから、
テキトーに1dotの点々を何個かうってもらった画像を初期値として
そこから準備しておいた数式でごにょごにょーごにょーして
適度に粗密と大小をつけた星空ふいんきの画像を出す。
っていうのつくったら、
カネにはならんだろうが
やったったです!デモにはいいだろうな。

機械学習は、
全天サーベイの写真あたりをインプットにして、
「初期値からいいかんじにごにょってくれる数式」を製作するところに使ってくれ。
425デフォルトの名無しさん (ワントンキン MM2a-4Ncq [153.237.134.243])
垢版 |
2019/11/01(金) 16:25:10.67ID:GsymoNAsM
却下
426デフォルトの名無しさん (アウウィフ FFb7-DOEl [106.171.80.130])
垢版 |
2019/11/01(金) 16:29:45.45ID:4VV6x0MuF
星団
星雲
天の川
あたりをだしたければ重力シミュレーションも必要
2019/11/01(金) 17:28:42.59ID:qSHo2rpn0
>>426
うーんどうだろう?

天の川を0から現在まで作るには、
「2400億粒くらいの星を撒いて重力シミュレーション」らしいけど

星空っぽい柄を生成しちゃるぞー
程度だったら
天の川銀河(銀河系)のざっくり図・・・星がある確率の地図を作っておいて
あとは地球のどこからみると、どっちがどんだけみえるー
くらいのデータがあれば
ええんでないのかなー

入力も、
dotをいくつか打ってもらうんじゃなくって
メルカトル図的な真っ黒四角の中に、
どこか1点でいいような。
季節とか時刻はめんどうだから春分の夜@ロンドン固定とかで。


星団・星雲はトッピング的なもんで、
肉眼でもわかるぞー!っていうのはマジ数少ないから、
「星空柄の壁紙つくっちゃる」くらいだったら
とりまホーチでおk。
どーしてものせたいのなら、確率地図に大小マゼラン雲くらいは書き足しておk。
2019/11/04(月) 09:14:43.57ID:cAnKAoHq0
カブリ数物宇宙研、宇宙の複雑な3次元シミュレーションをAI技術で効率化 日米加 共同研究
https://www.ipmu.jp/ja/20190828-AI_model

>宇宙の構造形成過程を瞬時に模倣できる深層学習モデルの作成に成功
>宇宙の始まりの初期条件を復元することも不可能ではない
429デフォルトの名無しさん (ワッチョイ c7dd-4Ncq [122.249.72.219])
垢版 |
2019/11/04(月) 14:20:31.61ID:6UHCWlqh0
嘘臭い
2019/11/04(月) 17:51:30.22ID:WRpKwFsh0
この論文通ったのは奇跡だと思う
中身なさすぎ
431デフォルトの名無しさん (アウアウウー Sab7-qHxX [106.161.128.195])
垢版 |
2019/11/04(月) 18:20:52.91ID:PQlPE2ZKa
>>416
BART?
2019/11/04(月) 19:05:13.23ID:F/trr2gA0
修士論文で2次元アニメ画像の顔をたくさん読み込ませて
平均顔みたいなのをAIで自動生成するみたいな課題を割り振られたんですが
何から手を付けていいか分かりません

まず顔認識の場合ラスター画像そのままよりもベクター画像に変換したほうがよさそう
(とくにアニメ画像の場合髪色がまちまちぃだったりするので)
と思うんですが詳しい方いませんか?

その場合顔の画像を与えると境界情報をベクトル化して抽出してくれるようなライブラリってないでしょうか
髪型を特徴量として表すのはかなり難しいとおもってるので
まずは顔全体の外接円、あごからほおの輪郭、目の位置、鼻の位置 あたりをベクトル化して
大量画像をディープラーニングで流し込んで顔データを自動生成して
髪型だけは既存のものを適当にあてはめて可愛い画像ができました
あたりをおとしどころで論文にしようかなとおもってます

機械学習は大学の講義レベルの知識しかないので
それじゃあだめだろとか改良点とかあったら
みなさまのプロのご意見をおききしたいです
433デフォルトの名無しさん (アウアウウー Sab7-Tw1J [106.154.131.133])
垢版 |
2019/11/04(月) 19:57:54.46ID:b7XfuRK5a
「平均顔みたいなの」というのがよく分からないが、あなたの考えるベクター画像に変換するメリットをもっとkwsk
2019/11/04(月) 20:10:24.80ID:l8jF+acj0
>>432
ラスタをベクタにしてやんよ!系ソフトは
それだけで高額販売されてるレベル
2019/11/04(月) 21:00:39.11ID:F/trr2gA0
>>433
かわいいとおもった画像の特徴を平均化すれば
万人受けするもっとかわいい画像が作れるんじゃないかっておもってますが
そこは別に商業じゃないので結果うまく行きましたでも修論レベルなら十分かなとおもってます

あとラスターだとかなり周辺広く見ないとどこの部分なのか認識するのが難しいから
特徴量が多くなりすぎてかなり深いニューラルネット組まないと
そもそも顔として認識するのが難しいんじゃないかっていう印象です

見当外れだったらすみません

>>434
そうなんですね

リアルの写真は難しそうですが
2次元アニメ画像ぐらいなら境界周出するのってそんな難しくないかなと
なんとなくおもってました

そこがすでにすでに難しいなら
大量の画像の顔部分だけ手動で輪郭や目とかをトレスして
そのペンのストロークを座標に記録してベクトル化するようなプログラムを作ってから
そのベクトルに対してディープラーニングを行ったほうが良さそうですね

アドバイスありがとうございます
2019/11/04(月) 21:34:46.65ID:l8jF+acj0
>>435うえはんぶん
('A`) おう べんきょうもっとがんばれよ

>まんなからへん
ラスタ画像っつか写真の顔認識は、ぐっぐるが結構昔から販売してるぞ。

それとはたぶん独立に、
近頃のプリクラマシンの
デブスだって日本人受けしやすくカワイい方へガツンと盛ってくれる補正技術はすごいから、
カワイイをきわめるつもりなら、
勉強する価値があるとおもう。

>したからにばんめ
二次元はいわゆる人外カラーの髪や瞳の色が壁になると思う
まぁがんがれ

>いちばんした
機械学習くんを調教できるほど手を動かすなら
努力したで賞で修士・・・でるのか・・・・・・?
理学じゃ努力しまくってても失敗データじゃ修士でないんだが。
2019/11/05(火) 02:25:13.35ID:WGM3y/GM0
>>436
販売なんですね
有名なんだったら普通に研究室で買ってそうなのできいてみます

>プリクラマシンの補正技術
調べてみます!

> 二次元はいわゆる人外カラーの髪や瞳の色が壁
そうなんですよね
3次元用の顔認識アルゴリズムをそのままラスター画像に適用して
うまく肌以外の色相自由度を認識してグループ化してくれるか分からないです

いろいろアドバイスありがとうございます!
2019/11/05(火) 06:41:44.76ID:KGQwTe220
pcaのeigenfaceだろ?
2019/11/05(火) 08:08:18.32ID:wNX9eMw00
修士なんて何やっても貰えるよ
お前大学院行ってないだろ
2019/11/05(火) 09:53:29.25ID:1ygLA3K6M
機械学習を就職に使うなら、修士論文がんばらないといいところ行けないぞ(哀しい目)
論文適当にすませてKaggleがんばってもいい気がするけど
2019/11/05(火) 12:17:34.32ID:GVd5q/rua
就活段階で修論の全体像なんて全然見えていないだろうからなんとなく立派そうなテーマとそれっぽく説明できる話術があればOK
2019/11/05(火) 12:41:52.10ID:fvi/VFnh0
修論レベルでちゃんとした成果を出すのは不可能に近い
何かをやったということにしかならない
研究で成果を出すことはものすごく大変
2019/11/05(火) 13:23:27.49ID:1ygLA3K6M
それで充分さ。立派だよ。まぶい
444デフォルトの名無しさん (ワッチョイ 23da-DOEl [118.21.135.8])
垢版 |
2019/11/05(火) 16:10:59.42ID:mbkTm92O0
>>432
宿題は宿題スレで
2019/11/05(火) 17:32:52.03ID:4ZvLZxny0
>>437
どこの研究室でもライセンス買っつるであろう、Officeみたいなものじゃない件。
しっかりパッケージされて売ってるわけではないぞw > 顔認識システム

>色相自由度を認識
人外カラーの髪や瞳だけじゃなく、
スキンカラー問題だの、
いわゆる色トレス線を境界だと誤認識するだの、ありそうだぞ。

インターネッツに、日本語で、
自分で顔写真を顔写真だと認識するプログラム組んだったw

黄色人種以外に非対応な人種差別っぷりよ…(´・ω・`)

改良したった!
っていう話をのっけてくれてるブログが転がってるはずだから
がんばってしらべろ。

二次元絵じゃないほうの、
リアル写真からの顔認識については、
おさえておくべき特徴点とか、
年齢・性別・人種を分類するためのポイントとかまでもう研究されてるから、
そっちをしっかり勉強してから、
二次元に挑んだ方がいいのかもわからん。

あー
続きは宿題スレを占拠されても困るんで
指導教員なり同様の課題をやってる先輩にききんしゃー
2019/11/05(火) 17:43:51.24ID:4ZvLZxny0
>>439
なにやってても押し出し(追い出し)てもらえるなんざ、
戦前から平成一杯くらいまで続いてた研究室(たぶん200人以上卒業生がいる)の中でも
1名しかいないレベルの
特大ハズレ大馬鹿うんこ野郎だけの特権だw

>>442
そんなに枯れちゃってるのこの業界?

おれは正直いって結構オワコンな分野の所属だったけど
学部で配属後最初の1か月分のデータでレター書いて、
学部の残りのデータあわせて1報書いて、
修士で全く違うジャンルだけどやっぱもう廃れてきてる分野に引っ越して
1から?勉強しなおしになったけど、
(こっちはハゲタカとまではいかないがまずまずのマニアック誌にしか載らなかったが)1報書けたぞ・・・
博士過程のことと、某大職員時代については・・・きくなよwwwだけど。。。
2019/11/05(火) 17:56:57.62ID:D3X6JyYoF
新規性はともかく有用性はなあ
大抵有用性はほとんどないに等しい
2019/11/05(火) 18:16:33.73ID:4ZvLZxny0
>>447
それは、いえてる。
2019/11/05(火) 19:16:48.26ID:4ZvLZxny0
>>438
今wikiで読んだったら
調教開始前の
生写真に求められる要件がすっげ厳しいのなw
2019/11/05(火) 21:48:30.86ID:FS2CN9rWM
C言語で画像処理してる会社をクビになって
(その会社に入社する時に、面接官にいわれた方便程度の優しい嘘がささって
バタフライ効果で周りの人間にさっさと会社を辞めた方がいいと諭されまくった挙句、
心が棒人間になって仕事を続けられなくなった。人間関係の板挟みって複雑。。。)
Kaggleちょっとやって、メダル獲れなかったけどいい線いったから
元から行きたかった自然言語処理の方面へ応募してみようかな〜みたいな感じでフラフラしてるんだが
自然言語処理に行きたい!とこっちがいくらいっても、逆求人で画像処理の奴ばっか来るのな。くるなー、くるなー!
やっぱ画像処理の方が簡単に就職できるのかな。それともOpenCVを独学でやっちまったからか
2019/11/05(火) 21:53:10.42ID:4ZvLZxny0
>>450
しぜんげんごが不自由ですな。
マ板向けだろその話題は。
452デフォルトの名無しさん (アウアウクー MM2b-6BDJ [36.11.225.146])
垢版 |
2019/11/05(火) 21:53:50.28ID:FS2CN9rWM
>>451
板違い? すまん、感情のほとばしりがやばかったわ
453デフォルトの名無しさん (ワッチョイ 2e10-5RI4 [153.131.102.129])
垢版 |
2019/11/05(火) 22:16:09.83ID:S4fXfghv0
>>432
pcaとかautoencoderとか使えるかも
あとはパーツ毎に学習して
パーツ毎に生成したものを組み合わせるとか

パーツの位置、配置や大きさでも変わってくるだろう

可愛いキャラは目の位置が上下中央辺りとか
目の大きさが顔に占める割合が大きいとか
2019/11/06(水) 00:05:37.17ID:ggnsGnq2H
>>450
実績ない分野で中途って基本ないだろう
画像とNLP両方やってるとこに画像と抱き合わせでNLPやらせてくれって交渉したら
それでもやらせてくれる確証なんてないけど
455デフォルトの名無しさん (アウアウクー MM2b-6BDJ [36.11.225.146])
垢版 |
2019/11/06(水) 00:32:15.90ID:YRVde36bM
>>454
だな。別にNLPに固執してるわけでもないんだがアプリでも作るわ
次は失敗しないように頑張ろう
456デフォルトの名無しさん (ワッチョイ 8347-hvvP [150.249.206.28])
垢版 |
2019/11/06(水) 10:20:15.66ID:q549CorC0
Google AutoMLをKaggleの350万人のデータサイエンティストに提供
https://cloud.google.com/blog/products/ai-machine-learning/bringing-google-automl-to-3-million-data-scientists-on-kaggle

こうなってくるともうなんかつまんなくない?
2019/11/06(水) 10:43:11.86ID:dKEXVk/h0
仕事としてはシステム導入のノウハウが一番大事だから残るけど
機械学習の仕事は消えていく運命
2019/11/06(水) 12:10:55.21ID:WNCFxxLWa
>>456
AutoMLで自動化できてしまう程度のことに労力使わず人間でなければ(現段階では)できない高度なことに集中しろというだけのこと
むしろつまらない仕事を減らしてくれているんだから感謝しかない
2019/11/06(水) 13:59:14.13ID:Zqmg2IVoF
能力のめちゃくちゃ高いエンジニア以外は淘汰されていくんだな
クラスわけ問題を解いているだけの会社は危うそう
460デフォルトの名無しさん (ワッチョイ 8347-hvvP [150.249.206.28])
垢版 |
2019/11/06(水) 16:41:33.50ID:q549CorC0
次、どこに行こうかね。。。
2019/11/07(木) 18:39:39.86ID:KASF5ywG0
人間が現場作業をしつつアノテーションが同時に出来る(撮影しておいて、
右手を伸ばして目標物体を掴んだ時に左手で数値などを入れてラベリングする)機械を作れば
色んな作業がどんどん自動化されるのかなあ
2019/11/07(木) 19:19:45.16ID:i5KqlsP00
>>461
3Dスキャナとさわるほうの手につけるタイプのセンサーグローブを用意して、
初期位置合わせをがんがれば、
3次元の座標入力と応力(弾性)入力くらいは
今よりはかどりんぐ!になりそうだが、
だからといって
いろいろなんでも自動化ハッピー☆とはならんと思うぞ。。。

そんなことより
3Dプリンタのz軸の動きをもっと精度よくして
積層段差うんとちいさくするなり、
大きめにうちだしておいて自動であとから削って精密に仕上げるテクノロジー

シリコーンみたいなエラストマー樹脂を積層するように、素材開発

はよ
2019/11/07(木) 23:42:34.21ID:TJTG2zyAM
そのうち撮影とアノテーションだけの会社ができるってみんな言ってる
誰も設立したがらないだけで
2019/11/07(木) 23:45:17.24ID:TJTG2zyAM
ネットで調べたらもうあった。時がたつのって早い…
2019/11/08(金) 00:48:20.76ID:WgiyDGhsa
「未経験の貴方もAI業界で大活躍!」とか言って募集してひたすらアノテーションさせるんだろうな
2019/11/08(金) 01:46:15.47ID:2zKKI3uDM
いや、もっと普通の人を集めるんじゃない?
「接客不要。デスクワーク。画像データのラベリング」みたいな求人
接客したくないフリーターが世の中いっぱいいるから人手に困ることはないと思う
467デフォルトの名無しさん (ワッチョイ ff10-Lc5z [153.131.102.129])
垢版 |
2019/11/08(金) 07:13:35.28ID:LWIqGPHS0
>>466
クラウドソーシングじゃね
468デフォルトの名無しさん (アウウィフ FF5b-tB+Q [106.171.87.199])
垢版 |
2019/11/08(金) 11:40:21.46ID:3E1/z7K0F
>>461-462
これは今後どうなるかな
https://www3.nhk.or.jp/news/html/20191107/k10012168051000.html
https://www.okinawatimes.co.jp/articles/-/495151
2019/11/08(金) 12:20:26.44ID:xgevcE5G0
>>466
中国で貧民がそれやらされてるらしいな
2019/11/08(金) 16:58:00.80ID:HH11ynhJ0
>>468
撮影地点の座標と、三脚の高さがしっかりきっぱり分かってれば
写真は平面なんだから
自動で空と建物の境界を認識させて
外枠の3D座標起こすくらいは、
いまどきスッとできるんじゃね?
471デフォルトの名無しさん (ワントンキン MM7f-qVE0 [153.154.54.55])
垢版 |
2019/11/08(金) 17:14:11.10ID:HpQs1W/gM
できるね
2019/11/08(金) 17:32:33.66ID:LJWzZTdr0
HoloGAN?
2019/11/08(金) 17:33:27.04ID:klpf5FSXa
古典的なエピポーラ幾何の問題に機械学習要素を入れる必要はない
474デフォルトの名無しさん (ワントンキン MM7f-qVE0 [153.154.54.55])
垢版 |
2019/11/08(金) 17:56:01.28ID:HpQs1W/gM
金谷センセだな
475デフォルトの名無しさん (アウアウウー Sa5b-CSR4 [106.154.138.79])
垢版 |
2019/11/08(金) 19:07:52.56ID:CSR+2ZkJa
>>470
撮影地点の座標と三脚の高さがしっかりきっぱり分かってないからスッとできないんじゃね?
2019/11/09(土) 01:19:19.56ID:dqtY4XvXd
https://news.yahoo.co.jp/byline/kazuhirotaira/20191108-00149956/
2019/11/09(土) 03:14:02.31ID:ieexeq/b0
https://headlines.yahoo.co.jp/hl?a=20191107-00000082-asahi-soci
478デフォルトの名無しさん (ワッチョイ d7e6-qVE0 [14.3.161.84])
垢版 |
2019/11/09(土) 07:23:02.53ID:R+fonfJU0
歩道を歩いてない奴が事故っただけじゃん

無罪
2019/11/09(土) 09:12:53.22ID:TBchCo8fa
素人でも予見できる例外を考慮してないとかカス設計だな
2019/11/09(土) 10:10:53.93ID:u5+ga7gca
>ウーバー車のAIは車道に歩行者がいることをそもそも想定していなかった

小学生が作ったのか?というレベルだな
481デフォルトの名無しさん (ワッチョイ f790-QzFo [112.139.91.58])
垢版 |
2019/11/09(土) 10:28:42.03ID:ZM4bFDeE0
AI技術者ってマジで急激に増えたな
それも大学で体系的に教育されてきたやつが。
まぁ三年もあれば修士くらい量産できるしな
2019/11/09(土) 12:40:04.35ID:ibGxAFOpd
>>478
普通なら車側が100%悪いと判決される
2019/11/09(土) 15:06:51.67ID:QVHxqxkCa
人が100%悪くても、それが理由でひいていいわけではない
飛び出してきたときは多少考慮されるようだが
それでも車が無罪にはならない
2019/11/09(土) 15:11:10.81ID:06f/2UDZ0
>>481
そして
かつてのバイオテクノロジーバブルと同じように
ピペド(ピペッティング奴隷)ならぬ
機械学習設置するだけの奴隷があふれかえるところまでがセット。
2019/11/09(土) 15:15:32.65ID:BmJjM1vIM
もうAI土方は居るんじゃね
2019/11/09(土) 15:25:20.12ID:06f/2UDZ0
AI土方→(たぶん)最低賃金は守られてるんだろう
AI奴隷→サビ残だらけで実質時給は違法なのが当たり前
487デフォルトの名無しさん (ワッチョイ f790-QzFo [112.139.91.58])
垢版 |
2019/11/09(土) 16:06:33.78ID:ZM4bFDeE0
必要精度に到達できるかどうかのリスクを請負で抱え込んじゃってる会社もあるらしい。
開発のリスク背負うんだったら販売契約だろ
488デフォルトの名無しさん (ワッチョイ 1f02-QzFo [101.142.8.160])
垢版 |
2019/11/09(土) 16:30:27.99ID:dihGWiYo0
>>487
その条件で請け負っている時点でAI技術なさげ

でも、客も解ってなさそうだから、過学習させたインチキ精度で逃げるか?
2019/11/09(土) 17:11:58.21ID:u+nAgAfJM
インチキ精度で逃げる。でもそういう仕事は黒か白かではないから、あながちインチキとも呼べない
たとえば、もともと人間がやっても精度が出ていなかった仕事で
建前上だけ検査しているという話にして、その仕事に関わっているひと皆がおかしいとは思ってるけど
仕事が回らないから誰も何もいわない〜みたいな仕事が世の中にはいっぱいある
そういう仕事を機械に置き換えるような場合、名目上の目標の精度がでなくても
前の精度を実質上回っていれば迷わず開発するでしょ
発注元も、精度が目標を下回っていたところで、見て見ぬフリをする
2019/11/09(土) 17:21:43.78ID:u+nAgAfJM
後そういう会社はAI技術はなくても
ほかの技術をしっかりもってるからエンジニアとしてはむしろ一般より格上
2019/11/09(土) 18:37:54.55ID:PlRJlzfP0
>>487
自分のところの事業の成功率の予測モデルでも学習してろよと思うわなw
2019/11/09(土) 20:05:44.35ID:R+fonfJU0
>>476

AIは警告出してた
警告を無視した人間のせいじゃん
2019/11/09(土) 20:48:42.09ID:u+nAgAfJM
てか機械学習だけしかできない会社ってよほどでないとこれからは厳しいな
別のフィールドに専門を持つ会社の方が残りやすそう
2019/11/09(土) 21:12:41.54ID:PlRJlzfP0
>衝突0.2秒前になって減速が始まると同時に、ドライバーのバスケス氏に警報で危険を知らせる。
これで対応できるわけねーだろ。
2019/11/09(土) 21:31:22.85ID:u+nAgAfJM
今さら警報なんて鳴らさないでくれって感じだな
496デフォルトの名無しさん (ワッチョイ ff10-Lc5z [153.131.102.129])
垢版 |
2019/11/09(土) 21:38:40.63ID:1ZolsRQG0
>>489
その場合は人件費より安く前と同程度の結果が出せれば依頼者側としては大きな問題ではないかもしれない
2019/11/09(土) 21:40:04.01ID:R+fonfJU0
飛び出しで急ブレーキなんて一瞬の判断だよ
0.2秒で判断できないならAI以下じゃん
498デフォルトの名無しさん (ワッチョイ ff10-Lc5z [153.131.102.129])
垢版 |
2019/11/09(土) 21:40:09.82ID:1ZolsRQG0
>>491
データを得られないんじゃね?
499デフォルトの名無しさん (ワッチョイ ff10-Lc5z [153.131.102.129])
垢版 |
2019/11/09(土) 21:41:20.60ID:1ZolsRQG0
>>493
AIは手段だよな
2019/11/09(土) 21:44:56.26ID:PlRJlzfP0
普通に運転してるならともかくとにかく乗せられていざという時なんとかしろって
できるわけねーだろ。
こんなもん責任かぶせるためだけに乗せてるだけってのがミエミエで気分悪くなるわ。
2019/11/09(土) 21:50:16.84ID:u+nAgAfJM
>>496
そそ。俺の前にいた会社なんて
C言語で画像処理やってたんだけど、電機や半導体などの簡単な仕事ばかり請け負って、その道の専門という体裁で仕事を集めてたんだ
全部なんでもやれますというより、これがうちの強味って売り出し方した方が強い
千葉はそういう会社がいっぱいある。中小企業が多いからじゃん
2019/11/09(土) 21:52:56.76ID:u+nAgAfJM
だから機械学習なのにプログラマーの人件費は超安い
まさしく土方
2019/11/09(土) 22:15:57.44ID:LDMrdFKy0
ある日はkeras
別の日にはchainer
そして頭大混乱
2019/11/09(土) 23:58:20.65ID:ieexeq/b0
>>492
???
日本の法律として100%車側のNGな案件。

AIが悪いとかではない。
2019/11/10(日) 00:02:08.22ID:j8ULpgDb0
まあ、前からこの話は問題になると予想された案件。
一度AI設計者の責任にはならないという法律はできたが、それを導入した設計者に責任があるかはまだ結論は出てない
2019/11/10(日) 00:10:11.95ID:j8ULpgDb0
機械学習はあくまで目的解決手段の一つに過ぎない。
最近、AI専門の学科が増加してるが、それをメインにしては飯食えなくなる気がする。
2019/11/10(日) 01:37:00.28ID:eARvZr/10
ついにバブルが完全に弾ける要素が出たなあ
まあこれから地に足ついた現実的な路線に戻るだろなあ
普通にまずは業務プロセスを改善するということに使って欲しい
それ以上のことはあまりにも現実的ではない
2019/11/10(日) 02:20:34.83ID:j8ULpgDb0
https://qiita.com/yossymura/items/334a8f3ef85bff081913
2019/11/10(日) 03:52:17.75ID:j8ULpgDb0
>>476への1つの打開策としてAI保険基金でも作るしかないかなー。
AI車が事故った場合、AI車の管理者が責任を有する。そのときのお金はAI保険に入っていれば保険やさんが出す。

そもそもの事故回避の問題点は消えないままだが。。
2019/11/10(日) 07:45:50.09ID:odpzTgCKM
つぎ量子コンピューターが出てくるとどうなるか分からないけど
2019/11/10(日) 08:55:44.53ID:vAvO6oJv0
>>476
自転車を押している人

を、危険なものと認識できなかったって事か

https://www.kunihikokaneko.com/dblab/keras/31.png
こんなもんの分類は出来るのに、夜中だったから無理だったって事かなあ
2019/11/10(日) 09:15:41.41ID:vAvO6oJv0
>>508
これ以外に、株やFXの相場のろうそくチャートから
次に上がるか下がるかを90%以上の確率で予測できた
なんてのもあるねえ

更にどこぞの高速コンピュータがそれを上回る精度で予測し
しかも1秒に100万回の売買可能!なんて言ってやがるw
実際には証券取引所の方で制限が掛かりそうだな

(0.01%の利益率しか無くても、取引手数料を考慮しないなら
1秒で1万倍以上に軽くなるわけだ(実際には大赤字))
2019/11/10(日) 09:59:21.42ID:rtaa2JF9a
>>509
保険料決めるには保険屋にソースコードや学習に使ったデータなど、基本的にAIの全てを公開しなければならないな
514デフォルトの名無しさん (アウアウウー Sa5b-CSR4 [106.154.138.55])
垢版 |
2019/11/10(日) 10:20:19.78ID:+OI0AxiYa
>>509
事故は分からんが精度に対する保険はある
https://www.nikkei.com/article/DGXMZO47986460Q9A730C1EE9000/
515デフォルトの名無しさん (ワッチョイ d7e6-qVE0 [14.3.161.84])
垢版 |
2019/11/10(日) 11:57:56.59ID:C4cvR5cE0
https://ja.m.wikipedia.org/wiki/%E5%A4%A7%E6%BE%A4%E6%98%87%E5%B9%B3

松尾豊の弟子かよ(笑)
516デフォルトの名無しさん (ワッチョイ f790-QzFo [112.139.91.58])
垢版 |
2019/11/10(日) 12:23:39.77ID:i7RQ4O9k0
松尾研は変なやつが集まりすぎだよ
yentaでも松尾研のやつ見たぞ
2019/11/10(日) 13:11:20.89ID:/B2ESouKa
松尾先生で思い出したけど
「G検定を機械に解かせてみた」で合格したらそれは合格と認められるのかね?
2019/11/10(日) 13:37:21.47ID:uUiSn9Z5a
そもそもG検定なんて文章の読み取り能力を問うような国語の試験になってしまっているので
あんなの合格しても「素人でもわかるAI」系の本の内容を理解している程度の評価にしかならない
E資格ならまだマシだけどそれでも費用が高すぎるので、勤務先が全額出してくれるなら取ってもいいんじゃね?というレベル
2019/11/10(日) 13:46:32.18ID:j8ULpgDb0
松尾てだれだよ
2019/11/10(日) 14:35:24.56ID:eARvZr/10
松尾研出身の人でまともに論文とか出して人いる?
2019/11/10(日) 14:46:59.67ID:5evIiogq0
学習モデル考えたりしてバリバリの研究するより、松尾のような既存の技術を社会に導入する方法を提案する方が金になるだろうな
2019/11/10(日) 15:08:09.90ID:j8ULpgDb0
データなんちゃらりすとになりたいなんて言ってないで素朴に専門学科の勉強をしっかりやりましょう。機械学習はあくまで複数ある問題解決手段の一つに過ぎない。企業側はそのうち見切りつきますから。
523デフォルトの名無しさん (ワッチョイ ff10-Lc5z [153.131.102.129])
垢版 |
2019/11/10(日) 15:49:21.14ID:iNYMutj60
>>511
静止しているから衝突しないとそのモデルは判断していたんじゃね?
本当は静止していなかったから認識ミス、識別ミスだな
ドライバーが動画を見ずに前を見ていたら停止できたと思う
ドライバーの契約がどうなっていたかわからないけど
事故を予防する役割もあったとしたらアメリカなら訴えるだろうな
あくまでも事後処理の役割しかなかったのかな
524デフォルトの名無しさん (ワッチョイ ff10-Lc5z [153.131.102.129])
垢版 |
2019/11/10(日) 16:08:28.16ID:iNYMutj60
>>513
事故の確率とかがわかれば保険料率とか決められるんじゃないの?
病気とかその発生メカニズムとかを説明できなくても保険はあるし
2019/11/10(日) 16:31:30.69ID:j8ULpgDb0
死亡者を出すか出さないかは社会的に大きな差を持つ。
死亡者が出た以上、確率云々の話にならない可能性がある。
2019/11/10(日) 16:48:45.66ID:j8ULpgDb0
小さなお子さまを轢いてしまいました、なんて前例作ったら一気に手を引かなければならない状況になるでしょうね
527デフォルトの名無しさん (ワッチョイ ff10-Lc5z [153.131.102.129])
垢版 |
2019/11/10(日) 17:14:27.32ID:iNYMutj60
>>525
人間が車を運転しても死亡事故は発生する
自動運転の方が死亡事故率が低い事が分かったら
自動車保険で自動運転の場合の保険料が安くなるだろう

社会的な影響は理解できる
だから実証実験のドライバーが動画を見ていて良かったのかが疑問
2019/11/10(日) 17:22:52.75ID:j8ULpgDb0
保険も思い付きで上げた事例。
実際にそれですむかは知らん
2019/11/10(日) 17:58:05.20ID:si2lOYY4a
自分が自動運転アルゴリズムの開発責任者なら何があっても全責任をユーザー(とユーザーが契約した保険会社)が負う条件でないと販売できないな
何故ならバグ皆無のプログラムなど存在しないのだからそれを了解した上で使えよとしか考えられない
で、そんな条件で自動運転車を使おうとする人がいるのかどうか
2019/11/10(日) 17:59:45.60ID:FBzaMbQQM
機械学習の仕事はなくならないどころか増えてるけどな
だから人が増えても単価落ちてない
2019/11/10(日) 19:30:46.14ID:FBzaMbQQM
でもJavaとCで不良品検査する単価の安い仕事はもうしたくないな
つらたん
2019/11/10(日) 19:44:33.69ID:zgABv+Qd0
>>530
具体的に何の産業での仕事よ
2019/11/10(日) 19:56:07.47ID:FBzaMbQQM
少なくとも、画像処理の仕事は増えてる
2019/11/10(日) 20:03:19.56ID:MbFf7EI60
まあテスラならテスラが全額賠償するんだろう。
日本じゃ無理だな。
2019/11/10(日) 20:09:35.21ID:zgABv+Qd0
>>533
それはただの要素技術でしょ
工場とかの不良検品?医療のサポート系?それとも色んな分野のpocが来てるだけ?
2019/11/10(日) 20:19:42.03ID:FBzaMbQQM
>>535
不良品検査で伸びてる。データ集めだるくて
今までシステムを導入してなかったところが、上にせつかれてようやく動きはじめた
2019/11/10(日) 20:26:29.68ID:zgABv+Qd0
やっぱりその辺だよなあ
ありがとう
2019/11/10(日) 21:41:34.53ID:Ni2n1I0Oa
荒稼ぎさせてもらったがそろそろ逃げる準備かな
そもそも機械学習なんて外注してる時点で終わっとるのよ
本当にビジネスに生かしたいなら
海外のIT企業の様に業務プロセスに入れなきゃ
活かせるわけないんだよね
2019/11/10(日) 22:52:41.28ID:FBzaMbQQM
pythonで組んだtensorflowのモデルをjavaで実装するだけという底辺の仕事もあるよ。そんで外向けにはDL4Jを使ってることになってる
最初Cが苦手でそんな仕事ばかりやらされたわ
2019/11/11(月) 05:12:56.35ID:4B7iuPHw0
ちくっとしちゃうよ!
2019/11/11(月) 05:25:18.59ID:tX5kGdXzH
データ分析も人出足りてないよな
2019/11/11(月) 14:12:42.36ID:KOoLqfbJa
>>539
Web経由で結果だけ返すとか
system関数などでpython起動するのじゃダメなのか?
543デフォルトの名無しさん (ワントンキン MM7f-qVE0 [153.154.54.55])
垢版 |
2019/11/11(月) 15:28:27.51ID:6RvD5GOFM
モデルだけ再利用?
よく分からん
2019/11/11(月) 18:52:23.73ID:Oegy0lSI0
https://tech.nikkeibp.co.jp/atcl/nxt/mag/rob/18/00003/110600045/
545デフォルトの名無しさん (ワントンキン MM7f-qVE0 [153.154.54.55])
垢版 |
2019/11/11(月) 19:19:21.18ID:6RvD5GOFM
これだったら
小さい工場でも気軽に導入できるね?
2019/11/11(月) 20:45:45.13ID:EVqu4APJ0
推論のためにモデルを軽くするってのはあるけど、
精度を考えるとそもそもそこまで大きなモデルで学習する必要なかったんじゃね?
みたいな話はある。
てか誰も精度なんか興味なかったって話も。。
547デフォルトの名無しさん (ワントンキン MM7f-qVE0 [153.154.54.55])
垢版 |
2019/11/12(火) 15:52:52.24ID:5J5yqkZqM
hackerxてなんのイベントなの?
2019/11/12(火) 15:59:09.63ID:c/ZpUwOW0
リクルートみたい
2019/11/13(水) 15:33:05.22ID:hApsuBpcr
ハッカー村(そん)
550デフォルトの名無しさん (ワッチョイ fde6-iZ7S [14.3.161.84])
垢版 |
2019/11/15(金) 08:48:30.37ID:y4RyaYdh0
gpt-2の発表は変だった
期待外れ

あの大袈裟な発表は
イーロンマスクが入れ知恵したからなのかな
551デフォルトの名無しさん (ワッチョイ 8d82-IR5O [124.40.110.128])
垢版 |
2019/11/17(日) 21:27:39.70ID:Qw4Ltt1k0
形式ニューロンとパーセプトロンの違いがよくわかりません。
552デフォルトの名無しさん (ワッチョイ 2b10-k7Fv [153.131.102.129])
垢版 |
2019/11/18(月) 07:41:28.00ID:9aN5YyV+0
>>551
ニューロンは一つの素子で
ニューロンを層状の2層構成にしたのがパーセプトロンじゃないかな
553デフォルトの名無しさん (アウウィフ FF11-/nAh [106.171.85.218])
垢版 |
2019/11/18(月) 09:52:47.05ID:ahZzeXy3F
割とマトモなこと言ってる
https://www.youtube.com/watch?v=OLkoIsuxg8k
2019/11/19(火) 06:35:07.83ID:cfYOxE8L0
むんどくさい
https://ainow.ai/2019/11/18/180603/
2019/11/19(火) 10:12:41.66ID:49NB1ryfM
要するに定期的な性能評価と再訓練が必要だから、作って終わりじゃないよって話だよね
あたりめえの話だ
2019/11/19(火) 12:10:48.90ID:2mjMv6uSa
作って放置して劣化しないものなど存在しない
技術の進歩の速いソフトウェアの世界ならなおさら
557デフォルトの名無しさん (ワイーワ2 FF13-/nAh [103.5.142.235])
垢版 |
2019/11/19(火) 12:20:05.56ID:8naC8O/UF
過学習で馬鹿になるパターンは人間でもよく居るよな
2019/11/19(火) 18:54:57.23ID:Y8qF6Kw60
増加しているアジャイルもAIも従来のSI型の発注では無理だけど、
いつまでこの慣行が続くんだろうね
559デフォルトの名無しさん (ササクッテロ Spc9-k7Fv [126.35.69.142])
垢版 |
2019/11/19(火) 19:12:20.06ID:s40irKmEp
>>555
運用中に処理対象になるデータが
開発中に扱ったデータと違う分布になっているとか
開発中のデータがもともとたりなかったってことじゃ無いの?
560デフォルトの名無しさん (ササクッテロ Spc9-+iTV [126.33.37.160])
垢版 |
2019/11/19(火) 20:25:28.12ID:Ag+TvSO9p
ここで聞くのもなんなんですがdeep learningの手法とかテクニック系を話してる板はどこでしょうか?
561デフォルトの名無しさん (ワッチョイ 8d82-IR5O [124.40.110.128])
垢版 |
2019/11/19(火) 20:31:02.32ID:nEj8UkU30
どうしたらディープラーニングで言語理解出来るようになりますか?
2019/11/19(火) 20:46:18.90ID:FKsBQDds0
>>561
ママンに自然言語をも一度おしえなおしてもらってからだな
2019/11/19(火) 21:02:01.44ID:cfYOxE8L0
https://www.itmedia.co.jp/news/spv/1911/19/news098.html
2019/11/19(火) 21:03:39.09ID:bUPqVsUtM
>>555
つまりはしばらく食いっぱぐれ無いってこったな。ええこっちゃ。
2019/11/19(火) 21:30:03.49ID:z1WwUVuJ0
SIerが滅びないと日本のITに未来はない
2019/11/19(火) 21:33:22.55ID:EAp6ZFS60
滅びない。そして未来はない
2019/11/20(水) 00:19:44.54ID:fEAcQWwmp
すいません。まったくのど素人なのですが、質問させてください。

システム構築というか、コンピュータに望むような動きをさせるため、どのプログラムをどのように組んだらいいのか、ってことについて勉強をしていきたいと思ってます。

アルゴリズムや機械学習などの基本知識を学んだ上で、プログラミングを勉強していけばいいでしょうか。

よくわからないなりに考えたので、何を言ってるのかわからないかもしれませんが、何をすべきか、ご教示ください。
568デフォルトの名無しさん (ワッチョイ fde6-iZ7S [14.3.161.84])
垢版 |
2019/11/20(水) 07:06:48.48ID:zvVE5hEg0
>>567
こういうのをやってみたら?
https://www.codexa.net/
2019/11/20(水) 07:43:05.33ID:akFTsaUH0
>>567
適切なスレに誘導してもらう
2019/11/20(水) 08:22:58.48ID:xoh76b7Fp
>>568
ありがとうございます。できれば最初に地図というか全体を俯瞰して理解したいのですが、それは可能でしょうか。

>>569
ありがとうございます。どこらへんで聞くのが適切でしょうか。教えていただけると助かります。
2019/11/20(水) 09:45:01.14ID:hrstG49p0
>>570
システム構築をゼロから学ぶつもりってこと?
どこかの情報工学科のシラバス一回見てみるとか
習得範囲が広すぎるような気もするので、とりあえず望んだプログラム動かすまでとか範囲決めるといいかも
あとは身近で詳しい人捕まえて素人質問たくさんぶつけた方がよさそう
572デフォルトの名無しさん (ワンミングク MMe3-f9Up [153.235.108.33])
垢版 |
2019/11/20(水) 11:54:50.74ID:8uwrhbuIM
東大に入ればいいんじゃない?
2019/11/20(水) 12:22:19.49ID:QpxHOQL8d
ライフワークになってしまう
2019/11/20(水) 15:56:49.87ID:fDyJS9pg0
>>567 >>570
続きは↓へ移動汁
スレ立てるまでもない質問はここで 152匹目
http://mevius.5ch.net/test/read.cgi/tech/1573214616/
2019/11/20(水) 22:43:33.41ID:xoh76b7Fp
遅くなりました。皆さまありがとうございました。
とりあえず、全体像を見て、どこらへんを目指すか考えていきます。
>>574のスレッドでいろいろ聞いてみようと思います。
それでは。
576デフォルトの名無しさん (ワッチョイ 56bb-tIGp [217.178.3.78])
垢版 |
2019/11/23(土) 11:06:54.12ID:EMpawcHE0
>>567
>「コンピュータに望むような動きをさせるため」

その『望むもの』を自分で先に見つけ出したほうがいい
これ自体はコンピューターと直接の関係はない。
まずは、コンピュータにとらわれない実務に触れてみたら
ヒントがでてくるんじゃないかな。
じゃないと、何やっていいかすらわからないから、
何から覚えるかもわからないことになる。
2019/11/23(土) 14:23:27.39ID:pr0bhlVh0
意匠権について
https://youtu.be/nXdkZafRzyY


2020年4月に法改正
https://youtu.be/5YS0TLS37Zs
2019/11/23(土) 14:52:00.77ID:UeAxjNOJa
大澤昇平 :: AI 救国論 🇺🇳 @Ohsaworks:

AI の場合は単に精度が高ければ何でもいいんですよ。
設計時に人間が主観(「事前分布」といいます)として差別的な情報入れたら NG ですけど、
ラーニングの結果として差別が生まれるのであれば、それは単なる自然の摂理です。
https://twitter.com/rysyrys/status/1197764388691689472
https://twitter.com/5chan_nel (5ch newer account)
2019/11/23(土) 15:07:28.15ID:PHGQW6IUa
特任准教授なのに准教授と自称している人だな
2019/11/23(土) 19:34:36.75ID:rr4WRS2d0
> 称号 経済産業省認定 未踏天才プログラマー/スーパークリエータ
(つд⊂)ゴシゴシ
( ゚д゚ )
2019/11/24(日) 00:38:43.56ID:2vFps37N0
>>580
これが何の意味もないことを証明してしまったな
2019/11/24(日) 08:46:55.06ID:wKi7JOLd0
清水某とかもそうだろ
2019/11/24(日) 13:27:18.72ID:WoLlse2Fa
東大から正式に切り捨てコメント出たな
こういう胡散臭い人はどんどん切ってほしい
2019/11/24(日) 13:30:34.69ID:G+scijNw0
つくばが出発点で
政府系のあやしープロジェクトにガンガン応募して
りっぱにうかってるところも一緒ダナーw > >>578の人&「トロイのつくば」の作者

>>581
だなw

>>583
東大以外からも
どんどん探し出してポイしてってほしい
2019/11/26(火) 08:01:06.64ID:g0fKFAs1r
cudaがらみはくだpyスレがいいのかな
2019/11/26(火) 19:02:05.57ID:pgCzIwzp0
>>585
【GPGPU】くだすれCUDAスレ part8【NVIDIA】
http://mevius.5ch.net/test/read.cgi/tech/1465969275/
587デフォルトの名無しさん (ワッチョイ ff82-CqbB [124.40.110.128])
垢版 |
2019/11/26(火) 19:32:56.95ID:xV5ChpD10
文章から画像を生成するGANがあるけど
例えば「机の上にリンゴが1個あります」という文章から画像が生成されたら

機械は人間のように、言葉の意味を理解したと言えるのでしょうか?
588デフォルトの名無しさん (ワッチョイ d610-b4Py [153.131.102.129])
垢版 |
2019/11/26(火) 19:36:56.31ID:cmZeJbzH0
>>587
机、りんご、上、1個、ある
とかの個別の概念と
それらの関係を人間が意図したのと同じように
解釈して図示できたら
通信ができたことになるのではないでしょうか?

通信が出来ることを理解すると解釈するなら
理解したことになりそうな気はします
589デフォルトの名無しさん (ワッチョイ d610-b4Py [153.131.102.129])
垢版 |
2019/11/26(火) 19:38:45.07ID:cmZeJbzH0
xmlとかでちゃんと書いてやればコンピュータでも解釈できると思う
画像からXMLなりを生成するのもできそうな気はするな
590デフォルトの名無しさん (ワッチョイ d610-b4Py [153.131.102.129])
垢版 |
2019/11/26(火) 19:41:33.35ID:cmZeJbzH0
センター試験か何かを解かせたとかニュースになってた気がするけどな
一応問題文を理解して答えを見つけられるようにはある程度なってるんじゃないの?
2019/11/26(火) 20:21:16.43ID:4LG/NuNj0
理解、ってなに?ってことだよな
2019/11/26(火) 22:54:22.47ID:qL3WJ7tta
まあ、人間も問題の意図している理解をしているとは限らないからな
2019/11/27(水) 09:01:28.12ID:dU+ct8c00
入試問題を解くのは条件反射、出題の意図を理解するのは無駄(笑)
594デフォルトの名無しさん (ワンミングク MM82-Gedh [153.235.108.33])
垢版 |
2019/11/27(水) 14:25:38.08ID:pvWhqXzvM
curriculum learningてどうよ?
効果を感じないんだが。。。
2019/11/27(水) 14:44:38.10ID:R3eAH8fN0
>>594
にんげんさまが指示してやらねばならん部分・・・
階段の刻み方(どういう方法で難しさを順位付けするか)
が悪いんでね?

あるいは
これもやっぱりにんげんさまが指示してやらねばならん部分・・・
レベル1の勇者にいきなりたまにはぐれメタルエンカウントさせちゃう的な、
試練の与え方が悪いか。
596デフォルトの名無しさん (ワンミングク MM82-Gedh [153.235.108.33])
垢版 |
2019/11/27(水) 14:50:18.75ID:pvWhqXzvM
nlpなんだけど
ミニバッチ作るときに自然にもうcurriculum learning的になっているのかな?
2019/11/28(木) 22:01:34.94ID:Y+wConzQ0
訓練データとテストデータの相関性がほとんどない問題とか
当てずっぽうで適当に振るところから始めて反応見て方向性定めているのか?
パワーと投稿数の勝負になっている気がしてならないけど
598デフォルトの名無しさん (アウアウウー Sa23-8b9h [106.161.209.107])
垢版 |
2019/11/28(木) 22:37:12.05ID:fUP9hRZYa
>>590
2019年大学入試センター試験英語筆記科目においてAIが185点を獲得 
https://www.ntt.co.jp/news2019/1911/191118a.html
599デフォルトの名無しさん (ワッチョイ 5fad-q7p1 [110.130.184.72])
垢版 |
2019/11/29(金) 00:17:47.54ID:lLJmxOHf0
Kaggleとかの機械学習コンペで主催者(依頼者)が持ってるマシンよりも参加者(優勝者)がコンペで使ったマシンのほうが性能良いってことあったりするの?
2019/11/29(金) 02:03:47.84ID:ZRMLeeOO0
主催者がもってるマシンってなんぞ
2019/11/29(金) 02:04:56.14ID:WPSMNOiN0
マシン持ってない可能性も高いだろう
602デフォルトの名無しさん (アウアウクー MM33-O/Gm [36.11.225.189])
垢版 |
2019/11/29(金) 09:49:10.05ID:gYWo3w4cM
Deep Learning散々騒いだ割には結局テーブルデータじゃGBDTにボロ負けな現状なんとかならんの
せいぜいGBDT様にお情けでensembleさせて頂く程度
603デフォルトの名無しさん (ワンミングク MMdf-LjR8 [153.235.108.33])
垢版 |
2019/11/29(金) 12:49:35.84ID:9onQejqxM
つ適材適所
2019/11/29(金) 16:11:35.42ID:WPSMNOiN0
>>602
テーブルデータの解析で話題になったわけじゃないぞ
2019/11/29(金) 19:08:43.15ID:rfU0XW80r
>>604
多分だけどニューラルネットワークは汎用性が高いだけで、画像系でももっと良いほうがあるけど見つかってないだけと思ってる
2019/11/29(金) 19:15:32.09ID:Ab9Y7Svv0
>>605
画像処理で高精度が出るDNNのモデルサイズを精度をあまり下げずに削減するような研究が出てきてるから、それを突き詰めると決定木的なルールが取り出せるのではないか
607デフォルトの名無しさん (ワンミングク MMdf-LjR8 [153.235.108.33])
垢版 |
2019/11/29(金) 19:18:55.66ID:9onQejqxM
えーまた同じ間違いを?
2019/11/29(金) 21:04:43.23ID:i2+wAL7T0
>>602
データテーブルでも回帰の滑らかさではnnが上だけどな。
2019/11/29(金) 23:37:12.91ID:ZRMLeeOO0
>>602
調律師次第ではNNもGBDTに精度で並ぶ
しかもNNとGBDTではGBDTの方がモデルの劣化が早い
2019/11/30(土) 09:04:53.45ID:DZbtLtp60
回帰がなめらかじゃないと困るって、たぶんあるとは思うけど具体的にどういうケースだろう
2019/11/30(土) 09:36:17.16ID:Uqy6J8Cl0
>調律師次第ではNNもGBDTに精度で並ぶ
んなわけねーだろ。。データが 2000,3000程度の場合、NNなんてまともに動かんわ。
612デフォルトの名無しさん (アウアウウー Sa23-29PW [106.154.127.208])
垢版 |
2019/11/30(土) 09:52:40.58ID:vuvC9RZIa
>>609
モデルの劣化って汎化能力が低いってこと?
2019/11/30(土) 10:17:22.90ID:g/CprbiQ0
overfitじゃない?
614デフォルトの名無しさん (アウアウウー Sa23-nO0S [106.154.136.36])
垢版 |
2019/11/30(土) 10:53:06.13ID:xqSKATFaa
>>611
それもNNの規模次第でゎ。。。
615デフォルトの名無しさん (アウアウウー Sa23-nO0S [106.154.136.36])
垢版 |
2019/11/30(土) 10:54:38.50ID:xqSKATFaa
>>609
劣化が早いってどゅこと?
モデルって腐るの。。。?
2019/11/30(土) 12:02:50.26ID:Uqy6J8Cl0
>>614
そんな小規模でNNチューニングしてまで使ううまみはないだろ?
ばかなの?
それとも本気で現場でそんな主張してんの?
2019/11/30(土) 12:09:04.69ID:A+rR0WU8a
はい
618デフォルトの名無しさん (アークセー Sx33-O/Gm [126.149.48.137])
垢版 |
2019/11/30(土) 12:58:50.37ID:YcFQTR8Rx
なんか悪かった
どう考えてもGBDTの方が精度出る案件でクライアントがでぃいぷらあにんぐ使いたいですってほざくから
むしゃくしゃしてやっただけなんだ

NGBoostは学習も推論も遅いし予測分布も分類じゃそんなに嬉しくないし結局LightGBM/CatBoostは超えられなさそうだよなぁ
2019/11/30(土) 13:03:41.07ID:OO2kPiiB0
>>618
> どう考えてもGBDTの方が精度出る案件でクライアントがでぃいぷらあにんぐ使いたいですってほざく
発注元の責任で このでぃーぷするとです って
明文化しとけよw
あとから責任おっかぶせられそうになると
ブチ切れちゃうぞw
2019/11/30(土) 13:57:35.50ID:kDVEf3m10
政策もビッグデータで決めるようになるらしい
2019/11/30(土) 13:59:00.59ID:OO2kPiiB0
>>620
テラ保守スwww
しっぱいするみらいしかみえないぞ・・・
2019/11/30(土) 15:42:08.94ID:NbIvukTW0
>>610
例えば学習データでは整数しかないけど、小数点の数値も予想したいときとか。
パラメータ変えた時に結果が同じだと説明の整合が取れないようなものにも使う。
2019/11/30(土) 16:47:02.28ID:n3PjdAM0a
数万程度のデータでNNは流石に無理だろう
過学習して終わるイメージ
2019/11/30(土) 17:12:57.03ID:369/mHN+0
パンピーには関係ない話だけど、
Kaggleで賞金狙えるレベルの人の中には、稀にNNでGBと大差ない精度を出す者もおるんだ
これはたびたびカーネルに出る話題だから間違いない
GBで特徴量を400程度使って出す精度と、ほぼ同等の精度を特徴量20~50程度で出すらしい
NNは前処理もパラメーター調整もシビアだけど、この少ない特徴量でモデルを組めれば、
実装後にデータの傾向が多少変わっても、GBDTよりは精度が落ちない
2019/11/30(土) 17:34:03.26ID:CwbTtXvfH
そんな怖いモデル使えないっす
2019/11/30(土) 17:54:56.02ID:U4j9IED8a
長期に渡って現場で使い続けられるかという観点ではパラメータをやたらと増やした力ずくモデルの方が信用ならない危険なモデルなんだけどな
627デフォルトの名無しさん (アークセー Sx33-O/Gm [126.149.48.137])
垢版 |
2019/11/30(土) 18:09:44.73ID:YcFQTR8Rx
実務上は精度追い求めるよりFeature Importanceが出せるかどうかの方が重要なんだよなぁ
2019/11/30(土) 18:32:57.53ID:HNwCuvLH0
NNでもGBでもいいけど、>>618のような客が使う道具まで指定してくるのがイタイ
これで失敗した場合の瑕疵担保責任はどっちにあるんだ?
2019/11/30(土) 18:40:26.81ID:Uqy6J8Cl0
>GBで特徴量を400程度使って出す精度と、ほぼ同等の精度を特徴量20~50程度で出すらしい
そりゃ20~50にうまく特徴量を絞れたらそうだろ。それが難しいんだっつーの。
それを半自動でやりたいってのがそもそもの機械学習の目的だろうに。
2019/11/30(土) 18:47:56.68ID:OO2kPiiB0
>>628
>瑕疵担保責任
契約書の文面の(偶然のなりゆきも含めた)ふいんきと
弁護士に幾らかけるか次第じゃね?
2019/11/30(土) 18:49:01.71ID:OO2kPiiB0
「渡り鳥の渡り行動の研究するよ!
モデル動物はニワトリ指定な!!」くらいの
明瞭な無茶苦茶さがあれば楽なんだがなw
632デフォルトの名無しさん (アークセー Sx33-O/Gm [126.149.48.137])
垢版 |
2019/11/30(土) 19:06:06.12ID:YcFQTR8Rx
大体4000件しかないデータで何すんだよ
Titanicじゃねーんだぞ
2019/11/30(土) 19:19:04.99ID:DZbtLtp60
>>622
台風の進路予想とか言うくらいのもっと具体的な例を期待していた
それだと滑らかな回帰ができないとホントに困るのかぴんと来ない
634デフォルトの名無しさん (スフッ Sd9f-DWOz [49.104.6.183])
垢版 |
2019/12/01(日) 09:32:45.02ID:loLKdL8Wd
このソニーのニューラルネットワーク関連の解説動画どうよ?
https://www.youtube.com/channel/UCRTV5p4JsXV3YTdYpTJECRA

良い動画だと思うんだけど、このスレの人たちの意見を聞きたいです。
2019/12/01(日) 09:34:39.98ID:YoP0MD/80
アノテーションツールとしてVoTTとlabelImgが紹介されているが
VoTTの方が楽かな
ただしtag名を入力してから、最後にエンターキーを押さないと
それが確定しない、という事を知っておかないと
いつまで経ってもtagすら作れないw

labelImgはpythonのpyqtから作るからワクワク感があるが、
自分の落として来たバージョンがミスっていたのか、プログラム内のimportファイルの書き方に
3ヶ所エラーがあって、自分で「こんな行き当たりばったりの治し方で良いのかなあ?」
と直したら、とりあえずユーザーフォームが開く所までは動いた
だがまだ肝心なアノテーションを試してないなあ
ボロボロだったりして
2019/12/04(水) 16:01:19.77ID:tCRQbFTxr
GPUのメモリがオーバーしてしまい
Jupyter閉じてプロセスID調べてtaskkillと

こんなの出来たんかwwwww
637デフォルトの名無しさん (ワンミングク MMdf-LjR8 [153.235.108.33])
垢版 |
2019/12/04(水) 16:29:35.31ID:9sxYmTh0M
knnをneural netでやるのって無意味?
638デフォルトの名無しさん (ワッチョイ 5f01-YC6P [126.94.220.36])
垢版 |
2019/12/04(水) 16:54:35.12ID:vhuKISsK0
コリアン・ニュース・ネットワーク。
2019/12/05(木) 20:26:03.41ID:NiCdCRl60
chainerやめちゃうのか
chainerXとかリソースメチャクチャ使ってたのに
やはりマーケティングの失敗だよなあ
非常に残念
2019/12/05(木) 20:36:15.87ID:NKJ9SQ6T0
マジかよChainerの勉強もそこそこ進めてた矢先に

まあPyTorchが類似部分が多いから何とか
2019/12/05(木) 20:52:35.88ID:NiCdCRl60
PyTorchに統一して欲しいね
TF2.0も今更感あるし
初心者向けのKerasとプロ用のPyTorchの2つでいいと思う
2019/12/05(木) 21:11:16.43ID:aecxiEdH0
粘着してたkerasの作者大勝利だな
2019/12/05(木) 21:55:53.24ID:JFK1j8cBr
chainet-rlの代わりは何がよいの?
cupyとoptunaは開発継続らしいよ
2019/12/06(金) 01:37:39.24ID:GLXpNeMl0
マーケティングじゃなくてマンパワーの差。
2019/12/06(金) 04:01:13.87ID:1/Pn3P+Y0
何といっても深層学習の数学的な枠組みが分かってないと
使いにくいのがChainerとPyTorch
だが細かくカスタマイズし易いのがChainer&PyTorch

kerasは「何かこのタイミングでこれっぽい事したら上手く動くんじゃね?」ぐらいの理解でも
何とか動いてくれる
でも細かなカスタマイズは出来ないからTensorflow丸ごと弄ることになって、
そうなるとChainer&PyTorchより更に上のレベルの数学的な理解と
そのプログラミング上の実装を知っておく必要が出来てしまう
2019/12/06(金) 07:42:41.87ID:GLXpNeMl0
まあ、良いのではないでしょうか
マイナーチャンジに力を注ぐより、より良きものを求めることが立場
2019/12/06(金) 07:43:08.75ID:GLXpNeMl0
できる立場
2019/12/07(土) 09:11:16.92ID:ARR8om9gM
tf2.0とpytorchってシェアほぼ互角じゃない?
どっちに統一されるかは知らん。自分の使ってる方がマイナーになったら
あきらメロン
2019/12/07(土) 09:44:14.90ID:iMRj3aHc0
メロンです、請求書です。
2019/12/07(土) 09:58:04.39ID:xi7Cj8Cta
ツールが使えるだけで機械学習や統計を理解した気になっている人は危険だと言うことだ
本当に理論から理解していれば多少記法が変わったところですぐ順応できるが、特定のフレームワークを使った単なる作業者だとそのフレームワークが下火になった時に移行するのにかなりの労力が必要
2019/12/07(土) 10:43:12.55ID:ARR8om9gM
はじパタ本とかゼロから作るで適当にベースを作っただけでも
複数のツールを使うぐらいならワケないけどな
でもそのレベルだとこれからは機械学習を専門職にはできない感じがする
2019/12/07(土) 12:39:37.05ID:ZsYnLuoj0
ハードウェアサポートが広い方を使いたいからtensorflowって感じになってる。
分散環境での学習とか、クライアント機でどれだけ動くのかがこれからの焦点なんじゃないかね。
コード内容自体はどっちも大して変わらん。バカは大騒ぎするけど。
2019/12/07(土) 15:48:15.19ID:adovJNi9M
ゼロから作るやっとくメリットで具体的になんですか?
2019/12/07(土) 15:58:51.31ID:kC4yD5gfF
自動微分を自分で実装すると手間だなというのが実感できる。
655デフォルトの名無しさん (ワッチョイ bd54-DV35 [180.235.0.69])
垢版 |
2019/12/07(土) 16:41:02.63ID:8POX1SPh0
あ、はい
2019/12/07(土) 16:52:12.95ID:ARR8om9gM
>>653 NN、畳み込みNNやLSTMのロジックを一から理解できる
逆にいえば、そこ完璧にわかってるならやる意味ないだろうなあ
2019/12/07(土) 17:00:30.01ID:xi7Cj8Cta
「ロジック知って何の意味あるの?知らなくても使えてるよ?」みたいなことを言う奴が出てきそう
2019/12/07(土) 17:06:56.43ID:ARR8om9gM
お前が使えるレベルならそうなんだろうとしか言いようがないな
2019/12/08(日) 08:50:34.91ID:pkvtzmnX0
つまり意味はない、ってことだな
660デフォルトの名無しさん (ワッチョイ 5a3d-MVf8 [219.104.75.160])
垢版 |
2019/12/08(日) 09:09:03.18ID:d61YKsOU0
>>659
好き
2019/12/08(日) 09:36:02.76ID:wx0c05j8a
ハイパーパラメータの自動調整をまともに使うには背景にある統計理論の知識がいるよ
662デフォルトの名無しさん (ワッチョイ 6190-MVf8 [42.126.56.69])
垢版 |
2019/12/08(日) 13:55:46.22ID:KMc7Z1Fn0
chainerは単純に人員が足りてなかったと思う
リリース版にバグがあるままリリースしてる
リリース版の更新が多すぎ
で離れて使わなくなった
663デフォルトの名無しさん (ワンミングク MM6a-DV35 [153.235.108.33])
垢版 |
2019/12/08(日) 15:40:26.42ID:dxbVA0b4M
いうてtfもバグなしじゃないだろ
2019/12/08(日) 16:05:40.36ID:HPGGb6iI0
>>661
あんまり関係ないがな。
hyperoptなりoptunaなりにつっこむだけだろ。
しかもそんな変なチューニングするくらいなら論文のままのもの使った方がいいっていうおまけつき。
665デフォルトの名無しさん (ワンミングク MM6a-DV35 [153.235.108.33])
垢版 |
2019/12/08(日) 16:11:39.81ID:dxbVA0b4M
automlで適当に調整してくれるしな
2019/12/08(日) 17:12:03.76ID:DDGzay+d0
>>662
いよいよ倒産が見えてきたのかな?
受託もしないし自社サービスも出さないし
それでやってられるとは思えん
とにかくユーザーが使えるサービスをリリースしないと
2019/12/08(日) 17:15:40.02ID:S4ZYhJQRa
ハイパーパラメータ調整ツール自体の調整能力まで把握した上で使うならいいが
理論も分からない、ツールがどうやって調整したのかも分からないだと困るな
「どうしてこのハイパーパラメータが最適なのか?」の質問に対して「ツールがそう算出したから」「論文に書いていたから」を回答にせず説明できるなら問題ないとは思う
2019/12/08(日) 17:26:18.38ID:d61YKsOU0
>>667
それは生産性も価値もない話だと思う
理論について勉強することは必要だけど、重箱に隅のような知識を大切にするよりは
機械学習の外に目を向けた方がいい
2019/12/08(日) 17:31:13.86ID:4TAWhQS40
>>666
嫉妬じゃん
670デフォルトの名無しさん (ワッチョイ 6190-MVf8 [42.126.56.69])
垢版 |
2019/12/08(日) 19:49:05.17ID:KMc7Z1Fn0
pfnってなんか仕事はしてるだろ
トヨタとの共同研究ってまだ続いてるんじゃないの
2019/12/08(日) 20:50:44.18ID:7TPIEo2i0
オコボレ狙いの企業が未だに群がってるから、財源の心配は無いだろう

人材に恵まれていないのか成果がパっとしないけど、
それでも日本のSI企業に頼るよりPFNに投資した方が賢い
672デフォルトの名無しさん (ワッチョイ f610-DJoW [153.131.102.129])
垢版 |
2019/12/08(日) 20:59:04.48ID:wWaHJEbO0
>>667
試した中で一番いい結果だから
じゃダメなんですか?
2019/12/08(日) 21:32:17.42ID:HPGGb6iI0
PFNみてるとgoogleが広告やらなかったらこんな風にじり貧になってたんだろうなってのが想像できる。
674デフォルトの名無しさん (ワッチョイ 6190-MVf8 [42.126.56.69])
垢版 |
2019/12/08(日) 22:44:35.51ID:KMc7Z1Fn0
googleは元々広告で食ってるだろ
2019/12/08(日) 23:18:41.13ID:DDGzay+d0
>>669
嫉妬というかこれだけの技術力あるのになにをしてるんだ?という気持ち
結局第三者から見たchainer以外のアウトプットはないわけだし
それを切るってもう何も残らん
676デフォルトの名無しさん (ワッチョイ 6190-MVf8 [42.126.56.69])
垢版 |
2019/12/08(日) 23:30:34.77ID:KMc7Z1Fn0
いちいち公開してないだけで色々案件はやってるだろ
2019/12/09(月) 00:20:35.28ID:NiFr8TmZ0
>>675
技術力って何?具体的に何のこと?
2019/12/09(月) 01:54:46.39ID:PMVVzMoi0
第三者ってどの程度のこと言ってるか分からんけどCuPyとかoptuna使ってる人そこそこいるだろ
2019/12/09(月) 13:00:46.54ID:cQNHGZkd0
機械学習で日本の人名を生成したい
どうすればできる?

当方しがないエンジニアでpythonはできるが、
機械学習周辺のキーワードがわからなくて調べられずに困っている
GANとかいうのは画像用だから使えないんだよな?程度の知識
680デフォルトの名無しさん (アウウィフ FF79-MVf8 [106.171.79.171])
垢版 |
2019/12/09(月) 13:09:35.22ID:RLwtKsqpF
日本の人名は戸籍に使える文字が決まってるから
そこから選べ
2019/12/09(月) 13:14:56.65ID:cQNHGZkd0
>>680
ありがとう
ただこれの用途はキャラクターの命名なので、
現実に使える文字かどうかはあまり重要じゃない
むしろ実際にはありえなさそうな方が良い
2019/12/09(月) 13:55:54.49ID:scocuTx70
>>681
保険会社かなんかが姓名ランキングしてるから
まずは使える文字からランダムして
よくある苗字や名前になってたら再抽選
2019/12/09(月) 15:05:03.48ID:xDp47k0Pa
ディープなことするよりマルコフ連鎖とかでやった方が良さそうだけどな
684デフォルトの名無しさん (アウウィフ FF79-MVf8 [106.171.79.171])
垢版 |
2019/12/09(月) 15:14:40.70ID:RLwtKsqpF
条件後出しは失格
685デフォルトの名無しさん (ワッチョイ bd54-8zr5 [180.235.0.69])
垢版 |
2019/12/09(月) 16:25:34.13ID:HdYgf83V0
ああ、同人誌みたいなライトノベルみたいなどうしようもないやつに使いたいのね
乱数でいいんじゃね?
2019/12/09(月) 19:24:47.20ID:QTsW6dvXa
ランダムな個人情報を生成するプログラムなら既にあるが
テストとかに使うらしい
2019/12/09(月) 21:39:53.12ID:w/kMOH0C0
人名ジェネレーターで良くない?
辞書リストと乱数で成り立っていてAI不要な
688デフォルトの名無しさん (ワッチョイ 5aad-CqlS [27.139.41.170])
垢版 |
2019/12/10(火) 04:20:23.19ID:0gRjlhkw0
デスノートのいじめが発生しないようにって配慮スゲーって思ったな
689デフォルトの名無しさん (アウウィフ FF79-MVf8 [106.171.67.227])
垢版 |
2019/12/10(火) 14:05:49.73ID:48kVELqAF
阿部進次郎
2019/12/11(水) 19:37:08.57ID:LCchQiSlD
ご質問なのですが、機械学習の回帰問題において、教師信号が特定の範囲内にある時の重みを重くするような損失関数はありますでしょうか?

私が解きたい問題においては、教師信号の値が0~1の間の値を取るように基準化しているのですが、
例えば、RMSEを下記のようにカスタマイズした損失関数を使用したいのです。

False Positive:学習器の出力は0〜0.2の範囲だが、教師信号は0.2より大きい or
学習器の出力は0.8〜1の範囲だが、教師信号は0.8未満

False Negative:教師信号の出力は0〜0.2の範囲だが、学習器の出力は0.2より大きい or
教師信号は0.8〜1の範囲だが、学習器の出力は0.8未満  

とTrue negativeとFalse Negativeの場合にのみ損失関数を計算するか、重みを大きくした損失関数を使いたいのです。

もしご存じでしたら、この損失関数を使用可能な学習器やライブラリなどを教えていただけますでしょうか。
ライブラリなどが無くても最悪論文などがあればそれでもかまいません。何卒ご教示をお願いいたします。
691デフォルトの名無しさん (ワッチョイ bd54-8zr5 [180.235.0.69])
垢版 |
2019/12/11(水) 21:41:26.98ID:DwgG6llj0
わかんない
2019/12/11(水) 21:52:30.04ID:10/84Yqu0
知らない
2019/12/11(水) 22:27:12.29ID:ARdMYJJF0
andで繋げたら?
2019/12/11(水) 22:52:42.17ID:KfdgnhFCa
損失関数自分で定義すればいいじゃん
2019/12/12(木) 00:35:12.72ID:XDEaLtEed
>>690
まず教師信号とはなに?ベクトル?時系列?
>教師信号が特定の範囲内にあるとき…
ヘビサイト関数(ステップ関数)の重ね合わせで表現可能

>RMSE
二乗平均?(RMS)
よくわからん。一般的でない。

>false positive, false negative…
応答だけ書かれてもわからん。±で4パターンあるだけ?
2019/12/12(木) 06:56:14.26ID:HzXPCxE7r
>>690
fpに分類をよせたいということであれば重み付けカッパ係数で評価する方法はある。
ttps://qiita.com/tand826/items/4d1fb2045f2b48d21b7d

求めているものと全くちがうかも
697デフォルトの名無しさん (ワッチョイ 5b54-OFkf [180.235.0.69])
垢版 |
2019/12/12(木) 07:02:30.85ID:x0loQ0xU0
理解してない人が繰り出す小手先の改善ほど効果のないものはない
2019/12/12(木) 07:37:25.30ID:xvtH/KsFd
>>695
RMSEは一般的だけど。。

>>690
やり方は主に2通りある
一つはサンプルをいじる方法、もう一つは関数をいじる方法だけどもっと詳しく聞きたい?
2019/12/12(木) 08:02:27.31ID:mOtpkcnLa
うんこレベルに無知なくせに回答しようとするゴミって
どういうメンタルなんだろうなw
機械学習は分かるけどウンコの考えは謎だわ
2019/12/12(木) 09:22:48.99ID:rtEMPQR+d
文句いうだけのうんこよりマシって程度
2019/12/12(木) 12:56:19.08ID:qy4ltjlBD
皆さん、お忙しい中返信をありがとうございます。

>>698
知りたいです。是非教えてください。
>一つはサンプルをいじる方法、もう一つは関数をいじる方法だけどもっと詳しく聞きたい?
2019/12/12(木) 17:43:51.02ID:xvtH/KsFd
>>701
サンプルをいじる方は2パターンあって、重みを付けたい範囲のデータを水増しして増やすか、逆に重みを付けたくない方のデータを間引くかのどちらかを行う

関数をいじる方は、使ってるライブラリのオプションにweightみたいなのがたぶんあるはず。無ければ自分で実装しかないんじゃないかな
2019/12/12(木) 21:49:18.95ID:x0loQ0xU0
違う話になってない?
2019/12/12(木) 22:07:40.49ID:SSYYfvrk0
損失関数を変えるってより真の目的は特定のデータ範囲だけ重み付けしたいということだと解釈したけど、違ってたらすまん
2019/12/12(木) 23:49:42.64ID:2XjPPOkCd
>>702はあほか
ただステップ関数だけやん
2019/12/12(木) 23:50:24.59ID:2XjPPOkCd
訂正
>>702はあほか
ただステップ関数かけるだけやん
2019/12/12(木) 23:52:33.17ID:2XjPPOkCd
>>702はうんこにも負けるお馬鹿さん
2019/12/12(木) 23:58:44.94ID:2XjPPOkCd
>>702の方法を詳しく聞きたいです。
どのレベルのものが出てくるのかな?
2019/12/13(金) 00:03:20.51ID:YzIzcvdhd
>>698
>やり方は主に2通りある
一つはサンプルをいじる方法、もう一つは関数をいじる方法だけどもっと詳しく聞きたい?

聞きたいです。
どのくらい短いコードになりますか?
2019/12/13(金) 00:07:11.37ID:ztjeN6RTD
>>702
ありがとうございます。私が阿保でした…。色々と難しいことを考えていましたが、普通に分類問題における不均衡データの扱いと同じように考えれば良いのですね…。
2019/12/13(金) 00:10:21.56ID:XxZjyVfOd
>>698いわく方法は2つあるらしいけど、僕ちん一番始めに思い付かなかったな。長過ぎて。
2019/12/13(金) 00:21:47.33ID:XxZjyVfOd
>>698のどや顔のわりに出題者の意図を組んだ回答になってなくて笑うわ
2019/12/13(金) 00:28:36.82ID:XxZjyVfOd
>>699>>695の始め四行を理解できましたか?

おそらく意図に沿った最適解ですよ?
2019/12/13(金) 00:52:32.77ID:XxZjyVfOd
ところでさ、>>690>>695の最後の一行だけで解決できたって認識はある?
2019/12/13(金) 08:26:43.93ID:4f9XcAird
>>710
ID変わっちゃってるけど

>>698は俺で、>>702で回答したつもり
そうそう不均衡データ知ってるなら話は早い。それと同じに考えればいいんじゃないかな
2019/12/13(金) 08:47:13.93ID:zOMzCfb1a
オライリーのPythonによるデータ分析とデータサイエンスハンドブックってどっちがおすすめですかね?
717デフォルトの名無しさん (アウウィフ FFc7-EbeN [106.171.69.81])
垢版 |
2019/12/13(金) 11:10:40.03ID:V90d9jYdF
前者
2019/12/15(日) 11:25:39.35ID:NsMHdX+Qd
オライリー本の機械学習本大杉
俺にも初心者向けのお勧め教えてほすぃ
趣味でやる程度で、プログラムは問題なくて数学はソコソコ程度でやんす
719デフォルトの名無しさん (ワッチョイ 5b54-OFkf [180.235.0.69])
垢版 |
2019/12/15(日) 11:27:48.03ID:qAhsyicK0
どうせ無理
2019/12/15(日) 16:36:37.82ID:IJ9lyMvCr
夢見る機械学習
夢見る深層学習

あたり
721デフォルトの名無しさん (ワントンキン MM86-OFkf [123.216.161.18])
垢版 |
2019/12/17(火) 17:57:23.97ID:IOLSzPnMM
neuripsは、にゅうりっぷす、でいいの?
2019/12/17(火) 21:22:33.32ID:TP04XND70
夢見るって何だよw
2019/12/18(水) 08:37:06.46ID:AGv/bbi+0
アンドロイドは電気羊の夢を見るか? フィリップKディック
2019/12/19(木) 16:18:27.57ID:687/ZJ6rM
>>723
この板では常識みたいな本のタイトルだよな
725デフォルトの名無しさん (ワントンキン MMab-BqQa [123.216.161.18])
垢版 |
2019/12/19(木) 19:13:19.10ID:7bTJNhmPM
攻殻機動隊は?
2019/12/19(木) 20:08:23.64ID:Gv7/QyPZ0
>>725
アニメという時点でダメですね、紙の本を読みなよ
727デフォルトの名無しさん (ワッチョイ 2154-BqQa [180.235.0.69])
垢版 |
2019/12/19(木) 20:36:41.48ID:2pi3DA5F0
コミックです。。。
2019/12/22(日) 12:35:04.23ID:Ens8Pa2w0
pythonの入門書を終えてtensorFlowとかkerasとか学びたいんだけど、
よい入門書教えろください。 orz
2019/12/22(日) 13:30:25.72ID:AF24n/5l0
>>728
いきなり深層学習フレームワーク触るより深層学習の基礎勉強しなさいよ
つ ゼロから始める〜
2019/12/22(日) 13:47:20.09ID:QqTXpvNUM
せんせー、pythonの文法知ってるだけの人がいきなりゼロからはじめるやって分かるんですかー
2019/12/22(日) 13:50:53.01ID:AF24n/5l0
tensorflow触ったって理屈何も分からんでしょ
2019/12/22(日) 14:19:38.73ID:sLfMPx200
tensorflowに触ってごらん、AIだよ
2019/12/22(日) 14:24:41.20ID:Ens8Pa2w0
>>729
説明不足でした。
ニューラルネットで修士号とってますが、
全然関係ない分野で働いてたので、
プログラムのリハビリ状態。

統計学と昔の機械学習は理解しているので、
新しいトピックと実際の動かし方を学びたい。
2019/12/22(日) 14:32:55.35ID:fEmGBg4L0
統計学は応用数学だが
機械学習に数学はいらない
2019/12/22(日) 14:38:25.43ID:D2xqHNpK0
>>734がイイ(・∀・)こといった!
2019/12/22(日) 14:54:20.51ID:jKm3tCWya
何をどう調べてどこまで身につければ十分なのかを自力で把握できなければダメ
何も知らない中学生・高校生ならまだしも、大学出た社会人が「何から学べばいいか?」とか聞くこと自体がアウト
2019/12/22(日) 15:02:08.75ID:Ens8Pa2w0
いや、Tensorflowの全体像を知るための定番の入門書を知りたかっただけなんですが・・・。
2019/12/22(日) 15:13:24.42ID:MAO/zmGQ0
>>733
「scikit-learnとTensorflowによる実践機械学習」などどう?
2019/12/22(日) 15:40:47.34ID:tyzf2bxBa
>>737
TensorFlow2.0やりたいなら本はほとんどない
これから2.0しか使わなくなるから今ある1.0の本を読むべきかと言うと微妙
2019/12/22(日) 15:55:54.03ID:Ens8Pa2w0
>>738
ありがとうございます。チェックしてみます。
2019/12/22(日) 15:58:04.45ID:Ens8Pa2w0
>>739
なるほど。
現在2.0を学ぶんなら洋書ということになるのでしょうか?
ひょっとして、洋書もまだ出てなくて、ネットで情報を漁るしかないのかな・・・。
2019/12/22(日) 16:15:13.33ID:kqUBoQ4ga
pytorch開発入門が良い
2019/12/22(日) 16:35:38.25ID:Ens8Pa2w0
>>742
pytorchなんてものもあるんですね・・・。

Scikit-learn
Tensorflow
dlib
PyTorch

どれから手をつけるのがいいんでしょう?
2019/12/22(日) 16:36:54.74ID:Ens8Pa2w0
修士のときはアルゴリズム系の研究をしていて、
あの頃は、みんな一からC言語でコード書いていたから、
完全に浦島太郎状態だなぁ。
2019/12/22(日) 18:28:11.78ID:AF24n/5l0
>>743
sklearnでいいんじゃない?
仕事内容にもよるけど
2019/12/22(日) 18:45:14.82ID:Ens8Pa2w0
>>745
入門書ではsklearn使ってましたね。
とりあえず直近の回帰分析とかレベルだとこれで十分なんですよね。

ただ、流行りのDeepLeariningとかも学んでみたいという欲が出ているのが抑えがたい。
2019/12/22(日) 21:16:41.90ID:tA8JsD2t0
使い物にならない頭の固い浦島太郎
2019/12/22(日) 22:11:05.54ID:Ens8Pa2w0
ライブラリ比較サイトで勉強してきました。
直近のしごとはsklearnで事足りそうだし、
Deep Learningとかの勉強はPytorch使ってみようかと思います。
Tensorflow+Kerasも気になるけど、Tensorflow2.0の情報が出てから勉強したほうが、
効率良さそうな気がしてきました。
2019/12/23(月) 00:31:24.07ID:Aom+GboU0
>>741
洋書もほとんどないと思うよ
公式のドキュメント読み込むのが良いと思う
750デフォルトの名無しさん (ワッチョイ 1302-4eo+ [27.81.114.231])
垢版 |
2019/12/23(月) 01:08:38.23ID:VfWxGDyD0
修士持ってて5ちゃんで入門書の情報収集かよ
てかネタだよな?
751デフォルトの名無しさん (ワッチョイ 2154-SJkM [180.235.0.69])
垢版 |
2019/12/23(月) 07:02:49.05ID:C376Wcca0
neural machine translationを試してるけど
ユーザー辞書を指定する方法が分からない

誰か教えて
752デフォルトの名無しさん (ワッチョイ c101-Rp4x [126.243.47.200])
垢版 |
2019/12/23(月) 07:57:44.83ID:OGRagDqQ0
print('Hello World')
2019/12/25(水) 20:19:54.82ID:1fTZ/ZaM0
>>748
普通にtensorflowやっとけ。
どうせ2.0でても1. 系統との違いみたいな説明しかされんから。
2019/12/25(水) 20:56:16.29ID:aaAP7ysf0
やるならkerasがいいよ
モデル構築部分はほぼkerasと同じ感じに書けるようになった
1.0の計算グラフはユーザーから意識することはなくなったし
それを覚えても意味はないと思う
755デフォルトの名無しさん (ワッチョイ 4f54-ieRt [180.235.0.69])
垢版 |
2019/12/29(日) 10:57:12.10ID:qpN3wIzL0
NICTはなぜオープンソースで公開しないんだろう

MSやGoogleやFacebookはGitHubにアカウントを持っていて
研究成果を公開しているのに

NICTもそれらのオープンソースを利用しているくせに公開しない
756デフォルトの名無しさん (ワッチョイ df10-YTym [153.131.102.129])
垢版 |
2019/12/29(日) 11:57:05.52ID:qLN9wlkm0
企業は収益を得る手段がほかにあるけど
研究機関は違うのも関係あるように思う
2019/12/29(日) 12:16:45.48ID:ji21HRv6M
NASAもジャンル違うけど公開してるし、税金投入してるなら国民に見せた方がいいはずだけど
日本の研究機関は遅れてるんかね
情報漏洩と公開範囲を定義して運用出来る頭脳はよ
2019/12/29(日) 13:53:29.86ID:TN/x0Ru2a
現代のIT企業は研究成果をオープンにすることで世界中からフィードバックを貰うことで超速で進化しているんだけど
日本の古典的大企業や研究機関は研究成果を隠すことで他と差別化できると思い込んでいる
GAFA躍進前の時代なら日本式もそれなりに良い方針だったかもしれないが
今の時代ならその隠した研究成果と同等かそれ以上のものがその内GAFAから生まれるだろうから無意味
研究機関がGAFAのようにオープンにした成果を利用した金儲けができないことが問題なのであれば
金儲けできるように日本のローカルルールを変更すればいいだけ
2019/12/29(日) 15:38:02.27ID:Dx5kC0NRM
研究機関はどうかは知らないけど少なくとも世界的に大学は公開してるしな
2019/12/29(日) 15:42:26.10ID:ji21HRv6M
横並びで公開しない暗黙のルールか忖度ありそうね
東大やら普通にイントラにgitlabサーバ建てたりしてた記憶
あの先生より上層部の意識がどうかやねえ
2019/12/29(日) 20:25:01.95ID:by75XqYfM
研究スピードがどうしても海外より劣るから、モノを公開しちゃうと置いてかれるんだよ。
日本の研究機関の風土の問題じゃなくて、研究以外もこなさなきゃいけない人達が合間を縫って研究するしかない
日本の科学技術に対する制度設計の問題。
2019/12/29(日) 20:42:28.27ID:BQX6608C0
国立の研究所が情報隠すのって
NHKが受信料で作った番組を子会社でDVDで商売してるようなもんだね
2019/12/29(日) 21:52:42.26ID:rpIpsCsdM
論文優先で手が廻らないってとこか
ソース公開も楽じゃないすな
2019/12/29(日) 23:28:34.15ID:XnQ2dClWa
論文で十分に公開していると思うが
ソースも欲しいのか
テクニカルレポートが欲しいのか?
765デフォルトの名無しさん (ワッチョイ 4f54-2tmj [180.235.0.69])
垢版 |
2019/12/29(日) 23:56:49.13ID:qpN3wIzL0
実装公開するのが世界標準
2019/12/30(月) 00:20:35.01ID:KJuDSflP0
Pythonライブラリの公開とかね
日本も大学はしてるとこあるし
767デフォルトの名無しさん (ワイーワ2 FFdf-v1fK [103.5.142.234])
垢版 |
2019/12/30(月) 12:19:39.72ID:WAqdspciF
>>762
国民の財産で私服を肥やすNHKはもっと悪質
2019/12/30(月) 12:43:25.39ID:cr0/Lsx50
公開出来るレベルのソース書けてるか、ライブラリ設計する能力があるか、も問題になりそうだけど、その辺も磨くと、ワイのような暇してる野良開発者もOSSなら協力出来るという特典はあるね
正直、研究系のITの仕事はパートタイムの30年前のサーバ管理みたいなのが多くて手伝えん
769デフォルトの名無しさん (ワイーワ2 FFdf-v1fK [103.5.142.234])
垢版 |
2019/12/30(月) 13:41:37.17ID:WAqdspciF
>>768
ほんそれ
https://megalodon.jp/2019-1225-1001-08/https://qiita.com:443/unico/items/76499d1e20042d929aa1
2019/12/30(月) 15:40:35.39ID:H7m/k27K0
研究者なら本来ソースが見やすいかとか関係ないからなあ
大事なのは数式の理論だし
日本人はごちゃごちゃどうでもいいことでなんくせつけるし
771デフォルトの名無しさん (ワッチョイ 77dd-2tmj [122.249.73.11])
垢版 |
2019/12/30(月) 15:54:00.51ID:iq/klXJD0
古い日本人の陰湿さだよな結局
2019/12/30(月) 16:12:34.46ID:EbY28/9f0
もう日本は終わりだよ
どうしようもない
773デフォルトの名無しさん (ワッチョイ 77dd-2tmj [122.249.73.11])
垢版 |
2019/12/30(月) 16:21:10.72ID:iq/klXJD0
産総研、JST、NICT、理研あたりは実装公開しろ
774デフォルトの名無しさん (オッペケ Sr1f-6GiO [126.255.57.149])
垢版 |
2019/12/30(月) 17:47:06.43ID:hVGBluVVr
>>770
んなこたーない
スパゲッティなコード書かれたら検証も追実験もやりにくくなる
機械学習の論文の再現性がないのは大きな問題になっている
2019/12/30(月) 17:47:44.68ID:8pRHoXtUa
研究報告の本質は再現性の有無を確認してもらうことだ
機械学習分野で言えば都合のいい学習データ、テストデータを使っていて実用上そんな状況あり得ないとか、ハイパーパラメータどう決めたのかとか疑おうと思えばいくらでも疑える点は出てくる
それを払拭する唯一の方法は実際に書いたソースそのものを出すこと
そのソースは最早論文の一部なのだから書いた人にしか分からない滅茶苦茶なものを公開して「公開したのだからこれでいいだろ」などというのはあり得ない
776デフォルトの名無しさん (ワッチョイ df10-YTym [153.131.102.129])
垢版 |
2019/12/30(月) 17:58:08.77ID:U5SCa4jH0
>>775
ソースコード出しても他のデータでの
汎化誤差が小さいかどうか判らなくね?
2019/12/30(月) 18:04:19.52ID:cr0/Lsx50
STAP細胞はありまーす
2019/12/30(月) 19:15:55.84ID:tmdGEa4Zd
stap細胞はありました。
2019/12/30(月) 22:05:07.58ID:lxiCJ2Yf0
企業もIT云々と言われた時代から金を掛けないし人を育てようともして無かったんで伸びないだろ
AIについてソフトバンクの孫が日本は遅れていると吠えてたけどまともな人材すら流れて来てないんじゃないか
企業にとっては若者をいかに騙して利益を吸い取るかっていう分野だろう
日本ではIT土方より土方の方が将来性ある
780デフォルトの名無しさん (ワッチョイ ef1d-uaPE [143.189.31.12])
垢版 |
2019/12/30(月) 23:34:55.91ID:HsGQHO6z0
stanとかPyMCって明らかに統計解析向きでシステムに組み込みづらいけど、
明らかにNNよりベイズの枠組みで変数間の関係を記述する方が優れているので、数学弱者でも自力でアルゴリズムを導出する事なく、kerasみたいにシステムに組み込めるようになる日は来るんだろうか。
2019/12/31(火) 03:09:29.79ID:nxNHwLJH0
研究者のコードは糞で見てられない。
R&D何年かやってたけど、もう関わりたくないなぁ
2019/12/31(火) 04:10:23.19ID:RM1+Cid30
人に読ませることは重要ではない。
読めない奴は置いていけばよい
確固たる結果が付属する理屈があること。それさえあれば自然と読む人が必ずいる。
2019/12/31(火) 05:43:20.17ID:nxNHwLJH0
情報系の研究はソースコード公開してても読むやつほぼいないよ
バグとかそのまんまで放置されてる
動くかどうかすら怪しいから研究の副産物触るのは嫌い
2019/12/31(火) 08:04:33.96ID:NUJAOpc70
動かなかったら研究を追試できないと文句を言えばいいし
ぐちゃぐちゃコードで動けば追試できるしリファクタリングもできる
785デフォルトの名無しさん (オッペケ Sr1f-6GiO [126.255.57.149])
垢版 |
2019/12/31(火) 09:51:08.49ID:rB5IKPkdr
>>782
そして誰もいなくなった
786デフォルトの名無しさん (オッペケ Sr1f-6GiO [126.255.57.149])
垢版 |
2019/12/31(火) 09:52:45.34ID:rB5IKPkdr
>>783

> 情報系の研究はソースコード公開してても読むやつほぼいないよ

どうやって調べたの
2019/12/31(火) 11:11:19.86ID:9r6RBOcwM
たしかに酷いコード見るなあ
1関数1ファイルで何百行もあってif
文が大半のとか
リファクタリングしてあげたいけど、作者が読めなくなりそうで躊躇
2019/12/31(火) 12:51:42.15ID:cUwK5JbL0
ソフトバンクの損って節税(脱税)と投資失敗で話題の人か
2019/12/31(火) 13:10:46.49ID:K5ePzvxLa
>>782
その真逆でとことん人に読んでもらう・理解してもらう環境を整えることを追求した結果が今の世界的IT企業の躍進に繋がっているんだけど
2019/12/31(火) 13:20:30.79ID:RM1+Cid30
読む奴は存在すると言ってるだけ。
有益ならばちゃんと拾う
791デフォルトの名無しさん (ワッチョイ 4f54-2tmj [180.235.0.69])
垢版 |
2019/12/31(火) 13:56:00.88ID:NUJAOpc70
日本の論文だけなんだよ実装がないのって
海外のは下の脚注にgithubで公開してるぜとある
2019/12/31(火) 15:39:29.45ID:K5ePzvxLa
機械学習分野なんて玉石混交の論文が日々大量に出回っているのに読みやすさを無視して「有益なら読む人はいるだろ」
という態度で書いたものを読んでもらえるのなんて既に実績上げているごく一部の人だけなんだよな
2019/12/31(火) 21:47:08.95ID:+hXuYToDd
くっだらないね
だから読むっての
2019/12/31(火) 23:51:33.77ID:a+xjNkxx0
>>782
人が読めないのは100歩譲っても自分でも読めないとか言い出す馬鹿が多いからな。
それ根本的にソースが糞ってことだから。
2020/01/01(水) 00:51:57.38ID:EAfwe2HZM
論文読まないけどソース読むよ
2020/01/01(水) 03:50:18.57ID:Bw/I0Y2Fa
ソース公開しないのは発展性がない論文だからだよ
要は書き逃げ。そこから次々に論文が出てくるようなら
否応ざるにコードもちゃんと書かなければいけなくなる
それをしないということはその論文はゴミ、あるいは捏造
2020/01/01(水) 08:35:14.27ID:2Yvb+gk50
その判断は読者がするので
とにかく公開すればいい
798デフォルトの名無しさん (ワッチョイ 6b54-hZl1 [180.235.0.69])
垢版 |
2020/01/01(水) 11:06:21.99ID:2Yvb+gk50
ハーバード大のテキストは公開されてる
https://drive.google.com/file/d/1VmkAAGOYCTORq1wxSQqy255qLJjTNvBI/view
2020/01/01(水) 12:49:32.22ID:Bw/I0Y2Fa
まず、ソース公開は、業績にならないからな
次に、公開しない論文は自らゴミと認めていることでもある
どうせ使う人はいないだろうという意味合いもある
2020/01/01(水) 13:02:33.72ID:R7AcXQfB0
ソースより醤油
2020/01/01(水) 15:35:59.56ID:R/r7VkS4M
論文書いてる人はソース公開されないと実行できないとかいうレベルの人向けに書いてるわけじゃないんだぞ
2020/01/01(水) 15:44:55.51ID:EAfwe2HZM
追試しやすくなるから、やましいことがないならソースも公開した方がモテると思うよ
2020/01/01(水) 16:00:02.58ID:/oDzwe5Aa
>>801
論文に書かれた内容だけで論文に示された結果を完全再現できるような論文なんてほぼ存在しないことを知らないのか
それをソースで示して完全再現できるようにしない限り捏造の誹りから逃れることはできない
2020/01/01(水) 16:09:55.17ID:EAfwe2HZM
せやせや
2020/01/01(水) 16:22:41.75ID:kPvcajv80
1行目と2行目の繋がりがよくわからない。
世の中のほとんどの論文は捏造が疑われているということ?
806デフォルトの名無しさん (ワッチョイ 6b05-g2RO [116.94.174.100])
垢版 |
2020/01/01(水) 16:47:20.30ID:YftyIXIv0
>>803
お前はバカなんだから黙ってろ
2020/01/01(水) 17:02:22.17ID:AV+0j7FA0
>>805
捏造とは言わんが、特定のデータにチューンして宝くじ効果で上手くいったよね
みたいな論文ばっかだと思われる。
MNIST、CIFER10でしか実験してない論文とかな。
2020/01/01(水) 17:17:44.38ID:Q+lm5ndma
>>805
公開情報のみから判断した人に捏造と疑われても仕方がないということ
>>801は「ソース公開されないと実行できないとかいうレベルの人向けに書いてるわけじゃない」と言っているが論文をいくら読み込んでも必要な全情報が含まれないことなどザラにあるのだから実行して確認したくてもできないことが多い
だったら最初からソース丸ごと公開しろよ、ということ
その方が無駄な疑いに基づく手探りの検証過程などすっ飛ばして早く自分の成果を認めてもらえるのだから
2020/01/01(水) 17:26:30.85ID:kPvcajv80
結果が疑わしかったり論拠があやふやな論文はさすがに査読で落とされていると信じたいが。
大半がそんな状態だというのが共通認識だとしたらいまごろもっと問題視されてないか?
2020/01/01(水) 17:50:51.23ID:Bw/I0Y2Fa
水面下では問題視されている
結果が良すぎたり、特定の国の人が書いた論文は
信用されない
2020/01/01(水) 18:22:02.12ID:AV+0j7FA0
>>809
だから普通に問題視されてるだろ。
http://blog.livedoor.jp/tak_tak0/archives/52421590.html
812デフォルトの名無しさん (ワッチョイ 6b54-BJMr [180.235.0.69])
垢版 |
2020/01/01(水) 19:32:55.99ID:2Yvb+gk50
だから日本は遅れてる
何とかしろよ
2020/01/01(水) 19:46:28.03ID:kPvcajv80
それが共通認識になっていたとしたらもっと大問題にされているだろうと言っている。
2020/01/01(水) 19:52:14.44ID:AV+0j7FA0
連日報道でもされん限り問題になってないとか思っちゃうバカ?
何をもって問題になってるなってないというかによるとしか言いようがない。
使ってなけりゃ社会的な問題にはならんだろうし。
少なくとも「まるっきり信じてやったら上手くいきませんでしたー俺は悪くありません」
とか言い出す奴は、自分の職場では大問題だわ。
2020/01/01(水) 20:34:27.25ID:kPvcajv80
「論文に書いてあることなんて信用できないからその通りにできなくても俺の責任じゃありません」
と言ってるのかと思ったが。
2020/01/01(水) 20:50:13.15ID:W/LYnAl/0
>>809
> 結果が疑わしかったり論拠があやふやな論文はさすがに査読で落とされていると信じたい
希望論でつねわかります

>>815
実験系だと
論文の結果そのものは
往々にしてミラクルなオリンピックレコード的な伺か
って暗黙の了解なんだけどぬ・・・
2020/01/01(水) 21:00:46.16ID:AV+0j7FA0
もう馬鹿は「再現性なんてなくても問題ない」と思ってりゃいいよ。
お前の中ではそれでも問題ないんだろう。
2020/01/01(水) 23:03:53.85ID:VTgMf2Yt0
実装が公開されてるけど、実行しても論文通りの結果が出ないとか普通にあるしなぁ
ソースが公開されてても査読者は暇じゃない限り実行せんしな
2020/01/01(水) 23:48:05.60ID:1biaYKqja
さらにデータを開示してもらわなければならない
「このデータ・セットではうまくいった」
実はそのデータ・セット以外ではうまくいない
じゃあダメじゃん
よくある話だ
820デフォルトの名無しさん (ワッチョイ 6b54-hZl1 [180.235.0.69])
垢版 |
2020/01/02(木) 07:41:44.81ID:abNQ9/EA0
まともな論文はオープンなデータを使うか
実験に使ったデータを公開してる

JST、産総研、NICT、理研、NTTあたりはこれらもやってない
2020/01/02(木) 09:14:28.28ID:tOCbQ3Wha
オープンなデータを使っているけど
データを恣意的に選択して実験しているため
他の人がやっても再現できないというのも
よくあるパターン
別に日本だけではないが
2020/01/02(木) 11:12:59.42ID:VAl9vceh0
データの選択によって再現性が失われているなら、抽出データが偏ってるし、
普通は検証段階で確認する

しかし、精度の高いモデル作りました→実践投入
で、新規データを食わせたら精度が右肩下がりって良くある光景
823デフォルトの名無しさん (アウウィフ FF0f-p4uH [106.171.74.125])
垢版 |
2020/01/02(木) 14:08:56.51ID:fRqsjLPxF
>>812
箱根マラソンもビッグデータωで戦ってるそうだ
https://toyokeizai.net/articles/-/321510?page=3
824デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/02(木) 14:23:33.66ID:CkITwvFM0
>>822
よく言われる過学習になってると思う
過学習かそうでないかは未知データで訓練と同程度の性能が出るかどうか以外の判別方法ある?
2020/01/02(木) 19:01:13.39ID:GkTEMuMY0
ない。あったらみんな飛びついてる。
2020/01/02(木) 19:18:29.62ID:GkTEMuMY0
そういうわかりやすい汎化性能を表す指標ってものがあったら、それをロスに組み込めばいいわけだ。
だがそんな状況にはなってない。
2020/01/02(木) 22:19:42.02ID:KXPhUsay0
希望の結果に成らなかった事柄全て、過学習と言ってしまうことのないように
828デフォルトの名無しさん (ワッチョイ 6b54-BJMr [180.235.0.69])
垢版 |
2020/01/02(木) 23:09:33.24ID:abNQ9/EA0
日本の研究期間は
本当の意味で研究に寄与してない

松尾豊あたりがちゃんと言わなきゃダメだろ
2020/01/03(金) 09:51:46.65ID:JJK+Gv110
そんな自分を全否定するようなこと言えないだろw
2020/01/03(金) 10:33:40.29ID:dIGkMlOva
PyTorchとTensorFlow - 学界と産業界で有力なMLフレームワークはどちらか
https://www.infoq.com/jp/news/2019/12/State-Machine-Learning-fw-2019
831デフォルトの名無しさん (アウウィフ FF0f-p4uH [106.171.76.178])
垢版 |
2020/01/03(金) 11:57:25.32ID:lHIykz7yF
>>827
ほんそれ
日本の教育構造の欠陥だな
832デフォルトの名無しさん (ワッチョイ ab01-CjBp [126.161.32.147])
垢版 |
2020/01/03(金) 15:30:23.04ID:W71Q+2T/0
>>831
主語デカ
2020/01/03(金) 16:10:33.70ID:jtHjGBI50
粗探し <<<< 欠点の解消の実行
2020/01/03(金) 17:04:32.60ID:WpaKhE1wa
過学習の判定は当然ながら一定数の推論結果を総合して行うわけで個別の推論結果が希望通りかどうかなんてことはそもそも眼中にない
>>827は過学習が何なのか、どうやって過学習か否か判定するのかすら理解していないのだろう
2020/01/03(金) 17:59:55.69ID:gVRcdqQw0
松尾豊にダメ元で意見を送ってみることにした
実装とデータをgithubで公開することを基本にしろ、と
そうしないと日本の研究は停滞したままだ、と
2020/01/03(金) 18:29:08.35ID:6jkaCR+Q0
>>835
松尾に送ってどうするよ
2020/01/03(金) 18:34:20.22ID:b+HkQOrh0
繰り返しますが、うまくいかなかった事柄を過学習とラベリングし、考えることを止めないように。
過学習って言葉は使用禁止にしたいぐらいですね
2020/01/03(金) 18:37:58.64ID:b+HkQOrh0
>>835
松尾って奴には何も期待してないから別にやらなくてよい
2020/01/03(金) 19:54:17.54ID:hATKQL5q0
線形代数とか難しいんだけど、ライブラリ使いこなすだけだとやっぱりしぬ?
2020/01/03(金) 21:15:55.83ID:JJK+Gv110
機械学習は置いといても線形代数は理解してた方が今後の人生のためにはなる。
2020/01/03(金) 22:46:08.59ID:kIdsqT260
>>835
経産省と文部科学省に言うべきだが、
>>835が進言するより、松尾や落合が言った方が聞く耳を持って貰える
2020/01/04(土) 01:07:26.61ID:+fj4YEmI0
聞いてるふりをして聞き流してますよ
843デフォルトの名無しさん (ワッチョイ 6b54-hZl1 [180.235.0.69])
垢版 |
2020/01/04(土) 08:10:20.67ID:0FWfySRB0
PFNの連中でもいいけど
日本のAIベンチャー(笑)から建設的な意見が出てこないのも悲しい

やっぱり山師なんだろう
2020/01/04(土) 10:56:49.96ID:GvN9lrG00
実装を公開するといっても、実装した人の特異な環境、設定で
やっているかもしれないし。次はそれをもっと標準的な環境で
公開しろということになってきりがないような気がするが
2020/01/04(土) 11:08:32.58ID:uVSKRwzpM
まずは米国並みに公開すればいい。問題が出てきたら他国でも問題になるだろうから皆で考えればいいさ
846デフォルトの名無しさん (ワッチョイ 3bdd-BJMr [122.249.73.11])
垢版 |
2020/01/04(土) 11:41:58.28ID:ENDwxYLV0
公開するのってキリスト教的な考えなのかな
寄付みたいな

日本はどうも閉鎖的
847デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/04(土) 11:42:29.12ID:j2BUyZ6N0
複数のデータセットでエラー率を測定して
その母比率を区間推定して
下限値が要求するレベルを超えているかどうかで
そのモデルを採用するか否か判別する方法はどうか

エラー率を他の指標にしてもいいかもしれない
848デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/04(土) 11:43:40.22ID:j2BUyZ6N0
過学習しているモデルなら
エラー率の分散が大きくなると予想して
区間推定の区間が広くなって
下限値が下がると思う
2020/01/04(土) 11:56:52.06ID:NL29rqkc0
複数のデータセットをそんな簡単に用意できるわけないだろ。
クロスバリデーションからやり直し。
2020/01/04(土) 11:59:21.87ID:uVSKRwzpM
>>846
科学的なものではないか

材料系の実験論文は、材料と手順を書いても追試困難なものも多いそうな
計算機上で出来る実験はエビデンスとしてソースが使えるから、公開したら説得力が増して良いことばかり
2020/01/04(土) 12:19:30.68ID:NL29rqkc0
問題は説得力と信頼性を得ても金にならんてことだけどね。
852デフォルトの名無しさん (アウウィフ FF0f-p4uH [106.171.67.82])
垢版 |
2020/01/04(土) 12:31:23.41ID:trUJS7QSF
線形代数が難しいって言ってる人に聴きたいんだが
具体的にどの辺で詰まってるの?
2020/01/04(土) 12:33:42.39ID:n3QqNFMv0
論文の説得力が増しても給料上がったりに繋がらないなら、研究者の評価の仕方が違うんかね
お役所はどこを見てるのか
2020/01/04(土) 13:01:13.27ID:Eq0fd+t90
随伴行列とか
855デフォルトの名無しさん (アウアウウー Sa0f-CjBp [106.154.136.90])
垢版 |
2020/01/04(土) 13:12:18.47ID:lipfO/3va
>>844
イメージも一緒に公開するまでだ
856デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/04(土) 13:20:23.20ID:j2BUyZ6N0
>>849
訓練に必要なデータ数はどの程度か目安を計算する式ある?
テスト用ならそれよりもっと少なくていいんじゃね?
857デフォルトの名無しさん (ワッチョイ 9fb3-Hx/H [125.173.52.11])
垢版 |
2020/01/04(土) 14:13:41.19ID:CQ4m6M+L0
教育やってるけど難しいと言ってる人は大抵固有値問題で引っかかる
2020/01/04(土) 14:39:53.48ID:eKUy87rqa
固有値で引っかかり
ジョルダン標準形で完全挫折
2020/01/04(土) 15:16:22.42ID:zJPV7nPe0
固有値では引っかからんだろ、ジョルダン標準形なら分かるが
2020/01/04(土) 16:07:21.47ID:+gXTwHr30
線形代数は大抵の大学の講義がひたすら定理の証明をなぞるだけで何のためにやってるのか説明しないからいつしか付いていく気が失せるのが問題
2020/01/04(土) 16:55:02.67ID:dVmT9Zd40
>>853
何本かいたか&何回発表したか しかかぞえてないぉ
だから
プレデター(ハゲタカ)ジャーナルとかプレデターカンファレーションがわらわらわー
862デフォルトの名無しさん (ワッチョイ 6b54-BJMr [180.235.0.69])
垢版 |
2020/01/04(土) 17:12:16.04ID:0FWfySRB0
じゃなくて
研究者としての矜持くらい持てよ
2020/01/04(土) 17:15:40.43ID:dVmT9Zd40
矜持と予算がケンカする現状なのー
2020/01/04(土) 17:58:28.14ID:UI0ynszPa
正当な評価を受けたいまともな研究者は海外へ出ていくだけ
2020/01/04(土) 19:20:25.08ID:mrNm0sQkF
ロジック/ロジカルシンキング/論理的思考と一般的に呼ばれるもので物事を解決しようとすると、基本的な問題解決のための方法は
帰納法によるアプローチ
演繹法によるアプローチ

この二つの何れかのアプローチに分けられる。
2020/01/04(土) 19:24:33.17ID:mrNm0sQkF
前者は、これまでの実績/経験則を元に一般法則を推定しようとするアプローチである。

一方後者は、確固たる前提/原理原則/一般規格から、確固たる結論を得る方法である。
2020/01/04(土) 19:27:21.07ID:mrNm0sQkF
例えば、ハイパーパラメータを弄って一定の効果・傾向を掴み、それを元に上手くいった/いかないを結論付けようとするのは帰納法による推論である
2020/01/04(土) 19:33:21.25ID:mrNm0sQkF
他方、小学1年の算数の例であるが…

1+1は2である。

これは、小学生1年生であろうが学校の先生であろうが、会社の社長であろうが一国の首相であろうが同じ答えを答えるだろう。
2020/01/04(土) 19:34:05.47ID:iP+F2XtLM
>>861
引用数も評価されると思ってた
引用稼ぐにはソース公開はいいと思うけどなあ
2020/01/04(土) 19:37:44.95ID:mrNm0sQkF
ただし、
数字を十進法ではなく二進法で表せば1+1=10である。

他に、
1+1の『+』の加算の定義を『×』乗算の定義と入れ換えれば1+1=1である。

あるいは、
2という数字の定義を5と入れ換えれば1+1=5である。
2020/01/04(土) 19:39:43.23ID:mrNm0sQkF
加算の定義、数字の定義、数の定義を全て正しいものと仮定して始めて1+1は2となる。
2020/01/04(土) 19:41:39.97ID:mrNm0sQkF
ここの人は是非、自分のやっていることが前者で進めているのか、後者で進めていることなのか、よく考えてほしい
2020/01/04(土) 19:47:32.97ID:mrNm0sQkF
帰納法で得られた結果はあくまでも推定の域を出ない。

例え10回やって10回ともいい結果が出たとしても11回目に100%よい結果が出るかどうかは保証はない。
2020/01/04(土) 19:50:57.56ID:mrNm0sQkF
他方、演繹法は絶対的・普遍的な解を得ることができる。

これは非常に強烈なロジックなのだが、残念ながら日本ではこのアプローチを重視する人材が非常に少ない、というかいない
875デフォルトの名無しさん (ワッチョイ 9fb3-Hx/H [125.173.52.11])
垢版 |
2020/01/04(土) 19:52:14.75ID:CQ4m6M+L0
公衆無線LANで何寒いこと書いてるねん
876デフォルトの名無しさん (ワッチョイ 3bdd-BJMr [122.249.73.11])
垢版 |
2020/01/04(土) 20:19:20.64ID:ENDwxYLV0
ねー
文系出身のワナビーだろう

直感はどちらに分類されるのだろうね
2020/01/04(土) 20:27:40.67ID:dVmT9Zd40
>>869
そういえばそんなのもあったが
だいたいはお友達w同士で相互に引用しあって一蓮托生というね もうね
2020/01/04(土) 20:43:29.49ID:m+tPynmQ0
>>876
帰納法
2020/01/04(土) 20:52:46.32ID:YBqf4hfGa
日本での研究者の評価というと、真っ先に思い浮かぶのが科研費
過去の論文の数を基に、今後の計画を立てて予算申請する
一応審査しているのは専門家
専門性の高い論文を書いているかどうかが評価の基準
情報公開は・・・評価されるのかな?
そういうのを書く項目がないような気がする
2020/01/04(土) 21:56:53.64ID:xLbjEwkrM
君たちG検定はとるの?
2020/01/04(土) 22:06:24.08ID:NL29rqkc0
>>856
そんなものはない。
あってもVC次元使った奴とかバウンドが実際のデータ数よりも圧倒的に多いものしか計算できなくて
全く使い物にならん。
テストデータのサンプル数も何回か試して精度が安定する個数に設定するってのが現状。

この仕事、やってない奴ほど理論でなんとかなると思ってんだよな。
そこが実際とのギャップになってめんどくさい議論を増やしてる。
2020/01/04(土) 22:16:11.54ID:Eq0fd+t90
相対性理論は帰納法で導かれたよ
2020/01/04(土) 22:31:38.39ID:m+tPynmQ0
相対性理論は
仮説推定⇒演繹法による検証⇒ローレンツ変換不変の前提のもとで100%正しい
2020/01/04(土) 22:34:59.55ID:m+tPynmQ0
仮説推定の検証が実験のみか理論かで分かれる
2020/01/04(土) 22:36:39.92ID:m+tPynmQ0
>>881
それはお前及びお前が出会ってきた人間がヘボいだけ
2020/01/04(土) 22:39:40.66ID:NL29rqkc0
>>885
そうだな。お前みたいなヘボイ奴ばっか相手にしてる。
2020/01/04(土) 22:41:53.90ID:Eq0fd+t90
例えば一般相対性理論は慣性質量と重力質量は等価である等の
小さな原理から大きな理論を構築した帰納的思考によるもの
2020/01/04(土) 22:45:01.46ID:m+tPynmQ0
だから仮説推定の後すぐに演繹法による検証をやってるのがアインシュタイン
2020/01/04(土) 22:46:21.57ID:m+tPynmQ0
実験やってないんだよ
2020/01/04(土) 23:11:36.37ID:Eq0fd+t90
実験したとかしないとか関係ないし
2020/01/04(土) 23:15:56.70ID:m+tPynmQ0
??
2020/01/05(日) 06:22:18.52ID:+jir1/5X0
自然言語処理のツールの使い方を覚えたいんですが
具体例のあるブログ記事ってないでしょうか

keras とか ALBERT とか tensorflow とかでてくるんですが
どれもインストール方法とかの説明はあるんですが
はじめからセットしてあるモデルに対して精度を出力して終わりみたいなブログ記事ばかりで
実際に日本語で質問文を投げてAIが返答するようなプログラムの書き方みたいなのが一切出てこないです

どうやって勉強すればいいんでしょうか

情報系の大学院生でプログラムはそこそこ経験があるんですが
AIに関しては原理を講義でならっただけでtensorflow すら使ったことがないレベルです
もうじき就活がはじまるのでAIが使えるってだけで有利になるらしいので
サンプルシステムを作ってみたいと思ってます
893デフォルトの名無しさん (ワッチョイ 0f63-bcBw [153.218.137.102])
垢版 |
2020/01/05(日) 06:28:31.48ID:kv6ApXZt0
それは世間的には基礎的かもしれないが
現行のAIはそこまで対応してないだろ
文書の内容を機械が理解するのは高度
とりあえず日本→英語の翻訳を実装してみれば手がかり、オリジナリティを得られるのでは?
一般的な、唯一の手法はないという前提だが、じぶんがしらないだけかもしれないが
894デフォルトの名無しさん (ワッチョイ 0f63-bcBw [153.218.137.102])
垢版 |
2020/01/05(日) 06:35:30.27ID:kv6ApXZt0
2019/08/19 05:01
AI翻訳が人間超え、言葉の壁崩壊へ
1人に1台、自動翻訳機、多言語“通訳”がポケットに
第1部:市場動向
https://tech.nikkeibp.co.jp/atcl/nxt/mag/ne/18/00046/00001/



2019/08/20 05:02
AI翻訳が人間超え、言葉の壁崩壊へ
トランスフォーマー時代到来、翻訳技術から汎用言語系AIに
第2部:技術動向
https://tech.nikkeibp.co.jp/atcl/nxt/mag/ne/18/00046/00002/
895デフォルトの名無しさん (ワッチョイ 0f63-bcBw [153.218.137.102])
垢版 |
2020/01/05(日) 06:41:07.68ID:kv6ApXZt0
総務省・NICT主催「多言語音声翻訳アイデアコンテスト」(第2回)優秀賞決定!
多言語音声翻訳コンテスト運営事務局 2019年12月19日

総務省と国立研究開発法人情報通信研究機構(NICT)は、12月14日(土)TEPIAホールにて、
多言語音声翻訳技術の更なる普及や多種多様な翻訳サービスの出現を加速するため、
世界の「言葉の壁」をなくす新しいアイデアを募集する「多言語音声翻訳アイデアコンテスト」(第2回)審査会及び表彰式を開催いたしました。
https://prtimes.jp/main/html/rd/p/000000002.000050519.html
2020/01/05(日) 06:55:10.09ID:24cr/O3JM
機械学習だと固有値って教本にやたら出てくるけど具体的にどこで使うの?主成分分析だけ?
2020/01/05(日) 07:05:39.44ID:+jir1/5X0
>>893
ツールを使うだけではBOT同志で会話するっていうのは無理で
かなり高度なチューニングの知識?がいるってことなんでしょうか

ライブラリに適当な文章大量に流し込めば勝手に知識獲得してしゃべりだすものかと思ってました
898デフォルトの名無しさん (ワッチョイ 0f63-bcBw [153.218.137.102])
垢版 |
2020/01/05(日) 07:15:11.42ID:kv6ApXZt0
人工知能が2019年センター試験の英語筆記本試験で185点を獲得 2019年11月19日

人工知能プロジェクト「ロボットは東大に入れるか」の一環として、大学入試センター試験の英語筆記科目に挑戦した結果、185点(偏差値64.1)の成績を収めた。

NTTコミュニケーション科学基礎研究所(NTT CS研)ではこのプロジェクトを自然言語処理および知識処理の基礎研究を進めるベンチマークとして捉え、自動解答に関する知見を積み重ねてきた。

近年は深層学習に基づく文書読解技術が進展しており、そのなかの最新技術であるXLNetは、大規模テキストによる事前学習をベースモデルに、問題の性質に合わせた移転学習を施すことで、異なる種類の問題を比較的少量のデータから効率的に解くことを可能にした。

しかし、学習に利用できるデータが大きく不足している問題や、解答に辞書的な情報が不可欠な問題では、十分な精度の解答が得られなかった。
今回NTT CS研は以下の点で改善を施し、過去3年間のセンター本試験/追試験に対して適用した結果、安定して偏差値60以上を達成したという。

不要文除去問題の高精度化
機械学習は正解と不正解のデータの両方を入力して学習するが、文章から不要な文を見つける比較的新しい「不要文除去問題」には適用できない。
というのも、通常の文章には不要な文が含まれておらず、学習に用いるデータを集めることが難しいためだ。このため従来のAIでは、本試験/追試験で15問中6問しか正解できなかった。

そこで、不要文を含まない通常の文章から、文の順序を組み替えて擬似的に不自然な流れを作成することで、大量の不要文除去問題を自動作成する手法を考案。
これにより15問すべて正答できたという。また、過去問や独自作成問題からなるベンチマークデータにおいても、正答率を60%から86%までに高められた。

https://pc.watch.impress.co.jp/docs/news/1219388.html
899デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/05(日) 13:14:15.07ID:5vFDsLtv0
>>881
ないならつくるのが研究者の課題じゃ無いのかな?
900デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/05(日) 13:16:19.91ID:5vFDsLtv0
科学って帰納的に仮説を立てて実証することの繰り返しじゃね?
その仮説を立てたりどんな実証方法があるかを考えたりするのにこれまでに判っている事を演繹的に適用して論理展開する
両方の思考が必要だと思う
901デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/05(日) 13:17:44.79ID:5vFDsLtv0
>>882
時間や空間が絶対的なものではなくて光の速さが絶対的だと言う仮定を元に演繹的に論理展開していったものだと理解している
902デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/05(日) 13:19:41.39ID:5vFDsLtv0
>>890
あなたはそうかもしれないけど世の中的には
実験で確認されて初めてノーベル賞もらったりしてるけどな
ヒッグス粒子もそうだったし
2020/01/05(日) 13:31:19.77ID:98+Qbn7z0
マウント合戦
2020/01/05(日) 13:34:07.84ID:/FsL/PEZM
物理は実験が主だよ
アインシュタインみたいな理論屋は凄いけど実験で確認出来なかったら只の妄想
2020/01/05(日) 13:41:29.59ID:98+Qbn7z0
イタチ野郎
906デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/05(日) 14:55:53.83ID:5vFDsLtv0
>>904
湯川博士とか理論物理で進展した領域もあると思う
実験で確認されないとただの仮説だけど
2020/01/05(日) 15:01:35.73ID:Xx30ZH0k0
>>897
(ヾノ・∀・`)ナイナイ

大量に話しかけてやれば
そのうち
それっぽい応答するようになる、かもしれない
日本語対応Python3系のコードっていうと
ちょっと古いが、
unmoっていうのがある。
探して読んでインスコして遊んでみれ。
908デフォルトの名無しさん (ワッチョイ ef1d-iOMu [143.189.31.12])
垢版 |
2020/01/05(日) 15:38:21.14ID:rjC1FbEm0
ガチ勢はフツーの線形代数じゃなくて、行列の微分が自然に出てくる領域で、
一般相対論とスキルセットで親和性が高かったりする。
2020/01/05(日) 17:38:18.20ID:qqN6BGPlM
>>906
もちろん理論も大事なんだけど、物理の場合は理論がいくら発展しても実験で確かめられないと意味がないという風潮があるよ
電磁気力、弱い核力、強い核力を統一する大統一理論の有力候補の超対称性理論ってやつも、多分理論としてはかなり綺麗にまとまってるんだと思うけど、超対称性粒子が全然実験で検出されないからなかなか立場的に厳しいみたい
重力まで統一する万物の理論に関しては、例えば超弦理論なんかだと決めるべきパラメータが多すぎて、また実験も惑星規模の加速器を作ったりしなきゃいけないらしく、現実的にこの世界に適合する超弦理論が得られるかというと怪しいみたいで、物理学の仮説として取り扱うのすら反対意見があるらしいよ
2020/01/05(日) 17:57:18.05ID:ZpTtXk4N0
>>909
風潮じゃなくてニュートン以来の原則が実験ですよ
何故か物理は数式で表せて、しかも美しい数式になるという所から、ここ100年ちょっとは美しさという指標で、理論だけでもドンドン発展させられたのさ
2020/01/05(日) 18:08:53.21ID:qL+E1kAs0
実験検証でのデメリットとしては、実験でよい結果が得られた⇒だから正しい⇒終わり
としてしまう人が発生すること。

たまたま偶然よい結果がでただけの可能性を疑わない人がいるんですよね。

○-○aveなんかはその最たる例ですね
912デフォルトの名無しさん (アウアウウー Sa0f-qQU+ [106.154.126.11])
垢版 |
2020/01/05(日) 19:11:04.25ID:aadHI+RPa
アニーリング方式は100%最適解が求まる類のものではないんじゃないの?
量子の振る舞いの結果を計算結果とみなすってことだろうし
量子ゲート方式なら論理演算ができるのかもしれないけど

ノイマン型でも誤り訂正とかしないとミスは起きるし
量子ビットも誤り訂正とかの技術が確立されてきたらエラー率が下がるんじゃないかな
2020/01/05(日) 19:22:52.95ID:qL+E1kAs0
>アニーリング方式は100%最適解が求まる類のものではないんじゃないの?

そのとおり。量子アニーリングで得た結果は最適解である保証はありません。

結果だけ切り取った結果、無駄な投資を生んでしまい、日本の量子コンピュータ検討の邪魔する結果となってしまいました。
2020/01/05(日) 19:24:37.61ID:qL+E1kAs0
https://www.itmedia.co.jp/news/spv/1906/03/news033.html
2020/01/05(日) 19:43:23.83ID:6gmeklwC0
全くすれ違いだし
そもそもお前ら実験も理論もどっちもやってねーだろ。。
916デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
垢版 |
2020/01/05(日) 20:06:43.95ID:5vFDsLtv0
組合せ最適化問題を解ければ判別問題の学習結果を
より早くより正確に得られるようになるんじゃね?
2020/01/05(日) 20:07:51.30ID:y5M6+8m0d
元々の話題の一例を語ってるだけに見えますが…

>>915は帰納法・演繹法何れで仕事をされているかたですか?
2020/01/05(日) 20:08:34.48ID:y5M6+8m0d
>>916
それ以上はスレ違いですね
2020/01/05(日) 20:49:34.82ID:6gmeklwC0
>>916
そっちのが難しいっつーの。
>>917
両方だよ。どっちかだけで仕事になると思ってのかおめでてーな。
2020/01/05(日) 21:17:01.17ID:+jir1/5X0
>>907
ありがとうございます!
921デフォルトの名無しさん (ワッチョイ 0f63-bcBw [153.218.137.102])
垢版 |
2020/01/06(月) 06:54:23.54ID:KyZp9b9y0
いよいよ人間超え、AI最新事情 文章読解でもAIがついに人間超え、グーグルの「BERT」発表から1年で急成長
2019/11/13

文章読解でもAIがついに人間超え、グーグルの「BERT」発表から1年で急成長

かつてはディープラーニング(深層学習)の適用が難しいと言われていた自然言語処理の分野でも、人工知能(AI)が人間の認識精度を上回るようになった。

グーグルが2018年10月に発表したBERTは、文章の「言語らしさ」を予測する言語モデルを「Transformer」というニューラルネットワークを多段に重ねて実装したものである。
言語らしさの予測は、AIが単語や文章を理解したり自然な文章を生成したりするうえで必要不可欠な要素である。

言語モデルの応用先としては、機械翻訳や機械読解、質問応答、言葉の言い換え(換言)、表現が異なる2つの文章の意味が同じかどうかの判断(含意関係認識)などがある。
グーグルのBERTは自然言語処理の世界に衝撃を与え、論文の発表からわずか1年で2200件以上も他の論文に引用されるほどになった。
これは、BERTが応用に関するベンチマークで人間の精度を上回る成果を上げたからだ。

文章読解のスコアで人間超え

具体的には機械読解のベンチマークである「SQuAD 1.1」で人間の精度を上回った。
SQuAD 1.1は米スタンフォード大学が作ったベンチマークで、「Wikipedia」の中にある140単語ほどの文章を読み解かせて、その文章に関する質問に回答させる。
正答は元の文章の中にフレーズとして存在する。正答の部分を正しく抜き出せるかどうかがポイントとなる。

SQuAD 1.1はタスクとして単純すぎるという指摘もある。
SQuAD 1.1よりタスクの難易度が高いベンチマークは「SQuAD 2.0」や「GLUE」など他にもあり、そうしたより難しいベンチマークではBERTは人間を上回れなかった。
しかしBERTが一部でも人間をスコアで上回ったことから、この分野の研究が一気に加速し、今ではBERTを改善した手法が、より難しいベンチマークでも人間超えを果たすようになった。

https://tech.nikkeibp.co.jp/atcl/nxt/column/18/01056/111200002/
922デフォルトの名無しさん (ワッチョイ 3bdd-BJMr [122.249.73.11])
垢版 |
2020/01/06(月) 16:22:20.03ID:7M4Z0nKv0
この手のテストに和文が無いからいまいちよくわからん
923デフォルトの名無しさん (ワッチョイ 6b54-hZl1 [180.235.0.69])
垢版 |
2020/01/06(月) 19:21:10.07ID:SSsR6M4H0
MSRの連中が描いた本(pdf)だってさ

Foundations of Data Science
https://www.cs.cornell.edu/jeh/book.pdf

日本の研究者はなーんもしない
924デフォルトの名無しさん (アウウィフ FF0f-p4uH [106.171.87.46])
垢版 |
2020/01/07(火) 15:50:31.93ID:2Dq0zKSWF
>>868
1 + 1 は 2 にはならんよ
大抵の場合 2 未満で 1.5 とか 1.0 とか
酷い時には 1 未満になることの方が多い
925デフォルトの名無しさん (ワッチョイ 4f7c-I5PR [113.32.86.138])
垢版 |
2020/01/07(火) 16:00:42.05ID:8esPW0SX0
>>908
<・∇・>ニダ
2020/01/08(水) 03:38:16.27ID:LHUjt0c20
>>924>>870-871を嫁
2020/01/08(水) 04:04:04.17ID:LHUjt0c20
>>908
ガチ勢は一般相対性理論なんて言わない。ゲージ曲率かファイバー束における写像の捻れで語る
2020/01/08(水) 10:16:28.43ID:XvkUwLSh0
イタチの屁
929デフォルトの名無しさん (ワイーワ2 FF13-Eg5K [103.5.142.233])
垢版 |
2020/01/09(木) 11:42:39.35ID:0RBXSUPhF
https://hayabusa9.5ch.net/test/read.cgi/news/1578536733/
NVIDIA製GPUドライバーに深刻な脆弱性、いますぐIntelオンボードを利用に切り替えてください
2020/01/10(金) 00:41:45.45ID:xMwSVvEb0
https://youtu.be/fK_JGVti5y8
2020/01/10(金) 02:20:32.44ID:xMwSVvEb0
まあ、学生さんはデータナンちゃらリストなんてうつつ抜かしてないで、各専門の基礎教科の習得に励みましょう。

機械学習なんてあくまで多数ある問題解決手段の1ツールに過ぎない。そもそも機械学習の習得なんて社会人からでも十分。
2020/01/10(金) 08:00:59.46ID:MP8EZybiM
excelくらいのもんだね
933デフォルトの名無しさん (ワッチョイ fddd-fF6T [122.249.73.11])
垢版 |
2020/01/10(金) 11:21:21.64ID:dy6nGdDz0
数年後には無くなってそう>>データサイエンティスト
2020/01/10(金) 11:33:30.82ID:MP8EZybiM
業務の一部として取り込まれる未来
2020/01/10(金) 12:28:08.40ID:9hvTdV+ca
データを元に業務上の判断をするのがデータサイエンティストの仕事
これは技術者にとって本質的な能力なのでデータサイエンティストという呼び名が無くなったとしてもこの能力を必要としなくなるわけではない
2020/01/10(金) 12:31:18.21ID:MP8EZybiM
データを元に判断するのは、豊臣秀吉もやってたそうだから今更感
937デフォルトの名無しさん (ワッチョイ 6501-ErPi [126.242.217.97])
垢版 |
2020/01/10(金) 12:35:48.58ID:K/lWprnk0
秀吉はデータサイエンティスト。
938デフォルトの名無しさん (アウアウウー Sa19-8whf [106.180.2.62])
垢版 |
2020/01/10(金) 12:47:28.71ID:ap2klRr+a
技術者にはもともとデータサイエンティスト的な要素があったのに、それだけが妙に持ち上げられた
そのうち、訳もわからずデータをライブラリにぶち込むだけの人をデータサイエンティストと蔑むことになるよ
2020/01/10(金) 13:15:10.43ID:W4/veIGi0
データサイエンティスト的なタスクって、
業務に携わってる奴がやるのが世界の普通のような

システム屋にやらせるから応用範囲が限定される
940デフォルトの名無しさん (ワントンキン MMa3-fF6T [153.248.186.192])
垢版 |
2020/01/10(金) 14:59:12.98ID:jdArXowMM
マクロかexcelにツールがついて終わり
2020/01/10(金) 16:48:37.09ID:3HDQydXj0
若手の自称データサイエンティストと話すと
linuxわかりませんとか言う人マジで多くて嫌になる
どこがのスクール出身なのか?
クラウドのjupyter notebook上でしかコード書いたことないらしい
マジで基礎がガバガバ
そこを身につけるのは地味で退屈だから最近の人はやりたがらないのはわかるが
2020/01/10(金) 16:53:19.80ID:XoWOAf9+0
ツールの話でマウントとろうとすると僕は馬鹿ですって自己紹介してるのと同じだからやめた方が良いよ
2020/01/10(金) 16:54:28.69ID:iWyShsMIH
エクセルで完結はさすがにない
2020/01/10(金) 17:00:34.97ID:MP8EZybiM
分析から先の仕事メインならlinux知らなくてもいいかなと
技術者でなく、ただのビジネスマンだと思うが
2020/01/10(金) 17:03:43.90ID:apRS/vPU6
リモートサーバにコード投げて動かすときくらいしかまともにlinuxコマンド使わんわ
vscodeで開発してるからvimも最低限しか使えない
2020/01/10(金) 17:03:57.42ID:6tzIS8Z40
自前で動かそうとしたらLinuxはあったほうがいいよ
2020/01/10(金) 17:34:07.53ID:1UGZVEFGd
>>941
プロダクションで動かすコードにするまでにすごい苦労しそうだな
(自称)データサイエンティストとSI屋の間に、もう一人両方の分野を知ってる人間がいないと無理そう
2020/01/10(金) 17:39:06.54ID:o1aiizUGM
データサイエンス系の仕事手伝ってるけどSI屋が分析より下のレイヤーやるようになりそうな雰囲気
ETLとかの延長で出来るところまで
2020/01/10(金) 17:43:26.30ID:3HDQydXj0
>>947
ウチはジョブキュー使ってコマンドで投げるから
最低でも一連の学習処理をシェル化して
入力ファイルを配置してサブミットするというのができないと詰むんだけど
大したことではないはずなのにわかりませんとかさあ
2020/01/10(金) 17:47:52.64ID:o1aiizUGM
kaggleみたいなUIにしとけばいいんかな
951デフォルトの名無しさん (ワントンキン MMa3-fF6T [153.248.186.192])
垢版 |
2020/01/10(金) 19:00:13.93ID:jdArXowMM
msの技術力を侮ってはいけない
いずれexcelに付くよ
2020/01/10(金) 19:03:54.70ID:iWyShsMIH
そら小規模データならエクセルでも可だろうけど
ちょっと大きいデータ扱うと重たくてどうしようもないしょ
953デフォルトの名無しさん (ワッチョイ 0b10-xl+7 [153.131.102.129])
垢版 |
2020/01/10(金) 19:16:19.21ID:9TebhQDM0
>>943
少し前にexcelのマクロ言語にPythonを採用するとか言う噂が上がってたけどな
今はその話は無くなってPythonからexcelを操作してくれってことになってると思う
954デフォルトの名無しさん (ワッチョイ 0b10-xl+7 [153.131.102.129])
垢版 |
2020/01/10(金) 19:19:06.71ID:9TebhQDM0
>>949
社内ルール的なものはマニュアル作れば解決する問題だと思うけど
その判らない人に作るように言って判らないところは仮で書いてもらって訂正すればいいのでは?
955デフォルトの名無しさん (ワッチョイ 0b10-xl+7 [153.131.102.129])
垢版 |
2020/01/10(金) 19:20:16.63ID:9TebhQDM0
>>952
表示の更新とか完了するまで再計算を停止するとスピード上がる
956デフォルトの名無しさん (ワッチョイ 0b10-xl+7 [153.131.102.129])
垢版 |
2020/01/10(金) 19:22:21.42ID:9TebhQDM0
ピボットテーブルとかはexcelの方が作業効率良くない?
GUIで操作できるし
2020/01/10(金) 19:41:25.05ID:iWyShsMIH
議論するつもりはないけど、前処理やらバッチ処理するのもエクセルでやるんかな
2020/01/10(金) 19:45:47.30ID:OuRZpUf20
VBAで数値積分する人もいるから、ありえる
jupyterの人も増えそうだけど
959デフォルトの名無しさん (アウアウウー Sa19-vCMi [106.154.137.133])
垢版 |
2020/01/10(金) 19:55:10.38ID:hc3qGoBHa
>>933
誰でもタイピングする様になってタイピストが居なくなったように、データサイエンティストもなるかもね
2020/01/10(金) 20:00:51.64ID:gdjTauNe0
>>941
jupyter使いは信用するなってのがこの業界の鉄則だぞ。
961デフォルトの名無しさん (ワッチョイ 5b1d-3ULX [143.189.31.12])
垢版 |
2020/01/10(金) 20:24:48.47ID:eyebCCoV0
filemakerとかkintoneの流れでexcellって消えていくのかと思ってた。
pythonも使えるようになってるっぽいし、pandasとかRとGUIが融合したみたいになっていくのか。
962デフォルトの名無しさん (ワッチョイ 6501-ErPi [126.242.217.97])
垢版 |
2020/01/11(土) 01:41:29.68ID:r5wulSj/0
Linux板でよくExcel対スパコンみたいな話してるけどな。
Excelはスパコンより性能が低いからもうWindows使わないみたいな。
2020/01/11(土) 11:21:35.22ID:R+Z8VLSZM
スコップとショベルカーみたいな関係かね。
自分は重機好き?だからWindows使いたくないんだけど、仕事ではWindows上でVirtualBox動かしてlinux+dockerしてる。
退勤時間はexcelで集計したりしてる
適材適所やね
2020/01/11(土) 11:41:24.42ID:vkWme/+ta
Excelはあくまでデータとビューが同時に確認できることがメリット
明らかに一画面に収まらないぐらい大量のデータや大量のグラフが必要になるものをExcelで処理している時点で使い道を誤っている
一画面に収まらないなら素直にデータとビューを分離できる仕組みで処理すべき
2020/01/11(土) 11:45:43.40ID:ucFJPBVI0
excel使うくらいならmatlab使う
2020/01/11(土) 12:35:50.32ID:WuYSTrVT0
>>962
テラワロスwwwwwwww
2020/01/11(土) 20:57:36.20ID:H7kAoHn50
https://i.imgur.com/XGU2tNI.jpg
968デフォルトの名無しさん (ワッチョイ 0bbb-ZJ4Y [217.178.3.78])
垢版 |
2020/01/12(日) 03:23:49.39ID:gh55rPFY0
>>965
そんで、最終的に
Excelでレポートにする

単に、適材適所と思わん?
969デフォルトの名無しさん (ワッチョイ 0bbb-ZJ4Y [217.178.3.78])
垢版 |
2020/01/12(日) 03:26:42.09ID:gh55rPFY0
ライブラリ使わずに自分でAIプログラム書きました
といわれても、プログラムが信用できへんで
970デフォルトの名無しさん (ワッチョイ 6501-ErPi [126.242.217.97])
垢版 |
2020/01/12(日) 04:33:11.51ID:Uj5X0q1W0
Excelのシートは業務のノウハウそのものなので、使われてきたシートのせいでシステム化が出来ないというのなら、インテグレータとして失格だと思うというか、普段なんでお金貰えてるの?と不思議に思う。
OAと言ってた頃はまさに詐欺で飯食ってたけど。
いま同じことしたら普通に詐欺で訴えられると思う。
971デフォルトの名無しさん (ワッチョイ 5501-ErPi [220.56.102.222])
垢版 |
2020/01/13(月) 00:58:09.24ID:HVnwH/nI0
≪株式会社学情 調査≫
『2020年卒 就職人気企業ランキング【速報】』
http://service.gakujo.ne.jp/files/7415/5374/1191/2020_ranking.pdf

IT・ソフトウェアの最上位
26位 アマゾンジャパン

AIとか若い奴は興味ないんだろうな
2020/01/13(月) 01:05:12.23ID:bgtYO71Ta
日本企業の技術系なら理系であれば何学部出身でも採用の可能性があるが
GAFAみたいな外資だと情報系で修士か博士取っていないと門前払いだからそもそも応募資格のある人数が圧倒的に少ないので仕方がない
973デフォルトの名無しさん (ワッチョイ 5501-ErPi [220.56.102.222])
垢版 |
2020/01/13(月) 01:08:04.53ID:HVnwH/nI0
>>970
まー日産っていう大きい会社のカリスマ経営者と言われている英雄ですら
ペテン師みたいなもんだからな
大量に解雇して金をこっそり奪い取るんだ!ぐらいの気持ちが無いと
金持ちにはなれんぞ
974デフォルトの名無しさん (ワッチョイ 5501-ErPi [220.56.102.222])
垢版 |
2020/01/13(月) 01:21:36.71ID:HVnwH/nI0
>>972
日本企業の IT・ソフトウェアで人気なのは52位のSkyだな
次が54位の楽天
次が99位のLINE
2020/01/13(月) 01:55:13.05ID:xcD2sz0v0
20年前のgoogle考えたら、今はちっこいベンチャーなとこ(日本じゃなくて)行かんとダメなんじゃねーの?
2020/01/13(月) 04:39:22.46ID:AqVlGfb/0
若いのになんでこんな保守的なんだろうなw
金儲けしたい訳でもなさそうだし
おじさん世代からすると今の若い奴なんていくらでも
多様な道があると思うのだが
977デフォルトの名無しさん (アウアウウー Sa19-0CUc [106.161.116.215])
垢版 |
2020/01/13(月) 07:31:56.91ID:8RyNzpcha
>>975
Arayaは?
978デフォルトの名無しさん (アウアウウー Sa19-0CUc [106.161.116.215])
垢版 |
2020/01/13(月) 07:35:28.69ID:8RyNzpcha
>>972
イオヌッツは修士出てなかったが。
ちなみにイオヌッツは断った。
2020/01/13(月) 12:15:52.60ID:XVZ9a4MGa
>>975
アメリカだと本当に優秀な人はとっとと起業する
GAFAみたいな既に出来上がった大企業に行くのは起業できるだけの能力とアイデアが無かった二流という感じ
2020/01/13(月) 12:21:17.18ID:pLOO1PDzM
東大卒でGAFA行くの勿体ないよね
すぐ辞めて起業するならいいけど
昔官僚、今GAFAで、ノーベル賞少ないところを見ると目先の金に計算高いという特性が透けて見える
981デフォルトの名無しさん (アウアウウー Sa19-vCMi [106.154.130.228])
垢版 |
2020/01/13(月) 12:35:20.31ID:uorRSC+xa
ノーベル賞にCS分野はないぞ
チューリング賞ならGAFAから出てるじゃないか
982デフォルトの名無しさん (アウアウウー Sa19-vCMi [106.154.130.228])
垢版 |
2020/01/13(月) 12:38:02.23ID:uorRSC+xa
むしろGAFAは目先の金に囚われずに基礎研究にもかなり注力している印象だが
2020/01/13(月) 12:54:31.24ID:pLOO1PDzM
東大卒で研究するためにGAFA行くって人増えてるかな
それならそれでいいんだけど、研究より金を優先させてる人が多い印象だったのよね
2020/01/13(月) 12:59:26.89ID:L7OG7ykaa
>>983
GAFAですら結果出してのは一握りの人だけだから
日本の企業と人材では到底無理だろうね
一昔前は日本のメーカーがそういうことして
結果も出てたのになあ
985デフォルトの名無しさん (ワッチョイ 5501-tgR8 [220.56.102.222])
垢版 |
2020/01/13(月) 13:48:22.96ID:HVnwH/nI0
>>976
頭が良くなったんじゃないか?
使い捨ての知識を植え付けられ会社の為
一時の利益に貢献させられるより
食いっぱぐれない食品関係に長く居た方がいいっていう
起業と言っても大半は失敗する訳で
その中の本当にごく僅かな人が運的要素により成功しているが
そんな割にも合わないものにチャレンジするより安定して長く居られる会社に就職した方がいいっていう
2020/01/13(月) 14:12:17.54ID:qe5f7iwkd
【統計分析】機械学習・データマイニング27
https://mevius.5ch.net/test/read.cgi/tech/1578892284/
2020/01/13(月) 14:17:46.68ID:6kghygIo0
>>986
たておつ
2020/01/13(月) 16:00:18.20ID:NQckQZya0
>>972
Googleは学歴不問になったはず

入社テストが上手く出来てりゃ、最終学歴で振り分ける必要が無いので、新しい主流
2020/01/13(月) 16:31:01.42ID:9nwjRJNrd
次スレッドが重複してるぞ
2020/01/13(月) 17:01:53.06ID:6kghygIo0
誘導かかってない↓こっちのスレのほうがほんのちょっとだけ先にたってるな
【統計分析】機械学習・データマイニング27
http://mevius.5ch.net/test/read.cgi/tech/1578890891/
2020/01/13(月) 17:44:13.38ID:QmCTZYcld
そもそもワッチョイぐらいつけろよ
2020/01/13(月) 18:58:02.41ID:xgMgrp400
どっちのスレを使うか決めて
2020/01/13(月) 19:26:49.09ID:6kghygIo0
>>991なるほど990はスレ設定失敗してる不良品なんだな。

じゃあみんな↓を使おうぜ
【統計分析】機械学習・データマイニング27
https://mevius.5ch.net/test/read.cgi/tech/1578892284/

1578890891のほうは、ノーレス放置で落とそう。
2020/01/13(月) 20:27:06.16ID:9nwjRJNrd
賛成多数。よって本法案を可決致しました。
2020/01/13(月) 20:36:48.83ID:l7upyLYs0
民主主義を無視している、横暴だ(笑)
2020/01/13(月) 20:41:25.06ID:QmCTZYcld
よしなに
2020/01/13(月) 20:41:56.67ID:QmCTZYcld
あぽーん
2020/01/13(月) 20:42:26.27ID:QmCTZYcld
SQL
2020/01/13(月) 20:43:03.73ID:QmCTZYcld
ldl
2020/01/13(月) 20:43:35.62ID:QmCTZYcld
らめー
10011001
垢版 |
Over 1000Thread
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 120日 11時間 20分 29秒
10021002
垢版 |
Over 1000Thread
5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。


───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────

会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。

▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/

▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
レス数が1000を超えています。これ以上書き込みはできません。