【統計分析】機械学習・データマイニング20

機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング19
http://mevius.2ch.net/test/read.cgi/tech/1520586585/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured

723デフォルトの名無しさん (アウアウエー Sa6a-VI3z)2018/10/08(月) 13:07:36.75ID:DvqFh1SLa
>>722
再確認すれば良い
利用規約の改定とか普通によくあることじゃね?

724デフォルトの名無しさん (アウアウエー Sa6a-TFgJ)2018/10/08(月) 14:02:39.08ID:tjiQ7o9Aa
>>723
その再確認を既に退院した人含めて一人一人にするのは結構大変なのでは

725デフォルトの名無しさん (ブーイモ MMed-fU7r)2018/10/08(月) 14:31:20.58ID:4tTMXMXFM
arxivのML・DL論文読んでて、日本人の論文少ないよね

726デフォルトの名無しさん (ワッチョイ 048a-Qng4)2018/10/08(月) 15:01:42.20ID:aB+juQlj0
意味不明な日本語を使う奴に言われてもw

727デフォルトの名無しさん (ワッチョイ 951d-CKq4)2018/10/08(月) 21:08:44.54ID:ND0ntmkA0
英語でわざわざ論文書くのがめんどくさい

728デフォルトの名無しさん (ワッチョイ 3aaf-2Yci)2018/10/08(月) 22:37:44.37ID:6UIbz9ua0
外人嫌いだし

729デフォルトの名無しさん (アウアウエー Sa6a-VI3z)2018/10/09(火) 08:09:06.14ID:CcNKGFP6a
>>724
新たに同等のデータを取るのに比べたら手軽じゃね?
現状の法律でも個人情報の開示や削除要請には応じる必要があるからその準備はできているはず

730デフォルトの名無しさん (ワッチョイ 9e12-2/1q)2018/10/09(火) 23:49:18.73ID:++HOLxfb0
分類するときにA,B,C,その他みたいに分類できるアルゴってないですか?
学習してない似たやつをどや顔で間違えて分類するのでなんとかしたい

731デフォルトの名無しさん (スプッッ Sd9e-qFZH)2018/10/10(水) 00:05:38.82ID:RHyHT8b9d
何回同じ話ししてるんだよw

one vs allかone vs restで検索
もしこれで分類できないならそもそも使っている特徴量的にA,B,Cとその他が区別できていないのだろうから特徴量の選定からやり直す

このネタ同じ人?

734デフォルトの名無しさん (ワッチョイ 528a-CKq4)2018/10/10(水) 22:38:14.62ID:3fNWNg5+0

735デフォルトの名無しさん (ワッチョイ 671e-XM+q)2018/10/10(水) 23:37:18.54ID:CBzJzHEZ0
文系PG抱えてる会社を食い物にしてる商売多すぎぃ

736デフォルトの名無しさん (スププ Sd70-rfKm)2018/10/10(水) 23:58:52.97ID:Z3r4I6WRd
>>735
文系PGを抱えてる会社を食い物にする商売ってどんなの?

737デフォルトの名無しさん (ワッチョイ df0e-4Hut)2018/10/11(木) 00:28:18.10ID:DY6agtqn0
PGに文系もくそもねぇwww

738デフォルトの名無しさん (ワッチョイ 278a-Zu1O)2018/10/11(木) 12:18:02.31ID:vTh9hgF00
土方PGで大儲け(過去形)

739デフォルトの名無しさん (ワッチョイ 7f08-w7rM)2018/10/11(木) 13:19:56.51ID:WWqvoXS50
AI(人工知能)で既存のホワイトカラーの仕事がなくなっていく一方、
孫正義が言うように「AIのエンジニア」の需要は増加する。

そこで画像生成について学習してるんだが、
DCGANは知ってたけどCycleGANというものがあることを知った。
CycleGANはかなり面白そうだったので、

自前で人工知能作ろうと思う。
GTX1080で3時間学習させたCycleGANがあったんだが、
男性のトーク動画を女性に変換しててすごいと思った。

これから購入するパソコンのスペックはGTX1080以上あればいいかな?

740デフォルトの名無しさん (スップ Sd7f-m/yn)2018/10/11(木) 14:28:42.63ID:jOTiaxUqd

741デフォルトの名無しさん (スップ Sd7f-m/yn)2018/10/11(木) 14:31:15.98ID:jOTiaxUqd
アトラクター?
ポアンカレ断面の不動点でも求めてんのかね

742デフォルトの名無しさん (ワッチョイ c78a-Zu1O)2018/10/11(木) 15:17:36.46ID:ZiWr81AM0
孫正義(笑)、Nスペ見るの止めた

743デフォルトの名無しさん (ワッチョイ df23-4Hut)2018/10/11(木) 15:46:57.01ID:jc3fQN7m0
これからの時代、人とのコミュニケーションを鍛えた方が生き残れると思うよ

744デフォルトの名無しさん (ワッチョイ a71e-JlWZ)2018/10/11(木) 16:57:44.01ID:HpbFK8lR0
小学生並みの感想

745デフォルトの名無しさん (ワッチョイ df5d-nqL9)2018/10/11(木) 20:26:53.34ID:CtLR6CRw0
メモリ8GBでやってたら訓練データメモリに載せるだけでPCカックカクでわろた
一応モデルとバッチはGPUのメモリが足りてるからいいけど訓練データ増えたらきついな

746デフォルトの名無しさん (エムゾネ FFff-PH46)2018/10/11(木) 21:10:29.30ID:1ID+fdJTF
tensorflowなら訓練データをtfrecordにして非同期読み込みすることで解決できるけど

もちろんTFRecord にしてもいいけど、
クラウドでやれば最低でも50GB くらいはメモリついてるぞ

748デフォルトの名無しさん (アウアウエー Sa9f-0CBk)2018/10/13(土) 01:09:59.51ID:I1iISO8ka
訓練データ全部メモリに乗せてやるなんてMNISTくらいでは

749デフォルトの名無しさん (スップ Sd7f-CyC/)2018/10/13(土) 02:24:00.24ID:jEm+mxu1d
前処理段階でメモリ食うことは良くある

GANを勉強してるんだけど識別者の方は基本的に偽物だと判別し続けるってことで合ってる?

751デフォルトの名無しさん (アウアウエー Sa9f-0CBk)2018/10/13(土) 10:31:45.96ID:I1iISO8ka
>>750
本物を本物と言えることも必要

>>751
じゃあどうやって識別者は学習していくの?
教師ありではないんだよね

753デフォルトの名無しさん (アウアウエー Sa9f-0CBk)2018/10/13(土) 12:02:40.35ID:I1iISO8ka
>>752
ジェネレータが生成したデータか本物のデータかってラベルはGANの枠組みとして付けられるよね
GAN自体は教師なしだけど、識別者はこのラベルを使って教師あり学習する

754デフォルトの名無しさん (ワッチョイ df9f-FjYh)2018/10/13(土) 12:44:21.13ID:Ttma0+8g0
識別側の学習には教師ラベルを使ってるってこと?
識別の学習では普通の分類NNのように本物の画像と正解ラベルを使ってそれらが本物であることを学習させていくってことか
じゃあ生成側の学習はどういうしくみ?

755デフォルトの名無しさん (ワッチョイ df9f-FjYh)2018/10/13(土) 12:46:04.58ID:Ttma0+8g0
>>753
安価つけ忘れた
ID変わったけど>>752です

756デフォルトの名無しさん (オッペケ Sr9b-0CBk)2018/10/13(土) 12:50:36.89ID:i0XDn4SOr
>>754
識別側はデータが本物なら1、偽物なら0を出力するように学習するので、生成側は自分が出力した画像に対して識別側に1を出力させるように学習する

>>750
偽物だと判別し続けるモデルに何の価値がある?何にも判別してないではないか?
言ってておかしいと思わないのか?

GCPのAutoMLを利用しようと思ったんですけど、プロジェクトを選んでSET UP NOW押すとCustomer bucket missingって出てセットアップ完了しないのですが、今ってAutoML使えないんですか?

自己解決
自分で "プロジェクト名-vcm"のバケット作ったら行けました
何故自動で作ってくれないのか…

CNNの分類による検出器の作り方ですが、
例えばドラレコの映像から人を検出したいとして、
例えば映像を適当な矩形でラスターして人か否かの2出力CNNにかける場合、
学習時にネガティブとして与える映像はどうすればよいですか?
人以外のあらゆる一般物体を集めてきてネガティブにすれば効果が高いのでしょうか?

761デフォルトの名無しさん (JP 0Hab-4Hut)2018/10/15(月) 17:26:36.70ID:pLFxHPPwH
>>760
それだと分類じゃなくて
YoloとかSSDとか検出器使ったほうがよくない?

762デフォルトの名無しさん (ワッチョイ e7c3-CQ5Q)2018/10/15(月) 17:33:34.17ID:DA9AnZKj0
自動運転ってyoloとかでオブジェクトを単体で視認したあとってif文とかでやってるのそれとも論理プログラミングとか?

763デフォルトの名無しさん (ワッチョイ 7f9f-PH46)2018/10/15(月) 17:55:37.84ID:slolOmKf0
強化学習

>>761
検出器を使っていない理由は画像全体にラベリングしたいからです。
それだとsegnetとかをファインチューニングしろ、と言われそうですが
ピクセル単位のラベル付けが困難なためです。
結局のところsegnetのようなものをCNN分類を矩形走査することで画像単位ラベルのデータセットのみで作ってみたいということです。

765デフォルトの名無しさん (ブーイモ MM0b-CQ5Q)2018/10/15(月) 18:19:52.50ID:9QRJdq2GM
>763
あーそうだよね。その存在が脳からドロップアウトしてたわ、ありがとう

766デフォルトの名無しさん (ワッチョイ df09-a1T9)2018/10/15(月) 20:07:31.69ID:E7SbL8Og0
BERTの成功とその方向性から垣間見える
脳構造の模倣における連続的時間情報の把握の重要性
俺が>>650で指摘している状態

>おそらくは完璧を求めると
>階層的にAttentionによる時間情報とポジション付与をしつつ、それらを考慮したCNNで畳み込み
>なおかつそれらすべての層を参照しながら、動的に再帰的処理する必要性がある
>これにGAN的な世界モデルによる強化学習手法を取り入れれば汎用AIができるだろう

これとBERTで使われている、transformerよりも更に多層化して各層の参照密度を増したAttentionとの間に
共通性を認識できる人がいれば、俺の言い分を理解してもらえるだろう

767デフォルトの名無しさん (ワッチョイ 7fd3-7IED)2018/10/15(月) 20:39:32.75ID:hN5zazbp0
深層学習の話ばっかりだなあ。

768デフォルトの名無しさん (ワッチョイ 07e0-SmB1)2018/10/15(月) 21:31:32.65ID:E6pr56BO0
 私たち日本人の、日本国憲法を改正しましょう。
総ム省の、『憲法改正國民投票法』、でググって
みてください。拡散も含め、お願い致します。

769デフォルトの名無しさん (スップ Sd7f-CyC/)2018/10/15(月) 23:56:03.72ID:9aG3IWOmd
>>767
じゃあ違うネタ出してみるとか

確率モデルのpythonライブラリは何使うのが良いかしら

770デフォルトの名無しさん (JP 0Hab-4Hut)2018/10/16(火) 10:26:37.31ID:EErsLIkGH
>>764
画像全体にラベリングってマルチラベリングしたいってこと?
yoloもssdもラベル作成は矩形単位だよ

>>770
例えば、
2cm四方の正方形の画像があった場合
その正方形を1cmの正方形で4分割して
分割した4枚それぞれの正方形の画像が人か人でないか分類したい、
ということです。

772デフォルトの名無しさん (JP 0Hab-4Hut)2018/10/16(火) 11:48:54.78ID:EErsLIkGH
>>771
その分割から分類までやってくれるのが
まさにyoloとかssdなんだけど
だめなの?

773デフォルトの名無しさん (ワッチョイ bf8a-Zu1O)2018/10/16(火) 15:38:43.59ID:QWtfESi60
そこんとこyoloしく

新着レスの表示
レスを投稿する