X



【統計分析】機械学習・データマイニング22

■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん (ワッチョイ f6da-BIu2)
垢版 |
2019/01/13(日) 09:13:37.19ID:lpjZ4t830

機械学習とデータマイニングについて語れ若人


■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング21
https://mevius.5ch.net/test/read.cgi/tech/1541309676/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
0580デフォルトの名無しさん (ワッチョイ c61a-uR/r)
垢版 |
2019/02/12(火) 00:17:48.23ID:KEdHt1PV0
>>552
いや会社でIEとedgeでしかブラウザ使えないからchromeもvivaldiも使えなくて困ってるのよ
もちろん、家では普通にchromeで読めるんだけどな
0581デフォルトの名無しさん (ワッチョイ bdc3-EwQo)
垢版 |
2019/02/12(火) 03:51:36.70ID:xDY2FToe0
まず何から始めればいいの?
なんちゃって理系で高校で数VCまではやったけど数学がとても苦手
とりあえず機械学習のための数学って本は買った
0582デフォルトの名無しさん (ワッチョイ cd81-974c)
垢版 |
2019/02/12(火) 03:57:39.08ID:fVFjrefg0
大して知らない人だが。
大して数学しらなくてもできるとはおもうが。
数学部分はライブラリに内蔵されてて、ブラックボックスでも操作はできるかと。
環境設定と動かし方では。
0587デフォルトの名無しさん (ワッチョイ 7d35-OF6d)
垢版 |
2019/02/12(火) 11:27:35.35ID:sv506HrS0
>>581
まず

・目的
を決める
mnist(チュートリアル)なら後述のグラボは無しでも良い

・予算の設定
mnist以降はグラボ必須
既にあるならそれを使えば良いが、無ければ買う必要がある
無いままやろうとすると人生が終わるゾ

・環境設定
ある意味恐らく一番の難関
windows、mac、linux、それぞれで設定の仕方が違う
とにかく最初は聞きまくり検索しまくりながら気合でやりきる
0588デフォルトの名無しさん (ワッチョイ fe7c-DOJB)
垢版 |
2019/02/12(火) 12:07:54.70ID:8lolhehX0
>>586
2・3日前にテレビの報道特集みたいなやつでそれやってたわ
言葉の定義があいまいなまま中学校で教育してるのが問題らしい

教師のレベルが全国的に可笑しいんだろうな
0589デフォルトの名無しさん (スフッ Sd22-JzIx)
垢版 |
2019/02/12(火) 12:41:32.35ID:qHcaHQyCd
ディープラーニングには
CNNだのRNNだのLSTMだのオートエンコーダだのGANだの色んなアルゴリズムがありますけど

「よくこんなに色々と考えるよなあ」と感心しますよ!
考えた人、天才かよ!
0591デフォルトの名無しさん (スフッ Sd22-JzIx)
垢版 |
2019/02/12(火) 12:46:51.02ID:qHcaHQyCd
あと、深層学習には画像や文章生成といった
一種の創作も出来るみたいですけど、質問。

ディープラーニングは4コマ漫画が描けますか?

例えば『コボちゃん』のデータを大量に学習させて
絵と台詞を自動生成させて、面白い4コマ漫画を自動で生み出せますか?
0594デフォルトの名無しさん (エムゾネ FF22-snZf)
垢版 |
2019/02/12(火) 13:57:52.97ID:desEWZwSF
>>586
次の文を読みなさい。

アミラーゼという酵素はグルコースがつながってできたデンプンを分解するが、
同じグルコースからできていても、形が違うセルロースは分解できない。

この文脈において、以下の文中の空欄にあてはまる最も適当なものを選択肢のうちから1つ選びなさい。

 
 セルロースは(     )と形が違う。

(1)デンプン  (2)アミラーゼ  (3)グルコース (4)酵素



1-4 どれ選んでも正解やな
0596デフォルトの名無しさん (ワッチョイ 91da-DOJB)
垢版 |
2019/02/12(火) 14:03:26.51ID:ZBuOEwZt0
ああ江川紹子の記事なんか
0598デフォルトの名無しさん (スフッ Sd22-JzIx)
垢版 |
2019/02/12(火) 15:09:35.75ID:qHcaHQyCd
>>594
答えは(1)デンプン
0600デフォルトの名無しさん (ガックシ 0666-OF6d)
垢版 |
2019/02/12(火) 16:08:14.72ID:wnAg7pAj6
前提知識がなくても正しく答えられるだろうか

次の文を読みなさい。

?アルパド・イロというバルギルはプレブルがつながってできたニヤ鎮をアラーモンするが、
同じプレブルからできていても、Ap4Aが違う?ダヤナラ・トレスはアラーモンできない。

この文脈において、以下の文中の空欄にあてはまる最も適当なものを選択肢のうちから1つ選びなさい。

 
 ?ダヤナラ・トレスは(     )とAp4Aが違う。

(1)ニヤ鎮  (2)??ダヤナラ・トレス  (3)プレブル (4)バルギル
0603デフォルトの名無しさん (ワッチョイ 82d2-CHas)
垢版 |
2019/02/12(火) 17:00:50.66ID:puzbyhsI0
田中というコックさんは思いやりがつながってできたシチューを調理するが、
同じ思いやりからできていても、色が違うタンポポは調理できない。

この文脈において、以下の文中の空欄にあてはまる最も適当なものを選択肢のうちから1つ選びなさい。

タンポポは(     )と色が違う。

(1)シチュー (2)田中  (3)思いやり (4)コックさん

作ってみた
0604デフォルトの名無しさん (ワッチョイ fe7c-DOJB)
垢版 |
2019/02/12(火) 17:16:15.75ID:8lolhehX0
AIの立場だと簡単に解けるが
人間だと解けない問題もいっぱいあるな
0605デフォルトの名無しさん (ワッチョイ 91b3-tGKk)
垢版 |
2019/02/12(火) 18:04:27.41ID:eVAdyGJj0
「買い物にいって牛乳を1つ買ってきてちょうだい。卵があったら6つお願い!」
0608デフォルトの名無しさん (ササクッテロル Spd1-DOT6)
垢版 |
2019/02/12(火) 19:35:30.07ID:13UR+7Anp
>>607
603の問題で言うとどれを選択しても色が違うは真になるんじゃないかな?
0609デフォルトの名無しさん (ササクッテロル Spd1-DOT6)
垢版 |
2019/02/12(火) 19:36:47.44ID:13UR+7Anp
>>605
卵があったらの条件付きで
買う対象の分布を学習すれば解決するんじゃね?
卵なのか牛乳なのか
0610デフォルトの名無しさん (スッップ Sd22-OCrz)
垢版 |
2019/02/12(火) 19:54:17.42ID:UXGuSnHjd
>>608
「同じ思いやりからできていても」がそれ以降の文の対象を思いやりから出来てるものに制限する用法だから、
「(〇〇とは)色が違うタンポポ」の〇〇に田中や思いやりが来ることは無いんじゃないかな
0611デフォルトの名無しさん (ササクッテロル Spd1-DOT6)
垢版 |
2019/02/12(火) 20:46:29.82ID:13UR+7Anp
>>610
思いやりは思いやり1つから出来ているし
田中が思いやりから出来ているか出来ていないかはこの文章からだけでは特定できないんじゃね?
0613デフォルトの名無しさん (ササクッテロル Spd1-DOT6)
垢版 |
2019/02/12(火) 21:02:46.53ID:13UR+7Anp
>>612
無意識の先入観で可能性を限定しすぎている
0614デフォルトの名無しさん (スッップ Sd22-OCrz)
垢版 |
2019/02/12(火) 21:06:44.61ID:UXGuSnHjd
>>613
選択肢から一つ選ぶんだからよりソフトマックスかけるなりしてより蓋然性の高いものを選べよ
この場合文中で100%思いやりから出来てるって確定してるシチューがあるのに他の選択肢選ぶのは人間としておかしいわ
0615デフォルトの名無しさん (ササクッテロル Spd1-DOT6)
垢版 |
2019/02/12(火) 21:38:29.65ID:13UR+7Anp
>>614
蓋然性が高いってどうやって数値化できるの?
0617デフォルトの名無しさん (ササクッテロル Spd1-DOT6)
垢版 |
2019/02/12(火) 22:15:46.91ID:13UR+7Anp
AIにどうやって学習させるのか?ってこと
0619デフォルトの名無しさん (ワッチョイ 91b3-tGKk)
垢版 |
2019/02/13(水) 06:59:27.41ID:+IQ5YJc80
シチューを黄色くしたらタンポポになるみたいに学習しそう
0620デフォルトの名無しさん (アウアウイー Sa91-mimx)
垢版 |
2019/02/13(水) 10:41:56.81ID:mlPWZGhIa
>>618
その通りだと思うし、そもそも現在AIを使うときは
大きな枠組みがまず必要と思う。
そこではアプリオリな情報が必要となる。
制約があるからこそ最適化が成り立つところに似ている。

いかに周辺(仕事なら業務知識)が重要かってなところかな。
0621デフォルトの名無しさん (ワッチョイ d190-DOJB)
垢版 |
2019/02/13(水) 13:17:36.03ID:JbNR3gUc0
>>528
>Signateは賞金安いのに権利全部よこせとか、優秀だけど安く雇える学生だけ探してるわとか、
>訓練画像20枚な、とかで絶望しか感じないんだが
画像データ20枚ってのはファインチューニング用のコンペってこと?
0622デフォルトの名無しさん (ワッチョイ fe7c-DOJB)
垢版 |
2019/02/13(水) 15:15:56.51ID:Yg4iFXpY0
NHKの方から来ましたって言われて
集金詐欺に引っかかりそう
0626デフォルトの名無しさん (ワッチョイ 7d35-OF6d)
垢版 |
2019/02/13(水) 19:33:02.13ID:lFTFiggD0
>>624
DBなんてどうとでもなるぞ
joinが鬼門って程度だし、そもそも機械学習はDBほとんど使わない
セキュリティと速度求めだすと底なし沼だけどな

フロントとか更にどうでもいい
bootstrap辺りいれときゃそれっぽく見えるし、まぁ見えなくてもいい
0627デフォルトの名無しさん (ブーイモ MMcd-JcLr)
垢版 |
2019/02/13(水) 19:34:24.58ID:b7Wb7/cXM
モザイク消しを試している者だけど、なかなか良い物ができた。
機械学習にあんまり詳しくない俺でもここまでの画像ができるんだから、実はみんな隠れてやってるだろ。
俺はこの重み付きのモデルを公開する事は決してないが、ググれば初学者でもすぐに作れるようになる物なので、時間の問題だと思っている。
マジで悪用厳禁だ。これは気軽に使えるようにしちゃいけない。
0631デフォルトの名無しさん (ササクッテロ Spd1-wlBb)
垢版 |
2019/02/13(水) 20:55:21.41ID:ik/h3+HJp
顔分類面白そうと思ってスポーツ選手の画像集めてみたところまでは良いけどopenCVの正面顔のカスケード分類器?使ってみたら400枚で4枚しか顔の識別してくれなくて驚いた
一枚一枚トリミングするわけにも行かないしどういうやり方が良いんだろう
0636デフォルトの名無しさん (ワッチョイ 913c-gzwS)
垢版 |
2019/02/13(水) 21:44:53.16ID:AdED0sik0
>>624
組み込み、DB、ネットワーク、サーバ周りは出来るけどフロントエンドは無理だなぁ
最近のJavaScript事情に全然ついて行けてない
機械学習はそれなりにやれる方だと思うけど、確かにDBやサーバの知識はほとんど使ってない
スキルセットが違いすぎるから別物と考えた方が良いね
0637デフォルトの名無しさん (ササクッテロ Sp7b-nFDO)
垢版 |
2019/02/14(木) 09:53:57.10ID:n9WX//slp
>>631 です

>>633
>>634
その辺ひと通り検索して真似してみるんだけど処理の部分はopenCVで用意してる分類器使うからスクレイピングしてくる部分以外は大差ないように感じる…
記事で見かけるのはアイドルの写真が多いみたいだけど、グラビアとかも顔見せるのが仕事だから正面向いてるのが比較的多いのも良い点なのかもしれない(自分はスポーツ選手の画像でやって動きの中のものが多い)

あとはdetectMultiScaleのパラメータもminNeighborsとかminSizeとか指定出来るんだけど何も指定しない方が画像は多く検出してくれるからこの辺の設定も難しい上によく分からない…(検出出来るだけで顔以外のところがほとんど)
0638デフォルトの名無しさん (アウアウイー Sa7b-4ITP)
垢版 |
2019/02/14(木) 14:11:14.03ID:k9Mf52PPa
>>633
>一枚一枚トリミングする

AI使ったらどうだ?
(--;
0639デフォルトの名無しさん (ワッチョイ 5fad-wsIX)
垢版 |
2019/02/14(木) 22:33:20.70ID:EZq+SINA0
皆さんどんなグラボ積んでますか?
購入検討の参考にさせて頂きたく

私は今はGTX650という化石のようなグラボです… 
趣味でMLを楽しむくらいなので下記が今のところ購入対象です。

GTX 1050ti
GTX 1060
GTX 1660(今月発売予定の1060後継機)
0643デフォルトの名無しさん (ワッチョイ 2735-cT+3)
垢版 |
2019/02/15(金) 00:14:27.89ID:6HYCgI4B0
>>639
GTX1070
以前は750辺り使ってたけど、仕事前や就寝前に回し始める→帰ってきたら完成、
のサイクルが楽しかった
回してる間は勉強できるしな

今はすぐに終わってしまうから超大変
0646デフォルトの名無しさん (ワッチョイ ff82-C859)
垢版 |
2019/02/15(金) 07:13:05.59ID:BgDcDv3l0
DCGANって何の役に立つの?
0651デフォルトの名無しさん (アウアウウー Sa4b-4B+v)
垢版 |
2019/02/15(金) 11:51:10.65ID:31zBapMna
>>646
自動運転の研究で用いられている例
道路画像から特徴を抽出してセグメンテーションするネットワークを学習するときに
道路画像から抽出した特徴から道路画像が実画像かシミュレータ画像か判定するDiscriminator入れて、抽出器(Generator)をそのadversarial lossで学習すれば
実画像とシミュレータ画像の違いによらない本質的な特徴を抽出することができる
結果的にシミュレータでの学習をそのまま実世界で利用することができる
0652デフォルトの名無しさん (スフッ Sd7f-C859)
垢版 |
2019/02/15(金) 12:22:10.48ID:jnroZ227d
>>651
なるほど。
気になるのは本物と見分けがつかない実在しない人の顔や動物のリアルな画像生成ですけど
凄い技術だけど、人や動物の場合は何の役に立つの?

同時に恐ろしさも感じます。
写真に証拠能力はなくなるのかな?
0653デフォルトの名無しさん (オッペケ Sr7b-u7O1)
垢版 |
2019/02/15(金) 16:54:25.53ID:4Ov+2rLwr
>>650
モデルの上位互換なアルゴリズムってどういう事?
0662デフォルトの名無しさん (ワッチョイ 073c-ffjz)
垢版 |
2019/02/16(土) 10:27:52.64ID:Zd6VVlQB0
>>649
微分の記号が連なっているのが分かりにくいって人はいるよね
はっきり言って難しいことは一つも言っていない
三次元で絵にするとアホみたいに簡単
数式でより汎用性高く記述すると本質と違うところで分からない人が発生する
アルファベットをロシア語アルファベットにしたら理解に時間がかかるようなもん
0663デフォルトの名無しさん (ワッチョイ 877d-OU7K)
垢版 |
2019/02/16(土) 11:48:10.46ID:mrWW64c10
>>652
ドラマとか映画の制作で使われるようになるよ、
俳優使わずにだれでも簡単に生成できるようになる
0664デフォルトの名無しさん (ワッチョイ df02-OU7K)
垢版 |
2019/02/16(土) 13:13:29.89ID:xP0jDbtx0
GANの応用で幾つかのドラえもんの道具が現実化するな

映画の登場人物をしずちゃんやジャイアンに変える秘密道具があったはず
0668デフォルトの名無しさん (アウアウイー Sa7b-4ITP)
垢版 |
2019/02/16(土) 15:50:18.44ID:td/FtdQ5a
>>666  オーメンナンバーだな

>ベッキーが生成された・・・

納得。混ざり合うとそうなるかも
0670デフォルトの名無しさん (ワッチョイ c701-qPb/)
垢版 |
2019/02/16(土) 16:19:53.42ID:LE6s3aZE0
>>656
gcpでもawsでもまずはクラウドでいくらか使ってみるのが一番良いと思う。
変な環境依存問題で悩まされることも少ないし、本格的なグラボ買うくらいの金額使う前に
だいたい飽きたりもういいやってなるから。
0671デフォルトの名無しさん (ワッチョイ 8701-SuQg)
垢版 |
2019/02/16(土) 17:46:28.12ID:Thrmbpuf0
保存されたモデルを読み込むのにメッチャ時間がかかっちゃう
コマンドラインでの使用だったらinput関数で次々渡していけるのですが、モデル読み込み済みの別プロセスに引数わたして、標準出力を得るにはどうすればいいでしょうか
0674デフォルトの名無しさん (ワッチョイ 7f1f-yQ/S)
垢版 |
2019/02/16(土) 21:17:06.09ID:ZttmoLt30
GANで生成された画像がホントにデータセットにない画像なのかって気になるよね
たまたまミッキーマウスが生成されて著作権侵害で訴えられたりもあり得るのかなって
0676デフォルトの名無しさん (ササクッテロ Sp7b-sF/z)
垢版 |
2019/02/17(日) 08:27:46.53ID:QdZbpHpop
>>675
送信とかしなければ著作権を侵害していないと思うけどな

人間が著作物を見て学習するのは問題ないし

著作権のうちのどの権利を侵害している?
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況