機械学習とデータマイニングについて何でもいいので語れ若人
※ワッチョイだよん
次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね
■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76
■前スレ
【統計分析】機械学習・データマイニング20
https://mevius.5ch.net/test/read.cgi/tech/1533635797/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
【統計分析】機械学習・データマイニング21
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん (アウアウウー Sa4f-YdG1)
2018/11/04(日) 14:34:36.02ID:W830XVm1a623デフォルトの名無しさん (ササクッテロレ Sp61-giVT)
2018/12/26(水) 19:24:45.31ID:Wyt7kWB4p >>620
与えられた課題に対して解決方法が知りたいなら、キーワードはモデリングかな
ある程度考え方の基礎がないとモデリングは難しい
勉強方法としてはKaggleとかの方法をそのまま別の課題に適用して、自分の引き出しを増やすことから始める
ある程度こなせるようになって、それでもまだ足りないなら原理を学ぶ必要があるので、統計学や時系列分析、ベイズモデリングのような入門書を読む
高度な数学まで勉強する必要はないけど、自分の言葉で説明できるくらいまでは理解と経験が必要
与えられた課題に対して解決方法が知りたいなら、キーワードはモデリングかな
ある程度考え方の基礎がないとモデリングは難しい
勉強方法としてはKaggleとかの方法をそのまま別の課題に適用して、自分の引き出しを増やすことから始める
ある程度こなせるようになって、それでもまだ足りないなら原理を学ぶ必要があるので、統計学や時系列分析、ベイズモデリングのような入門書を読む
高度な数学まで勉強する必要はないけど、自分の言葉で説明できるくらいまでは理解と経験が必要
624数おたサラリー (ワッチョイ 9b8a-CDCs)
2018/12/26(水) 19:32:09.33ID:vrpNaYHk0 汎用的なものがほしいですね
625数おたサラリー (ワッチョイ 9b8a-CDCs)
2018/12/26(水) 19:34:11.40ID:vrpNaYHk0 経験則なんて頼りたくないものです
626デフォルトの名無しさん (ワッチョイ f54e-Wbbf)
2018/12/26(水) 19:57:53.25ID:7Jt9vuQx0 kaggleで言うなら、機械学習のアルゴリズムより典型的なアルゴリズムの方が面白い
627デフォルトの名無しさん (ワッチョイ 7d8a-pJxC)
2018/12/26(水) 20:08:49.00ID:pnyjyGEy0 ババアw
628デフォルトの名無しさん (ワッチョイ 7d8a-pJxC)
2018/12/26(水) 20:09:17.18ID:pnyjyGEy0 都中
629デフォルトの名無しさん (ワッチョイ f54e-Wbbf)
2018/12/26(水) 20:13:26.23ID:7Jt9vuQx0 機械学習なんて正確性無いし、機会がやる必要ないよね
630デフォルトの名無しさん (ワッチョイ f54e-Wbbf)
2018/12/26(水) 20:13:39.30ID:7Jt9vuQx0 コンピュータがやる必要ない
631数おたサラリー (ワッチョイ 9b8a-CDCs)
2018/12/26(水) 21:35:05.18ID:vrpNaYHk0 他人に説明しやすければ、メリットはデカイんだけどな
632デフォルトの名無しさん (ワッチョイ 650d-uMV0)
2018/12/26(水) 21:38:58.22ID:THkVMJ6O0 よし、それじゃあパウル君にやらせよう
633デフォルトの名無しさん (ワッチョイ 3598-5YD5)
2018/12/26(水) 22:20:05.30ID:npb9YBls0634デフォルトの名無しさん (ワッチョイ 1b67-477d)
2018/12/26(水) 22:50:51.33ID:cRjPUG9L0 えっ
635デフォルトの名無しさん (ワッチョイ 3598-5YD5)
2018/12/26(水) 22:59:29.99ID:npb9YBls0 だってデータ集めて流せば終わりやし
636デフォルトの名無しさん (ワッチョイ c5b3-q1e7)
2018/12/26(水) 23:24:32.11ID:0GgU1Jru0 資格商法っぽい気はしたがG検定取ったわ
松尾研究室有名だし、転職のときに使えそうだから
松尾研究室有名だし、転職のときに使えそうだから
637デフォルトの名無しさん (ワッチョイ 239f-ZAfu)
2018/12/26(水) 23:55:32.97ID:eK314zDk0 E資格もそうだけど、未経験者が意欲をアピールするのには使えるよ
638デフォルトの名無しさん (ラクペッ MMdd-UqqQ)
2018/12/27(木) 00:24:45.59ID:Nnsyug5pM E検定は内容としては演習問題も含めてコーセラのディープラーニングコースに似てるかな
どうしても日本語で勉強したい人くらいしか需要無さそう
どうしても日本語で勉強したい人くらいしか需要無さそう
639デフォルトの名無しさん (ワッチョイ 9d4e-gJOZ)
2018/12/27(木) 00:51:11.66ID:FixG7szi0 機械学習とかつまんね
数学当たり前とか言ってるけど、他の情報科学だって必要だし、気取ってんじゃねえよ
数学当たり前とか言ってるけど、他の情報科学だって必要だし、気取ってんじゃねえよ
640デフォルトの名無しさん (ワッチョイ 718a-5EXd)
2018/12/27(木) 03:42:08.33ID:QbB+qhLj0 NG検定
641デフォルトの名無しさん (ワッチョイ ae76-NHNr)
2018/12/27(木) 07:43:58.41ID:Vfu+cRgY0 Neural Ordinary Differential Equationsってどうよ?
642デフォルトの名無しさん (ワッチョイ 5508-+vhK)
2018/12/27(木) 08:18:08.21ID:DfJTLRgn0643デフォルトの名無しさん (ワッチョイ 0517-nqzs)
2018/12/27(木) 08:42:27.41ID:dq01g3G80644デフォルトの名無しさん (ブーイモ MMde-frri)
2018/12/27(木) 09:36:37.47ID:X1PNXoe/M エロ系のデータセットってある?
モザイク消しを深層学習で出来るか試してみたい。
モザイク消しを深層学習で出来るか試してみたい。
645デフォルトの名無しさん (ワッチョイ 1a23-z75V)
2018/12/27(木) 14:18:15.80ID:77scK8dX0646デフォルトの名無しさん (ブーイモ MMa1-pOqM)
2018/12/27(木) 15:30:31.87ID:xSnO512RM まず、自動でモザイクかけるAIを作るのかw
647デフォルトの名無しさん (スップ Sdda-b4sB)
2018/12/27(木) 15:37:30.88ID:MGCavWend データセットが洋モノに偏ってあそこだけ洋っぽくなりそう
648デフォルトの名無しさん (ロソーン FFa1-Oscs)
2018/12/27(木) 16:19:30.67ID:X03Q+yv7F たしかにモザイクから復元するのに利用してる先行研究はあったはず
649デフォルトの名無しさん (ブーイモ MMde-frri)
2018/12/27(木) 16:29:25.56ID:X1PNXoe/M データセット無いかー。今考えてる方法は
1.洋物無修正動画をVottでマンコチンコトレーニングデータを作る。
2.yoloとかで自動モザイク装置作ってモザイクを入力としたDCGANでトレーニング
3.モザイク認識ソフトを作ってモザイクを切り抜き、切抜き箇所を2.にかけて出力を元画像と合成
GLCICは学習コストが凄そうなのでできれば回避したい。他に良いアイデアあったら教えて
1.洋物無修正動画をVottでマンコチンコトレーニングデータを作る。
2.yoloとかで自動モザイク装置作ってモザイクを入力としたDCGANでトレーニング
3.モザイク認識ソフトを作ってモザイクを切り抜き、切抜き箇所を2.にかけて出力を元画像と合成
GLCICは学習コストが凄そうなのでできれば回避したい。他に良いアイデアあったら教えて
650デフォルトの名無しさん (ワッチョイ 8908-M/0e)
2018/12/27(木) 16:41:22.77ID:1o6+PNFf0651デフォルトの名無しさん (ブーイモ MMde-frri)
2018/12/27(木) 17:01:13.23ID:X1PNXoe/M652デフォルトの名無しさん (ブーイモ MMde-frri)
2018/12/27(木) 17:11:03.99ID:X1PNXoe/M もしかして、マンコチンコトレーニングしなくても無修正画像をPartial Convolutionsでトレーニングすれば良いだけだったりするか?
光が見えてきた気がする
光が見えてきた気がする
653デフォルトの名無しさん (ワッチョイ 898a-5EXd)
2018/12/27(木) 17:21:24.33ID:2LS3jhIW0 マ●コが見えてきた気がする
654デフォルトの名無しさん (ワッチョイ b68a-YRCv)
2018/12/27(木) 17:24:50.95ID:RZ3xJ99q0 機械に頼るな
心の目で見るんだ
心の目で見るんだ
655デフォルトの名無しさん (ワッチョイ 2124-SF4R)
2018/12/27(木) 17:25:28.71ID:NCjIgPPe0656デフォルトの名無しさん (アウアウエー Sa02-rDRb)
2018/12/27(木) 17:35:48.30ID:T1w2lFK8a モザイクの復元か
657デフォルトの名無しさん (ブーイモ MMa1-pOqM)
2018/12/27(木) 17:42:47.76ID:xSnO512RM jpg時代のDejavu。エロは偉大なモチベだw
658デフォルトの名無しさん (ワッチョイ 6adc-Yicv)
2018/12/27(木) 21:44:15.51ID:2qDLgn1i0 GANだと出来上がるのは機械の想像物にならんか?
659デフォルトの名無しさん (ワッチョイ 0517-nqzs)
2018/12/27(木) 23:00:37.63ID:dq01g3G80660デフォルトの名無しさん (ワッチョイ 21d2-frri)
2018/12/27(木) 23:20:01.45ID:JdZkwcys0661デフォルトの名無しさん (ワッチョイ 95b3-rWdN)
2018/12/27(木) 23:57:27.63ID:XnkO3CS60662デフォルトの名無しさん (アウアウカー Sa4d-uRxS)
2018/12/28(金) 00:24:40.64ID:qU8TuhmSa 荒くなってはいるが黒塗りとかじゃないんだし完全に情報失われてるわけじゃないでしょ
663デフォルトの名無しさん (ワッチョイ 050d-sbeT)
2018/12/28(金) 03:00:23.93ID:OPkwyCCZ0 エロAIはよ
664デフォルトの名無しさん (ワッチョイ 7d98-4fyn)
2018/12/28(金) 03:23:06.50ID:Nt5XO8IQ0 本物そっくりのCGでもわいせつ物扱いになったし
そのうちモザイクも違法になるかもしれんね
画像から欠けた部分を補完する技術はあるし
どうせそう遠くない未来に、動画の欠けた部分を
補完する技術も一般的になるでしょ?
「欠けた部分」を「モザイクパターンになってる部分」に置き換えるのも
そう難しいことじゃないだろうし、モザイクの部分を本物そっくりのCGに
リアルタイムに置き換える。その時に色情報を使用すればよりリアルになる
結局の所補完した画像はCGなのだが、CGがわいせつ物扱いになるしなぁ
より本物に近いCGを作れるモザイクから違法になって、
最後には黒塗りもアウトになるかもな。
ん?その流れで行くと、水着や下着もアウトかもしれん
今の技術で裸に見える画像(水玉コラ)を補完したらどうなるんだろうか?
流石に誰かやってるよな?
そのうちモザイクも違法になるかもしれんね
画像から欠けた部分を補完する技術はあるし
どうせそう遠くない未来に、動画の欠けた部分を
補完する技術も一般的になるでしょ?
「欠けた部分」を「モザイクパターンになってる部分」に置き換えるのも
そう難しいことじゃないだろうし、モザイクの部分を本物そっくりのCGに
リアルタイムに置き換える。その時に色情報を使用すればよりリアルになる
結局の所補完した画像はCGなのだが、CGがわいせつ物扱いになるしなぁ
より本物に近いCGを作れるモザイクから違法になって、
最後には黒塗りもアウトになるかもな。
ん?その流れで行くと、水着や下着もアウトかもしれん
今の技術で裸に見える画像(水玉コラ)を補完したらどうなるんだろうか?
流石に誰かやってるよな?
665デフォルトの名無しさん (ワッチョイ 7d98-4fyn)
2018/12/28(金) 03:30:13.25ID:Nt5XO8IQ0 よりリアルな補完画像画像(よーするにコラだなw)が
誰でも簡単に作れるようになったら、誰でもわいせつ物が作れると同時に
逆にリベンジポルノ流出とかでもあれはコラだって
言い張れるようになるかもしれないな
写真(そのうち動画)がなんの証拠にもならない時代
誰でも簡単に作れるようになったら、誰でもわいせつ物が作れると同時に
逆にリベンジポルノ流出とかでもあれはコラだって
言い張れるようになるかもしれないな
写真(そのうち動画)がなんの証拠にもならない時代
666デフォルトの名無しさん (ワッチョイ 7d98-4fyn)
2018/12/28(金) 03:43:57.02ID:Nt5XO8IQ0 >>655
モザイクから元の顔に戻せるように見えてるけど
似顔絵捜査員とどちらがすごいんだろうかね
情報量自体は被害者の記憶を言葉にしたほうが少ないと思う
たったあれだけで、それなりの精度をだせるなら
訓練すればモザイクから元の顔を書く
モザイク捜査員が生まれるかもしれない!
モザイクから元の顔に戻せるように見えてるけど
似顔絵捜査員とどちらがすごいんだろうかね
情報量自体は被害者の記憶を言葉にしたほうが少ないと思う
たったあれだけで、それなりの精度をだせるなら
訓練すればモザイクから元の顔を書く
モザイク捜査員が生まれるかもしれない!
667デフォルトの名無しさん (アウアウイー Sa35-J3Xo)
2018/12/28(金) 07:24:47.70ID:jk6Z9ErNa668デフォルトの名無しさん (ワッチョイ 7d98-4fyn)
2018/12/28(金) 07:40:23.31ID:Nt5XO8IQ0 機械学習とはもう無関係なくなってきたが、モザイクどころかなにもないところから
コンピュータが人工知能で作り出した本物そっくりなCGはわいせつ物になるんだろうか?
コンピュータが人工知能で作り出した本物そっくりなCGはわいせつ物になるんだろうか?
669デフォルトの名無しさん (ワッチョイ 0db3-UlkU)
2018/12/28(金) 07:42:55.28ID:xbVEt4Kl0 猥褻物判別AIが判断しそう
670デフォルトの名無しさん (ワッチョイ 7d98-4fyn)
2018/12/28(金) 07:47:16.82ID:Nt5XO8IQ0 猥褻物判別AIは、生成されたCGに対して反応するわけだから
そのCGを生成するための元データ(=モザイク画像)を配布したら・・・?
未来もまだまだ、法律の抜け道と無理やりな法解釈のイタチごっこが続きそうだな
そのCGを生成するための元データ(=モザイク画像)を配布したら・・・?
未来もまだまだ、法律の抜け道と無理やりな法解釈のイタチごっこが続きそうだな
671デフォルトの名無しさん (アウアウイー Sa35-J3Xo)
2018/12/28(金) 08:24:37.00ID:jk6Z9ErNa672デフォルトの名無しさん (ワッチョイ 2124-SF4R)
2018/12/28(金) 09:52:24.03ID:Wn6dMni60673デフォルトの名無しさん (ワッチョイ 7a87-kXV/)
2018/12/28(金) 09:55:24.02ID:zXZ69/3K0 漫画だってわいせつ物になりえるんだからCGもものによってはなるでしょう。
674デフォルトの名無しさん (ワッチョイ 898a-5EXd)
2018/12/28(金) 10:45:47.06ID:CHUSo/SN0 わいせつの3要件
徒に性欲を刺激・興奮させること
普通人の正常な性的羞恥心を害すること
善良な性的道義観念に反すること
徒に性欲を刺激・興奮させること
普通人の正常な性的羞恥心を害すること
善良な性的道義観念に反すること
675デフォルトの名無しさん (ブーイモ MMa1-pOqM)
2018/12/28(金) 10:55:29.66ID:2zbjWBV3M ワイ動画見ただけじゃ興奮しないんだが。猥褻物なぞ無いキリ
676デフォルトの名無しさん (ワッチョイ 0523-+kHz)
2018/12/28(金) 11:28:32.32ID:dG0NGNXL0 児ポだって大多数の人は興奮しないから猥褻物に該当するかどうかみたいな議論あるしな
677デフォルトの名無しさん (ブーイモ MM99-frri)
2018/12/28(金) 11:35:03.92ID:3yiiX6rlM 猥褻物を描く機械じゃなくてモザイクを消す機械だから問題無いのでは?
消した画像を公開できる状態にしたら流石にダメだろうけど。
消した画像を公開できる状態にしたら流石にダメだろうけど。
678デフォルトの名無しさん (ラクペッ MMdd-+kHz)
2018/12/28(金) 11:40:38.32ID:Xa1MxpzYM Winnyやマイニングスクリプトで検挙される国ですし
679デフォルトの名無しさん (アウウィフ FF39-9xIt)
2018/12/28(金) 11:43:58.12ID:JLORl2/qF お前らエロの話題だと急に盛り上がるなw
680デフォルトの名無しさん (ワッチョイ 2124-SF4R)
2018/12/28(金) 12:06:41.23ID:Wn6dMni60 winnyは開発者が捕まるのがありえなかったよなー
マイニングスクリプトはモバイルはマジでやめて欲しいぞ。電池無くなる
PCで一部リソース使うぐらいならいいけど
マイニングスクリプトはモバイルはマジでやめて欲しいぞ。電池無くなる
PCで一部リソース使うぐらいならいいけど
681デフォルトの名無しさん (アウウィフ FF39-Oscs)
2018/12/28(金) 12:10:54.40ID:sicn3fFVF 名前忘れたけど反転系モザイク解除ソフトも捕まってたな
あれもソフト作る側には問題無いのに
あれもソフト作る側には問題無いのに
682デフォルトの名無しさん (アウアウカー Sa4d-uRxS)
2018/12/28(金) 12:13:34.81ID:srjLee/0a 一般的なセキュリティの紹介記事書いただけでウイルス公開したことにされて有罪食らう国だし
683デフォルトの名無しさん (ラクッペ MMa5-gJOZ)
2018/12/28(金) 12:25:06.68ID:1eV7vVnKM 海外の鯖に置けばいい
684デフォルトの名無しさん (ブーイモ MM99-frri)
2018/12/28(金) 12:40:59.01ID:3yiiX6rlM Winnyの件を考えると、モザイクを消す学習済みモデルを配布するだけで逮捕されそうだよね。
でもまあ学習前のソース配布は問題ない筈だから
(類似や同じネットワークモデルを利用した他のソフトも違法になるため)
学習用無修正画像を自前で用意できればなんとかなりそうではある。
でもまあ学習前のソース配布は問題ない筈だから
(類似や同じネットワークモデルを利用した他のソフトも違法になるため)
学習用無修正画像を自前で用意できればなんとかなりそうではある。
685デフォルトの名無しさん (ワッチョイ 0523-+kHz)
2018/12/28(金) 12:50:57.52ID:dG0NGNXL0 何らかのサービスを提供する場合は海外鯖に置いていても運営元が日本にあると判例上アウトだよね
686デフォルトの名無しさん (スフッ Sdfa-JcBT)
2018/12/28(金) 12:53:10.36ID:9fFTYmAmd アルファ碁の深層学習の仕組みについて
わかりやすく教えて下さい。
従来のようにモンテカルロ木探索も使われているのはわかりますが
深層学習をどう利用しているのか、いまいちよくわかりません。
深層学習は、画像認識ならわかりますが
これをどう囲碁に利用しているのかイメージが出来ません。
この点をわかりやすく教えて下さい。
よろしくお願いします。
わかりやすく教えて下さい。
従来のようにモンテカルロ木探索も使われているのはわかりますが
深層学習をどう利用しているのか、いまいちよくわかりません。
深層学習は、画像認識ならわかりますが
これをどう囲碁に利用しているのかイメージが出来ません。
この点をわかりやすく教えて下さい。
よろしくお願いします。
687デフォルトの名無しさん (JP 0H7e-AIgs)
2018/12/28(金) 13:46:50.39ID:yS/2qGZjH kernel読んでたらデータの標準化って出てきたんだけどこれやってもいいもんなんですかね
たとえば[1, 2, 3, 4, 5]だと[-2, -1, 0, -1, -2] / √2になるそうで
でもこれだと例えば最後の要素が最初の要素より4大きいっていう情報は欠落するじゃないですか
データの絶対値って重要じゃないんですかね
たとえば[1, 2, 3, 4, 5]だと[-2, -1, 0, -1, -2] / √2になるそうで
でもこれだと例えば最後の要素が最初の要素より4大きいっていう情報は欠落するじゃないですか
データの絶対値って重要じゃないんですかね
688デフォルトの名無しさん (アウウィフ FF39-Oscs)
2018/12/28(金) 14:05:02.53ID:sicn3fFVF 2乗して足すから問題ないって感じか
689デフォルトの名無しさん (ワッチョイ 2124-SF4R)
2018/12/28(金) 14:08:52.59ID:Wn6dMni60 >>685
DMMだかfc2の無修正エロサイトは日本語で紹介してるから日本扱いでautoって無茶な判例だった
DMMだかfc2の無修正エロサイトは日本語で紹介してるから日本扱いでautoって無茶な判例だった
690デフォルトの名無しさん (ワッチョイ 95b3-rWdN)
2018/12/28(金) 14:09:37.53ID:KXx45DYL0 それは標準化の仕方が間違ってる
[-2, -1, 0, 1, 2]/√2
が正しいから大小関係は残る
[-2, -1, 0, 1, 2]/√2
が正しいから大小関係は残る
691デフォルトの名無しさん (アウアウカー Sa4d-uRxS)
2018/12/28(金) 15:15:52.25ID:wGEI6iLia >>687
よくある標準化は学習データを平均=0、分散=1にしてその時に使った係数を残しておいてテストデータにも適用する
分散を変える以上は差の絶対値が変わるのは仕方ないが同じ係数をテストデータに使うのが重要で、結局同じ比率で調整されるので問題はない
よくある標準化は学習データを平均=0、分散=1にしてその時に使った係数を残しておいてテストデータにも適用する
分散を変える以上は差の絶対値が変わるのは仕方ないが同じ係数をテストデータに使うのが重要で、結局同じ比率で調整されるので問題はない
692デフォルトの名無しさん (ワッチョイ 7d98-4fyn)
2018/12/28(金) 15:43:33.87ID:Nt5XO8IQ0 >>680
> winnyは開発者が捕まるのがありえなかったよなー
winnyは開発者は、考え方が厨二だったからなぁ
この世界は腐っている。一度滅びなければいけない。
新世界を作るために、私は滅びの道具を作った。
だからな。
世界を良くする道具を作ればいいのに、
なぜか滅ぼす道具を作って「お前らあとは頑張れ」だもんなぁ。
あんなんだからWinnyは何も変えられなかった。
> winnyは開発者が捕まるのがありえなかったよなー
winnyは開発者は、考え方が厨二だったからなぁ
この世界は腐っている。一度滅びなければいけない。
新世界を作るために、私は滅びの道具を作った。
だからな。
世界を良くする道具を作ればいいのに、
なぜか滅ぼす道具を作って「お前らあとは頑張れ」だもんなぁ。
あんなんだからWinnyは何も変えられなかった。
693デフォルトの名無しさん (ワッチョイ 7d98-4fyn)
2018/12/28(金) 15:44:18.38ID:Nt5XO8IQ0 厨二っていうかサイコパスかな
694デフォルトの名無しさん (ブーイモ MMa1-pOqM)
2018/12/28(金) 16:06:37.31ID:2zbjWBV3M まともな用途向けだと流行らなかったりして
695デフォルトの名無しさん (ワッチョイ dad2-CP3A)
2018/12/28(金) 17:31:39.09ID:tfE2tijX0 生きてたら仮想通貨やってただろうな
まああれも結局マネロン用途だろうからまともではないか
まああれも結局マネロン用途だろうからまともではないか
696デフォルトの名無しさん (ブーイモ MMa1-pOqM)
2018/12/28(金) 17:38:25.10ID:2zbjWBV3M ソフトイーサはいいところ攻めてるような。捕まらないような持って行き方は色々あったろうに
697デフォルトの名無しさん (ワッチョイ 7d98-4fyn)
2018/12/28(金) 17:39:23.71ID:Nt5XO8IQ0 ソフトイーサは単なるVPNじゃん。OpenVPNと変わらない
698デフォルトの名無しさん (ワッチョイ 6adc-AIgs)
2018/12/28(金) 18:19:41.45ID:+dm45OvN0 このブログの人の勤め先ってNTTデータとかCTC?
http://biz-and-deep.hatenablog.com/entry/2018/03/01/001228
外資系じゃなそうだけど、
この頻度で新規AI案件を取ってきて回してる大企業って思い浮かばない
http://biz-and-deep.hatenablog.com/entry/2018/03/01/001228
外資系じゃなそうだけど、
この頻度で新規AI案件を取ってきて回してる大企業って思い浮かばない
699デフォルトの名無しさん (ワッチョイ 2124-SF4R)
2018/12/28(金) 18:29:01.65ID:Wn6dMni60700デフォルトの名無しさん (アウアウイー Sa35-J3Xo)
2018/12/28(金) 18:47:51.76ID:3Bc3qTdBa ここに書いてある中で、一つだけ賛成できないのは
データ(分析対象になるデータ)の件。
それこそ、生の形でデータを受取り分析者側で加工から
やることが私は必要だと思っている。
そもそも顧客のデータを信じるところから始めてはいけない。
今は、ネットのデータだったり、データが集まりやすいし
さらにデータベース化されているケースが多い。
それに甘んじたまま分析に入ろうとする人が多いのは
私は疑問。
データ(分析対象になるデータ)の件。
それこそ、生の形でデータを受取り分析者側で加工から
やることが私は必要だと思っている。
そもそも顧客のデータを信じるところから始めてはいけない。
今は、ネットのデータだったり、データが集まりやすいし
さらにデータベース化されているケースが多い。
それに甘んじたまま分析に入ろうとする人が多いのは
私は疑問。
701デフォルトの名無しさん (ワッチョイ 7d98-4fyn)
2018/12/28(金) 19:07:54.99ID:Nt5XO8IQ0 >>700
どれに対して言ってるのか知らないけど
機械学習はデータをコンピュータを使って高速に演算するものなんだから、
データが重要なのは当たり前だよ。
でも "機械学習" ではないけどね。俺が機械学習に興味が薄いのは
結局最後にはデータをどうするか?の話になってしまうのがわかってるから。
機械学習のアルゴリズムがーではなく、○○データを加えることで精度がー。とかいう流れになる
行き着く先は、データの売買ビジネスだよ。
今はデータが有るようで無いからね。
例えば売上データはあるが、あるのは売上データだけだ。コンビニとか
年齢層入力してる(してた?)が曖昧だし、ポイントカードで情報抜き取る必要があるが
全員抜き取れるわけじゃないし、別の店で買う場合もある(つまり売れるはずの商品がわからない)
精度をあげるためのデータがわかってる。だけどそれらを集めるには
他社と協力していろんなデータを集めて統合しなければいけない
個人情報の保護がある時点で難しいし、ライバル会社と協力なんかしないだろ?w
となると第三者のデータ売買会社からデータを買うことになる。
その始まりの姿がTポイントカードだろう
どれに対して言ってるのか知らないけど
機械学習はデータをコンピュータを使って高速に演算するものなんだから、
データが重要なのは当たり前だよ。
でも "機械学習" ではないけどね。俺が機械学習に興味が薄いのは
結局最後にはデータをどうするか?の話になってしまうのがわかってるから。
機械学習のアルゴリズムがーではなく、○○データを加えることで精度がー。とかいう流れになる
行き着く先は、データの売買ビジネスだよ。
今はデータが有るようで無いからね。
例えば売上データはあるが、あるのは売上データだけだ。コンビニとか
年齢層入力してる(してた?)が曖昧だし、ポイントカードで情報抜き取る必要があるが
全員抜き取れるわけじゃないし、別の店で買う場合もある(つまり売れるはずの商品がわからない)
精度をあげるためのデータがわかってる。だけどそれらを集めるには
他社と協力していろんなデータを集めて統合しなければいけない
個人情報の保護がある時点で難しいし、ライバル会社と協力なんかしないだろ?w
となると第三者のデータ売買会社からデータを買うことになる。
その始まりの姿がTポイントカードだろう
702デフォルトの名無しさん (ワッチョイ 7d98-4fyn)
2018/12/28(金) 19:13:51.37ID:Nt5XO8IQ0 >>700
> 今は、ネットのデータだったり、データが集まりやすいし
> さらにデータベース化されているケースが多い。
ぶっちゃけ無いよ。
データベースの用語風に言えば、今データベース化されてるのは
マスターデータ。機械学習で必要なのはトランザクションデータ
トランザクションデータはほとんどデータベース化されていない
せいぜい自社の過去のデータが、必要最小限だけ残ってる程度
大企業以外、統計的に役に立たない
(正確に言えば人間が予測した精度と大差ない)
> 今は、ネットのデータだったり、データが集まりやすいし
> さらにデータベース化されているケースが多い。
ぶっちゃけ無いよ。
データベースの用語風に言えば、今データベース化されてるのは
マスターデータ。機械学習で必要なのはトランザクションデータ
トランザクションデータはほとんどデータベース化されていない
せいぜい自社の過去のデータが、必要最小限だけ残ってる程度
大企業以外、統計的に役に立たない
(正確に言えば人間が予測した精度と大差ない)
703デフォルトの名無しさん (ワッチョイ 2124-SF4R)
2018/12/28(金) 19:17:04.43ID:Wn6dMni60 >年齢層入力
元コンビニバイトだけど、忙しいと全部「10-20代」を叩くのが当たり前。タバコと酒でエラー出るからな
忙し店は若者向けで入力してる可能性が高い、というか当たり前
元コンビニバイトだけど、忙しいと全部「10-20代」を叩くのが当たり前。タバコと酒でエラー出るからな
忙し店は若者向けで入力してる可能性が高い、というか当たり前
704デフォルトの名無しさん (アウアウイー Sa35-J3Xo)
2018/12/28(金) 19:22:49.32ID:3Bc3qTdBa705デフォルトの名無しさん (アウアウイー Sa35-J3Xo)
2018/12/28(金) 19:24:30.41ID:3Bc3qTdBa706デフォルトの名無しさん (ワッチョイ 7d98-4fyn)
2018/12/28(金) 19:26:13.36ID:Nt5XO8IQ0 >>703
そうそう。信用できる過去のデータは少ない。
そういう意味でも「今はデータが有るようで無い」
データが間違ってるんだから、そこから学習しても間違った答えになる
まあ結局は確率でしか答えが出ないんだから、
ある程度は正解するんだけどねw
で、精度をあげようとすると、データの質がーって話になって
正しいデータを入力するよう徹底してくださいとか、
修正できるなら修正してくださいとか(例えば明らかなタイポとかなら修正できる)
そういう話に行き着くので、つまらねぇなぁと
そうそう。信用できる過去のデータは少ない。
そういう意味でも「今はデータが有るようで無い」
データが間違ってるんだから、そこから学習しても間違った答えになる
まあ結局は確率でしか答えが出ないんだから、
ある程度は正解するんだけどねw
で、精度をあげようとすると、データの質がーって話になって
正しいデータを入力するよう徹底してくださいとか、
修正できるなら修正してくださいとか(例えば明らかなタイポとかなら修正できる)
そういう話に行き着くので、つまらねぇなぁと
707デフォルトの名無しさん (アウアウイー Sa35-J3Xo)
2018/12/28(金) 19:27:47.85ID:3Bc3qTdBa708デフォルトの名無しさん (アウアウイー Sa35-J3Xo)
2018/12/28(金) 19:31:46.09ID:3Bc3qTdBa709デフォルトの名無しさん (ワッチョイ b68a-YRCv)
2018/12/28(金) 19:37:46.16ID:X6YBhkn90 機械学習の有用性はラプラスの悪魔がだけが知っている
710デフォルトの名無しさん (ワッチョイ 7d98-4fyn)
2018/12/28(金) 19:41:12.28ID:Nt5XO8IQ0 >>708
分析までは良いんだよ
これぐらいの精度でした。おしまい。
という仕事なら
実際には精度の向上が求められ、人間がやるよりもいい結果を
得られるようにするのが目的。
仕事でやる場合は、これぐらいの精度でした。
もっと精度をあげるにはどうすればいいですか?
と話が続く
つまらないのはそこからだね
重要で大変だけど、人海戦術でつまらない作業の始まり
分析までは良いんだよ
これぐらいの精度でした。おしまい。
という仕事なら
実際には精度の向上が求められ、人間がやるよりもいい結果を
得られるようにするのが目的。
仕事でやる場合は、これぐらいの精度でした。
もっと精度をあげるにはどうすればいいですか?
と話が続く
つまらないのはそこからだね
重要で大変だけど、人海戦術でつまらない作業の始まり
711デフォルトの名無しさん (ワッチョイ 2124-SF4R)
2018/12/28(金) 19:45:06.57ID:Wn6dMni60 AIが本当に人類を超えるなら、そのゴミデータもaiも捨ててくれるんだけど
それはもう・・・
それはもう・・・
712デフォルトの名無しさん (アウアウイー Sa35-J3Xo)
2018/12/28(金) 20:02:54.72ID:3Bc3qTdBa713デフォルトの名無しさん (ワッチョイ 7d98-4fyn)
2018/12/28(金) 20:06:33.00ID:Nt5XO8IQ0 異常値を通常は起こりえない値として捨てるべきか、
それとも一回だけだが攻撃された形跡があるぞと重要視するか
それとも一回だけだが攻撃された形跡があるぞと重要視するか
714デフォルトの名無しさん (ワッチョイ 7d98-4fyn)
2018/12/28(金) 20:07:34.16ID:Nt5XO8IQ0715デフォルトの名無しさん (アウアウカー Sa4d-uRxS)
2018/12/28(金) 20:13:44.32ID:wGEI6iLia どういう層やユニットをどこに幾つ追加すれば更に精度が上がるか、どんな特徴量を追加すればいいか、これらを考慮しながらアップデートしていくのは機械学習の本質だろ
716デフォルトの名無しさん (ワッチョイ 7d98-4fyn)
2018/12/28(金) 20:19:14.42ID:Nt5XO8IQ0 データを変えないでそれをやるってこと?
パラメータ変えてやってみて、結果見るだけだし
特徴量っていうのは結局画像解析や音声解析の分野の話でしょう?
パラメータ変えてやってみて、結果見るだけだし
特徴量っていうのは結局画像解析や音声解析の分野の話でしょう?
717デフォルトの名無しさん (ワッチョイ 7d98-4fyn)
2018/12/28(金) 20:22:04.91ID:Nt5XO8IQ0 画像解析や音声解析の道具として機械学習を使うっていうのは別に良いんだよ?
本来やりたいのは「画像解析」であり「音声解析」だから
機械学習をテーマとして考えると、つまらない作業もしくは
関係ない作業の話になるなぁと
本来やりたいのは「画像解析」であり「音声解析」だから
機械学習をテーマとして考えると、つまらない作業もしくは
関係ない作業の話になるなぁと
718デフォルトの名無しさん (アウアウカー Sa4d-uRxS)
2018/12/28(金) 20:23:37.77ID:yqLTDq33a 機械学習の素養のある人が一定の根拠に基づいてパラメータ変えるのと、お手軽ソフトでポチポチやって理解した気になった素人が錬金術的にパラメータ変えて一喜一憂するのは天と地ほど違う
719デフォルトの名無しさん (ワッチョイ 2124-SF4R)
2018/12/28(金) 20:23:55.04ID:Wn6dMni60 >実際には精度の向上が求められ、人間がやるよりもいい結果を
>得られるようにするのが目的。
>仕事でやる場合は、これぐらいの精度でした。
→精度がクソ
if(バイト){
上司に報告;
} else {}
>もっと精度をあげるにはどうすればいいだろう?
>と話が続く
>得られるようにするのが目的。
>仕事でやる場合は、これぐらいの精度でした。
→精度がクソ
if(バイト){
上司に報告;
} else {}
>もっと精度をあげるにはどうすればいいだろう?
>と話が続く
720デフォルトの名無しさん (ワッチョイ 7d98-4fyn)
2018/12/28(金) 20:28:04.33ID:Nt5XO8IQ0 >>718
そうなると、機械学習というよりパラメータ職人だよねw
で、そういう職人いらずにするのがディープラーニングでしょ?
人間がやるよりもコンピュータの膨大な計算能力を使って
富豪的に処理したほうがいい。
そうなると、機械学習というよりパラメータ職人だよねw
で、そういう職人いらずにするのがディープラーニングでしょ?
人間がやるよりもコンピュータの膨大な計算能力を使って
富豪的に処理したほうがいい。
721デフォルトの名無しさん (ワッチョイ 2124-SF4R)
2018/12/28(金) 20:28:05.68ID:Wn6dMni60 あーすまん途中で書き込みtiちゃった
バイト君・外注の場合は上司に報告して終わり
社員は結果を出す必要がある
俺は当時、バイトで外注だったから「あーどうしよもないっすw最小二乗法でも-1であらゆるでーたと関係ないっす」と答えたな
小売はマジであらゆる変数と関係なかった(災害やセール日は除外。巨大な災害の日は店自体閉じた扱い)
びっくりした
バイト君・外注の場合は上司に報告して終わり
社員は結果を出す必要がある
俺は当時、バイトで外注だったから「あーどうしよもないっすw最小二乗法でも-1であらゆるでーたと関係ないっす」と答えたな
小売はマジであらゆる変数と関係なかった(災害やセール日は除外。巨大な災害の日は店自体閉じた扱い)
びっくりした
722デフォルトの名無しさん (ワッチョイ 2124-SF4R)
2018/12/28(金) 20:32:49.31ID:Wn6dMni60 >>720
>で、そういう職人いらずにするのがディープラーニングでしょ?
違う
データ職人いらずにするなら、今度は計算式職人になる
今の所は全く関係のないのないデータは除外しないと適切なデータは出せない
仮にデータをいじらずにだそうすると、莫大な費用がかかる。googleならだsルかもしれんが
仮に気温を含めた小売のデータを出すと、フィンランドでは常にマイナスになるだろうな
>で、そういう職人いらずにするのがディープラーニングでしょ?
違う
データ職人いらずにするなら、今度は計算式職人になる
今の所は全く関係のないのないデータは除外しないと適切なデータは出せない
仮にデータをいじらずにだそうすると、莫大な費用がかかる。googleならだsルかもしれんが
仮に気温を含めた小売のデータを出すと、フィンランドでは常にマイナスになるだろうな
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【サッカー】U-17日本代表、激闘PK戦制す 北朝鮮撃破で6大会ぶり8強入り U17W杯 [久太郎★]
- 「国民の憤りを引き起こした」中国側“高市首相発言の撤回改めて要求” [どどん★]
- 【インバウンド】中国からの“渡航自粛”…ツアー1000人分の直前キャンセル「キャンセル料は免除してくれ」 ことしいっぱいキャンセルに [1ゲットロボ★]
- 【芸能】日中関係悪化でエンタメ業界に大ダメージ… JO1の中国でのイベント中止、邦画は公開延期、STARTOアイドルへの影響も [冬月記者★]
- XやChatGPTで広範囲の通信障害 投稿や閲覧できず [蚤の市★]
- 【サッカー】日本代表、ボリビアに3発快勝 森保監督通算100試合目を飾る…鎌田、町野、中村がゴール [久太郎★]
- 【J SPORTS】FIFA U-17ワールドカップ ★10
- とらせん IPあり
- 巨専】
- こいせん 全レス転載禁止
- 【ATP】テニス総合実況スレ2025 Part 211【WTA】
- ネットでサッカー観戦◆2025-29
- Perfume・あ~ちゃんの結婚相手の一般男性、吉田カバンの社長と判明 [977261419]
- 地球から無限km先の場所ってどうなっているの?
- 日本、高市のお陰で破滅に近づくwwwwwwww
- 自民党議員「高市は先人が築き上げた日中関係を壊した。外務省が謝罪に言ってるが自分で責任を取れ」 [834922174]
- 🖐( -᷄ὢ)俺に挑むのはやめておけ……実力差がありすぎる
- 岡田克也「軽々しく存立危機事態とか言うべきじゃない」高市早苗「台湾で武力攻撃が発生したらどう考えても日本の存立危機事態」 [931948549]
