【統計分析】機械学習・データマイニング21
■ このスレッドは過去ログ倉庫に格納されています
機械学習とデータマイニングについて何でもいいので語れ若人
※ワッチョイだよん
次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね
■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76
■前スレ
【統計分析】機械学習・データマイニング20
https://mevius.5ch.net/test/read.cgi/tech/1533635797/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured >>700
どれに対して言ってるのか知らないけど
機械学習はデータをコンピュータを使って高速に演算するものなんだから、
データが重要なのは当たり前だよ。
でも "機械学習" ではないけどね。俺が機械学習に興味が薄いのは
結局最後にはデータをどうするか?の話になってしまうのがわかってるから。
機械学習のアルゴリズムがーではなく、○○データを加えることで精度がー。とかいう流れになる
行き着く先は、データの売買ビジネスだよ。
今はデータが有るようで無いからね。
例えば売上データはあるが、あるのは売上データだけだ。コンビニとか
年齢層入力してる(してた?)が曖昧だし、ポイントカードで情報抜き取る必要があるが
全員抜き取れるわけじゃないし、別の店で買う場合もある(つまり売れるはずの商品がわからない)
精度をあげるためのデータがわかってる。だけどそれらを集めるには
他社と協力していろんなデータを集めて統合しなければいけない
個人情報の保護がある時点で難しいし、ライバル会社と協力なんかしないだろ?w
となると第三者のデータ売買会社からデータを買うことになる。
その始まりの姿がTポイントカードだろう >>700
> 今は、ネットのデータだったり、データが集まりやすいし
> さらにデータベース化されているケースが多い。
ぶっちゃけ無いよ。
データベースの用語風に言えば、今データベース化されてるのは
マスターデータ。機械学習で必要なのはトランザクションデータ
トランザクションデータはほとんどデータベース化されていない
せいぜい自社の過去のデータが、必要最小限だけ残ってる程度
大企業以外、統計的に役に立たない
(正確に言えば人間が予測した精度と大差ない) >年齢層入力
元コンビニバイトだけど、忙しいと全部「10-20代」を叩くのが当たり前。タバコと酒でエラー出るからな
忙し店は若者向けで入力してる可能性が高い、というか当たり前 >>701
そういう話をしたわけじゃないんだよね。
残念ながらデータは足りなくてあたりまえだから。 >>703
そうですね。
その問題はもう25年前から出てきている話題 >>703
そうそう。信用できる過去のデータは少ない。
そういう意味でも「今はデータが有るようで無い」
データが間違ってるんだから、そこから学習しても間違った答えになる
まあ結局は確率でしか答えが出ないんだから、
ある程度は正解するんだけどねw
で、精度をあげようとすると、データの質がーって話になって
正しいデータを入力するよう徹底してくださいとか、
修正できるなら修正してくださいとか(例えば明らかなタイポとかなら修正できる)
そういう話に行き着くので、つまらねぇなぁと >>706
そうなんです。
それを知るためには、まず本当の生データを分析するところから
はじめないと、ならないんですよ。 >>702
>大企業以外、統計的に役に立たない
>(正確に言えば人間が予測した精度と大差ない)
それ自体の分析から始めないとあかんのよ
それを使えるようにしてゆくのが仕事 機械学習の有用性はラプラスの悪魔がだけが知っている >>708
分析までは良いんだよ
これぐらいの精度でした。おしまい。
という仕事なら
実際には精度の向上が求められ、人間がやるよりもいい結果を
得られるようにするのが目的。
仕事でやる場合は、これぐらいの精度でした。
もっと精度をあげるにはどうすればいいですか?
と話が続く
つまらないのはそこからだね
重要で大変だけど、人海戦術でつまらない作業の始まり AIが本当に人類を超えるなら、そのゴミデータもaiも捨ててくれるんだけど
それはもう・・・ >>710
>分析までは良いんだよ
>これぐらいの精度でした。おしまい。
>という仕事なら
な、あほな 異常値を通常は起こりえない値として捨てるべきか、
それとも一回だけだが攻撃された形跡があるぞと重要視するか >>712
だから、そこでおしまいじゃないから、
あとはつまらなくなるって言ってるんだよw
機械学習とは関係ない作業の始まり どういう層やユニットをどこに幾つ追加すれば更に精度が上がるか、どんな特徴量を追加すればいいか、これらを考慮しながらアップデートしていくのは機械学習の本質だろ データを変えないでそれをやるってこと?
パラメータ変えてやってみて、結果見るだけだし
特徴量っていうのは結局画像解析や音声解析の分野の話でしょう? 画像解析や音声解析の道具として機械学習を使うっていうのは別に良いんだよ?
本来やりたいのは「画像解析」であり「音声解析」だから
機械学習をテーマとして考えると、つまらない作業もしくは
関係ない作業の話になるなぁと 機械学習の素養のある人が一定の根拠に基づいてパラメータ変えるのと、お手軽ソフトでポチポチやって理解した気になった素人が錬金術的にパラメータ変えて一喜一憂するのは天と地ほど違う >実際には精度の向上が求められ、人間がやるよりもいい結果を
>得られるようにするのが目的。
>仕事でやる場合は、これぐらいの精度でした。
→精度がクソ
if(バイト){
上司に報告;
} else {}
>もっと精度をあげるにはどうすればいいだろう?
>と話が続く >>718
そうなると、機械学習というよりパラメータ職人だよねw
で、そういう職人いらずにするのがディープラーニングでしょ?
人間がやるよりもコンピュータの膨大な計算能力を使って
富豪的に処理したほうがいい。 あーすまん途中で書き込みtiちゃった
バイト君・外注の場合は上司に報告して終わり
社員は結果を出す必要がある
俺は当時、バイトで外注だったから「あーどうしよもないっすw最小二乗法でも-1であらゆるでーたと関係ないっす」と答えたな
小売はマジであらゆる変数と関係なかった(災害やセール日は除外。巨大な災害の日は店自体閉じた扱い)
びっくりした >>720
>で、そういう職人いらずにするのがディープラーニングでしょ?
違う
データ職人いらずにするなら、今度は計算式職人になる
今の所は全く関係のないのないデータは除外しないと適切なデータは出せない
仮にデータをいじらずにだそうすると、莫大な費用がかかる。googleならだsルかもしれんが
仮に気温を含めた小売のデータを出すと、フィンランドでは常にマイナスになるだろうな で、ディープラーニングにしろ、人間が膨大なパラメータの組み合わせで検証するにしろ
コンピュータの膨大な計算能力を使うにもコストがかかるわけで、
将来は(すでにそうなってるかもしれないけど)
目的を達成するために
機械学習のコスト VS 機械学習を使わないコスト
というコスト対決の話になって、割にあわないぁと判断されることが多くなると思う
機械学習しなくても(現状でも)それなりの精度で予測できてるわけなんだから >>722
おいおい、違うって言うなら、違う根拠を書いてくれよw >>724
君はディープラーニングには職人不要だと確信しているんだからその根拠となる論文・書籍・記事などを示せば反対意見など一切封じられると思うけど >>724
すまない、今売上に関する学習やってたのでd若干適当に書いた
用途によると結論付いた
教師ではなく報酬だろう
・報酬あり
alphagoがまさnそれ
報酬ないと適当に置くだけ
・教師なし
ヒューまりティクスを使うしかないが、
これにしてもやはり報酬と言い換えるしか無いだおる
mnistにしても教師か報酬アリでないとなんだかよくわからない結果になる >>682
むしろ犯罪として認定されうるほどのプログラミング技術に憧れます、私も逮捕されたい… >>692
>この世界は腐っている。一度滅びなければいけない。新世界を作るために、私は滅びの道具を作った。
名言にして至高ですね
世の流れに抗うことはほとんど不可能ですが、世の流れを加速させることはできる、偉人にしかできない技だとおもいますね >>693
サイコパスは自己の利害損得計算に優れているだけ(ただその手段は特異的ですが)で、それは winny とは違うでしょうね ディープラーニングが上手くいくのは、上手くいくまで人間が地道にチューニングしてるからだ、みたいな論文あったよね 動きがあるとモザイクがチラチラするだろ?
それを時間積分するモザイクによる低解像度化画像から
と高精細化できるだろうに
あほどもが。 QZは読まずにスルーしてるからいいけど
それ以外のも糞だったわ >>691
標準化するデータセットによって平均値や分散が変わる
から訓練データセットとテストデータセット
でも平均値や分散が変わるかも知れないけど
訓練データセットの平均値と分散を使って
テストデータやテストデータセットの標準化処理をする
って事だよね >>701
ビジネスに直結する以外のデータ活用用途もあるけどな >>706
データ採取にAIを使う様になる
無人店舗とか
顔判別→ID
年齢もAIで推定
今人間が推定しているのをAIで推定する
手間が省けるし漏れも少なくなるし分散も小さくなるだろう
同一企業グループ内なら顔IDで名寄せできる
他企業間とかの話になると法律とか変える必要があるかも >>710
つまらない作業をAIとかでやる様にすれば良い >>717
あなたが想定している機械学習のテーマは
SVMのアルゴリズムとか
BPとかAEとかの学習アルゴリズム
に限定したものなんじゃね
実際の社会に影響を及ぼすには
それだけだは不十分
昔のコンピュータだと今の機械学習も実現できていないだろう
将来量子コンピュータとか実現したら
また状況は変わるだろう
BPとか使わずに量子コンピュータで最適な結合荷重を見つけられるかも知れない >>720
ディープラーニングも結合荷重を見つける
パラメータ職人だけど
それを比較的精度よく見つけるアルゴリズムを
開発できた
他の機械学習のパラメータを特定するアルゴリズムを
あなたが開発すれば良いだけ >>723
そんな事は既に他のビジネス領域では起きている >>740
なるというより
もうやってることだからね
一般化していないだけで 今年も2つほど人の脳神経に新しい仕組みが発見されたから
そういうのをどんどん理論化して取り入れると
性能UPしそうだよね
脳の詳細な解明にはあと100年かかる
らしいから俺たちの5代あとぐらいには
面白い世界になっていそう。
ただ、それまで人類は生き残れないだろうと
言われてるけどね >>746
見たくないものから目を背け
不満をつぶやいて自分は何も提供できないんだな 幼稚園児が「あっちは●●電車〜」「こっちが●●線に乗り換え〜」とか
規制ラッシュの混雑の中で大声で叫んでてうるさかったが
親がえらいね〜ωωωとか普段からあやしてるんだろうな
誰でも知ってることを大声で喚いても恥ずかしいだけなんだが ブログに書きなよ
建設的な意見欲しいならそっちの方がいいだろ
そしてリンクを貼ってくれ AIつくってる会社は所詮はソフト屋だから儲からない
AI使ったサービスつくってる会社が儲かる >>757
サービス会社がAI作成する会社を買収しまくってるの知らないの >>758
AIを専門とする会社は基本的に、いくつか残るだけでお
あとはどこかに買収されてゆくでしょう。 こらん ビルの灯りが消えて行くよ
もうすぐ始発が走り出す
さよならだね
君の肩を叩くことも出来ないまま
ドアの前に 二つの段ボールケース
社員証は机の上 AIゆえに人は苦しまねばならぬ!
AIゆえに人は悲しまねばならぬ! 機械学習難しい
mnistすら何やってるか分からんから、
チュートリアル動かしてるだけだ。小学生でも出来るわ
みんなどうやって覚えてるの? ディープラーニングによる創作について。
多くの画像(顔など)データを入力→別人の顔を生成は出来るのに、なぜ
多くの文章データを入力→小説を創作は出来ないの? >>766
俺は自動生成のエロを作りたいんや・・・AIにより無限に湧き出るエロ動画が作りたいんや・・・! 時間軸がある表現が難しいから。
現状の機械学習だと反射に近い事しかできない。 >>767
機械学習は時系列を覚えるのが苦手
あと、商業的にもあまり美味しくないってのもある >>771
時系列に特化したLSTMもあったけど?
言語理解が出来たら、強いAIそのものだろうけど。 >>756
>>692
> この世界は腐っている。一度滅びなければいけない。
> 新世界を作るために、私は滅びの道具を作った。
気に食わないから、全部殺してしまえ。という発想 >>774
>気に食わないから、全部殺してしまえ
現実の社会のからくりは複雑で、「全部壊してしまえ」と思っても、なかなかそういうことは出来ないですね
むしろ、そういう「全部壊してしまえる」部分を見つけることができる、というのは、それだけで賞賛に値するでしょう
あなたは現時点での社会の脆弱な部分を指摘することができますか?そしてその脆弱性を突く方法を考案できますか?
人は「良心のためあえて指摘しない」と気取りますが、実は「指摘できない」ものなんです、無論私も今のところはそういう脆弱性を指摘できません
そういう意味で、私は「滅びの道具」を作ってしまうこと自体に稀有な着想を感じるのです >>775
何が言いたいんだ?
だからサイコパスだって言ってるんだが 殺そうと思って毒薬を作りました。
毒薬を作れる技術を評価してくださいってか? 世界が腐ってるなんて言ってたっけ?
デジタルデータに対する著作権の概念が限界に来てるから新しいシステムを試さないかって感じだったと思うけど × デジタルデータに対する著作権の概念が限界に来てるから新しいシステムを試さないか
○ デジタルデータに対する著作権の概念が限界に来てるから、古いシステムを壊す道具を作った。新しいシステムはお前らが作れ
だからサイコパスだと言ってる >>776-777
>何が言いたいんだ?
@そもそもあなたの持つサイコパスの定義が間違っており
Aあなたはあなたの主観的思考に沿わないものを一律にサイコパス呼ばわりしているだけ
だいたい「サイコパス」という最近考案された目新しい概念をチョイスすること自体が「考える前に安易に流れている」という感じを受けますね。
>殺そうと思って毒薬を作りました
実は毒薬を作るのは難しいんですよ、特に人に仕掛けて実際に殺人を行ってしま「える」ような実効性のある毒薬は
「毒薬を作りました」という概念を考えることは簡単でも、毒薬そのものを実際に作るのはかなり困難です
概念を頭の中で操作することは誰でもできますが、その概念に対応する実体を操作するのはかなり難しい
私はあなたの持つ概念と実体の乖離を指摘しているのです >>779
>○ デジタルデータに対する著作権の概念が限界に来てるから、古いシステムを壊す道具を作った。新しいシステムはお前らが作れ
>だからサイコパスだと言ってる
ちょっと論理が飛躍しているような気がします、どういう点を「サイコパス」だと考えたのでしょうか? サイコパス(精神病質者)に見られる共通した20の特徴
http://karapaia.com/archives/52164745.html
20.表面上は魅力的で口達者
19.自信満々でよく自慢話をする
18.刺激を求める
17.慢性的に平然と嘘をつく
16.ずる賢こく人を操ろうとする
15.良心の異常な欠如
14.他者に冷淡
13.自分の行動を制御できない
12.衝動的
11.無責任
10.自分の過ちを決して認めない
9.寄生的な生活
8.性関係の乱れ
7.幼少期からの異常行動
6.現実的な長期にわたる目標がない
5.行動に対する責任が全く取れない
4.短い結婚期間、多数の離婚歴
3.青年期の非行
2.仮釈放の取消
1.犯罪面での多才ぶり 6.現実的な長期にわたる目標がない
とか、まさに当たってるよな
新しい仕組みを考えずに、12.衝動的 に まず壊そう
他人が作った著作物に 9.寄生的な生活 して
5.行動に対する責任が全く取れない
15.良心の異常な欠如 して 16.ずる賢こく人を操ろうとする >>782
それらは反社会的な人間の誰にでもあてはまるようなことを漫然と並べているだけではないですか?
反社会的な人間の中でも特に「サイコパス」に当てはまること、「サイコパス」にしか当てはまらないこと、を指摘しているものを挙げてみてはいただけませんか? 反社会的な人間の誰にでもあてはまるようなことが
金子にも当てはまった >>784
なら、お前のサイコパスの定義言って、
それがどう当てはまらないのかを説明するべきだな >>783
>新しい仕組みを考えずに、12.衝動的 に まず壊そう
いや、だから、「壊すこと」自体が難しいといっているのです。大抵は、個人が破壊できるのは部分的な範囲にとどまり、広い範囲を壊すことは通常はできないものです
>他人が作った著作物に 9.寄生的な生活 して
それは winny の作者自身はしていないのでは?
>5.行動に対する責任が全く取れない
「責任」という概念を説明いただけませんか?
>15.良心の異常な欠如 して
日本語が変ですよ、もしかして韓半島の国籍をお持ちですか?
>16.ずる賢こく人を操ろうとする
操られてしまった人は、操る人に対して「ずる賢く」という感情を持つものです、単に「操られてしまった人よりも操った人の方が賢い」という事実を示しているにすぎません >>786
>なら、お前のサイコパスの定義言って、
>それがどう当てはまらないのかを説明するべきだな
私のサイコパスの定義は、
「サイコパス」という定義そのものが意味がなく、「サイコパス」に対応する(反社会的)人間像を持つ実体は、「サイコパス」がどのような定義であれ、存在しない
ですね >>787
> いや、だから、「壊すこと」自体が難しいといっているのです。
だから、難しいからなんだよ?
サリンだって作るのは難しいだろうが >>788
> 「サイコパス」という定義そのものが意味がなく、「サイコパス」に対応する(反社会的)人間像を持つ実体は、「サイコパス」がどのような定義であれ、存在しない
それは世間一般の定義ですか?
それともお前が考えたものですか?
世間一般の定義であれば、検索してから
あんたと同じことを言ってるサイトを見つけてきてください ID真っ赤にしてる奴はサイコパスってことで、
サイコパス以外の人は誰も異論ないと思う。 たった5回書き込んだだけでサイコパスになるのかよw よくわからんが、データマイニングでサイコパスは見つけられたのかね? 途中からNGにしてたけどまだやってたのか
年末とは言えさすがに非生産的過ぎるな LSTMって普通のディープラーニングに過去に行った予測結果も係数付きで追加するだけなのでそこまで高度なことできないぞ なんだって◆QZaw55cn4cのような災厄がこのスレに憑りついてしまったんだか・・・ >>799
他のスレが救われてるから、ここにくぎ付けにしとけよ。 ■ このスレッドは過去ログ倉庫に格納されています