【統計分析】機械学習・データマイニング21

■ このスレッドは過去ログ倉庫に格納されています
2018/11/04(日) 14:34:36.02ID:W830XVm1a
機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング20
https://mevius.5ch.net/test/read.cgi/tech/1533635797/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
2018/12/17(月) 12:19:08.02ID:H6jXePT1a
>>450
緑=人文・社会科学の統計学 (基礎統計学)
https://www.amazon.co.jp/dp/4130420666/
459デフォルトの名無しさん (アウアウウー Sa4f-LVLw)
垢版 |
2018/12/17(月) 12:26:23.19ID:DntVs6XQa
>>456
線形の方が微積より必要。マセマ でもやれ。
2018/12/17(月) 12:29:27.44ID:jkPJsDhgM
せやな
2018/12/17(月) 12:44:39.16ID:hc1NFolx0
機械学習に数学はいらない
2018/12/17(月) 12:55:59.01ID:TXQpWudsd
>>442
この路線なら久保先生の本じゃね?
2018/12/17(月) 14:35:16.79ID:oMwl1qsb0
>>458
なる
2018/12/17(月) 17:43:44.98ID:+K5AHMUC0
要らない派からマセマ派、ルベグまでやれ派と入り乱れてますな
465デフォルトの名無しさん (トンモー MM47-LhEE)
垢版 |
2018/12/17(月) 19:02:53.31ID:n7hAu6UxM
仕事でデータ分析するには
数学は、ほぼ必要ないね。
理論的なこと聞かれたのって2、3回しかないし。
ただ、その2、3回聞かれたときに
ビシッと答えたからずっと高い報酬貰えてるんだと思います。
2018/12/17(月) 19:07:51.30ID:jkPJsDhgM
詐欺師めw
467デフォルトの名無しさん (アウアウイー Sae3-igRr)
垢版 |
2018/12/17(月) 20:48:03.14ID:S6eGuv5Sa
>>464
たしかに、利用する対象や場面によって、
その重要性は変化するから
一概にどちらといえないでしょうね。
468デフォルトの名無しさん (ササクッテロラ Spa3-ISso)
垢版 |
2018/12/18(火) 12:12:42.85ID:yMWs9D+/p
>>447
excelからCSVやXMLに変換するのなんて簡単にできる事じゃね?
受け取る側は色んな人がいるんだからその中で多くの人が慣れ親しんでいる形式を採用するのは判る
2018/12/18(火) 12:30:35.86ID:drKI9kyXM
Excelはねえ。見た目優先で作ってセル結合やらされると、行によってカラムがズレたりして自動化出来なくなるのが問題なのよ
2018/12/18(火) 12:33:21.09ID:drKI9kyXM
Excelを一旦画像にしてAIで処理させた方がいいかもね?
2018/12/18(火) 13:30:36.51ID:gd3MIM5DH
初歩的な質問で申し訳ないんだけどディープラーニングの活性化関数って何のためにあるの?
階段関数は分かる。0か1の2択にしたいんだなって
でもシグモイドやrelu(の0以降)は連続値じゃないですか。なら入ってくる値をそのまま使っても何も問題ないんじゃないか
わざわざ関数に突っ込む意味あるんだろうかって思うんですよ
2018/12/18(火) 13:58:19.11ID:FHpOcoYR0
非線形関数に代入しないと線形変換しかできない。
行列の積と和を繰り返しても連立一次方程式にしかならんのだよ
473デフォルトの名無しさん (ササクッテロラ Spa3-ISso)
垢版 |
2018/12/18(火) 16:51:18.50ID:yMWs9D+/p
>>471
階段関数は微分できなくね?
2018/12/18(火) 18:11:56.54ID:gd3MIM5DH
>>472-473
お二方の言ってることが全く理解できないので自分にはまだ早いことは理解できた
前のノードの値×重みを足し合わせたものを次のノードに送るくらいの認識しかないので線形だの連立方程式だの微分だの何が関係あるのだろうレベル
2018/12/18(火) 20:35:01.16ID:O5jE7AS20
>>472
>行列の積と和を繰り返しても‥

んなこたーない
2018/12/18(火) 22:33:21.28ID:O5jE7AS20
あまり本を鵜呑みにしないように‥
2018/12/19(水) 00:11:12.23ID:R79UPiko0
このへんが簡易な本を嫌うべき理由ですね。
簡便な例でもって納得した気になってしまう。
478デフォルトの名無しさん (オイコラミネオ MM96-QeEb)
垢版 |
2018/12/19(水) 05:06:16.83ID:wdzWFhPYM
>>457 たとえば理論では絶対値たが、計算量を少なくするために二乗に換算すればいいとか、

私が知る範囲の機械学習では見ないけど、たとえば微分方程式を使うなら可能な限り級数展開で近似してから解く、とかじゃない?

機械学習の理論は東大、京大生に任せておくとし、私のようなヴァカは理論に突っ込んで課題をクリアするために、数学よりc++だな。pythonのほうがライブラリあって良さそうだが、産業用途では使えんからなあ。
479デフォルトの名無しさん (オイコラミネオ MM96-QeEb)
垢版 |
2018/12/19(水) 05:13:01.29ID:wdzWFhPYM
高専のとき選択でニューラルネットワークがあってなんに使うんやと寝てたけど、いま普通にデータ突っ込んでるな。

いまいち検出器の選定がわかんないんだよな。入力データのバラツキとかの性質と、検出器の数学的性質を結びつけれる脳みそがあれば、どういう前処理をすべきかわかるし、捗るんだろな
2018/12/19(水) 09:33:59.69ID:jzYXTi8Ia
pythonだと産業用途で使えないという理由が分からないけど学習結果の利用という意味なら例えばtensorflowは言語依存のない形式で学習済みモデルを保存できる
というか機械学習フレームワークで検索上位に出るようなものならほとんどは言語依存ないフォーマットで出せるはず
481デフォルトの名無しさん (ブーイモ MM6f-0Mu6)
垢版 |
2018/12/19(水) 15:02:50.58ID:XaHr9AnuM
〉〉480

たぶん研究段階ではpythonでいいけど、製品レベルに実装する場合は、
pythonではなくc等が主流だから、「製品開発者等では」ってことを
言っているんじゃない?
2018/12/19(水) 15:38:11.72ID:Ms5INDSEM
モデルと実データをライブラリに食わせるCコード書くだけでいいのちゃう
2018/12/19(水) 17:24:57.84ID:Q8dTxw3N0
pythonのコード隠蔽したいのかな。
pythonを暗号化してテキストでもっておき、C++のプログラム内でメモリ上に復号、python本体に送ってキックするってことはできるよ。
メモリを覗かれてしまったらアウトだけどね。
pythonを完全に隠蔽したいならクラウドじゃないとできないな。
484デフォルトの名無しさん (ササクッテロラ Spa3-ISso)
垢版 |
2018/12/19(水) 17:40:50.77ID:R/AQ8eSIp
>>481
製品って具体的にどんなものかによる
組込的なものだとそうかもしれないけど
サービス的なものだと関係ない
2018/12/19(水) 17:51:42.99ID:q2I72u2nM
基礎はやりたいフィールドのテッペンを概観でるレベルで十分
そこで大きな壁が何枚もある事を把握してから必要な基礎を潰していく
いつまでも基礎基礎いっててなかなか前に進まないのが日本教育のだめなとこだな
みんな染み付きすぎて疑問にもおもってない
2018/12/19(水) 17:56:47.59ID:Ms5INDSEM
テッペン見てから必要なだけ降りたらええちゅうことね
2018/12/19(水) 19:38:11.41ID:R79UPiko0
>>485
やりたいフィールドに限定すると、他分野の視点から見えるものも見えなくなる
2018/12/20(木) 00:43:50.31ID:0XNWkq3y0
基礎をおっかけるレベルでそれはねえ
2018/12/20(木) 09:56:46.33ID:zvkF6ECRM
AIを使いたいんじゃない。
茄子の仕分けがしたいのだ。みたいな
2018/12/20(木) 16:02:48.40ID:QKOzYWM00
夢無い記事
https://tech.nikkeibp.co.jp/atcl/nxt/column/18/00138/121400206/?P=1

日本で5人の実力を持ってても、名刺OCRしか活躍の場が無い。
(分析出来るデータが国内企業に無いし)
491デフォルトの名無しさん (ワッチョイ 4523-1q7i)
垢版 |
2018/12/20(木) 17:28:29.50ID:t8x/0UH10
おもろい
492デフォルトの名無しさん (JP 0H59-2M8b)
垢版 |
2018/12/20(木) 17:57:27.11ID:pvKHw8OKH
http://monoist.atmarkit.co.jp/mn/articles/1812/18/news047.html
なんじゃこりゃw
2018/12/20(木) 18:09:43.22ID:BNnLdzd/a
https://paiza.hatenablog.com/entry/2018/12/20/【1位はGo言語】機械学習人気でPython・R言語も上位に!
494デフォルトの名無しさん (オイコラミネオ MM2b-8XTe)
垢版 |
2018/12/20(木) 19:10:08.34ID:y/0AbOWxM
>>483 そこまでする人は最初からCで書くだろう。
2018/12/20(木) 20:26:07.75ID:1ZGu8YZza
>>490
名刺の会社にGrandmasterが2人もいるの不思議だよな
GAFAとかヤフーとかメルカリに行けばいいのにと思うけど、開発環境が魅力的なのかな
2018/12/20(木) 20:37:23.22ID:m4Vq6pGD0
>日本人の名刺なら「98%の精度で種別を判定できる」
う〜〜〜〜ん
2018/12/20(木) 21:55:38.26ID:1IWPdvcn0
メルカリ・・・
2018/12/20(木) 22:03:38.17ID:jyk8KY1l0
>>492
> 2020〜2021年ごろをめどに実用化を目指す。

はいはい
2018/12/20(木) 22:19:39.52ID:zmoosF6L0
>>490
この人なんで名刺に拘るんかな
他業種でも引く手あまたやないの
2018/12/20(木) 22:41:01.49ID:m4Vq6pGD0
>>499
給料良かったか、社風が合ってたんじゃないかな
勤務時間に勉強出来るとかじゃないとすぐに陳腐化してしまう
2018/12/20(木) 23:08:54.62ID:1IWPdvcn0
転職はIT系の中でさえあんまり遠くに行けないんだよ
2018/12/20(木) 23:15:30.51ID:1ZGu8YZza
kagglerはGrandmasterになると目標がなくなって弱くなる説ある
503デフォルトの名無しさん (スフッ Sd43-7yME)
垢版 |
2018/12/21(金) 15:13:58.46ID:e1hlpNlkd
ディープラーニングで、ロト6等の数字選択式宝くじの予想をやる場合
過去の全ての当選数字のデータを
多分、教師なし学習をさせて
AIが自動で特徴を見つけて、次回の当選数字を予測させることをやりたいのですが

どんなアルゴリズムが最適なのでしょうか?
画像認識の場合はCNNですが、次回の当選数字の予測は?
よろしくお願いします。
2018/12/21(金) 15:29:25.68ID:l+qby1fs0
誰がお前の金儲けの為に唯で教えてやるの?
2018/12/21(金) 16:11:56.79ID:rlKfPByqd
こんなところで聞かなくてもググればLSTM使って予測してるの出てくるだろ
2018/12/21(金) 16:37:41.59ID:25HIctKAd
毎年の当たりくじ番号なんて互いに相関が無く、独立な事象過ぎてやるだけ無駄と思われる。それでもやる?
2018/12/21(金) 18:03:46.75ID:vBAMI/Fmd
マジレスするとrand()が最強
DNNと同等の精度が出る
508デフォルトの名無しさん (トンモー MM59-Kky7)
垢版 |
2018/12/21(金) 19:24:26.23ID:y6GICHw5M
>>507
それな。
だが、本当に乱数なのかな?
乱数の検定が圧倒的に否定されたので、
誰かが当たり番号を操作してると思う。
2018/12/21(金) 19:35:05.93ID:NPvPpeG0M
ロトの乱数生成の手法調べたらいいのか
意外と運用適当だったりしそう
2018/12/21(金) 19:37:05.65ID:j1TAG+KNa
コインを投げろ
2018/12/21(金) 19:39:49.12ID:2OY83J+s0
サイコロを振れ
2018/12/21(金) 19:46:49.63ID:NPvPpeG0M
的を射よ
2018/12/21(金) 20:17:21.65ID:OZj4m0Cba
乱数生成が多少適当だったとしてもあからさまに偏ってるわけじゃないんだから儲け出すにはかなりの大金注ぎ込む必要があるだろうな
2018/12/21(金) 21:54:08.02ID:F/bqqAJb0
めるせんぬついすた
2018/12/21(金) 23:43:05.46ID:GxPHf02D0
乱数はパチ台チェックしたりで意外と扱い馴れてる可能性も
516デフォルトの名無しさん (ワッチョイ cb80-5YD5)
垢版 |
2018/12/22(土) 00:17:02.80ID:b6CiPLFa0
MT使うほどのことない
Xorshiftで十分
LCGsはウンコすぎてダメ
2018/12/22(土) 00:20:27.91ID:+oRc8mMV0
XBoxというゲーム機で出たカルドセプトというゲームがあってのう
疑似乱数の質が低すぎて専門学校生が作ってるんじゃないかと疑われたんじゃ
2018/12/22(土) 13:37:04.48ID:LRefV07O0
>>503
番号決めるのがサイコロ振ったりしてアナログな方法だったら
効果がないのでは?
コンピュータでやってるならチャンスあるかも
2018/12/22(土) 14:07:01.79ID:uNMjVS+90
的がぐるぐるまわっていてそこに矢を射る機械を複数並べて決める
2018/12/22(土) 14:19:23.79ID:m2vEGMHm0
つまり各桁無相関ですね。
521デフォルトの名無しさん (アウアウエー Sa13-Mh38)
垢版 |
2018/12/22(土) 14:20:11.61ID:6IjrjQDGa
ロト7はこんな機械で決めてるらしい
https://youtu.be/imk1s7fTkJo
2018/12/22(土) 15:32:27.47ID:nkaFCGe40
昔ロト3でなんとなならないか試行錯誤したなw
なんともならなかったけど。
2018/12/22(土) 15:40:11.13ID:6l606PfA0
123
431
137

だと「1」はジグザグに出やすく、
「3」はなだらかなカーブを描いて出現する、みたいな攻略(笑)方法があって
これを勉強する時間でバイトでもした方が良いな、と子供心に思ったものです
2018/12/22(土) 15:47:20.29ID:6ewcgBao0
抽選機は電動攪拌式遠心力型抽せん機(愛称:夢ロトくん)
2018/12/22(土) 16:04:24.04ID:3dnqkl28M
ここまでベルヌーイ施行というキーワードすらでない
526デフォルトの名無しさん (オッペケ Sr61-Mh38)
垢版 |
2018/12/22(土) 16:08:18.85ID:2yl5Ts6Jr
わざわざ名前出す程複雑な事象じゃないやろ
2018/12/22(土) 16:20:58.77ID:6l606PfA0
>>525
この流れギャグだと思ってたんだけどまさか真面目に考えてたの
2018/12/22(土) 16:24:41.65ID:iZWJkg8TF
釣れますか?
529デフォルトの名無しさん (アウアウイー Sae1-WTf5)
垢版 |
2018/12/22(土) 16:27:19.80ID:UGqq2IDwa
マルクス経済学の学者の世界では
Aという現象が出て戦争が起きた
よってAが出ると戦争がが起こる
だから、Aを出すことを阻害しよう
という単純な考えが通用するみたい

それで博士等取れる確率が高いようなので
チャレンジしてみたらどうでしょう。

確率が念頭にないのに、博士号の確率は念頭にある
面白い世界です。
2018/12/22(土) 16:34:17.76ID:6l606PfA0
相関関係と因果関係をしっかりとわけないといけないのだ
2018/12/22(土) 16:42:59.61ID:vmp1HvU+0
>>507
MTじゃダメなんですか?
532デフォルトの名無しさん (アウアウイー Sae1-WTf5)
垢版 |
2018/12/22(土) 17:36:26.63ID:UGqq2IDwa
>>530
確率考えてないから因果にもならない
想定するのは、単にそういうことがあったというだけ
2018/12/22(土) 22:23:41.20ID:WYzIfn2B0
帰納法のプログラムの世界では起こりえないだけど、
因果関係と相関関係の混同は世に溢れている
2018/12/23(日) 00:02:52.98ID:9403HeVX0
アホな経験則がまかり通っているだけ
535デフォルトの名無しさん (ワッチョイ 45d2-6UAB)
垢版 |
2018/12/23(日) 03:10:51.94ID:u8o0/RKX0
しかし、おまえらアフォだな
因果関係だと?
笑えるw
536デフォルトの名無しさん (アウアウイー Sae1-WTf5)
垢版 |
2018/12/23(日) 09:38:54.52ID:yKwr45+Fa
因果応報
2018/12/23(日) 09:40:34.21ID:E3mTjHLn0
親の因果が子に報い
2018/12/23(日) 11:39:39.64ID:6PHCJ2OS0
>>530
>相関関係と因果関係をしっかりとわけないといけないのだ

そして次のことも理解しておくことですね
「因果関係の認定は主観的判断であり独断や偏見と何一つ変わらないこと」
2018/12/23(日) 13:41:04.67ID:fn6gFrmZ0
親の資産を相続したQZが一言
2018/12/23(日) 14:37:30.80ID:lx3OhfOu0
>>538
>>534でよくね
2018/12/23(日) 17:14:58.35ID:q486kEO1a
因果関係を証明したければ実験すればいいだけのこと
原因だと推測したものを動かして予想通りに結果が変わればok
2018/12/23(日) 17:20:18.77ID:6PHCJ2OS0
>>541
相関関係を持つものについても、片方を動かせばもう片方も予想通りに動くのでは?
>>541 の方法では相関関係と因果関係を見分けられないのでは?
2018/12/23(日) 17:53:54.43ID:q486kEO1a
コンビニ店舗数と人口密度に正の相関があったとする
何もない山奥に強制的に大量の人間を住ませればその人口密度に応じてコンビニが入ってくるだろう
しかし逆に誰もいない状態で山奥にコンビニ建てまくったとしてもコンビニ数に応じた人間が引っ越してくると考えるのは不自然だろう
つまり上記が正しい場合、人口密度→コンビニの因果関係はあるが、コンビニ→人口密度の因果関係はない
Aを変えればそれに応じてBが変わる時に因果関係があると言い、必ずしも逆が成り立つとは限らない
544デフォルトの名無しさん (トンモー MM59-Kky7)
垢版 |
2018/12/23(日) 18:00:58.58ID:MBENqEE6M
実験できないようなことは
どうするんだ?
2018/12/23(日) 18:19:32.54ID:oZ5uabWQ0
プログラマの主張する実験(笑)
2018/12/23(日) 18:41:00.17ID:q486kEO1a
>>544
因果関係知りたいのは原因を操作することで結果変えたいからで、そもそも原因を操作できないものの因果関係を知っても使い道なく自己満足で終わり
2018/12/23(日) 19:29:51.55ID:6PHCJ2OS0
>>543
>何もない山奥に強制的に大量の人間を住ませればその人口密度に応じてコンビニが入ってくるだろう
>しかし逆に誰もいない状態で山奥にコンビニ建てまくったとしてもコンビニ数に応じた人間が引っ越してくると考えるのは不自然だろう

それは「人口密度が最初に設定される」→「設定された人口密度に従ってコンビニ密度が決定される」
という因果律を先に読み手に想定させた上で話をしている、という意味で、先入観に囚われた推論でしかないのでは?
二つの数量的関係に相関があるかないかは統計処理を行えば客観的に判断できるのですが、因果関係は、我々の主観的判断=独断と偏見、が含まれているのです
独断と偏見、といういいかたはちょっと極端に偏っているかもしれませんね、因果関係、というものの見方そのものが、人間が進化していく上で獲得した思考の「癖」なのでは?
548デフォルトの名無しさん (アウアウエー Sa13-bLl2)
垢版 |
2018/12/23(日) 20:45:50.47ID:F+c0HMsCa
>>542
目的の値をコントロールしたい
それを達成できるなら
本当の原因じゃなくても許容範囲じゃね
2018/12/23(日) 20:48:42.70ID:6PHCJ2OS0
>>548
なるほど
では因果律なるものは虚構であるのに、人はどうして因果律を設定して、例えば人を説得しようとする、とかするのでしょうか?
550デフォルトの名無しさん (アウアウエー Sa13-bLl2)
垢版 |
2018/12/23(日) 20:52:26.47ID:F+c0HMsCa
>>547
車のアクセル開度の値と速度の関係は?
時間的にアクセル→速度になっている
アクセル開度が原因で速度が結果じゃね

人間が車を押したら速度は上がるけどアクセル開度は変わらない
速度→アクセル開度の因果関係はない
551デフォルトの名無しさん (アウアウエー Sa13-bLl2)
垢版 |
2018/12/23(日) 20:53:33.88ID:F+c0HMsCa
>>549
虚構ってどんな定義?
因果律が虚構っていうのは本当?
552デフォルトの名無しさん (アウアウエー Sa13-Mh38)
垢版 |
2018/12/23(日) 21:23:34.18ID:4U3a3JXta
因果律は今の全ての科学の根底にある仮定なのにな
2018/12/23(日) 22:26:30.66ID:qkeRRc5P0
なんのスレだよ
2018/12/23(日) 22:28:48.65ID:6PHCJ2OS0
>>551
因果律は「人が因果があると決めたもの」という意味で虚構あるいは集団幻想みたいなものかと

>>550
「アクセルを踏むと車の速度が増大する」という因果律を人が決めたのではないですか?
客観的な言い方を追求するのならば「アクセルの踏み込み度合いと車の速度とは r = 1 の相関関係があります」にとどまるべきで、それ以上のいいかたは、主観が混じっているのです、純粋性を追求すれば、そういう結論になるかと
2018/12/23(日) 22:29:09.54ID:6PHCJ2OS0
>>552
そう、それはあくまでも仮定なんですよ
556デフォルトの名無しさん (アウアウエー Sa13-bLl2)
垢版 |
2018/12/23(日) 22:43:37.49ID:F+c0HMsCa
>>554
根底にあるのは自然科学の法則じゃね?
法則が複雑に影響しているけど
557デフォルトの名無しさん (アウアウエー Sa13-bLl2)
垢版 |
2018/12/23(日) 22:46:29.80ID:F+c0HMsCa
>>554
表現の方法は別でも可能だけど
法則自体は存在する
つまり因果関係と言っている
原因と結果の関係は存在する

あなたが言っているのは表現の方法が人間の決めた方法だ
と言っているだけ
表現の方法を変えても良いけど
他の人と知識を共有したり議論するのに不便
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況