【統計分析】機械学習・データマイニング21

レス数が950を超えています。1000を超えると書き込みができなくなります。
2018/11/04(日) 14:34:36.02ID:W830XVm1a
機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング20
https://mevius.5ch.net/test/read.cgi/tech/1533635797/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
2019/01/05(土) 21:45:59.88ID:pBvTkhT0M
初子さんが現役ならブレイクスルーしそうな感じ
879デフォルトの名無しさん (トンモー MM8d-cPPE)
垢版 |
2019/01/05(土) 22:13:28.72ID:oxyPFcuMM
言語なんてのは自然発生したものなので
自然そのもの。
自然には矛盾はなく、ただただ複雑なだけ。
よって大量のデータで当てはめを
するしかないのですよ。

構文解析は例外だらけで
あまり役に立ちません。
2019/01/06(日) 00:45:33.12ID:SRAubW5L0
>>877
なるほどね。
2019/01/06(日) 01:05:33.13ID:SRAubW5L0
構文的には日本語のほうが遥かにファジーなのにAI的には格構造の貧弱な英語独特の曖昧さが問題なのか。
面白いっちゃ面白い。独仏は覚えてしまえばまぎれの少ない分英語より易しいとはよく言われたものだ。
882デフォルトの名無しさん (ワッチョイ f9b3-nLVr)
垢版 |
2019/01/06(日) 01:23:06.35ID:T+vTBvBg0
・形態素解析が楽
・話者が多い
・例外が少ない

これらを満たすのはスペイン語かな
883デフォルトの名無しさん (アウアウイー Sa45-P9Vx)
垢版 |
2019/01/06(日) 03:19:11.93ID:KoFEEgaia
>>879
将来的な方向性はわかっていての話ですよ
2019/01/06(日) 04:36:40.19ID:yXbHk54h0
変態素解析
885デフォルトの名無しさん (ワイーワ2 FF63-aDDJ)
垢版 |
2019/01/06(日) 11:39:48.56ID:RBr8Qah/F
Cとかは言語としてどうなん?
886デフォルトの名無しさん (ワッチョイ 11da-TgmH)
垢版 |
2019/01/06(日) 12:05:48.03ID:3oHTeufm0
>>885
どういう側面から聞いてます?
2019/01/06(日) 13:02:38.00ID:upyG96ASM
>>885
PythonでできることをC言語でやるなら何でもできる
888デフォルトの名無しさん (ワッチョイ 11da-TgmH)
垢版 |
2019/01/06(日) 13:04:41.35ID:3oHTeufm0
>>879
単純に技術側面だけをみるとそう考えがちなんですが
実際の適用場面では、まるきり新出の熟語などのワードを的確にとらえるには
ラーニング等の時間的負荷が大きく、その辺りをしっかりとしないと本格的な
商用適用ではそれでは不足というこを知っておくと良いかと思います。
889デフォルトの名無しさん (ワッチョイ 11da-TgmH)
垢版 |
2019/01/06(日) 13:15:56.57ID:3oHTeufm0
>>887
そういう話になっちゃうよね。
2019/01/06(日) 13:18:52.28ID:mLogrqRB0
スレの内容に向いているかといえば日本刀で薪割りする感じかw
言語としてはCが一番好きだけど、学習やマイニングはpythonとかRでやりたい。
2019/01/06(日) 20:51:20.87ID:P5pPVlOx0
I think that that that that that boy wrote is wrong.

あの少年が書いたあのthatは間違っていると思います。
2019/01/06(日) 21:12:19.79ID:r6TnJvb+0
>>891
Google翻訳すごいな。thatをたくさんくっつけても
スルーしてくれるんだ。

I think that that that boy wrote is wrong.
I think that that that that boy wrote is wrong.
I think that that that that that boy wrote is wrong.
あの少年が書いたのは間違っていると思います。

これでもほぼ同じ意味になってる。すごいや。
I think that that that that that that that that that boy wrote is wrong.
あの少年が書いたことは間違っていると思います。
2019/01/06(日) 21:39:37.45ID:5oySTXmOd
勝手に判断するなよという気もするが。
2019/01/06(日) 22:00:10.50ID:U7f3R3tEa
たまに二重否定を真逆に翻訳されたりするからな
2019/01/06(日) 23:07:40.94ID:roeGuIZk0
C言語で機械学習とか毛根のためにやめといた方がいいと思う
896デフォルトの名無しさん (ササクッテロラ Spc5-ZBCD)
垢版 |
2019/01/06(日) 23:15:06.69ID:sqll98Tep
>>895
C言語の機械学習ライブラリがあれば良いんじゃないの?
一々コンパイルしないといけないから面倒だろうけど
2019/01/06(日) 23:57:46.74ID:Lb2C/ZsE0
Cのレイヤーの低さは大変だよ。
メモリ管理とか機械学習と全然関係のない部分でハマるから。
PythonでもRでも使ってドメインに近い所だけで完結させるのがお得
2019/01/06(日) 23:59:14.45ID:Lb2C/ZsE0
ああでもIoTのモノ側で組込みCでやらねばいかん世界はあるのかなあ。
899デフォルトの名無しさん (ササクッテロラ Spc5-ZBCD)
垢版 |
2019/01/07(月) 00:06:00.55ID:z2xg/ZNbp
いわゆるエッジ側で学習の必要がなければ
FPGAとかで処理すれば良いと思うけど
学習するならソフトウェアが必要な気がする
エッジ側の処理能力とかメモリとか次第だろうけど
2019/01/07(月) 00:06:54.29ID:v3ry/0Vm0
>>896
Tensorflow for Cというのもあるけど誰が使うんだろう
C++ならまだ使う気もするけどライブラリと情報が揃うまでは使いたくない

mallocとかガーベッジコレクション今更頑張るのとか
csvファイル読み込むのに専用の関数を一から書くのとか
日付とか全部time型に直して処理するのとか
特定条件でマスクしたりソートしたりする場合全部実装するのとか
グラフ描画したい場合にGUIライブラリと連携させたり
一旦外部ファイルに落としてgnuplotとか使うのとか

考えれば考えるほど面倒くさくて髪が抜ける
901sage (ササクッテロラ Spc5-ZBCD)
垢版 |
2019/01/07(月) 00:13:20.73ID:Pkuny5Kkp
>>900
多分グラフ表示とかしないんじゃね?
人間が見るわけじゃなくて
センサとかからのデータ使って動的に学習する
人間はセンター側でまとめて管理する
2019/01/07(月) 00:19:09.21ID:ETLx0Gvna
エッジ側で学習させるとかいうのはほとんどの場合商品デザインが間違っている
普通は学習済みモデルを入れてエッジでは推論させるだけで事足りるだろう
903デフォルトの名無しさん (アウアウイー Sa45-P9Vx)
垢版 |
2019/01/07(月) 00:20:19.73ID:xRvtRT4Ya
機械学習アルゴリズムでとか、そういうのがCの利用場面ではなく
あくまで、システムに近い部分の役割で使うんでしょう。
米国の大規模なパッケージやDBの会社もJavaが出た時Java試したが
フロント系以外はみんなCにもどちゃったんで、役割分担でしょうね。
904sage (ササクッテロラ Spc5-ZBCD)
垢版 |
2019/01/07(月) 00:26:03.07ID:Pkuny5Kkp
強化学習だと現場で動くんじゃない?
データと結果を通信する方法もあるけど通信の費用や時間もかかるし
905sage (ササクッテロラ Spc5-ZBCD)
垢版 |
2019/01/07(月) 00:32:52.76ID:Pkuny5Kkp
あと逐次学習したらデータを貯めておく必要が無くなると思う
観測したら学習してすぐ捨ててしまえばいい
人間もいちいち紙にメモしないし
2019/01/07(月) 02:08:48.36ID:52D4hsE60
>>895
> C言語で機械学習とか毛根のためにやめといた方がいいと思う
毛根なんて死なないなんて〜言わないよ絶対〜
っというメロディが頭に浮かんだ
2019/01/07(月) 09:37:14.90ID:ifxxLBHVM
機械学習で毛根が元気になる成果はよはよ。
908デフォルトの名無しさん (アウアウウー Sa9d-ltid)
垢版 |
2019/01/08(火) 10:40:30.80ID:HzI9v9D6a
>>903
PythonからCへ戻るの?
2019/01/08(火) 10:58:40.00ID:utfQjZLSM
裸画像のデータセット、ご存知ないでしょうか
ヤフーで見つけたと思ったのですが、見失ってしまいました
ラベルにfrontsex,backsexなどがあったと思います
2019/01/08(火) 11:00:07.99ID:utfQjZLSM
すいません、データセットじゃなくてモデルファイルでした
2019/01/08(火) 11:46:23.66ID:TWf9/U6F0
ぼくも裸のモデルさんみたいれす(^q^)
2019/01/08(火) 11:59:06.42ID:AcbGA7EAM
画像検索すればいいのでは
単語わかってるやんw
2019/01/08(火) 13:32:54.84ID:FlStMH810
ヒント ウクライナ
2019/01/08(火) 16:14:35.00ID:utfQjZLSM
アダルトサイエンティストという言葉に出会いました
考えた人素晴らしい
2019/01/08(火) 16:24:42.71ID:Xx9Eymyv0
アダルトデータマイニングの勧め
https://www.slideshare.net/kensukemitsuzawa/ss-42196585
2019/01/08(火) 16:44:13.50ID:ve7iSAaX0
必要は発明の母なり
エロは普及の母なり
917デフォルトの名無しさん (アウウィフ FF9d-aDDJ)
垢版 |
2019/01/08(火) 16:51:24.00ID:GKZx39y6F
グロ認定
918デフォルトの名無しさん (ワッチョイ 6963-TgmH)
垢版 |
2019/01/08(火) 18:32:51.97ID:42LYtsDx0
>>908
あくまで基本部分にあたるシステム回りの話。
javaは遅くて使い物にならないもので。
2019/01/08(火) 20:33:34.69ID:tANukHNP0
パーの主張
2019/01/08(火) 22:57:08.36ID:JluhMs7T0
最近ベリー位相が面白す
2019/01/09(水) 13:50:45.65ID:fwf2O4Py0
WRNCHATって何?
あとGPUってどれ?
https://www.google.co.jp/amp/s/pc.watch.impress.co.jp/docs/news/event/1163/725/amp.index.html
> Cascade Lake-SPは、新たにVNNI(Vector Neural Network Instructions)と呼ばれるAVX512の拡張命令に対応し、従来世代よりもよりディープラーニング/マシンラーニングの処理が高速になる「Intel Deep Learning Boost」などの新機能が搭載されている。

> 説明のなかで、WRNCHATというソフトウェアを利用し、GPUよりもIntel Deep Learning Boostを有効にしたXeonプロセッサのほうがが5倍速いというデモを行なった。
922デフォルトの名無しさん (ワッチョイ 99ad-ikDe)
垢版 |
2019/01/09(水) 14:41:22.29ID:D/Qf9aRX0
>>920
物性の相というのは理論的にあんま面白くないと思うんだけど、
どこが面白いの?
2019/01/09(水) 14:59:23.13ID:gjS0lpl4M
あんた素粒子中華思想なん?
2019/01/09(水) 18:05:40.74ID:3qLWXVf40
qiitaに真面目な機械学習系記事書いたけど何も反応ない
ランキング入りしてるのがツイッターレベルの初心者の感想文ばっか。
いいね押し合いするクラスタみたいのが存在してるのかね。やる気無くした。
925デフォルトの名無しさん (ワッチョイ 917c-aDDJ)
垢版 |
2019/01/09(水) 18:50:11.47ID:+j6Vua/i0
>>924
+1
2019/01/09(水) 18:57:00.28ID:DKn8T9Mqa
同じorganizationの人同士でいいね押し合うからそういう所属の人がいいね数が多くなりがちという記事が以前qiitaに上がってたな
2019/01/09(水) 19:03:26.93ID:APiqAO8s0
>>924
つSEO対策
2019/01/09(水) 19:20:19.57ID:gjS0lpl4M
初心者が多いからしょうがないよ
2019/01/09(水) 19:39:14.69ID:/vKZJ9Qy0
>>922
応用性の高いところ
2019/01/09(水) 19:39:41.81ID:/vKZJ9Qy0
物性なんて俺も元々興味ないよ
2019/01/09(水) 19:57:05.44ID:gjS0lpl4M
ガーン悲しみの物性理論
932デフォルトの名無しさん (アウアウエー Sae3-tq1D)
垢版 |
2019/01/09(水) 20:10:05.57ID:MMvJKNDDa
>>924
いいねの数=内容の薄さ みたいな所あるからね
933デフォルトの名無しさん (アウアウイー Sa45-P9Vx)
垢版 |
2019/01/09(水) 20:56:02.56ID:x9x2NNCZa
>>932
あ〜。
的を得てるかもしれないな。
とはいえ、「いいね」が実際どういう人かわかれば、マーケットともいえる。

「どうでもいいね」もあるかもしれんけど。
2019/01/09(水) 21:07:43.61ID:oR1DIEqS0
>>924
ちゃんとした専門的な記事なら、そんなすぐチヤホヤされることにはならんでしょ 対象読者少ないし
中身のある記事だったら、むしろ1〜2年後でも実務者から参照される
2019/01/09(水) 22:09:46.08ID:QC8lFlUP0
ワイも最近1年前のバイオ系の記事参考にしてゴニョゴニョしてる。イイネは1桁だね
936デフォルトの名無しさん (アウアウエー Sa22-jz9p)
垢版 |
2019/01/10(木) 00:55:05.91ID:QYVZqKtda
Qiitaはストック数も公開してほしい
投稿者ですら普通には見れなくてAPIからしか参照できないのは意味不明
2019/01/10(木) 01:04:13.40ID:hRtu07os0
内輪受けの記事を書くことに何の意味があるのだろう
2019/01/10(木) 01:08:20.38ID:RPFawrIr0
>>924
どの会社がヤバイのか分かる
発注者目線では大変参考になる
2019/01/10(木) 01:44:42.64ID:qmqQcTeJp
>>924
ギフハブに英語ドキュメントで公開してみたらどう?
2019/01/10(木) 07:24:55.08ID:+1yO0jKY0
ここに貼ってもいいんやで
2019/01/10(木) 10:02:03.72ID:bljh2Rvj0
見たいね
2019/01/10(木) 10:20:47.54ID:PDZS8zDd0
お断りいたします
943デフォルトの名無しさん (トンモー MM71-T7+w)
垢版 |
2019/01/10(木) 12:14:20.56ID:s+S5b/hOM
>>924
どの記事か教えて!
イイネするよ!
944デフォルトの名無しさん (アウウィフ FF89-Iup+)
垢版 |
2019/01/10(木) 12:40:25.62ID:+qf2Eno1F
ここの人らがいいねしてもコンタミュ
2019/01/10(木) 13:01:18.39ID:aBTmYGywd
いいねだと刹那的な評価でインパクト重視になるしリピート率とか見てみたい
2019/01/10(木) 13:04:16.69ID:Ao3SM5X3M
タイトルに煽り成分入れればいいんよ
947sage (アウアウエー Sa22-PaIb)
垢版 |
2019/01/10(木) 14:10:01.29ID:41Nua0wya
>>945
記事に対するリピートだと
何回も見ないと判らないって事じゃね

判りやすく表現するのが良いところだと思う
2019/01/10(木) 18:24:54.51ID:laDnUVyX0
>>924
あるるw
2019/01/10(木) 21:23:50.80ID:Ka2EgZBfM
ユーザーを評価していいねの重み付けを変えたほうはいいかも
950デフォルトの名無しさん (ワッチョイ 55b3-uMLd)
垢版 |
2019/01/10(木) 21:30:40.25ID:Zurlj8Py0
お金払うと重みが増えるやつですね
2019/01/10(木) 22:04:09.34ID:laDnUVyX0
俺の経験上、いいねやRTを増やしたければ、偏差値30をターゲットにしないだめ

偏差値70をターゲットにすると、日本人の2%しかいないからね
2019/01/10(木) 22:13:13.08ID:+1yO0jKY0
偏差値60のワイは30向けの情報にイイネはしないぜー
953デフォルトの名無しさん (アウアウウー Sa89-LFg1)
垢版 |
2019/01/11(金) 06:08:50.10ID:FijiENsqa
>>951
偏差値30がプログラミングなんかやるか?
954デフォルトの名無しさん (ワッチョイ 55b3-uMLd)
垢版 |
2019/01/11(金) 06:36:29.70ID:xgRxAvYH0
日本ではアメリカみたいに低学歴にPythonと基本的な統計学を叩き込んで機械学習エンジニアに育てるみたいなの動き無いの?
2019/01/11(金) 08:11:12.90ID:wf8iyB5Va
java教え込んでIT土方にする組織は山ほどあるけど
2019/01/11(金) 09:10:19.33ID:x+Gsn1Q9M
機械学習の利用が人海戦術で進められるなら勝手に土方がやるんでない
2019/01/11(金) 09:12:26.10ID:x+Gsn1Q9M
ではデータセットを作りましょう。各自担当ターゲットを街で探して写真を撮ってきてください。最低でも1万枚
2019/01/11(金) 09:31:57.91ID:lFlKxvPB0
>>957
頭悪〜
その辺のドライブレコーダの動画を画像にすれば一瞬で終わる
2019/01/11(金) 09:35:54.28ID:x+Gsn1Q9M
八百屋でキュウリの写真を撮る班もあるんだ
2019/01/11(金) 09:36:46.50ID:x+Gsn1Q9M
野菜はドラレコの前通らないからね
2019/01/11(金) 09:50:58.18ID:P42UZhHca
何を扱いたいかにもよるけどドラレコ映像が必ずしも母集団を表せるとは限らないということ
2019/01/11(金) 09:55:59.07ID:iLd5zxVY0
裸は?
2019/01/11(金) 11:40:48.62ID:qaT7orPq0
>>954-956
大手企業は、Python 土方を、2千〜数千人雇う
2019/01/11(金) 12:08:49.66ID:x+Gsn1Q9M
ほうほう。それは食いっぱぐれなくて良いな
2019/01/11(金) 12:22:50.98ID:tgfZXoTaa
それ単に今の非正規労働者がPython使うようになるだけであって、直接雇うわけじゃないから給料も労働環境も雇用形態も変わらないよ
966デフォルトの名無しさん (ワッチョイ 55b3-uMLd)
垢版 |
2019/01/11(金) 16:15:03.28ID:xgRxAvYH0
機械学習のライブラリを使うだけなら数学とかの知識はあまり要らないから大卒雇っても賃金が高いだけで無駄、と思ってる企業がやってる事だから、賃金が安いままなのは当然
2019/01/11(金) 16:34:56.08ID:mbIv84yh0
将来、AIで結果を出せる企業はダイキンみたいに自社社員を育てて内製化していくと思う
2019/01/11(金) 17:04:48.59ID:qaT7orPq0
ダイキンのPython 土方は、社員で、2千人とか
2019/01/11(金) 17:18:48.91ID:lFlKxvPB0
>>967
よほど余裕が無いと厳しそう
基本的には外注になるんじゃないかなぁ

>>968
何か嫌な事でもあったのか?
2019/01/11(金) 17:27:24.03ID:1jMejBHz0
どのデータが必要かは内部の人でないと分からないんじゃない?
971デフォルトの名無しさん (アウアウイー Sa45-7QjO)
垢版 |
2019/01/11(金) 18:25:36.20ID:c0+U3zbma
ま、独自にAIアルゴリズムを作ってというフィールドは残るでしょうが
いま一生懸命自分でバンバンという人の多くは、その仕事はなくなるでしょうね。

独自に作って提供されても信用されないですよ。
いちいちアルゴリズム検証、その通りにできているか検証なんてやってられんもんね。

逆に残ったところは強いといえるかもね。
2019/01/11(金) 20:13:39.51ID:lFlKxvPB0
>>971
>いま一生懸命自分でバンバンという人の多くは、その仕事はなくなるでしょうね。
>独自に作って提供されても信用されないですよ。
>いちいちアルゴリズム検証、その通りにできているか検証なんてやってられんもんね。

これは今の営業事務そのもの
特に小売はインバウンドが大きすぎて指標が全く無く、検証も評価も何もできない状態なんだ
若干内部情報を好評すると、年間売上3%上昇すればいいところ、年間30%上がったり、10%下がったりしている
何の通例も憶測も通じない状態
2019/01/11(金) 20:36:55.01ID:x+Gsn1Q9M
カオス
974デフォルトの名無しさん (アウアウウー Sa89-LFg1)
垢版 |
2019/01/12(土) 04:12:30.59ID:V37M1mwUa
>>955
Julia 教え込んでIT土方にしたら。
2019/01/12(土) 10:32:48.09ID:0oMdY++l0
ここ実務者どれぐらいいるんかな
てかMLもしくはデータサイエンス従事者って国内ではまだまだ少ないような
流行ってるってんで本業の傍らに始める人も多そうだし
2019/01/12(土) 11:15:05.48ID:XdMPLSc00
アンケート
2019/01/12(土) 11:59:31.83ID:m8m8I3Dx0
ワイ、データ分析してるけど来年度は全く未定の派遣
2019/01/12(土) 14:00:02.90ID:0k4AMosy0
>>974

Python学んでもう新しいプログラミング言語覚えないと心に決めたが
Julia見て行列計算の簡便さとスピードの速さで早くも心が揺らいでいる
レス数が950を超えています。1000を超えると書き込みができなくなります。
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況