【統計分析】機械学習・データマイニング27

■ このスレッドは過去ログ倉庫に格納されています
2020/01/13(月) 14:11:24.56ID:srY+iVUM0

機械学習とデータマイニングについて語れ若人

*機械学習に意識・知能は存在しません。
人の意識に触れたい方はスレ違いです

■前スレ
【統計分析】機械学習・データマイニング26
https://mevius.5ch.net/test/read.cgi/tech/1568506986/

スレ立ての際は、一行目冒頭に
!extend:on:vvvvvv:1000:512
をお願いします。
VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured
2020/01/13(月) 15:57:32.45ID:9nwjRJNrd
重複スレッドです。どちらを本スレにするか決めて下さい。

【統計分析】機械学習・データマイニング27
https://mevius.5ch.net/test/read.cgi/tech/1578890891/
2020/01/13(月) 20:12:05.67ID:xgMgrp400
という訳で、このスレッドを本スレとします。ご自由にお使い下さい。
2020/01/13(月) 22:23:51.29ID:V22NtS8V0
A群 年数とαが正比例
B群 年数と関係なくαは一定
C群 年数とαは反比例

ABCそれぞれを単回帰分析して回帰直線の傾きから、各群の違いを考察しようと思いました。
ACは決定係数0.8といい値なのですが、B群は決定係数がほぼ0となります。
回帰直線は当てはまっているように思うのですが、回帰分析で傾き0だと決定係数も0になるのでしょうか?
2020/01/14(火) 00:01:12.56ID:aLTEXrUV0
>>4
自己解決かな。
R2はモデルの当てはまりの良さではなくて、説明変数でどれだけ説明できているかを評価しているから傾き0ならR2も0になる
モデルの当てはまりなら
square mean error
などの評価指標を使うべき

間違ってたらご指摘お願いします。
6デフォルトの名無しさん (ワッチョイ fddd-fF6T [122.249.73.11])
垢版 |
2020/01/14(火) 10:29:55.29ID:jw1m7ykR0
transformerとcnnて同じもの?
2020/01/14(火) 13:25:53.31ID:NngjCG95r
大量の画像の全ての物体を全て自分の手でアノテーションするのは面倒だ

アノテーションアプリと物体検出プログラムで相互にデータをやり取りする
具体的には、それまでアノテーションして作ったpickleデータを元に新たな画像で物体検出して、
その検出領域をpascal voc型などで、しかもアノテーションアプリが出力するものと同じ形で出力し
それをアノテーションアプリが読み取って仮の物体検出領域を画像内に編集可能な状態で
描画する

VOTT3 とか出来たら、この機能が欲しいかなw
でもyoloやcenternetなどの側にも、まあ難しくはないけど領域データ出力部は作らないと

多分並レベルのプログラマなら半年専念したら出来るだろうけどやる奴はちょっといないか
8デフォルトの名無しさん (ワッチョイ 1501-GYCx [60.86.178.93])
垢版 |
2020/01/14(火) 20:48:25.42ID:1xiQQLQx0
>>6
違うものなので
Transformer-CNNなんてのやってるやつもいる。
9デフォルトの名無しさん (ワッチョイ 1501-GYCx [60.86.178.93])
垢版 |
2020/01/14(火) 20:54:58.12ID:1xiQQLQx0
>>4-5
R2(決定係数)は
くっそ複雑な式をたてて殴るとなんでかよろしくなってきてしまう、というハッキングが可能なので、
複雑なモデルをたてた場合は、自由度修正済み決定係数(adjusted coefficient of determination)を使おう。

>square mean error
いわゆるRMSE(平均平方二乗誤差)のことかMSE(平均二乗誤差)のことかわからんのだが、
前者は標準偏差的なサムシング、後者は分散くさいサムシング。
前者はおもたーい外れ値があると、ハッキングされてしまう。
10デフォルトの名無しさん (ワッチョイ 1501-GYCx [60.86.178.93])
垢版 |
2020/01/14(火) 20:56:33.96ID:1xiQQLQx0
>>7
VIPPERとかJ民を
うまいこと無料の作業員として使えるネタスレ(釣りスレ)立ててやらせればぁー? > アノテーション

以前どっかのサーバのパスワードを↑の原理で割ったやつがいたはず。
2020/01/14(火) 21:49:32.16ID:VLxG/qPMa
無料の作業員として人を使うのはgoogleとかが既にやってる
読みにくい字を読ませたり画像内のオブジェクトを探させたり
2020/01/15(水) 00:11:52.66ID:EHDdhj7F0
https://ainow.ai/2020/01/14/182639/

最適化じゃなくて重ね合わせたらいいのに…
2020/01/15(水) 08:02:35.42ID:DfHwFdpbr
>>11
クラウドワークスとかで出てるような奴かな
14デフォルトの名無しさん (アウアウウー Sa21-K7NQ [106.180.14.144])
垢版 |
2020/01/15(水) 17:09:34.82ID:YPapDUBga
>>11
reCAPCHAとかいうやつだっけ?
15デフォルトの名無しさん (アウアウウー Sa21-K7NQ [106.180.14.144])
垢版 |
2020/01/15(水) 17:10:54.19ID:YPapDUBga
スペルが違った
reCAPTCHA
16デフォルトの名無しさん (スフッ Sd03-IoeC [49.106.204.182])
垢版 |
2020/01/19(日) 10:47:24.95ID:myDdOTl3d
2020年、Deep Learningをはじめましょう!
https://www.youtube.com/watch?v=9gXB7MvyKJ8&;feature=share

もうこのツールで良いんじゃないか?
2020/01/21(火) 03:01:03.03ID:CAkK2Pk90
>>16
そんなWebベースのツールなんて誰も使わないと思う
ユーザーのこと何もわかってなさそう
18デフォルトの名無しさん (ワッチョイ eda5-ZA0I [222.0.172.133])
垢版 |
2020/01/21(火) 04:01:38.07ID:HbPqWHbL0
google colabでGPUに切り替えても大して早く動いた感がないんですが何か設定とか
必要なんでしょうか。とりあえずimportはnumpyだけの物とtensorflow2系を利用した
物の二種類のソースコードを用意、それでランタイムを切り替えたんですが
まずnumpyだけで作った奴の実行時間は
CPU:1099秒、GPU:943秒、TPU:1090秒
tensorflow2を使用した物は
CPU:95.1秒、 GPU:86.8秒、TPU:97.8秒
数回やったんですが結果はだいたいこんな感じでした。
一応デフォの2.1から2.0に変えたりしたのですが大した変化は起こらず、
device_lib.list_local_devices() でGPUを認識していることは確認済み
print(tf.config.experimental.list_physical_devices("GPU"))やら
print(x.tensorflow.python.client.device.endswith('GPU:0')) (xは適当なテンソル)
を試したらこちらもGPUは認識しているっぽいです、ただTPUの時はCPUしか
表示されなかったのでもしかしたら上手くいってないかもしれません。
やってることは中間100層の3層mnistでエポック数は20です、予想だとCPUとGPUで
2倍くらい実行時間が違うと踏んでいたので多分何か失敗していると思うのですが…。
19デフォルトの名無しさん (ワッチョイ cd54-yrkk [180.235.0.74])
垢版 |
2020/01/21(火) 05:08:01.44ID:CeoYFJWc0
モヤモヤする
2020/01/25(土) 09:51:49.23ID:vCW2boQ60
https://jp.techcrunch.com/2020/01/24/2020-01-23-googles-dataset-search-comes-out-of-beta/
21デフォルトの名無しさん (ワッチョイ c552-/KBK [118.243.199.173])
垢版 |
2020/01/25(土) 10:04:24.49ID:gws7pYPA0
aiの民主化

日本は遅れてるなー
せいぜい翻訳バンクくらい。。。
誰でも使える訳じゃないしな
22デフォルトの名無しさん (ワッチョイ f501-FkkX [126.242.217.97])
垢版 |
2020/01/25(土) 11:07:06.72ID:cxLY0DeL0
日本の法律にはフェアユースの概念が無いので、日本人が関わった時点で、ライセンス問題が自動的に付随する。
ICUプロジェクトは日本人を排除することでライセンスをクリーンに保っている。。
23デフォルトの名無しさん (ワッチョイ c552-/KBK [118.243.199.173])
垢版 |
2020/01/25(土) 11:17:22.21ID:gws7pYPA0
閉鎖的
24デフォルトの名無しさん (ワッチョイ f501-ajuj [126.66.165.217])
垢版 |
2020/01/25(土) 17:27:05.16ID:jLXMv9zL0
tidymodels の時代はやってくるのか?
2020/01/26(日) 13:11:56.12ID:BKKks8j/0
>>18
微妙なところ。
使ってるモデル、データの規模も小さいからGPUもTPUも大して生かせないってのはありそう。
データをimagenet、モデルをresnet50くらいにして実験した方が効果はわかりやすいと思う。
26デフォルトの名無しさん (ワッチョイ 25da-Y2bj [60.47.95.202])
垢版 |
2020/01/26(日) 15:02:08.11ID:iSSRn4si0
>>24
使ってないなあ。レシピとかジュースとか逆にイメージし辛いんだよ
27デフォルトの名無しさん (ワッチョイ f501-ajuj [126.66.165.217])
垢版 |
2020/01/26(日) 17:09:16.46ID:rnJ+wwZr0
Juiceとbakeは名前を変えた方がいいよな
28デフォルトの名無しさん (ワッチョイ f501-FkkX [126.242.217.97])
垢版 |
2020/01/26(日) 17:20:59.04ID:Yuet6lAk0
Pythonが900秒使ってたとしたら、倍速くなってるのでは。
29デフォルトの名無しさん (ワッチョイ 9bbb-FkkX [103.2.249.212])
垢版 |
2020/01/28(火) 02:58:37.77ID:AHUMZ1ov0
QiitaでCourseraのMLの内容丸パクリして日本語化した記事を
中学生が投稿してて笑った
出典も明確にせず図の使い方や解説までほぼ全パク
コメントでやんわり指摘してる人が一人いたけど無視
それでトレンド乗るくらいいいねされてて草

しかし中学生は黒歴史としても、いいねしてる大人側も大人側だろ
中学生とは言わずとも高校数学レベルで理解できるんだからやりゃいいのにな
やってたらあの完全丸パクリ記事にいいねはできないわ
CourseraのML終えたらG検定の7割くらいを終えたような物だから
あとテキスト買ってCNNやRNNみたいなのを覚えればG検定も楽勝だろうし
上流になってても知ってるべきことだからやって損はない
30デフォルトの名無しさん (ワッチョイ 9554-/KBK [180.235.0.74])
垢版 |
2020/01/28(火) 04:18:29.40ID:C8Byh5hm0
きいたは99%がごみ
31デフォルトの名無しさん (ワッチョイ f501-ajuj [126.66.165.217])
垢版 |
2020/01/28(火) 07:36:15.40ID:jb5BRPLw0
記事のレベルが正規分布を満たすとしたら、
皆さんのレベルでは99%がゴミでしょう。
32デフォルトの名無しさん (アウアウウー Sa29-zXgt [106.154.136.64])
垢版 |
2020/01/28(火) 07:46:13.79ID:JI6Ga278a
再帰と循環参照の記事はゴミだった
キータでやる内容じゃ無いな
33デフォルトの名無しさん (ワッチョイ a5ad-FkkX [124.144.197.178])
垢版 |
2020/01/28(火) 13:27:00.98ID:RbU9nI6E0
きいたをみてPythonと機械学習の勉強してますけど
なんか中途半端な記事ばかりのように思うのですが、
無料だからしょうがないんでしょうね。

きいたは本当に断片しかないんですよね。
有料のところを受講しないとダメですかね?
34デフォルトの名無しさん (アウウィフ FF29-FkkX [106.171.75.238])
垢版 |
2020/01/28(火) 13:33:08.38ID:ijxMtirOF
そうでもない
35デフォルトの名無しさん (ワントンキン MMb9-/KBK [210.132.39.19])
垢版 |
2020/01/28(火) 15:08:24.09ID:4HuXe2R7M
そうです
2020/01/28(火) 15:10:00.00ID:hS3FcbytM
本でええやん
2020/01/28(火) 15:37:23.64ID:f5VZ0BtE0
>トレンド乗るくらいいいねされてて草
qiitaはいいねクラスタみたいのがあるらしい
はてな民が悪習もちこんでる
2020/01/28(火) 15:38:00.60ID:f5VZ0BtE0
プログラムの情報って本来、紙とは相性悪いよなぁ
2020/01/28(火) 16:16:01.00ID:TJfGGUWo0
パクリ記事見たけどこれはこれであり
日本語でこういうまともな記事がほぼ存在しないことが問題
やる場所を間違えた感
2020/01/28(火) 20:03:30.30ID:txqRv4d7a
分かりやすい簡単な英語での優れた入門講座が全世界に無料公開されているのに
わざわざ専門家でもない素人が翻訳した、誤りが含まれる可能性があるものを参照する必要がどこにもない
2020/01/28(火) 20:30:43.62ID:xsJhNcNEM
コーセラのoctaveムズいし、あれだけだと足りない
42デフォルトの名無しさん (ワッチョイ c161-i/iU [114.150.49.230])
垢版 |
2020/01/29(水) 21:29:01.53ID:MPgI5HCM0
挫折しました(笑)
2020/01/30(木) 10:34:36.57ID:iEbzYH960
屈折しましたw
2020/01/30(木) 12:48:50.17ID:+s+UmAusr
入力の次元数が違いますのエラーの嵐

Conv2Dで作り替えて解決すべきか
2020/02/01(土) 12:48:14.62ID:fOMW7iT3a
>>41
別にcourseraでは大して複雑なoctaveの使い方などしていない
あれが理解できないのだとしたらoctave自体が難しいのではなく単に線形代数とか行列演算が理解できていないだけ
そこが理解できていないのにcourseraの講座では不足だという資格はない
2020/02/01(土) 13:34:59.33ID:HI9gNj8C0
日本入国禁止
2020/02/01(土) 16:03:29.05ID:Gzx0Z3pbM
>>45
そうかね
numpyで実装した方が分かり易い
2020/02/01(土) 16:34:06.06ID:Gzx0Z3pbM
あと、バックプロパゲーションの説明端折りすぎじゃね?
別で参考書いるし、ぶっちゃけ、講座全体そ〜なので終わって次につながらんよ
49デフォルトの名無しさん (ワッチョイ 49a5-7STw [222.0.172.133])
垢版 |
2020/02/01(土) 20:27:43.34ID:+wydX4Ei0
>>25
かなり遅くなりましたが返信ありがとうございました、
今更ですが混乱していたとはいえ非常に読みづらい文章で申し訳ありませんm(_ _)m
とりあえずご指摘の通りにもうちょっと大きいデータ扱ってきます。
50デフォルトの名無しさん (ワッチョイ 9982-6qQq [124.40.110.128])
垢版 |
2020/02/01(土) 22:07:24.44ID:Snb+hJ1L0
ありえないことですが、もし囲碁が完全解析出来たら
アルファ碁ゼロでも勝てませんか?
2020/02/01(土) 22:31:07.01ID:A7aDGzxz0
>>50
囲碁のルール知ってるか?あふぉか???
2020/02/01(土) 22:33:41.60ID:JxI2nLp2M
引き分けがないから先手必勝か後手必勝になるんでないかな
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況