【統計分析】機械学習・データマイニング20

レス数が900を超えています。1000を超えると表示できなくなるよ。
2018/08/07(火) 18:56:37.59ID:sGPH9ejna
機械学習とデータマイニングについて何でもいいので語れ若人

※ワッチョイだよん

次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング19
http://mevius.2ch.net/test/read.cgi/tech/1520586585/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
843デフォルトの名無しさん (ワッチョイ f380-tM5n)
垢版 |
2018/10/20(土) 18:49:17.27ID:gp/trlhl0
知識って。。。
画像処理ソフトとか画像データのピクセル加工やってるだけやんけ

で、見た目がそうなってる
とりあえず見た目こんな感でいいや

コレを機械学習と同じと思ってる時点でもうね
2018/10/20(土) 20:39:27.85ID:k0LrzqP2a
>>836
本質を理解しようとはあまり思っていませんね。
とりあえずツールとしてラクチンに使えたらそれだけでよいので・・
>>837
そうだったんですね、自分winでブートしてるのでそれは知りませんでした。
>>838
そうなんですよ、そこなのです。
だから手持ちデータとやりたいこと等から使うべき手法やモデルを教えてくれる本とかがあればいいんですけどねえ
2018/10/20(土) 20:44:45.92ID:k0LrzqP2a
>>842
そうですよね。
だから最適な処理を見つけるためのバイブル的なものがあればなあと思っています。

>>843
本質的にはあまり変わらないと思うのですが。
上の人が言っている通り自動化する技術が確立されていないだけで、
学習自体はデータに対して同じ処理を繰り返してるだけですし、
フォトショップでいう見た目=テストaccなりlos、という感じで使えても悪くないと思いますし
最近でいうならそれこそGANなんて見た目だけの話なのでとりあえずこんな見た目でいいや、で解決すると思います。
2018/10/20(土) 21:05:27.07ID:xvv7H8Vz0
それはそうかもしれないがそうだとするとプログラム板の話題ではなくなるな
847デフォルトの名無しさん (ワッチョイ 6ad2-CW5R)
垢版 |
2018/10/21(日) 03:09:43.34ID:yA/rLZti0
まあ発展途上よな
実用も含めて
848デフォルトの名無しさん (ワッチョイ 53c3-+WKx)
垢版 |
2018/10/21(日) 05:50:34.84ID:MsXt9/J70
>>845
>だから最適な処理を見つけるためのバイブル的なものがあればなあと思っています。
これは最先端の研究なので論文を読んでパラメータの設定はどうするとか学ぶ必要がある.
いくら機械学習の出版が早いとはいえ待ってたら2,3年は遅れた知識になる.

後結局手法はAutoMLとかで大体今でも自動化できてるんだけど,データから推定した結果の解釈とかの問題もあるし,
全部が全部バイブル通り行くとは行かないのが現実.「全てのモデルは間違ってる.完全なる解釈はない」というのが統計学の鉄則だよ
849デフォルトの名無しさん (ワッチョイ 53c3-+WKx)
垢版 |
2018/10/21(日) 05:53:12.18ID:MsXt9/J70
赤池先生の経歴をと尊敬を持って機械学をやるべきだと僕は思ってる.

汎化誤差の最小化だけじゃあまりにもつまらないし.最近のAmazonの差別AIみたいなのができるのが落ち.
未来はどうなるか分からないけど数式から逃げることはできないと覚悟した方が良いと思う.
2018/10/21(日) 08:11:33.22ID:UfdBUaGe0
lossの定義の仕方さえ分かれば良いだけの話だろ
昔なんか自動微分を手前で実装してたんだぞ
2018/10/21(日) 08:40:17.71ID:Cf36qMnJM
>>833
俺のは2018モデルだけどNVIDIAだったかな?

あと
2080 Tiの方がコスパ高い
https://i.imgur.com/SfoNEyI.png
2018/10/21(日) 08:54:49.06ID:Cf36qMnJM
あー最新版TensorflowではmacのGPUサポートしてないわ
2018/10/21(日) 09:46:27.36ID:IzQUIvSq0
>>849
AICはねw
2018/10/21(日) 10:11:18.91ID:MsXt9/J70
最近edX初めてめっちゃいいよな
2018/10/21(日) 10:24:19.90ID:Pb7O8TaX0
courseraの"How to Win a Data Science Competition: Learn from Top Kagglers"っての始めたけど、
これはムズいわ

まず、ロシア人が何を言ってるのか聞き取れない
2018/10/21(日) 10:38:57.18ID:MsXt9/J70
ロシア語はきついわ
857デフォルトの名無しさん (ワイーワ2 FFa2-T/6m)
垢版 |
2018/10/21(日) 11:29:45.72ID:sjXodBVwF
>全部が全部バイブル通り行くとは行かないのが現実.「全てのモデルは間違ってる.完全なる解釈はない」

ほんそれ
2018/10/21(日) 13:35:30.75ID:Ya81v9Q1a
>>848
最先端のネットワークはモチロンそうでいいと思うのですが、
DropoutやらReLUとか組み込んだCNNならもう流行りだして2,3年は経ってると思うので
それくらいの構造のCNNでimagenetのような分類タスクしようと思った時にモデル選定とかどうチューニングしたらいいとかある程度まとめてくれてるような書物があったらいいなと思いました。
859デフォルトの名無しさん (ワッチョイ 53c3-+WKx)
垢版 |
2018/10/21(日) 14:04:50.88ID:MsXt9/J70
>>858
あるのでは
860デフォルトの名無しさん (ワッチョイ 53c3-+WKx)
垢版 |
2018/10/21(日) 14:07:48.83ID:MsXt9/J70
最近の書籍だと直感ディープラーニングとか
2018/10/21(日) 16:57:03.15ID:SdRIg5RYa
あれこれ楽すること考える前にCourseraの有名な機械学習コースのシラバスの各項目をざっくりとでも他人に説明できないレベルならCourseraやるのが一番手っ取り早い
2018/10/21(日) 17:34:54.29ID:fxS7+DP10
Coursera教に入信すれば救われます
2018/10/22(月) 13:50:58.13ID:DttoQmKL0
なんかスレ面白くなくなったな
2018/10/22(月) 14:08:49.04ID:hF2/Is9u0
じゃ、chainerの話でもするか!
日本の会社なのに公式に日本語ドキュメントがないやん、とか
2018/10/22(月) 14:26:31.01ID:DttoQmKL0
>>864
世界を狙っとるんやない?
866デフォルトの名無しさん (オッペケ Srb3-6bZA)
垢版 |
2018/10/22(月) 14:37:01.74ID:zvg+yeJrr
CEATECでPFNが出してた片付けロボットすごいよな
2018/10/22(月) 14:48:12.27ID:go7C76bPa
いい感じのクロスモーダルモデル考えたけど適用事例が思い付かない
868デフォルトの名無しさん (ササクッテロ Spb3-Mv/o)
垢版 |
2018/10/22(月) 19:35:15.84ID:M3H01wI/p
>>866
物体検出、物体判別、位置特定は他の所でも出来るんじゃね?
その正確さとかが実用になるかどうかだろうけど
869デフォルトの名無しさん (アウアウエー Sae2-6bZA)
垢版 |
2018/10/22(月) 19:59:52.03ID:8nbAtIu2a
>>868
それらを現実世界のロボットの動作に結びつけるのは難しい
あと口頭で指示も出せるらしい
2018/10/22(月) 22:45:23.68ID:IVZcl8cFa
PFNロボのアピールポイント:
・衣類の画像認識ができる(衣類、布は置き方によって形状が大きく変わるため難度が高かった)
・対象によって掴む位置、掴み方を変える(けん玉は棒の部分を掴むなど)
・日本語の命令に従い行動できる
・ラフな言い方、ジェスチャーを認識できる(指差しながら「あそこに片付けて」で認識できる)
・展示会の騒音、変化する照明環境で1日連続稼働できる
871デフォルトの名無しさん (ササクッテロ Spb3-SqDF)
垢版 |
2018/10/23(火) 09:47:19.57ID:ruDoWt35p
どこもかしこも画像データを扱う事を前提として文章書いてるから嫌になってくる
2018/10/23(火) 10:02:16.82ID:2OPbXDwm0
二ーズは疑問だけど、頭の固い機械制御の業界には良い刺激
2018/10/23(火) 10:19:26.64ID:bd7/TlGt0
緩い機械制御(LOL)
874デフォルトの名無しさん (ワッチョイ f323-UnLy)
垢版 |
2018/10/23(火) 10:59:29.01ID:2b6Tbph30
メリットが分かりやすい分野で教科書書いたら、参入者が増えるから先行者は嫌がるもの
2018/10/23(火) 12:17:00.88ID:MT32asC/a
先行者が新規参入嫌うって、オープンソース化で新規参入増やすことで急速に技術の新陳代謝促すことで発展しているIT業界を逆行しているようだ
2018/10/23(火) 14:24:49.91ID:pUmb/2Nb0
今んとこわかってるAIのメリットってなによ
2018/10/23(火) 14:36:44.37ID:xBougz0l0
マスゴミが商品の宣伝してくれる
878デフォルトの名無しさん (ブーイモ MMd6-9TKK)
垢版 |
2018/10/23(火) 14:47:39.15ID:cio3imcuM
>>876
人の作った定石を覆す一手が生まれる可能性がある
879デフォルトの名無しさん (オッペケ Srb3-6bZA)
垢版 |
2018/10/23(火) 14:51:30.72ID:gBK/KF1nr
>>876
人にしか出来ないと思われていた高度な処理が可能になった
880デフォルトの名無しさん (ワッチョイ 7b23-T/6m)
垢版 |
2018/10/23(火) 14:53:00.00ID:yFsvvFWj0
ゲームで定石以外の手を打つAIはいるけど
脳外科手術とかで定石以外の手をAIに指示されて
実際その通りに手術出来る医者っているのかな
2018/10/23(火) 15:04:50.59ID:bagxQGHJa
手術の機械学習って学習データどうするんだ?
医療では当面は診断用途だろう
怪しい所を自動ピックアップしてくれるから楽になる
2018/10/23(火) 19:11:15.08ID:BDP8ufz9a
全く同じ条件の学習が上手くいかなくなったんだけど原因は何が考えられますか
1回目やったときは70epochでvalのaccが.95くらいだったのに
2回目やったら1epochからずっとvalのaccが.65前後のままtrainのaccだけが上がり続けるから過学習してると思うんですけど
実行毎に過学習起きたり起きなかったりとかあり得ますか?
883デフォルトの名無しさん (ワッチョイ f323-UnLy)
垢版 |
2018/10/23(火) 21:06:52.05ID:2b6Tbph30
重みの初期化はどうしてるの?
2018/10/23(火) 21:48:04.91ID:nb50ik1P0
みんなすげぇなぁ
機械学習の本まずは1冊やり終えたけどここで話されてる内容ほとんど分からん
2018/10/23(火) 22:19:45.80ID:BDP8ufz9a
>>883
inceptionv3のimagenetです
2018/10/23(火) 23:35:10.13ID:7LErHcLzp
データ分析の基礎的な部分をちゃんと身につけないとと思って統計の勉強始めた
学のある人なら当たり前に知ってる事なんだろうけど自分には知らない事ばかりで結構面白いって感じた
多分最初だからこう思うだけかもしれないけど
887デフォルトの名無しさん (アウアウエー Sae2-6bZA)
垢版 |
2018/10/23(火) 23:44:40.12ID:EZC/vVVWa
>>884
特にディープラーニング関連は本になる頃には陳腐化してるからなぁ
ある程度基礎を勉強したらネットで解説記事とかトップカンファレンスの速報まとめとか有名な論文(の解説)とかを読むと良いかも
2018/10/24(水) 05:47:43.50ID:kJsLSWt60
脳から就活生の傾向を調べるって怪しすぎてワロタ。
2018/10/24(水) 08:56:06.97ID:ljKXe/5ha
>>884
ここで話されてる内容はもうかなり古くて、だからレスする人も減ってる
890デフォルトの名無しさん (ワイーワ2 FFa2-T/6m)
垢版 |
2018/10/24(水) 14:10:20.50ID:wUNs4a59F
統計は高校で習ったから高卒「でも」充分理解できるもんだと思ってたが
最近の高卒は統計習ってないのもいるんだね
891デフォルトの名無しさん (オッペケ Srb3-6bZA)
垢版 |
2018/10/24(水) 14:28:42.96ID:+JXZmafPr
>>890
統計っても機械学習だとロジスティック回帰とか主成分分析とかカーネル法あたりだろう
高校じゃまずやらない
2018/10/24(水) 16:06:02.78ID:anPZCCeda
kerasでGPUを使う時に
最初のプロパティみたいなので
totalが4GBあるのにfreeが3.2GBしかありません
4GB全部をkerasで使うためにはどうすればいいですか
2018/10/24(水) 20:34:04.80ID:GjsFXG0cp
>>892
>最初のプロパティみたいなの

これって何?
2018/10/24(水) 21:13:03.43ID:scNJP40R0
三宅陽一郎は日本のゲームAIの権威と言われてるそうですが本当なのでしょうか?
2018/10/25(木) 09:15:39.86ID:Kapp8Prd0
AIと相性の良い技術ってなに?
2018/10/25(木) 09:55:47.79ID:0TmPhp2B0
プログラム
2018/10/25(木) 10:44:00.40ID:bw1V0BXua
うんこ
898デフォルトの名無しさん (ブーイモ MMf3-dYvX)
垢版 |
2018/10/25(木) 15:07:49.79ID:qGEaBy7DM
>>895
画像診断。下手な医者より優秀だろう
2018/10/25(木) 20:36:36.38ID:yGYVJ0zR0
>>895
超解像
2018/10/26(金) 00:03:05.76ID:HAARiEj70
クラスタリングって教師ラベルがあるデータに対しても行うことってあるの?
職場の人が教師ラベルあるデータに対してクラスタリングするって言ってたんだけどそれは分類とは違うのかな?と思って聞いてたんだけど自分は知識がないから知らないだけで主成分分析みたいに探索的に何か見つけるために使う事も出来るのかな?
901デフォルトの名無しさん (ワッチョイ 1d80-SUE8)
垢版 |
2018/10/26(金) 00:03:51.15ID:7cGNdWT70
アホたちは
いまのいんちきNNモデルをAIと呼称してんのか
2018/10/26(金) 05:54:37.59ID:xXrtI3FC0
>>900
その場合クラスタリングとは呼ばないような
2018/10/26(金) 05:58:52.27ID:xXrtI3FC0
ラベルが既知なのにクラスタリングっていうのは、聞いたことないしやる意味もないのでは。だってデータの距離空間が定義されてるのにわざわざ別の部分集合に割り当てる意味が分からんな。
次元削減なら分かるけど、クラスタリングなんでしょ?
2018/10/26(金) 06:57:09.46ID:GCXjdrQrd
>>901
それな
2018/10/26(金) 08:07:55.75ID:eyOTXDKja
クラスタリングではなく分類の手法として教師あり学習ではk近傍法ならあるけど
2018/10/26(金) 10:06:27.81ID:8ANUhE7EM
NNの一番の問題点って計算量?理論的な保証?
907デフォルトの名無しさん (アウアウエー Sa93-resC)
垢版 |
2018/10/26(金) 10:38:04.98ID:XMhrCttAa
>>906
学習の時は計算量かかるけど使うときは大した事ない
理論保証とブラックボックスさだと思う
2018/10/26(金) 15:22:53.19ID:6HAQawqDM
>>905
すべてのラベルが既知ならそれはしなくない?
上の質問者の意図が全くわからん
2018/10/26(金) 15:26:11.38ID:6HAQawqDM
>>900
上の人が言うように、基本的にその場合クラスタリングとは呼ばない。クラスタリングは教師なしだから。

それで質問に答えるとしたらあるデータX(Xはベクトル)にラベルがあるとして、X以外のデータが入力されたときに例えばaとする。そのaとXとのユークリッド距離を測り(k近傍法)、どのx_iと近いのかを判定したりはする。
2018/10/26(金) 16:56:27.75ID:65losNFXM
https://teratail.com/questions/152987

今CNNの学習をしていて、
このページの1つめの結果画像のような状態なのですが、
原因は何だと思いますか?
2018/10/26(金) 17:22:17.83ID:gM4hGWhWM
>>907
個性っぽくて面白いよな。
2018/10/27(土) 15:09:34.95ID:v0X4VL4w0
これって何か斬新なのか?
http://www.itmedia.co.jp/news/articles/1810/26/news077.html

GANとしては出来が悪いし、レンブラントのAI画のようなテーマも無いし
2018/10/27(土) 15:36:19.64ID:y1YlZFrSa
Jupyterってジュパイターと発音するんだな
pythonのpyなのは分かってたけどなぜかジュピターって読んでた
914デフォルトの名無しさん (ワッチョイ 7d23-qsqE)
垢版 |
2018/10/27(土) 18:17:25.38ID:Rhmyt2K70
こういうのに最初に大金を出した人が美術史を作っていくのや
2018/10/27(土) 18:22:26.40ID:YLSwYbPjd
>>912
著作権とかどうなるんだろうな
2018/10/27(土) 20:53:05.83ID:+ZkL2hzfF
まあ、AIはお金になるという実績を作ってしまったな
2018/10/27(土) 21:33:01.74ID:uuDSt7d3M
>>910
わかる人おねがいします
2018/10/27(土) 21:41:30.48ID:0HglwheTa
>>917
一目瞭然じゃん、教えて欲しいのか、試してるつもりなのか。
2018/10/28(日) 10:52:14.40ID:ZEyjWc9P0
どうみても過学習だろ
920デフォルトの名無しさん (アウアウエー Sa93-resC)
垢版 |
2018/10/28(日) 11:39:15.80ID:EoM4jV8ha
>>913
わかる
921デフォルトの名無しさん (アウアウエー Sa93-resC)
垢版 |
2018/10/28(日) 11:41:19.59ID:EoM4jV8ha
>>910
そのページ内で結論出てるやん
2018/10/28(日) 21:57:26.97ID:U2zUowxY0
train か少ないとか、val と train の性質が違うとかもあり得るが
2018/10/28(日) 23:48:27.52ID:Got3VCGwM
>>919
これも過学習なのですか?
ページの人が答えてるように下にあるresnet34の結果が明らかに過学習なのは分かるのですが
こんなに振動する過学習もあるのですか?
2018/10/28(日) 23:50:29.50ID:Got3VCGwM
あと、accがほぼ100%近いのにlossが10もあるのが理解出来ないのですが
こんな状態あり得るのですか?
2018/10/29(月) 00:14:41.57ID:MQrExvvX0
https://bit.ly/2ELs5Zp
2018/10/29(月) 06:28:46.79ID:kXYWj2tR0
>>795
>>792
>そこまで高いの買わなくても、
>サブ機に1050Ti積んでますけど
>inceptionv3の199層〜のファインチューニングでも
>32000枚を100エポック回して大体5時間で終わりますよ
>低価格でいろいろ試すには悪くない性能だと思うので検討してみてはいかがでしょうか。

ありがとうごさいます
そこそこのグラボ買ってみます
927デフォルトの名無しさん (ワッチョイ 1bd2-e7ji)
垢版 |
2018/10/29(月) 08:06:16.95ID:62KNlyE40
↓これって日本版Kaggleみたいなもの?

https://signate.jp/competitions
2018/10/29(月) 10:26:37.08ID:8gX7Io6i0
>>924

https://stackoverflow.com/questions/46561531/why-does-the-validation-performance-have-large-fluctuations-during-deep-cnn-trai

上記以外にも似たような話がいくつかあったけど明確な回答はないみたい
データセットの側の問題ということのようだけど

単純にデータ数が少ないだけのような気もする
2018/10/29(月) 10:55:56.04ID:8gX7Io6i0
NNは最小限の構成から始めて
学習曲線を確認しながらレイヤー数を増やして複雑にしていくのが常道だから
まず3層ぐらいの単純な構成だとどうなるのか見るべきじゃないのかな
teratailの例を見れば少ないレイヤー数なら普通に過学習で見られる学習曲線なわけだし

いずれにせよどんなデータを使って何を分析しようとしているかもわからない
ネットワークの構成もわからないで学習曲線だけ出して的確な回答を期待する
というのも無理があるかと
930デフォルトの名無しさん (ワッチョイ abe7-gZJR)
垢版 |
2018/10/29(月) 11:31:50.05ID:VxCr7qKV0
あらかじめ結論を決めておくのは意味が無くね
931デフォルトの名無しさん (アウアウエー Sa93-resC)
垢版 |
2018/10/29(月) 11:38:09.69ID:tXMYusEla
でかいネットワークで学習するとむしろ汎化性能が上がるって説もあるよね
932デフォルトの名無しさん (ワッチョイ 1d80-SUE8)
垢版 |
2018/10/29(月) 21:39:26.10ID:JGxixszg0
むしろ期待通りの結論に到達するように
学習させてるのがいまのウンコAIだからな
2018/10/29(月) 21:58:32.07ID:zEESrYYqa
むしろ期待通りになるように学習させないでどうするんだよw
間違った教科書で勉強したら間違った答えを出すだけ
934デフォルトの名無しさん (ワッチョイ 1d80-SUE8)
垢版 |
2018/10/29(月) 22:12:20.15ID:JGxixszg0
つまりオマエが作ったAIは
オマエより賢くなることはない
アホのまま
2018/10/29(月) 22:18:10.77ID:FSHl5k4M0
教師あり学習なんだからそんなの当たり前やん何言ってんのこの人
2018/10/30(火) 00:39:20.03ID:NTdM/MUxa
作り手の想像を超えた知性が得られたとしてそのことを数値で評価することなど不可能なんだから、そもそも作成に成功したかどうかすら誰にも分からないわけで
937デフォルトの名無しさん (アウアウエー Sa93-resC)
垢版 |
2018/10/30(火) 02:23:18.40ID:82wxAJF9a
>>936
強化学習なんかだと、例えばゲームで人間の思いもよらない戦略を学習する事もあるし、スコアとかの客観的な評価軸もあるぞ
2018/10/30(火) 08:59:49.24ID:R0rHQSFYa
強化学習は報酬を与えるルールさえ決めれば後は膨大な計算コストがかかるだけで結果は決まっているわけだから作り手を超える賢さを得たと言って良いかどうかは微妙なところ
939デフォルトの名無しさん (アウアウエー Sa93-resC)
垢版 |
2018/10/30(火) 11:21:40.67ID:82wxAJF9a
賢さとは
2018/10/30(火) 12:07:17.38ID:BPezb0mna
賢さの定義などないけど>>934が賢さについて言ってたから使ってみただけ
2018/10/30(火) 13:55:45.69ID:jHKI7OLI0
この分野、売り逃げがしにくい。
それが良さでもあり悪さでもある
2018/10/30(火) 16:34:11.40ID:MWqKC0Xe0
本当に初心者ですけど質問です。
他クラス分類してて線形モデルを考えてるんだけどグリッドサーチしてCを出すプログラムを書いた。
そのプログラムを数回走らせると毎回違うCが出てくるんですがそう言うものですか?
ちなみにaccuracyはおんなじ値が何回も出てたまに低かったり高かったりします。
2018/10/30(火) 17:24:22.04ID:6RcW7/vQ0
Cとはw
レス数が900を超えています。1000を超えると表示できなくなるよ。
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況