【統計分析】機械学習・データマイニング23

■ このスレッドは過去ログ倉庫に格納されています
2019/02/28(木) 20:07:20.50ID:PNBr8RBB0
!extend:on:vvvvvv:1000:512
機械学習とデータマイニングについて語れ若人


■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング22
https://mevius.5ch.net/test/read.cgi/tech/1547338417/
VIPQ2_EXTDAT: default:vvvvvv:1000:512:----: EXT was configured
2019/03/06(水) 20:42:46.54ID:6lH7pSN2H
まぁそりゃあね
アプリつくるにしてもちょっと早い
2019/03/06(水) 20:46:05.98ID:Xpq2GQ9p0
caffeより抽象化進めたツールで成功例は無いな
2019/03/06(水) 21:12:25.21ID:jo/xiwA80
>>100
概念とか凄いとか上とか考えても何も分からんよ
概念の話じゃないっての
2019/03/06(水) 21:19:02.98ID:lnI7RF0Y0
開発だけじゃなくて製造現場が自ら機械学習を使って何かをやろうとしてるってよく聞くけど実用に足るものなのかね
勝手なイメージだけど機械学習まで行かなくてもデータの可視化くらいでも十分な気がするんだよな
105デフォルトの名無しさん (ワッチョイ abd5-We7c [113.197.43.244])
垢版 |
2019/03/06(水) 21:31:38.90ID:8bAYf/MO0
ニール・アームストロングとレオンハルト・オイラーはどっちの方が頭が良いですか?総合的に見て。
2019/03/06(水) 21:41:18.00ID:2MZy3Km30
信濃川は冷たいぞ
107デフォルトの名無しさん (ワッチョイ abd5-We7c [113.197.43.244])
垢版 |
2019/03/06(水) 21:50:02.13ID:8bAYf/MO0
明和水産みたいな画像掲示板を作ってそれの広告収入で月収最低でも200万円以上は稼ぎたい。
2019/03/06(水) 22:23:43.43ID:TL+94TVF0
>>105
ユニバーサルメルカトル解法の思案者は誰だっけか
109デフォルトの名無しさん (ワッチョイ 237d-QFY+ [61.213.64.57])
垢版 |
2019/03/06(水) 23:18:58.04ID:N/TycHTt0
明和電気で我慢
2019/03/06(水) 23:41:47.34ID:4UcSYbmf0
自然科学と人文・社会科学の違いの議論と確定論・自由意志の議論は関係がなくもない。

人為の所産であるところをどのように記述でき得るのかという話。
あるいは統語を徹底させたところで、何かしら意味の一端を持たせた途端に矛盾が入り込むという話。
そこから意味論のど真ん中に話を持っていかざるを得ない思考なり意志なりの扱いについて、
こういったものはその体系そのものが不確定な相互解釈の循環に依存しており、
今のところそれは綺麗に紐解けないでいる。

だから強いAIの強いってどのように定義できるのかというような、そもそもの知性の定義にしたって
人間中心主義から逃れ得ないというような議論にもなるし、ひとまずはブラックボックス化した上で、
擬人的な振る舞いとして見ることで、本当に人のような擬人的振る舞いなのか、
擬似・擬人的なものにすぎないのかという範疇での判断に依存しているのが、
たとえば有名なチューリングテストもそう。

さりとて別に物理と精神をまったくの二元論として捉えるべきであるという話ではない。
それは究極的には一元論であるのだろうがしかし、やっかいなのは一元論をそのまま一元論として
我々はどのように記述できるのかという問題がある(おそらく何かしら二元論的表現をすることは避け得ないだろう)。
2019/03/07(木) 00:14:32.77ID:2k6UzfbCa
windows環境でssd keras使って物体検出試してるんですけど、
特定のアノテーションツール(VoTT)を使ってxmlファイルを生成すると、
いざ学習に入るところで以下のエラーが起きてしまいます。
No such file or directory ...('画像ファイルのパス(なぜか拡張子は入っていない)')
しかし、下のURLのオリジナルアノテーションツールを使うと上手くいきます。
http://arkouji.cocolog-nifty.com/blog/2018/01/tensorflowkeras.html

同じようにディレクトリと画像データも配置しているので
「ファイルが見つからない」ということは考えられないのですが・・・。
何か原因思いつく方いらっしゃいませんか。

ssd keras:
https://github.com/rykov8/ssd_keras
2019/03/07(木) 00:39:54.42ID:UepKFInK0
それはそのままpathの問題じゃないか
windowsだったらエクスプローラの拡張子を表示する/しないで解決する気がする

機械学習の前に、簡単なデバッグぐらいは出来るようになっておいたほうが良いぞ
この先ちょいちょいソースコードを書き換える事になる
2019/03/07(木) 01:09:53.16ID:2k6UzfbCa
>112
ただ、別のアノテーションツールで生成した場合は上手く回る理由がわからないんですよね。
違いとしたらxmlの構成ぐらいしかないと思うので、
そこを疑ってはいるのですが。
114デフォルトの名無しさん (ワッチョイ 0e66-LbCk [183.77.216.198])
垢版 |
2019/03/07(木) 07:22:35.12ID:tddfhX+h0
path
115デフォルトの名無しさん (スププ Sd42-qdRN [49.98.77.136])
垢版 |
2019/03/07(木) 10:08:36.30ID:uo0cLguid
G検定の勉強って、どこから始めれば良いんだ?
全て暗記だけでは対処できない?
2019/03/07(木) 10:26:05.64ID:PmCa69mL0
参考図書一読すれば十分だった
難易度的にはITパスポートに毛が生えた程度
2019/03/07(木) 11:31:16.91ID:erN6c55/H
>>113
双方のxmlを見比べて違いがなかったら
もしかすると文字コードか改行コード、BOMありなしの違いが影響してるかも
2019/03/07(木) 12:53:05.53ID:MJ46GSxEa
G検定の参考書読んだことあるけど
採用担当の人事が勉強するような程度で実際に使う人間なら知ってて当然レベルだった
119デフォルトの名無しさん (JP 0Hf3-fyjV [210.251.91.153])
垢版 |
2019/03/07(木) 13:00:48.61ID:P/xUd1prH
Gはなんの頭文字なの?
120デフォルトの名無しさん (スップ Sd62-E/Me [1.75.10.119])
垢版 |
2019/03/07(木) 13:02:33.54ID:ctQUrX+Qd
日本のITの資格って基本的にどれも終わってるよな
国家資格も全部業務系アプリ前提で作られてるし
2019/03/07(木) 13:20:44.46ID:Av2UuGF/0
general
2019/03/07(木) 13:38:19.08ID:PQuL0AEYM
GOKIBURI
2019/03/07(木) 15:09:52.98ID:CSHgRqK8a
簡単なものでも実際に手を動かして作ったことある技術者にはG検定の勉強はほぼ意味ないよ
統計検定受けとけ
2019/03/07(木) 16:14:57.73ID:qaLAxQqc0
GIANTS
125デフォルトの名無しさん (ワッチョイ 7b54-chNm [218.110.23.140])
垢版 |
2019/03/07(木) 18:09:21.78ID:v47605ND0
例文)In Santa Cecilia, Mexico, Imelda Rivera was the wife of a musician. Imelda's husband left her and her daughter, Coco, to pursue a career in music.
質問)who is husband of Imelda Rivera
回答)Coco
ソース:https://machinereading.azurewebsites.net/
開発:Microsoft AI Lab
126デフォルトの名無しさん (ラクペッ MM17-twFz [134.180.5.144])
垢版 |
2019/03/07(木) 20:53:58.23ID:d/kVFYQ2M
1. INSERT TEXT HERE
Tom took a test. It is very difficult for him. But Tom says, "it was very easy for me".

2. ASK ME A QUESTION
Did Tom take a test?

3. THIS IS MY ANSWER
test
2019/03/07(木) 21:37:08.61ID:8RwKmlXy0
>>111
PC のユーザー名、パス・ファイル名に、日本語を使っているとか?
128デフォルトの名無しさん (ワッチョイ 227d-8dgO [61.213.64.57])
垢版 |
2019/03/07(木) 23:45:58.67ID:qOac/eNm0
>>118
Z検定より難しい?
129デフォルトの名無しさん (ワッチョイ 7b54-chNm [218.110.23.140])
垢版 |
2019/03/08(金) 11:47:56.09ID:pGsX+Iev0
>>74
この人のやってること結構、面白い。
言語理解をルールベースのシステムでやろうとしてる。
よくページを見るとMIT/Concept Netの日本語版みたなものまで作ってる。
これはConcept NetのAPIを使ってると思うんだけど、どうなんだろう?
やりたいことの方向性が悪い意味でAGI的なんだけど、よくありがちの企業の
クレーム文書の感情性分析位の実用AIシステムなら作れるんじゃないかと思う。
130デフォルトの名無しさん (ワッチョイ 77ad-BAw6 [124.144.197.178])
垢版 |
2019/03/08(金) 12:32:24.66ID:6T5DLBm40
売り上げ予測のデータ分析やってます。

仕事でやってて最も困るのがお客様から
「本当にあたるのか?」と聞かれたとき。

売り上げ予測は難しいんですよ。まじで。
同じような商品のデータがあればいいんですけど、
新商品なんて比較するものがないから分からない。
つまり教師データがないからわかりません!

「あたるのか?」なんて俺に聞かないで!
お願いします!
2019/03/08(金) 12:35:38.90ID:yfSfhG9h0
当たるかどうかではなく、指標の一つ、判断材料として捉えていただきたい
と何故言えない
2019/03/08(金) 12:57:55.24ID:ycrcjzM2p
予言者と勘違いしてる人たまにいるよね
2019/03/08(金) 13:28:12.69ID:/1dDX89pa
みなさま回答ありがとうございます。解決しました。

原因は、VoTTが生成するxmlファイルには<filename>タグに拡張子がつかないことでした。
画像ファイル名(拡張子なし)を参照していたため、
画像ファイルが存在するのにエラーを吐いていたんですね。
別途xmlファイルを編集するコードを作成し、対応できました。

お手数をおかけしました。
2019/03/08(金) 13:30:43.31ID:VZPZZqqDM
ipの出るスレで愚痴っぽいことを言うと命取りになるぞ
2019/03/08(金) 14:36:05.88ID:LAU54OqTa
客は技術面には無知なんだから、機械学習の出力結果は過去のデータから推定される予測にすぎないということを分かりやすく説明できなければ確実にトラブルになる
136デフォルトの名無しさん (アウアウウー Sa1b-uCyK [106.161.121.228])
垢版 |
2019/03/08(金) 15:09:01.21ID:qlEyucvJa
>>135 >>130
機械学習による需要予測は計量経済学で消費関数を測定したようなもの。
137デフォルトの名無しさん (ワッチョイ cf92-FvDc [180.92.26.243])
垢版 |
2019/03/08(金) 17:04:16.24ID:jAWBoCTx0
魔界はどこに存在するのでしょうか?
2019/03/08(金) 20:05:53.66ID:RBA96Hlw0
>129
>>6みたいな主張についてどう思われますか?
2019/03/09(土) 01:12:57.52ID:jLGW6cn2a
系列データの分割点を予測するアルゴリズムってありますか?
(1,2,3,7,8,9)なら3と7の所で分けるみたいな
系列クラスタリングとかないのかと思ったが見つけられなかった。デンドログラム書くのが近いかとも思ったが、linkage法によっては系列の順番を無視してつながってしまう
2019/03/09(土) 01:35:25.86ID:MvEZQ/as0
その程度ならk-meansでよくね
2019/03/09(土) 01:54:57.08ID:hrAUVgjq0
PCA + k-meansが精度よい
2019/03/09(土) 01:56:06.50ID:hrAUVgjq0
無しやった
143デフォルトの名無しさん (オッペケ Sr3f-kBQR [126.133.227.40])
垢版 |
2019/03/09(土) 02:01:33.11ID:H6isrNeir
>>139
微分値が大きい所で切るのではだめ?
144デフォルトの名無しさん (ワッチョイ cf92-FvDc [180.92.26.236])
垢版 |
2019/03/09(土) 02:16:56.24ID:ivaaRscD0
霊魂は本当に存在するのですか?
2019/03/09(土) 02:18:43.18ID:W+fBApj50
>>139
変化点検出と違うの?
146デフォルトの名無しさん (アウアウイー Sa7f-yYMx [36.12.28.242])
垢版 |
2019/03/09(土) 02:47:21.20ID:PBbAuzzza
>>139
何に対して(目的変数)ないと意味ないですよね。
だとすると、AICなどで分けてみたらどうでしょう。
147デフォルトの名無しさん (スッップ Sd42-E/Me [49.98.150.130])
垢版 |
2019/03/09(土) 06:51:24.22ID:vST01Dkld
微積・線形代数・アルゴリズムの他に学んだ方がいい分野ってある?
機械学習に限らずwebアプリを作るときに必要な学問でも可
148デフォルトの名無しさん (ワッチョイ f6d5-htbK [113.197.42.204])
垢版 |
2019/03/09(土) 07:57:54.04ID:jC+loU2/0
数論幾何学
2019/03/09(土) 10:00:13.60ID:Cr1wZmJVa
>>145
恐らくこれだわ
言葉も知らなかった、今から勉強してくる、ありがとう
他のみんなも教えてくれてありがとう
>>143>>146
2019/03/09(土) 11:32:24.32ID:lhXQ/RBv0
>>147
機械学習に数学はいらない
2019/03/09(土) 12:25:35.18ID:GFeTrT4Q0
>>150
そうなんだ
152デフォルトの名無しさん (スププ Sd42-qdRN [49.98.79.110])
垢版 |
2019/03/09(土) 12:44:48.29ID:pPVR7Mzad
怪しいAIベンチャーの見抜き方はありますか?
153デフォルトの名無しさん (ワッチョイ 0e66-LbCk [183.77.216.198])
垢版 |
2019/03/09(土) 13:05:35.31ID:IlyNCMRb0
松尾豊ってなんで重宝されてるの?
2019/03/09(土) 13:06:24.89ID:dpeRh0oda
>>152
AIというワードを連呼してたらアウト
2019/03/09(土) 13:12:50.63ID:bKE1dZ5yH
喋れるからじゃない
あと肩書が分かりやすい
2019/03/09(土) 13:13:25.54ID:X1H2sWBi0
>>152
AI、ベンチャーという言葉が入っていたら怪しい
2019/03/09(土) 14:41:02.37ID:xGlqK/PUa
年間売上1兆円越えてる企業の採用でAIってワードめっちゃ見るんだが
2019/03/09(土) 14:51:36.47ID:lwZTh4qpp
>>157 セット販売にご注意ということだろ。単体は良いんだよ。
2019/03/09(土) 15:54:20.30ID:S2zh/ihD0
>松尾豊
初心者向け無料講座開きまくって露骨にビジネスしてるから
160デフォルトの名無しさん (ワイーワ2 FF3a-AP8G [103.5.142.235])
垢版 |
2019/03/09(土) 17:40:50.17ID:kfZA3URWF
池上よりましかな
161デフォルトの名無しさん (ワッチョイ 3f01-/bUt [126.161.188.235])
垢版 |
2019/03/09(土) 19:55:03.85ID:jx9iLAiD0
>>157
用心したほうが良い。
2019/03/09(土) 23:51:00.05ID:jz9xUaFa0
>>157
君はまず条件付き確率を勉強したほうが良い。
それでもって
「一兆円以上の売り上げの企業」と「AIワードの多い企業」の分布を見ると良い。
163デフォルトの名無しさん (ワッチョイ c7b3-twFz [118.5.12.246])
垢版 |
2019/03/10(日) 00:10:05.87ID:4F0EpXC20
>>152
帝国データバンクに5万円払って調べてもらう
2019/03/10(日) 00:31:06.56ID:Wvp+I2S90
M尾叩かれすぎ
そんな悪い人じゃないと思う
2019/03/10(日) 07:44:50.39ID:+Jyc/2Gc0
御用学者
2019/03/10(日) 12:19:36.08ID:nCBDiVE90
そりゃ匿名掲示板なら誰だって叩かれるだろう
叩かれない人間などいないぐらい
2019/03/10(日) 14:02:27.62ID:Fihnw/C1a
教え方が上手いか素晴らしい研究成果を出していればそれでいいんじゃないか?
自分はどっちも知らないから何とも言えないけど
2019/03/10(日) 18:26:35.11ID:bDFWdxia0
>松尾豊
話を聞く価値なし。(悪い人とも思わんが。)

http://ymatsuo.com/japanese/research.html
松尾さん上のリンクで紹介してる「深層学習、ian goodfellow」を真剣に読んだほうがよっぽどいい。
2019/03/10(日) 19:03:51.45ID:+Jyc/2Gc0
こんな研究しかしてなくて失笑じゃね?
https://weblab.t.u-tokyo.ac.jp/%e5%bd%93%e7%a0%94%e7%a9%b6%e5%ae%a4%e3%81%ae%e8%ab%96%e6%96%87%e3%81%8c%e6%83%85%e5%a0%b1%e5%87%a6%e7%90%86%e5%ad%a6%e4%bc%9a%e8%ab%96%e6%96%87%e8%aa%8c%e3%81%ab%e6%8e%a1%e9%8c%b2%e3%81%95%e3%82%8c/
170デフォルトの名無しさん (アウアウエー Sa7a-kBQR [111.239.49.6])
垢版 |
2019/03/10(日) 20:32:36.33ID:0AQyi5Wia
>>169
https://i.imgur.com/K9VYyPK.jpg
2019/03/10(日) 21:32:05.18ID:SyOOr5JC0
>>168
なんか訳が
2019/03/10(日) 22:49:47.39ID:QRthXdOt0
>>169
単に今ある技術でひたすら金稼いでる感じ
せこいっちゃセコいがまぁ日本人らしくて良い
2019/03/10(日) 22:55:00.47ID:bDFWdxia0
>>171
英語版で読めば?
どうせ論文漁ることになるだろうし日本語経由しない勉強も悪くないと思うよ。
2019/03/10(日) 23:08:00.42ID:SyOOr5JC0
>>173
ドイツ語読めません
175デフォルトの名無しさん (ワッチョイ 227d-8dgO [61.213.64.57])
垢版 |
2019/03/10(日) 23:16:51.47ID:hius1VQ50
ドイツ語はローマ字読みでOK
2019/03/11(月) 00:56:26.47ID:X8qUTTmb0
発音できても意味が理解できなきゃ意味ないだろ
2019/03/11(月) 02:32:53.00ID:99rM3tyn0
東ロボくんっていう企画をつくった人も嫌われてたろ
商売っ気が強い人ってなんとなく嫌われやすいんだよ
2019/03/11(月) 07:52:52.37ID:iRTnjzwy0
hintonが商売っ気強くても嫌われない

新井は大した理論も手法も試せず作らず「できない」と言い放った無能だから
179デフォルトの名無しさん (スプッッ Sd62-qdRN [1.75.243.65])
垢版 |
2019/03/11(月) 10:08:03.35ID:88h0YmlTd
ディープラーニング界の大御所って誰?
180デフォルトの名無しさん (アークセー Sx3f-ouaW [126.149.147.4])
垢版 |
2019/03/11(月) 11:03:07.44ID:rKuZue9zx
キャプチャっていうんですか?
車はどれ?とか画像を選ぶやつありますよね
あれって一部の画像はAIが生成したやつじゃないですか?
それっぽいモザイクが入った画像がたまにあります
181デフォルトの名無しさん (JP 0Hf3-/v1g [210.251.91.153])
垢版 |
2019/03/11(月) 11:51:35.52ID:UDQQhFqfH
NLP2019、パットしない研究ばっかりでワロタ
182デフォルトの名無しさん (オッペケ Sr3f-kBQR [126.179.115.52])
垢版 |
2019/03/11(月) 12:47:03.93ID:/+lQo4UPr
>>179
HintonとかLeCunとかじゃない
183デフォルトの名無しさん (スッップ Sd42-E/Me [49.98.152.183])
垢版 |
2019/03/11(月) 13:42:40.27ID:hG4TGbqUd
>>179
テック系youtuberのKENTAさんかなーw
2019/03/11(月) 14:26:57.94ID:Fln3owLsp
初めてkeras使ったんだけどこれみんな分かりやすいと感じるの?
ドキュメントもこれ丁寧なのか…?
2019/03/11(月) 20:11:56.31ID:YRmagZmf0
>>179
ian goodfellow
2019/03/11(月) 22:17:53.95ID:sMjyJi/Y0
評価指標が全く理解出来ない
どんな時にどんな指標を使ってとかみんなよく分かるなぁ
187デフォルトの名無しさん (ワッチョイ 7b54-chNm [218.110.23.140])
垢版 |
2019/03/12(火) 05:13:44.70ID:3Gg2KW300
>>179
Andrew NgとFei-Fei Liが業界を代表する有名人、大御所。
特に、過去数年のAI業界のほとんど全ての領域(コンピュータービジョン、
機械翻訳、ディープラーニング)はFei-Fei Liがリードしてきた。
188デフォルトの名無しさん (ワッチョイ 7b54-chNm [218.110.23.140])
垢版 |
2019/03/12(火) 05:55:14.55ID:3Gg2KW300
追加するとFei-Fei Liはスタンフォード大教授から、GoogleのAI研究開発部門トップ。
去年末にGoogle辞任でスタンフォード大に復職という経歴。Googleは今年に入って
から、Fei-Fei Liの後任に、カーネギーメロン大教授で、学部長のAndrew Mooreを
指名してる。
2019/03/12(火) 07:01:19.54ID:VHXWee130
imagenetか
それだけの人ね
2019/03/12(火) 09:08:43.35ID:MPsJfGzZ0
MITは?
191デフォルトの名無しさん (スプッッ Sd62-qdRN [1.75.246.15])
垢版 |
2019/03/12(火) 10:14:15.10ID:rl6+e77/d
すみません。大御所の方は知らん海外の人ばかりやね。
そりゃヒントンはわかりますよ。
画像認識コンテストで、世界で初めてディープラーニングの実力を示して、衝撃を与えたから。

松尾豊さんやネオコグニトロンの人はどうなの?
192デフォルトの名無しさん (ワッチョイ f6d5-htbK [113.197.42.3])
垢版 |
2019/03/12(火) 10:51:01.29ID:6LXfKGMA0
神と全と無はどれが一番凄いですか?
193デフォルトの名無しさん (オッペケ Sr3f-kBQR [126.179.115.54])
垢版 |
2019/03/12(火) 11:11:15.86ID:2ETBc9aJr
>>191
松尾さんは日本じゃトップクラスだと思うけど大御所とは違うかなぁ
ネオコグニトロンの福島さんも原点ではあるけど違うイメージ
2019/03/12(火) 12:52:34.46ID:JNy7ATKh0
誰かを忘れていないか 甘利
195デフォルトの名無しさん (JP 0Hf3-/v1g [210.251.91.153])
垢版 |
2019/03/12(火) 13:20:24.74ID:qbD9jV9UH
松尾は業績に反比例した声のデカさと顔のデカさがトップクラス
バックにリクルートが居るから

甘利センセは情報理論と情報幾何学だけどディープラーニングかと言われたら微妙
無関係じゃないけど
2019/03/12(火) 14:44:40.29ID:UWGFG26I0
日本代表はプリファードネットワークの中の人で良いのでは?
日本人らしく、新しいことは出来ないけど
2019/03/12(火) 15:49:25.97ID:huwTcSuNp
参考書とか記事とか読むとaccuracyだけを見るのは良くないって散々書いてるのにその参考書や記事の中でずっとaccuracyを使って評価してるのはなぜ?
2019/03/12(火) 19:44:51.51ID:ONtsjcTiM
>>197
章毎に担当している著者が違うとか、偏りのないデータならaccuracyでも十分だったり
2019/03/12(火) 19:56:51.81ID:hqIVC039a
どの記事か言わないと誰にも答えられない
2019/03/12(火) 20:21:46.15ID:eEhk8w9P0
最近この手の質問が多いね、エスパー前提w
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況