【統計分析】機械学習・データマイニング25

2019/06/27(木) 01:53:38.17

機械学習とデータマイニングについて語れ若人

＊機械学習に意識・知能は存在しません。
人の意識に触れたい方はスレ違いです

■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
Machine Learningを用いた論文一覧2018
https://shiropen.com/seamless/machine-learning/2018
2017年のディープラーニング論文100選
https://qiita.com/sakaiakira/items/f225b670bea6d851c7ea
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

■前スレ
【統計分析】機械学習・データマイニング23
https://mevius.5ch.net/test/read.cgi/tech/1551352040/
-

【統計分析】機械学習・データマイニング24
https://mevius.5ch.net/test/read.cgi/tech/1556674785/

VIPQ2_EXTDAT: checked:vvvvvv:1000:512:----: EXT was configured

2019/06/27(木) 07:57:36.23

2ゲットー！

ズザザザ－！
(超満員の電車内なのでAA貼れない！)

2019/06/27(木) 08:43:37.55

乙

2019/06/28(金) 08:25:13.31

意識のないAIなんてAIとは言わないよ

2019/06/28(金) 10:05:12.77

AI完全をクリアしてから考えればいい
意識云々いう奴は自己陶酔のオナ猿

2019/06/28(金) 16:26:34.11

多次元尺度構成法ってデータ間のユークリッド距離を見てユークリッド距離をほぼ再現できる別次元のデータ構成をつくりなおすってことで合ってる？

2019/06/28(金) 16:29:44.88

距離を再現する必要はない

2019/06/28(金) 17:21:29.21

>>6
違う

2019/06/28(金) 18:57:47.38

>>8
ウソつくな馬鹿たれが！

2019/06/28(金) 19:10:52.92

😭💦💦

2019/06/28(金) 22:19:19.82

いわゆる最小二乗法っていうのは正規線形モデル(つまり誤差項が正規分布に従う仮定の線形モデル)でほかの確率分布を想定するために一般化線形モデル(正規分布以外の分布にも従うことを想定するモデル)があるっていうことでいいんでしょうか？だれかおしえてください
私の認識では正規分布に従う仮定ならばパラメータの推定は最小二乗法という簡単な行列計算で行うことができるけど他の分布の仮定であれば一般化線形モデルのもと最適化アルゴリズムを利用した最尤法を行わなければいけないという理解なんだけどあってるのかな？

2019/06/28(金) 22:31:38.89

いわゆる最小二乗法っていうのは正規線形モデル(つまり誤差項が正規分布に従う仮定の線形モデル)でほかの確率分布を想定するために一般化線形モデル(正規分布以外の分布にも従うことを想定するモデル)があるっていうことでいいんでしょうか？だれかおしえてください
私の認識では正規分布に従う仮定ならばパラメータの推定は最小二乗法という簡単な行列計算で行うことができるけど他の分布の仮定であれば一般化線形モデルのもと最適化アルゴリズムを利用した最尤法を行わなければいけないという理解なんだけどあってるのかな？

2019/06/29(土) 06:26:54.34

この前の目黒記念449,000円ごっつぁんです( ´∀`)/~~。
ラジオNIKKEI賞楽しみだな。
python一辺倒だったのを、統計解析部分をRに代えてやったら回収率が飛躍的にアップした。
Pythonはデータの取り出しに特化させるのが向いてるみたい。

2019/06/29(土) 09:34:37.29

>>13
それは言語の問題ではない
Rで処理している事をpythonで処理すれば良いだけ
つまり統計処理自体の選択が適切ではなかった
あなたのミスだ

2019/06/29(土) 09:35:22.12

>>13
前回うまくいったとして
今後10回とか繰り返したら損するかもしれないよ

2019/06/29(土) 09:50:41.55

>>11
>>12
質問の意味が分からん

2019/06/29(土) 10:01:58.78

>>12
文がごちゃついてるけど
合ってる

2019/06/29(土) 10:10:42.33

統計処理はRの方が楽なことが多いが統計学を理解していれば言語で結果が変わるなど起こらないはず

2019/06/29(土) 10:56:23.50

みんな統計検定準一級って持ってる？
機械学習やるなら持ってた方がいいかなって思ってるけどどう？

2019/06/29(土) 11:36:03.57

機械学習に数学は不要
統計学に数学は必要
ゆえに機械学習に統計学は不要

2019/06/29(土) 13:38:25.90

>>19
必要だと思うなら持てばいいじゃん
人に聞いてどうすんの？

2019/06/29(土) 14:14:30.70

deepnude
https://headlines.yahoo.co.jp/hl?a=20190629-00000002-jij_afp-int

2019/06/29(土) 17:04:47.33

>>20
機械学習じゃあ中途半端な数学は
意味ないからかなり勉強しないと。

統計学は基本からしっかり勉強すれば
数学は役に立つね

これからは機械学習でも
数学やってないと
淘汰されそうじゃね？

2019/06/29(土) 17:43:05.37

アノテーション作成がメインのお仕事なデータ・サイエンティスト系なのかも

2019/06/29(土) 18:49:31.23

アノテーション作成って
アルバイトがやるやつ？
まあ、それなら数学いらんわな

2019/06/29(土) 18:59:08.09

アノテーションと言えば最近読んだこれ思い出した
https://www.itmedia.co.jp/news/articles/1906/27/news042.html

2019/06/29(土) 20:50:27.68

面白そうな本を見つけた。
買いでしょうか？かなり高いけどw

昆虫の脳をつくる ─君のパソコンに脳をつくってみよう─
https://www.asakura.co.jp/books/isbn/978-4-254-10277-2/

2019/06/29(土) 23:50:32.96

さっきのサヨナラのランニングホームラン
なんでエンタイトルツーベースにならなかったのか

2019/06/30(日) 02:05:07.60

>>15
やってみます。
試行錯誤しながら精度上げていきます。

2019/06/30(日) 02:07:01.19

>>15
10回と謂わずに100レース以上試してベストな方法でやってみます。

2019/06/30(日) 02:11:22.24

>>23
競馬やってるが、極めてくるとプログラミングなんて知識よりも数学の知識が重要になってくる。
プログラミングなんて競馬予想をスムーズに効率的にやるツールに過ぎない。
最終的に数学の知識が必要になる。
極端な話、プログラミングなんてどうでもよくてその時代のベストなツールを組み込んでやれば良いが、ベースは統計学だから。

2019/06/30(日) 02:18:37.02

機械学習ってプログラミングと言っていいのか
ライブラリ作ってる人は凄いと思うが
使う人はなんかマクロ言語使ってる感覚に近いんじゃね
だから言語は何でもいい

2019/06/30(日) 02:19:40.66

>>14
恐らくそのようですね。
自分のコーディングの問題ではあると思いますが、統計解析ではRの方が実行速度が速いですね。
特にリアルタイムでオッズ表示してやるものとか。
自分のプログラム自体に問題あるかも(；´_ゝ`)。

2019/06/30(日) 02:37:04.55

>>32
その通り。
中のライブラリ(数学の知識)が重要なんよ。
コーディングだけやるなら大したことないが。

2019/06/30(日) 08:21:41.61

>>30
ベストかどうかは想定内の選択肢の中で一番良い
という事でしかないと思う
想定外のアプローチでより良い結果を得られるかもしれないけどな

2019/06/30(日) 08:24:25.93

>>31
統計処理にミスがあったら損する事になるけどな
理論も実践も重要

理論的には実現できるけど実際にやろうとすると
見込み利益よりコストがかかって赤字とかのパターンもある

2019/06/30(日) 08:25:31.26

>>34
中のライブラリにないものは自分で作るしかない

2019/06/30(日) 08:27:38.23

>>33
結果を得るまでに必要な時間が
必要な時間内に収まるかどうかも問題になる事がある

自動運転とか結果を得るまでに5秒とかかかってたら役に立たない

2019/06/30(日) 09:10:52.59

>>32
個人的には電気回路設計にかなり近いと感じている
新しい回路を設計する人はもはや殆どいない
トラ技等の雑誌を見てノウハウを学びつつ、実務では完成されたネットワークを使って変更点のある部分はPICやFPGAでなんとかする感じ

2019/06/30(日) 11:21:11.95

回路パラメータは計算で決められるけど機械学習のハイパーパラメータはそうはいかないんだよな

2019/07/01(月) 07:32:53.79

>>36
コストの方がかさむなら理論の時点で間違いだろw

2019/07/01(月) 12:11:54.39

理論が間違いというか、細かい人件費や手数料などどこまで計算に入れるかの問題だろう
あまり具体的に入れすぎても汎用性がなくなって使いにくくなるし、逆にシンプル化しすぎると現実とのズレが大きくなる

2019/07/01(月) 22:39:51.18

人間って視点を移動しながら視野の全体を認識してるけど
これをAIの画像認識にも応用すれば学習コストって大分少なくできるような気がするな
視点の中心に特徴量を集中させればいいだけだからかなり効率的だと思う

2019/07/02(火) 01:31:56.34

だからさ、そんなこと誰でも考えるの

アイデアを形にして結果を出せなければ
ただの馬鹿でしかないから。

2019/07/02(火) 09:12:22.72

どこに視点を合わせるの？馬鹿乙

2019/07/02(火) 09:15:54.85

ランダムフォレスト分類の予測結果に「A」「B」「C」があった場合、
それ以外に確信度が低ければ「わからない」というラベルを
出力することができますか？
それかテスト入力データを与えたら、予測結果だけでなく
確信度的なものを数値で把握したい。
ランダムフォレストは多数決で判定結果を決めているということは
複数の木での意見の一致度とか意見が割れているとかが算出できるのでは
ないかと思います。
判定を間違えるくらいなら「わからない」と言ってくれたほうがいいので。
ランダムフォレスト回帰でも同様のことをしたいです。
pythonのscikit learn RandomForestでこのような機能があったら
教えて頂けるとありがたいです。

2019/07/02(火) 09:56:07.67

そうだな
AIにDNAやRNAと代謝を完全にエミュレーションさせればきっと完璧なはず

2019/07/02(火) 11:33:05.05

>>46
できるし
積極的にそういうふうに実装すべき

2019/07/02(火) 12:15:34.28

>>45
お前がものを見るときはどうやって視点合わせてんの？

2019/07/02(火) 12:18:40.82

>>49
それ医学的科学的に説明できる人いないだろwww

アホすぎwww

2019/07/02(火) 13:09:37.68

>>48
すみません、メソッドレベルで教えて頂けると助かります。
該当するメソッドやインスタンス変数などを教えてください。
scikitlearnの RandomForestClassifierと
RandomForestRegressionです。

2019/07/02(火) 14:13:50.40

>>49
真性の馬鹿か

2019/07/02(火) 14:27:52.36

ど素人の思い付きであった

2019/07/02(火) 17:45:11.93

知ってる人教えてください。
scikitのmlpとRのnnetで同じネットワークサイズにしてるのに、mlpの方が精度がかなり悪いです。どのパラメータをいじれば整合が取れるでしょうか。
nnetのdecay に対応するのがalpha？

2019/07/02(火) 18:24:16.68

>>50
世界中さがしても説明できるやついないのかw
そっかw

2019/07/02(火) 18:51:26.82

┐('～`;)┌

2019/07/02(火) 18:52:28.39

>>55
50だがそういう意味で言ったんだぞ
お前は余計な事考えずに勉強しろ

2019/07/02(火) 19:09:02.62

>>57
何が言いたいのかさっぱりわからん
説明できるやつがいないから実装は不可能だと言いたいのか？
それとも説明できるやつがいないからここで議論してもしょうがないよねって言いたいのか？
どちらにせよ論理破綻してるぜ？

2019/07/02(火) 19:23:09.20

>>58
お前は馬鹿だとみんなが言ってるだけだよ

2019/07/03(水) 14:44:38.34

med

2019/07/03(水) 18:44:41.74

>>51
誰も答えてあげてなくてかわいそうになってきた
predict_probaで確率出るからそれで弾いて

2019/07/03(水) 19:28:37.76

>>57
勉強してる人が5chなんて見るかよ馬鹿

2019/07/03(水) 19:28:40.72

>>54
Rの方はよく知らないけど整合取るには双方のヘルプ・ソースコードとニラメッコじゃないだろうか
nnetのオプティマイザはBFGSだけどscikitのsolverはデフォルトでadam
nnetの損失関数はLeast Squareだけどscikitの方はLog-loss

ヘルプを見る限りnnetのdecayとscikitのmlpのalphaは同じように見える
両方ともL2正則化のペナルティを表すもので、Rのデフォルトが0でscikitのデフォルトが0.0001

いろいろ違いそうだね

2019/07/04(木) 06:29:25.26

>>63
ありがとうございます。
なるほど、正則化パラメータ以外もいろいろ違うとこがあるんですね。

整合を取りたいと書いちゃってたのですが、一番の目的はscikitでもnnetと同じ精度以上を出したいというところですので試行錯誤してみたいと思います。

2019/07/04(木) 13:38:58.04

ribesがそんなにいいとは思えない
sentencepieceもそんなにいいとは思えない

ゴミみたいな研究だと思う

2019/07/04(木) 17:20:12.29

SIGNATEの武田の創薬やってる人いる？
どうやったら精度上がるか全然分からん

2019/07/04(木) 18:14:37.95

>>66
今やってるKaggleの白血病もそうだけど、
AI屋やIT屋の課題じゃないような

2019/07/04(木) 19:40:25.86

サイト教えろよ

2019/07/04(木) 20:51:44.89

株でばくえきだわ

2019/07/04(木) 21:39:41.57

株で大儲けー♪

2019/07/05(金) 08:39:15.99

株で大損失中だわ
泣けてくる

2019/07/05(金) 09:13:03.49

>>66
どこでそれやってるの？

2019/07/05(金) 09:30:40.35

>>72
SIGNATEって書いてあるだろ

2019/07/05(金) 10:54:57.01

俺も知りたいわ、3800もある項目見るのはきつい

2019/07/05(金) 12:11:53.87

singateみたけどさ
>(２)最終提出物及び最終審査用提出物に含まれるすべての分析・予測結果及びレポート、分析・予測モデル・アルゴリズム・
>ソースコード・再現法等の説明書等、及び提出物に関する著作権、特許を受ける権利、ノウハウ等すべての譲渡可能な権利（著作権法第27条及び第28条に定める権利及び特許を受ける権利を含み、以下、「本件権利」といいます。）
>のホストその他の当該コンペティションにおける権利譲渡対象者への譲渡に同意すること

ナニコレ。。。

2019/07/05(金) 12:32:46.62

他のデータサイエンスコンペの規約はどうなってるの？

2019/07/05(金) 13:19:13.36

流石にそのまま専属データサイエンティストになれるでしょ

2019/07/05(金) 14:45:36.60

口約束もないのに確約なんかされるかいな

2019/07/05(金) 18:58:42.97

SIGNATEって営利目的を想定しているみたいだけど、
どのコンペも提供されているデータ変数がそもそも足りないので実用投入は無理っぽそ

2019/07/05(金) 21:23:45.12

やばい雰囲気が漂ってる
避けた方が良さそう

2019/07/06(土) 12:05:06.31

この分野もホント人が居ないんだな
技術とは全然関係の無い人間がマイニングでいらなくなったグラボ使って
暇つぶしに本2冊読んだぐらいで上位10％以内に入れるっていう
まーやらんわな今の若い人達がこんなもん

2019/07/06(土) 12:33:03.79

SIGNATE結果出してる奴らってやっぱりスタッキングとかでやってるのかな？

2019/07/06(土) 14:15:12.98

通販のポスデータで何すべき？

2019/07/06(土) 14:28:02.29

他社にこっそり販売する

2019/07/06(土) 16:37:22.33

スタッキングとかって実務でもやるもんなのか？

2019/07/06(土) 17:20:16.92

スタッキングってなによ？

2019/07/06(土) 18:19:21.64

車がぬかるみにはまってでられなくなること

2019/07/06(土) 19:02:41.40

つまんね

2019/07/06(土) 20:39:37.49

今日からやります
こんなブルーオーシャンないわ

2019/07/06(土) 20:51:11.49

やれ！
Excelでデータごにょごにょできれば
月100万取れるから。
まじでバブルだ

2019/07/06(土) 21:47:06.80

>>89
もうすでに血みどろで真っ赤になって誰も入らんだけだぞ。

2019/07/06(土) 21:49:58.69

パトロンがいればどうにでもなる現実

2019/07/06(土) 22:54:36.59

とある事情でGPUマシンを無料で使える環境なのでやってみますわ

2019/07/06(土) 23:56:00.77

パトロンはどうやって探すの

2019/07/07(日) 00:43:35.82

>>89
いいアルゴリズムができると途端に出したくなくなるよ
これを100万ごときで版権込みで全て渡すのか、と思うときが来る

2019/07/07(日) 01:08:08.73

100万とか200万とか安すぎ

優秀な成果にしか賞金出さないのに

2019/07/07(日) 07:16:54.42

せｘ

2019/07/07(日) 11:33:26.45

入賞しなくても
全部むこうのものになるんだろ？

データサイエンティストをいいように搾取してるだけじゃん？？

2019/07/07(日) 14:22:57.77

何を言っている
優秀だと会社や国に吸われるシステムになっているのが日本だろう
世界で最も中間層の多い国なんだぞ
ダメなものには補助金が出て優秀な奴等からはガッポリ金を吸い取る
高学歴と言っても大半は無駄に頑張らないといけない運命を強制的に背負うだけ
ごく一握りの人間が運的要素によって金持ちになるけど

2019/07/07(日) 14:39:26.35

>>98
機械学習本体の部分は渡しても良いんだけど、前処理の部分は自分の人月を考えると絶対に渡したくなくなるレベル

2019/07/07(日) 17:49:21.97

>>100
むしろ前処理を渡して良くないか？

2019/07/07(日) 18:43:11.25

>>98
しかし、新卒以外のデータサイエンティストは、
勉強してもこんな場しか与えられなさそうだな

Kaggle上位者であっても年を食ってたらsansanしか拾わないし

2019/07/07(日) 19:04:18.22

データ分析はあくまで補助的なツールだしな
日本だと全部外注でいいやとなりそうな気がする

2019/07/07(日) 19:25:39.85

ビジネスを回せないデータサイエンティストは単なるデータ処理屋でしかないからな

2019/07/08(月) 19:08:27.36

今、深層学習の最新のアルゴリズムって何？

2019/07/08(月) 20:15:17.33

YOLO v3

2019/07/08(月) 22:11:24.50

>>105
昨年まではTDAが最新だったが
今はDTかなあ？
勉強してるけど追いつけない！

2019/07/08(月) 22:26:53.91

働き方改革
https://www.youtube.com/watch?v=Hd4XLShifog

2019/07/09(火) 01:14:15.31

いわゆる最新のｱﾙｺﾞﾘｽﾞﾑだと、その解きそのときに巷でもてはやされたものが
手短な目先の成果や収益のために安直に消費される分野に、
発展性や将来性があるのかというと、疑問で
やはりバブルだったんだろうな
Ｎ○Ｉの粗いとか

2019/07/09(火) 10:11:26.33

こんな気になるまとめを発見。
東ロボくんの生みの親《新井紀子》教授の間違いが明らかになった日。人間は人工知能に読解力でも負けつつある
https://togetter.com/li/1285134

どういうものなのか、よく分かりません。
AIが人間のように文章の意味理解が可能になったのでしょうか？

2019/07/09(火) 10:17:12.36

分からなければ気にする必要はない

2019/07/09(火) 11:53:57.31

可能になったようだ。
囲碁の時と同じく、技術の変化が速すぎて
学会レベルでも追いつけていない

2019/07/09(火) 11:55:57.50

新井さんは元々（AIではなく）若い人の読解力の無さを嘆いていた
何を間違いと言っているのかわからんが、もうとっくに大半の人間の読解力よりAIの方が優れているることは
彼女は指摘済み

2019/07/09(火) 12:25:18.22

新井？
キチガイ馬鹿女w
笑わせるなクズ

2019/07/09(火) 12:43:06.16

↑もっと読解力身につけろw

2019/07/09(火) 13:23:33.78

読解力があるのに人間と会話できないのはおかしい

2019/07/09(火) 16:41:00.27

読解力テストってどんなん？
東ロボ君も国語は得意だったような

2019/07/09(火) 18:50:54.75

XLNetが自然言語処理のスコアでBERTを大幅に超える
https://twitter.com/quocleix/status/1141511813709717504
https://twitter.com/5chan_nel (5ch newer account)

2019/07/09(火) 19:13:09.54

>>110
英文和訳をさせてみればわかるでしょう

2019/07/09(火) 19:14:01.25

>>112
変てこチューリングテストに過剰最適化したのでないといいきれますか？

2019/07/09(火) 19:23:19.25

現代文、フィーリングで解ける人いるよね。言葉をちゃんと使える大人も少ないから、自分で勉強しないと。君は大人を超えてくれ。フィーリングは大切に。
https://www.youtube.com/watch?v=AxQjF0WS7Yc
現代文勉強法偏差値29から最短で偏差値62になる勉強法
https://www.youtube.com/watch?v=iXeADsgRq_g
#よなたん #大学受験 #勉強法
【現代文】保存版！9割取れる参考書カリキュラムと勉強法
https://www.youtube.com/watch?v=OtUkb2rJjZw
現代文が苦手な人のための現代文勉強法
https://www.youtube.com/watch?v=fNSdHsq1gT0&;t=269s
【開成→東大卒が教える】現代文の勉強法基礎編！理解のための4ステップ
https://www.youtube.com/watch?v=U7vhQaVPX0I
現代文の勉強法～屁理屈なし！高１でも半年で東大過去問を解く参考書の選定と使い方
https://www.youtube.com/watch?v=3o_xk0LUEq8&;t=754s
偏差値44から東大・京大・早慶上智に合格する大逆転勉強法（現代文編）参考書の使い方
https://www.youtube.com/watch?v=01NhY57R0Dk
阪大生が教える『田村のやさしく語る現代文』を活用する3つのポイント～現代文の基礎を確立しろ
https://www.youtube.com/watch?v=BK3f7-6MZfc
どう勉強すれば現代文の成績が上がるの！？【馬場センセイの大学受験１問１答vol.13】
https://www.youtube.com/watch?v=TZoukTmSM2s
現代文の勉強法（全部入りVer.）｜教科別勉強法
https://www.youtube.com/watch?v=CCdZCd32R2I
『きめるセンター』だけでは早稲田の現代文はツラい。高田先生も苦戦した『現代文と格闘する』は「やるべき!?」or「やらなくてよい!?」
https://www.youtube.com/watch?v=QfRkyQ2ryC0

2019/07/09(火) 19:24:00.26

『きめるセンター』だけでは早稲田の現代文はツラい。高田先生も苦戦した『現代文と格闘する』は「やるべき!?」or「やらなくてよい!?」
https://www.youtube.com/watch?v=QfRkyQ2ryC0
現代文読解力の開発講座｜武田塾厳選！今日の一冊
https://www.youtube.com/watch?v=EoC9GlPxOKE
現代文基礎の参考書を徹底比較！【参考書MAP】
https://www.youtube.com/watch?v=cn4wotDmBVM
東進　講師紹介 - 現代文 - 出口汪先生
https://www.youtube.com/watch?v=RvafT5lPt5Y
授業というものの価値はどこにあるのか
https://www.youtube.com/watch?v=RlMc1F5ElRM
【気になる一冊を完全紹介!!】船口のゼロから読み解く最強の現代文・船口の最強の現代文記述トレーニング｜武田塾厳選! 今日の一冊
https://www.youtube.com/watch?v=c67J9cv8nRU

2019/07/09(火) 20:51:06.96

>>110
文章を見て、その文章から絵や動画みたいなものを
自在に再現できるか？あるいはイメージできるか？

これで勝負するという訳で、

少年が通りを駆けて行った

という単語で、少年が町の中か田舎道か知らんがそこを
半ズボンでも履いて全力で走っていく動画かアニメみたいなものを
イメージできるか

人間なら、本が読める人ならこれはイメージできる、ということになっているが
実際に例えば大人向けの小説を読ませて、それらのイメージを脳内に描きながら
読める人はそんなにいない
だから偏差値63以上でないと文章の内容をイメージできない、なんて
言われている
本なんて幾つかの単語を拾ってフィーリングで読んでいる人の方が多いんだ、
などというのだ

新井氏のグループは、最後までその再現を十分な精度で達成できないまま
東ロボ計画も終了してしまった

だが、MicroSoftとかアリババとかが、その再現に相次いで高精度で成功し
最近では人間の出すスコアを完全に上回るようになってしまった！

なお新井氏のグループは機械学習すら十分に使いこなせていなかった？
なんて言われている始末

2019/07/09(火) 21:09:42.98

そもそも新井は研究業績もショボいんだよね
あんな大規模プロジェクトのリーダーには無理があった

NLP界の小保方

2019/07/09(火) 21:41:56.74

>>123
それって文章からそれらしい画像を検索したか生成したかってだけだろ
それで文章理解とか片腹痛い
だいたい「新井氏のグループ」とか書いてる時点で東ロボの実施体制を全然知らないってバラしてるも同然だからクソ黙ってろって

2019/07/09(火) 21:45:14.24

論理的に考えろ　新井（笑）

2019/07/09(火) 23:42:04.96

言語解釈からテスト問題の理解と回答につなげるとか
とんでもない溝があるような

2019/07/09(火) 23:50:26.38

2ちゃん見てれば人間でもほとんど読解できてねーじゃんとか思うし、AIには無理だろ。

2019/07/09(火) 23:53:21.68

それでも幾何とか微積分とか
人間がちょっと手直しすれば機械的に解けちゃうレベルにはあるんだろう
かなりのもんじゃないか

2019/07/10(水) 00:28:12.26

文章題のキーワード及び回答の選択肢のキーワードを抽出し、検索エンジンにかけて
ヒット数が多い方が正解の可能性が高いとか、そのレベルで人気知能を騙られると
まじめに研究している人が気の毒だわ。少数はだけどｗ
舐めきってる

2019/07/10(水) 00:30:34.34

東ロボが失敗したのは
新井紀子が無知で無能だったから

2019/07/10(水) 00:48:59.28

>>129-130
数学はそのレベルの解き方で結構いい所まで言った
でも英語や国語は良くなかった

やっぱ記号接地が出来てないと
そしてそれをMSもGoogleも今は出来てる

2019/07/10(水) 00:51:19.42

>>130
平成の長短除外の法則だなw

んでも今の教師付き学習は多数派が正解になるんだから
大きな枠組みでは変わらんのではないかとも思う

2019/07/10(水) 00:59:49.35

あのプロジェクトは問題設定のセンスが壊滅的に無かった
新井紀子にAIを語ってほしくない
数学もそんなにできないでしょこのｵﾊﾞﾊﾝ

2019/07/10(水) 01:21:52.41

いや、だからあれは検索ＩＦの前処理だろ
ＡＩじゃなくてさ

2019/07/10(水) 05:18:32.19

>>132
ほんとに？どんな感じなん？

2019/07/10(水) 08:50:59.14

>>134
新井さんは
汚いバカ教授どもと交際して、
セックス奴隷となって
そうやってアカデミックに仕事を
得たのだから
その努力は認めるべき。

俺は汚い教授のチンポしゃぶるなど
死んでもイヤ！

2019/07/10(水) 08:52:31.72

>>131
新井は無知で無能だが
フェラはうまいんだろうな(笑)

2019/07/10(水) 08:56:34.77

>>128
2chは爺さんが日頃の欲求不満を書いてるからだろ、理解する気なんか最初からない

2019/07/10(水) 12:32:37.72

新井氏を批判するのは結構だがここでやる意味はないな
ここは機械学習に関する情報を交換する場であってズブの素人がルサンチマンを吐き出す場ではない
日本人エンジニアの邪魔をして足を引っ張っていることに気づいて欲しい

2019/07/10(水) 14:27:00.55

singateで個人情報ダダ漏れ&クラウドソーシングと勘違いさせてるゴミサイトじゃん

2019/07/10(水) 15:22:34.09

>>141
金もらえるならそれでいいかな
そもそも完全にコスト部門だし
基幹システムですら外注に出す今の日本企業が
データサイエンティストとかいう怪しいものを雇うわけが無い

2019/07/10(水) 16:14:59.04

ここはチラシの裏

2019/07/10(水) 20:23:39.98

目的に応じたデータを選択して抽出してくる作業がスキルがいるのに
分析だけを任せるクラウドソーシングにニーズが有るとは思えん

まして、基幹システムも外注に出す日本企業のDBは肝心な指標が抜けてるゴミが多い

2019/07/10(水) 20:32:54.79

>>144
選択して出すだけなら誰でもできるやろ

2019/07/10(水) 20:39:27.40

>>144
その指標を追加ができないんですよ
今の日本企業は
予算ありきの縦割りで基幹システムに追加しようものなら
SIer含め何社が絡む話になるかわからん
たかがデータ分析のためにそんな工数認められるわけが無い
今あるデータでなんとかするしかない

2019/07/10(水) 20:43:50.19

>>146
指標を出せる能力がないだけ

2019/07/10(水) 21:19:13.49

日本企業のIT投資不足が深刻、2025年にはシステム6割が老朽化
http://blog.livedoor.jp/itsoku/archives/54285324.html

2019/07/10(水) 21:24:07.47

司法予備試験の問題、AIが“6割”的中　「合格ラインと同水準」
https://www.itmedia.co.jp/news/articles/1905/20/news122.htm

2019/07/10(水) 21:51:41.87

新井は研究者としてのセンスが皆無

2019/07/10(水) 22:01:56.77

日本の技術も精神論が通用しなくなった途端に終了したな
IT土方より土方の方が息長いしな
下位互換って言われたIT土方

2019/07/10(水) 22:46:49.82

ディープラーニングで音を認識　ほ乳類の脳に近い反応を示す
https://www.itmedia.co.jp/news/articles/1907/10/news134.html

ディープラーニングはほぼ脳と同等だったとのこと

2019/07/11(木) 02:05:20.28

>>152
脳と同等なわけねーだろ馬鹿！

おめーの脳はシナプス1個なんだろうな

おめーはゴキブリが大天才に見えるわけだ(笑)

2019/07/11(木) 03:28:24.18

新井紀子なんてcms作ってただけじゃん
しかも自分でコーディングしてないだけだし
女指導教官の「女枠」でアカポスゲットした、不平等ﾏﾝｺじゃん
なんてデカイ面してるんだろう
厚顔無恥なのね

2019/07/11(木) 07:51:13.83

なるほど読解力ない奴が多いなｗ

2019/07/11(木) 09:01:37.09

>>148
たぶん、問題にはならない

2019/07/11(木) 09:01:46.58

問題のすり替えに気づかれちゃうからね

2019/07/11(木) 10:16:59.48

いつもの日経の煽り記事、ゴミ
「ビッグデータや人工知能（AI）を使うビジネスに、多くの日本企業が乗り遅れる恐れがある」

2019/07/11(木) 11:03:44.53

乗り遅れるだけならまだ救いがあるが
7payみたいに害悪まき散らして
新規登録するジジババを恐れさせて減らして
普及を妨げてるからな

2019/07/11(木) 12:47:41.07

セブンペイとAIとは
全くなんの関係もないのだが
関係あるように見えるのか？

2019/07/11(木) 13:02:42.23

一般人にとっては

コンピュータ = AI

なんじゃないの? AI と言えば深層学習とイコールらしいし

2019/07/11(木) 13:51:00.57

>>158
他のビジネスにも乗り遅れてるから
AIだけ限った話ではない

2019/07/11(木) 18:40:00.58

ピンハネビジネスでは世界最先鋒
副作用もデカいけどw

2019/07/11(木) 18:47:39.33

邦人企業は中抜きが大き過ぎるんだよな

2019/07/11(木) 18:54:42.92

海外は中抜きしないの？

2019/07/11(木) 20:21:30.36

>>162
間抜け、そういう観点ではない

2019/07/11(木) 21:47:07.11

日本の大企業はSIerべったりだし
自分たちで何かできる体制はないよ

2019/07/12(金) 06:10:24.20

>>137
松坂和夫

2019/07/12(金) 06:19:03.94

東大数学科出て
入門書執筆だけ？

数学的業績無し？

そりゃ紀子もダメだわ

2019/07/12(金) 10:40:42.56

数学科出身って理系のくせに業績ゴミな人結構いるよ。

2019/07/12(金) 13:50:46.06

数学科で業績を出すって大変なことだぞ
実験とかシミュレーションとか設計とかでごまかせないから大変

2019/07/12(金) 14:53:06.33

でも読解力があるから

2019/07/12(金) 20:58:15.86

>>171
でも実験系と同じくらい研究に時間とエネルギー投入してるかというと、
そうとうも言えないｗ
結構怠惰な日常にうだうだ流されて無為な月日をおくってる人ゴロゴロいるｗ

2019/07/13(土) 01:13:41.03

成果出さないにも関わらず特に純粋数学の人は物理や統計等で使う数学より優れたことやってると思い込んで上から目線になりがちなのが困る

2019/07/13(土) 05:53:40.04

>>170
森毅

2019/07/13(土) 06:02:21.09

ていうか小規模な村社会の住人しか理解できないことやってるからな
サークル状態

2019/07/13(土) 06:39:50.86

>>175
そんなひどいこと言うたんなや！

2019/07/13(土) 07:47:59.15

大量の会話文をディープラーニングで学習させたら
人間のように自由に会話できるAIが作れそうに思えるのに
実際はそうはなっていないのはなぜですか？

2019/07/13(土) 08:03:36.51

>>178
人間とAIが違うから

2019/07/13(土) 08:12:38.11

>>178
・言葉が現実と結びついていないから言葉どうしの関連性だけ精度を上げても限界がある。
・そもそも学習機能が未熟だから。
・そういう試みが実際にはどの程度行われているのだろうか？

2019/07/13(土) 09:18:51.15

Keras の Xception で画像分類を学習させて、
意図的に過学習の状態を作ろうとしているのですがうまくいきません。

過学習が起きる条件としては
・教師データが少なすぎ
・パラメータが大きすぎ
・エポック回しすぎ
・学習率低すぎ

あたりだと思うのですが、
データの数を減らしても、
全層Trainableにしてパラメータ増やしても
エポック回しまくっても
学習率下げまくっても
val_acc が減らずに増えた状態から動きません

Xception にはなにか過学習防止機能でもあるのでしょうか？
学習率下げまくっても
過学習してくれません・・・

2019/07/13(土) 09:21:57.07

>>178
入力があってモデルがあって出力がある場合において
入力が違う可能性、モデルが違う可能性、あるいはその両方のどちらか

例えばモデルが完全だったとして、その場合は入力が足りていない
狼に育てられた人間が言葉を話せないのが良い例

モデルが不完全な場合、入力が完全であっても再現できない
ペットを生まれた時から育てても、人間と同じように話せない

2019/07/13(土) 09:29:36.13

まだまだハードウエアの能力が低すぎるんじゃないかな
逆に言うと足りないのはそれだけかもしれない
ハードウエアの能力が足りない間はどういうアルゴリズムを
組んでも人間のようにはいかないのかもしれない

2019/07/13(土) 09:51:07.16

>>181
10枚の画像で学習したものが10000枚の画像に適用して高いval_accを維持できるはずはないので、初期値にどっかの重みを読み込んでからスタートしているとかないかな

2019/07/13(土) 10:12:50.19

>>181
過学習の状態になったら
入力の中の本質的な特徴以外の特徴に反応して適切な出力をしなくなる
と思う

モデルが対象のデータ集合に対して
大き過ぎる
とかそんな感じじゃね？

結合を無くすような処理があると
過学習が起きにくくなる説ってある？

2019/07/13(土) 10:33:03.29

>>184
ソースは
https://harigami.jp/cd?hsh=57b55f0d-5c8b-4658-acff-71d2b3485c71
こんな感じで、すごくベーシックな転移学習です
重みがあるとすればImageNetですかね

>>185
なるほど・・・
classが5個だけなので過学習状態でも
テストデータが正解してしまっているということですかね

ちなみにデータセットはkaggleから拾ってきた5種類くらいの花の分類です

2019/07/13(土) 10:51:19.44

>>186
中間層のニューロン数は1024かな
これを2倍とかにして
学習回数を増やしてみるとか？

2019/07/13(土) 11:29:13.15

>>178
りんなを試せば分かるでしょ

2019/07/13(土) 11:31:06.63

遂に機械は文脈を理解し始めました(1/2)
https://webbigdata.jp/ai/post-2233

2019/07/13(土) 14:22:21.81

>>189
そういう
「機械が理解する」という表現が
大嫌いなんだ。
ウソだから。

「人が構文解析のうまい方法を
見つけてプログラミングしました」、
というのが本当のことでしょ？

マジで人工知能の記事って
大げさなウソばっか。
いやになる。

松尾や新井も馬鹿な詐欺師に
しか見えない。

2019/07/13(土) 14:52:17.50

>>190
この2人は本が売れればいいだけだしな
次回作も執筆中だろうしブームに乗って一儲けしたいだけ
学術的な成果はゼロってのはみんな理解してる

2019/07/13(土) 15:41:26.26

いんちきではない
真の成果を出して
発表しましょう

2019/07/13(土) 15:48:51.34

胡散臭い事でも大マジで言ってると金出してくれるバカが世の中にはたくさんいるんやで

2019/07/13(土) 15:53:01.92

BERTを超えたXLNetの紹介
http://medium.com/@akichan_f/bert%E3%82%92%E8%B6%85%E3%81%88%E3%81%9Fxlnet%E3%81%AE%E7%B4%B9%E4%BB%8B-dd243481f70a

2019/07/13(土) 16:08:46.22

人間の意識を機械へ移す
https://www.nikkei.com/article/DGXMZO42868710V20C19A3000000/
https://www.nikkei.com/article/DGXMZO44778940U9A510C1BC8000/
https://tech.nikkeibp.co.jp/atcl/nxt/mag/ne/18/00017/00007/

2019/07/13(土) 17:04:55.31

量子もつれが数学的に解明できない複雑な回路だと発生するのかも

2019/07/13(土) 17:56:24.74

>>190
松尾はともかく新井はまさに(ディープラーニングによって)「機械が理解する」という表現を嫌ってる先鋒だろ

2019/07/13(土) 18:03:08.57

>>196
統合情報理論で意識が生まれるということと
量子脳理論を合わせるとそうなる

2019/07/13(土) 18:04:51.42

>>178
Twitterからツイートとリプライの組を取ってきてディープラーニング(seq2seqとか)で対話するシステムを作ったらちゃんと会話できるかどうか考えてみたらわかるよ

2019/07/13(土) 18:30:37.50

>>195
「コピーロボット作れます」が「意識が生き続ける」になるのは語弊があると思うの。
自分は結局死んでなくなるよねそれ。