【統計分析】機械学習・データマイニング25
レス数が1000を超えています。これ以上書き込みはできません。
2ゲットー!
ズザザザ−!
(超満員の電車内なのでAA貼れない!) AI完全をクリアしてから考えればいい
意識云々いう奴は自己陶酔のオナ猿 多次元尺度構成法ってデータ間のユークリッド距離を見てユークリッド距離をほぼ再現できる別次元のデータ構成をつくりなおすってことで合ってる? いわゆる最小二乗法っていうのは正規線形モデル(つまり誤差項が正規分布に従う仮定の線形モデル)でほかの確率分布を想定するために一般化線形モデル(正規分布以外の分布にも従うことを想定するモデル)があるっていうことでいいんでしょうか?だれかおしえてください
私の認識では正規分布に従う仮定ならばパラメータの推定は最小二乗法という簡単な行列計算で行うことができるけど他の分布の仮定であれば一般化線形モデルのもと最適化アルゴリズムを利用した最尤法を行わなければいけないという理解なんだけどあってるのかな? いわゆる最小二乗法っていうのは正規線形モデル(つまり誤差項が正規分布に従う仮定の線形モデル)でほかの確率分布を想定するために一般化線形モデル(正規分布以外の分布にも従うことを想定するモデル)があるっていうことでいいんでしょうか?だれかおしえてください
私の認識では正規分布に従う仮定ならばパラメータの推定は最小二乗法という簡単な行列計算で行うことができるけど他の分布の仮定であれば一般化線形モデルのもと最適化アルゴリズムを利用した最尤法を行わなければいけないという理解なんだけどあってるのかな? この前の目黒記念449,000円ごっつぁんです( ´∀`)/~~。
ラジオNIKKEI賞楽しみだな。
python一辺倒だったのを、統計解析部分をRに代えてやったら回収率が飛躍的にアップした。
Pythonはデータの取り出しに特化させるのが向いてるみたい。 >>13
それは言語の問題ではない
Rで処理している事をpythonで処理すれば良いだけ
つまり統計処理自体の選択が適切ではなかった
あなたのミスだ >>13
前回うまくいったとして
今後10回とか繰り返したら損するかもしれないよ 統計処理はRの方が楽なことが多いが統計学を理解していれば言語で結果が変わるなど起こらないはず みんな統計検定準一級って持ってる?
機械学習やるなら持ってた方がいいかなって思ってるけどどう? 機械学習に数学は不要
統計学に数学は必要
ゆえに機械学習に統計学は不要 >>19
必要だと思うなら持てばいいじゃん
人に聞いてどうすんの? >>20
機械学習じゃあ中途半端な数学は
意味ないからかなり勉強しないと。
統計学は基本からしっかり勉強すれば
数学は役に立つね
これからは機械学習でも
数学やってないと
淘汰されそうじゃね? アノテーション作成がメインのお仕事なデータ・サイエンティスト系なのかも アノテーション作成って
アルバイトがやるやつ?
まあ、それなら数学いらんわな 面白そうな本を見つけた。
買いでしょうか?かなり高いけどw
昆虫の脳をつくる ─君のパソコンに脳をつくってみよう─
https://www.asakura.co.jp/books/isbn/978-4-254-10277-2/ さっきのサヨナラのランニングホームラン
なんでエンタイトルツーベースにならなかったのか >>15
やってみます。
試行錯誤しながら精度上げていきます。 >>15
10回と謂わずに100レース以上試してベストな方法でやってみます。 >>23
競馬やってるが、極めてくるとプログラミングなんて知識よりも数学の知識が重要になってくる。
プログラミングなんて競馬予想をスムーズに効率的にやるツールに過ぎない。
最終的に数学の知識が必要になる。
極端な話、プログラミングなんてどうでもよくてその時代のベストなツールを組み込んでやれば良いが、ベースは統計学だから。 機械学習ってプログラミングと言っていいのか
ライブラリ作ってる人は凄いと思うが
使う人はなんかマクロ言語使ってる感覚に近いんじゃね
だから言語は何でもいい >>14
恐らくそのようですね。
自分のコーディングの問題ではあると思いますが、統計解析ではRの方が実行速度が速いですね。
特にリアルタイムでオッズ表示してやるものとか。
自分のプログラム自体に問題あるかも(;´_ゝ`)。 >>32
その通り。
中のライブラリ(数学の知識)が重要なんよ。
コーディングだけやるなら大したことないが。 >>30
ベストかどうかは想定内の選択肢の中で一番良い
という事でしかないと思う
想定外のアプローチでより良い結果を得られるかもしれないけどな >>31
統計処理にミスがあったら損する事になるけどな
理論も実践も重要
理論的には実現できるけど実際にやろうとすると
見込み利益よりコストがかかって赤字とかのパターンもある >>34
中のライブラリにないものは自分で作るしかない >>33
結果を得るまでに必要な時間が
必要な時間内に収まるかどうかも問題になる事がある
自動運転とか結果を得るまでに5秒とかかかってたら役に立たない >>32
個人的には電気回路設計にかなり近いと感じている
新しい回路を設計する人はもはや殆どいない
トラ技等の雑誌を見てノウハウを学びつつ、実務では完成されたネットワークを使って変更点のある部分はPICやFPGAでなんとかする感じ 回路パラメータは計算で決められるけど機械学習のハイパーパラメータはそうはいかないんだよな >>36
コストの方がかさむなら理論の時点で間違いだろw 理論が間違いというか、細かい人件費や手数料などどこまで計算に入れるかの問題だろう
あまり具体的に入れすぎても汎用性がなくなって使いにくくなるし、逆にシンプル化しすぎると現実とのズレが大きくなる 人間って視点を移動しながら視野の全体を認識してるけど
これをAIの画像認識にも応用すれば学習コストって大分少なくできるような気がするな
視点の中心に特徴量を集中させればいいだけだからかなり効率的だと思う だからさ、そんなこと誰でも考えるの
アイデアを形にして結果を出せなければ
ただの馬鹿でしかないから。 ランダムフォレスト分類の予測結果に「A」「B」「C」があった場合、
それ以外に確信度が低ければ「わからない」というラベルを
出力することができますか?
それかテスト入力データを与えたら、予測結果だけでなく
確信度的なものを数値で把握したい。
ランダムフォレストは多数決で判定結果を決めているということは
複数の木での意見の一致度とか意見が割れているとかが算出できるのでは
ないかと思います。
判定を間違えるくらいなら「わからない」と言ってくれたほうがいいので。
ランダムフォレスト回帰でも同様のことをしたいです。
pythonのscikit learn RandomForestでこのような機能があったら
教えて頂けるとありがたいです。 そうだな
AIにDNAやRNAと代謝を完全にエミュレーションさせればきっと完璧なはず >>46
できるし
積極的にそういうふうに実装すべき >>45
お前がものを見るときはどうやって視点合わせてんの? >>49
それ医学的科学的に説明できる人いないだろwww
アホすぎwww >>48
すみません、メソッドレベルで教えて頂けると助かります。
該当するメソッドやインスタンス変数などを教えてください。
scikitlearnの RandomForestClassifierと
RandomForestRegressionです。 知ってる人教えてください。
scikitのmlpとRのnnetで同じネットワークサイズにしてるのに、mlpの方が精度がかなり悪いです。どのパラメータをいじれば整合が取れるでしょうか。
nnetのdecay に対応するのがalpha? >>50
世界中さがしても説明できるやついないのかw
そっかw >>55
50だがそういう意味で言ったんだぞ
お前は余計な事考えずに勉強しろ >>57
何が言いたいのかさっぱりわからん
説明できるやつがいないから実装は不可能だと言いたいのか?
それとも説明できるやつがいないからここで議論してもしょうがないよねって言いたいのか?
どちらにせよ論理破綻してるぜ? >>51
誰も答えてあげてなくてかわいそうになってきた
predict_probaで確率出るからそれで弾いて >>54
Rの方はよく知らないけど整合取るには双方のヘルプ・ソースコードとニラメッコじゃないだろうか
nnetのオプティマイザはBFGSだけどscikitのsolverはデフォルトでadam
nnetの損失関数はLeast Squareだけどscikitの方はLog-loss
ヘルプを見る限りnnetのdecayとscikitのmlpのalphaは同じように見える
両方ともL2正則化のペナルティを表すもので、Rのデフォルトが0でscikitのデフォルトが0.0001
いろいろ違いそうだね >>63
ありがとうございます。
なるほど、正則化パラメータ以外もいろいろ違うとこがあるんですね。
整合を取りたいと書いちゃってたのですが、一番の目的はscikitでもnnetと同じ精度以上を出したいというところですので試行錯誤してみたいと思います。 ribesがそんなにいいとは思えない
sentencepieceもそんなにいいとは思えない
ゴミみたいな研究だと思う SIGNATEの武田の創薬やってる人いる?
どうやったら精度上がるか全然分からん >>66
今やってるKaggleの白血病もそうだけど、
AI屋やIT屋の課題じゃないような singateみたけどさ
>(2)最終提出物及び最終審査用提出物に含まれるすべての分析・予測結果及びレポート、分析・予測モデル・アルゴリズム・
>ソースコード・再現法等の説明書等、及び提出物に関する著作権、特許を受ける権利、ノウハウ等すべての譲渡可能な権利(著作権法第27条及び第28条に定める権利及び特許を受ける権利を含み、以下、「本件権利」といいます。)
>のホストその他の当該コンペティションにおける権利譲渡対象者への譲渡に同意すること
ナニコレ。。。 他のデータサイエンスコンペの規約はどうなってるの? 流石にそのまま専属データサイエンティストになれるでしょ SIGNATEって営利目的を想定しているみたいだけど、
どのコンペも提供されているデータ変数がそもそも足りないので実用投入は無理っぽそ この分野もホント人が居ないんだな
技術とは全然関係の無い人間がマイニングでいらなくなったグラボ使って
暇つぶしに本2冊読んだぐらいで上位10%以内に入れるっていう
まーやらんわな今の若い人達がこんなもん SIGNATE結果出してる奴らってやっぱりスタッキングとかでやってるのかな? やれ!
Excelでデータごにょごにょできれば
月100万取れるから。
まじでバブルだ >>89
もうすでに血みどろで真っ赤になって誰も入らんだけだぞ。 とある事情でGPUマシンを無料で使える環境なのでやってみますわ >>89
いいアルゴリズムができると途端に出したくなくなるよ
これを100万ごときで版権込みで全て渡すのか、と思うときが来る 100万とか200万とか安すぎ
優秀な成果にしか賞金出さないのに 入賞しなくても
全部むこうのものになるんだろ?
データサイエンティストをいいように搾取してるだけじゃん?? 何を言っている
優秀だと会社や国に吸われるシステムになっているのが日本だろう
世界で最も中間層の多い国なんだぞ
ダメなものには補助金が出て優秀な奴等からはガッポリ金を吸い取る
高学歴と言っても大半は無駄に頑張らないといけない運命を強制的に背負うだけ
ごく一握りの人間が運的要素によって金持ちになるけど >>98
機械学習本体の部分は渡しても良いんだけど、前処理の部分は自分の人月を考えると絶対に渡したくなくなるレベル >>98
しかし、新卒以外のデータサイエンティストは、
勉強してもこんな場しか与えられなさそうだな
Kaggle上位者であっても年を食ってたらsansanしか拾わないし データ分析はあくまで補助的なツールだしな
日本だと全部外注でいいやとなりそうな気がする ビジネスを回せないデータサイエンティストは単なるデータ処理屋でしかないからな >>105
昨年まではTDAが最新だったが
今はDTかなあ?
勉強してるけど追いつけない! いわゆる最新のアルゴリズムだと、その解きそのときに巷でもてはやされたものが
手短な目先の成果や収益のために安直に消費される分野に、
発展性や将来性があるのかというと、疑問で
やはりバブルだったんだろうな
N○Iの粗いとか こんな気になるまとめを発見。
東ロボくんの生みの親《新井紀子》教授の間違いが明らかになった日。人間は人工知能に読解力でも負けつつある
https://togetter.com/li/1285134
どういうものなのか、よく分かりません。
AIが人間のように文章の意味理解が可能になったのでしょうか? 可能になったようだ。
囲碁の時と同じく、技術の変化が速すぎて
学会レベルでも追いつけていない 新井さんは元々(AIではなく)若い人の読解力の無さを嘆いていた
何を間違いと言っているのかわからんが、もうとっくに大半の人間の読解力よりAIの方が優れているることは
彼女は指摘済み 読解力テストってどんなん?
東ロボ君も国語は得意だったような >>112
変てこチューリングテストに過剰最適化したのでないといいきれますか? 現代文、フィーリングで解ける人いるよね。言葉をちゃんと使える大人も少ないから、自分で勉強しないと。君は大人を超えてくれ。フィーリングは大切に。
https://www.youtube.com/watch?v=AxQjF0WS7Yc
現代文勉強法 偏差値29から最短で偏差値62になる勉強法
https://www.youtube.com/watch?v=iXeADsgRq_g
#よなたん #大学受験 #勉強法
【現代文】保存版!9割取れる参考書カリキュラムと勉強法
https://www.youtube.com/watch?v=OtUkb2rJjZw
現代文が苦手な人のための現代文勉強法
https://www.youtube.com/watch?v=fNSdHsq1gT0&t=269s
【開成→東大卒が教える】現代文の勉強法 基礎編! 理解のための4ステップ
https://www.youtube.com/watch?v=U7vhQaVPX0I
現代文の勉強法〜屁理屈なし!高1でも半年で東大過去問を解く参考書の選定と使い方
https://www.youtube.com/watch?v=3o_xk0LUEq8&t=754s
偏差値44から東大・京大・早慶上智に合格する大逆転勉強法(現代文編)参考書の使い方
https://www.youtube.com/watch?v=01NhY57R0Dk
阪大生が教える『田村のやさしく語る現代文』を活用する3つのポイント〜現代文の基礎を確立しろ
https://www.youtube.com/watch?v=BK3f7-6MZfc
どう勉強すれば現代文の成績が上がるの!?【馬場センセイの大学受験1問1答vol.13】
https://www.youtube.com/watch?v=TZoukTmSM2s
現代文の勉強法(全部入りVer.)|教科別勉強法
https://www.youtube.com/watch?v=CCdZCd32R2I
『きめるセンター』だけでは早稲田の現代文はツラい。高田先生も苦戦した『現代文と格闘する』は「やるべき!?」or「やらなくてよい!?」
https://www.youtube.com/watch?v=QfRkyQ2ryC0 >>110
文章を見て、その文章から絵や動画みたいなものを
自在に再現できるか?あるいはイメージできるか?
これで勝負するという訳で、
少年が通りを駆けて行った
という単語で、少年が町の中か田舎道か知らんがそこを
半ズボンでも履いて全力で走っていく動画かアニメみたいなものを
イメージできるか
人間なら、本が読める人ならこれはイメージできる、ということになっているが
実際に例えば大人向けの小説を読ませて、それらのイメージを脳内に描きながら
読める人はそんなにいない
だから偏差値63以上でないと文章の内容をイメージできない、なんて
言われている
本なんて幾つかの単語を拾ってフィーリングで読んでいる人の方が多いんだ、
などというのだ
新井氏のグループは、最後までその再現を十分な精度で達成できないまま
東ロボ計画も終了してしまった
だが、MicroSoftとかアリババとかが、その再現に相次いで高精度で成功し
最近では人間の出すスコアを完全に上回るようになってしまった!
なお新井氏のグループは機械学習すら十分に使いこなせていなかった?
なんて言われている始末 そもそも新井は研究業績もショボいんだよね
あんな大規模プロジェクトのリーダーには無理があった
NLP界の小保方 >>123
それって文章からそれらしい画像を検索したか生成したかってだけだろ
それで文章理解とか片腹痛い
だいたい「新井氏のグループ」とか書いてる時点で東ロボの実施体制を全然知らないってバラしてるも同然だからクソ黙ってろって 言語解釈からテスト問題の理解と回答につなげるとか
とんでもない溝があるような 2ちゃん見てれば人間でもほとんど読解できてねーじゃんとか思うし、AIには無理だろ。 それでも幾何とか微積分とか
人間がちょっと手直しすれば機械的に解けちゃうレベルにはあるんだろう
かなりのもんじゃないか 文章題のキーワード及び回答の選択肢のキーワードを抽出し、検索エンジンにかけて
ヒット数が多い方が正解の可能性が高いとか、そのレベルで人気知能を騙られると
まじめに研究している人が気の毒だわ。少数はだけどw
舐めきってる 東ロボが失敗したのは
新井紀子が無知で無能だったから >>129-130
数学はそのレベルの解き方で結構いい所まで言った
でも英語や国語は良くなかった
やっぱ記号接地が出来てないと
そしてそれをMSもGoogleも今は出来てる >>130
平成の長短除外の法則だなw
んでも今の教師付き学習は多数派が正解になるんだから
大きな枠組みでは変わらんのではないかとも思う あのプロジェクトは問題設定のセンスが壊滅的に無かった
新井紀子にAIを語ってほしくない
数学もそんなにできないでしょこのオバハン いや、だからあれは検索IFの前処理だろ
AIじゃなくてさ >>134
新井さんは
汚いバカ教授どもと交際して、
セックス奴隷となって
そうやってアカデミックに仕事を
得たのだから
その努力は認めるべき。
俺は汚い教授のチンポしゃぶるなど
死んでもイヤ! >>131
新井は無知で無能だが
フェラはうまいんだろうな(笑) >>128
2chは爺さんが日頃の欲求不満を書いてるからだろ、理解する気なんか最初からない 新井氏を批判するのは結構だがここでやる意味はないな
ここは機械学習に関する情報を交換する場であってズブの素人がルサンチマンを吐き出す場ではない
日本人エンジニアの邪魔をして足を引っ張っていることに気づいて欲しい singateで個人情報ダダ漏れ&クラウドソーシングと勘違いさせてるゴミサイトじゃん >>141
金もらえるならそれでいいかな
そもそも完全にコスト部門だし
基幹システムですら外注に出す今の日本企業が
データサイエンティストとかいう怪しいものを雇うわけが無い 目的に応じたデータを選択して抽出してくる作業がスキルがいるのに
分析だけを任せるクラウドソーシングにニーズが有るとは思えん
まして、基幹システムも外注に出す日本企業のDBは肝心な指標が抜けてるゴミが多い >>144
その指標を追加ができないんですよ
今の日本企業は
予算ありきの縦割りで基幹システムに追加しようものなら
SIer含め何社が絡む話になるかわからん
たかがデータ分析のためにそんな工数認められるわけが無い
今あるデータでなんとかするしかない 日本の技術も精神論が通用しなくなった途端に終了したな
IT土方より土方の方が息長いしな
下位互換って言われたIT土方 >>152
脳と同等なわけねーだろ馬鹿!
おめーの脳はシナプス1個なんだろうな
おめーはゴキブリが大天才に見えるわけだ(笑) 新井紀子なんてcms作ってただけじゃん
しかも自分でコーディングしてないだけだし
女指導教官の「女枠」でアカポスゲットした、不平等マンコじゃん
なんてデカイ面してるんだろう
厚顔無恥なのね いつもの日経の煽り記事、ゴミ
「ビッグデータや人工知能(AI)を使うビジネスに、多くの日本企業が乗り遅れる恐れがある」 乗り遅れるだけならまだ救いがあるが
7payみたいに害悪まき散らして
新規登録するジジババを恐れさせて減らして
普及を妨げてるからな セブンペイとAIとは
全くなんの関係もないのだが
関係あるように見えるのか? 一般人にとっては
コンピュータ = AI
なんじゃないの? AI と言えば深層学習とイコールらしいし >>158
他のビジネスにも乗り遅れてるから
AIだけ限った話ではない ピンハネビジネスでは世界最先鋒
副作用もデカいけどw 日本の大企業はSIerべったりだし
自分たちで何かできる体制はないよ 東大数学科出て
入門書執筆だけ?
数学的業績無し?
そりゃ紀子もダメだわ 数学科出身って理系のくせに業績ゴミな人結構いるよ。 数学科で業績を出すって大変なことだぞ
実験とかシミュレーションとか設計とかでごまかせないから大変 >>171
でも実験系と同じくらい研究に時間とエネルギー投入してるかというと、
そうとうも言えないw
結構怠惰な日常にうだうだ流されて無為な月日をおくってる人ゴロゴロいるw 成果出さないにも関わらず特に純粋数学の人は物理や統計等で使う数学より優れたことやってると思い込んで上から目線になりがちなのが困る ていうか小規模な村社会の住人しか理解できないことやってるからな
サークル状態 大量の会話文をディープラーニングで学習させたら
人間のように自由に会話できるAIが作れそうに思えるのに
実際はそうはなっていないのはなぜですか? >>178
・言葉が現実と結びついていないから言葉どうしの関連性だけ精度を上げても限界がある。
・そもそも学習機能が未熟だから。
・そういう試みが実際にはどの程度行われているのだろうか? Keras の Xception で画像分類を学習させて、
意図的に過学習の状態を作ろうとしているのですがうまくいきません。
過学習が起きる条件としては
・教師データが少なすぎ
・パラメータが大きすぎ
・エポック回しすぎ
・学習率低すぎ
あたりだと思うのですが、
データの数を減らしても、
全層Trainableにしてパラメータ増やしても
エポック回しまくっても
学習率下げまくっても
val_acc が減らずに増えた状態から動きません
Xception にはなにか過学習防止機能でもあるのでしょうか?
学習率下げまくっても
過学習してくれません・・・ >>178
入力があってモデルがあって出力がある場合において
入力が違う可能性、モデルが違う可能性、あるいはその両方のどちらか
例えばモデルが完全だったとして、その場合は入力が足りていない
狼に育てられた人間が言葉を話せないのが良い例
モデルが不完全な場合、入力が完全であっても再現できない
ペットを生まれた時から育てても、人間と同じように話せない まだまだハードウエアの能力が低すぎるんじゃないかな
逆に言うと足りないのはそれだけかもしれない
ハードウエアの能力が足りない間はどういうアルゴリズムを
組んでも人間のようにはいかないのかもしれない >>181
10枚の画像で学習したものが10000枚の画像に適用して高いval_accを維持できるはずはないので、初期値にどっかの重みを読み込んでからスタートしているとかないかな >>181
過学習の状態になったら
入力の中の本質的な特徴以外の特徴に反応して適切な出力をしなくなる
と思う
モデルが対象のデータ集合に対して
大き過ぎる
とかそんな感じじゃね?
結合を無くすような処理があると
過学習が起きにくくなる説ってある? >>184
ソースは
https://harigami.jp/cd?hsh=57b55f0d-5c8b-4658-acff-71d2b3485c71
こんな感じで、すごくベーシックな転移学習です
重みがあるとすればImageNetですかね
>>185
なるほど・・・
classが5個だけなので過学習状態でも
テストデータが正解してしまっているということですかね
ちなみにデータセットはkaggleから拾ってきた5種類くらいの花の分類です >>186
中間層のニューロン数は1024かな
これを2倍とかにして
学習回数を増やしてみるとか? >>189
そういう
「機械が理解する」という表現が
大嫌いなんだ。
ウソだから。
「人が構文解析のうまい方法を
見つけてプログラミングしました」、
というのが本当のことでしょ?
マジで人工知能の記事って
大げさなウソばっか。
いやになる。
松尾や新井も馬鹿な詐欺師に
しか見えない。 >>190
この2人は本が売れればいいだけだしな
次回作も執筆中だろうしブームに乗って一儲けしたいだけ
学術的な成果はゼロってのはみんな理解してる いんちきではない
真の成果を出して
発表しましょう 胡散臭い事でも大マジで言ってると金出してくれるバカが世の中にはたくさんいるんやで 量子もつれが数学的に解明できない複雑な回路だと発生するのかも >>190
松尾はともかく新井はまさに(ディープラーニングによって)「機械が理解する」という表現を嫌ってる先鋒だろ >>196
統合情報理論で意識が生まれるということと
量子脳理論を合わせるとそうなる >>178
Twitterからツイートとリプライの組を取ってきてディープラーニング(seq2seqとか)で対話するシステムを作ったらちゃんと会話できるかどうか考えてみたらわかるよ >>195
「コピーロボット作れます」が「意識が生き続ける」になるのは語弊があると思うの。
自分は結局死んでなくなるよねそれ。 人間が理解しているかどうかを他者がちゃんと判断するのも難しい
結局理解度テストみたいなやつのスコアで評価するしかないよね
「AIがテストで高得点を取れたら理解していますね」がおかしいというなら
理解しているかどうかを判断するのに何をすればいいのか 文章認識は入力に対して、出力出してるだけ。つまり只の関数。
『理解する』という表現は正しくない AIが「理解する」という表現を嫌うのは、理解が人間にしかできない崇高な営みであってほしい願望からくる防御反応なのかな >>196
出力はあるけれど
内部が少し変化したら
出てくるかわからない
といった具合
それは計算してみないとわからない
という感じ
人間には主観があるし >>203
モノに対して記述されたものなら、人間もAI も似たようなものですが、
心を持つもの、人間とか、に対して記述されたものについては、AI の解釈は頓珍漢です >>204
脳医学の人の方が人間の脳をモノとして捉えてそうだよね
手のひらに乗せた1500グラムに満たないモノがなぜこれほどまでに理解が出来るのか、という神秘さは普通の人間の感覚であって
脳医学の人はちっちゃいパソコンと思ってそうだ 人間の活動なんて単なる化学反応の固まり
虫と基本的におんなじ
勝手に高尚なものと思ってる >>195
すげー胡散臭いw
よくわからんのだが、人間の左脳半球と右脳半球に
半導体を取り付けるという意味ですか?
テセウスの船問題で、本当に元の人間だと言えるのか?
移植が完了しても、元の人間も存在しているはずでしょ?
記憶を機械に徐々にコピーしただけで、機械の私はコピーでしょ? >>203
突き詰めたらとは?
何か論拠を示してください。 >>204
意味嫌う感情はないが、勝手に解釈されるのは不愉快ですね。
上でも述べてますが、何か根拠を示してください。個人的な私見に興味はないですね。 >>213
人間の感覚器官で捉えた物理や化学的な事象は
人間というシステムへの入力とみなせる
人間の体内では神経や脳内を電気信号や化学物質で伝わる
出力として行動をしたり会話つまり通信したりする
それが他の人の入力となって、、、
同時並行で入力と出力が複雑に関連しつつ繰り返される
全宇宙の物理、化学のシステムを記述できれば
過去から未来まで全て記述できるはず >>215
214ではあなたの言葉ではなく、何か文献を出せと言っているだが ちなみに私の個人的な私見だが
>>215の理屈はまともだとは思えない >>213
脳の仕組みとか電気信号とかはさておき、文章を読んで考え、出力するという振る舞いだけに着目することを突き詰めると表現した。
あなたの言う理解がどういった状態を指すのか分からないから話が噛み合ってないと思う >>219
>>202にて『人間も同じく関数だ』という主張が貴方だけの主張なのか、一般的なものかどうかを問うているだけなのですが…。
イエスかノーで答えを求めているだけ。また、イエスならば何か文献を示してください。 人間イコール関数ではなく、特定の振る舞いに着目してブラックボックス化すると関数とみなせるってだけ
文献も何もなく、科学の俎上に乗せるための一般的な手続き
チューリングテストだって入出力だけに注目する事で人間とAIを同列に比較できるようにしてるでしょ? 只の関数だと「理解する」という表現が正しくないっていう主張に同意できないんだけど
理解するという言葉の意味を共有出来ていない状況で議論しても無駄な議論にしかならないだろうね >>198
統合情報理論はその物体に意識があるかどうかを確認する時に使う数理だぞ?
勘違いしないように。
意識を作る理論は自由エネルギー原理だ。 >>217
この考えはAIの研究者がテレビで言っていた考えだ
あなたがどう判断するかは自由だ
考え方は多様であるほうがいい >>220
一般的というのはどういう意味?
多数派かってこと?
入力を受けて出力するシステムだとみなすことは可能でしょう 入力→出力をするシステムを関数と呼ぶとしても
その関数が単純なものとは限らないよ
どんな仕組みで入力→出力をしているのか
それを突き止める活動をいろんなアプローチで
実現しようとしているんじゃね? >>232
半導体の中で生成と検出という記事なら見たことある >>212
どちらかというと移植に近い感じがするなぁ
心臓移植みたいに全部取り替えるわけには行かないから
部分的に少しづつ慣らすのは医師の発想だね
ベンチャーの方は普通の機械学習で安定的な収入源って感じだね >>223
まさに「理解」できてないAIでもできそうなレスやな 「理解」なんてものは勝手にそうだと「認識」しているだけの状態
高尚なものでもなんでもない >>236
そのとおり
因果関係とは人間側が設定した主観にすぎない アリババ「DAMO」のAIプログラム、言語理解で新記録を達成
http://www.technologyreview.jp/nl/alibaba-has-claimed-a-new-record-in-ai-language-understanding/
アリババが開発した人工知能(AI)プログラムが、読解力のテストで史上最高点を記録した。この結果から、機械による文章や話し言葉の処理能力が、着実に向上していることが伺える。 AIは入力に対して、出力出してるだけ。つまり只の関数。
『理解する』という表現は正しくない >>229
生物学的に認められていることかどうか? >>235
あなたの回答形式がサラリーマンからみたらNGという話 >>228
一般的なものになってない、一部の人間が勝手に述べているのであれば、『理解する』は正しいとすることに対して、突っ込みをいれる根拠になってない。
あくまで私見として述べるべきですね。 245を訂正
>>228
一般的なものになってない、一部の人間が勝手に述べているのであれば、『理解する』は正しくないとすることに対して、突っ込みをいれる根拠になってない。
あくまで私見として述べるべきですね。 >>242
職業なんかどうでもいいじゃん
AIの理解についての議論をしようよ >>246
理解するという表現が正しいことは実験とかで確認できるまでは仮設ですね
アインシュタインの相対論にしろ量子論の説にしろ
実際に実証されるまでは仮設に過ぎない
〇〇ではないと言ったところで
沢山ある可能性の一つを否定しただけで
情報量としては比較的少ないですね
そもそも理解とは何かが明確になっていないから
正しいとか正しくないとか議論しても答えにたどり着かないと思います >>248
そもそも多数の文献にて関数として表現されているAIの動作について、『理解する』は正しくないとの主張はそんなにロジックとしてずれてないように思います。
意義を唱えることがそもそも突拍子な話。なんであなたの主観に合わせないといけない? 夢中になってデータ分析してたら、
ご飯を焦がしてしまった。
たまにやってしまうんだよなあ >>249
関数→理解するは正しくない
このロジックには飛躍があって真か偽か判りません
なぜ関数ならば理解するが正しくないのか?
あと、多数だから正しいとも言えないですね
有名なのはガリレオの地動説 >>255
関数で出力すると理解する
なんの関係性もない。
だから正しくないと言った。
多数だからではなく、文献としてなにもないから、只のあなたの主観と言わざるを得ない。 まずは>>256にイエスかノーかで答えてください。
もうそれで解決です。 一つまたずれました。
まずは>>257にイエスかノーかで答えてください。
もうそれで解決です。 理解する、というのは人間側の主観ですから
「因果関係」自体が人間の主観の産物ですし 私がずっと聞いているのは>>257です。
いらん横やりは不要です。 野球盤みたいな環境で強化学習を使ってバットの振るタイミングを平均的に広角に打てるよう学習させるってのは可能なの?
グラウンドを3つのコースに分けて状態を
[左に打った回数,真ん中に打った回数,右に打った回数]
として
行動はバットを振るタイミングでボールが出てから
[○秒後,○秒後,○秒後]
みたいにして設定すればいけないかな
報酬は全方向の回数が一致すればプラスで差が離れ過ぎたらマイナスって感じで
誰か強化学習詳しい人教えて 二年ぶりくらいにwikipedia見たら日本語版記事もぼちぼち増えてるんだな。
それでも低投稿数だが いまPythonで機械学習のお勉強中なんだけど
数学がさっぱりで辛いンゴ 機械学習に必要な数学は
頻度論統計
ベイズ統計
検定全般
最尤法
線形代数
回帰分析
こんなところでいいのでは?
機械学習っても結局は統計で最適解見つけるだけのことだし もう少し言うと線形代数における微積分かな。
まともに計算してる部分て多変数ガウス分布に対する計算くらいのもんよ。 非線形問題を線形代数で解くのは普通だけど
線形代数における微積分ってなんだ?初耳だわ あーヘッセ、ヤコビアンのこと言ってるのかw
線形代数における微積分っていうよりベクトル解析とか言った方が良いかも いやただの連鎖律の計算だよ。
この辺まともに計算できりゃそんなに問題ない。 勉強する必要性はあまり感じないが、二重数(複素数のようにε^2=0, ε!=0なる数を導入する)を使うと自動微分ができる話が面白かった 量子力学とは無関係なのに量子化とか
CSの用語が紛らわしい >>254
> お前は炊飯器かw
鍋の焦げ付きを落としましたw
自動の炊飯器は持ってなくて、鉄製の鍋にてガスコンロで炊いてる
だいたい16分から18分ぐらいで炊きあがるんだけど
その間にデータ分析にとりかかると火にかけてるの忘れてしまうんだよね
データ分析のほうは、時系列の分析でLSTMがうまくいかなくて
RNNでやってみようと取り組んでるところ。
こういう試行錯誤って、数学は役に立たないね
体力のほうが役に立つかもしれないwww - 基本を身に着けていない者が物事を無駄に複雑にする -
昔の哲学者はいいことを言ったものだ。 じゃ、機械学習の基本は統計学であって、その基本は確率論だから
確率論がわかってない奴が複雑にするということ?
じゃ、お前も含めてこのスレの住人全員じゃん! ここはプログラム板
いわゆるプログラマなんてこんなものですよ
基本の意味も理解出来ていないで
人をバカ呼ばわりする
これがこの業界の状況 至るところで機械学習・データサイエンスの講義開催するとこ増えてるけどどれくらい効力あんじゃろ
京大のは受けてみたい 実際測度論だの多様体論だのは機械学習にどれくらい関わってくるんだろう
少しは勉強した方がいいのかな 学生ならばやれるだけやってたほうが良い。社会人になるとやれることが少なくなる。 〜の分野だけで十分と言わず、他のエンジニアとの差別化のためと考えたら良い SVMの時に出てきたマージンというワードが
DNNでも出てきた 機械学習に数学なんていらないよ
測度論も多様体もいらない 真面目に確率過程なんかを勉強すると加法族とかフィルトレーションとかの測度論用語が出てきて
これが分からないとストレスが溜まる
理論を正しく理解するのであればやっておくに越したことはない
どのレベルを目指すかによって学ぶレベルも変わってくるんじゃなかろうか 数学はいる(いらない)と主張する時、自分が機械学習でしていることも併記してほしいな そういった意味では
確率輪より関数解析が重要度が上ですね。
CNNによりスペクトルの分解ができていること、ハイパーパラメータを連続に変えて分解したときにどのような結果になるかなど、実際に面白い結果が得られてます。 いずれも測度論により、空間の完備化の話が容易になる、ということを理解していれば、測度論ははしょりぎみで問題ありません。 機械学習は統計数学、情報幾何に分類されがちだか、関数の最適化という視点で考えたとき、関数解析のほうに重点を置くべきかなとよく感じる。 >>296
数学はいらない
機械学習のwebアプリリリース >>297
それは確率論のモデルの範囲の中で
上手くいくパラメータを見つけていることじゃね こんな感じだと思う
戦略→確率論とかニューラルネットワークとかの方式選択
戦術→最適パラメータや重みを見つける
実現するには両方必要 >>283
こういう開催情報ってひとまとめになってるところある? 数学は測度論まで必要
仕事は他企業から依頼されたデ―タ分析やってるので
詳しい説明を求めらることあるので
数学は必要
自社のデータ分析だけで、かつ上司が馬鹿なら
数学は要らないと思う ルベーグ積分わからないのに統計やってる人が信じられない
基礎中の基礎だよ?
経済学部の人でも理解してる可能性が高いのに 大概の確率・統計の問題は暗黙の了解事項でなんとかなっちゃうからね 数学いらないって、機械学習のアルゴリズムひとつも分からんのとちゃうの(・ω・) >>301
違いますね。
近似する関数が唯一なものに成りうるかを議論するには基底にとる関数の空間で考えたほうがよい、ということです。
何故かこの部分はしょられぎみで残念ですね。
カーネル法などはこの考え方があるからカーネルトリックなんてものが流行ったのに。 >>305
ルベーグ積分やらなくても工学部卒業できるじゃないですかー 工学部でルベーグはやらなかったが、大学院で微分幾何と多様体の授業はあったよ。
誰一人としてそれが相対性理論などに応用されてるなんて気づかなかったが… >>308
基底ベクトルが見つかったとして
それで目的のパターン認識などが可能かどうかは判らないのでは? 基底を使ってフーリエ展開できることがわかっていればいいだけ、収束なんかきにしない、馬鹿乙 scikit-learnに実装されてるそれらしいアルゴリズムとハイパラを片っ端から全部試して一番目的に合ってる奴を選べば数学など不要w
どうせ論文のアルゴリズムを自分で実装できる奴は限られる 最低限の数学や統計の知識は無いと打ち合わせで恥をかく
PGみたいに土方だけって仕事は少ないし >>314
悲しいけど実務だとこれなんだよなあ
むしろデータの前処理どうするかとか
巨大なデータセットをどうパイプラインに乗せて
並列で扱うかとかそっちの方が面白かったりする罠 測度論知らないが、データサイエンティスト名乗って給料貰ってる 面積は本当に面積なのだろうか?
みたいな禅問答するやつでしょ?測度論ってw いや普通に公理化するから。
測るものと計らないものを明確にするだけ。 測度論なんて完備なベクトル空間を構築できるかどうかな話。正直どうでもよい。
が、
測度論がわからないと数学の確率論の本が読めない。そんだけの話。 一般人の述べる確率論と数学科の確率論はイメージが違う 優先度はあるよ。
んなものやるぐらいならロバスト制御とデジタルフィルタ使ってロボットでも動かしてたほうがよい。 ところでここでいう統計とはなに?
主成分分析ぐらいはできたらOK? >>305
経済学には数学が必要
機械学習には数学はいらない
それだけの話
「経済学部の人でも」の意味が分からないね 「数学」を知ってることが唯一のプライドなんだろ、察してやれよ(苦笑) >>332
まあ片っ端からは大げさだけど、グリッドサーチとか事実上そういうことでしょ
GoogleのAutoMLとかも並列で各種手法・ハイパーパラメータを回してるんだろうし 測度論を勉強した時に唖然となったのは点の面積はゼロ
それが測度論のつじつま合わせかよと愕然としたな えぇえ−!?
点の面積0で唖然?????
じゃ点の面積がいくらならいいと思うの? 理解してもない話題をさも理解しているかのように語るのはやめた方がいい 面が点の集合なのに点の面積0だったら常に面積0じゃん 相変わらずメチャクチャだな
測度論知らんオレでも算数の基礎ぐらいは分かっとるぞ カントール集合とか言い出すならまだしも点の面積が0に驚愕とか
小学生でも点は長さも面積も0くらい理解できるだろうに
知ったかしているのがバレバレだわ
そうでなければ単純にセンスない
ま、機械学習に数学はいらないから別にいいけど >>336
どの発言に言ってるのか?
アンカーぐらいつけられんのか馬鹿
Fランの馬鹿は自分が知ったかだからといって
他人まで同じと見るから困る
日東駒専レべルに多いんだよ(笑) >>334
点の面積をいくつに定義しようが自由なんだよ ほー
点の面積を1平方cmとか定義すると
半径1cmの円の面積はいくつになるんだ?
頭の良い回答をお願いします >>341
>どの発言に言ってるのか?
お前に日本語能力がないだけなんだよなぁ 何億倍も頭の良い天才が築き上げた数学より自分の直感の方が正しいと思うのは傲慢過ぎる 今活躍してるデータサイエンティストに抜き打ちテストで
確率分布の導出や計算を手でできるかやってみたいわ 点の面積を0にするという定義の話と
そこから導かれる推論が完全かつ健全だと
いう話と両方あるからなあ 論文書かないなら測度論なんて必要ない
小難しい議論は補足資料に押しやられてるし、論文読んで自分で実装したりするにも細かいところは飛ばしても問題ない
でも書くなら避けられない AIをそこそこ練習するにはどの位のPCが必要なのかな。 GPUも最低どの位? CUDA覚えるとおもしろいよ
GPUだとメチャ高速化できる >>355
なんでその質問をするのか、ということだが? >>343
その答えは中学生でもわかると思うぞ?
ホント馬鹿だな(笑) >>358
頭の悪い回答ありがとう
せめてもう少し捻れや 数学分からなくても大丈夫っていうのは単にその人が数学を必要としない業務しかできていないだけ
芸能人が「学校の勉強なんて社会出たら役に立たない」と言ってるのと同じで、そりゃお前がそういう仕事を選んだだけだろ、ということ うんうん、だから機械学習に数学はいらない
機械学習ってのはそういう分野なんだよ データ活用のデの字もなかった職場がAIを活用しようって話になってどこで聞きかじったのかオートエンコーダって単語をやたら聞くようになった
そんなに万能だっただろうかと思いながら聞いてたけどこういう職場の案件に当たる人は大変なんだろうな >>360
冗談じゃなくて本当にわからないの?
まじで心配になってきた。
学歴は?
もしかして中卒とか? まさかこの分野で学歴にこだわる人がいるとは思わなんだ。
必要なのは実力だよ。 >>343
その定義された点何個で円が埋まるかを考えればいいよ
その例の場合、一個の点がすでに1cm^2の大きさで円のサイズを超えているので、円よりも小さい1/4サイズの点で円を埋めることを考えよう
そうすると隙間ができてしまうので、さらに小さいサイズの点で隙間を埋める
この作業を繰り返すと、無限に小さい点で円の隙間を埋めることになるよ
結局、点の個数を数え上げると、スタートの点のサイズの定義がいくつであっても、π cm^2 になるよ 一個の点のサイズは円よりも小さかった
思慮が足らなかった
反省 >>367
学歴は関係ないとおもうけどさ、
あまりにバカな質問するので
実力ないと思うぞ?
すごくバカだから
自分がバカということを
理解できないのだろう。
まあ、気にするな。
NTTデータ先端技術のデータサイエンティストは
みなそのぐらいバカだからw >>369
円の中に重ならないように点を4つ入れると
・円内の点の面積合計は4
・円の面積はπ
→円の面積<円内の点の面積合計
になる
この矛盾をどう説明するにでしょうか? 人をバカバカ言う割に自分では何一つ賢いことを言えないアホが一人いるなw
ID:dS2eQ1SuM >>373
自分がバカだってことを知らないんだよ
多分一生気づきもしないだろうね 他人を批判するのが実力だと思ってるんだろw
自分じゃ何もできなかった民主党と同じなw >>372
点に面積がある、と決めた時点で、円の面積を超えた点の数を円の中に入れることはできない、としないとダメかな 俺は能力ないから月給130万しかないが、
隣にいる画像認識のスペシャリストは
月給350万だからなあ。
ま、偉そうに言うのだから彼ぐらい
もらってるんだろう
まったくうらやましいよ(^◇^) >>377
一月を20日くらいに定義するとお前と同じくらいの月給だわ 画像認識のスペシャリストってどうスペシャリストなんだろうか。
確かにCNNが流行る前は奥の深いジャンルであったけど >>373
バカになにいっても
理解できないだろ
バカレスばっかだし
低学歴のバカのくせに
自尊心だけあるんだな
朝鮮人のようだ(笑) 点に面積があるとすると
円の中に点を複数入れると円の面積を超えてしまう
よって点には面積はない
照明終わり >>384
少しは教養のある書き込みしてみろよ
頭悪そう としか感じないよ もうその辺でいいから、あとはマッド・データサイエンティストになってみんなを見返してくれ
変態関数発明して世界中の変態のカリスマになるとか 自然言語処理のスペシャリストなら分かる
俺は画像処理の底辺"だった"けど、opencvを使えて
R-CNNのことをまあまあ分かっていれば、トップ連中とも大して変わらなかったわ
cやjavaで画像処理を行う求人があるの、要するに、まともに機械学習のライブラリを使えなくても
実務で通用しちゃうことの裏返しだからね
しかも、画像処理の研究はここのところ頭打ちで、斬新な研究成果が出にくくなってる
ある意味でもう終わったジャンル。仕事はあるけど 中小企業向けの画像処理の仕事がまだあるの、
学習用のPCをネットとつなぐだけで、データを外部に流出させるリスクが発生するような
人たちが、まだ世の中にたくさんいるから、オフラインで動くシステムに需要が
ものすごくあって、そこがグーグルなどの超大手が参入できない穴場になってるからだよ
誰かがフリーの汎用画像処理ソフトを配布したらみんな討ち死にする世界 ただ画像処理の仕事、お給料が高いから手っ取り早く稼ぎたいなら悪くないけどね
普通の仕事よりはキャリアになるし でもjavaで画像処理を行う仕事はオススメしない
レガシーっぽいコードと、機械学習のライブラリをただ繋ぐだけのお仕事
評価の仕事がたるい。将来性のないライブラリを使わされる精神的苦痛
ああ、時間の無駄だった… でもjavaで画像処理を行う仕事はオススメしない
レガシーっぽいコードと、機械学習のライブラリをただ繋ぐだけのお仕事
評価の仕事がたるい。将来性のないライブラリを使わされる精神的苦痛
ああ、時間の無駄だった… ちな、オススメはpython
就職先は自然言語処理のエンジニアがいいんじゃないかなあ >>394
自分がやりたい事と
お金を出して依頼してくれる事は
一致するとは限らないからな
基本的には依頼されなければ仕事にならない >>395
俺が聞いた話だと、まだ儲かってるけどそろそろ大手メーカーが同じ市場に参入するから、
いずれ儲からなくなるとかなんとか
あとあれは画像処理というより、組み込みの仕事だよね
自然言語処理は意外と仕事があるらしい >>400
せやろ、自然言語なんかそうやすやすと専門家になれるわけがない 画像処理、NLPとあるけども、そろそろそれぞれドメインに特化する時代に入りそうな気も >>401
そうね、画像処理よりは入りにくいわ
>>402
ずっと前からそう
自然言語処理と画像分析の中間領域の仕事も結構あるんだけどね
受ける会社がないみたい。たぶん開発コストでわりに合わないんだと思う お客さんから画像つきのメールが送られてくる仕事とかね DL4Jの糞仕様について誰か一緒に愚痴を書かないか
画像処理関連の求人は、なんでまともに使ってないツールを採用条件に書くんだ
あれか、実はopencvしか仕事に使ってないことを、外部に露見させるのが嫌なだけか DL4J、前処理関連の機能が弱すぎて、マジで辛かったんだが 勢いありそうなのでこっちにもすいません、質問です。
初心者です。バカっぽい質問で恐縮ですが、深層系で新しい構成のモデル考える時って、その構成の中の各レイヤーで一体何がなされてて、だからこういう構成なんだ、ってわかって組み立てるものなの?
四苦八苦しながら調べてはいるんだけど、どうもその辺をスパッと解説したものは無いというか、経験則から探し当ててるような印象を持ってしまうのだけど、研究者とかはちゃんとセオリーわかってて目的が実現できるモデルの構成考えてるんだよね? 実績あるモデルからの転移学習とか、学習率調整したりとか、そういうのはわかるんだけど、例えばtransformerとかああいう新しい発想のがどうやって考え出されたのかサッパリ理解ができない。 >>407
分かっててやってる面もあるし、経験則な面もある
後、分析者の能力や方向性に寄るところもあるだろうなあ
画像処理の実務だと、モデルの選択は以下でだいたい決まる
・問題はクラス分類か、回帰か
・カラーで分析するか、グレーで分析するか
・エッジ抽出して形状を読み込むか否か
・hsvなどに色情報を変換してから分析するか否か
・物体検知必要?
・データ量に応じてのモデルの選択(データの複雑性と、量でだいたい決まる)
アンサンブルとか難しい話は忘れてくれ >>409
ありがと。そういうのは既存モデルベースでやるときの定石みたいなものですよね。
それはなんかわかるのだけど、行列計算の積み上げ方で何が起きるのか、ってわかった上で好きなモデルを考えて実装したり、細かな実装の調整ができるのかと思ってたのだけど、そういうのは諦めた方がいいのかな あっ。そっちの難しい話か
以下、完全なる憶測
まず、lstmよりattentionの方が効果が高いことは直感でわかってたんじゃないかなあ
少なくともエンコーダーには要らない感があるよね
エンコーダーからデコーダーに渡されている情報に、文法の情報がほとんどなくて
単語の情報だけがあるというのも経験則でわかったんだろう
ならattentionで置き換えられるよね、みたいな
いや、天才の考えることはわからんけど >>408
GANは閃きらしいし、バックプロパゲーションもそうじゃなかったかな
transformerにしても出自の論文に経緯書いてないかね なるほどー。まぁ一般人は研究室からいいパーツが出てくるのを待つ、ということかしらね。
そうは言っても畳み込みは何してるかわかるかな。特徴量を勝手に抽出させてるんだろうなとか。画像分析で難しい理論立ててたのとか無駄になっちゃうのかね。凄い事だわ。 バックプロパゲーショは蓄積じゃないかな
勾配降下法なんて、たぶん微分積分の歴史と同じぐらい
古くからある考え方だし、バックプロパゲーションなんてただの合成微分だから バックプロパゲーションって
合成関数の微分?
どうしてそれやると
うまく推定できるの? 画像処理は体系化があまり進んでないから素人でもわりとできてしまう
が、ステレオ投影とか体系化されて高度に専門化してる分野もある。そういうのはついていけん。 GoogleのCloudAutoMLVisionは枚数も少なくて良いから、スマホだけで機械学習完了
この辺の事業はコモディティ化しそう
https://www.softbank.jp/corp/news/press/sbkk/2019/20190717_02/ こんな古くさいサービスつくってどうするつもりなんだ 実際、このサービスで片付く程度の同レベルの案件で、300~500万ぐらい
ふんだくってる中小企業いっぱいあるからな
皆いずれ滅びる運命だけど まぁまだバブルですからね
バブルが去った後どうなるか ハゲの金儲けの種
【AI】孫正義氏「この数年で日本は発展途上国になった。結構やばい。手遅れになる。」AI開発競争の遅れを指摘
https://asahi.5ch.net/test/read.cgi/newsplus/1563541705/ エクセルでデータ集計してグラフ作成するだけで数百万の仕事になってる
データ分析バブルだと思う kuzushiji recognition、面白そうじゃん >>428
価値はその実現手段ではなく結果に付いてくるものだ
高度なプログラムを組んだから高い金が発生するとは限らないし、EXCELでポチポチしただけだから安値になるとも限らない
EXCELで大幅な改善ができてビジネスに貢献したのなら数百万貰ったっておかしくはない その金が末端まで行けばいいが
組織に属している技術者は吸われるだけの使い捨てなんだよな 要するに分析者の先入観が入り込んだ予測
と、解析しなくても自民惨敗の予測が付く沖縄が抜けてる 画像もGANの台頭でこの先新しいビジネス領域生み出しそうだけどな
下手したらツール化されて終わりかもしんないけど もうビジネスになっとるの?
まだ展覧会状態かと思ったが アイコラは日本でも違法なんで業界消えたが、今でも細々とやってるやつはいるなあ >>81
実は皆あんまりkaggleをやらないだけ
学生にはグラボの購入やクラウドの使用料は高い負担になる。院生なら論文の方が大切だし
そして社会人になったら忙しくてやれないっていう >>446
確かにkaggleやってみたいけど時間ない。
まずは他社より自分のとこの実務でどう適用するかで手一杯。 >>446
学生じゃなくてもグラボ含む専用環境なんかカミサンが許してくれないっすよ
なんかもうColabのプロフェッショナルみたいになってきたわw >>466
上位10%ってのはsignateの武田だけどね試しにやってみた
それも上位5%ぐらいで止まってるけど
ちなみに農家だけどね フルパワーで回したら電子レンジ並みの電力消費だから電気代でバレそうw 三上悠亜のモザイク外しが出回っとるな。GANらしいが。 deepnudeこそディープラーニングの最高の応用だったのに潰されたね ディープヌードだとう!?
全裸なんだな!?
日本じゃ違法だぞ?
マンコ露出はタイホじゃ! xgboostとhyperoptの理論のお勉強中。
そろそろプロとしてデータ解析している人たちの背中が見えてきた頃合い?
今やってることより難しくなると、ガチでついていけなくなる 仕事でやるのかコンペに参加するのかっていう
仕事だと目標値とデータと時間と金の関係で終わりが見えて効率よくやるんだろうけど
コンペとかだと限界が無いんで僅かな数値upの為に
無駄に頑張らないといけないところがあったりで研究者っぽいけど
仕事とコンペは少し違いそうだけど 社会系は精度そんなにいらないらしいからな
機械学習を使って一般的なデータ分析をしてる人たちは、意外とアルゴリズムの調整とかしないのか
画像処理も機械学習はあんまり重要視されないし、
業務でがっつりアルゴリズムについて勉強する必要がある分野は、自然言語処理ぐらいかなあ。
あれも地味な作業が多そうだけど >>461
販売予測なんてのは
営業出身のクルクルパーの部長クラスに
それっぽいグラフを見せて
「これで御社の売り上げは50%UP間違いないです!」と、
適当なこと言うだけで
「素晴らしい分析だ!」となって
たんまり儲かる
バカを相手にする仕事だから
むちゃ楽だよ そこら辺を真面目に詰めたら予算を超えて、
依頼者にとっても儲からない話になる >>462
ほんとそれ
バカ相手にする仕事はボッタクれる
しかしいつかバレるのは間違いないから
氷河期には備えてる >>465
バカは沢山いるので氷河期まで
あと100年は安泰です 年金と一緒で利益還元を10年先送りしますとかで押し通す BtBだと、先方も財布のヒモが固くなったけどなあ
お金を出す決定権を握ってる人が、お金を出したくなるような分析・開発サービス、商品がウケやすい
保守契約の充実とか、簡単設定とか、わかりやすいプレゼンとか
会議用の資料をこちらでご用意とか >>469
企業にて決定権を持つまで出世する奴は
上司よいしょに徹する馬鹿が多い
そんな馬鹿と付き合うには、
馬鹿にでも分かるグラフを用意すべき
100回の分析より馬鹿でも分かるグラフひとつのほうが重要であり、
そのグラフを作り出すのが
データサイエンティストの仕事
そう思ってやってきまして、
どうやら今のところ大成功ですよ まぁリテラシー上げなきゃどうにもならん
行き過ぎた場合は法廷へGO 営業はクルクルパーだろうけど、
コンサル系やMBA持ちは多少なりともデータ分析の心得が有るので、
ハッタリは無理 グラフ作成が重要なのは間違いないけど、
機械学習エンジニアの肩書をただのハッタリに使って、
アナリストに徹するなら、BIツールに存在意義で負けていそう
まあ、ビジネスで精度を提出する時に、
ROC曲線とか出しちゃ駄目なのはガチだろうがな
分かってもらえないんだよねえ 金融界はコイントスで10回表が出たからそろそろ反転するみたいな
理論がまかり通っているからな。 金融界をろくに知らないくせに分かったようなことを書かないこと 一般人はROC曲線の意味を理解してないだろうからな
再現率適合率辺りが分かってもらえるギリギリのラインじゃない 横からすまんけど
以前、外資系投資バンクで
債券価格の予測システムを作ってた。
債券といっても仕組み債のほうで、
主として不動産がらみの債券を
担当してた。
実際の予測はとても複雑で、
独自の指数を作成したり
ありとあらゆることやってた
マーケットはランダムウォークしてませんからね。
いつも予測を外してる馬鹿が
言い訳としてランダムウォークしてるから
予測不可能といってるだけです。 ランダムだとしたらその分布を予測するのが仕事だろうに ROCが駄目な理由はふたつある。
ひとつは分かりにくい。
ひとつはクラス分類の閾値の設定を見る側に委ねていること。
仕事を発注する側は素人だから、
ROC曲線から判断して、この確率でクラスとクラスを分けるとうまくいきそうだなあ、
的な判断を下したがらない。
分析結果が明白で、そこから派生する意思決定の選択肢の幅が狭いものが好まれる。
まあ。あくまで底辺の仕事だけど。 当然モデルを使用する
プライシングとリスク計量とでは色々と異なるが
dr=u(r, t)dt + σ(r, t)dW は基本
価格予測も将来分布で考える
〇〇円になるなんて予想は不可能なのでありえない >>484
金融なんて興味なかったけど、ちょっと楽しそうな気がしてきた 金融なんか構造不況業種だぞ。
欧州最強”ドイツ銀行、苦肉のリストラ 破綻すれば「リーマン・ショック」以上の衝撃
https://bunshun.jp/articles/-/12877 >>487
日本もゼロ金利や下手をするとマイナス金利で地銀の大部分やメガでもみずほ 証券は野村が危ない。 自分でやる気はないけど、調べてみるぐらいなら面白そう
今度、掛け金を10万円で区切って遊んでみようかな >>482
Fラン学生のクズのしったかとバレバレだぞ(笑) 横からだけど、出力値の分布の母数を予測するのが仕事なんじゃないの 昨日発表されてた平均寿命のグラフが
なんとなく平方根のグラフっぽく見えるのですが
こういう曲線になる理由って判りますか? これです
https://oku.edu.mie-u.ac.jp/~okumura/stat/life_expectancy.html 遺伝子的な限界があるのでしょう。
伸びしろが少なくなれば成長が鈍化するのは自然。 元から健康な状態の寿命があり
人類の医療は死亡率の高い病気に多くの予算を当てて研究し、予防や治療を行う
1つの主要な死因の順位が下がれば次の死因の根絶に取り組む ああ平方根じゃなくて対数グラフなのか
それなら判る気がする >>492
バレバレだぞクズ
全くなにもわかってね―な なんちゃってデータサイエンティストの分析手法
・最低限の前処理
・ランダムフォレストを使って重要な特徴量を探す(ここは飛ばしてもいい)
・前処理2
・XGB、DL、SVMあたりで学習
・線形でモデルに重み付け or アンサンブル(飛ばしてもいい) 先に人間が統計を駆使して目途を付けて結果を予測
持論の裏付けするためにツールを利用
どこがAIやねん >>502
おっ今の書き込みにいい情報見つけた
Thx!! >>505
俺もすこし書けるけど、学習を回す時はほとんどの場合においてpythonと大して変わらないぞ
あと学習パラメータの調節も難しいし、前処理のライブラリがpythonに比べて少ないから辛い
例えば、caffeはデータサイエンスにはまず使えない上に、
画像処理に応用しようとすると、データ拡張のところで多大な悲しみを負う C系はCPUに直接打てる命令をかけるからね
効率よく描くとJavaより数百倍とか信じられないレベルで高速化可能
でもCPUのレジスタとかハードウェアの理解が必要だからちょいと大変
興味があればやってみるとおもろい
さらにGPUも!
世界がわかる Ruby では、
JRuby(Java 実装系)のJIT は、百万回からコンパイルされる。
一千万回(実行時間で、1秒)では、なんと、MRI(C 実装系)よりも速くなる!
このように最適化では、Java は数十年も研究してるから、C よりも速くなる! GPUを動かすとpythonとCの速度差は10分の1程度になる
結局、GPUのインターフェイスを実装して実行するだけだからな
ライブラリが豊富だから、実際の開発だとpythonの方が良い精度を出しやすい
逆に機械学習にあまり興味がなくて、ツールとして使いたいだけならC言語がオススメ
最新技術のキャッチアップできる組み込み系のエンジニアになれば、
独立後に高給取りになれる 機械学習に関して言えばpythonでもボトルネックになる部分はCで実装されているから速度は大して問題にならない
やりたい事のやりやすさで選ぶべき 機械学習における各言語の速度はこう
C言語 > python > java
python > java はGPUで学習する時のライブラリの差ということで
基本的にはjavaの方がpythonより実行速度早いし、開発コストも格段に安い
pythonのエンジニアに学習済みモデルを作成させて、
javaで実装する開発形式が一番コスパよさそう。javaのエンジニアはお給料が安いからな あとデータから学習してモデルを作成する機能をシステムに組み込むなら、javaはあんまりよろしくない
ライブラリが貧弱。開発コストが高い。実行速度が遅い。三重苦でつらすぎる
それでも大規模開発なら仕方ない面もあるのかなあ
誰か大規模開発でjavaがどう使われているのか知らないか 直接は無理じゃないかな
CUDAでdll作って読み込むとかかな >>516
thx
並列並行分散処理ではありかな、とも思うけど。。。 >>514
普通にApache Sparkじゃない?
MLlibとかあるし
まぁpyapaek使えばいいけど javaエンジニアが薄給なのは「未経験でも君もエンジニアに!」的な企業が真っ先に教えるのがjavaで、
そこからSIer傘下の多重下請ピラミッドの底辺に大量に送り込まれるから平均値として低くなるだけだぞ
当然そういった経路を通らずに進む上位層も一定数いるので、そっちに限れば大して低くはないはず
結局はやりたいことが最も簡単に実現できるものを自分で調べて選択すればよい 5大SIer も、土建業と同じ構造、多重下請け構造
1社通すと、3割抜かれる。
この3割は、保険料!
5大建設会社の平均年収は、1,500万円あるだろ
小沢が、東京を通さず、地方が直接受注すれば、半額になるというのは、こういう構造のこと。
中抜きすれば安い
その代わり、保険が無くなる。
不備があっても、その会社は賠償に応じず、倒産するかも知れない
小沢の弟子の、れいわ山本太郎も、こういう上流階級をつぶすのが目的 5大SIerがどこだかわからんけどSIerは客のゆうこと聞くだけで提案力が無いのは何故?
日本のSIerからイノベーション的なものがほぼ皆無
どっかまともなとこないものかね SIer は保険業だから、設計などの実務は外注
SIerの給料は、2千万円とか高いから、自分で実務をやれない。
実務をやると、下請けと同じ仕事になるので、給料が下がってしまうから
例えば、銀行では、プログラマーに聞いても、
SIer とは、違う会社なのでわかりませんとしか、答えられない
そこで、SIerを呼ぶけど、SIerは設計を外注してるから、全くわからない。
それで、銀行が怒って、SIerの責任者がドンドン変わるw
Waterfall では、プログラミングフェーズから、設計フェーズに戻れないため、廃棄処分しかできないw
これがSIer のSolution !w ん〜例えば銀行であればAI融資審査をやるのに
受注側(SIer?)はロジスティック回帰等の手法を理解できさらに財務、CF分析ができる人間が仕様をユーザー調整し
さらに実装レベルまでやってしまう仕組みを作っちゃった方が良いってことかな 何故か日本のSI業界では上流工程=下流工程より身分が上、という意味不明な理解がまかり通ってるのが面白い
本当は単なる役割分担でしかなく、それを正しく認識できている文化圏では上流だから高給なんてことにはなり得ない 経済関係の予測って時系列データとしてやるようなもんかね?
直接測定できない隠れ変数の存在を定義するより、パラメータ足りてないのが悪いとしたほうが良いんじゃないだろうか >>532
5chはFランのクソ馬鹿が
知ったかぶりするところ
おめ―のように
考えてるふりしてる
知ったかくんも多いのよ Sierなんて結局は自分より能力が劣るエンジニアしか掻き集められないから それでもSierは儲かってるから
いいんじゃないの?
仕事は儲けるためにやる
儲かればよい
朝鮮人なのに中国人気取りの損正義もそういってる 差別主義と低IQは相関関係があるそうな
http://健康法.jp/archives/6454 SIerのビジネスモデルが近いうちに成立しなくなるのが問題なのであって今儲かるかだけを見ても仕方がない ふむ
このスレに約一名IQが低い人が常駐しているようですね >>537
孫は技術なんか興味はない、あるのは錬金術 >>541
損は無能
今まではたまたま運がよかっただけ
損は株暴落で破産 SIerなんていっくら会社が儲かっても社員は地獄だろ 機械学習のエンジニアだったら、優秀な人は下請けで働かないから関係ない人種だな
これ以上は他所のスレでやろう 機械学習の下請けというのは結構ある。
そして本当に地獄だ。 俺は下請けだったけど
実際に手を動かして分析してたから
すごく楽しかった!
今は転職して大手にきて自分で手を動かす
機会が減って
書類仕事が増えてしまいました。
下請けのほうが楽しかったなあ(遠い目) 何とか機械学習を使えそうなところまで来たが
統計学のメイン部分はまあ全部使うなあと
こりゃ秀才しかこの分野で 十分な 働きなんて出来ないわけだ
8桁9桁貰う奴がいて当然と
日本の経営者で「もっと給与を抑えたい」てのもいるが、これスラスラ出来るのって
本当にごく少数だろうなあ
エラー塗れの後やっとフィッティング、ならもっと多いか 機械学習がSI案件になってきたからそろそろ逃げ時かな
マジで奴らに関わってる暇はない Sierは統計学の基礎も知らないのに
機械学習を使って客をだまして儲けてる
データサイエンティストになって
俺より知ってる人って
大手の研究所の社員が一人いただけ。
で、その人もうすぐ定年
つまり専門家が不足してるので
しばらく俺の天下かな? >>552
課題解決になれば知識とかどうでもいいんじゃね?
知識だけあって課題解決に役立たない場合もある
目的による そのケースにおいてどれが一番優れているかという予想は
やってみないことにはわからない
知識よりパワーと経験値から来る選択術なんじゃないかと思う今日この頃だけど 知識ってのは問題解決ノウハウも含めて知識ってゆーんじゃあないの? システム化して実装する必要が有るならまだ解るが、
機械学習(データマイニング)でSIに頼るって発想になる時点でなんか違う感 最近は内部統制の関係で必要データは全てシステム子会社が保有してね?
ユーザー部門はベンチャー系とも取引するんだが
システム子会社は基本SIerにしか口座を開かん
顧客都合で商流がシステム子会社経由になるとSIerが絡まざるを得なくなるわな >>557
社員の数倍の報酬出して期間限定で数人のプロ雇う方が効果的だろうな >>560
HP ProLiant専用アクセラレータと書いてあるが >>559
電気や土木とかはそんな感じだよね
個人でやってる人達を集めてプロジェクト終了すると退散っていう
頑張って稼いでも税金で持っていかれるだけだから
ってことで釣りばかっりして有名な釣り師になってたりするのはこの分野 たしか電気や土木は派遣業者が介在しないんで製造やITみたいに
たかが作業員でも急な補充が出来ないんだろ
復興とかなんとかって人手が足らなくなると高くついてもやってもらうしかない AIによる創作について。
ディープラーニングで文章を学習させて
文書生成をやる場合、現在最も最適なアルゴリズムは何ですか? >>569
LSTMはモデル
MaskGANは学習方法 >>673
GANに詳しくないからなんともいえないけど、たぶん間違った認識してる GANもモデルのひとつ。
違うと言いたくなる気持ちも分かるけど おれ、仕事先からデータ持ってかえって
ながめるのが趣味なんだが
ダメかな?
かなりデータがたまってきた 前の会社の取引先、こんなデータ送ってくるなよ、みたいなデータを平気で送ってきたけどな
俺もそんなレベルの仕事してたんだけど データ持ち出しなんて会社が気付いていないわけがないから変な辞め方しようとすると懲戒解雇扱いになったり訴えられるだろうな
辞める時はできるだけ波風立てないように気を付けよう 意外と気づいてないんだよな。。
日本の個人データ取り扱いは表面上厳しくて実態はガバガバだよ。 俺は飲食店のPOSデータや
家計簿データ、所得データを
見てるのが楽しい
医者や弁護士、パイロットは
所得すごいけど、それ以外の人は
思ってたよりすごく低所得で驚いた
特に沖縄県と東北の北の方は低くて
東京の6割ぐらいしかない!
よく生活できるなと思います 田舎は家賃安いし娯楽少ないから金使わなくて済むけどそれが給料低くてもよい理由にはならないよな 順番はあるけど、
自然言語を時系列と
わざわざ言うような奴はいない
そこまでいくとただの馬鹿というか
知ったかぶりのクズだろ >>586
日本のっていって、政府か企業かを区別せずに一緒くたに言うのはおかしい
どっちもがばいけど 「日本は規制がキツ過ぎてデータ活用が出遅れてるから緩和しろ」と言ってる奴に限って個人情報保護の知識は皆無 緩和しなくていい!
個人情報データを自由に
見れるのはデータサイエンティストの
特権だから
他の奴には見せなくてOK 機械学習スタートアップシリーズってホントにイマイチ
もうちょっとなんとかならんの?
劣化おライリー Colaboratory混んでる?
すぐGPUインスタンス落とされる >>598
わかってる人には意味がない本だし
わかってない人が理解できる書き方ではない
日本語の本はこういうのばっか 同意
結局、理論も実装も洋書でやった方が理解早いし深まる
オライリー本は実装入門の鉄板だ… >>602
そういう本多いよね
でも実際自分で本書こうと思うと
かなり大変 SLIでkeras走らせると交互に100%処理してて並列してくれないの何でだろう 実務のデータ分析だと、
大抵の場合においてXGBかLGBを使った方がNNより楽で精度が出るな 東大生がバカッツラ晒してる
https://ledge.ai/stockmark/
お前らは本来BERTを発想する立場にあるのに
国外の天才の成果物に頼っているだけかよ 学歴なんてものは今や
コンピューター1台に勝てない程度の知能の証明に過ぎない 低学歴の人達ってそのコンピュータすら満足に使いこなせないんだけどな あーどうせ俺は大卒だよ
周りはドクターマスターだらけだわ ぶっちゃけ、第3次AIブームは冬の時代になると思いますか? ぶっちゃけ、よくわからん
自動運転を一般道で実現できたら
スゴいと思うけど
あと50年は無理だと思う 他の革新技術でブームがこないから
AIブームは線香花火のように
細々と続くのだろうね 一般道でもGoogleあたりはかなり良いところまでいってるね >>620
そこから先が長ぃ
命かかってる技術とはそういうもの
>>621
ノロノロ運転でいいならな
自転車よりノロいぞ?
俺はイヤだ!
認めない! >>617
もう来てる
ほとんどの企業はデータがないからやる以前に終了
データ持ってる企業でも計算にコストかかりすぎて終了
結局GAFAや日本だとLINEとかそういう一部の会社しか実践できない 日本はどうせ中間採取業者を沢山入れて一時的に対処するっていう
捨て分野の代表みたいなのがIT系なんで
取り合えず生贄として若い奴放り込んで様子を見るが
結局何もしないまま終わるんだろう
捨て分野だからね 物が飽和しすぎているにも関わらず進化を求め続け
抑制だけでは温暖化は止めらないとか言われているこの時代に
何かやれるようになっても負担だけ増えて給料が上がらない日本社会で
まともな技術者を目指している若者が居るのかどうかは不明だけど 日本の場合は、AI以前にOA化に取り組め
でないと、始まりもしない AI以前にキャッシュレスシステムくらいちゃんと作れよって感じだな
その上でデータを集めるわけで土台のシステムがクソ過ぎる 別に自動運転で事故をゼロにする必要などなくて人間より圧倒的に事故率下がるならメリットしかないんだけど
1回でも事故やらかすと過剰反応起こす人がいるから面倒なんだよね 自動運転厨ってなんでこんなに偉そうなんだろうな。
そういうとこだよ、人が納得しないのは。 事故が激減するという明らかなメリットがあるのに、偉そう、納得できない、程度の理由で拒絶するとは 人間の運転技術にばらつきがあって、自動にした場合に事故率下がる人と上がるがいるはず。 >>630
しかたがありません、事故を起こした主体を特定し、賠償責任をその主体に負わせなければならないのは法治国家のならわしですからね
いくら人間より事故率が低くてもこの点をクリアしないと現代社会に受け入れられることはないと思います >>613
回帰はビンカウンティングして、スケール調整してNNかな >>636
ビンカウンティングっていうの初めて聞いた。
個人的に回帰はGPだなあ。NNと精度はどっこいだけど、外挿だったり予測区間が欲しい時に強い感触がある。 >>637
ビンカウンティングってwww
そのままの意味だよ
>>636は単なる知ったかぶりの馬鹿
いつもの奴だwww なんか上のコメントはヒストグラムで度数をかぞえるのと勘違いしてそう なんか上のコメントはヒストグラムで度数をかぞえるのと勘違いしてそう SIGNATEの土地価格、建物込みの価格だったんだな。気づかなかった。
FAQにいつ追加されたんだ? ディープラーニングを
初めて試してみたら全く変なことになった
初心者だとChainerでいいんだよね? pytorchはtensorflow2に負ける可能性が高いからオススメできない あのですね、KerasでもPytorchでも
いいんですけど、結局のところ、
僕にでもわかるような参考書がないと
なかなか進まないということがわかってきました。
どのソフトでもいいので、この参考書は馬鹿でもわかるよ!
という書籍を教えてください
一応、重回帰分析や相関、t検定などは
仕事で使ったことがありますけど
詳しい理論はわかってません。 ライブラリやフレームワークの使い方は公式ページを確認するのが一番確実
理論は統計の参考書で勉強するしかない 理論は誤差逆伝播法を理解しておけば問題ないでしょ
単純な例で行列使って順伝播と逆伝播を手計算できるようにしとけば問題なし >>650
今tfに手を出すと、ウェブで情報漁ろうとしてもバージョン1向けか、2向けか分からんくて余計な苦労しそう ≫660
>判定も古くからある多肢選択式問題(つまりクイズ)によるもので、
この指摘が出てくる時点で健全だな
日本企業はAI詐欺しすぎ >>622
PFN
PEZY
ARAYA
ABEJA
LeapMind
DeepX
GITAI
まともなAIベンチャーはどれ? ふふふ!
バカでもわかる本見つけた!
涌井の「Excelでわかるディープラーニング超入門」じゃ!
これ読んで、なんとか手がかりを
つかむのじゃ!
>>654
> バカには無理
おまえな、僕が理解して
偉くなっても教えてやんないからな!
ほえづらかくなよクソジジイ! ソフバンが投資してたAIベンチャーが全くAIじゃなかったらしいね
いよいよくるぞバブル崩壊が
軒並みAIベンチャーは潰れるか事業転換を余儀なくされる
逃げ出すなら今 "まとも"って枕詞が付くAIベンチャーならいくつもあるだろ
業績が突出してるのがPなだけで AIベンチャーに行って話しをしてこいよ
おれみたいにアゴがはずれてポカーン( ゚д゚)という顔になるからw
とにかく上場して金を手に入れることしか考えてないから! PFNも目立った成果はchainerぐらいですからね
トヨタとは自動運転じゃなくロボットでの提携みたいだし
自動運転はやはり無理なのか >>672
PFNはトヨタとの協業で、車両間相互通信を高度化して自動運転に繋げるとか言ってたが、
どうなんだろうな ディープラーニングによる学習と人間の学習なら
どっちが効率的なの?
猫の画像認識の場合、たくさんの画像データが必要だけど。
人間は何枚の画像データ必要? それおもしろいね
転移学習が常に動いているからどうなんだろ 教材の量で効率を測るならたぶん人間のほうが効率いいんじゃないかな。
ところで機械学習の場合、ネコ以外の画像からこれはネコではないよみたいな学習はするの? 学習データ量の効率なら人間が圧倒的に勝つけど機械学習は24時間365日学習させ続けることができるから
データと時間が十分あれば最終的には人間は太刀打ちできなくなる 人間は子供のころからの経験値の蓄積があるから判別できる
それを考慮すると効率悪いかもじゃね? >>680
お前は最も大事な基本を忘れている。
そういう機械学習の方法では
絶対人に追いつけない。
馬鹿でもわかる。
この業界も高卒やFランの馬鹿が
データサイエンティストを名乗るようになって
本当に馬鹿たらけになってしもた。
お前のような知ったかぶりの馬鹿 根拠も示さず絶対追いつけないなどと言い切られても困る 現に碁は自動学習だけで人間を圧倒する強さになっちゃったからなあ… 囲碁が人類を超えたのは自動学習だけじゃないと思う。
学習があってもそれ以前のモンテカルロ法がなければ無理だったのではなかろうか。 >>687
初代AlphaGoは過去の人間の棋譜を学習してたがAlphaGo Zeroは一切使っていない それは教師ありかなしかのちがいだよね。
流石にモンテカルロは使ってるんじゃないの? 強化学習を教師なし学習というのはまたちょっと違うだろ。
学習データ作りと学習と推論をサイクルさせてるってのが肝なわけで。
一般に教師なし学習というと主成分分析とかああいうのだろ。 >>686
そういう、人間よりもコンピューターの計算の方が適している分野は
いっぱいあるから気にしてもしょうがない >>685
根拠って
まじ馬鹿なのか?
電卓がどうやって人間を超えるのさ?
こっちが教えて欲しいゎ馬鹿たれが! 強化学習を実務に適用している事例ってどんなのがあるんだろう ゲームメーカーがモーション・キャプチャリング入力補正に使ってるというのは聞いた
あとロボティクス分野は使ってるんじゃないの? ロボティクス分野では使ってるね
物を壊さずにつかむ学習とか >>694
そもそも人間を超えるって何
電卓でも四則演算の速さは人間超えてるが >>697
分からんのなら
コンピューターの基本から
勉強しなおせ
むかしそんな低レベルの会話してたら
仕事なかったわ
今どきは人手不足だから
どんなバカでもクズでも
データ分析の仕事がある
NTTデータ先端技術の
営業が言ってるが、今はバブルだ
バカでもクズでも地方から集めてくれば
高く売れる
ホント、馬鹿ばっか
馬鹿バブルはやがて崩壊する メカトロ系で強化学習を使ってるのはなんとなく想像がついたけど
やっぱりロボットとかそっち系が強いのか
本当に最先端の、さきっちょの方だな 普通の人間は5桁×5桁の掛け算に数十秒かかるのに電卓は一瞬で終わる
明らかに電卓に人間が負けているんだけど >>700
業界を俯瞰するような物言いに見えてスカスカ
馬鹿って言いたいだけ? >>702
ほほう
お前の勝つというのはそれか(笑)
ホント馬鹿 >>703
俺は親切だから
レスしてやってる
感謝して欲しいね
誰だって馬鹿は
相手したくね―よ >>704
電卓との勝負においてより速くより正確に計算する以外の評価指標など存在しないぞ なにも考えてないんだな
じゃヒントやろう
電卓で毎月60時間残業した場合の
年収を計算してみ! ディープラーニングの活性化関数のひとつも答えられないような奴が、
このスレにカキコしてはいけないと思うんだけど
なんかそういう人のカキコが多すぎるよな。もっと普通のスレにいけよ >>32
実際にはpython以外の言語で機械学習をやろうとすると前処理の段階で辛くなる
データを加工するライブラリが十分に充実している言語は、
現状かなり限られていて、javaやCで仕事してもそこら辺で行き詰まることが多い
開発コストを考えるとと、python以外の言語で高い精度はなかなか出せない WEB+DB vol.111 は、Ruby on Rails 6, Julia 特集だけど、
Python から、Julia へ流れそう
Julia は、do 〜 end が使えて、Ruby風に改良されてる!
Jupyter Notebook(JN)でも使える
Juliaから、Pythonも呼び出せる
Windows で、RubyをJNで使っている人は、日本語でバグらないの?
irb では、バグるけど >>710
おいおい
データの前処理で
しかもJavaやCで
行き詰まるなんて
どんだけ馬鹿なんだよw
そういう馬鹿がPythonかたるとはw テキストなんかはcでもshellでもどうとでもなる
画像もopencvでも使えやいいよ
学生さん多いのかしら ミンスキーのセクハラスキャンダル
米メディアが報じた裁判所記録によると、性的搾取の被害者の一人とされるバージニア・ジュフリー(Virginia Giuffre)さん(36)は、
10代の時にエプスタイン被告の自宅でメディアラボの共同創設者マービン・ミンスキー(Marvin Minsky)氏とのセックスを強要されたと証言している。
人工知能 (AI)研究の一人者だった ミンスキー氏は、2016年に88歳で死去している。【翻訳編集】 AFPBB News
https://headlines.yahoo.co.jp/hl?a=20190823-00000030-jij_afp-int >>695
ゲームのモブとか結構使ってる方かな。
実世界と違って変な行動したとしてもそこまで問題にならんし。 確かにゲームはAIを使うのに相応しいな
参考書も多いし >>713
前処理ひとつでも、たとえば画像ならデータ拡張でpythonのライブラリを使えないと
開発コストが上がるうえに、現実的な意味で学習の精度が落ちる
画像を加工するまではどうとでもなるんだけど numpyという共通ライブラリのありがたさがわかるね
Pythonの数値計算はほぼこれでできてる
もしくは変換メソッドがあるからすごく楽
他の言語でもライブラリはあるがデータの変換がすごく大変でやる気無くす WEB+DB vol.111 は、Ruby on Rails 6, Julia 特集!
Juliaから、Pythonも呼び出せる
Numpy も呼べる
逆に、Pythonから、Juliaも呼べる
Jupyter Notebook も使える
do 〜 end など、Ruby風に書ける! >>722
Pythonじゃないと
前処理大変だから
やる気なくすとか
元からやる気のないFランの馬鹿だろ
ま、今は馬鹿でも仕事あるから
いいんでないか(笑) 明らかに実データ取り扱ってない奴だな。
実際のデータのクソ汚さ見たらc/c++系統で処理するとか地獄だとわかる。 前処理はそれに適した言語やツールを使えばいいだけで、それと数値計算自体を
同じものでやらなきゃならん必然性はないがな。昔はみんなそうやってたし。 >>725
自分がC、C++できないからって
そゆ発言はダメです
言語は状況に応じて適切なのを選択するんですよ
わかるかな?
Pythonは遅すぎて使えないという
場合はよくありますから 前処理終わったら一旦ファイルかDBに保存するじゃない?
計算はそいつを読み込むんだから、前処理と主計算で別の言語使っても問題ないでしょ。パイソンでもjuliaでもCでも好きにすればよろしいかと >>727
python自体が遅いのは確かだがnumpy, scipyとかのライブラリのバックエンドはCってご存じ?
適切に使えばかなり速い >>724
目的に応じてツールを使い分けてるだけじゃん
手書きの履歴書とか持て囃してそう 前処理を細かく操りたいときにpython FWのAPI使わず外でやるとか
FWだとパラメータをランダムに決めちゃったりするやん
仕様も不明なこともあるし >>731
データのパラメーターをランダムで勝手に変更するライブラリなんて逆にあるのか
あるなら画像処理か音声処理だと思うんだけど
少なくとも、OpenCVにはそんな仕様は絶対ないな >>729
知ってるよ
俺が作ったライブラリも
お前が使ってそう >>731
Pythonのライブラリは
きっちりバージョン合わせないと
変なことになるぞ
だから完全自立人型ロボットの
リアルタイム処理には
Pythonなんて絶対に使えない
自動運転もそう
実験では使えても
実装じゃ絶対使わない
つか使ってるメーカ―なんて
ないから 誰もロボットや自動運転に組み込む話なんてしてないのに何をいきなり語りだしてるんだろう ライブラリよりGCがあるから使わないでしょ。
そもそもロボットのOSで動くLLなぞ無いような >>735
自動車業界はMatlabじゃないの?
部門によるのかな >>738
Luaとか?
リアルタイム処理の前処理と一般的な機械学習の前処理はなんかレイヤーの違う話に感じるけど同列に議論するものなの?
リアルタイム処理の前処理って機械学習の推論側だよね?そしたら好きな言語で書いてONNX形式にしてTensorRTが今時なんじゃないのとか思ったり
C/C++が面倒だというのを批判したいだけ?私も相当C++を書くけど面倒くさくてPythonばっかり使うわ ワイもワイも
pythonで足りる許されるなら使うよ armsのボードを入れてるだけのところが多いけど、
俺は底辺だったからなあ >>727
ちゃんと計測してから物言おうな。
今のpythonで100万行のデータ取り扱っても数十秒だから。
んで持ってpythonでてきとうな処理書くのなんて数分でできる。
c/c++でまともなデータ処理コード書こうと思った恐ろしく時間かかるわ。
まともに使ったこともないくせに理論上のランタイム速度だけで議論しようとするのは
愚かなことだよ。 >今のpythonで100万行のデータ取り扱っても数十秒だから。
ちゃんと計測してから物言おうとか言いながら、処理内容も限定せずにこんなこと言っちゃう矛盾 csvでてきとうなカラム50〜60のデータを処理する場合だよ。
イチャモン付けしたいだけで何も提示しないバカは黙ってろよ。 モデルは最新の決定木だろ。データ分析を想定してる? だからその「処理」の内容次第で数十秒で済むのか数十時間かかるのか変わるだろ。
csvとか言っているところを見るともしかして前処理の時間の方を言っている?
そうだとしたら話がかみ合わんわけだわ。 C言語は画像処理の分野で使われていて、
まともなところはpythonでまずモデルを作って精度を測ってから実装に移る
あとCやjavaで業務をこなしているけど、実はpythonで十分な案件も多々ある
てか、そんなのばかり >>744
100万行?
なにいってんだ馬鹿
そんなちっちゃなデータしか扱ったことがないのか!!!???
ホント視野の狭いFランの馬鹿は困る
データ分析には想像力も必要なんだぞ?
ま、いまどきの若いのはExcelがちょっと使えるだけで
データサイエンティストだから(笑)
NTTデータ先端技術が地方から集めてきた馬鹿の仲間か? >>751
データサイズで人を馬鹿にするのはよしなさい
そんなのは業務によるもの
あと学歴をすぐに持ち出すのはコンプレックス丸出しでみっともないですよ
私の感覚ではデータ量が増えれば増えるほどプログラミング言語より分散処理に重要度がシフトする気がしますね kaggleを大規模なコンペに参加したことある奴おる?
ブレンド勝負に突入したんだけど、特徴量の選択とモデルのパラメーターをちょくちょく変えて、沢山のcsvファイルを作ってブレンドするのが底辺の戦術でOKかね
kernelで明らかにアイディアが出尽くしていて辛い >>753
最適化合戦になると性能のいいハードが用意できないと勝てないかなぁ
外人って飯の種となりそうな凄いカーネルをあっさり出すよね 752
> データサイズで人を馬鹿にするのはよしなさい
話の流れを無視して
意見いってる自分が天才すぎて怖い!
って感じがガンガン伝わってくるwww
データ分析したことないならだまってなさい
低知能さらして恥ずかしくないかい? >>755
人を馬鹿にしないと自我が維持できない病気にかかってそうで哀れだ 今後10〜20年の間に最も必要とされる仕事
https://rikunora.hate○nablog.com/entry/20170217/p1
>ずばり「教師」である >>755
データサイズを解決するのはC++じゃなくてマシン台数って話だと思うけど、俺、なんか勘違いしてる?
少ないデータ量しか分析してないならPythonで十分だわな、って主張してたんじゃないの? 改行おじさんは無視するに限るよ
アジテーションが趣味な人だから >>754
外人さんがすごいカーネルをあっさり出してくれるのは
勉強になるから物凄くありがたいけど、コンペの性質が変わっちゃうから困るw
まあでも、無課金colabでも銀は狙えそうだからいいや
これで勝っても、自分の実力とはまったく言えないけどなあ…。むなしさを覚える kernelの例真似して見るけど順位は真ん中位だわ。
まだまだ精進の余地あるのか Excelで適当にデータいじって年収800万
こりゃやめられん
つかバブルだろ?
どうかバブルがずっと続きますように! 実務経験ってやつは何を期待してんだろうな。プログラマと兼任で余裕だろうし、自習でも楽勝じゃないかい? >>735 Jetson nanoはPythonだぞ。 自動運転ができる。 CUDAやTensorFlowなども自由自在。
https://www.nvidia.com/ja-jp/autonomous-machines/embedded-systems/jetson-nano/
>>738 GCなんてのはどうとでもコントロールできる。 ロボットのOSってなんだよ。 RTOSの事か? LLはCPUに対応してればよいだけの話だぞ。 >>765
最近はゆるいの?
車やロボットの判断、操作に遅延が起きるの相当嫌がってたと思うんだけど
お車業界 コミュ力ってのは何を指すのかさっぱりわからんのだw
要はお友達になれる能力?w >>766
tensorflowとかOpenCVなど特定の環境の実務経験ないといかん案件が結構あるよ。
プログラマとしての実務経験は10年以上あるんだが >>768
報連相ってやつでしょう
常時不機嫌な相手じゃなければ出来るようになるよ >>770
そんな感じに明確なところは良いんだろうけど
以心伝心的な能力をコミ力と思ってる人多くね? お前らが何を実務経験と見なそうが勝手だがほとんどの企業は該当の職種に就いていた期間が一定以上か否かでしか判断しない
つまり全く無関係な仕事をしながら自力で勉強した人は実務経験ゼロ扱い バズワード界隈って結局コミュ力(笑)とか実務経験(笑)とかのくだらない話になるよな
原子力発電所の駐輪場の屋根の色をどうするか議論してた方がまだマシ >>773
免許が有る職種ならいいけど、データ分析の実務経験なんて企業によってやること違いそうだから、ミスマッチ起きまくってそう 耐震工事と言いながら柱と壁の色を塗り替えるだけで耐震性は変わってないパターン >>767 本当にシビアなところでは、FPGA使ったりハードウエアRTOS 使ったりするから、遅延は余り気にすることはない、今時ギリギリのソフトでカバーするなんて危険すぎる。
それでもシビアなところは、Cとかで書いてるだろ。 実務経験よりコネ(というより口利き)の方が重要だから
いつだって、その人の実力を証明してくれるのは、信頼できる仲介者の証言
正門から入ろうとしたら、字面でもわかりやすい実績を求められるのは当然じゃん なんか問題がすり替わってるような。。。
リファラル採用はまあ置いといて、仕事で同じ事ばかりやる訳ないのに応用力や柔軟性を考えず〇〇の経験者を取ろうとするのは頭悪い。と思ったのでした 俺の前職は画像処理だけど、その経験は転職にまったく活かせないから間違いないわw
結局は実力が全て >>773
AI関連の職に10年ついていた人はほとんどいないが。 どのポジションでどの程度関わっていたか解らない実務経験って無意味だけど、
要領の解らん素人が営業として間に入るから指標として機能しているのだろう データセット作るだけでも大変だ―
画像をフォルダに振り分けてそのフォルダ名をラベルにして
まとめてnpzに
で、これを読み込んで画像の列をX 、ラベルをyに
で、これをサポートベクトルマッスィーーンにfitで読ませて
そしてもう1回相関取って
おおー動いた感激
って理解じゃあ、なーんの使い物にもなんねーwwwwww >>785
言いたい事は何となく分かるけど、恐らくその作業は最も基本的で最も使い物になる作業だと思う 社外向けに出す精度は、捏造なしでもデータクレイジング等のグレーゾーンを攻めれば、
水増しできるけど、自分たちの分析や開発が、
現場で実際に役立つか否かは、自分たちで客観的に評価できないよな・・・
だから、実務をまわせるだけでプラスアルファがない人と一緒に仕事をすると、
技術があんまり向上しない いや、年収500万ぐらいの画像処理の仕事はどこもそんなものだよ 転職する時は自分がやってた作業じゃなくてちょっと上の先輩か上司がやってた仕事をあたかも自分がやったように話せば若い割に高度な仕事してたんだと思ってくれる
少なくとも何をやってるかはある程度理解してるから多少突っ込まれても支離滅裂にはならないだろう そうかな
自分がやったことじゃないと定量的に答えられない 自分にもできることだったら、多少はホラを吹いてもいいんじゃない
相手はホラを吹かれること前提で面接してるからさ scikit-learnに入れて結果出してる
だけなのにネットで読んだ解説や、
Excelでわかるディープラーニング超入門
を読んで、逆伝搬はネットで読んで、
それで客が馬鹿なので
知ったかぶりして能書きたれて
それで年収800万(残業代込みw)なので
まじやめられん!
つかバブルだろ!
バブルマンセー! 俺だったら誠実に前処理しっかりやりましたとか答える奴を取るけどな。
クソしょうもない理屈言い出す奴なんて取っても無駄になるだけだし。 大体において、採用する側の理屈はそうだよな
入る側としては技術力がきちんと向上する会社にいきたいけど
あとは会社のレベルによって全然違う
研究開発をやってるところなら、理論までしっかり分かってる人を採るだろうし、
実践的なやつをやってるところならそういう人を採る 理論しっかりやってる人材を使いこなせる会社なんて日本にまず無い
知ったかぶりのタレントしながらコミュ力ある作業員やってるのが一番評価される これからはディープラーニングの推論結果の根拠の説明が重要になるから理論を理解しない人は間もなくSI業界の末端コーダーと同等扱いになるだろう MLOpsという雑用の方が稼げそうな気がして来たわ。若者よりオッサンの方が色々経験あるし 機械学習は何と何のスキルを組み合わせて、
いま現在たべれる状態+将来稼げる状態、をキャリアとして構築するかが課題だな
ここまで機械学習の勉強コストが高いとキャリア上の捨てスキルにできない >>796
システム開発だって
客とのコミュ力が大事だもんね
つかデータ分析なんて
客とのコミュ力だけで儲けてる
ような仕事だよ 理論なんかの追求より大事なものがあるとか言う人ってその理論を使ってどう稼ぐかを考えられないだけなんだよね
つまりは理論を理解する能力が足りていないために現実世界での利用方法に辿り着けない人の言い訳にすぎない ian goodfellowですらどうやったら金儲けに使えるかわかっとらんのに無茶言うな。 データ分析は日本だとアナリスト寄りの人材の方が食えるらしいな
機械学習は予測精度だけ求められることがあるから、純粋な統計屋よりは、逆に理論で勝負しやすいけど
普通にやってると、理論ってほど大した話ではなくても、理論的な知識を使うのは
モデル選択より前処理の部分だよね 敵対的検証って手法をいま初めて知った
これはSUGEEEE パートのおばちゃんの経験則を超えられる日は来るのか 実践できれば仕事はあるから。
つか理論分かってない高卒やFランほど
理論が大事とか言うし 理論わかってる奴はそれで何が出来て限界がどこにあるのか分別がついてるだけで理論を軽視してる訳ではないのでは 前処理に出てくる概念を理解できない人と一緒に仕事するの辛いけどな
カルバック・ライブラー情報量って何? コルモゴロフ–スミルノフ検定って何?
ここら辺を調べて一時間で理解できない奴と、一緒に仕事するとできることがだいぶ限定される ベイズ推定とか自動微分とか使ってるのに
書いて無い本多いよね
理恵論は不要もしくは知らない?ってゆーか使えればよいって人が多い? むしろそこら辺はだいたいの参考書に基礎的なことが載ってるような >>813
ベイズのなにも知らないくせに
お前のように知ったかの馬鹿ばっか
せめてExcelぐらい使えるようになっておけ
Fランの馬鹿さん >>815
おまえは馬鹿なんだから黙ってなさい
学歴コンプレックス丸出しですよ カルバックライブラーとかふぃっしゃー行列もなんだかわかんない 例えば「情報量基準」という本がある
これ一冊あると色々と便利
当然KL、KS、フィッシャー情報行列等も記載あり >>816
クズが偉そうにいうな
人売りに売られてる馬鹿クズめw kaggleって銅メダルだと何の能力証明にもならないな
下手したら他人のkernelのブレンドでいけちゃう 既に公開されている手法の組み合わせで短時間で及第点を取るって実務上かなり重要な能力だと思うが いや、この場合のブレンドって要は
公開されているcsvファイルの平均値を取るだけよ さすがに今ブレンドだけで銅取るの難しくない?
むしろそのブレンド手法が知りたい。kappaとか そんな言い争ってもどうせ捨て分野なんだから
年収800万だの900万だのと言っても税金やら社会保険やらで200万以上引かれるわけで
大した仕事でもない毎日定時に帰って趣味のゲームのことばかり考えているような
年収200万しか稼いでない奴等の5倍以上払っている訳で
組織の中でいつまでもやれるような職種でも無いし
出来ても出来なくてもアホとか学歴とか言う合う程のことではない 上の方で東京の6割ぐらいの収入でよくやってるなとか書いてるけど
田舎の高卒なんて実家通いで月に3万円程度親に支払って終わりなんだから
年収250万もあれば160万ぐらい自由に使える金が発生する
体を動かす目的で空いた土地に野菜でも作れば野菜に税金がかかるわけでも無いし
食うもん安いし信号は無いしうまく平均化されるような仕組みになっている >>827
そんなに卑屈にならなくても・・・・・・・w
税金ってたくさん稼げば稼ぐほど増えるんだよw 実家の周辺で警官なんて
見たことないぞ
大麻栽培してもばれないと思います >>832
誰かが通報するんじゃないの?
俺なら速攻で通報して警察と仲良しポイント稼ぐわ
電気代が高すぎても通報されると聞いたことがある
24時間電気が付いていてカーテンが引かれていると、室内で栽培していると疑われるらしい 俺ら、グラボ4枚刺しを回すだけで通報されるじゃんw 【コミュニティの一生】
面白い人が面白いことをする
↓
面白いから凡人が集まってくる
↓
住み着いた凡人が居場所を守るために主張し始める
↓
面白い人が見切りをつけて居なくなる
↓
残った凡人が面白くないことをする ←イマココ
↓
面白くないので皆居なくなる つまらない人が大声でつまらないことをする
↓
センスのない馬鹿がもてはやす
↓
センスのない馬鹿はすぐに別のつまらないものをもてはやす
↓
賢い人はそれがつまらないことを最初から知っているから何事もない やっと金メダル圏内が見えてきた
ただ、まだスコアを上げにかかってない元ゴールドメダル獲得者が、
リーダーボードの下の方にうようよいるんだよなあ。やっぱりムリポ 富士山頂で上の登山者が蹴飛ばした落石で死ぬようなもんか 松尾豊のすごさてなに?
業績無いのに日本のai界でデカい顔してるところ? そゆこと
自分の著書に書いてあることと
全く違うことを平気でテレビで
しゃべってるという二枚舌 まー
一般社団法人 日本デイープラーニング協会の理事長だけどな kaggleあるある
学習終えて結果をアップする時に形式間違えて弾かれる
元のクラウド上のデータはすでに消えている
俺のことでもなし、俺のことでもあり。ああ無情 松尾豊は
一般社団法人 日本デイープラーニング協会
とやらを急に設立しようと思ったの?
誰が設立しても良かったの?
きな臭くない? >>847
この分野の日本の大学教授でまともなやつ居ないだろ きな臭くないっていうか親戚もお偉いさんなんで環境が一般人と違うんだろう
麻生太郎の祖父が吉田茂、吉田茂の祖父が大久保利通、実父が九州財界のドンみたいなもんで
カップめんの値段がわからないとかそんなもん麻生が知る訳ねーだろっていう
そもそも家系図が一般とかけ離れてるだろ >>849
吉田茂の義祖父が大久保利通。実祖父は竹内庄右衛門。実父が竹内綱。養父が吉田健三。吉田健三の親が渡辺謙七。吉田茂の義祖父には三島通庸もいる。 >>847
日本ディープラーニング協会は
在日朝鮮人が設立したと聞いたな
とにかく在日は肩書きが欲しいんだよ >>854
25-30万円の投資と見合わない。
でも好きな人には良いと思う。 全くの初心者が、ディープラーニングを学ぼうとしたら
何から学べばいいかわかりません。
以下のサイトはどうなのでしょうか?
他にありますか?
よろしくお願いします。
ディープラーニング入門
https://tutorials.chainer.org/ja/ >>856
Chainerのサイトは初心者には良いと思うよ
本当に分かりやすく良くできている
終わったらpytorchかtensorflowのウェブサイトを一通りやる
その後はKaggleのカーネルかなぁ 大学生なら微分積分・線形代数・統計学などの基礎をしっかりやった方がいい
プログラミング能力も大事。機械学習なんかよりよっぽど大事
基礎を固めたら、最適化数学、機械学習の理論書を勉強しよう
ツールの勉強なんて後回し。逆に理論ある程度やったら、kaggleのカーネルを
いきなり読んでもある程度はいけるはず
上の人のコメントは、時間のない社会人向けだな
それもひとつの正解ではある 最終目的がよくわからないが
コンペで上位に行きたいならChainerのサイトとか
amazonで人気の本を2冊ほど買って基礎的な部分だけ覚えて実際に参戦
限界を感じたところで一旦撤退して上位に行ってる奴等が何をしているのか
ネットで探ってパクる、、これでかなり最短で上の方に行ける
おそらくブロガーとかユーチューバーとかその辺も多分同じ
基礎覚えて参戦して撤退してパクる kaggleってDLいるのかね。
自分はtableコンペしか出てないから決定木系しか使って無い
画像もやってみたい 俺、tableコンペばっかやってるけど
DLがんがん使う。アンサンブルのためだけに
上位はそれがないときつい おお、早速パクりたいけどアンサンブルのどこで使うか想像もつかない。検索の旅に出ます >>858
>最適化数学の理論書
具体的に挙げていただけますか?最適化数学とは何かがすごく気になるのです 本屋に行けば沢山あるから新しめの本を買えばいいさ
自分の買った本は当時としては一番よかったものだけどもうオススメできないんだよ 徹夜で組んだ奴がいい学習してる感じでスコアが出るまでとても寝れない気分だけど
気づいたら朝だった
なにをいってるかよくわからないと思うが俺にもよくわからねえ けっこう工学的というか実験ベースな分野ではあるのに、
その辺理屈を無理に押し通す輩が多いからうまくいってないなとは思う。 >>867
わかる
意味なくログファイルをモニターしてしまう 自作データセットでトレデータ:テストデータ=3:1で正解8割
もう1割上げないとなあ kerasはライブラリに
便利な評価用の
関数があるからよ >>857
ChainerとSONYのNNCなら
どっちの方が良いのでしょうか? >>872
どっちもどっちだけどNNCの自動最適化機能は勉強になった
Pythonでガシガシ書きたくないならNNCでいいんじゃないかと 自動最適化は内部がpythonのhyperoptだったりしてw 株価を予想して売買して儲ける、
というのは超ムズイと聞くけど
やっぱりやりたくなってしまう。
で、成績はトータルで赤字です。
やっぱりムズイっすね。 >>875
話題とファンダとチャートみたいなことが言われるが
なんとかモデルみたいな、過去のチャートの動きから騰落率を予想するようなものはだめだと思う。
やるなら話題分析じゃないかな。決算データとかは単純だから手動でなんとかなるし。 >>881
参考になるかわからんけど
https://japan.zdnet.com/article/35142144/
ガートナー、先進技術のハイプサイクルを発表--センシングとモビリティーなど5つのトレンド >>881
なりそう
ついに出版ラッシュが終わった感じがする 冬の時代と言うより実用時代に入ってきたと言う気がする。
時代が変わりつつある。 RPAとAIを合わせてDXなんて言うようになってるのね。
ようやっと既存産業にITが浸透するのかな。
基幹システムとかただの帳票の置き換えだったから、やっと時代が進むのか >>886
AIというバズワードが後押ししたのなら良いことだね
単なるIT化な訳だけど >>880
吉田茂の祖父は大久保利通でなく義祖父。 pythonのhyperoptにあたるライブラリ
Rにはあるけどjavaやcにはないのかなあ。探してるんだけど javaはたぶんランダムサーチとグリッドサーチしかないよね
Cもそうかな python からてきとうにシステム関数使って他の実装呼んでhyperoptつかいまわせばええやん。 それしかないね。pythonでコーディングして、速度が必要な検知システムだけ
Cで書いた関数を呼び出そうかな
kotlinにもモデルを送れるようにしたいから色々と重いわ >>879
> 話題とファンダとチャートみたいなことが言われるが
あ、そうなんすか?全然知らなかったです。
俺のように情弱なのがカモになるんでしょうね。
買ったら下がるし、売ったら上がるしで、悔しい思いばかりですので、
話題分析(?)とか、ファンダメンタルズも少し勉強してみます。 >>893
字句解析の方はtwitterやニュースを利用したソーシャルビッグデータ解析の応用をした米国のスタートアップが大金を集めたが失敗した
感情分析などの精度が粗くスピード感に欠ける方法では戦えなかった 欠損値の補完にXGBを使うのどうなんだろうね
やってみてるんだけど 新しい手法を試して以前よりいい値が出ると嬉しいなあ カテゴリデータの欠損値を埋められると、
決定木以外のモデルでアンサンブルできるからスコアが跳ね上がるんだけど
大抵はよい埋め方が分からなくて時間切れになるんだよね 欠測値の補完は
相関の高い系列から
比率補完してる。
補完方法が分からない、
または面倒ならば、
欠測値の直前の値のコピーでよい。
これは横置き補完(LOCF)という
ちゃんとした方法であり、
分析結果もわりと良いことが知られている。 契約書とか
アホじゃね?
まつおも
分析してくれるのか? sklearn.impute.IterativeImputer
このツールを調べてるんだけど
なんかランダムフォレストで欠損値を保管するアルゴリズムまで
サポートしてくれそうな気配じゃないですか。なんとなく神ツールの予感 このツール、どうも凄そうだけど、kaggle上位陣でも使いこなせる気がしないな >>901
いや、これは良いと思うぞ
学生出身のベンチャーなんか契約書マトモなの書けないから大企業とは仕事できんぞ
プログラミングとは別のスキルだから、こういう面倒なことを押さえていくのはいいと思うわ
検定よりよっぽどか役に立つ まともに契約書もかけないとこと契約すんのかよ。。。 まともでない契約書を書いた企業相手なら穴をつけばいいだろw 契約書にあまりに無茶なことを書いても
つまり、公序良俗に反することやあまりにも常識からかけ離れている場合は
裁判をすれば勝てる可能性が高い
あまり知られていないけど >>889
Adaptive Simulated Annealingのライブラリがあるよ
https://www.ingber.com/#ASA
TPEじゃないけどまあ用途は同じ
比べたことないので性能の優劣はわからんけど俺は重宝してる >>911
ありがとう。これは凄そう
こんなの状況によって使いこなせるcやjavaのエンジニアは
本当にいいエンジニアだな しかしcはこれで、javaはdl4jのアレか
一応、どの言語にもハイパーパラメーター調整用のライブラリはあるんだな libpython使うのもおススメ
やってみると割と簡単
C++とpythonが融合すると新境地が開ける 世界最大の専門職団体であり電気・電子工学・コンピューターサイエンス分野の文献や論文誌を発行するIEEEによる学会誌IEEE Spectrumが、
「Top Programming Languages 2019(人気の高いプログラミング言語2019)」を発表しました
https://gigazine.net/news/20190910-top-programming-languages-2019/
まーpython強いけど だいたい納得のランキングだけど、Kotlinこんな下なんだ
そこだけ驚いた Rが5位ってんなわけあるかよ
どういう重み付けだよ HTMLとかSQLってプログラミング言語、、、なのか? SQLでゲーム造ってた人はいたかな
HTMLはプログラミングの言語じゃないと思うけど
HTML5って広義のHTMLなんか >>920
先輩がスクリプト言語と言ってるから
俺も同様に読んでる。 先輩からは
OSまたはCPUに命令できるのが
プログラミング言語で、
ソフトウェアの動作を記述するのが
スクリプト言語と教わった
SQLもHTMLもソフトウェアの
動作を記述してる その理屈で言うとWordやPowerPointもスクリプト言語だな
ユーザ数はPythonの比ではなさそうだが >>925
外見は全くのアホとしか見えないけど
会社の上の人も、1次受けのSierの人も
エンドユーザーもすごくそのアホ先輩を
崇拝しているのが態度でわかるぐらいなので
多分、大丈夫かと思います。 マークアップ言語をスクリプト言語っていう人はちょっと合わんな
texもスクリプトとか言いそう >>928
勉強は出来ないが仕事が出来るタイプの人かもな
その辺の認識の違いは仕事をする上で問題にならないってことだろうな 重回帰分析で
説明変数の意味は伏せられている
説明変数は3800ぐらいで整数値か実数
欠損値はなし
どう取り組んだらいい? まず、、考える前に周辺を整理する
パソコンのキーボードにゴミは無いかマウスにへんなヌメリが無いか
机にイラナイ本はないか、、そして床の隙間にゴミが入り込んでないか入念にチェック
そうこうしているうちに疲れて来る
また明日考えればいいだろう
そう思って颯爽と寝る
なんて奴はやってもすぐ諦める奴だから
取り組まない方がいい >>933
近くに似たような人がいるわ
グラウンドの掃除ばっかやってて、いつ試合するんだ?ておもてた 1.目的変数と説明変数の相関を調べる
2.相関の高い説明変数だけで、まず重回帰分析してみる >>939
たじゅうきょうせんせい
>>932
とりあえずxgboostとか入れてみる。
マルチコでもそれっぽいものはでるかも >>940
線形以外のモデルも重回帰分析って呼ぶの? >>942
線形でなくても、非線形でも良いので、ブースティングでも、ニューラルネットワークでも 最近、進行速度が早いのでここの利用者が増えていると思われます。
次スレもIP表示のままといます。 スーパーやユニクロなどのセルフレジもそうだが、正直めんどくさい。 逝きたがらない理由は良く判ったが
場所によっては需要があることも判った
>いわゆる“おとなのおもちゃ”を扱っている店は中国全土で普及しています。
>中国でもそういった店での買い物は恥ずかしいようですね。
>中国の地図アプリで「無人商店」と入れて出てきた店舗は8、9割、
>いやそれ以上の割合で無人のアダルトショップです。
>意識の高そうな技術が、意外にも意識の低い現場で大活躍していました。 tf2とpytorchやるならどっちがいいの?
tensorflowとpytorchをpix2pix動かした程度に触っただけ ドロップアウトのことかな?
名古屋大、睡眠中に記憶消す神経発見 起床直前の夢、忘却に関与か?
http://himasoku.com/archives/52090228.html 顔画像から人種のパーセント振分けするのはあるけど
顔画像から身体的特徴を推測するのはまだないと思う
例えば顔だけでこいつは胸が大きいとかチンコがでかいとか程度の特徴は
アダルトサイトから膨大な教師データ取り込んで機械学習させればできるんじゃないかと 顔の特徴と身体的特徴に相関があるならばできるけれど、これは自明ではない
無ければ幾らデータがあっても不可能 人相学は顔から身体的特徴を判断するものだったのか、知らなかった >>956
可能ですよ
世界中の全ての人の顔と身体の
データあれば。 >>960
これから生まれてくる人の顔から予測するのはできないんじゃね? ヒトゲノム情報と成人した時の顔や身体的特徴との相関を取ればよいのでは?
このテーマが解ければ、ゲノム編集で生まれる前から整形できるし
遺伝もする そういえば最近、ディープラーニングの話題があまり出ない気がします。
もしかして、冬の時代に入った? できることできないことがほぼ明らかになったからな
自動運転は世の中が100% を望むからもうこれ以上開発しても意味が
ないかと思う。遺伝子組み換え食品と同じ運命 目新しさが無くなって話題が減ったせいでは。投資が減ったようなデータは見かけてない もう完全に実用段階に入ってる
浮ついた話題はだいぶ消えた 真のAIならコミュニケーションしてても気付けないだろ GCPとか使えば知識なくても出きるらしいしね
ところでGCPってクレカ登録必須だけど、Vプリカでもできるか誰か試したことありますか?
クレカは出来ればやたら登録したくないです GCPってクレカ登録しても明示的に課金操作しなければ課金されることはない(=課金開始ボタンのようなものがある?)という趣旨の記事と
無料と思っていたら知らない内に請求されてたという記事が混在していて何を信じればいいのか分からない >>974補足
GCPは無料枠をオーバーしてもインスタンスが自動で止まるからちょっと試したいだけの人も安心みたいな記事が多いけど
サマータイムで1日多い月に月間の上限を超過して課金されただのという記事もあり、
「いや、超過前に勝手に止めてくれるんじゃなかったの?」と困惑して興味はあったが使っていない 分類系の実際問題にはどんどんAIを適用すればいいのに できるところはやってる。みんなバカじゃない
導入が遅れているところは、データを集める労力の高さがネックでシステムが走るところまでいかない OpenAIがだしたMARLのかくれんぼ動画って結局なにをいいたいんだ・・・アメリカ語が分かる方教えてクレメンス エージェント同士が道具を使って協力する事を学習出来た
ついでに人間側の想定しなかった道具の使い方も学習した >>979 ありがとう!協調して目的を達成するまさにマルチエージェントと強化学習が合体したすばらちい研究ですね。 OpenAIのやつも、DeepMindのDQNと同じ深層強化学習なの? 株価のローソク足グラフを深層学習したいって言ってた人がスレに大昔いたっけ
ローソクだけなら[始,終,高,安]のリストでもタプルでもjsonでもいいんだな
チャート画像丸ごと学習! って言ってたな それってわざわざチャートのローソク画像使わなくても数値でいいじゃん。
よほど楽で正確だと思うがな。 完全にプログラミング等ど素人です。
RとかPython、ベイズ統計、機械学習と勉強していきたいんですがどうやって勉強すればいいでしょうか。
やりたいことは、株とか競馬とかです。
データ取り込んで解析してグラフ化まで出来るようにしたいんです。
簡単な本で例題が豊富で手を動かしながら統計処理を習得できるような書籍ありましたらご教示願いたいです。
熱流体専攻してた理系ですので、数式とかは結構すきです。
会社の研修で統計かじってみたら存外面白くて勉強してみたくなりました。業務には全く使いませんが。
今持っている本は、
Excelでスッキリ分かるベイズ統計入門、すぐわかる確率統計、すぐ分かる統計処理
の3冊です。 独学なら言語名+機械学習とか言語名+ベイズとかでググって評判のいい書籍買ってみたら。 「ベイズ統計はベイズの定理を基礎として〜」といった趣旨の説明がある書籍は筆者自身がベイズ統計を理解できていないので買ってはならない 東大のデータサイエンティスト養成講座はpythonで手を動かす感じで向いてそう 銀行系の不正検知システムは、
特徴量ごとにモデルを作ってスタッキングするのが主流らしい
kaggleの世界じゃん 自分の知ってる狭い範囲の話をすると、
ベイズ統計は必要だけど普通の統計学の知識の方が百倍役にたつ
基礎統計学をそこそこやってからベイズ統計やった方がいいんじゃないかな 頻度統計:得られたデータが理想的な○○分布母集団に対してどれだけ近いか論じる。仮定した母集団から得られるデータとして妥当なのかありえないのか。検定。
ベイズ統計:得られたデータを発生させる母集団分布の形を推定する。母集団の分布の形を確率として表現する。
みたいな感じ? >>985
言語はRでもPythonでもいいけどスクレイピング技術を勉強しておくと役に立つよ。 >>996
なんでこんな全く関係ないこと言ってるの? このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 89日 20時間 0分 18秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。