【統計分析】機械学習・データマイニング31
■ このスレッドは過去ログ倉庫に格納されています
!extend:on:vvvvvv:1000:512 !extend:on:vvvvvv:1000:512 ↑すれたてる毎に1つずつ減るので、減ってたら3回に増やしてたてること。 機械学習とデータマイニングについて語れ若人 *機械学習に意識・知能は存在しません。 人の意識に触れたい方はスレ違いです。 ■前スレ 【統計分析】機械学習・データマイニング29 https://mevius.5ch.net/test/read.cgi/tech/1597882603/ -EOF- 【統計分析】機械学習・データマイニング30 https://mevius.5ch.net/test/read.cgi/tech/1609459855/ VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured 最初に多層ニューラルネットワークを考えた人は正直ノーベル賞レベルだと思う ようやく花ひらいたけど基本は当初と何も変わってないし ノーベル何賞になるんだよ 新設しないと該当する賞がねーだろ >>79 だからノーベル賞的なものと書いた 数学だとそれはフィールズ賞らしいけどな ニューラルネットワークって物理の文脈で捉えることも可能だからゴリ押せば問題ない ノーベル賞の認知度の高さが一般人の科学への認識を歪めてる感はありますね。 > お前は毎朝起きるたびに俺に負けたことを思い出すよ^^ あー、ホンッとに思い出すなあ(笑) キチガイの嘘つきの低レベルFランの、 朝鮮ゴキブリBot君は、 チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な ことはよーくわかったよ。 ホントなにもできない朝鮮ゴキブリBot君! クソチョンw 情報系じゃなくて実験系の出身だから論文読むのも大変だわ 機械学習が必要になってPytorchやTensorFlow使ってるんだけど、 自分がやってることと言えば論文軽く読んでGitHubからコード落として、ネットワークを目的に応じて修正し自分のデータに適用してるだけ 詳細なアルゴリズムはよく理解できてないことも多い 全く新しいモデルを提案する人達はすごいなと感じます >>93 同分野でも原理か応用かでやってることは全く違いますからね。 原理を知っておいて損はありませんが、応用で一番大事なのは対象となる事象の理解なんて言われるくらいですし。 パソコンを使って何かを創る人とパソコンの仕組みを研究してる人って感じですね。 特定分野の一技術がこれだけ広く利用されている現状はなにげにすごいことです。 K-meansするとき、標準化や正規化って必須なの? 特徴によってスケールが違うんだけど。。。 >>98 データを歪めてるというよりも、異る値を公平に比較するために揃えてる感じですね。 正規化は単体のデータではなくデータの集合に対して行いますので、単体の値が変化しても集合内のデータ間の関係(例えば距離の比)は保たれます。 手法が見ているのがこの生の値なのか関係なのかが問題で、生の値をそのまま使う場面はかなり稀だと思います。 >>95 例えば身体測定のデータが身長km体重gで入ってたらどうなると思う? NFTゲーム、ブロックチェーンゲームに今すぐ参入しなさい これからこの市場は100倍になる 2年もしたら先行者利益が失われてブルーオーシャンからレッドオーシャンになるだろう こんなとこで宣伝しなきゃならんほどアブナイのか... 機械学習やDeepLearningにおいて、線形代数ってどのレベルまで勉強したらいい? 行列の計算方法がわかるくらいじゃ不十分? >>105 ベクトル値関数のベクトル、行列でのフレェシェ微分を計算できるぐらいは必要。 テンソルの演算と多変数関数の連鎖率とミニバッチ勾配降下法だけで全て対応可能だよね ややこしい微分方程式の解を求めるための重積分の計算とかとか ラグランジュの未定乗数法もいらないから数学的には相当楽勝 おそらく機械学習の分野の中でも1番シンプル この分野を難しく解説してる本もあるけど 想像以上にめちゃくちゃシンプルだよ 大学で物理や数学やってた人からするとめちゃ簡単に感じる この簡単な仕組みで世界を変えたのは本当に凄いとしか言いようがない 数学の行列もいじれない人は既存のソフトウェアで十分。 ツール化が進んだので結果的に数式はいらなくなっている 新しい分野に適応するのはほぼ不可能だろうな 先行事例があるものだけがうまく行く可能性がある それでも条件が違うとうまく行かないだろうが 今のAIってかなり雑な処理してるように思えるんだけど 生体もそんな感じだから良いのだろうか こんな雑にやってたらじきに頭打ち来るよね? gpt3やらtransformerベースのcv見てるとそう思う > お前は毎朝起きるたびに俺に負けたことを思い出すよ^^ あー、ホンッとに思い出すなあ(笑) キチガイの嘘つきの低レベルFランの、 朝鮮ゴキブリBot君は、 チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な ことはよーくわかったよ。 ホントなにもできない朝鮮ゴキブリBot君! クソチョンw クジラ飛行机の『PythonによるAI・機械学習・深層学習アプリのつくり方』という本を読んでいるのですが、はがきの郵便番号の枠の抽出処理が 原始的すぎるので驚いています。 抽出領域のサイズを大きすぎたり小さすぎたりしないようにしていたり、抽出した輪郭同士が近すぎるのは駄目とか細かなルールを コーディングしています。 機械学習って、あまり楽しいもんじゃないですね。 本当に必要に迫られている人とか仕事でやっている人なら、一生懸命やるかもしれませんが、そうでない人のモチベーションってなんですか? 苦行でしかないような気がします。 それは機械学習ではなくて前処理だ 前処理は苦行であるが必要なのだ ちなみ、本を読んでないからなんとも言えないところがあるけど、おそらくもっとスマートに抽出する方法はある。 機械学習のエキスパートだからといって 画像処理のエキスパートとは限らない あとソフト屋さんはソフトでなんとか しようとするけど、照明とかカメラとか ハードを工夫することも大事 >>122 深層学習でも面倒な「前処理」をするんですか? >>118 それは古い手法 今時の物体認識はそれを自動でやる クジラ某、とか良く分からん奴の本なんか当てにすんな ひまわりやなでしこを開発した人か マレーシアの東海岸に住んでるんだっけ > お前は毎朝起きるたびに俺に負けたことを思い出すよ^^ あー、ホンッとに思い出すなあ(笑) キチガイの嘘つきの低レベルFランの、 朝鮮ゴキブリBot君は、 チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な ことはよーくわかったよ。 ホントなにもできない朝鮮ゴキブリBot君! クソチョンw クソチョンはウンコを食べる糞食人種w ゲリ便をじゅるじゅると うまそうに食ってるw ホテル、民泊などの料金はダイナミックプライシングになっていると聞きます。何ヶ月か前に予約すると安くて、当日はビジネスユースで高い?固定の価格の人もいる? 売上を最大化するプライシングを予測する場合、説明変数、目的変数はどのように設定するものでしょうか。 以前にsignateでコンペがあったのですが、目的変数が部屋の価格?になっていて予約日やその時点での空き部屋数などの考慮はしていなかったと思います。 これにちょっと違和感を感じていました。 >>124-128 ありがとうございました。 >>127 OpenCVの使い方とかが分からなかったのですが、サンプルファイルを動かしてみるとこんなことができるんだというきっかけにはなる本だと思います。 自分のパソコンに保存してある数学の講義動画のmp4ファイルを使って、サンプルプログラムを動かしてみたら、動いている人物=講師が 緑色の枠線でときどき囲まれていて楽しかったです。 transformer系の論文、ネタ切れの感ない? 蒸留やモデル圧縮した話ばかりに思える https://youtu.be/rxKghrZU5w8 パランティア 大量の情報を瞬時に統合、分析できる高速データマイニングシステム 法人向け、製品の活用例:軍事 Windowsの「ペイント」で1桁の数字を手書きで書きました。(白い背景に黒い文字) MNISTの数字のデータとフォーマットを合わせるために以下の処理をしました。 「9」を書いたファイル'my9.png'を読み込んで処理しています。 その後、TensorflowでMNISTデータをもとに学習したニューラルネットワークで、自分で書いた数字が どの数字なのかpredictしようと思ったのですが、エラーが出てしまいました。 im = cv2.imread('my9.png') im = cv2.cvtColor(im, cv2.COLOR_BGR2GRAY) im = cv2.resize(im, (28,28)) im = 255 - im plt.imshow(im) plt.show() im = im.astype('float32') / 255 どこがおかしいでしょうか? 説明変数だの目的変数だの日本語訳がわかりにくすぎませんか? false positive false negativeは毎回どっちやねんてなる パーセプトロンで、重みを0で初期化してはいけない理由がわかりません。 重みを0で初期化しても学習で重みが更新されていけば問題ないんじゃないですか? 誰かがそう言っていても実際に問題がなければ間違いだと判断していいと思います 例外的に問題が発生するかもしれないけど、その場合はその条件を明らかにしたらいいと思います NNが学習する仕組み書いてある本とかサイト読めばすぐ分かるのに 俺今までPytorch使ってたんだけどKerasのほうがよっぽど使いやすいなこれ こらゃ流行るわけだわ 自分はkerasからPytorchに変えたよ 論文の実装がPytorchだらけなんでコード読むのに必要になったからさ 今ではPytorch派ですw Kerasは統計の人(非エンジニア) PyTorchはプログラマの人 にそれぞれ使いやすいって印象 >>152 点群処理関連がほぼ PyTorch なんで入れたが、cuda のバージョン依存が厳しい〜 >>154 画像系から画像以外に行こうとしたらデータ読み込み周りが分からなくなってPGだけど自信無くしたわw df読み込むのKerasならすぐなのにPytorchはデータローダー噛まさないと行けない?から面倒くさい ネットワーク構築以外にも学習にたどり着くまでの敷居が高い気がするわ 異常検知の分野って特徴量の抽出だけにモデル(ResNetとかEfficientNet)を使う方法が最近覇権とってるけど、教師あり学習とかオートエンコーダーではもうかなわないのかな どうすれば脳の仕組みを「理解」できるのか: 分かり方は一つじゃない 脳を解明する4つの方法 https://rmaruy.hat ○enablog.com/entry/2019/09/05/225258 『神経科学者はマイクロプロセッサすら理解できなかった』 https://rmaruy.hat ○enablog.com/entry/2019/01/29/225106 Google騙る迷惑電話?ネット注意喚起も... 実は公式調査、同社が発表「営業時間の確認中」 https://www.j-cast.com/2021/11/12424821.html?p=all >Googleアシスタントからの電話は会話型AIを採用している。 >ツイッターでは精度について、「AIなのか生身の人間なのか曖昧で、絶妙に違和感のある話し方」だと評する声も。 Google Duplexが日本でも稼働 「怪しさ満載なんだが、、、」 「怪しいおじさんの電話 詐欺かな」 「とにかく気持ち悪かった」 >この電話かかってきたけどマジで気持ち悪かった >機械と人間の中間くらいの話し方で会話のテンポもおかしいし https://www.youtube.com/watch?v=D5VN56jQMWM 英語版はそこまで気持ち悪くない 人間てnnでend2endのシステムを作っても自前ルールを後付けしてちょっとでも性能を上げようとしがち だってちょっといじった感出したいしさ Githubほぼそのままでいけましたなんてサボってたみたいじゃんw csc matrixをarray化するのに10.7TiBが必要でoomが出た 最初の数行だけでも展開できないものか ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.5 2024/06/08 Walang Kapalit ★ | Donguri System Team 5ちゃんねる