探検
ワイ氏、AIアルゴリズムTransformer理解できない
1デフォルトの名無しさん
2024/08/16(金) 03:04:51.87ID:mQScfB5o CNNとかRNNとか理解できて組めるけど、こいつだけ理解できんし組めん
2デフォルトの名無しさん
2024/08/16(金) 03:09:06.20ID:mQScfB5o 他人の組んだやつを少しいじったりはできるけど、パラメータ数とかのいじったりできんわ。誰かに聞きたいんやけどこんなやつ結構多いと思うんよ
2024/08/16(金) 03:14:20.62ID:Rc0NIZPv
何が理解できないの?
2024/08/16(金) 14:23:36.24ID:ckm1V/4U
ところで開発環境はどうしてるの?
でっかいモデル学習させるのに必要なGPUって高いやろ?
ちっこいモデルで我慢するのかな?
でっかいモデル学習させるのに必要なGPUって高いやろ?
ちっこいモデルで我慢するのかな?
5デフォルトの名無しさん
2024/08/16(金) 15:00:20.27ID:mQScfB5o >>3
いろいろ理解できてないから分からないとすごく言いたい。
前提として今まで趣味でCNNとかをkerasで組んでます。
Transformerはtorchになるからそこで少しつまずいているのもあります。
__init__とforwardとかも__init__が定義でforwardが処理みたいなことぐらいしか理解できない。
self-attentionのqkvとかもよくわかってない。ネットで調べても数式の解説とかが多くて、私には分からんかった。高卒なので線形代数とか分からない。
漢検5級の人が1級の勉強をしている感覚です。ところどころわかるけど、全体通すと分からないです。
いろいろ理解できてないから分からないとすごく言いたい。
前提として今まで趣味でCNNとかをkerasで組んでます。
Transformerはtorchになるからそこで少しつまずいているのもあります。
__init__とforwardとかも__init__が定義でforwardが処理みたいなことぐらいしか理解できない。
self-attentionのqkvとかもよくわかってない。ネットで調べても数式の解説とかが多くて、私には分からんかった。高卒なので線形代数とか分からない。
漢検5級の人が1級の勉強をしている感覚です。ところどころわかるけど、全体通すと分からないです。
6デフォルトの名無しさん
2024/08/16(金) 15:09:07.96ID:mQScfB5o >>4
Python開発環境は、Python 3.9.0を使用しています。Visual Studio Codeを仮想環境はvenvで管理しています。OSはWindows 10です。
CPUはryzen9 5900x
メモリ 96GB
グラボ RTX 3090
今は個人向けグラボで学習できる範囲でしています。
1bぐらいのモデル学習させてみたいです
Python開発環境は、Python 3.9.0を使用しています。Visual Studio Codeを仮想環境はvenvで管理しています。OSはWindows 10です。
CPUはryzen9 5900x
メモリ 96GB
グラボ RTX 3090
今は個人向けグラボで学習できる範囲でしています。
1bぐらいのモデル学習させてみたいです
2024/08/16(金) 19:58:02.10ID:ckm1V/4U
レスを投稿する
ニュース
- 最新版Z級クソ映画ランキングが決定! [牛丼★]
- 【STARTO ENTERTAINMENT】SUPER EIGHTの横山裕、フジ『ドッキリGP』ロケで全治2ヶ月の重傷 [Ailuropoda melanoleuca★]
- 「1800万円の売り上げゼロに…」中国インバウンドに特化の宿の今 ★2 [蚤の市★]
- 公用車カーナビのNHK受信料「全額免除を」 千葉市議会、国に制度創設求める意見書可決 [少考さん★]
- 【食】「シャウエッセンは焼くべからず」暗黙のルールを破り売上高過去最高…日本ハム社員たちが「夜味」にかけた情熱 [ぐれ★]
- 地震 [Hitzeschleier★]
- 恋する山上はせつなくて安倍ちゃんを想うとすぐパァンしちゃうの [377482965]
- おまえらはスマホ何年でダメにしてる?
- (´;ω;`)起きちゃった!
- 仮に放射線混ざってたとしてもテムとアリエク使うわ
- ドーは
- 親父が同級生(クラスの真面目委員長JK)の母親と結婚した。ウソじゃない。事実なんだ
