Pytorchなどの既存の機械学習用ライブラリを使わずにC++とCUDAを使ってゼロから画像生成AIを作っている
画像生成モデルにはGAN、VAE、拡散モデルなどがあるが
巷で話題のStable DiffusionというのはVEAと拡散モデルを両方取り入れたもの
ただし、Stable Diffusionにはprompt embeddingというユーザーの入力であるテキストプロンプトをニューラルネットワークに埋め込む構造が存在しているが
自分が作ろうとしているのは単純に正規分布の乱数列を入力すると任意の画像が生成されるという改造版のStable Diffusionなので
prompt embeddingを使わない方向で行こうと思う
探検
画像生成AIを作る
2025/01/19(日) 13:52:21.32ID:dMmOXYWM
学習データはエロ画像ということもあり
もともとはPINK板にスレ建てたが
プログラム板住民ほど賢い人がいないのと、60レス目からグロ画像荒らしが来るようになったため
ここに来た次第である
https://phoebe.bbspink.com/test/read.cgi/hgame/1724853336/
もともとはPINK板にスレ建てたが
プログラム板住民ほど賢い人がいないのと、60レス目からグロ画像荒らしが来るようになったため
ここに来た次第である
https://phoebe.bbspink.com/test/read.cgi/hgame/1724853336/
3デフォルトの名無しさん
2025/01/19(日) 18:17:28.14ID:I92SXWAZ 尾行ついてるぞ
余計なもん連れて来やがって
余計なもん連れて来やがって
>>3
よくわからないですが、尾行とは誰のことでしょうか?
よくわからないですが、尾行とは誰のことでしょうか?
あ、もしかして2レス目からハンドルネームがついてるのに違和感を覚えたのか
それならIDが同じであることからもわかるけど、同じ人ですよ
ただし、前に使っていたネームと違うものにしました
それならIDが同じであることからもわかるけど、同じ人ですよ
ただし、前に使っていたネームと違うものにしました
2025/01/19(日) 23:33:04.94ID:xePVZNJy
AI構築って企業が金を積んで教師データ量でバトルする領域だと思ってたけど、今さら個人でどうにかなるもんなの
勉強ついでなら好きにすればいいけどさ
勉強ついでなら好きにすればいいけどさ
7デフォルトの名無しさん
2025/01/20(月) 13:40:51.06ID:G+ryJ45G 企業は馬鹿を対象に馬鹿なデータも大量に集めるから馬鹿なAIにしかならんよ
そこそこ知名度のある企業だと公衆の目を浴びなければいけないので
公序良俗に反するエロに進出することもできなくなるのでしょう
公序良俗に反するエロに進出することもできなくなるのでしょう
Stable Diffsionのトレーニング手順としては
VAEのトレーニングと拡散モデルのトレーニングの二つの段階に分けられる
VAEはエンコーダとデコーダを持つモデルで、画像を低次元の潜在空間に圧縮し、その表現を使って元の画像を再構築する
拡散モデルのトレーニングはVAEで学習された潜在空間上で行われる
つまり、VAEが正しく画像を圧縮と再構築できなければ、次の段階である拡散モデルのトレーニングに進むこともできない
VAEのトレーニングと拡散モデルのトレーニングの二つの段階に分けられる
VAEはエンコーダとデコーダを持つモデルで、画像を低次元の潜在空間に圧縮し、その表現を使って元の画像を再構築する
拡散モデルのトレーニングはVAEで学習された潜在空間上で行われる
つまり、VAEが正しく画像を圧縮と再構築できなければ、次の段階である拡散モデルのトレーニングに進むこともできない
VAEのトレーニングは先週から始めた
自分のPCのGPUのVRAMは16GBしかないため
もともとのstable diffusionで使われたいた512×512サイズの画像で学習することはできず、128×128で学習している
MSE lossは今では0.02なんだけど
再構築された画像はまだ微妙な感じ
https://i.imgur.com/nxwODSu.png
https://i.imgur.com/Vv32Cf2.png
自分のPCのGPUのVRAMは16GBしかないため
もともとのstable diffusionで使われたいた512×512サイズの画像で学習することはできず、128×128で学習している
MSE lossは今では0.02なんだけど
再構築された画像はまだ微妙な感じ
https://i.imgur.com/nxwODSu.png
https://i.imgur.com/Vv32Cf2.png
11デフォルトの名無しさん
2025/01/21(火) 08:30:55.42ID:yRL5l1cZ QRコードの質問此処で良い?
レスを投稿する
ニュース
- れいわ議員「母親はね、子どもを戦争に行かせるために産んだんじゃないんだよ」 高市総理に“10秒回答”迫り、残り5分は“独壇場”★2 [♪♪♪★]
- 男女2人死亡の赤坂・個室サウナ火災、非常ボタン押された形跡…従業員は煙感知の報知機で気づく [蚤の市★]
- 中国国防省が再反論 SNSで公開した音声とは“別の通報”で日本に訓練の時間や海域を通報したと主張★3 [夜のけいちゃん★]
- 【東京】赤坂サウナ火事2人死亡 サウナ室のドアノブ外れ閉じ込められた可能性 ★7 [nita★]
- BreakingDown選手がくも膜下出血、瓜田純士、平手打ちを行った江口響は「もう格闘技も辞めます。責任取りたいです』とまで言ってきてる」 [muffin★]
- 資さんうどんが「PayPay」の取り扱いを停止 他のキャッシュレス決済は引き続き利用可能 [少考さん★]
- 【速報】高市早苗、文春砲wwwwwwwwwwwwwwwwwwwwwwwwwwwww [339035499]
- 【実況】博衣こよりのえちえちダンガンロンパ6🧪
- 現役JKのお茶会スレ( ¨̮ )︎︎𖠚ᐝ184
- サウナ火災焼死事件、死亡した夫婦は非常ボタンを押すも扉は開かず蒸し焼きに [963243619]
- 従兄弟を自殺させたんだけど
- 女子小学生すこすこスレッド 三👶🔪 🎒👧🏡
