stable diffusionの構造に関してネットいろんな記事を見てきたけど
自分が見つけた実装レベルまで詳しく解説してくれているのは以下です
https://blog.csdn.net/xd_wjc/article/details/134441396
探検
画像生成AIを作る
数日VAEをトレーニングしてみたが
最構築された画像はどれも>>10のようなぼやけているものばかり
ChatGPTに聞いてみたところ、どうやらMSEの短所らしい
MSEはピクセル単位で誤差を判断するため、キャラクターの輪郭など全体的な特徴を評価するのが苦手
全体的な誤差を評価するために、画像の類似度を示せるSSIMがいいらしい
合っているかどうかわからないが、とりあえずMSEとSSIMを組み合わせて使おうと思う
最構築された画像はどれも>>10のようなぼやけているものばかり
ChatGPTに聞いてみたところ、どうやらMSEの短所らしい
MSEはピクセル単位で誤差を判断するため、キャラクターの輪郭など全体的な特徴を評価するのが苦手
全体的な誤差を評価するために、画像の類似度を示せるSSIMがいいらしい
合っているかどうかわからないが、とりあえずMSEとSSIMを組み合わせて使おうと思う
2025/01/22(水) 21:27:34.18ID:Ggey4yUO
stable diffusionの画像生成プロセスを観てると、夢ん中で作られていく感じに似てるとおもた
17デフォルトの名無しさん
2025/01/24(金) 11:01:44.72ID:BC4ZbKEp VAEから作ってんのか
なかなか真面目じゃん
なかなか真面目じゃん
>>17
ありがとうございます
一応C++標準ライブラリとCUDA以外のライブラリは使わないつまりなので
VAEを作る前の段階として
tensorや主要なニューラルネットワークの層も自作しています
ただ、png画像の読み込みと出力はopencvを使い、グラフのプロットはgnuplotを使っています
どちらも複数のOSに対応しているので、環境構築は非常に簡単です
ありがとうございます
一応C++標準ライブラリとCUDA以外のライブラリは使わないつまりなので
VAEを作る前の段階として
tensorや主要なニューラルネットワークの層も自作しています
ただ、png画像の読み込みと出力はopencvを使い、グラフのプロットはgnuplotを使っています
どちらも複数のOSに対応しているので、環境構築は非常に簡単です
2025/01/24(金) 18:36:35.48ID:NBK/ONYA
ソース公開する気ないならただの日記だよ?
ソースは完成したら公開する予定です
readme.mdはまだ書いていないのと、ライセンス関係はまだよくわからないので
今は公開できないです
readme.mdはまだ書いていないのと、ライセンス関係はまだよくわからないので
今は公開できないです
2025/01/24(金) 21:58:30.76ID:5i0pdKkE
ただの統失の日記スレ
23デフォルトの名無しさん
2025/04/29(火) 00:25:24.70ID:/Qf//3PH どう?開発進んだ?
レスを投稿する
ニュース
- 高市早苗首相の答弁めぐり参院予算委が再三ストップ 立民会派が“台湾有事”答弁に納得せず [♪♪♪★]
- 【東京】赤坂サウナ火事2人死亡 サウナ室のドアノブ外れ閉じ込められた可能性 ★3 [nita★]
- 【東京】赤坂サウナ火事2人死亡 サウナ室のドアノブ外れ閉じ込められた可能性 ★4 [nita★]
- フィンランド、ミスや国会議員つり目投稿 くり返されるアジア人差別 ★3 [蚤の市★]
- 「PC買うなら急げ」は本当だった。マウスが一部販売停止&1月値上げを発表 [♪♪♪★]
- BreakingDown 前日会見で対戦予定選手から不意打ちビンタ→後頭部強打で失神した選手、くも膜下出血と報告「脳内に出血が発見され…★3 [Anonymous★]
- 高市「環境性能割を2年間停止とする!新車が安くなるわよ!」ネトウヨ「うおお高市!俺たちの高市!!減税最高!!!」 [792931474]
- 政府「ヒキこもり増えすぎ;;コイツラ普段何してんの;;」 [189987783]
- 【和歌山】県警さん、乾燥大麻を紛失 [696684471]
- マッチングアプリさん、鉄オタのキャンセルカルチャーに負けて謝罪 鉄道模型をうっかり踏むシーンが炎上 高市早苗 [175344491]
- 赤坂サウナ 身元判明 川崎在住の会社経営者 [628392482]
- 【悲報】小泉進次郎(関東学院大卒)、レーダー照射事件で何故かパイロットの「手袋」を公開して反論を試みる🥹 [616817505]
