X



【StableDiffusion】画像生成AI質問スレ21
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。 (ワッチョイ 9bf2-e8vO)
垢版 |
2023/12/22(金) 20:18:47.98ID:WCuIa5Ix0
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512
↑スレ立て時にはこれを3行に増やしてください

Stable Diffusionをはじめとする画像生成AIに関する質問用のスレッドです。
次スレは>>970が立ててください。

質問する人はなるべく情報開示してください

・使っているアプリケーション(1111ならどこから/何を読んでインストールしたか)や使っている学習モデルを明記する
・状況の説明は具体的に。「以前と違う画像が出力される」「変になった」では回答しようがない。どう違うのか、どう変なのかを書く
・状況やエラーメッセージを示すキャプチャ画像や出力画像をアップロードする。出力画像はimgurではなく、catboxなどアップロード時に出力パラメータが残るサービスへ
・ローカルならマシンの構成(GPUの種類は必須、VRAM容量やメインメモリの容量、CPUの種類もなるべく)を書く

テンプレは https://rentry.co/aiimggenqa

※前スレ
【StableDiffusion】画像生成AI質問スレ20
https://mevius.5ch.net/test/read.cgi/cg/1700315721/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
0244名無しさん@お腹いっぱい。 (ワッチョイ 7ff2-zQB7)
垢版 |
2024/01/24(水) 14:09:05.62ID:VPmHtnMF0
>>243
グロ
0246名無しさん@お腹いっぱい。 (ワッチョイ c794-5jDG)
垢版 |
2024/01/24(水) 17:51:10.54ID:5O3XDhSZ0
そもそも同じモデルで生成してれば似たような物が出るのは当たり前
構図とかポーズもそのモデルで出やすい物が出る
そこを代えてくプロンプトはあるけど、特定絵柄に特化してるタイプのモデルは効きにくい
汎用性があるモデルでも、指定すれば何でも出るというほどではない
0247名無しさん@お腹いっぱい。 (ワッチョイ 7f34-amFq)
垢版 |
2024/01/25(木) 13:03:40.27ID:CcxOAcFd0
https://mevius.5ch.net/test/read.cgi/cg/1703250505/518
> 最初optimizerの設定をadamW8bitにしていたのですがError no kernel image is available for execution on the deviceとなったのでadamWに変更したところのエラーです
1070tiなんでadamW8bitは動かないんだろうね

> CUDA out of memoryとあったので色々参考にSBwebui-user-batに--xformers --medvramを加えてみたりwebui.batのほうにset PYTORCH_CUDA_ALLOC_CONF=garbage_collection_threshold:0.6, max_split_size_mb:128
> を入れてみたりしたのですがあまり改善しませんでした
> そもそも何か根本的に間違っているのでしょうか?
これは勘違い、それはwebui側であってkohya_ssとは関係ない
0249名無しさん@お腹いっぱい。 (ワッチョイ 7ff2-zQB7)
垢版 |
2024/01/25(木) 19:08:47.44ID:FDgC0t3O0
>>248
グロやね
0251名無しさん@お腹いっぱい。 (ワッチョイ 5fc0-5jDG)
垢版 |
2024/01/25(木) 20:57:39.64ID:E8dWQL8g0
SDXLでリアル系でLoRAの効きのいいモデルって何があるでしょうか?
fudukiMix_v20 をいま試しているのですが LoRA JP2 を追加しても全然変わらないのです
できればAnimagineベースでRefinerとして使いたいのです

SD1.5ではアニメモデルをベースにxxmix9realistic_v40でRefinerかけてADetailerという感じがお気に入りでした
理想 → https://i.imgur.com/6a1OH8B.jpg
0252名無しさん@お腹いっぱい。 (ワッチョイ df23-EFyZ)
垢版 |
2024/01/26(金) 02:26:06.16ID:uQLW+6450
>>247>>250
やっぱりwebuiとkohyaは別々なんですね…
kohyaを含めてCUDA out of memoryエラー?を調べてもSBの解決方法しか出なかったのでwebui側の問題かなと考えてしまいました
書き方からすると初歩的なミスなのでしょうがプログラミングなどの知識はないので何が間違っているのか何度見返してもわかりません
できれば噛み砕いて教えてくただけると助かります
0253名無しさん@お腹いっぱい。 (ワッチョイ 8754-zQB7)
垢版 |
2024/01/26(金) 02:45:35.76ID:m9A1jw5P0
>>252
Kohya_ss起動した時の一番上Running on local URL: http://127.0.0.1:7860より上の
メッセージが見えるSSが見たいな
Kohya_ssのセットアップミスだと思うけど
後、CUDA out of memoryは単純にVRAMが足りないから処理続行出来ないってエラーだから
8GBしかVRAMが無い1070じゃそれなりにやりくりしないと厳しいよ
一応共有メモリを使うことで多少ならカバー出来るけど
メモリ搭載量が16GBしかないので共有メモリが8GB(メインメモリの半分)しか確保出来ないので
処理によっては8GB+8GBでは足りない感じなんじゃないかな(よっぽど無茶しなきゃ普通は12GB前後でおさまる筈)
0255名無しさん@お腹いっぱい。 (ワッチョイ 5f74-9ai5)
垢版 |
2024/01/26(金) 12:12:19.62ID:h9xQ5rB10
>>252
細かい事はわからんのだけどメモリ32GBと3060ti(8MB)でKohya_ss回してて、OutOfMemory対策で設定してるところ。もし参考になれば。
・LoRAtype:Standard(他は無理?)
・Trainbatchsize:1か2(Max resolutionと相談)
・Mixed precision、Save precision:fp16固定
・Max resolution:512ならTrainbatchsize2でも可能かも、752なら1固定
・Network Rank、Network Alpha:上げすぎは無理(128、1で問題ないと思ってる)
0256名無しさん@お腹いっぱい。 (ワッチョイ 7f34-amFq)
垢版 |
2024/01/26(金) 14:05:20.75ID:GkV37sHr0
>>252
レス遅れた、ごめん
https://i.imgur.com/C2w7ixb.png
一番上よく見るとdreamboothになってる、メモリめっちゃ消費するのでOOMになる

デフォの起動時のタブがそれで、見た目もほとんど変わらないので
> みんなよくやるらしい
https://www.reddit.com/r/StableDiffusion/comments/111w2gy/cuda_out_of_memory_when_using_kohya_ss/
0258名無しさん@お腹いっぱい。 (ワッチョイ 87da-0Ail)
垢版 |
2024/01/27(土) 13:39:36.76ID:lW9Bt8xu0
初めて2週間ぐらいの初心者です グラボはgtx1660です
kohya_ssを使用して33枚の画像を繰り返し20回×15回=9900ステップで自作のloraを作成しました
教育用の画像は1024×1024の正方形で背景を白く加工しもので全画像でキャラクターが同じ服装をしています
stable-diffusionで自作のloraを使って画像を生成しましたが、微塵も反映されません
見た限りでは学習時と画像生成時にエラーもないようです
学習結果が反映されない理由として何が考えられるでしょうか?
0261名無しさん@お腹いっぱい。 (ワッチョイ 87da-0Ail)
垢版 |
2024/01/27(土) 15:36:48.89ID:lW9Bt8xu0
>>259
>>260
学習時にloraを選択しタグもいれています
プロンプトも試しましたが自作loraありとなしで同じ結果でした
0263名無しさん@お腹いっぱい。 (ワッチョイ 87da-0Ail)
垢版 |
2024/01/27(土) 16:20:13.07ID:lW9Bt8xu0
>>262
自作loraのメタデータを見たときに設定したタグが全てあるので
たぶん間違ってないと思います
0265名無しさん@お腹いっぱい。 (ワッチョイ 7f34-amFq)
垢版 |
2024/01/27(土) 18:02:05.53ID:8ds3cEts0
実はキャプションtxt一切なしでも一応学習はするし、トリガーワードなしでもLora入れてると反応する

>>258
エスパーじゃないので細かい設定見ないとなんとも・・jsonファイルをアップローダー等に上げて貼って
> 見た限りでは学習時と画像生成時にエラーもないようです
LossがずっとNaNとかになってない
0268名無しさん@お腹いっぱい。 (ワッチョイ 87da-0Ail)
垢版 |
2024/01/27(土) 19:04:05.60ID:lW9Bt8xu0
>>266
ありがとうございます
設定を変えて学習してみます
0269名無しさん@お腹いっぱい。 (ワッチョイ 9a23-DQL8)
垢版 |
2024/01/28(日) 00:50:34.05ID:2tgegJT/0
遅くなってすみません。
>>256 >>260
うわああああああああああ、その通りです
出来ました…
指摘されるまでタブがあったことすら気づきませんでした
本当にありがとうございます

>>253 >>255
丁寧にありがとうございます。スペック的にやはり最低限という感じなんですね…
今回は私のミスでしたが今後の参考にさせていただきます
ありがとうございました
0270名無しさん@お腹いっぱい。 (ワッチョイ 358a-TUA6)
垢版 |
2024/01/28(日) 00:53:36.93ID:Y+EJL+670
kohya_ssの最大の欠点があのタブだと思う
あれは今でも油断してると変更忘れる
0273名無しさん@お腹いっぱい。 (ワッチョイ 6d78-7cac)
垢版 |
2024/01/28(日) 22:47:58.30ID:M9oLwnZS0
ドリームブースとLoRAのタブの中身が
レイアウトもパラメータがほとんど一緒というのが罠度高い
しかもデータの読み込みもLoRAのコンフィグを
ドリームブースのタブで読み込みしてもエラーにならなかったりトラップが複数あるw
0275名無しさん@お腹いっぱい。 (ワッチョイ 35f3-TUA6)
垢版 |
2024/01/29(月) 01:26:53.20ID:rzvaDXwn0
入れ替えって簡単にできるん?
kohya_gui.pyをエディタで開いて、それっぽいところを入れ替えてみたがエラー出て動かん
0278名無しさん@お腹いっぱい。 (ワッチョイ 9124-lsrJ)
垢版 |
2024/01/29(月) 12:29:07.79ID:4CdtnyAD0
ちょいと質問
今PCIE3.0×16のPCで1650使ってるんだか、流石に時間がかかってしかたがないのでグラボ買い換えるつもりなんだ
ただ、PCIE3.0のマザボに本来PCIE4.0用の3060とか4070とか挿したときの生成スピードの低下がどの程度かわからなくてさ

グラボ内で計算するので大差ないのか
本体とのやりとり発生するので大幅に低下するか知ってる人いたら教えて欲しい

PCの買い換えまでとなると流石に貯蓄の切り崩しがでかいので避けたいんだかどうやろ
0282名無しさん@お腹いっぱい。 (ワッチョイ ead7-vA68)
垢版 |
2024/01/29(月) 13:23:10.10ID:jjE8ZwpD0
久しぶりにSD触ってるんだけども、LCM loraをa1111で使うには

1)lcmのloraを落としてくる(1.5用,XL用)
2)animatediff入れてサンプラーをLCM選択
3)プロンプトに<lora:対応LCMlora:1>追加 モデルや他loraは任意
4)CFG scaleを2くらい、step8くらいで生成

という感じで合ってますかね
他なんか足りない設定とかあるかな
0283名無しさん@お腹いっぱい。 (ワッチョイ 6d78-7cac)
垢版 |
2024/01/29(月) 13:35:10.32ID:7P/f3yrI0
>278
うちはPCIe3に3090刺したけど1600系より次元が違うくらい早いわ。SDではグラボの速度が一番影響でかいで
俺の場合、現在金もそんなに無いしCPUがSandhiBridge-EPなんてクッソ骨董品だし、スロットはPCIe3だし、マザーやCPUの新調するべきか悩んだけど
一応メモリだけは百ギガ以上積んでるしCPUコアも16コアあるから、半分賭けで NVMe SSD + 3090でSD環境整えた。結果、費用対効果で正解だったわ
起動も生成も学習も以前の数倍早くなったし一度に大画像を複数生成できるようになった
CPU速くしたかわりに、余裕の無いSSDにwebui入れて安いグラボにしてたらメチャクチャ効率悪かっただろうな
0287名無しさん@お腹いっぱい。 (ワッチョイ bd6e-7cac)
垢版 |
2024/01/29(月) 14:55:17.88ID:6NbOCsaG0
4060Tiとかだとx8接続だから更に若干パフォーマンス低下はあるかもね
ゲームとかだと誤差と言えなくもない位だけどAI利用だとどうなんだろうね
0289名無しさん@お腹いっぱい。 (ワッチョイ 3515-TUA6)
垢版 |
2024/01/29(月) 20:39:51.40ID:rzvaDXwn0
>>276
やっぱそこだよね。うまくいかないんだが
と思ってたら今なぜか成功した
何が間違っていたのかよくわからんな
0290名無しさん@お腹いっぱい。 (ワッチョイ 5eab-7cac)
垢版 |
2024/01/30(火) 00:40:47.85ID:VJTNlRWP0
.pyはTABと半角全角スペースでめちゃくちゃになりがち
揃ってないとエラーになる
編集するときはメモ帳でなくコードエディタがいい
0291名無しさん@お腹いっぱい。 (ワッチョイ 6d78-7cac)
垢版 |
2024/01/30(火) 08:50:36.87ID:1lGKRV1r0
Pythonはインデントの数がC言語のカッコに相当するからな
他の言語はインデントなんて単なる可読性のためだけど
Pythonだと実行内容に影響する
タブとスペースの混在もトラブルの元になりがち
なぜかというと大半のPythonプロジェクトはタブ一個をスペース4個と解釈するが、メモ帳だとタブ一個でスペース8個分インデントするから
0292名無しさん@お腹いっぱい。 (ワッチョイ 6610-7cac)
垢版 |
2024/01/30(火) 09:47:59.45ID:Upwqy6Du0
さすがにメモ帳はどうよ、VS Codeでいいじゃん
0299名無しさん@お腹いっぱい。 (ワッチョイ 357a-50ll)
垢版 |
2024/01/30(火) 15:20:05.81ID:+za5kyAv0
サクラエディタを30年近く使ってる
コード書いたのは10年ぶりくらいだけどちゃんとやるなら統合環境とか使うんでない
PythonはSD始めてから触ってみた感じVSCodeかColabでいいと思うけど
0302名無しさん@お腹いっぱい。 (ワッチョイ 3573-TUA6)
垢版 |
2024/01/30(火) 16:43:50.96ID:QLEF+v3I0
289だけどサクラエディタを使ってますよ
半角スペースの有無で動かなくなるのはなんとなく知ってたけど、予想以上に厳密さが求められるんだな
0305名無しさん@お腹いっぱい。 (スプープ Sdea-5eDQ)
垢版 |
2024/01/30(火) 17:12:01.79ID:jNO0c5VMd
グラボをSD用に購入しようと思うんですが
少し調べたら最近のドライバだとVRAM溢れてもメモリである程度代用できるらしいので
SDXLも8GB+RAMでもいけるんでしょうか?強烈に遅くなるなら16GBのを買おうかと迷ってます
0310名無しさん@お腹いっぱい。 (ワッチョイ 6d78-7cac)
垢版 |
2024/01/30(火) 18:04:38.74ID:1lGKRV1r0
>>305
速度がいきなり2~5%とかに落ちるぞ、マジで。VRAMでやれば1分かからないくらいの生成が、VRAMからあふれると予想時間が15-30分とかになる
VRAM24ギガあって2~3ギガあふれただけなのにそれくらい速度が落ちるからな
GPUはメインメモリに直接アクセスできるわけじゃ無いから
CPUに頼んでデータを転送してもらわないとならないわけでそのオーバーヘッドがとてつもないんじゃね
0315305 (スプープ Sdea-5eDQ)
垢版 |
2024/01/30(火) 19:02:42.73ID:jNO0c5VMd
レスありがとうございます
想像以上に遅くなるようなので4060Tiぐらいを検討してみます
0317名無しさん@お腹いっぱい。 (ワッチョイ 2a3c-on57)
垢版 |
2024/01/30(火) 21:08:56.56ID:2TUB56bY0
>>316
上げられている画像のものとバージョンが違うのかパフォーマンスというタブではなかったのですが
SDXLというタブにVAEを32ビットで使用(--no_half_vae)がありました
ちゃんと探したつもりで見落としていたんですね…ハズカシイ
でもこれで学習が進められそうです
回答ありがとうございました!
0321名無しさん@お腹いっぱい。 (ワッチョイ 3d36-5smM)
垢版 |
2024/01/30(火) 22:22:10.17ID:8N9QeeCm0
StableDiffusionを使ってみたくて、4060TI 16GBを買おうと思っているのですが、
CPUがceleron G6900でも使えそうでしょうか。

ベンチを見るとG6900はシングルでcore10世代、マルチで7世代程度の性能のようです。
CPUはあまり影響しないと見たのですが、celeronでも行けそうなのでしょうか。
0323名無しさん@お腹いっぱい。 (ワッチョイ 6d78-7cac)
垢版 |
2024/01/31(水) 00:33:24.31ID:z9YUCmba0
>>321
メインメモリさえ32ギガ積んでいればとりあえず使えるとは思うが
普通に起動してるだけの状態でPythonが7ギガくらい食ってるしSD使ってるブラウザのタブもメモリ食うし今はWindowsもメモリ食いになってるから。
メインメモリ16ギガだとツラいと思う。絶対無理ってほどじゃないが
強いて言えばCPUが2コアだと画像生成中に他の事するのは無理。動画見たりとか
0327名無しさん@お腹いっぱい。 (ワッチョイ a68d-VHcW)
垢版 |
2024/01/31(水) 03:32:04.73ID:EZVWbVay0
>>324
メモ帳
メモ帳ではいくつかの変更がありました。
UTF-8エンコーディング
バイトオーダーマークなしでファイルを UTF-8 で保存するオプションが追加され、これが新しいファイルの既定となりました。
0329名無しさん@お腹いっぱい。 (ワッチョイ 59fd-KOx/)
垢版 |
2024/01/31(水) 08:47:15.28ID:xisml0dY0
メモ帳 = Windows Notepad = notepad.exe
単独とかどうとかじゃなくて古いWindowsシステムのパス用とそれ以降デフォルトで使う物が置いてあるので2つある
ずいぶん前に互換性は失われないとかなんとか記事出てた記憶あるわ
0330名無しさん@お腹いっぱい。 (ワッチョイ f961-3wr1)
垢版 |
2024/01/31(水) 10:03:13.84ID:2yKqM0Z60
すみません
StableDiffusionを使えるようRTX4070Tiに換装しようと思うんですが他のスペックは以下でも大丈夫でしょうか?

CPU:AMD Ryzen™7 3700X(3.6GHz-4.4GHz, L3 キャッシュ32MB , 8 コア/16 スレッド)
メモリ:DDR4 16G×2(8G×2から換装予定)
電源:500w

電源がちょっと不安ですが
これで普通に使える程度にはなりますでしょうか?
0332名無しさん@お腹いっぱい。 (ワッチョイ 5dca-on57)
垢版 |
2024/01/31(水) 11:25:41.41ID:wx0Ob95t0
4070Tiの推奨電源容量は750Wだからやめといたほうがいい
それなら4060Ti/16GBにしとくのが無難(550W推奨だけど)

ついでにいえば4070Ti SUPERが出たばかりで
これから値下がりすると思うから待った方がいい
0333名無しさん@お腹いっぱい。 (ワッチョイ 66f2-7cac)
垢版 |
2024/01/31(水) 11:35:04.04ID:wlnVaKpT0
>>330
電源以外はいい感じ
欲を言えばメインメモリは64GB欲しいが上を見たらきりがないし
0337名無しさん@お腹いっぱい。 (ワッチョイ 59fd-KOx/)
垢版 |
2024/01/31(水) 14:56:41.99ID:xisml0dY0
>>334
その上限はきっと1枚32GBであって最大じゃないと思う
32GB2枚差しで64GBが上限で4枚差しなら32GB×4で128GBが上限
だけどcore i3 とかCPUの性能で64GB上限の物が存在する 3700X はおそらく128GBが上限
もしマザーボードで上限32GBならやばいメーカーのマザーボードでPCIeも3.0でしかもx16じゃなくてx8の可能性ある
変なのじゃなかったとしてもB450系ならPCIe3.0だからGPUの性能は生かしきれないよ
0339名無しさん@お腹いっぱい。 (ワッチョイ 6610-3wr1)
垢版 |
2024/01/31(水) 16:22:22.74ID:s6S+NLMV0
>>337
hpのBTO品でマザボはmoria2ってのです

ちなメモリアップグレード情報

デュアル チャネル(1 チャネルあたり 1 DIMM)メモリ アーキテクチャ
DDR4 UDIMM(288 ピン)ソケット 2 基
PC4-21300 (DDR4-2666) をサポート
8 GB および 16 GB の DDR4 UDIMM をサポート
32 ビットシステムは最大 4 GB をサポート
補足: 32 ビットシステムは 4.0 GB のメモリをフルに使用できません。
64 ビットのコンピューターで、16 GB DIMM で最大 32 GB(バッファなし)をサポートします。
補足: 記載されている最大メモリはハードウェアの機能を示すもので、オペレーティング システムではさらに制限されることがあります。

※持ってるのは64ビットマシンでっす
0340名無しさん@お腹いっぱい。 (ワッチョイ 6610-3wr1)
垢版 |
2024/01/31(水) 16:45:26.29ID:s6S+NLMV0
>>337
追加情報っす
これだと多分大丈夫かと思います

現グラボ情報
AMD Radeon RX 5700 8 GB FH PCIe x16
フォーム ファクター:ATX(25.4 cm(10.0 インチ)フルハイト)
背面 I/O コネクタ:(1) HDMI および (3) ディスプレイポート
ディスプレイポート バージョン:1.4a
HDMI/HDCP サポート:HDMI 2.0b/HDCP 2.2
最大解像度:
HDMI 解像度:4096 x 2160 (60 Hz)
ディスプレイポート解像度:7680 x 4320(60 Hz、8 ビット)
補足: 最大解像度をサポートしないポートもあります。
メモリ サイズ:8 GB(256 ビット)
メモリの種類:256M x 32 GDDR6/14 Gbps(8 個)
総消費電力:180 W
PCIe:PCIe x16 (Gen4)
同時に最大 4 画面をサポートできます。
電源コネクタ:6 ピンおよび 8 ピン
AMD Surround マルチモニター テクノロジ、Blu-ray および DirectX 12 をサポート
0341名無しさん@お腹いっぱい。 (ワッチョイ 66f2-7cac)
垢版 |
2024/01/31(水) 16:59:04.13ID:wlnVaKpT0
>>338
やればできるのかもしれませんが、現在1つのアプリケーションで生成できる手法は公開されていないと思います
0342名無しさん@お腹いっぱい。 (ワッチョイ ea48-qAAg)
垢版 |
2024/01/31(水) 17:44:50.12ID:SyShjp7v0
Google Colabでsd-webui-train-toolsを使ってLora作ってるんだけど

AssertionError: <class 'gradio.layouts.Box'> Component with id 1764 not a valid output component.

が出て先に進みません。
原因がわかる方いらっしゃいますか?
■ このスレッドは過去ログ倉庫に格納されています