X



【StableDiffusion】画像生成AI質問スレ17
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
垢版 |
2023/08/30(水) 22:15:15.82ID:z8bP+sn/
Stable Diffusionをはじめとする画像生成AIに関する質問用のスレッドです。
次スレは>>950が立ててください。

質問する人はなるべく情報開示してください
・使っているアプリケーション(1111ならローカルかcolabか、ローカルならどこから/何を読んでインストールしたか、colabならノートブックのURLも)や使っている学習モデル
・状況の説明は具体的に。「以前と違う画像が出力される」「変になった」では回答しようがない。どう違うのか、どう変なのかを書く
・状況やエラーメッセージを示すキャプチャ画像
・ローカルならマシンの構成(GPUの種類とVRAM容量は必須、本体メモリの容量やCPUもなるべく)

テンプレは>>2以降に

※前スレ
【StableDiffusion】画像生成AI質問スレ16
https://mevius.5ch.net/test/read.cgi/cg/1692012289/
0485名無しさん@お腹いっぱい。
垢版 |
2023/09/08(金) 19:40:34.39ID:3XnHTZSq
Lora作るのに25枚くらいの画像で3060 12GBだと何時間くらいかけるのが普通ですか?
学習ステップ7000
2時間かけたんだけど微妙で
やり過ぎも良くないんですよね?
0486名無しさん@お腹いっぱい。
垢版 |
2023/09/08(金) 20:15:12.58ID:/cNazvsr
拡張機能のNegPipを導入して、アクティブにチェック入れて生成しようとするとTypeError: unsupported operand type(s) for +: 'NoneType' and 'Tensor'’とエラーが出てしまいます
原因や解決方法ご存じの方いたら教えてください
0487名無しさん@お腹いっぱい。
垢版 |
2023/09/08(金) 20:22:34.46ID:S/EBW3LY
>>485
最近のお気に入りの設定は
教師画像10枚 くり返し10回 エポック30 
lr 0.0005 dim 128 alpha 1 constant AdamW8bit

これをバッチ 5 でやって10分くらい
グラボは3060 12GBね
0488名無しさん@お腹いっぱい。
垢版 |
2023/09/08(金) 20:34:14.06ID:Q8oDatN1
即戦力でSD1.5用を作ってるのか次のためにSDXL用を作ってるのかによっても話が変わってくると思うけど
SDXLでもその辺の基本的な設定はあんま変わらんものなのかな
0491名無しさん@お腹いっぱい。
垢版 |
2023/09/08(金) 21:03:44.13ID:XvqhT8hF
>>476
でもそのタグ学習はアフリカの貧しい人達にやらせてたりするのがOpenAIだったりする。
法律や規制で先進国ではできないから
0492名無しさん@お腹いっぱい。
垢版 |
2023/09/08(金) 21:32:45.72ID:DZCtZcQC
>>485
昨日始めたばかりのLora学習初心者だけど、某所に書かれてたのを参考に

・画像20枚(たまたま)、フォルダ名1_で1回
・BLIPでtxt出して手作業でカンマ入れたり、調整したり
・Epoch40~80(学習画像による、上手くいかない都度LoRA network weightsで追加学習していく)
・Text Encoder learning rate 1.0
・cosine_with_restarts、DAdaptation
・Network Rank 128、Network Alpha 64
(1回で8分~20分くらいかな、中途LoraもSave every N epochsでいくつか残しておく)

が一番うまくいってる、使い方が本当に合ってるのかわからんけど
3060(12GB)だから試行錯誤に時間かかるので自分で突き詰めるのしんどい、学習画像でコロコロ変わるっぽいし
lossは眺めてるけど収束具合がまだよくわからん、グラフでも出てくれたらなぁ
DAdaptationは今や一周回って人気ないみたいだけど、自動だから過学習しにくい?
batchはDAdaptationだから上げるのは無理かな?弊害あるっぽいので元々1で回してたけど

出てきたLoraの顔が似なかったりしたら、無理矢理<Lora:xxxx:1.5:lbr=yyyy>
(yyyyは顔意外おおよそフィルタしたlbw)とか1以上にして無理矢理調整してる、自分用で配布する気もないので
自分でLora作れず他人様のをこねくり回してた期間が長いのでLora Block Weightの謎の経験蓄積があったりw
Advanced Configurationにもweightあるみたいだけど画像によって変わるのに追随する自信がないのえあえて使わない
0494名無しさん@お腹いっぱい。
垢版 |
2023/09/08(金) 22:12:07.05ID:hiK1uV+r
>>491
そうか日本は先進国じゃなかったか……
0495名無しさん@お腹いっぱい。
垢版 |
2023/09/08(金) 22:13:08.92ID:PXf0v3eE
何枚も作成すればするほど思ってたのと違ってくる現象
0497名無しさん@お腹いっぱい。
垢版 |
2023/09/08(金) 22:30:31.30ID:1py6KOVl
>>492
>>492

> lossは眺めてるけど収束具合がまだよくわからん、グラフでも出てくれたらなぁ

WANDB API Key
kohya_ss で「API key」を取得すればできたよ。
0499名無しさん@お腹いっぱい。
垢版 |
2023/09/08(金) 22:39:17.52ID:Q8oDatN1
なんなら「英語さえ読み書きできればAIタグ付け奴隷の仕事がある」ってアフリカではかなりマシな労働まである
0501名無しさん@お腹いっぱい。
垢版 |
2023/09/08(金) 23:20:20.85ID:4lKxqeb8
たぶん俺だけぽいので知ってたらで教えてほしい
lora学習でnエポックごとに保存って設定すると
「〇〇-000001.safetensors,〇〇-000002.saferensors,…」って感じでファイル出てくると思うんだけど最後に出てくる〇〇.safetensorsだけ急に質感変わる現象って何が原因?
ちなみに適用するとパッと見は凄いいい出来だけどプロンプトの効きはめちゃくちゃ悪い
0505名無しさん@お腹いっぱい。
垢版 |
2023/09/08(金) 23:56:28.39ID:gn4tawkh
ローカルで始めたけどanything-v5モデルフォルダに入れたら自動DLしたモデルは削除でOK?
0508名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 00:07:34.39ID:laFYnbau
>>506
URL貼ると書き込めないので・・・
「誰でもわかるStable Diffusion Kohya_ssを使ったLoRA学習設定を徹底解説」
 のWANDB API Keyのこうもくを見ればできるよ 馬鹿な俺でもできたから
0510名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 00:44:46.37ID:kR2NNsbr
>>500
素直にアップスケールすると1分半ぐらい
2段階アップスケールなら1分弱
0511名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 00:56:11.07ID:F64po7Zt
わいはそれの3倍すら10分かかる
出来るまでずっと空眺めてる
なぜかi2iだけは生成完了の通知が来ないので困る
0512名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 02:48:28.07ID:rSt6/Q6S
RTX3050 Latentの設定 1回目 96 96 48 2回目 128 128 64
512*768 → 1024*1536 30秒 → 2048*3072 2:40 合計 3分10秒
768*768→1536*1536 1分そこそこ → 3072*3072 5分そこそこ 合計6分強

>>511
その間にペイントでごにょごにょしたりしたらええやん
メインメモリ32GBあったらつべで音楽聞きながら生成画像を2GBの仮想ドライブに吐かせて2Dゲーム周回させてても余裕やで
0516名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 12:03:56.10ID:TktEC31j
Lycorisが良いと聞き学習を試したものの1ヶ月ほど試行錯誤してみてLoRAの方が良くない?となりつつあるw
0517名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 12:14:58.63ID:Gi5RCOGn
>>515
bar無効になってそう
0518名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 13:00:48.46ID:MXLivCjW
生成ボタン押しても何も出ない
cmdのDownloading pytorch_model.binが完了するまで待つしかない?
0519名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 13:40:00.94ID:gPzi+eFP
何かが進行してるならそのとおり
コマンドラインの部分はマルチタスクじゃないから
0520名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 14:07:10.68ID:k3tQs+k5
Google colab課金勢ってどれくらいいるのかな?
自分のペースだと2日くらいで停止になること多いから3つアカウント作って使い回してるとそんなに困らない。
0521名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 14:43:03.13ID:fPzt+NF4
規約に「複垢使いまわしでcolabってるの見つけたらBAN(意訳)」って書いてあるから気をつけろよ
0523名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 15:10:12.50ID:3FKbLaLV
LORAのコツを知りたいです。
LORAの作り方って特定の顔のくせみたいなのを学ばせたい場合は顔だけを切り取った物を学ばせるわけですよね?
正方形に切り取って背景できるだけきれいに抜いて、taggerでキャプション作って、それでKohya_SSで適当なプリセットで回す。
って感じですよね?
生成時にそのLORAとtagを使っても、なんかお腹に顔がくっついてるみたいな変なキメラが生まれちゃいます。
0524名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 15:19:35.85ID:17lmDQnZ
>>517
barってなに??
0525名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 15:56:02.35ID:J+GrvLgJ
切り取ったせいで顔がどこにあるかを学べてないのでは・・・
0526名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 16:14:54.85ID:3G4EvvYg
>>524
知らないんならいいや
4090勿体ないね
0527名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 16:24:10.50ID:yPbur/vM
生成するとき解像度は1000より1024にしたほうがいいですか?
1024にするとうまく絵が出力できたり、生成速度が速くなるとかあるんですか?
0530名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 17:14:16.54ID:CZlotg71
>>523
上半身~バストアップ推奨
(全身は顔の比率が小さいので非推奨)

背景はシンプルであれば気にしなくて大丈夫
(あまりにごちゃごちゃしていれば切り抜いた方がいいかな)

あと画質は重要

画質が良くないものは切り捨てる
素材画像が減っても高画質で揃っていた方が仕上がりは良い
0531名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 17:16:18.91ID:RK3HDNZD
tiledで拡大ってそんなにいい?
解像度はhiresのがいいと思うんだが、設定かえればtiledでもよくなるんか?
0532名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 17:53:30.40ID:kR2NNsbr
512*768の4倍程度でアウトオブメモリーになったことないなぁ
ハード性能使い切れない環境になってそう
0533名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 17:54:53.11ID:3FKbLaLV
>>528
>>530
ありがとうございます!
なるほど、体との繋がりみたいのが学べてないのはありそうです。
癖のある男性の顔なのでちゃんとした顔と認識されてないとかはありそうなので試してみます。
キャプションのテキストとかは整理するほうがいいんでしょうか?
細かく見ると全く関係ないワード(狐耳とか、ポケモンとか)が入ってたりするんですけれど
0534名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 17:56:00.62ID:IPbdzxnI
>>531
tiledの方がvramが少なくていいというのもあるけど
tiledの一番のメリットは構図が変化しないことじゃないかな
お手本があって構図を変化させずに高画質化したいならtiled
0535名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 18:01:40.25ID:xqKfwZ7O
プロンプトの英語で
前置詞の扱いが難しいんだけど
英語勉強してた時も
前置詞で苦労した覚えある
0537名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 19:23:48.19ID:WdwLgqPv
しっかりとした背景入れるようにプロンプト入れると、lora込みの人物のクオリティがかなり下がるんだけどみんなどうしてるんだ
背景はinpaintとかであとから入れてるのか?
先に人物作ってシード固定とかしてあとから背景入れてたりするのか
追加で服のlora入れたりするより、背景入れたほうがクオリティ下がる程度が大きい
0538名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 19:28:33.54ID:Rx10h5Rs
>>532
hiresならvram24でもアウトオブメモリーじゃね?
0539名無しさん@お腹いっぱい。
垢版 |
2023/09/09(土) 19:58:57.31ID:RK3HDNZD
>>534
サンクス
そうなのかー、個人的にはhiresのほうが描写が細かくていい感じに仕上がるんだよなあ
tiledだと細かい所がちょっとぼける
設定のせいかなあ?
0544461
垢版 |
2023/09/09(土) 22:51:19.65ID:zF/evAys
よく見たらタグテキスト入れてるのにキャプションなかったとかいうメッセージ出ててloraに反映されてなかった
答えてくれた方ありがとうございました
0546名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 00:13:42.70ID:d+e1YkIO
>>529
レス番がおかしいのは専ブラ使用者がレス削除されたのに再読み込みしていない場合が多い
0547名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 00:31:52.02ID:LcRTN1QV
webpって学習とかに使えるんですか?
試せばいいと言えばそれまでですが、例えばまだ検証版で不具合が出るとかあるのかとかよくわからない
0548名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 00:39:34.97ID:BjMK+EM0
えっちなプロンプトを探してきてinpaintで好きなモデルさんの首から下にいろんなシチュエーションを合成できることに気づいて楽しい。
0551名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 01:06:56.71ID:iScwb3GI
>>544

自分の場合、最初の頃ずっとキャプションに.txtを指定し忘れてて、テキストが全く反映されないLoraばっかり作ってたわ。それに気づいた時は頭を抱えたけど、作り直した結果、画質だけならキャプションなしの方が良いケースが多くなって結局また悩むはめに…
ほんと学習はよくわからんわ
0552名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 01:10:42.57ID:M/J+i9JL
人間も同じ学習内容の勉強しても覚えている内容も出せる結果もバラバラやしな
良くも悪くも同じ展開
0553名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 01:23:20.38ID:INVStjL6
>>549
言うほどアイドル脱がす奴おるか?
0554名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 01:43:34.54ID:YmR1xaKu
>>551
キャプションの付け方
学習時のパラメーター
どこまでLossを減らせば良いか
生成時のパラメーター

いろいろな要素が絡むガチャでシンドイ
世の中のすんばらしいLoRAは偶然の産物なのか?って思うくらい沼にハマる

元の画像が悪いんかねえ……
0555名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 01:56:52.68ID:62kSnzba
Pixaiの学習Loraで何個か使ったけど出来良すぎてワラタ。ベースモデルの差?

リアル系も引退したアイドルDVDのスクショから30枚ぐらいで適当に作ったけど満足出来る出来だったで。
0556名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 01:59:34.40ID:wvuH0DEG
フェイク画像が捲くりそうだな……。

いややってる人の99.8%は外には出さないんだろうけど。
0557名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 05:43:59.15ID:bDj87zKW
>>538
処理が終わるまでVRAM上限で張り付くだけ
共有GPUメモリを使うわけではないので生成完了するまで時間はかからない
4倍でも8倍でもアウトオブメモリーになるとか意味がわからない
0558名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 06:00:25.76ID:RVj0XKiJ
ここのテンプレのリンク先には書いてない、RTX3000,4000シリーズに替えたらやることをやってないんだろうと推測
PC板やゲハ板ではないから知らないのは仕方ない気もするけれども
0559名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 07:22:39.09ID:F6NoK8xs
>>557
そんな挙動初耳だわ
その仕様ならtile diffusionいらんやん
0560名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 08:32:05.80ID:UlsiDzbC
resizeble bar という設定は知らんかったが確認したら最初からenableになってた
tileを使わないhiresのアップスケールはVRAM24GBだとxformersで3000x2000あたりが限界点でsdpだともっと小さくなる認識だったが
>>557の言ってる意味がわからない、8倍でもアウトオブメモリーにならんってどういうことや
0563名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 09:52:50.37ID:BjMK+EM0
>>553
これまでのアイコラの多くは首から下を別人に挿げ替えていた。
一部で本人の身体のままで乳コラやスジコラあるいは10円コラといった亜種もあったけど基本は別人の身体。
それがinpaintでは本人の身体に乳だけ生成できて自然になる。
指崩壊問題とかもその辺りの気になるパーツを残して生成することができる。
あとinpaint最大の武器は画像の座標がずれないこと。
どういうことかというと元の画像と生成後の画像をフォトショで重ねて透過合成すると透け透けのTシャツ着てる人とか作れる。
AV女優みたいにお股の部分だけが切り取られたGパン履いてる風にしたりも。
そもそもフォトショ上で透過範囲を設定するブラシが強い。銀色のスクラッチカードを剥がすみたいにマウスで服を剥いでいくような遊び方は病みつきになる。
0565名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 10:06:54.95ID:EF5v/00P
自環境の限界が気になって試してみた
4090欲しくなるわぁ
```
Hires.fix:
- Settings > 512*768, DDIM, steps:20, VRAM11GB
- Times:
- 2.00 (1024 * 1536) > 19.9s
- 2.25 (1152 * 1728) > 27.9s
- 2.50 (1280 * 1920) > 35.8s
- 2.75 (1408 * 2112) > 46.2s
- 3.00 (1536 * 2304) > 62.4s
- 3.05 (1561 * 2342) > OOM
```
0567名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 14:24:07.57ID:3CU3zf/t
>>565
Hires.fixでそこそこ拡大してから、upscaylっていうソフトでさらに拡大するといいよ。
https://www.upscayl.org/
0569名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 14:53:46.65ID:INVStjL6
>>563
でもそのおっぱい別人のやつだよ
0571名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 15:45:07.27ID:2bsgIEBi
違うスレでradeonはVRAM足らないと共有メモリを使用するって見たんだけど仕様してる形跡がない なにか設定がいるの?
ドライバは最新版
0574名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 16:30:46.62ID:pBA5a03w
directml版でrx6800使ってるけど、
共有メモリはゲフォドライバの話しか聞いたことないが一体何の話だ
0576名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 16:41:00.50ID:qum3gd7D
技術スレで散々話題になった設定知らんやつばっかりで草
0578名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 17:00:28.31ID:CAbB1aeZ
>>559
倍率上げすぎると生成内容が変わりすぎるからhirsは実質2倍ぐらいまでしか使い途ないってだけ


途中で処理が止まるのをおかしいなんとかしようと思わないかね普通
技術レベル低いと思ってたけどCGスレだからこんなもんなのか
0579名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 17:12:43.60ID:UlsiDzbC
>>578
俺はそんな話してないよ
hires8倍でアウトオブメモリーにならない方法教えてくれ
0580名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 17:54:18.33ID:5oCH+DqH
でもOOM回避ドライバって物理破壊言われてるバージョンがほとんどなの怖くね
一応iCUEのせいじゃないかってなってるけどNVIDIA放置&ユーザー回避でよくわからんし
0581名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 17:56:08.22ID:8/82cnn7
>>579
Tiled vaeをオンにしたらアウトオブメモリーは出なくなる
hires8倍はそれを前提にした話になってるかもしれない
0583名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 18:36:14.78ID:pBA5a03w
なおradeonだとTiled vaeは出力できても角がグレーアウトする模様

ラデでも使えてる奴いるらしいけどほんとかよアレ
0584名無しさん@お腹いっぱい。
垢版 |
2023/09/10(日) 19:30:59.57ID:MZBCi+qS
>>582
初心者スレは水飲み場だからリスキルする奴が暴れるのは日常
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況