【StableDiffusion】画像生成AI質問スレ21
■ このスレッドは過去ログ倉庫に格納されています
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512
↑スレ立て時にはこれを3行に増やしてください
Stable Diffusionをはじめとする画像生成AIに関する質問用のスレッドです。
次スレは>>970が立ててください。
質問する人はなるべく情報開示してください
・使っているアプリケーション(1111ならどこから/何を読んでインストールしたか)や使っている学習モデルを明記する
・状況の説明は具体的に。「以前と違う画像が出力される」「変になった」では回答しようがない。どう違うのか、どう変なのかを書く
・状況やエラーメッセージを示すキャプチャ画像や出力画像をアップロードする。出力画像はimgurではなく、catboxなどアップロード時に出力パラメータが残るサービスへ
・ローカルならマシンの構成(GPUの種類は必須、VRAM容量やメインメモリの容量、CPUの種類もなるべく)を書く
テンプレは https://rentry.co/aiimggenqa に
※前スレ
【StableDiffusion】画像生成AI質問スレ20
https://mevius.5ch.net/test/read.cgi/cg/1700315721/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured >>1
おつです。口調が荒い人が減るならこっちが良いですね。 聞く人もワッチョイ特定されるの嫌がるんだよなぁ、初心者ならなおさら
ワッチョイなしの低きに流れるのは目に見えてるけど、
あの荒らしにはもう我慢できないのでとりあえず抵抗してみるか
・ここに来た質問には普通に答える
・ワッチョイなしスレにされた質問には「知ってるよワッチョイありで答えるよ」ってレスして誘導する
但しこっちに来て質問しなおさない限り答えないこと(勝手に答えちゃうと結局見るだけ見て来ないので)
回答する側はワッチョイ好むだろうってのが唯一の突破口 匿名性高い掲示板はとにかくお口悪い人が好んで居座るんだよなあ よっぽどやましいことがなきゃIP無しのワッチョイに書けないとかないはずだがワッチョイ自体よく分かってないと無駄に警戒するんだろう
上記のことから俺も低きに流れると見ているけどとりあえずこっちからにするわ >>5
> 但しこっちに来て質問しなおさない限り答えないこと(勝手に答えちゃうと結局見るだけ見て来ないので)
うーん、あまり厳しくしなくてもいい気がするなあ
質問者は甘やかす方向でどうでしょう 前スレのHires. fixのLatent系はいつのまにか全部ジャギるようになってるっぽい
1.6初期はそんなことなかった気がするけど個人的にはLatentは使わないから気づかんかったしスルーだな
Hires前の絵と全然別物になっている時点でプロンプトそのものも悪くてグロいのが出来るのはLatentとは別の問題だね 元々そんな人いないのに自演で延々伸ばしてる、わかりやすくてほんと笑う
あいつ回線2つ持ちなんだよな
>>9
hiresの瞬間にブワって変わるのがホラーみたいで怖かった
そもそもhiresって小サイズで半分stepまで生成してお化け出ないようにノイズ固定してから残りstepをi2iで拡大だっけ >>5
両スレずっと見て質問あっちに来たら無しに毎回書込むの? >>5
両スレずっと見て質問あっちに来たら無しに毎回書込むの? 質問です。
この様な感じの輪郭のモノクロ画像を作りたいのですがプロンプトの呪文だけで出来ますか?
または輪郭用のLoraとか他の方法等あるのですかね。ツールはComfyUIで生成しています。
用途はゲーム(Path of the Abyss)のカスタムアバター用画像です。
https://cdn.cloudflare.steamstatic.com/steam/apps/1768650/ss_676e8c2cbb920e8af6877499d1d19aa21b0c62fc.1920x1080.jpg >>13
lineart風になるLoRAが色々あるからそれ使って色合いだけプロンプトで抑えれば
それっぽいのは作れるけどお好みにあうかどうかはわからぬ >>13
白い縁取り?みたいなのだよね?
https://civitai.com/models/81340
これを使って、sketch系loraも併用したら行けそう
monochrome, greyscaleも指定しつつ >>14
ありがとうございます。lineart風や色合い調整も試してみます。
>>15
それです白い縁取りです。教えて頂いたLoraを使ってみましたが良いですね。
いろいろ試行錯誤してみます。ありがとうございます。
https://i.imgur.com/sD5wqFz.png お忙しいところお手数をお掛けいたします。
1111をローカルで使用しています。
ttps://civitai.com/models/227059/fullyrealxl のような6GBを超えるモデルを読み込もうとすると
以下のエラーで読み込めません。
Failed to load checkpoint, restoring previous
Loading weights [6a5798187d] from C:\stb\stable-diffusion-webui\models\Stable-diffusion\kisaragiMix_v22.safetensors
Applying cross attention optimization (Doggettx).
changing setting sd_model_checkpoint to fullyREALXL_v30ForREAL.safetensors: RuntimeError
Traceback (most recent call last):
File "C:\stb\stable-diffusion-webui\modules\shared.py", line 483, in set
self.data_labels[key].onchange()
何か設定が必要なのでしょうか。
ご教示いただければ幸いです。 試しにそのモデル読み込んでみたら普通に使えたんでよく分からんけど他の重いモデルでもそうなるならグラボのメモリ不足とかかね
もしファイルサイズ依存でないならCheck Pointのファイル名変えるだけでも動くかもしれない >>0018 さんへ
お返事ありがとうございます。
6GB超えるのでも使えた事もあったのですが、XLモデルがダメなのかもしれません。
ファイル名変えてみましたがダメでした。
現状PCはこんな感じです。
GPU 1
NVIDIA GeForce RTX 3080 Laptop GPU
ドライバーのバージョン: 30.0.15.1165
ドライバーの日付: 2022/01/28
DirectX バージョン: 12 (FL 12.1)
物理的な場所: PCI バス 1, デバイス 0, 機能 0
使用率 0%
専用 GPU メモリ 3.8/8.0 GB
共有 GPU メモリ 0.1/15.9 GB
GPU メモリ 3.8/23.9 GB
ノートだと厳しいですね。 >>17
それはSDXLのモデルだからビデオカードのVRAMが12GBくらいは無いと厳しいよ
SDなら起動オプションに
--medvram-sdxl
を追加すれば動くかも >>20 さん
お返事ありがとうございます。
性能の問題のようですので動かなかったら削除して別のモデルでという風にします。
ご教示いただいて大変助かりました。
また何かありましたらよろしくお願いします。 >>17
DoggettxってことはCOMMANDLINE_ARGSが--opt-split-attentionになってるのかな?
--opt-sdp-attention
にしたらどうだろう?
一応COMMANDLINE_ARGSも見せてほしい、あとグラボその他の環境、webuiが最新か否かも ここ最近LCM-LoRAの設定ひたすら詰めてたんだがこのクオリティが出るようになってきた
https://imgur.com/GpcJAr1.jpg
https://imgur.com/CxukCr6.jpg
https://imgur.com/RqNjoRc.jpg
SamplerはEuler aにするのが一番伸び代があるような気がする
プロンプトは下のやつにLCM-LoRAとmore_detailsの2個追加しただけでCheck PointとVAEは同じ
https://majinai.art/i/ggac9yr
というわけで上程度のクオリティはLCMでも出せるって結論になった
LCM-LoRAは下絵時短よりHiresのステップ数短くかつ質感上げられるのが最大のメリットかもしれんね >>17
GPUドライバが511.65で古すぎるのでアップデートしてみてはどうかな。
536.40以降なら共有GPUメモリを使うようになるので改善するかも。
>>23
凄い詳細な感じで良いですね。 >>24
改善しねーぞ
お返事ありがとうございます。
6GB超えるのでも使えた事もあったのですが、XLモデルがダメなのかもしれません。
ファイル名変えてみましたがダメでした。
現状PCはこんな感じです。
GPU 1
NVIDIA GeForce RTX 3080 Laptop GPU
ドライバーのバージョン: 30.0.15.1165
ドライバーの日付: 2022/01/28
DirectX バージョン: 12 (FL 12.1)
物理的な場所: PCI バス 1, デバイス 0, 機能 0
使用率 0%
専用 GPU メモリ 3.8/8.0 GB
共有 GPU メモリ 0.1/15.9 GB
GPU メモリ 3.8/23.9 GB
ノートだと厳しいですね。 >>23
ここは質問スレだろうが
質問じゃないので却下
ここ最近LCM-LoRAの設定ひたすら詰めてたんだがこのクオリティが出るようになってきた
https://imgur.com/GpcJAr1.jpg
https://imgur.com/CxukCr6.jpg
https://imgur.com/RqNjoRc.jpg
SamplerはEuler aにするのが一番伸び代があるような気がする
プロンプトは下のやつにLCM-LoRAとmore_detailsの2個追加しただけでCheck PointとVAEは同じ
https://majinai.art/i/ggac9yr
というわけで上程度のクオリティはLCMでも出せるって結論になった
LCM-LoRAは下絵時短よりHiresのステップ数短くかつ質感上げられるのが最大のメリットかもしれんね >>23
ここは質問スレだろうが
質問じゃないので却下
ここ最近LCM-LoRAの設定ひたすら詰めてたんだがこのクオリティが出るようになってきた
https://imgur.com/GpcJAr1.jpg
https://imgur.com/CxukCr6.jpg
https://imgur.com/RqNjoRc.jpg
SamplerはEuler aにするのが一番伸び代があるような気がする
プロンプトは下のやつにLCM-LoRAとmore_detailsの2個追加しただけでCheck PointとVAEは同じ
https://majinai.art/i/ggac9yr
というわけで上程度のクオリティはLCMでも出せるって結論になった
LCM-LoRAは下絵時短よりHiresのステップ数短くかつ質感上げられるのが最大のメリットかもしれんね >>23
質問じゃない話は技術スレか、なんJNVA部あたりでしてほしいかな…
LCMの話題は荒れがちだから十分注意してね ワッチョイありは口調の荒い人をNGNameに出来るからいいね。 >>31=(ワッチョイ cfbb-whC3)
そしてワッチョイ有りは自演質問もバレるからいいよね
抽出すると回答者にもなってる
最初の方の奴らだけで回してるのがよく分かる
16 名無しさん@お腹いっぱい。 (ワッチョイ cfbb-whC3) sage 2023/12/23(土) 01:03:34.95 ID:0DtREn2O0
>>14
ありがとうございます。lineart風や色合い調整も試してみます。
>>15
それです白い縁取りです。教えて頂いたLoraを使ってみましたが良いですね。
いろいろ試行錯誤してみます。ありがとうございます。
https://i.imgur.com/sD5wqFz.png >>32
それは私が質問して他のお二人の回答に対しての返信ですね。
ご存じだと思いますがレスを参照する場合はコピペしなくても
>>16 の様に記載すると良いですよ。荒らしでないのなら。 最初の質問が身内とか
無理すんなよ
あっちに書いて誘導してる奴が荒らしてるがそれは注意しないのか?
こっちは指摘だけどな
仲間の荒らし止めないのならお前も荒らしに加担してると見なす
5 名無しさん@お腹いっぱい。 (ワッチョイ 161d-3PPy) sage 2023/12/22(金) 22:47:17.45 ID:nkHTfkuM0
聞く人もワッチョイ特定されるの嫌がるんだよなぁ、初心者ならなおさら
ワッチョイなしの低きに流れるのは目に見えてるけど、
あの荒らしにはもう我慢できないのでとりあえず抵抗してみるか
・ここに来た質問には普通に答える
・ワッチョイなしスレにされた質問には「知ってるよワッチョイありで答えるよ」ってレスして誘導する
但しこっちに来て質問しなおさない限り答えないこと(勝手に答えちゃうと結局見るだけ見て来ないので)
回答する側はワッチョイ好むだろうってのが唯一の突破口 >>31
特にここは住民が少ないので捗る
人口多いところだと下手にNGすると普通の人まで巻き込んで読めなくなるので >>34
向こうのスレ見てみたが目的がわからんが褒め殺し誘導みたいな荒らしがいて大変そうだけど
結果的に両方のスレに対して荒らしている輩はレスコピペやURLをNGワードで対処するしかないかも。
自分はここにしかレスしないので双方のスレ住民で個々にNG対応ですかね。
>>35
ここに限らずだけどモバイル回線系はNGNameで良い気がします。 昨日の17です。
なんか私のせいでご迷惑おかけしておりますでしょうか・・・
申し訳ありません。
>>22 さん
もし何か工夫できそうなことがあるなら挑戦したいです。
コマンドラインというのはどうやればよいでしょうか。 >>34
「最初の質問が身内」っていうけどその根拠がわからないし、そもそも誰が「身内」とかないから意味不明なんだよね
質問した人がほかの質問に回答するのは普通のことだし
だから「仲間」もなにもないし、荒らしてると思うならまず自分で注意しなよ
ただ正しいスレはこちらなのだから、こちらに誘導するのは間違ってないよね
正しいスレへの誘導を「荒らし」というなら、向こうは荒らしが立てた不適切なスレだと認めることになるよ
それにレスをアンカーせずいちいちコピペするのも荒らしと見なすからよろしく あっちのスレに書き込みは止めた方がいいんじゃない
それを理由にこっち荒らされると嫌だし
ここの住人が同類と思われるのも >>37
webui-user.batに記述する起動オプションなんだけど、編集したことない?
webui-user.batでgoogle検索すると一番上に出てくるサイトが分かりやすい
省メモリや高速化設定やらができる
3080ならとりあえず
COMMANDLINE_ARGS=--xformers --no-half-vae --medvram
あたりがいいんだろうか? >>40 さん
教えていただいてありがとうございます!
先ずグラフィックボードのドライバ更新して2023.12.12の物になりました。
その後編集して起動しました。
@echo off
set PYTHON=
set GIT=
set VENV_DIR=
set COMMANDLINE_ARGS=--xformers --no-half-vae --medvram
call webui.bat
起動の際以下の状態で立ち上がりました。
Launching Web UI with arguments: --xformers --no-half-vae --medvram
Additional Network extension not installed, Only hijack built-in lora
LoCon Extension hijack built-in lora successfully
[-] ADetailer initialized. version: 23.9.1, num models: 9
ControlNet v1.1.201
その後昨日の物を読み込みましたがまた同じランタイムエラーとなりました。 >>23
真似てみたけど、ちょっとマシになる感じかな
どうしてもLCM特有のボヤッとしたのは変わらない
でも実用性は上がったからサンクス >>41
うーんわかんない
safetensorsファイルが破損してるってことはない?再DLするとか
ファイル名変更したってことだけど、先頭に「_」つけてみたらどうなる?
あとまだ聞けてないんだけどまさかwebuiのバージョンが1.5未満ってことないよね?
やっぱVRAM8GBでSDXLはきついのかな、ComfyUIなら行けるらしいけど
でもモデル選ぶことくらいはできそうだが・・・ >>43
結局答えられねーじゃーんw
ここで遊ばせてもらうわ
お前が無しスレ荒らしてるし迷惑でここに来るしかないわ〜w
43 名無しさん@お腹いっぱい。 (ワッチョイ cf1d-y73S) 2023/12/25(月) 20:07:47.45 ID:RecO/8Ju0
>>41
うーんわかんない
safetensorsファイルが破損してるってことはない?再DLするとか
ファイル名変更したってことだけど、先頭に「_」つけてみたらどうなる?
あとまだ聞けてないんだけどまさかwebuiのバージョンが1.5未満ってことないよね?
やっぱVRAM8GBでSDXLはきついのかな、ComfyUIなら行けるらしいけど
でもモデル選ぶことくらいはできそうだが・・・ >>43 さん
あの・・・衝撃の事実が判明したんですが・・・
バージョンが1.1と書いてありました・・・
調べて1.7にアップデートしたら読み込めました。
あぁ・・・恥ずかしい・・・
親身になって教えてくださった方に申し訳ありません。
本当にありがとうございました。 みなさんへ
バージョンアップしたらXLもサクサク読み込めて、
今まで小さな画像しか出力できなかったのが
今2Kサイズ指定してもちゃんと作成されます。
自分の阿保さ加減にうんざりです。 レスコピペのIDコロコロ君がいるのかな…以後NGで。
>>46
解決して良かったですね。43のエスパーレスナイス。 何言ってんだか分からんぞ?
頭大丈夫か?
あっちに荒らしが来たからここに来るしか〜無いわ〜
説明しろよこの駄文
「最初の質問が身内」っていうけどその根拠がわからないし、そもそも誰が「身内」とかないから意味不明なんだよね
質問した人がほかの質問に回答するのは普通のことだし
だから「仲間」もなにもないし、荒らしてると思うならまず自分で注意しなよ
ただ正しいスレはこちらなのだから、こちらに誘導するのは間違ってないよね
正しいスレへの誘導を「荒らし」というなら、向こうは荒らしが立てた不適切なスレだと認めることになるよ
それにレスをアンカーせずいちいちコピペするのも荒らしと見なすからよろしく
>>34
向こうのスレ見てみたが目的がわからんが褒め殺し誘導みたいな荒らしがいて大変そうだけど
結果的に両方のスレに対して荒らしている輩はレスコピペやURLをNGワードで対処するしかないかも。
自分はここにしかレスしないので双方のスレ住民で個々にNG対応ですかね。
>>35
ここに限らずだけどモバイル回線系はNGNameで良い気がします。 1111でhiresからextraに勝手に流してくれる方法ない?
生成画面でextraと同じく拡大出来るExtensionとか? >>49
ねーよ
自分で作れ
LCMも使いこなせん奴には必要ねーよ
さっさと説明しろよ
「最初の質問が身内」っていうけどその根拠がわからないし、そもそも誰が「身内」とかないから意味不明なんだよね
質問した人がほかの質問に回答するのは普通のことだし
だから「仲間」もなにもないし、荒らしてると思うならまず自分で注意しなよ
ただ正しいスレはこちらなのだから、こちらに誘導するのは間違ってないよね
正しいスレへの誘導を「荒らし」というなら、向こうは荒らしが立てた不適切なスレだと認めることになるよ
それにレスをアンカーせずいちいちコピペするのも荒らしと見なすからよろしく >>46
よかった
そういえばXLっていつからデフォでいきなり使えたっけ?ってふと思ったので
>>49
batchでまとめてくらいしか思いつかない、t2i→i2i自動なんかもないよね
ちょっと検索したら
https://github.com/nefudev/sd-webui-auto-operation
こんなのがあった、自動化ツールで拡張ではないとのこと
6ヶ月前に止まってるし、なんか難しそうだ・・
> オリジナルの自動化処理を作成するためには、javaScript の知識がある程度必要です。
あと普通にやるとしたらComfyUIで組むくらいか あとは鉄板のautohotkeyかな
extraタブクリックみたいなかなり泥臭いの組むことになるけど
512x768で回して、いいのが出た瞬間に
・seed固定
・hires
・seedランダムに戻す
とか昔やってた >>47 さん
>>52 さん
半ば諦めていましたが、聞いてみてよかった・・・
本当にありがとうございました! >>55
解決したようでよかったよ
ここは伸び悪いと思うがなんかあったらまた来てくれな >>28 >>30
前スレ124の
> LCMのアニメ絵
> ベタっとした塗りは行けるけど、精密なのは再現無理だな
> https://civitai.com/images/175093
> こういう感じの
というv/HOzmWwが https://majinai.art/i/ggac9yr を出しては再現出来んのか?って問うてきただろ
>>23はそれに対する回答なんだよ
ちなみに上の元絵はAbyssOrangeMix3モデル作者のサンプル画像で同じシード値では再現出来ないと書いてある(雰囲気は再現可)
https://civitai.com/models/9942/abyssorangemix3-aom3?modelVersionId=17233
だからシード変えれば元絵にある程度近い構図も出てくる
https://i.imgur.com/fn9Jp8a.jpg
これでもLCMはベタッとした塗りしかいけないとかぬかすようならもう相手にする気はない >>55
CPU内蔵GPUがある場合はメインをCPU内蔵GPUにして、グラボはSD 専用にするとGPUメモリ稼げるよ😁 他のスレで回答がなかったのでこちらで質問させてください
WebUIのADitailerって顔のサイズが200pxくらいでも綺麗に描画するじゃないですか
でもComfyUIのFaceDetailerだと小さい顔は綺麗にならなくて
良い設定とかカスタムノード知ってる方いますか? ほかのどのスレで質問したのかな?
ここは見てる人が少なめでComfyUIのカスタムノードのなると詳しい人に当たりにくそうだから、なんJNVA部みたいな人の多いところで聞くといいかも
画像つきで質問すると答えを得やすそう >>59
facedetailerの設定はどんな感じ? >>59
https://github.com/daxthin/DZ-FaceDetailer
たぶんこれだよね
設定できるパラメータにはどのくらいのサイズまで検出するかはないみたいだよね
https://github.com/ltdrdata/ComfyUI-Impact-Pack
こちらはどうかしら
作例の画像をざっと見ただけだけど、同じようなことができそうな気がする
検出する顔のサイズを調整できるかはわからないけど >>60 >> 61 >>62
DetailerはダブルクリックからSearchで"FaceDetailer"と表示されたものを使っています
おそらくImpact-Packのものかと
どうも顔LoRAを適用したときにうまくいかないみたいです
比較画像を上げましたが、顔LoRA適用時の生成で左から
Detailer無し | Detailer有り | Detailer時のみLoRAを適用しない | WebUIでADitailer有り
WebUIは同Seedでも違う画像が出るので(Wasなんちゃら入れていません)
小さな顔の画像を比較として出しています
LoRA使ってこのくらい綺麗に出てくれると良いのですが
https://imgur.com/a/EG0jwXQ
https://imgur.com/a/Dym0MnP BingImageCreatorのことで質問なのですが、棒状のモノ(剣、釣り竿など)を持たせると
「手以外の部分から棒状のモノが複数現れる」「まっすぐな棒ではなく曲がったり歪んだりしている」
このように描画されるんですが何か対策はありますか? >>64
カスタマイズ不可のBingでは無理
現在のAIは元々そういう物体を正しく認識できない >>64
まあ、対策としては「正しい形状」とか「正しい構え」とか入れるとちょっとマシになる
あとは物体の形状はフォトリアルの方が強い
イラスト系はデフォルメやらパースやら入ってるの学習したりしてるんで、そもそも論として歪みやすい
これは弓も同じ >>63
サンプルを見る限りキチンと効いているようにみえるが…LoRAありの方は目の間隔小さくなってるし
Detailer は 顔を個人の好みの顔に変える事ができるツールではなくて、生成画像に対して顔が小さい時にぐちゃっとなってしまって顔に見えないものをそのモデルでもっと大きなサイズで出したときの画像に差し替える機能だからそんなものでは?
できることといえば、大きめの顔でもなるべく Detailer で修正してもらうように guide_size を512とかにしたりするくらいか
自分のフローはこれだが まぁ 結果はあんまり変わらんと思う
https://comfyworkflows.com/workflows/2b0434a6-9e2d-4417-a5b8-d93bbe777530 >>67
ワークフローありがとうございます
好みかどうかではなく、LoRAを適用するとDetailerの効きが悪くなるという話です
色々試した結果、LoRAを弱めれば綺麗にできますが
LoRAの効き目がなくなるので意味がないというジレンマ 最近Stable diffusionを1111で使いはじめた初心者です。
女キャラのエロ絵を作ってそれを使った同人エロゲを作成しようとしていて、同一キャラの絵をいろんなシチュエーションで量産するためにはControlnetを使うのだと思うのですが、
例えば白背景や透過pngみたいなので女キャラの絵を作ってそれをreferenceやip-adapterで合成しようとしても、白背景にひっぱられてのっぺりとした背景になってしまったり、
女キャラの姿勢なども元画像に引っ張られて同じような体勢の絵になるか壊れてグロ絵になるかなどしてしまいます。
何かいい方法を教授していただけるか、それを学べるWebサイトあるいは本などを紹介していただくことはできませんでしょうか。「 >>69
その元画像に引っ張られてのっぺりした背景のって、キャラだけは理想的に作られてるんだよね?
保存して画像を右クリックして3Dペイントで開いてなんちゃらマジックで人物だけ切りぬける >>65>>66
レスありがとうございます
現状ではまだ不得意な部類なんですね >>70
レスありがとうございます。
例えば教室で授業を受けている女の子の画像が欲しいとして、素材としては授業を受けている女の子の透過画像があるときに、
Controlnetに透過画像をいれてclassroomなどのワードをいれて生成してる感じですが、これだと教室がうまく出てこないという感じです。
現在の生成AIの技術だと、女の子が本を読んでいるくらいの画像なら作れそうだからそれをうまく別にだした背景と合成するみたいな方法しかないんですかね?
絵の編集技術が弱いのでその辺をうまくできる方法があれば理想だったのですけど・・・・。 >>69
これは?
たった90分で初心者でもstable diffusionをマスター!!使い方&マネタイズの方法もOK!
https://m.youtube.com/watch?v=KniNw5t-h-Y&t=617 1,棒人間でポーズだけ変えた同一キャラ作成
2,背景は別で出力する
3, 1,2を合成
4, 3をimf2imgにいれて出力。合成の際にできた不自然な部分や色合いが自然になる(までガチャる)
>69 で透過png作れてるみたいだし背景と重ねるのもできるでしょ >>76
これは右の画像をi2iして左の画像を出力したのかな
denoising strengthを上げればパースも整えてくれるんだね
こうなってくると、どのくらいきちんとした構図の画像が欲しいかのイメージをしっかり持つ必要がありそうね >>72
controlnetは複数枚の画像セットできるから、
controlnet1に教室、controlnet2に女の子を
セットすればいい
後にセットした方が強くでる
あとはcontrol weight調整して効き具合を加減して
元絵に引っ張られるのは避けれないから、
同じ顔で色んなポーズを出したいなら
その顔のLora作るしかない >>71
コントロール ネットとローラと Photoshop を組み合わせる みなさんレスありがとうございます。参考にしてがんばってみます。 【StableDiffusion】画像生成AI質問スレ21
https://mevius.5ch.net/test/read.cgi/cg/1703250505/148
聞いたことない
最新(v22.4.0)入れても普通に5_xxx girlで中身は学習画像20枚の5回リピートで動くよ
あと具体的なエラー文言も書かないと意味がない、同じ症状って人のblogもできれば貼って すごく基本的なことなんですが、Loraを適用するとモデルによっては絵柄が変わったり、画像が崩れてしまったりします。
これはLora情報に引っ張られてしまってるんだと思うんですが、これはどうしようもないんでしょうか?
「気に入ったLoraを見つけてもモデルとの相性?によっては使えないこともある」というのが普通なんでしょうか? すいません、Stable Diffusion1.5の話です。 引っ張るのがLoraだから気に入らない要素があるなら
自作Loraか他のを探す >>85
ありがとうございます。
やはりそういうものなのですね。
気に入ったモデル見つけても作りたいloraと相性が悪いとなかなか大変だ… >>83
lora の適用を 0.5 とかに下げるとか >>83
最初ガビガビになってうーんってなるんだよね
lora block weightってのを使うと、完璧まではいかないけどかなり制御できる >>86
それが仕方がないので
ローラの強度を下げるとかしないといけない >>64
今月くらいから剣は回せばすぐまともなのが出てくるようになったが、釣り竿はまだ難しそう A1111を1.7にしたらエラーでるから1.6に下げたいんだけど
エクステンションとか消さないでできますか?
設定のバックアップってどうやるの? >>91
git cloneからインストールしたのならgit checkoutコマンドでバージョンを戻すことはできると思うけど、設定ファイルの整合性が怪しくなることを考えると、別のフォルダに1.6をインストールし直すのが確実じゃないかなあ
1.6はここ↓からダウンロードしてzipを解凍、webui-user.batの内容を今までのと同じにして実行すればインストールされる
https://github.com/AUTOMATIC1111/stable-diffusion-webui/releases/tag/v1.6.0
拡張機能はextensionsフォルダを移動するだけでOK
同様にmodels、embeddings、log、outputsの各フォルダと、styles.csvを上書き移動すればよい
いずれも1111がインストールされたフォルダのルートにある
設定はconfig.jsonとui-config.jsonに書かれているけど、バージョン違いの設定ファイルだから1.7のフォルダから1.6のフォルダにそのまま移動するとよくないことが起きそう
WinMergeのようなテキスト比較ソフトを使って、1.7の設定値のうち必要な部分だけを1.6に転記する方法がいいと思う
ところで1.7でどんなエラーが出るの? いつまでも1.6を使い続けるわけにもいかないだろうから、1.7でのエラーを解消することも考えたい >92
丁寧にありがとうございます。やってみます!
1.7でのエラーはエラー内容消しちゃったので正しいのはわからないんですが、
loraのフォルダをちゃんと読み込んでないようで、一部しか出なかったです。 >>93
LoRAが一部しか認識されないのは原因がいくつかあった気がする
自分もその症状に当たったことがある。どうやって解消したんだったかな…
実は一覧に出てこないLoRAでもプロンプトに書けばちゃんと反映されるのよね
いったんcheckpointを別のに切り替えて元に戻すとちゃんと表示されるようになることがあるとか、1111を再起動すると直ることもあると思った
試してみてください >94
書けば反映される!知りませんでした。いろいろ試してみます。
ありがとうございました! >>87>>89
ありがとうございます!
強度下げると今度はloraで適用したいポーズとかキャラとかから離れちゃうんですよねぇ…うまくいかないもんです。
>>88
ちょっと調べてみましたが敷居が高そうです。
もう少し技術を身に付けたら挑戦してみます。
ありがとうございます。 もうひとつの質問スレの158です
誘導されて来ました
原因が分かったとのことですが教えていただけますか >>96
いや簡単簡単
とりあえず「顔だけ似せてモデルの特性を出したい」として
@lora block weight入れる
https://github.com/hako-mikan/sd-webui-lora-block-weight
Aaaa,<lora:aaa_v10:1>を
aaa,<lora:aaa_v10:1:lbw=1,0,0,0,0,0,1,0.3,1,1,1,0.8,0,0.4,0,0,0>にする
(Loraの顔部分だけ取り出して他の部分の影響を削るか減らす)
これだけだよ
https://sorenuts.jp/751/
ごちゃごちゃ書いてるけど、
この1,0,0,0...みたいな値をテンプレにして、あれこれ調節して使う説明がされてるだけ
実際は顔だけって綺麗に分かれてるわけじゃないのでちょっとした沼があるけど・・ >>97
あってるかわからないけど
https://github.com/bmaltais/kohya_ss/blob/master/docs/config_README-ja.md
> まず注意点として、 image_dir には画像ファイルが直下に置かれているパスを指定する必要があります。
> 従来の DreamBooth の手法ではサブディレクトリに画像を置く必要がありましたが、そちらとは仕様に互換性がありません。
> また、5_cat のようなフォルダ名にしても、画像の繰り返し回数とクラス名は反映されません。
> これらを個別に設定したい場合、num_repeats と class_tokens で明示的に指定する必要があることに注意してください。
ようは「10_am」じゃなく、「10_am girl」とかにしないと
貼ってくれたcmdの画像内で、普通は
「class_tokens: aaa girl」とかなのが
「class_tokens: None」になっちゃってるので、反応しなくなってるのではないかと >>99
ありがとうございます
Kohyaサンプルのカエルで試したときは「20_usu frog」としてやりましたが
同じように無反応でした >>100
captionのtxtが一切用意されないなんてことはないよね?
同じフォルダに1.jpgに対しての1.txtで中につらつらとtagワードが並んでるファイル ■ このスレッドは過去ログ倉庫に格納されています