X



【StableDiffusion】画像生成AI質問スレ21

レス数が900を超えています。1000を超えると表示できなくなるよ。
1名無しさん@お腹いっぱい。 (ワッチョイ 9bf2-e8vO)
垢版 |
2023/12/22(金) 20:18:47.98ID:WCuIa5Ix0
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512
↑スレ立て時にはこれを3行に増やしてください

Stable Diffusionをはじめとする画像生成AIに関する質問用のスレッドです。
次スレは>>970が立ててください。

質問する人はなるべく情報開示してください

・使っているアプリケーション(1111ならどこから/何を読んでインストールしたか)や使っている学習モデルを明記する
・状況の説明は具体的に。「以前と違う画像が出力される」「変になった」では回答しようがない。どう違うのか、どう変なのかを書く
・状況やエラーメッセージを示すキャプチャ画像や出力画像をアップロードする。出力画像はimgurではなく、catboxなどアップロード時に出力パラメータが残るサービスへ
・ローカルならマシンの構成(GPUの種類は必須、VRAM容量やメインメモリの容量、CPUの種類もなるべく)を書く

テンプレは https://rentry.co/aiimggenqa

※前スレ
【StableDiffusion】画像生成AI質問スレ20
https://mevius.5ch.net/test/read.cgi/cg/1700315721/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
2024/03/09(土) 15:30:41.25ID:P0rcKbo80
>>814
XL系のベースモデルはvaeを使うと出来上がりの画像が真っ青になってしまうので
他のベースモデルと異なりvaeは無しで生成していました。
それでも畸形だらけで使い物になりません。
2024/03/09(土) 15:37:22.84ID:IuyqJpmr0
上アンカーミスしてたゴメン
810じゃなく809

>>816
>>576,588,594
の可能性

>>817
うーん文章だけでエスパー無理
t2iでは普通に出るの?
> 1024ピクセル四方で同一プロンプトと同一の元画像で
> img2imgで画像出力して出力結果を比較しています。
これはi2i「前」が1024x1024でOK?XLは最低が1024x1024推奨
2024/03/09(土) 15:41:27.87ID:i1fHWCLM0
>>816
拡張機能のLycorisを削除
これで改善したという報告が複数あり
820名無しさん@お腹いっぱい。 (JP 0H8f-GzBE)
垢版 |
2024/03/09(土) 15:49:39.85ID:xrFc1x1wH
>>816
Lycorisを無効化したら正常に稼働しました。
>>819
ありがとう
821名無しさん@お腹いっぱい。 (ワッチョイ 3b35-Q82t)
垢版 |
2024/03/09(土) 16:07:13.59ID:je1eK+K40
設定は前から何もいじっておらず、  ふむふむ
webuiとグラボのアプデだけしました。  やっとるやんけ
2024/03/09(土) 17:00:17.16ID:amFsWFJ00
>>821
思いっきり主要部分になにかやってて草
2024/03/09(土) 17:38:10.60ID:P0rcKbo80
>>813
ありがとうございます。
帰ったら試してみます。
824名無しさん@お腹いっぱい。 (ブーイモ MM7f-fVSZ)
垢版 |
2024/03/09(土) 23:17:25.67ID:QorZJ4frM
ネコ耳とかウサ耳とかよくありますが、あの名前を呼んではいけないネズミの付け耳が出せるプロンプトはありますか?
2024/03/09(土) 23:27:48.96ID:8uVuSxaz0
>>824
mickey_mouse_v10-10
https://civitai.com/models/70019/mickeymouse
ちなみに耳だけじゃなくて衣装もそれっぽくなる
2024/03/09(土) 23:28:17.60ID:lTtkp+Xd0
アバダケダブラ!
2024/03/09(土) 23:31:39.07ID:ecel4rXRr
そもそもディズニーは版権に関してはそこまでうるさくはない
きちんと線引きしてセーフなら好きにしてヨシってなってる
2024/03/10(日) 00:18:58.49ID:9qlgBg8Oa
金儲けたり名誉毀損にあたるもの以外は大丈夫なんでしょ?
さんざん他所の名作自分の作品にしまくってんだからそれくらい当たり前だけどな
829名無しさん@お腹いっぱい。 (ワッチョイ 7e3b-CNfw)
垢版 |
2024/03/11(月) 17:49:56.50ID:l2en4Y6b0
ディティールアップ系のLORAを足すことで生成できるジャンル(たとえば同性愛モノが理解できなくなるとか)が狭まることはありますか?
830名無しさん@お腹いっぱい。 (ワッチョイ eef2-jwTK)
垢版 |
2024/03/12(火) 09:25:51.95ID:11wkdbdi0
>>829
LoRAとジャンルの組み合わせによってはそういうこともあるかもしれない
でもディテールアップのLoRAによってBLや百合が出にくくなるとは思えないなあ

どういうことをやってそういう疑問にたどり着いたのかな
2024/03/12(火) 10:08:29.30ID:EOasbieb0
lora学習でマイナーキャラ作る時
白黒とカラーの教師画像があるんだけど
こういう場合白黒とかは使わない方がいいですかね?
カラーだけだと8枚くらいしかないんだけど
同じような画像を2重に学習するのは逆効果?
クオリティ高いloraとかすごいと思う本当
832名無しさん@お腹いっぱい。 (ワッチョイ 0d84-jwTK)
垢版 |
2024/03/12(火) 11:07:11.15ID:czxctRRt0
塗れよAI君出来るでしょ
833名無しさん@お腹いっぱい。 (ワッチョイ eef2-jwTK)
垢版 |
2024/03/12(火) 12:38:39.14ID:11wkdbdi0
>>831
白黒素材を使っても問題はないと以前聞いたことはある
SDXLならカラー素材が8枚でも大丈夫じゃないかなあ
悩む前に一度作ってみては
2024/03/12(火) 18:34:28.39ID:DgTCJ9Cx0
こればかりはほんと自分で試行錯誤していくしかないんよね
同じ設定・同じやり方・同じ生成物でも
Aさん「スゲー」
Bさん「ひでぇ!」
みたいな、言葉だけだと本当にわかり合えない絵の鑑賞の世界なんで

>>831
個人的な白黒画像多い場合のLora作成経験では
1.5はわりかし容易〜むしろ綺麗に出る、XLはあれこれ困難が多い
2024/03/12(火) 19:05:45.17ID:n/LYxW+Q0
forgeでunpromptedからcontrolnetの操作をする方法を教えてくれ
integrated版でない通常の拡張機能のcontrolnetを操作しに行って失敗してる?くさい
836名無しさん@お腹いっぱい。 (ワッチョイ 39d9-VRJu)
垢版 |
2024/03/12(火) 19:39:20.63ID:+bnXPsfD0
1.5なら白黒のみでも作れる。
さすがに色はいい加減になるが、そこにカラーが混じっていれば問題ない
ただ白黒が多い場合は、ちゃんとプロンプトで指定しないと白黒が出やすい物にはなる。
きっちり指定出来ればほぼ問題ない

ただし雑誌からのコピーみたいな画質だと、その画質が影響したりはする。
2024/03/12(火) 20:29:35.31ID:7NtqEOPN0
初心者質問ですまん
よく言うSD1.5とSDXLの違いが自分の中で整理がついてないんだけど、
単純にチェックポイントがSDXLに対応しているかどうか、ということ?
それに付随して、SDXLに対応してるコントロールネットのモデルやLoraのモデルがある、という理解であってる?
2024/03/12(火) 20:36:39.63ID:+kfvAZMZ0
少し違う
対応ではなくてどの規格で作られているかの違いで互換性はない
だからLoRAも基本的に互換しないしCN使うときのモデルも1.5用とXL用は別物
839名無しさん@お腹いっぱい。 (ワッチョイ 7e35-UCxz)
垢版 |
2024/03/12(火) 21:04:57.07ID:GcElfE1g0
animatediffがエラーで使えなくなりました
EinopsError: Error while processing rearrange-reduction pattern "(b f) d c -> (b d) f c". Input tensor shape: torch.Size([2, 4096, 320]). Additional info: {'f': 16}. Shape mismatch, can't divide axis of length 2 in chunks of 16

こんな感じのエラーです
1週間ほど前までは使えてました
アップデートとかも試したり、1girlのみで試してもエラーがでます
何が原因かわかるでしょうか?
2024/03/12(火) 23:15:49.83ID:DgTCJ9Cx0
forgeって生成alt+enterで出来たっけ?
a1111のwebuiでctrl+enterでもalt+enterでも出来るんだけど
comfyUIに合わせてなんかいじったのかなんだったか忘れた

>>839
以前と違ってwebuiのバージョンを上げたりしてない?
841名無しさん@お腹いっぱい。 (ワッチョイ 7e4c-LIQe)
垢版 |
2024/03/13(水) 00:42:34.69ID:h6KIglN+0
>>840
webuiのバージョンはそのままで1.7です
通常のt2t、i2i等は普通に使えてます
他のソフトでffmpegもちゃんと動作してます
2024/03/13(水) 01:44:09.08ID:eXgPv5+c0
>>841
これかなぁ
https://github.com/continue-revolution/sd-webui-animatediff/issues/449
> continue-revolution commented Mar 6, 2024
> wow, these are so old. update everything and retry. WebUI, ControlNet, AnimateDiff
1.6で「so old」扱い

https://github.com/continue-revolution/sd-webui-animatediff/issues/454
> continue-revolution commented Mar 7, 2024
> Update your webui to 1.8.0
別に1.8にしろってのもある

あと、forgeなのに普通の入れてたりしないよね?
2024/03/13(水) 01:52:30.94ID:eXgPv5+c0
ああ動いてたんならあるはずないか、ごめん
2024/03/13(水) 09:55:39.97ID:H4+qVMrq0
質問です。
複数のバージョンのStable Diffusionを使っていて、
Models、Lora、VAE、embeddingsは
全て共通のディレクトリのものを共有しています。

対して画像出力フォルダについても
インストールディレクトリ下ではない
別の場所を指定して共有する事はできないでしょうか。
2024/03/13(水) 10:02:12.66ID:uJYzL06E0
設定にあるはずだけど
2024/03/13(水) 10:23:28.21ID:H4+qVMrq0
>>845
ありがとうございます。うっかりしてました。

ちなみに出力画像は指定ディレクトリ下に
本日の日付のフォルダが自動作成されて、その下に作成されるのですが
この日付フォルダ自動作成機能を無くして
指定ディレクトリ下に直接出力できるよう
設定変更する事は可能でしょうか。
847名無しさん@お腹いっぱい。 (ワッチョイ eef2-jwTK)
垢版 |
2024/03/13(水) 10:36:55.91ID:ExABHj2I0
>>840
> forgeって生成alt+enterで出来たっけ?

Forgeだとできなかった
プロンプト欄が空っぽのとき「Alt+Enter to skip」とあって、生成には使えないキーアサインになっているみたいね
848名無しさん@お腹いっぱい。 (ワッチョイ eef2-jwTK)
垢版 |
2024/03/13(水) 10:39:14.28ID:ExABHj2I0
>>846
設定にあるはずだけど…あった

「ディレクトリへの保存(Saving to a directry)」にある「画像をディレクトリに保存する(Save images to a subdirectory)」ね
849名無しさん@お腹いっぱい。 (ワッチョイ eef2-jwTK)
垢版 |
2024/03/13(水) 10:40:39.30ID:ExABHj2I0
>>848
「画像をディレクトリに保存する」じゃなくて
「画像をサブディレクトリに保存する」だった、意味が正反対だった
2024/03/13(水) 10:55:16.18ID:H4+qVMrq0
>>849
試してみます。
ありがとうございました。
851名無しさん@お腹いっぱい。 (ワッチョイ 7e9e-LIQe)
垢版 |
2024/03/13(水) 11:58:33.54ID:h6KIglN+0
>>842
1.8にアップデートすると解決しました
ありがとうございました

追記として、1.7で出ていた不具合はanimatediffでエラーが出る事、
そのエラーが出るとt2i、i2iでの画像生成においても同じエラーが出て再起動(webui)しないと画像生成出来なくなる事で、
エラーが出た後でもSADTALKERは使えました
2024/03/13(水) 12:04:33.12ID:vD/Lc4gF0
loraのこと教えてくれた人達ありがとう
自作loraはどうしてものっぺりした塗りになるから
顔だけの適用の奴とかコントロールネットとかlora強度とかvae変えたりとかでイメージ変換で頑張ってます
大体みんな機能はこんな所を使ってるの?
モデルも今色々試してるけど
2024/03/13(水) 17:10:52.17ID:eXgPv5+c0
>>847
ありがとう
> プロンプト欄が空っぽのとき「Alt+Enter to skip」とあって
ほんとだ、書いてある・・空にすることなんてないので気づかなかった
webuiは空にするとどっちもgenerateだわ
comyUIをいじってた時に、あれがalt+enterだったからそっちに頭を統一してしまって
forgeやってるとあれ?あれ?ってなっちゃって
キー変えるソフトかなんかで変えます

>>852
1.5ならlbwは極めるには必須かと
https://github.com/hako-mikan/sd-webui-lora-block-weight
丁寧に説明してるサイトもあるので使ってみて、世界が変わる
わざと過学習させて、ガビガビになった絵柄だけ除去して顔の雰囲気そのままに2.5Dっぽく綺麗にしたりできる
2024/03/13(水) 17:15:32.81ID:eXgPv5+c0
>>851
よかった
3/2に出たばかりの1.8必須とか、作者さんが最新に常に合わせるタイプの真面目な人なんだろうね・
つつかれるまで数か月放置する人とかいるので、いろいろだなぁ
855名無しさん@お腹いっぱい。 (ワッチョイ 5110-hQEK)
垢版 |
2024/03/14(木) 01:10:26.91ID:w8FecW010
チェックポイントとキャラLoraをプロンプトに入れ生成
チャックポイントとキャラLoraマージして生成

この2つって同じ結果になる?
それともマージの方がいい結果、ポーズとか柔軟に反映されるようになったりするのかな?
2024/03/14(木) 01:12:39.63ID:Ew1HQQbF0
ならないよ
2024/03/14(木) 02:06:22.44ID:50ATaWZE0
めちゃくちゃ初歩的なことですみません誰か助けてください
habanerostudio.net/【stable-diffusion】lora作成ツール-kohya_ss-guiのインストール/
ってサイトを参考にkohya_ssインストしようとしてるんですが
git clone https://github.com/bmaltais/kohya_ss.git
入力した後にsetup.batクリックしてもエラーでて進みません・・・以下エラーの内容です

D:\kohya\kohya_ss\setup\setup_windows.py:223: SyntaxWarning: invalid escape sequence '\g'
"start cmd /k .\gui.bat --inbrowser", shell=True
Traceback (most recent call last):
File "D:\kohya\kohya_ss\setup\setup_windows.py", line 7, in <module>
import setup_common
File "D:\kohya\kohya_ss\setup\setup_common.py", line 8, in <module>
import pkg_resources
ModuleNotFoundError: No module named 'pkg_resources'

(venv) D:\kohya\kohya_ss>
2024/03/14(木) 02:27:24.92ID:50ATaWZE0
すみません自決しました
2024/03/14(木) 02:31:10.98ID:Ew1HQQbF0
成仏しろよ
860名無しさん@お腹いっぱい。 (ワッチョイ 86d3-UCxz)
垢版 |
2024/03/14(木) 04:32:49.60ID:M1VGOGRd0
LayerDiffuseが1.5に来たって見たんだけど、これはA1111ではなく
Forgeを導入してそこからLayerDiffuseを使用なんですかね?
861名無しさん@お腹いっぱい。 (ワッチョイ 86d3-UCxz)
垢版 |
2024/03/14(木) 04:38:08.26ID:M1VGOGRd0
痔穴しました。やっぱり4爺からだった
A1111にも欲しいな
2024/03/14(木) 08:43:59.36ID:4dUBjSEf0
A1111の時代は終わったよ
2024/03/14(木) 09:39:29.29ID:LVkeTOpd0
Forge使ってて起動後初回生成で躓いたり初回Lora使用時にやたら時間かかったりすることってない?
nVidiaのアプデのせいなのかForgeのアプデなのか拡張が悪さしてるのか
2024/03/14(木) 11:10:11.90ID:CAl3EDk90
loraがやたらデカいってことはない?
XLで自作しててNetwork Rank128のalpha64で作ったら916Mとかになって笑った
865名無しさん@お腹いっぱい。 (ワッチョイ eef2-jwTK)
垢版 |
2024/03/14(木) 12:05:07.47ID:ylZSWlJQ0
>>858
自決した人はどうやって解決したかを辞世の句として残してほしい
2024/03/14(木) 12:22:47.07ID:CAl3EDk90
>>860
だね、今のところforge用しか作られてないっぽい
2024/03/14(木) 14:44:14.98ID:UERKqC2z0
もう基本forgeで最新機能
未対応の拡張だけA1111の流れでしょ
2024/03/14(木) 14:52:18.79ID:9d9b/9gu0
4090使ってるけど、forgeに変えて嬉しいことある?
使用するするメモリが少し減って、少し速くなっても特に嬉しくない…
LORA作ったりしないし。
2024/03/14(木) 15:13:42.69ID:NrERrKOjM
Forgeは自分みたいなノート派の味方

2048*2048はアップスケーリング通るけど格子ノイズがひどくて見るに耐えなくなる
何かがおかしいんだろうけれど設定詰めるのも面倒なので今では1024のままでオカズ作りに励んでる
2024/03/14(木) 15:19:31.36ID:LVkeTOpd0
>>868
作者がやる気勢なのか更新が頻繁なのをメリットと取るかどうか
2024/03/14(木) 16:26:47.75ID:UERKqC2z0
現時点では一部拡張だけだが、
今後おいていかれてしまう可能性がある点だな
どうなるかは拡張作者次第だろう
両対応されるようなら乗り換える必要もないかもね
2024/03/14(木) 16:47:02.78ID:CAl3EDk90
4090でも大きな画像作りたいなら入れた方がいい
t2iで1024x1024のhires x4とかめちゃくちゃやると勝手にtileに変えて完遂してくれて感動した
> Ran out of memory when regular VAE decoding, retrying with tiled VAE decoding.
とにかくOOMは絶対出さない感すごい
873名無しさん@お腹いっぱい。 (ワッチョイ 39fa-VRJu)
垢版 |
2024/03/14(木) 19:30:47.64ID:ClyPbcgJ0
何かしらの最新機能が盛り込まれるペースは当分はforgeの方が早いだろうなあ
2024/03/14(木) 22:03:50.70ID:fisJoiFF0
ミッドジャーニーに新しくきたキャラクターリファレンスが強力ですげえってなってるんだけど、これに匹敵するか類似のControlNetの機能ってあるかな
2024/03/14(木) 22:43:35.11ID:ACmuBfFo0
正直、エロ 美女 ローカル環境で調整できる 以外でSDってmidjourneyに結構差を離されてきてないか?
876名無しさん@お腹いっぱい。 (ワッチョイ 8694-UCxz)
垢版 |
2024/03/14(木) 22:48:15.45ID:M1VGOGRd0
AIエロ画像に質問スレがどっか行っちゃった
2024/03/14(木) 22:56:09.61ID:Ew1HQQbF0
ローカル環境で好き勝手遊べるという点だけで個人的にはSDが永久に一人勝ちだわ
2024/03/14(木) 23:30:29.26ID:CAl3EDk90
>>874
サイバーパンク桃太郎の人の苦労がついに解消されたのか
https://www.youtube.com/watch?v=U_nrNAEwMjs

mj昔やってたけど画面全然変わってないんだね
879名無しさん@お腹いっぱい。 (ワッチョイ 5178-VRJu)
垢版 |
2024/03/15(金) 00:54:29.09ID:KoAP66LT0
>>877
Midjourneyの話してくる奴は100%SDサゲがしたいだけ、というのがこの板の法則だから相手すんな
2024/03/15(金) 06:08:35.19ID:cWNpf8KC0
a1111でkohyaで作成したLoRA使ってる
Promptに入れる時、<lora:xxxx:1>xxxxと表示される「xxxxはlora名」
自前loraだと<>の後のlora名が表示されるのは仕様?
ちなみにcivitaiで拾ってきたloraでは<>の後ろは表示されない
消す方法あったら教えて
環境は再構築したての環境
881名無しさん@お腹いっぱい。 (ワッチョイ e19d-VRJu)
垢版 |
2024/03/15(金) 06:28:51.51ID:rJSxL1Xb0
>>880
正確にどのツールかわからんけどうちではそんな挙動はしてないので(kohya_ss)仕様かどうかはわかんないけど
LoRAの設定(LoRAのサムネイルの右上のハンマーアイコン)で
中ほどのActivation textにテキストが入ってるとカード選択時に自動入力される
不要なら全部削除してsaveすればいい
よく使うトリガーとかプロンプトを登録しておくと便利って機能だね
2024/03/15(金) 09:07:09.36ID:OJm3etpu0
forgeで生成の前に毎回modelロードがされているみたいで
パフォーマンスがあがりません。

1111はモデルを変更しないかぎり、ロードしないんですが
原因わかりますでしょうか

Moving model(s) has taken 0.67 seconds
Model loaded in 19.7s (unload existing model: 3.3s, load weights from disk: 0.2s, forge load real models: 14.7s, load VAE: 0.7s, calculate empty prompt: 0.8s).
2024/03/15(金) 09:39:21.43ID:KEbh140R0
>>880
https://github.com/butaixianran/Stable-Diffusion-Webui-Civitai-Helper
> Add this model's trigger words to prompt
自作だけってことはこれの機能じゃないよなぁ

>>882
https://github.com/lllyasviel/stable-diffusion-webui-forge/issues?q=is%3Aissue+label%3APerformance+is%3Aopen
なんか未解決臭い?
3060と4080でなるって人がいる
大騒ぎになってないってことは、なんらかの特定環境絡みだろうか
2024/03/15(金) 10:35:00.18ID:OJm3etpu0
>>883
情報ありがとうございます

当方も 4060 Tiなので
VRAM多めのグラボ限定の問題のようですね
2024/03/15(金) 14:34:28.37ID:iLkaERqT0
>>884
俺4060 16だけどならないけどなあ?
2024/03/15(金) 15:29:20.52ID:cWNpf8KC0
>>881
Activation text削除でイケた
ありがと
2024/03/15(金) 15:45:06.38ID:aXqrechk0
>>882
これを見ると毎回20秒かかっているということなのか?
2024/03/15(金) 18:03:31.65ID:OJm3etpu0
>>885
そうなんですね
発動条件がわからないですね

>>887
2024/03/15(金) 18:04:59.98ID:OJm3etpu0
>>887
そうなんです
毎回20秒ロードがかかるので
1111のほうが早いです
2024/03/15(金) 18:05:26.15ID:oNSpT4B/0
Forgeは内部で自動的に良い感じにしてくれるから何も起動オプションは書かずに起動

VRAMの容量で自動的に動作が変わるから他のソフトを終了させる
(Windows起動直後にやってみる)

少し前のやつだと毎回アンロードされた時があったからgit pullで最新にしてみる

とりあえずこんなもんかね
4060Tiの8GBなのか16GBなのかわからないけど
16GBなら自分が使ってて問題ないよ
891名無しさん@お腹いっぱい。 (ワッチョイ eef2-jwTK)
垢版 |
2024/03/15(金) 19:31:32.21ID:boHhsaJY0
>>890
>少し前のやつだと毎回アンロードされた時があったからgit pullで最新にしてみる

おっと、Forgeのアップデートはupdate.batですね
2024/03/15(金) 21:13:23.08ID:46E+r7OM0
1660ti VRAM 6GBだけど毎回モデルの再ロードしますね
多分低VRAM用の機能が有効になってしまってるんじゃないかと
893名無しさん@お腹いっぱい。 (ワッチョイ 86e7-UCxz)
垢版 |
2024/03/15(金) 21:33:09.59ID:nsr5S5+d0
リアル系もおkなうpろだって無い感じかな、無いなら作りたいとか思ってみたり
2024/03/15(金) 23:03:08.79ID:KEbh140R0
上の毎回unload/loadの人の調べてたんだけど、
t2iの下の方にあるNever OOM Integratedって凄いね
https://github.com/lllyasviel/stable-diffusion-webui-forge/discussions/395
M.2 SSDでもload分で4秒くらい余計にかかるけど、全然VRAM使わない
共有GPUメモリの使用すら増えない、どうなってるんだろ
COMMANDLINE_ARGSに--always-offload-from-vramと同じ動きかな?

SDXL学習しながら途中のをちょっとチェックみたいなの出来る
kohyaに入ってるsamplesは使いにくそうだし・・
2024/03/15(金) 23:35:11.39ID:WCH2Rdsa0
そう考えたらオンにしない手はないんだけど
オンにした場合のデメリットはあるんだろうか
速度低下や品質低下?
2024/03/15(金) 23:45:31.26ID:KEbh140R0
ああ書き忘れてた、loadだけじゃなく生成時間も普通に遅い
品質はほぼ同じ(xformersくらいの差)で、時間が3倍くらい掛かる感じ

でも学習中みたいにメモリカツカツだとめちゃくちゃ嬉しい
チェックに別PC使ったりしてたので
897名無しさん@お腹いっぱい。 (ワッチョイ c610-VRJu)
垢版 |
2024/03/16(土) 02:39:52.41ID:vobDi3Hn0
最新forgeにしたら毎回ロードされるようになったw
2024/03/16(土) 08:42:41.99ID:t3FGqu840
自分のRTX3060環境だと、初めて共有メモリを使うgeforceドライバに更新した時にmodelのunload/loadが発生しましたが、git pullでちゃんとreuseするようになりました。
899名無しさん@お腹いっぱい。 (ワッチョイ 5178-VRJu)
垢版 |
2024/03/16(土) 17:45:54.78ID:Mha9o//R0
Never OOM Integratedも、always-offload-from-vramも状況によってはVRAM消費量がA1111より増えるバグがあるらしい?
https://github.com/lllyasviel/stable-diffusion-webui-forge/issues/500
https://github.com/lllyasviel/stable-diffusion-webui-forge/issues/349

深く読み込んでないので勘違いかもしれんし、今は解決してるかもしれん
2024/03/18(月) 00:34:14.16ID:CMxh0mh50
LoRA作成時のタグについて質問です
よく解説サイトではDataset Tag Editor等で抽出して「特徴を捉えているタグ」を選択して削除しろってあります。
すると残るのは例えばキャラものだったら背景や構図、ポーズのタグになるわけですよね。
で、先頭にオリジナルのタグを登録させてそれにキャラ特徴を集約させて、残ってる背景等の不要なタグはLoRA使用時にそれのタグを使わない事で不要な部分を呼び出さない役目を果たすとあります。

それとは別に
必要なキャラの髪型や体系、服装のタグだけをテキストに残して、背景タグ等を残さないパターンもあるようですが、結局どちらが良いのかいまいち分かりません。意見があったらください
2024/03/18(月) 01:12:09.96ID:nsfUNeVC0
結局キャラと特徴羅列すりゃ出てくる挙動は同じが
背景タグ消すのはゴミ紛れ込むからオススメしない
2024/03/18(月) 01:33:57.19ID:8cQJnG+s0
そこら最初考えてたけど、だんだん気にしなくなったなぁ、tagger任せで充分というか
例えば学習画像が全部服着てると、ちゃんと服のタグが入ってないと
水着にしても首の周りに襟が残り続けたりする

> 「特徴を捉えているタグ」を選択して削除
三つ編みキャラで三つ編みタグ削除しちゃうと、そういうキャラって覚えられるので、ポニテにしても三つ編みついたり
背景タグ外すと、どんな場所でもその背景がついてきてしまう(そのキャラに付随したオーラみたいな扱い)
903名無しさん@お腹いっぱい。 (ワッチョイ b978-DuwO)
垢版 |
2024/03/18(月) 02:36:49.43ID:+UcahfsL0
てかタグ削除って効果ある?なんかおまじないレベルの違いしか無いような気がするんだけど。
覚えて欲しい特徴を消すってのやっても、やっぱりプロンプトで指定しないとしっかり再現されない事が多い
逆に、タグを削除してなくてもLoRAの強度上げればプロンプトで指定しなくても特徴が再現されたりするし

同じデータセットや学習条件で比べたことがないから断言は出来ないけどそこまでたいした違いがない気がする
904名無しさん@お腹いっぱい。 (ワッチョイ 59f2-DuwO)
垢版 |
2024/03/18(月) 02:56:43.11ID:29BScG940
>>903
一般的に言われれてる手法では削除したタグの要素をトリガーワードに集約するって形だから
綺麗に集約された場合LoRA適用だけではその要素がほぼ出てこないけど
トリガーを使うと要素が強く出る
結局人が認識してる部分とAI側が認識して学習する部分に結構差異があるのでそんなに綺麗に分けれないみたいなところはある
キャプションをトリガーワードのみ、トリガーワードと覚えさせたいタグ削除、トリガーワード追加でタグ無削除辺りで比べると
結構違いが出ると思うけどまあ、結構なんとなくでも上手くいく事も多いし色々考えたやつほど失敗したりもあるから
自分に合う方法で納得いくならそれでいいんじゃない
905名無しさん@お腹いっぱい。 (ワッチョイ b978-DuwO)
垢版 |
2024/03/18(月) 05:25:56.73ID:+UcahfsL0
>>904
なるほど、そういう仕組みなのか
知らずに書いてあるままやってたから勉強になったありがとう
906名無しさん@お腹いっぱい。 (ワッチョイ 81fa-A0KB)
垢版 |
2024/03/18(月) 08:04:05.75ID:7GUgaMax0
残したい特徴を全部消すって聞いて衣服の特徴まで消すと絶対に脱ぎたくない強情な女の子が出来上がったりするよね
髪と目の色とおっぱいのサイズぐらい消しとけば概ね十分
907名無しさん@お腹いっぱい。 (ワッチョイ fb99-pWG2)
垢版 |
2024/03/18(月) 11:52:40.64ID:5NdT1PwE0
Animagineからpony系モデルに移行してるのですがあのdanbooruタグをまとめてくれてるサイトみたいなpony系タグのまとめサイトはありませんか?
908名無しさん@お腹いっぱい。 (ワッチョイ 519f-7lhN)
垢版 |
2024/03/18(月) 18:28:34.41ID:TghHFKCK0
状況によって可変しないものを消す
メガネっ娘のメガネを消すと体の一部になるぞ
目の色や髪が変わる人は少ない
2024/03/18(月) 21:59:37.22ID:rASQzevK0
最近ハマったものです
色々と生成した後に行う選別・移動・削除が面倒になってきました
ttps://i.imgur.com/NzDZTjs.jpeg
↑のPhotoScapeXというアプリが割と使いやすいけど、移動のときにいちいち聞いてくるのが難点
いい感じのおススメ画像整理アプリがあったら教えてください

Windowsのエクスプローラーだと特大アイコンでもまだ小さいんすわ
2024/03/18(月) 22:27:11.10ID:rBPj3XYKd
俺もそういうの皆がどうしてるのか気になるわ
今ははじめて1ヶ月で毎日300枚くらい生成したフォルダが30で把握は出来てるけど
このままではそのうちわけわからなくなる状態が必ずきそう
2024/03/18(月) 22:34:35.19ID:ma+eKRXt0
やり始めてから10万枚は余裕で生成してるけどほぼ管理してないぞw
投稿サイトにアップするために選別したのは別にしてあるけど後は全部そのまんまにしてる
2024/03/18(月) 22:42:57.80ID:nsfUNeVC0
有料でいいならeagle
2024/03/18(月) 22:47:01.33ID:+EvVSn5va
ビューアですら自由回転一つ満足についてないやつ多いし
サムネがかなりデカくできるタブファイラーでも導入するのが早いんかね
2024/03/18(月) 23:01:42.50ID:YR7wu2gz0
XnViewでサムネ短辺1000までは出来るね
A1111の拡張でXnViewで読めるコメント欄にプロンプト自動で入力するのとかもあるからプロンプトで検索も出来る

ファイラーだとDirectoryOpusがExiftool使って直接プロンプト検索出来るけどまぁお高い
915名無しさん@お腹いっぱい。 (ワッチョイ fbac-mjnA)
垢版 |
2024/03/19(火) 00:08:38.91ID:9Wth1PB20
NAI3で画像出してるんだけど
管理ってどうやるんだ?
今はリロードすると出した画像消えちゃうから前の画像から派生させるときは
毎回画像読み込んでプロンプトとか抽出してコピペしてる

A1111のimage browserのように簡単に管理する方法あるんですかね?
2024/03/19(火) 00:28:41.71ID:rIooiZhy0
画像管理ソフトは何度か書かれてるけど
有料でもいいならEagle
https://jp.eagle.cool/

非公式のSD拡張入れればプロンプトで検索もできるようになる
https://github.com/bbc-mc/sdweb-eagle-pnginfo/blob/master/README.ja.md


無料ならXnView MP
https://www.xnview.com/en/

こっちも非公式のSD拡張使えばプロンプトで検索もできるようになる…らしい(未確認)
https://github.com/Takenoko3333/sd-webui-xnview-pnginfo

XnView MPは初期設定だとごちゃごちゃしてるから
評価機能とか切っちゃったほうが個人的には使いやすい
レス数が900を超えています。1000を超えると表示できなくなるよ。
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況