X



【StableDiffusion】画像生成AI質問スレ11【NovelAI】

■ このスレッドは過去ログ倉庫に格納されています
2023/05/20(土) 19:09:49.64ID:FhWAh4Z/0
!extend:checked:vvvvv:1000:512
↑次スレ立てる時は行頭にこれいっぱい置いとけ

Stable Diffusionをはじめとする画像生成AIに関する質問用のスレッドです。
次スレは>>950が立ててください。

質問する人はなるべく情報開示してください
・使っているアプリケーション(1111ならローカルかcolabか、ローカルならどこから/何を読んで
 インストールしたか、colabならノートブックのURLも)や使っている学習モデル
・状況の説明は具体的に。「以前と違う画像が出力される」「変になった」では回答しようがない。
 どう違うのか、どう変なのかを書く
・状況やエラーメッセージを示すキャプチャ画像
・ローカルならマシンの構成(GPUの種類とVRAM容量は必須、本体メモリの容量やCPUもなるべく)

テンプレは>>2以降に

※前スレ
【StableDiffusion】画像生成AI質問スレ10【NovelAI】
http://mevius.5ch.net/test/read.cgi/cg/1683421154/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
2023/07/05(水) 15:55:30.00ID:1PfW0k4Q0
本来は終了時に消す手順だったらしいんだけど、みんな強制終了しちゃうから消えなかったらしい
最新版で起動時に消すようになったっぽい。
2023/07/05(水) 16:55:05.93ID:GQMReSe/0
本来の終了方法って?
ctrl+xか、windowの×ボタンでしか終わったことない。
2023/07/05(水) 16:56:43.07ID:cxc3VbWI0
UIからだろ
2023/07/05(水) 17:02:31.58ID:GQMReSe/0
わからん。
reloadはあるけど、終了は見つけられない。
2023/07/05(水) 17:10:18.61ID:6xJUCub40
質問です
tiled diffussionでアップスケールすると色味がくすむんですが解決策ありますか?
754名無しさん@お腹いっぱい。 (アウアウウー Sabb-sGjF)
垢版 |
2023/07/05(水) 17:38:12.22ID:mwx+GBMFa
>>748
ごめん、SAVEで保存されてたわ...
ところでimg2imgで画像をドロップしてそれをGenerateしても何も起きないんだけどどうして?
2023/07/05(水) 17:41:44.97ID:9T6X95HS0
>>754
その手順だとプロンプトがないからじゃないの
なにかプロンプトを入れると、画像をもとにプロンプトに従った画像が出る
2023/07/05(水) 20:50:19.47ID:SWSEAA51a
何もプロンプト入れなくても拾った画像をドロップしてそのまま高解像度にできる
757名無しさん@お腹いっぱい。 (アウアウウー Sabb-sGjF)
垢版 |
2023/07/05(水) 21:18:38.65ID:3UN9p5QMa
造った画像をSend to img2ingで送ってもダメなんだよね...
WaitingとはでるけどGPUも動いてないし
なんか間違ってるんだろうな
2023/07/05(水) 21:36:58.98ID:PvCs8OoD0
>>757
エラーメッセージ何かでてないの?
2023/07/05(水) 22:46:32.42ID:BgTZtLpLa
>>743
口だけ、眉毛、目だけとか細かくいじった方が崩れにくいと思う。顔全体だと別人になっちゃう。
760名無しさん@お腹いっぱい。 (アウアウウー Sabb-sGjF)
垢版 |
2023/07/05(水) 22:53:55.92ID:2tUElGVra
>>758
エラーは出てない
AUTOMATIC1111でインストールしたけどそのままimg2ing使えるんだよね?
761名無しさん@お腹いっぱい。 (ワッチョイ 6294-sGjF)
垢版 |
2023/07/06(木) 00:27:35.46ID:jJ1QThut0
>>760
ごめん自己解決
SD再起動したらできたっぽい
762名無しさん@お腹いっぱい。 (ワッチョイ 8269-ctHD)
垢版 |
2023/07/06(木) 07:55:15.68ID:YL6/WiaK0
pixaiがよすぎてStableDiffusionだと不満が出る
でもエロがだせないのがつらい
2023/07/06(木) 10:03:43.18ID:S/WNnkIfM
ステマ
2023/07/06(木) 10:09:42.87ID:5mGEZWz6M
モデル3つマージって3つめ反映されてるんですかね?
デフォルトの0.3でやるとAが0.7、Bが0.3と表示されるんだけど3つ目の数字が無い
マージは2つでやるものなんですか?
2023/07/06(木) 10:27:45.88ID:ud5DzGko0
>>762
同じことをMJからSDにしたときに感じたけど
商用には隠しプロンプトみたいなのがあらかじめ入ってるんだよ

同じプロンプトで比較せずに、SDのプロンプトを磨いていくべし
とくにネガティブ
2023/07/06(木) 10:34:40.07ID:ud5DzGko0
ちょっとズレるけど、去年7月って最初期のDALLE2で
https://www.techno-edge.net/article/2022/07/28/129.html
こんな話題もあった
767名無しさん@お腹いっぱい。 (アウアウウー Sabb-sGjF)
垢版 |
2023/07/06(木) 12:48:09.29ID:YVs3tsMMa
プロンプトって75文字制限なの?
2023/07/06(木) 13:25:36.54ID:tYboN0GGa
>>762

工ロが出せないってなんで?普通に出まくるんだけど。
769名無しさん@お腹いっぱい。 (ワッチョイ 8269-ctHD)
垢版 |
2023/07/06(木) 14:07:57.04ID:YL6/WiaK0
結局、似たような画像ばっか出るからあきやすいな
あと手がおかしくなるのが萎える
2023/07/06(木) 14:47:42.88ID:JW13b9Ffa
Angle 変えれば良い。アングル用LoRA結構重要。
2023/07/06(木) 15:21:07.48ID:X8Vezgx20
似たような絵ばっかりになるのはコントロールネット使って制御すればどうにでもなる
3D使える奴は深度画像での構図指定がおすすめ。
指定したものを描く能力自体が存在しないならどうしようもないが、能力自体の奥行きはけっこうあるからな
2023/07/06(木) 17:02:04.57ID:rqZxw1nq0
>>767
昔は75トークン以降は切り捨てられていたけれど今は制限はない
2023/07/06(木) 19:42:57.61ID:Svf5cv7I0
gtx1660superとrtx3060 12gb2枚刺しって意味ある?
2023/07/06(木) 20:01:58.49ID:mv0D18wJ0
>>773
意味のある設定にすれば意味を持たせることは出来るけど
生成速度上げれるかとかそういう意味なら全く無意味
2023/07/06(木) 20:32:14.67ID:Svf5cv7I0
>>774
学習時にはpytorchでもtensorflowでも複数GPUに処理を簡単に分散できるのは知っていますが推論時はどうなのかよく分かってません。stablediffusionは複数GPUに対応していないのね
2023/07/06(木) 21:09:45.53ID:ywkqeOUG0
>>767、772
制限はなくなったけど75トークンごとに分割して適用されるのと75トークンのうち最初の方が強く効くので分割箇所は要注意。
medium breastみたいな書き方で間で切られると意図した結果にならない。
順序を変えたりBREAKを使ったりすると良いらしい。
777名無しさん@お腹いっぱい。 (ワッチョイ 4294-sGjF)
垢版 |
2023/07/07(金) 01:25:53.22ID:ZnbTegb30
>>772>>776
75以上でもいけるんだね
無理して詰めてたけどうまく75で区切り付けられるようにするよ
ありがとう
2023/07/07(金) 04:35:17.13ID:01/QB3kt0
pixai簡単に仕上がり良いの出てくるから悔しい
2023/07/08(土) 06:08:49.02ID:5wfZBE1R0
使いこなす修行するのだ
2023/07/08(土) 07:10:12.37ID:XlU22eEF0
同じPixAIの質問で悪いんですけど。
i2iのマスク部分のinpaint ぽいの出来るって書いてあるけどマスクで塗って完了押しても反応しなくてアップができない。
2023/07/08(土) 10:46:17.46ID:a9rt7ltoa
自己解決 アプリ入り直したらできた。
pix AIのinpaint破壊力やばすぎだろNAIに金払ってたの馬鹿らしいわ。
2023/07/08(土) 12:31:31.90ID:PhUy9nuT0
PixAIもよかったけど、SeaArtで待たされずにアップスケールできるのが今ちょっと癖になってる
2023/07/12(水) 12:29:48.35ID:nmlDpvdRa
フォルダ内のpngの呪文を一括してテキストファイルに吐き出すpythonスクリプト書こうとしてるのですが、stabledefusionが使ってる仮想環境フォルダのpython.exeを直接呼べばいいのかな?
インストールしたpythonには(当然)ライブラリ(pillow)がないので。
784名無しさん@お腹いっぱい。 (ワッチョイ ff10-4oIi)
垢版 |
2023/07/12(水) 13:07:32.17ID:wV6MkD840
>>783
それでもいいけど、スクリプト書くなら程やる気あるならvenv環境つくってpipでpillow入れるくらいは覚えた方がいいぞ。どっちも1行だから。
2023/07/12(水) 19:14:39.91ID:2g4L9AVQ0
>>784
まあちゃんとやるには確かにアクティベートして仮想環境内でやるべきなんでしょうけどね。まあちょっとやってみます。
2023/07/15(土) 13:04:48.04ID:RAADJtB2d
手の修正を調べるとAdetailerを推奨するようなサイトを結構見かけますが
皆さんこれちゃんと機能してますか?
ある程度作りたい絵が決まったあとに手の部分を直したいと思い
Enable ADtailerにチェック入れて
Hand_yolov8n.ptを選択してT2Iで出力しても
全くまともなのが出てこないです
他に代替手段あったりするでしょうか
2023/07/16(日) 11:47:06.09ID:4YQ7zrIR0
ControlNetの手のDepthライブラリとか、方法はいくらでもある
2023/07/16(日) 17:56:04.47ID:ZCfHY0+n0
Automatic1111のローカル版インストールしてみたんだけど、
人の顔写真だけ用意して、体の部分を生成ってできるとしたらどうやるの?
2023/07/16(日) 18:13:59.51ID:hdVkefZi0
>>788
アウトペインティングかなあ
そういう使い方をしてる人はあまりいなさそう
2023/07/16(日) 21:43:32.80ID:4YQ7zrIR0
LoRA作ったほうが確実だろうな
2023/07/17(月) 07:47:22.80ID:9xRpLRJI0
Adetailer使うと人物が微妙にぼやけない?
ぼやけて使えないからAdetailerは背景部分にしか適用してない
2023/07/17(月) 12:28:57.70ID:E8Z6LQ0i0
>>789
ありがとう昨日試してみたけどなかなかうまくいかない
>>790
昨日から試しはじめてLoRAって知らないけど調べてみるありがとう
2023/07/17(月) 15:07:56.73ID:dwFgDfRd0
初心者なんですが、出力する解像度を上げるとキャラが複数人湧くんですがどうやったら避けられますか?
794名無しさん@お腹いっぱい。 (ワッチョイ 82d1-/jfo)
垢版 |
2023/07/17(月) 16:04:06.55ID:oEbA9C2M0
解像度を下げてください。今のSDは512×512が基本。
まず低解像度で出して、それを元に拡大するというのが今の主流。
2023/07/17(月) 16:06:47.56ID:VUmgRAtI0
>>793
完全には防げない
学習しているサイズが512である宿命で、これ以上のサイズになると複数人出てきてしまう
減らす方法は、プロンプトに顔や姿勢のワードを入れすぎない、大きなサイズに強いモデルを使う、ControlNetを使う
表情にこだわりたいならADetailerを使って表情指定を全部そっちでやる
2023/07/17(月) 17:41:45.14ID:orI+o7NrM
自分でモデルを作りたいんですが詳しく解説されているサイトなどありますか?
自分で探した限りではLoRAばかりで見つかりませんでした
2023/07/17(月) 17:42:56.61ID:orI+o7NrM
マージモデルでもなく一から作ってみたいです
798名無しさん@お腹いっぱい。 (ワッチョイ 4c10-/jfo)
垢版 |
2023/07/17(月) 18:10:09.55ID:y+y4V6JR0
>>797
どんな設備持ってるか知らなけど、RTX4090を1台2台持ってるレベルでは無理です
ゼロからだと、とんでもない枚数を学習させないといけないので
2023/07/17(月) 18:21:40.53ID:duLKxCVU0
>>797
まず適切にタグ付けされた画像を50億枚くらい用意します
2023/07/17(月) 19:05:17.21ID:g1si/HmE0
U15アイドルの画像を各アイドル数百枚レベルで所有してるんでLora作りまくってるんだけど正直ヤバいっす。
2023/07/17(月) 20:36:38.94ID:5bDY+NoH0
>>800
すごいものができて人に見せたくなっても我慢なのがつらそう
2023/07/17(月) 20:37:54.79ID:5bDY+NoH0
>>796
Waifu Diffusionは個人が作っているらしいから、どのくらいの規模のシステムでやってるのか調べてみたら
2023/07/17(月) 22:25:32.10ID:E8Z6LQ0i0
>>792
LoRA作ってたらout of memoryで断念
環境がしょぼすぎた
2023/07/17(月) 22:54:01.25ID:2yWBFUf60
>>799
50億枚学習したデータが数GBに収まるんだからすごいよねえ。一枚あたり1byteあるかないか。
2023/07/17(月) 23:24:05.98ID:KqR9Q6io0
>>803
そこら辺が RTX 4090を買った方がいいという理由
806名無しさん@お腹いっぱい。 (ワッチョイ 4c10-/jfo)
垢版 |
2023/07/17(月) 23:48:25.05ID:y+y4V6JR0
>>804
収まるというか、1枚でも1億枚でも学習直後のモデルサイズは同じだよ
サイズの違いは枝狩りとかFP16とかもろもろの事後調整
807名無しさん@お腹いっぱい。 (ワッチョイ 1439-4LRZ)
垢版 |
2023/07/17(月) 23:57:16.70ID:UwQ4ZNZb0
そもそも1枚の絵が1byteに圧縮出来る技術があればイラストAIなんかに使ってる場合じゃないよな
808名無しさん@お腹いっぱい。 (ワッチョイ 6c62-S+qH)
垢版 |
2023/07/18(火) 03:14:37.07ID:dasg8lv30
塵理論の話してる?
809名無しさん@お腹いっぱい。 (ワッチョイ a6da-MI76)
垢版 |
2023/07/18(火) 06:00:29.13ID:E8sVbVT50
PC壊れたので新しく組んでもっかいインスコしたけどxformersがうまくインスコできない
cudaとかのバージョンが違うせいか?
2023/07/18(火) 06:17:00.04ID:EJjA8cyt0
>>809
どのインストール手順でインストールして
現状ログとかにどういうエラーが出てるんだ?
xformers使う場合はbatに--xformersも入れないとインストールされてても使用されないけどその辺は?
811名無しさん@お腹いっぱい。 (ワッチョイ a6da-MI76)
垢版 |
2023/07/18(火) 06:22:51.20ID:E8sVbVT50
画像生成自体はできる状態
webui-user.batに--xformers書き込んでもNo module 'xformers'. Proceeding without itと出て
web ui画面の下にもN/Aと出てる
2023/07/18(火) 06:31:26.87ID:EJjA8cyt0
だからどの手順でインストールしたんだよ
git cloneで入れたら今なら1.4.0にPytorch2.0+cuda11.8とxformers0.0.20が入る筈
別手順でwebuiのバージョン古いのを入れちゃってたらPytorchの更新もしるかもしれないし
xformers自体も別でインストールしなきゃいけないかもだし
モジュールが入ってるか入ってないかはpip listとかで確認すればいいと思うけど
2023/07/18(火) 18:05:54.99ID:rN5FwRbi0
キャラ学習を勉強中なんですが、いろんなポーズとか全身画像を学習画像に含ませたら頭身も覚えてくれますか?
2023/07/18(火) 22:13:12.93ID:HygEtbLC0
>>805
Google colabてLoRA作ってローカル環境にコピーして動かせた
2023/07/18(火) 22:16:55.63ID:HygEtbLC0
>>814
濁点抜けた
colabで作れたからローカルにコピーして生成出来た
生成した画像は訓練データの顔とはちょっと違うけど
816名無しさん@お腹いっぱい。 (ワッチョイ 2e69-5LlG)
垢版 |
2023/07/19(水) 08:30:45.11ID:mdIexG6/0
LORAがよくなる条件ってなんだろうな。うまくいくときと失敗するときの落差が半端ない気がするが
2023/07/19(水) 13:23:47.58ID:JNEYY6nL0
とりあえずテストで雑に作ったやつの方がうまくいってたりするわ。
2023/07/19(水) 21:14:10.54ID:sgNoWNS60
根拠はないけど、エポック1つを比重1.0で使うと破綻率が高くなる感じがするので、エポックの初めの方と真ん中あたりと終盤(過学習しない程度)を比重0.3ずつぐらいでマージして使ってます
2023/07/22(土) 06:10:00.24ID:HcWyiSiYa
配布されてるキャラloraでモデル変えても似たような塗りや絵柄になってしまうのですが仕方がない事なのでしょうか?
体位loraとか一緒に使うと塗りも絵柄も似たような絵になるのも配布されたloraじゃどうしようもないんですかね
2023/07/22(土) 06:17:43.90ID:NZJJoaH60
>>819
マージ元が似ているモデルどうしなら同プロンプト、同シードで近い絵が出るよ
具体的な画像を見せてほしい
catbox.moeに1枚ずつ上げてくれればメタデータも見られるからよろしく
2023/07/22(土) 06:19:07.66ID:xmtylSLd0
48手LoRAがあると聞いて
2023/07/22(土) 06:37:40.88ID:YG500MLe0
>>819
そのロラがそういうロラ なんだろうね
2023/07/22(土) 09:22:30.00ID:HcWyiSiYa
配布されてるキャラloraでモデル変えても似たような塗りや絵柄になってしまうのですが仕方がない事なのでしょうか?
体位loraとか一緒に使うと塗りも絵柄も似たような絵になるのも配布されたloraじゃどうしようもないんですかね
2023/07/22(土) 09:29:56.15ID:HcWyiSiYa
すみません何故か同じ内容連投してしまいました
lora関連はかなり奥が深くて思い通りにするのは至難の技なんですね
loraマージとか試して駄目そうなら諦める事にします
2023/07/22(土) 09:33:34.50ID:EUE3aoqT0
Lora Block Weightって拡張である程度制御できる
ただ自力ではかなりの沼を経験する、自分は他人様の研究結果の表を拝借した
2023/07/22(土) 10:09:57.23ID:EUE3aoqT0
追記

<Lora:AAAA:1>
そのままだとガビガビだったり、塗りまで学習元のまんまだったりすることがよくある、背景までアニメ調になったり
この1をだんだん→0.75→0.5と下げていくとモデルの特質に近づいて塗りや背景も綺麗になっていくけど
キャラもだんだん乖離していってしまう

「キャラデザを維持しつつ、モデル本来の綺麗さに寄せて、背景も詳細リアルにしたい」

こういう時にLoraが持ってる不要な情報を切ってしまえって発想ね
「Lora Block Weight」で検索するといろいろ引っかかると思う
学習のさせ方が個々に違うので影響範囲が微妙に変わってるらしく一筋縄ではいかないんだけど
自分なりのを数種類用意しとくと、これか?これか?って試してだいたい対応できる
2023/07/22(土) 10:45:43.36ID:RKG0D7YqM
横顔がまず100%崩れるのは仕様?
2023/07/22(土) 10:53:20.40ID:ti96iuuVM
そんなことはない
2023/07/22(土) 11:17:54.87ID:RKG0D7YqM
マジですかい
実写系なんだけど横顔がきれいに出たためしがない
2023/07/22(土) 11:59:22.81ID:p+2Szc/y0
高スペックならサイズ最初から大きめにすると崩れにくいはず か顔をそもそも大きくするために構図考える
2023/07/22(土) 12:43:13.09ID:RKG0D7YqM
ランダムにいろんなアングルかつ全身入る構図になるようにしてるんだけど、たまたま顔のアップみたいなのになってしまった時は正面でも崩れかつ粗くて使えない画像になる
サイズは基本2000x2000くらい
2023/07/22(土) 14:20:24.16ID:NZJJoaH60
>>831
> サイズは基本2000x2000くらい

txt2imgの「幅」と「高さ」をいきなり2000にしているのだったらそれがちゃんとした画像にならない原因だよ
Stable Diffusionの学習モデルは512×512や768×768ピクセルで学習しているから、あまり大きな画像を出させると崩れてしまう

「幅」「高さ」はv2.x系列やSDXLの学習モデルでなければ、512×512から大きくても960×960程度で出力してまず構図を決めて、解像度を上げるにはそこからhires.fixやそのほかの方法で大きくするのが一般的
2023/07/22(土) 14:34:44.30ID:RKG0D7YqM
>>832
すまん、ちょっと端折って書いてしまった
今は1000x1000くらいでガチャして、選んでからi2iで2倍にしてるけど、以前はいきなり2000x2000でガチャしてた
で、どっちも顔の崩れ方は変わらなかった気がするんだよね
2023/07/22(土) 16:17:40.69ID:3r+gR8bW0
>>833
txt2imgでのサイズはSD1.5では768x768が限界かな
それ以上だと崩れる
SDXLは1024x1024で学習しているそうだから1024で綺麗に出るだろうけれど
2023/07/22(土) 16:37:40.26ID:YG500MLe0
>>831
そもそも 正方形があかんねん 2対3とかにしないと
2023/07/22(土) 16:47:29.02ID:NWgaI6k30
ローカルに1111版webuiをcloneしてsupermergerをインストールしたけど、supermergerタブが表示されない
どなたか教えてください

やったこと
1.ブランチをdevに指定してclone
2.日本語化やcontrolnetなどの拡張機能と一緒にsupermergerも導入
3.UIを再起動

設定は全くいじっていないし、同じ拡張機能を導入しているもう一つの環境では表示されているので謎
どちらの環境もバージョンは1.5.0-RC
念のためタブの順序変更の設定も見たが、そこにもsupermergerの表示はなし
2023/07/22(土) 17:42:14.86ID:6s9HAcVJ0
>>836
PC再起動
2023/07/22(土) 18:11:23.91ID:NWgaI6k30
>>837
アドバイスありがとうございます
今試したのですが直りませんでした
2023/07/22(土) 20:00:05.27ID:NZJJoaH60
>>836
そもそもどうしてわざわざRCを入れたの?
開発版は何が起きても不思議じゃないから、ここ↓から安定版である1.4.0のzipをダウンロードして解凍して使ってみては
https://github.com/AUTOMATIC1111/stable-diffusion-webui/releases/tag/v1.4.0
840名無しさん@お腹いっぱい。 (ワッチョイ e757-onGn)
垢版 |
2023/07/22(土) 20:20:10.47ID:6s9HAcVJ0
>>838
State Extention というのが悪さしているような記述があった。

Settings>State>uncheck the "extra networks" boxes and it fixed the issue.

https://github.com/AUTOMATIC1111/stable-diffusion-webui/issues/10304
2023/07/22(土) 20:39:58.60ID:Tm/Qw6yJ0
3060から4070tiに変えたけどHi-Res速度ほとんど変わらない。512✕768 の2倍
なんで?
842名無しさん@お腹いっぱい。 (ワッチョイ e757-onGn)
垢版 |
2023/07/22(土) 20:55:35.49ID:6s9HAcVJ0
>>841
何秒と何秒なんだ
2023/07/22(土) 21:05:35.47ID:EUE3aoqT0
あんまり古いPCだとCPUがボトルネックになってる可能性もある
2023/07/22(土) 21:28:13.26ID:k4ktb4OzH
別に急いで作る理由もないしいいや
1枚作る30分掛かるとかそんなだったら困るけど
2023/07/23(日) 01:21:33.26ID:oXactBOR0
そもそも拡大ってCPUパワーでやってなかったっけ?
2023/07/23(日) 01:38:11.45ID:0EVjphbM0
>>841
パソコンの構成を書いてくれないからわからん
2023/07/23(日) 02:45:45.89ID:fhh2B6Lxa
Loraや階層マージを弄っていて思ったのですがキャラの肌の色がワンパターンというか白すぎて茶色が目立ったり頬以外肌に赤みが無かったりで肌に赤みやら出したいのですが方法ありますかね?
veaや色々モデルマージしても解決できませんでした
2023/07/23(日) 07:55:03.04ID:KDZuk8h+d
adding detaile使えば解決
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況