【StableDiffusion】画像生成AI質問スレ20
■ このスレッドは過去ログ倉庫に格納されています
Stable Diffusionをはじめとする画像生成AIに関する質問用のスレッドです。
次スレは>>970が立ててください。
質問する人はなるべく情報開示してください
・使っているアプリケーション(1111ならどこから/何を読んでインストールしたか)や使っている学習モデルを明記する
・状況の説明は具体的に。「以前と違う画像が出力される」「変になった」では回答しようがない。どう違うのか、どう変なのかを書く
・状況やエラーメッセージを示すキャプチャ画像や出力画像をアップロードする。出力画像はimgurではなく、catboxなどアップロード時に出力パラメータが残るサービスへ
・ローカルならマシンの構成(GPUの種類は必須、VRAM容量やメインメモリの容量、CPUの種類もなるべく)を書く
テンプレは https://rentry.co/aiimggenqa に
※前スレ
【StableDiffusion】画像生成AI質問スレ19
https://mevius.5ch.net/test/read.cgi/cg/1697439745/ >>314
1番上以外全部知らないモデルだ
教えてくれてありがとう試してみるわ
こういうお勧めモデルの話をもっとしよう というか皆どうやってモデル探しているの?
ググっても似たような記事ばっかだし civitai眺めたりなんjで貼られるのみてよさげなの探してる >>319
ぐぐるときにサイトつけるとサイト内文字列検索してくれるからそんな感じで >>321
stepを下げすぎたからじゃないかなあ civitaiで一週間のダウンロードの多いcheckpointは人気があるし、定番以外も続々出てくる
Real Spice v2 とか好き >>323
自決した
なんかモデルを選択し直したら治った
他は弄ってないのに何だったんだろ 皆civitaiからモデル探しているのか
教えてくれてありがとう 稀にだけど動作がおかしくなることはよくある
たいていは再起動すれば治る
過去にはPCを再起動しないとグラボが作動しない症状に遭遇したこともあった Civitai helperでモデルのバージョンチェックするとAniimergeのNew version V2.5って出るんだけどModel not foundになる
一回だけ更新ページを見たような気もするけど幻かも SDで自分で生成した画像をもとに質のいいloraって作れる? >>330
まぁよくある
一度上げてからすぐ取り消したり
> 718 :名無しさん@お腹いっぱい。[sage] 投稿日:2023/11/13(月) 17:11:13.12 ID:MHHKdzpn
> すみませんこのkoloとかいうモデルお持ちの方いらっしゃいましたらください!
> あとでダウンロードしようと思っていま見たら消えてたんです >>56
newmarsmix_r2だけど個人的には再現度90%ぐらいで概ね満足してた顔LoRAでよく使うネガティブプロンプトをそれに変えたら全く似つかない別人になってしまった
ネガティブプロンプトの影響力恐ろしや 一見顔に関係なさそうなプロンプトでも顔に影響はある
体位Loraとかも何故かすげえ顔変えるんだよね
ADetailerは最終処理なのでこれ使えば
顔に影響を与えるプロンプトとかLoraを無視して修正できる
ADetailer側のプロンプトに顔に影響与えそうな
プロンプトを入れれば良い
表情とか年齢とかキャラLoraとか >>339
> ADetailerは最終処理なのでこれ使えば
> 顔に影響を与えるプロンプトとかLoraを無視して修正できる
ああこれ気づかなかった、空欄にしてたわ
顔をダメにするLoraだけ抜いて書いとけばいいんだ >>340
そうだなADetailer側には
顔に悪影響与えるとか無関係な
プロンプトとかLoraは加えない
何も入れずにいると通常の
プロンプトをそのままADetailer側に適応される 自作Loraで学習元が漫画やアニメだと手がぐちゃぐちゃになるのがあるんだけど
hand修正でLora部分だけ抜いとけばいいんだ・・これはかなりの開眼かもしれんthx civitaiよぉ……
ダウンロードと生成ボタンはどっちかに固定しとけや!!!!!!!
モデルによって左右逆にしてんじゃねえよ!!!!!!
全ユーザーが思ってること代弁しとくわ Seaart.ai で生成した画像のダウンロードについて質問です。
有料のSVIP(年間プラン)のスタンダードプランに加入しており、
受けられるサービスの一つに「一括ダウンロード」がありますが、
どこを探しても一括ダウンロードできるような項目が見当たりません。
サイト内のAIチャットに質問したところ、以下のような返答がありました。
スタンダードプランの一括ダウンロード機能を使用すると、生成された画像をまとめてダウンロードすることができます。
以下の手順で一括ダウンロードを行うことができます。
ダッシュボードにログインします。
1. 画面上部やメニューから「一括ダウンロード」などの選択肢を探します。具体的な場所は、
サービスのインターフェースによって異なる場合がありますので、画面上の案内に従ってください。
2. 一括ダウンロードのページに移動すると、ダウンロードする画像の範囲を指定するオプションが表示されます。
例えば、特定の日付範囲や特定のタグなどを選択することができます。
3. ダウンロードオプションを選択したら、ダウンロードボタンをクリックします。
4. サーバ側で画像の準備が完了すると、一括ダウンロードが実行されます。
このプロセスには数秒から数分かかる場合がありますので、お待ちください。
5. ダウンロードが完了すると、通常はダウンロードリンクが表示されます。
このリンクをクリックして、一括ダウンロードされたファイルを取得します。
6. ダウンロードしたファイルは、お使いのコンピュータやデバイスに保存されます。
7. 一括ダウンロード機能を使用することで、複数の画像を手間なくまとめてダウンロードすることができます。
しかし「一括ダウンロード」の項目はありません。
Seaartに詳しい方いましたら、一括ダウンロードの方法を教えてください。
よろしくお願いします。 SDで生成を一時停止する方法ってありますか?
Prompts from file or textboxで数千行のプロンプトを入れているため、ブラウザのInterrup(中断)はあまり使いたくないです。
コマンドプロンプト自体を直接中断(Pauseやクリック等)する方法は高確率でWindowsがフリーズしてしまいます。 >Prompts from file or textboxで数千行のプロンプトを入れている
そんなことできるんだ
ちゃんと反映されるのかね >>346
生成自体は1万行超えても全行問題なく動いてる。
すべての生成が終わったタイミングでコマンドプロンプトが固まったりするけど(多分だけど、生成結果が多すぎてブラウザのサムネイル表示時に固まってる) >>347
Always save all generated images grids のチェック外しじゃ駄目なのか? プロンプトは最小限が基本だよ全部は実行できない
人間で言うと飯食いながら同時に歯磨きして
うがいしながらジュース飲んでるみたいなもんだよ
5chで言うと長文にするほど誰も読まなくなる >>349
ワロタw
その秀逸な例えに座布団1枚進呈しよう 正直もう一枚絵ならプロンプトはこねくり回す必要ないけど
動画を見据えて研鑽してる人が大半ちゃうの >コマンドプロンプト自体を直接中断(Pauseやクリック等)する方法は高確率でWindowsがフリーズ
Windows95かな? >>348
実はその設定にしてから数千行以上のコードを出力し切ったことないんよね
数千行のコードは数十時間かかるし、その間に新しいプロンプト試したくなって以下の繰り返しだったから
数千行処理のコマンドプロンプト自体を一時停止→別のポートで新しいプロンプト試す→数千行処理のコマンドプロンプト再開→Windows(正確にはdwm.exe)がクラッシュしてWindows再起動
>>349
Prompts from file or textboxは1行ごとに画像出力するから、食事も歯磨きもうがいもジュースもそれぞれの行で独立できるぞ >>352
WIndows11です…
コマンドプロンプトを一時停止した程度でWindowsがフリーズするなんて思わんかったけど、
コマンドプロンプト一時停止解除後に同様のクラッシュ4回くらい続いてるのよね。
コマンドプロンプト一時停止をする前まではこの類のクラッシュ1度もなかったし。 一度に生成する画像が多すぎるのも原因じゃないのか? >>355
その可能性もあるけど、自分の環境で1万行オーバーの処理は結構な回数やり切ってるよ
それで怪しい挙動なしだからクラッシュの原因は一時停止だと思う 数百行の時に同様の操作を行ってフリーズしないなら、数千行ではSD切替の負荷にPCが耐えられていないかもね 中断頻度多いなら最初から短時間で終わるよう出力件数抑えるほうが手っ取り早いと思うぞ メモリリーク的なことが起きてるのかもしれないけど本体と拡張機能どっちが原因かもわからんし、とりあえず1ファイルあたりの件数減らして様子見たら? >>353
>Prompts from file or textboxは1行ごとに画像出力する
ほほう、そういうものなのか
ダイナミックプロンプトみたいなもんか GPUがおかしいとか?
CPUにGPUついてたらマザーボードから画面出力してみたら colab無料枠でのweb UI規制って一時的なもんじゃないんだな。
対策版のライブラリも出てこないし大人しく課金するか。 何でスラッシュするかという問題があるので難度は高そう >>353
グラボは? VRAM何GBのモデルなんだろう?
単に交互に実行してるのでVRAMが足らなくなってdwmがウィンドウ切り替えの為のVRAMが無くなって固まってると予想 温度も見張ってるけど、ずっと70~80度ぐらいで安定してるのよね。
一番の疑問点は14700KF搭載のPCがクラッシュしまくってて9700KのPCが終始安定して動いている部分だ。(どちらも4070tiで運用方法もほぼ同じ)
てか一時停止せんでもついさっきdwm.exeがクラッシュしてファンが爆音になって強制再起かけた…
とりあえずNvidiaのドライバクリーンインストールとシステムファイル破損のチェックしてきたけど、根本的な原因がわからん >>366
>温度も見張ってる
ソレだな
見張っちゃダメ、見守らないと 生成時のVRAMの使用量がVRAM+共有VRAM(RAMの空き)を超えてSSDにスワップして
激重になってるのをフリーズと勘違いしているとかもありそう。
実行中のタスクマネージャーのVRAMと共有VRAMとメモリ使用量はどうなってるか。 タスクマネージャー見てきたが、
14700KFのPCは専用GPUメモリ8.2/12GBだったけど、9700KのPCは3.4/12GBだったわ
どっちも似たような運用なのに結構差があるからもしかしたら瞬間的にオーバーしてクラッシュしてるのかもしれん
一応激重になってる状態かもしれないと思って10分放置はやってみたが、状況全く変わらんかった。(ファンが爆音で回ってる中待ち続けるのは心臓に悪かった…) >>370
それ以外全く同じではないということだろう
その差を見ればよろしいんではないか >>366
んじゃOSクリーンインストールして最小限のSD環境で試して再現するならハード、しなけりゃ競合起こすなにかがソフト側にいるってことだな 俺エスパー
366しか読んでないけど9700Kで使ってたのをそのまま14700Kに移植しておかしくなってると予想 >>345
一時停止する方法は無いよ
できるのは中断のみ Loraが絵柄に影響与えすぎるのってどうしてますか?
強調0.9とかちょっとずつ下げていってもLoraの効果が出なくなるし困ったもんだ >>376
構成の推移はちょっと複雑で以下の状態
元々の構成
14700K(BTO付属4070ti)
9700K(2070SUPER)
現在の構成
14700K(新品で別途購入した4070tiと2070SUPER)
9700K(BTO付属4070ti)
1回目のdwmクラッシュで2070SUPERは画像生成には使わないようにしてる。
本当は14700KにBTO付属の4070tiをそのまま積んでおきたかったけど、
別途購入の4070tiがやや大きめで9700KのPCケースに入らなかったから仕方なく14700KのPCに積んだ >>379
それはさ~
2つグラボ入れてるケースの排熱が壊滅してるんじゃない? >>378
LoRA弱めつつプロンプトを強める
Pose系LoraならOpenPoseで代用かな
>>380
その辺も気にして組んだんだけどなあ
一応、OCCTのストレステストでいろいろ見てるけどCPUもGPUも温度安定してるし、
温度がやばかったらdwmクラッシュする前にファンが爆音になってるはず(今回起きている障害はdwmクラッシュしてからファンが爆音になる) LoRA学習ってやっぱりxformers使用だと再現性無いのかな?
同じところからresumeしてseed値、設定同じで画像セットも同じはずなのになんか毎回微妙に違う
良さげな出力のstate消しちゃって世代遡って同じものが再現できるかやってみたが無理っぽいね。 ambientmix https://huggingface.co/OedoSoldier/ambientmix
について質問ですが License:creativeml-openrail-m では商用利用可能ですが
https://civitai.com/models/26622 には上記ライセンスとマークを見ると
商用利用不可のような記号が併記されています。商用利用はどうなんでしょう? >>386
作者に聞くのがいいだろうけれど
とりあえず商業利用しない方がいいね >>386
> License:creativeml-openrail-m
ここらの表記はめっちゃいい加減だとか、他人の真似してコピーしてるだけかも
filesにlicense.txt置いてないのは危ないって話も
実写系は大丈夫なモデルがいくつかあるみたいだけど
二次元はNAI流出モデルが高確率で入ってるので商用利用は危ないね
今現在商売してる輩は裁判上等orただの無知みたいな印象 >>379
dwmがクラッシュてのは珍しいね
メモリ境界越えてるとかかな
排他的ロックやらで他のアプリがアクセスできなくて、とか >>389
メモリ使用量の違いが出るってことは、管理把握できていないメモリ量がどっちかにあるかも >>381
WSL2で4090でメインメモリ128GBでWSL2に90GB割り当ててるけど、一度もクラッシュなんて無いな~
まあ、症状的にメインメモリ不足だろうね
あとGPUドライバは最新が必ずしも良い訳ではないよ
https://www.nichepcgamer.com/archives/geforce-driver-issue-546-17.html
RTX 2000シリーズにおいて、『ハードウェアアクセラレータによるGPUスケジューリング』(HAGS)とSLIの両方が有効の場合、PCがランダムにフリーズする場合があります >>387
>>388
答えてくれてありがとうー
このスレアプリとかから見えないんだね。
NAIで5$使ってみたけど、変なのも出てくるね。
変なプロンプト書くとstable diffusion も、NAIも良さげなのが出てくるな。奥が深いな。 Latent Coupleでそれぞれ二人の女の子に別のloraを適用したいのですが中々うまくいきません
loraなしのプロンプトや一人だけloraを適用するのは問題ないのですがそれぞれのloraをいれると破綻して2つのloraの特徴が混ざった子が一人生成されてしまうような状態です
何か解決策等ありますでしょうか? \( \)
これ使ってるローラ見かけるけどどういう意味なんですかね
タイトル名?スラッシュ使う意味がいまいちわかりません教えてください >>394
そのケースはかなり難しいと思う
私なら無理と割り切って一人づつ別画像で生成
フォトショ等で合成する >>394
Regional Prompterを使う
>>395
意味合い的には (hoge:1.23) みたいな重みづけ表記と区別するために使われる
スラッシュを使う理由は文字列 エスケープとかでググってくれ ComfyUIを使うメリットについて教えてください。
処理が可視化される、1111と比べて省メモリ・生成速度が速い辺りはそうだと思いますが、
表現の幅が広がったりするんでしょうか AI漫画描きたいと思っていますけど相当難しいですね。
キャラがこっちに向かないようにする方法ってあるのでしょうか。
こっちに向かないというか、向かせたい方向を指定するor大量生産してそこそこの確率で一部出てくる方法を知りたいです。
ちゃんとスマホを見て欲しいのに→スマホの販売員みたいにスマホもってアピールしてくる…
特定の相手見て欲しいのに→こっち見てくる…
勉強で本を読んで欲しいのに→こっち見てくる…
ご存じの方いらっしゃいましたら教えていただけますと幸いです。 >>394
AIは入力された要素を全部ごちゃまぜにミックスする仕様なので無理です
どうしてもというならキャラを別々に出力して画像編集とかi2iするしかない >>399
まず英語の辞書を買うと良いよ
そして英語でこっちを見てくださいとネガに入れる
横向き、後ろ姿の学習されてないモデルはいくら頑張っても崩れるからそのつもりで >>399
Stable Diffusionのモデルの多くは「こちらを見る」のプロンプトは「looking at viewer」が効きます
これをネガティブプロンプトに入れる、それでもこっちを見てくるなら強調する((looking at viewer:1.5)など) >>399
プロンプト not looking at viewer
ネガティブプロンプト looking at viewer >>402
ありがとうございます。ネガティブという発想はなかったので参考にしてみます。
ポジティブで以下のワードで頑張っていました。
looking at viewer
(looking up:1.2)
(looking down:1.2)
looking side
looking back
(looking away:1.4) >>399
ネガティブに low quality やembedding等による簡易ネガが入っているならそれをやめる >>399
絶対確実なコントロール方法はない
当たり前だが通常のモデルは圧倒的にこっち見てる写真で学習してるのでどうしても強い
一般的には向かせたい方向にプラスを入れつつ、向かせたくない方向をネガに入れる
あとは視線系プロンプトでイレースLECOを使うとか
NegPiPで向いてほしくない視線をマイナス強調とか
狙って探したことは無いけど視線系のLolaとかあるんじゃないかな。 質問連投なのですが、dynamic promptみたいに、自動で大量のいろんなポーズやシチュエーションを出すようにしたいです。
しかし、txt to imageでは、ポーズに特化して考えた場合、あまり良い成果が出ていません。
そこで、image to imageとかopen poseとか次々に読み込ませて
いろんなポーズを出す方法ってありますでしょうか。
朝から生成して、夕方に帰ってきたらいっぱいポーズできてて、そこから選んで漫画に使えるようにしたいです。
漫画作るときの悩みって、同一性(角度が変わっても同じキャラ、同じ服装、同じ場所)の確保と、同じ構図の連発を回避することですよね…。 >>398
あれこれ整っていて設定等も簡単なA1111と比べると一長一短ではあるが
自分で処理の順番を決められることによってやれることの幅は増える
一例として背景と前景(キャラ等)を別々に出力して保存しながらも最終的にはマージする、みたいな >>406
おっしゃる通りです。
映画とかアニメとかシーンを切り取った画像の学習が足りてない気がします。
Loraに興味があるので考えてみます。 >>406
おっしゃる通りです。
映画とかアニメとかシーンを切り取った画像の学習が足りてない気がします。
Loraに興味があるので考えてみます。 >>407
ランダムなプロンプトでいろいろな画像を大量に出すならdynamic promptsという拡張機能がよいです
それからGenerateボタンを右クリックしてGenerate Foreverを選ぶともう一度同じメニューを選ぶまで生成し続ける
生成中にプロンプトやパラメータを変えることもできる
マンガ制作についてはこれが参考になるかも
ヒツジ先生の「AIイラストで成人向けマンガを作ろう」が実践的かつわかりやすい - Togetter https://togetter.com/li/2128341
(作中Wildcardsと書かれているのがdynamic prompts) >>408
ありがとうございます。ちょうどやりかったことかもしれません >>411
ありあgとうございます
dynamic promptsは良く使っています(そしてよくとまっていますが…)
使い方がうまくないのか、あんまり漫画向けの典型的な姿勢がでてこず、似たポーズばっかりでてきて悩んでました
例えば、大量にあるフォルダに画像を放り込んでおくと、
ひたすらイメージtoイメージしてくれたり、大量の棒人間ファイルを順次読み込んでopen poseを適用してくれたり
するのが欲しいです google colabでよく出る
The future belongs to a different loop than the one specified as the loop argument
の連発何なんだろう…調子悪いと1日使ってしまう >>399
単語を羅列するんじゃなくて文章にした方が言う事効きやすい気がするね
例
=====
prompt:
(master piece:1.4),
(best quality:1.4),
One beautiful girl is sitting on a park bench looking at her smart phone. The girl has short blonde hair, wears a T-shirt and hot pants, and sneakers.
(1girl,solo:1.5),
(two shot:-1.5),
(full body:1.4),
(look at viewer:-1.5),
(look at smart phone:1.5),
<lora:LCM LoRA SD1.5(pytorch_lora_weights):1>
Negative prompt:
EasyNegative,
(worst quality:1.4),
(low quality:1.4),
(look at viewer:1.5),
(two shot:1.5),
=====
https://i.imgur.com/U27VSeF.jpg AIイラストで漫画って背景も服も細かいとこ毎回変わるだろ Lora作成について質問になります
Kohya_ss GUI v22.2.1でのLora作成に失敗してしまいログを確認したところエラーが出ていたのですが、
このエラー内容が失敗の原因になるのでしょうか
実行後は4KBのjsonファイルのみ作成される状態となります
21:42:07-951883 ERROR The following folders do not match the required pattern <number>_<text>:
C:\AI_illust\lora\lora_output
21:42:07-952885 ERROR Please follow the folder structure documentation found at docs\image_folder_structure.md ...
これまでの箇所は調べて何とか解決できたのですがLora作成はどこを直せばいいのか全くわかりませんでした… ■ このスレッドは過去ログ倉庫に格納されています