【StableDiffusion】画像生成AI質問スレ15
■ このスレッドは過去ログ倉庫に格納されています
Stable Diffusionをはじめとする画像生成AIに関する質問用のスレッドです。 次スレは>>950 が立ててください。 質問する人はなるべく情報開示してください ・使っているアプリケーション(1111ならローカルかcolabか、ローカルならどこから/何を読んでインストールしたか、colabならノートブックのURLも)や使っている学習モデル ・状況の説明は具体的に。「以前と違う画像が出力される」「変になった」では回答しようがない。どう違うのか、どう変なのかを書く ・状況やエラーメッセージを示すキャプチャ画像 ・ローカルならマシンの構成(GPUの種類とVRAM容量は必須、本体メモリの容量やCPUもなるべく) テンプレは>>2 以降に ※前スレ 【StableDiffusion】画像生成AI質問スレ14 https://mevius.5ch.net/test/read.cgi/cg/1688234958/ ■AUTOMATIC1111/Stable Diffusion WebUI https://github.com/AUTOMATIC1111/stable-diffusion-webui パソコン上だけで(ローカルで)画像を生成できるプログラムのデファクトスタンダード。実行にはパソコンにNVIDIA製のGPUが必要 導入方法1 https://seesaawiki.jp/nai_ch/d/%a5%ed%a1%bc%a5%ab%a5%eb%a4%ce%c6%b3%c6%fe%ca%fd%cb%a1 導入方法2 https://github.com/AUTOMATIC1111/stable-diffusion-webui/releases/tag/v1.0.0-pre zipを解凍→update.batを実行→run.batを実行、でインストールされる。学習モデルはSD1.5が自動でダウンロードされる ■ブラウザなどで画像生成できるサービスの例 https://novelai.net/ 有料。アニメ、マンガ風のイラストを手軽に生成できる https://nijijourney.com/ja/ 日本語プロンプト可。最初の25枚は無料。特徴は同上 https://memeplex.app/ 日本語プロンプト可。モデルはSD1.5/2.0(2.1ではない)、OpenJourneyなど。学習機能を利用できるなどのサブスクあり https://www.mage.space/ 基本無料。SD公式以外のモデルを使う場合有料。googleアカウントでログインすればSD2.1も使える。サブスクならWaifuやAnything v3なども使える。生成できる画像はSD2.1でも512x512のみ https://lexica.art/aperture Lexica Apertureという独自モデル。生成できる画像は正方形だと640×640まで。無料で生成できる枚数は月100枚まで https://www.stable-diffusion.click/ Waifu1.2/1.3、trinart2を使える https://page.line.me/877ieiqs LINEから日本語で画像生成。無料だと1日2枚まで ■FAQ Q1:ローカル(パソコンで生成)とGoogle Colaboratoryやpaperspace、Modalなどのクラウド実行環境、どちらがいい? A1:ローカルは利用時間の制限がなく、エロも生成し放題だがNVIDIAのグラボが必要。クラウド実行環境はエロ画像(特に幼児)の生成でBANされる可能性がある Q2:ローカル環境でパソコンの性能はどのくらいがいい? A2:グラボはなるべく3060 12GBから。VRAM容量が大事。CPUの性能はほどほどでよい。本体メモリは最低16GB。ストレージはNVMe SSDのような早いものにするとモデルの切り換えにストレスが少ない。本体の置き場所と画像の出力先はHDDでもよい Q3:NMKDと1111、どちらをインストールしたらいい? A3:NMKDはインストールは楽だが機能とユーザー数が少ない。1111がおすすめ Q4:画像を出力したら色が薄い、または彩度が低い A4:VAEが適用されていない可能性がある。1111なら設定(settings)−UI設定(User Interface)−クイック設定(Quicksettings list)に「, sd_vae」を追加するとVAEの切り換えが楽になる ■AUTOMATIC1111版Stable Diffusion WebUIについてのFAQ Q1:自分の環境で使える? A1:利用は無料なのでインストールしてみるとよい。インストール方法は>2参照。省メモリの設定は以下を参照 https://seesaawiki.jp/nai_ch/d/%a5%ed%a1%bc%a5%ab%a5%eb%a4%cewebui-user.bat Q2:起動時の初期値や数値の増減量を変えたい A2:1111をインストールしたフォルダにある「ui-config.json」を編集 Q3:作りすぎたスタイルを整理したい A3:1111をインストールしたフォルダにある「styles.csv」を編集 Q4:出力するごとに生成ボタンをクリックするのがわずらわしい A4:生成ボタンを右クリックし「Generate Forever」を選択。バッチと異なり出力中にプロンプトやパラメータを変更可能。止めるには生成ボタンを再度右クリックして止める Q5:アニメ顔を出力したら目鼻がなんか気持ち悪い A5:「顔の修復(restore faces)」をオフにする。「顔の修復」は実写の顔の修復専用 Q6:設定を変更したのに反映されない A6:設定変更後はページトップの「変更を反映(Apply)」ボタンのクリックを忘れずに。「再起動が必要」と書かれていても「UIの再読み込み(Reload UI)」ボタンのクリックですむものも多い Q7:消去したプロンプトがまだ効いている気がする A7:報告は多数ありおそらくバグだが、確たる原因や解消方法はわかっていない。影響をなくすにはWebUIの再起動や、まったく別の画像をPNG Infoから読み込んで再生成するなどが提案されている 【CLIP設定ってどうしたらいい?】 イラスト系モデルならCLIP2、リアル系はCLIP1とCLIP2の両方を試してみる 【そもそもCLIPって何?】 ざっくり簡単に言うと、プロンプトから受け取ったテキスト情報を層ごとに処理して画像を生成するという、Stablediffusionが採用してる処理方式のこと CLIP1設定なら『最後から1番目の層まで処理(※ようは最終層まで処理)してから画像生成』という設定であり、SD1.x系モデルはそれが標準設定となっていた その後、StableDiffusionをベースにしているNovelAIというお絵描きAIサービスが『最後から2番目の層で処理を止めて(※ようは最終CLIPを省略)画像を生成』という特殊な追加学習方法を実施 これは最終層で処理されるノイズなどの情報を省略することで、イラスト絵の再現度を上げるためであり、この方式で学習したモデルの場合はCLIP2設定ののほうがプロンプトの反映が正確になるとのこと そしてご存知の通りNovelAIが作ったモデルはネットに流出して各モデルへと派生、よってNovelAIを源流とするイラスト系モデルは基本的にはCLIP2設定が推奨となっている 実写系モデルは暫くは公式準拠でCLIP1を推奨していたが、最近の実写系モデルにもNovelAIが混ざっていることもあり、推奨設定が1か2かはモデルごとに違うとしか言えない またCLIPskipは結果的にプロンプト処理の一部を省略するため、モデルによってはCLIP2設定よりもCLIP1設定のほうがプロンプトの効き自体が良くなることもある ちなみに現在StableDiffusion公式モデル最新版であるv2.1はCLIP2が標準設定になっている もちろんだがどのモデルもCLIP設定は自由に変更でき、また1か2でないと出せない絵柄というのもあるので、両方試しつつ好みの絵柄を探ってみるのが良い と思われる ただ、CLIPを飛ばし続けるとどんどんプロンプトを無視していくので、仕様的にも2までにしておくのが無難である 取敢えずそのままコピペしたがテンプレが長すぎだろと思った グダグダ自己満足のための説明が長いオナニーが続いていて要点が分かりづらい RTX 4090 一択 なんだよね SDXLのLoRA(1024)のVRAM使用量(ざっくりタスクマネージャ調べ) キャッシュなし・バッチ1:23.5GB キャッシュ有り・バッチ1:11.7GB キャッシュ有り・バッチ2:12.6GB キャッシュ有り・バッチ4:14.0GB キャッシュ有り・バッチ8:17.2GB 質問失礼します。SD初めて1週間程度の初心者ですが、どのModelを使用しても同じ顔しか出てこないので滅入っています。 傾向としては特定のloraを一度使用すると、それをやめてもずっと影響を与えていてアプリ、PC再起動でも治らず。 半日シャットダウン放置で治ったりしますが、またそのloraを使うと再現します。 ちなみにclonecleanerを使用しても顔が変わらず、プロンプトで年齢指定しても年も変わらず、ずっと同じ顔(人)にしかなりません。よろしくお願いします。 >>14 具体的に画像を示してほしいかな catbox.moeに上げれば画像内のメタデータが消えないから、ここの人たちでどんなプロンプトやパラメータを使っているのか検証できるし >>14 SEEDを固定しているとか? clonecleanerという拡張を使ってそうなります? >>14 と書いてから考えたんですが、「シード」の下に「設定を上書き(Override settings)」が出ていませんか これが出ていると、設定をいくら変えてもそちらが優先されます クリックすると消えます PNG Infoから「txt2imgへ転送」すると、そのときtxt2imgと異なる設定値があった場合「設定を上書き」が出てきます 現在のtxt2imgの設定を使うか、PNG Infoの値を使うかどうか選べる機能です ControlNetのinpaint_onlyとADetailerの併用って出来ないんだろうか VRAM使用量も5GB程度なのに下記エラーが出て止まってしまう modules.devices.NansException: A tensor with all NaNs was produced in Unet. This could be either because there's not enough precision to represent the picture, or because your video card does not support half type. Try setting the "Upcast cross attention layer to float32" option in Settings > Stable Diffusion or using the --no-half commandline argument to fix this. Use --disable-nan-check commandline argument to disable this check. ・RTX3060 12GB ・webUI 1.4.0 ・ControlNet v1.1.231 ・ADetailer v23.7.3 ・設定の「Cross Attention レイヤーを float32 にアップキャスト」にチェックを入れる/--no-halfも効果なし ・face_yolov8n/s両方でエラー ・txt2imgにて ttps://www.pixiv.net/artworks/108779568 このイラストなんのモデル使ってるかわかる人いますか? >>18 ウチの環境だと何の問題もなく使えてるな エラーで検索するといろいろな対処法あったから単一の原因と対処で終わる話ではないのかも >>19 Loraはあまりにまんまだからわかるよね?w モデルは適当に2.5D系の選べば出来そうだが 14です。catbox.moeに上げさせていただきました。 先生方どうぞよろしくお願い致します。。 https://files.catbox.moe/376e50.zip 誰がわざわざzipを解凍して中身チェックしてくれると思うんだよ ControlNetで編集するときに画像読み込ませるエリアって通常だとやたら小さく表示されるけど これってどこで設定変更して大きくできるんだろう? >>25 別々のmodelでもseed値ランダムでも同じ顔になってことを伝えたかったので3枚でzipにしました。 1枚のほうがいいでしょうか? >>14 新しいディレクトリにpullしてきてそのlora入れないで使ったら何の問題も無い? png画像が3枚だね、変なものは入ってないからわかる人見てあげて 女性の顔6枚が3モデル分、同一プロンプトの”別seed”でそれぞれあったけどその女性が同じ人物に見えるってこと? 当然画像は全部違ったが、実写系詳しくないのでよくわからない あとpromptにLoraらしき表記は見当たらないから外した時ってことなのか >>22 そもそもの問題である「特定のLoRA」は一体なんなんだ? 画像見た限りはプロンプトで方向寄せてるし似たようなモデルデータで プロンプトガチガチだからそりゃそっくりな顔しかでないようんって感じ >>27 git pullしたら少し更新が入ってその後、生成してみたら今までと違う顔がでました! しかし試しにBRAV6でやってみたらまたzip画像の顔ばっかりの元通りになってしまいました・・・。 再インストのようなリセット行為をすれば一時的に治るような印象はあります。 BRAV6もう触らないほうがいいのかもしれません・・・。 >>28 ありがとうございます。参考画像はキラキラしてて同じに見えにくいですが全身とか引きだと露骨に同じになります。 Loraは外してますが、今はLora関係なく同一人物しか出ませんでした。 >>32 同じじゃなくて同じような顔はnegative promptにEazyNegativeやら何やら沢山積むことでpromptで指示してもあまり変わらなくなるからnegative promptの指定を全部消してみては >>34 自分には数枚が似た顔に見えるけれど同一には見えない。 ADteailer使ってADteailerのpromptにangryとか入れると表情大きく変わりそう >>36 顔を詳細に描かせるという意味でもADteailerを使った方が良いかも 同じモデルから派生したマージだから似てるだけってことはないの? ちょっと前にハローアスカと同じプロンプトで似てるのが出るのでcheckpoint取り下げた騒動あったけど breakdroシリーズとか 連投すいません。。 太眉の顔縦長の中国風美人のことなんですよね。 一度こうなるとkisaragimixとか他のmodelでやっても この顔に引っ張られて全部ほぼコレになってしまうんですよね。 おっとそろそろ時間が・・・。 ローカル更新したり、ガチガチなNG弱めたりすると明らかに違う系統の顔が見られ、改善傾向が見えてきました感謝です。 >>41 ADteailerのpromptにalice とかaoiとかの名前入れても顔立ち変わります。 NP弱めた状態でclonecleaner使えば顔立ち変わり、そのPNG infoみるとそういう名前が入っています どなたかXYZでモデルを一覧検証しているサイトを知っていますか? 検証結果をお持ちでしたら「貼ってください >>18 Use --disable-nan-check commandline argument to disable this check. の方じゃないか? 唐突にtcmallc:283でAttempt to invalid pointerってエラーが出るようになって起動しなくなったんだけど原因誰かわかる人いない? ググってはみたんだけど解決方法になりそうなのは無かった メモリ関連っぽいからインスタンス再起動もしたけどダメ >>18 どっかでみたエラーだな・・・ VAE入りのモデルを間違えてVAEフォルダに入れてVAE指定してしまっていたときか ADetailerが顔や手が一個もねーから処理できねーだろばかやろうって怒られてた時か・・ ちょっとわかんねぇなw AIはじめようと思っている初心者なのですが、 AIで使用するグラフィックボードにモニター接続せず、 Windows10のGPU振り当て機能で利用する事はできますか? (モニターはCPU内蔵GPUに接続するので) これでモニター一枚で済むのと、VRAM使用料を限りなくAIに使えると思ったので ご回答おねがいします 〇 GPU割り当て機能 〇 VRAM使用量 × GPU振り当て機能 × VRAM使用料 誤字失礼しました 参考 アプリごとに利用GPUを選択可能になったWindows 10プレビュー版 pc.watch.impress.co.jp/docs/news/1270691.html 警告音がなるけどグラボとしては機能していて使えるもよう Win側の設定はディスプレイ設定の複製で大丈夫っぽい >>46 Google colabのPython3の実行環境使ってる 配布されてる起動スクリプト利用して起動してるからそれの問題かと思ったけど、別の人が配布したので起動しても結局同じエラーに行き着くから参ってる >>54 だけどTwitter調べたら同じ問題起きてる人たくさんいたからColabの問題っぽかった クラウド任せだとメンテナンスもコストも不要で楽かと思ってたけどこんな罠があるんだな…でも物理マシン家に持ちたくないんだよな… >>55 同じので困ってる人居るかもしれないからLastBen使ってる人向け回避策 他の起動スクリプトでもエラー出てたからだいたい似たようなコードで他も起動してるだろうし参考になれば https://github.com/TheLastBen/fast-stable-diffusion/issues/2343 >>32 v6はいい顔出すコツ掴むの難くない? 個人的にBRAはv5が傑作モデルだと思う >>57 たしかに日本人より中国韓国寄りな顔立ちが多くて色気のない美人ばっかりですね。v5よりデータ量少なかった気がするしポーズ指定も言うこと効きづらくてlora入れたら余計おかしくなってあんまり良くなさそうですね。 Reasional Prompter使ってキャラLORAを分離して2人の画像を生成してるんだが、一枚あたり20分ぐらいかかるんだがそんなもん?GPUは3060ti 前まで5分ぐらいで一枚生成できてたのに何かのアプデで急に遅くなった 顔面ドアップばっかり出るのどうって解決するの?プロンプトもきかないし LORAも別に偏ってるわけでもないのに 顔面ドアップばっかり出るのどうって解決するの?プロンプトもきかないし LORAも別に偏ってるわけでもないのに >>59 それVRAMの容量突破してRAM使ってるパターンでは? >>61 ネガティブにclose-upとかface? >>58 ADteailerに名前入れるの効く。 Aoiと入れと日本人っぽくなったり、Rashmiと入れると目がキリッとしたインドっぽさ出たり、Aliceとかも >>61 promptで部位を指定すると指定されたところを強調しようとするから顔面関係の指示をpromptに多用すると顔面アップが強固になって、full bodyとかupper bodyとかのショットの指示の影響力下がる。 顔面(眉毛、目、髪の毛なども)にかけた効いているかどうか微妙な品質関係の指示を減らしてみては >>62 あ、確かにグラボアップデートしてからかも。 ただ、ダウングレード以外でRAM使わないようにすることできるんですかね? >>64 aoiとか入れてみてもいつもの顔から変化ありませんでした。 pnginfoに名前出るって動画で教わりましたが自分が見て一度も名前書いてあったことないんですよね。 おかしいですよね。。。 >>68 二次系でも同じ? しばらく二次系とか外人とかぜんぜん違うのやってみたら >>68 使っている model が同じで prompt / negative prompt も同じなら同じような顔になるだろ… >>68 どのぐらいの差を期待するかではあるけれど、自分の場合はこのぐらいの差が出ます https://i.imgur.com/UinZh55.jpg SSDで生成してHDDに画像を保存する方法はどうすればできますか? AI生成っぽい顔を変えたいなら表情の指定とかした方が良いかも https://i.imgur.com/29nkXR6.jpg >>71 PromptもModel変えてもその顔で学習しちゃってるのかずっとその顔で雰囲気だけが変わるだけな感じです。 2.5次元のkisaragimixでやってもその顔をそのまま2.5次元になる感じです。 SD再インストしてもう二度とv6触らないでやってみようかなと思います。 BRAV6でも表情付けたりlora使って濡らしたりすれば変化は付けられた https://i.imgur.com/rXpPGFS.png おまえ等革ジャンに騙されて買うなよ MSI自ら「RTX 4060Ti 16GBは8GB版より遅い」とコメントし各国レビュアーが震撼 前代未聞 Nvidiaは未だノーコメント [169920436] https://greta.5ch.net/test/read.cgi/poverty/1689831478/ >>78 そんなこと言われたって RTX 4090が コストパフォーマンス最高 であることは変わらないし一択だもん 毎回起動すると 「koreanDollLikeness_v15.safetensors is not a safetensors file」 「youA_koreandoll.safetensors is not a safetensors file」 ってエラー出て怖いけど、どゆこと?… 中身はウイスル?… 基本fpsゲームありき SDXLなら4090一択 50XXはAIに低電圧化を学ばせろよな 電気代やべーのに 司令室のオペレータ席、社長室の社長席、飛行機の操縦席などに自分が座っているように見えるオンライン会議の背景を作りたいです 構図を指定するのにどういう言葉を入力したら良いでしょうか? Bing Image Creatorです 例えば飛行機だとこういう感じで、人物は無しでシートが中央に写っていて 自分がパイロットとして映る構図です https://pbs.twimg.com/media/EUVVGDcVAAEr6qi.jpg >>81 ダウンロードした時にファイルが壊れてるとか そのファイルは正常に作動しないはず ずっと二次絵ばかり作っていて久しぶりに過去に作った三次絵を見るとなかなか堪らん そして三次絵ばかり作るw 帰ってから色々やってみましたが、表情変えても同じ顔で笑ってるだけでした。 CloneCleanerあり https://files.catbox.moe/le1ckp.png ちちぷい等のサイトからprompt丸パクリしてもまったく違うのを目指しても、こっち系の顔に引っ張られる感じでした。 別に嫌いな顔じゃないし、もう諦めますかな。 ADetailerとかのオプション類を全部切ったら >>88 ADetailerオフ https://files.catbox.moe/z0s7ze.png controlnet等の難しいのはまだ扱えないので入れてません。 いつもの顔で心霊写真になるだけですね。ネガティブ削ると宇宙人になるだけ。 そもそもなんか色盲絵師というか日光で退色してるというかイエローだけ落ちたような変な色調なのはなんでなの? >> 87 警察が犯人の似顔絵を書くときは、顔の特徴を伝えるんだぞ 「可愛い顔で、アイドルっぽくて、美人な人」 とかで似顔絵かけると思うか? 具体的な指摘がないから同じような顔が出るんだろう 顔の輪郭は丸顔?細長い? 顎の形は? 目の大きさは? 一重?二重? ツリ目?垂れ目? 鼻は高い?低い?幅広い?大きい?小さい? 唇は大きい? 小さい? 厚い? 薄い? とかあるだろう Civitai で prompt lists とかで検索して顔の形状・特徴関係のパラメータを引っ張ってきて パラメータ Dynamic Prompts ランダムで入れるとかしてみたら? lohaだけ適用されないんだけど、どうしたら直るんだ…… loconの拡張はすでに消して、最新のリコリス拡張いれてるんだよね loraとか他の形式はいけるんだけど、lohaだけ適用されない >>94 ご指導ありです。また明日ぼちぼちやってみますわ。 新しいLORA何かないか見に行ったらリアルうんこのLORA見つけてさすがに笑ったけど 冷静になってこれどうやって使うといい感じにうんこしたイラスト生成できるんだろう >>98 生成過程が気になる。 素材はどうしたんだよ?とか >>87 BRAV6でなくchillout系に見えますね アニメ系のモデルだと垂れ目ツリ目は簡単に指定できるけど リアル系のモデルだとそれ系の効果のあるプロンプトがないんだよなぁ drooping eyesとか入れてもほとんど効果無い。それどころか謎な変な効果が出たりするしな 結局フォトレタッチソフトの歪みで変形させて、それを学習させてLoRAにしてるわ ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.5 2024/06/08 Walang Kapalit ★ | Donguri System Team 5ちゃんねる