【StableDiffusion】画像生成AI質問スレ21
■ このスレッドは過去ログ倉庫に格納されています
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512
↑スレ立て時にはこれを3行に増やしてください
Stable Diffusionをはじめとする画像生成AIに関する質問用のスレッドです。
次スレは>>970が立ててください。
質問する人はなるべく情報開示してください
・使っているアプリケーション(1111ならどこから/何を読んでインストールしたか)や使っている学習モデルを明記する
・状況の説明は具体的に。「以前と違う画像が出力される」「変になった」では回答しようがない。どう違うのか、どう変なのかを書く
・状況やエラーメッセージを示すキャプチャ画像や出力画像をアップロードする。出力画像はimgurではなく、catboxなどアップロード時に出力パラメータが残るサービスへ
・ローカルならマシンの構成(GPUの種類は必須、VRAM容量やメインメモリの容量、CPUの種類もなるべく)を書く
テンプレは https://rentry.co/aiimggenqa に
※前スレ
【StableDiffusion】画像生成AI質問スレ20
https://mevius.5ch.net/test/read.cgi/cg/1700315721/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured 自分も一回間違えた後、kohya_gui.pyにパッチあててDreamboithとLoRAのタグの順番入れ替えるようにした ドリームブースとLoRAのタブの中身が
レイアウトもパラメータがほとんど一緒というのが罠度高い
しかもデータの読み込みもLoRAのコンフィグを
ドリームブースのタブで読み込みしてもエラーにならなかったりトラップが複数あるw いやほんとにタブの中身ほぼ同じなんですね…
私も順番入れ替えるようにします、お騒がせしました 入れ替えって簡単にできるん?
kohya_gui.pyをエディタで開いて、それっぽいところを入れ替えてみたがエラー出て動かん kohya_gui.pyの以下の2行をDreamboothの上に移動しました。
with gr.Tab("LoRA"):
lora_tab(headless=headless) ちょいと質問
今PCIE3.0×16のPCで1650使ってるんだか、流石に時間がかかってしかたがないのでグラボ買い換えるつもりなんだ
ただ、PCIE3.0のマザボに本来PCIE4.0用の3060とか4070とか挿したときの生成スピードの低下がどの程度かわからなくてさ
グラボ内で計算するので大差ないのか
本体とのやりとり発生するので大幅に低下するか知ってる人いたら教えて欲しい
PCの買い換えまでとなると流石に貯蓄の切り崩しがでかいので避けたいんだかどうやろ >>278
ゲーム関係だと誤差みたいなもんとされてる >>278
俺PCI3.0に4060さしてるよ
計測してないけど、乗り換えたほうがいい 久しぶりにSD触ってるんだけども、LCM loraをa1111で使うには
1)lcmのloraを落としてくる(1.5用,XL用)
2)animatediff入れてサンプラーをLCM選択
3)プロンプトに<lora:対応LCMlora:1>追加 モデルや他loraは任意
4)CFG scaleを2くらい、step8くらいで生成
という感じで合ってますかね
他なんか足りない設定とかあるかな >278
うちはPCIe3に3090刺したけど1600系より次元が違うくらい早いわ。SDではグラボの速度が一番影響でかいで
俺の場合、現在金もそんなに無いしCPUがSandhiBridge-EPなんてクッソ骨董品だし、スロットはPCIe3だし、マザーやCPUの新調するべきか悩んだけど
一応メモリだけは百ギガ以上積んでるしCPUコアも16コアあるから、半分賭けで NVMe SSD + 3090でSD環境整えた。結果、費用対効果で正解だったわ
起動も生成も学習も以前の数倍早くなったし一度に大画像を複数生成できるようになった
CPU速くしたかわりに、余裕の無いSSDにwebui入れて安いグラボにしてたらメチャクチャ効率悪かっただろうな ありがと、どうやら3.0であることはそこまで気にしなくてもよさそうやね
早速グラボの方、週末にでも見てくるわ 古いPCだと電源がヤバいかもしれないから
3060Ti12GBか4060Ti16GBにしといたほうがいいよ
安いのはVRAMが少なかったりするからよく見るんだよ
お母さんとの約束だよ 4060Tiとかだとx8接続だから更に若干パフォーマンス低下はあるかもね
ゲームとかだと誤差と言えなくもない位だけどAI利用だとどうなんだろうね グラボ買い替えは予算が許すならVRAM16以上欲しいね
電源とセットで考えるのも大事 >>276
やっぱそこだよね。うまくいかないんだが
と思ってたら今なぜか成功した
何が間違っていたのかよくわからんな .pyはTABと半角全角スペースでめちゃくちゃになりがち
揃ってないとエラーになる
編集するときはメモ帳でなくコードエディタがいい Pythonはインデントの数がC言語のカッコに相当するからな
他の言語はインデントなんて単なる可読性のためだけど
Pythonだと実行内容に影響する
タブとスペースの混在もトラブルの元になりがち
なぜかというと大半のPythonプロジェクトはタブ一個をスペース4個と解釈するが、メモ帳だとタブ一個でスペース8個分インデントするから さすがにメモ帳はどうよ、VS Codeでいいじゃん いや俺はメモ帳使ってないけど別にプログラマだけがSDいじってるわけじゃ無いだろ・・ 最近は少し規模が大きいのはvscodeに移行しだしたが
テキストエディターとしてはちょっとマイナーなK2editorってのをずっと使ってる サクラエディタを30年近く使ってる
コード書いたのは10年ぶりくらいだけどちゃんとやるなら統合環境とか使うんでない
PythonはSD始めてから触ってみた感じVSCodeかColabでいいと思うけど マジレスするけど専用のソフトを使わない限りWindowsではBOMがつくだろ
python使えないじゃないか >>300
いまはメモ帳もデフォルトbom無しUTF-8だよ 289だけどサクラエディタを使ってますよ
半角スペースの有無で動かなくなるのはなんとなく知ってたけど、予想以上に厳密さが求められるんだな 質問失礼します
Kohya_LoRA_GUIで>>228と同じエラーが出るので--no_half_vaeを設定に加えたいのですが該当する項目が設定に見当たりません
Kohya_LoRA_GUIでは--no_half_vaeの設定はできないのでしょうか? グラボをSD用に購入しようと思うんですが
少し調べたら最近のドライバだとVRAM溢れてもメモリである程度代用できるらしいので
SDXLも8GB+RAMでもいけるんでしょうか?強烈に遅くなるなら16GBのを買おうかと迷ってます >>305
VRAMとメモリは速度が全然違います
8GBでもSDXL生成は可能ですが新規に買うなら12~16GB以上をおすすめします >>305
予算の許す限りでVRAM一番大きくてなるべく新しいものから選ぶといいぞ
XLメインなら16↑かな
12は予算の関係とか今使ってるから妥協するって感じ >>305
速度がいきなり2~5%とかに落ちるぞ、マジで。VRAMでやれば1分かからないくらいの生成が、VRAMからあふれると予想時間が15-30分とかになる
VRAM24ギガあって2~3ギガあふれただけなのにそれくらい速度が落ちるからな
GPUはメインメモリに直接アクセスできるわけじゃ無いから
CPUに頼んでデータを転送してもらわないとならないわけでそのオーバーヘッドがとてつもないんじゃね 帯域幅がボトルネックだったかな?
例えばRTX4090が1,008GB/sでメインメモリDDR5-7000(PC5-56000)なら56GB/s
その差18倍 メインメモリの帯域より低いPCIe経由でアクセスするわけだからそこが上限だな >>308
すみません
>>232-233はKohya_LoRA_GUIでは出来ないみたいです
AdvancedのAdditional parametersが見当たらないので >>311
PCIe3.0 16GB/s
PCIe4.0 32GB/s
PCIe5.0 64GB/s ---対応クラボが無い レスありがとうございます
想像以上に遅くなるようなので4060Tiぐらいを検討してみます >>316
上げられている画像のものとバージョンが違うのかパフォーマンスというタブではなかったのですが
SDXLというタブにVAEを32ビットで使用(--no_half_vae)がありました
ちゃんと探したつもりで見落としていたんですね…ハズカシイ
でもこれで学習が進められそうです
回答ありがとうございました! StableDiffusionを使ってみたくて、4060TI 16GBを買おうと思っているのですが、
CPUがceleron G6900でも使えそうでしょうか。
ベンチを見るとG6900はシングルでcore10世代、マルチで7世代程度の性能のようです。
CPUはあまり影響しないと見たのですが、celeronでも行けそうなのでしょうか。 >>321
そこまで低いと厳しそうだが
とりあえず使ってみればいいのではないか
不足するなら交換すれば >>321
メインメモリさえ32ギガ積んでいればとりあえず使えるとは思うが
普通に起動してるだけの状態でPythonが7ギガくらい食ってるしSD使ってるブラウザのタブもメモリ食うし今はWindowsもメモリ食いになってるから。
メインメモリ16ギガだとツラいと思う。絶対無理ってほどじゃないが
強いて言えばCPUが2コアだと画像生成中に他の事するのは無理。動画見たりとか >>318
それはWindows Notepadだ。
メモ帳(単独で動くnotepad.exe)ではない。 windows10以降でメモ帳かnotepad起動してみりゃ一発でわかるんだがアウアウウー Sa21-on57は何を見てるんだ >>324
メモ帳
メモ帳ではいくつかの変更がありました。
UTF-8エンコーディング
バイトオーダーマークなしでファイルを UTF-8 で保存するオプションが追加され、これが新しいファイルの既定となりました。 cpuは11世代以上のi7,メモリは32GB。
これが最適ライン。メモリは64GBをオススメ。
2万くらいだし投資の割に効果か高い。 メモ帳 = Windows Notepad = notepad.exe
単独とかどうとかじゃなくて古いWindowsシステムのパス用とそれ以降デフォルトで使う物が置いてあるので2つある
ずいぶん前に互換性は失われないとかなんとか記事出てた記憶あるわ すみません
StableDiffusionを使えるようRTX4070Tiに換装しようと思うんですが他のスペックは以下でも大丈夫でしょうか?
CPU:AMD Ryzen™7 3700X(3.6GHz-4.4GHz, L3 キャッシュ32MB , 8 コア/16 スレッド)
メモリ:DDR4 16G×2(8G×2から換装予定)
電源:500w
電源がちょっと不安ですが
これで普通に使える程度にはなりますでしょうか? 電源やばくね?
PCの組み合わせについてなら自作PC板で聞いたほうが良い。
それか必要電源計算してくれるサイトあるから確認しといたら 4070Tiの推奨電源容量は750Wだからやめといたほうがいい
それなら4060Ti/16GBにしとくのが無難(550W推奨だけど)
ついでにいえば4070Ti SUPERが出たばかりで
これから値下がりすると思うから待った方がいい >>330
電源以外はいい感じ
欲を言えばメインメモリは64GB欲しいが上を見たらきりがないし >>331-333
有難う
結論としてはやっぱ電源も750wに替えつつちょっと待って買えば良いんだな
因みにメインメモリはマザボの上限が32Gだから64Gには上げられんのです>< >>334
その上限はきっと1枚32GBであって最大じゃないと思う
32GB2枚差しで64GBが上限で4枚差しなら32GB×4で128GBが上限
だけどcore i3 とかCPUの性能で64GB上限の物が存在する 3700X はおそらく128GBが上限
もしマザーボードで上限32GBならやばいメーカーのマザーボードでPCIeも3.0でしかもx16じゃなくてx8の可能性ある
変なのじゃなかったとしてもB450系ならPCIe3.0だからGPUの性能は生かしきれないよ 質問です
AIで自然風景の360度VR動画を生成出来ますか? >>337
hpのBTO品でマザボはmoria2ってのです
ちなメモリアップグレード情報
デュアル チャネル(1 チャネルあたり 1 DIMM)メモリ アーキテクチャ
DDR4 UDIMM(288 ピン)ソケット 2 基
PC4-21300 (DDR4-2666) をサポート
8 GB および 16 GB の DDR4 UDIMM をサポート
32 ビットシステムは最大 4 GB をサポート
補足: 32 ビットシステムは 4.0 GB のメモリをフルに使用できません。
64 ビットのコンピューターで、16 GB DIMM で最大 32 GB(バッファなし)をサポートします。
補足: 記載されている最大メモリはハードウェアの機能を示すもので、オペレーティング システムではさらに制限されることがあります。
※持ってるのは64ビットマシンでっす >>337
追加情報っす
これだと多分大丈夫かと思います
現グラボ情報
AMD Radeon RX 5700 8 GB FH PCIe x16
フォーム ファクター:ATX(25.4 cm(10.0 インチ)フルハイト)
背面 I/O コネクタ:(1) HDMI および (3) ディスプレイポート
ディスプレイポート バージョン:1.4a
HDMI/HDCP サポート:HDMI 2.0b/HDCP 2.2
最大解像度:
HDMI 解像度:4096 x 2160 (60 Hz)
ディスプレイポート解像度:7680 x 4320(60 Hz、8 ビット)
補足: 最大解像度をサポートしないポートもあります。
メモリ サイズ:8 GB(256 ビット)
メモリの種類:256M x 32 GDDR6/14 Gbps(8 個)
総消費電力:180 W
PCIe:PCIe x16 (Gen4)
同時に最大 4 画面をサポートできます。
電源コネクタ:6 ピンおよび 8 ピン
AMD Surround マルチモニター テクノロジ、Blu-ray および DirectX 12 をサポート >>338
やればできるのかもしれませんが、現在1つのアプリケーションで生成できる手法は公開されていないと思います Google Colabでsd-webui-train-toolsを使ってLora作ってるんだけど
AssertionError: <class 'gradio.layouts.Box'> Component with id 1764 not a valid output component.
が出て先に進みません。
原因がわかる方いらっしゃいますか? >>339
専用ケースにMicroATXマザーか
ケースの中に何mmまでのグラボが入るか確認したほうがいい
あと、電源のサイズ
専用の電源だと交換できない可能性があるぞ >>343
4070tiは今のグラボよりちょっとだけ大きいから気にはなってた
でも電源が交換できない可能性までは気にしてなかったな………… >>342
答えじゃないけど
https://github.com/liasece/sd-webui-train-tools/issues/49
と同じ症状だね・・
webui、gradio、sd-webui-train-toolsそれぞれは全部最新? >>345
常に最新をダウンロードして動くので最新です
一度Lora生成に成功したけど
そのLoraを使って画像生成したら、エラーで動かないので
再度Lora生成しなおしたら、Lora生成がエラーになってしまいました >>322-323
ありがとう、メモリ増やしてやってみようかな colabはいつも最新ダウンロードするから逆に不安定
ほとんど毎日何かのモジュールが更新されてるので環境が安定しない
俺も最初の頃はcolabでやってたけどどこも変更していないのにしょっちゅう違うエラーが出て起動しなくなってウンザリしたので
自動ダウンロードしないように設定してた >>346
https://www.youtube.com/watch?v=Cog5plOPn68
去年5月のwebui1.1で動かなくなったパターン
forkが紹介されてるけど、どっちも更新が8ヶ月前なんで、別のなんかにした方がいいのでは
>>348
> colabはいつも最新ダウンロードするから逆に不安定
結局これよね
一回成功してるのがよくわからないけど >>339-340
これか
https://www.gdm.or.jp/review/2020/0215/337233/3
2枚差しだから最大64GBまででBiosのアップデートがなかったらメインメモリはDDR4-3200MHzの動作が無理かもしれない
GPUはGen4がのってるからPCIe4.0だと思うけどサイズが多分3ファンどころか2ファンのも無理だ長さがきっちりしすぎてるw
Radeon RX 5700 XT 230 x 111 x 41 mm
RTX 4070 Ti VENTUS 2X 12G OC 242 x 125 x 51 mm
電源は普通にATXBOX型っぽいけどGPUに近すぎるしATX電源コネクタが邪魔してて厚み差の10mmが入りきるかは不明
電源の右横にあるのが電源スイッチ基盤だとしたらマザーボード側についてる可能性がないんで詰んでるけどフロントパネル系ならフロントパネルが使えないだけだから問題はないかも
https://www.gdm.or.jp/omen-obelisk_34_1024x768
まぁストレージをカバーしてる金属板をどうにかしないとグラボが乗っからないからマザボとPCBOXも買い替えた方がいい
完全にスレチなんでこれ以上は専用板へ >>350
書き忘れていた
111mm と 125mm で4070TIの幅が方が大きいからどのみち蓋はできないぞ
自分はあけっぱで細かい網目のあるシートを被せてるけどそういう覚悟がない人は買い替えをお勧めする >>350-351
そうそれ
詳しくありがとう
グラボの右側はコードの横にあるカバー外せばもう少し隙間があるのと
最悪ストレージカバーぶった切れば何とかなると思う
問題は下部のコネクタだな
これがダメなら大人しく4060tiにする………… 爆笑顔の日本人爺が真剣な顔のローティーン女子小学生の胸に手をのせる
↑で生成したらエロ画像になってしまった・・・ >>353
むしろそのシチュでエロくないのってどういう状況だよ >>354
え?
そういうコメント返って来ると思って
逆の事書いたんだが?
何同意しての? お前 >>356
お前2レスしかしてないよな?
質問もしてない 質問じゃないとか言う以前にどう考えても頭がおかしいのでNG推奨だなこれは 初心者質問ですみません
アニメ調のイラストを生成するのにプロンプトをどう弄っても顔がリアル系寄りになってしまうときはモデルを変えるしかないのでしょうか?
数をこなしていると偶に好みの顔が出てくるのでプロンプトや設定でそれに寄せることができるのならその方法を知りたいのですが >>361
生成に使っているツールとモデルとプロンプトと生成結果の画像例がないとアドバイスできない
画像をみて好みに合う合わないは個人の感性だから 昨日からローカルステブル始めました
自分はリアル系は捨てて、アニメ専門でいこうと思います
モデルで向き不向きがあるとの事なので先にアニメから攻略したいと思ってます
アニメならこのモデルと拡張機能入れとけ みたいなものあれば教えて欲しいです
YouTuberさんが紹介してくれたモデルを入れたのですが皆さんのようなクオリティーの高い絵が生成できません
皆さんの絵が100点だとしたら、自分の絵は43点ぐらいです
不細工とか奇形ではないですし、可愛いっちゃ可愛いんですが、クオリティーは低いです
原因は、モデルが悪いのか、拡張機能が悪いのか、設定が悪いのか、さえも分かりません
プロンプトも重要なので「easy-prompt-selector」を入れたら快適度が増しました
ですが、教えてもらったeasy-prompt-selectorと実際に導入したeasy-prompt-selectorが違うような気がします
こちらが教えてもらったeasy-prompt-selectorです
https://imgur.com/a/YVja1J0
こちらが導入したeasy-prompt-selectorです
https://imgur.com/a/5IxJIIY
導入してみるとすでに1000個以上のプロンプトが用意されていてカスタムせずとも今後は十分に使っていけるのでしょうか?
(〇〇:2)などは手入力します
あと自分は>>23みたいな絵を作りたいです
まだYouTubeで10時間ほどしか勉強してませんがLCMは聞いた事があります
コントロールネット→ポーズ等
LCM→高画質拡張
他にも高画質になる拡張は紹介されたのですが、みんなが勧めてるものだけを入れてみました
そして繰り返しローラとモデルとプロンプトを試行錯誤する という認識ですが合ってますでしょうか?
だとしても>>23みたいな絵は一度も出せませんしカスりもしません
デビュー2日目なので当然ですが、AIだからと言って簡単には価値のある絵は出せない事が理解できました
まず何からすればよろしいでしょうか? >>363
逆に1000以上プロンプトがあっても全部出すわけじゃなければ惑わされるだけ
動画とかで見たならまずは動画と全く同じようにやってみてから
23のような画像が良ければプロンプトもモデルもサンプラー他パラメーターも公開してくれているんだからまずはそのまま入力してみては?
あとLCMは高画質拡張じゃない >>363
すぐ前で他の人宛で返信したが生成に使っているツールとモデルとプロンプトと生成結果の画像例がないとアドバイスできない https://imgur.com/a/ysptWuJ
モデル
ドリームシェイパー
プロンプト
高解像度、女の子、美少女、パーカー、いたずらっこの笑顔
ネガティブ
イージーネガティブ
どこを直せばいいでしょうか?
>>23に似てる画風になりたいです 今からローラを勉強するのですが
sd-scriptsを利用した方法がいいんでしょうか?
CIVITAIからそのままローラをダウンロードしてステブルのフォルダーに入れるのは危ないんでしょうか? >>366
23のモデル使っているモデルを使え
ここに意見を聞きたいならプロンプトは変換後の英語のものを書く
モデル名もきちんと元の英語名でバージョンも書く(分からなければファイル名)
23のように 生成結果を MajinAI https://majinai.art/ja/ に貼ればどういう設定で生成しているかわかるから助言できる >>367
勉強するまえにわかりませんは当たり前だろ
勉強してから質問しろ 24時間前にAI画像の事を調べて今ここまでの知識を得てるレベルです
何卒、ご無礼をお許しください
命令文は英語です
日本語だと精度が落ちますよね
それで結果は分かりますか?
>>23との違いです ■ このスレッドは過去ログ倉庫に格納されています