【StableDiffusion】画像生成AI質問スレ4【NovelAI】
レス数が950を超えています。1000を超えると書き込みができなくなります。
Stable Diffusionをはじめとする画像生成AIに関する質問用のスレッドです。
次スレは>980が立ててください。
テンプレは>2以降に
※前スレ
【StableDiffusion】画像生成AI質問スレ3【NovelAI】
https://mevius.5ch.net/test/read.cgi/cg/1678428918/ いやvenv再作成時に全Extensionのinstall.pyを再度実行してくれてたりするのかな
わからんが >>836
神かよ?ありがとうIssueも確認しつつ試したらほんまにスピードは爆速(多分これが普通)になった!
一回目はアクセス拒否とかError出て変化なしだったし
二回目はSuccessfully installed onnxruntime-1.14.0の上にErrorの赤字大量に出て怖かったけどw
ただやっぱり言う通り肝心の画像の処理がまともにできてない感じなんだけどこれは何ともならんでしょうか
>>827
adobe税がね…それとrembgはフォトショと結構同等レベルとか見たし
できれば切り抜き処理はrembgに任せたいと思って頑張ってたのよね >>839
Cドライブの容量が足りなくなったら
別ディスクにデータ移すんじゃなくて容量のでかいSSDに
Cドライブをまるっとクローンコピーして換装したほうがいいぞ。
容量だけそのまま大きくなるからエラーもないし楽だぞ。 StableDiffusionってインストールしてから実際にそれなりの絵を描き出せるようになるまでどの程度のセットアップ時間かかるのかな?
1日あればwebで無料で使えるサイト並みのものが書き出せるようになる?
グラボはとりあえず3060 16GBを今からポチる予定 >>855
なれてる俺は2時間かからず
ちょっと躓いた ありがとう
設定とかインストールでバグった時に動かないってやつなのかな
取り敢えず3060かってやってみる
因みに3060二枚買ったら24GBになるって事はないよね? インペイントの際、絵を拡大することは出来ないんですかね?
小さくて見づらいし塗りづらくて。 >>859
部分的な拡大はできないが、ブラウザ本体にある拡大表示機能と
全画面表示で2倍くらいには拡大できる Multi diffusionええなこれ。
t2iで良さげな絵をガチャで引いたあと、クリスタとかで細部調整して、Multidiffusionいれたらサイズそのままでもめっちゃ綺麗になる。 >>855
最低限動作させるためのインスコだけなら2~3時間、
初期設定やらモデルのダウンロードやら必須prompt覚えたりやら、そういう環境構築を揃えることを含めてなら2日以上かかったわ
今なら赤ちゃんインストーラーとかもあるからもっと短くてすむんだろうか 未だに剥ぎコラの作り方が分からないままぶん回している
何時か勉強しよう何時か >>859
グラフィックスソフト(KritaとかPhotoshopとか)でマスクを作って読み込む方法もあるよ
マスク部分は白、それ以外は透明のPNGにする モデルって基本的に人物ありきみたいですが、
エフェクト系とか風景とかに特化したモデルってありますか?
もしくは、既存のモデルから人物のみ消すなどできますか? M1Mac16Gを使ってるんだけど、現時点でイラストAIを作るツールのオススメはどれになるのかね?
初めはGoogleコラボを使ってたんだけどNSFWの画像も取り扱いたくなってローカルでも使えてノンプログラマーにやさしいものって事でDrawThingsを使ってる。修練度としては通算出力700枚程度。
使い勝手も悪くなくそこそこ満足してるんだけど贅沢な悩みが生じ始めた。他のツールで出来るのか分からないけど下記3点を克服できればと思ってる。
・任意のseed値を指定したい
・長方形サイズで崩壊しない画像を出力したい
・不要になったモデルのckptやsafetensorsをpcから削除したい
automatic1111が自由度高いらしくて乗り換え候補に考えてるんだけど出力遅いとか聞いて怯んでる。ってな状況なんやけど有識者の意見を聞かせて下さい。 >>867
とりあえず入れて試していらなくなったら削除すればええのでは >>867
Draw thingsって処理はクラウドなん?分からないけど
DeffusionBeeを試してみて、遅すぎると思えばwebサービスなりwin買うなりすれば良いよ
safetensorが使えないとか使えるモデルにかなり縛りがあるけど使いやすいよ >>868
automatic1111って簡単に削除できるん?
アンインストールする方法が紹介されてる記事が見つからず不安だった macでも1111は使えるよ
ブログの通りにポチポチやるだけ
何故動いてるのかは知らないけどw全く問題ない
遅いのはMacの問題だし >>866
自分が知ってる範囲だとCounterfeit-V2.5が背景得意なモデル
上のモデルなら人物はプロンプトで消せると思う
背景得意なモデルは他に見た気がしたがエフェクト強いのはわかんないな
>>852わかりそうな人いたらまあ頼む
無理臭いしもうええかなーと思ってkatanukiとABG_extension試してるけど諦めきれん >>869
Draw thingsはローカル処理だと思う。Googleコラボで出力してた時よりけっこう遅いし。
DeffusionBeeはDrawThingsを導入する際に候補にあったけど使えるモデルに縛りがあるって記事を読んで却下したんだ。やっぱいろんなモデルを使ってみたいじゃんって。DrawThingsはsafetensorもckptも今のとこ興味持ったモデルは全部入れられてる。AI画像作成のためだけに新たにwindows買う前にまだ何か出来るんじゃないかって思ってます。 >>867
Macは持ってないのでiOS/iPadOS版drawthingsの場合の操作にはなるけど、drawthingsフォルダ下のmodelsフォルダとdownloadsフォルダにそれらがあるのでファイルアプリから不要なら削除すればいい
崩壊しないように高解像度で出したいというのはhires.fixが(あったような気がした)
seed値を任意の数値にするには長押しタップでできる colabも使ったことあるけど出先で遊ぶには毎回の準備工程が面倒臭すぎるし中断したらまた最初からっていうのが辛くてやめたわ MultiDiffusion(i2i)の設定ってみんなどうしてるのかな
自分はt2iのプロンプトまんまでデノイズ0.3~0.5、CFG適当、倍率2~3って感じで使ってるんだけども
チュートリアルによると画質アップ以外のプロンプトは入れずに使うものらしいけど、それでデノイズ高めにするとキャラが別人みたいになってしまうし。 4070tiでLoRAの学習速度が1.10it/sくらいなのですがこれが普通なんでしょうか?
バッチサイズが4以上だと学習が始まらないです
教師データ32枚、解像度512、dim32アルファ16、エポック20 ステップ数3100で一時間くらいかかります >>873
webuiのExtensionにはないがDISっていうもうちょい綺麗に切り抜けるモデルはある
でも動かすのにはちょっと知識が必要 >>876
iOSだと簡単に削除できるんだそれはイイな。Macだと分かりやすいとこに無いんだよ隠しフォルダか深いとこにあるんだろうけど。
サイズの変更くらいしか弄ってなかったからhires.fix探して弄ってみるわ https://github.com/xuebinqin/DIS
一応hugging faceに誰かがspaceで動くように置いてくれてある
ただ学習をイラスト中心で行ってはいないからU2netとあんまり変わらないかも
あとMetaが出てたzeroshotのセグメンテーションのやつもあった気がするけど試したことない >>866
人物をプロンプトに書かなければ風景だけの画像が出てくるよ
これはCounterfeit 2.5
https://i.imgur.com/H7uVl4X.jpg アニメ系のLORAならベースモデルにNAI使えって見かけるんだけど
素のNAI? 流出モデルを探してきて使えって事なんですかね
まだ学習に手出す前なんでトンチンカンなこと言ってたらスマヌ ACertaintyとだとどっちがいいんかな?こっちで十分ならファイルサイズも半分くらいだし入手しやすいけど そういやVRAMはメモリみたいにSwap使えないのかな
メモリオーバーしそうになったら一時的にSSDのスワップ領域に保存するみたいなやつ モデルのCounterfeit-V2.2.safetensors
を使う際のVAEはCounterfeit-V2.5.vae.ptを指定するので正しいでしょうか? >888
遅すぎて使えない
4090のメモリ帯域 1008GB/s
DDR4-3200 Dual Channel の帯域 51GB/s
まあ、HDDにスワップするみたいなもんですな昔はよくスワップすると固まってフリーズしたみたいになったよね あ、その前にPCIe4.0 x16の帯域32GB/sだつたw >>820 >>831
明確に学習蓄積されてる訳ではないのね
再起動してみて様子みます >>876
Seed値に関して解決したわ。長押ししたら反転して編集できました。ありがとう。
あと長方形サイズに関して。High Resolution Fix があった。オンにして調整するっぽいな。ただオンにするだけだと512以外の外側の部分が別の画像で間に合わせたようになる。ガチャを回すか何かしら調整が必要なのかもしれない。 medvramやlowvramがメインメモリをswapとして使うっていうオプションじゃなかったかな?ssdは知らん SDでプロンプトをタイマーで変更して作成をしてくれる拡張機能とかありませんか?
寝てる間にAキャラ→Bキャラ→Cキャラと連続して作っておいてほしい プロンプトにランダム性をもたせるdynami promptってのならある >>880
すまん導入手順見て諦めた。挑戦するのはいいけど自分じゃ対応できない不具合出るんが怖いんよ
でもhuggingfaceにあるデモ版はちょっと使っていってみるよ
>>852誰かもしわかったらお願い。言うて自分ももうkatanukiとABG使い始めてるんで
rembgで不具合出た奴はkatanukiかABG使ってこって事は書いとく >>896
なにそれ面白そう
dynami prompt って入れるだけ? >>867
俺もM1mac16GBでwebUI使ってるよ
前にDrawThingsも使ってて、これもかなり色んなことができるけど、webUIなら更に色んなことができるとだけ捉えとけばOK
1辺1000ピクセル以上の画像も出力できるしね
たぶんmacだからどうということはなく、スペック相応の生成速度は出てるはずだよ >>896
ググってみたけどちょっと思ってたのと違った
Stlylesに保存してるやつを次々に実行してくれたりがほしい それならxyz plotでいいな
プロンプトのカンマ「,」を全部「","」に置き換えて好きなプロンプトを切り替えながら色々組み合わせるか
シンプルにstylesでxyz plotを回すか >>897
Extensionのソースとrem-bgのreadme見てきたけど
推論に値を渡すことで介入して消え具合を調整する余地は無かった
出来るのはマスクとしてアルファを書き出して、そのアルファを調整して元画像であるRGB画像に引っつけて透過するという古典的なアプローチだけ
rem-bgの方のソースをいじればどうにか出来るかもしれんがそこまでまだ見てない >>901
おおおおおおできた
まさにこれが欲しかった
ありがとう これまでGoogleリモートデスクトップで出先から
ポチポチスタイル切り替えて生成してたのがアホみたいだったw 皆当たり前に使ってたから誰にも言えなかったけどxyz plotはちょっとした感動だったな >>899
おお!先輩いた!心強い意見ありがとう。
導入に向け勉強してみる >>895
プロンプトごとに窓開いて順番に生成ボタン押せば順番にやってくれる 小さな特定部位でloraを作ることはできますか。乳首のloraを作りたいです。 >>418>>420
ありがとう
とんかつ好きだけど柏の森浜勝は遠いしうめーやはいつも多いしやよい軒はほか弁仕様で微妙だし
ちょっと期待してたんだけどな― 調べたら乳首でlora作れそうなのでもう大丈夫です、ありがとうございました >>909
とんかつ…?君はどこの次元の人と話を…? >>855
なる
迷子になりやすいから気をつけて
特に自作lora >>902
なるほどわからん。プログラムのプの字もわからず雰囲気で画像生成やってるもんでサーセン
俺のために手間かけて対応してくださらなくてもええんやけど
あの不具合ってそのうち公式とかが何とかしてくれたりせんのかな。別に俺の環境依存とかじゃないみたいだし プロンプトや数値を公開してくれてる人のマネしても何故その数値に到達したのかさっぱりわからん
でも順番にサンプルアルゴリズム変えて、サンプリング回数合わせてアップスケーラ合わせてノイズ除去強度合わせてってやっていくとグイグイクオリティが上がっていくんよな
これって偶然じゃなくて理屈がわかってやってるのかやっぱり t2iでそれが再現できるなら間違いなくガチャの賜物だぞ
色んな要素がたまたまいい感じになるシードがそれだったわけよ でもseedとpromptで高解像度の良さげなイラストつくれても、手とか目とか1箇所でも破綻してると、inpaintとかで修正できるの?
解像度高いとInpaintとか上手くいかないイメージなんだけど。 >>912
なんかもうコピーライターもAIに殺されそうになってるな M1 Macって推論チップ乗っけてるから
ドライバーが用意されたらそれなりに早くなりそうだな M1~M2のGPUメモリっていくつなん?
3090 24GB相当になるなら欲しいけどなぁ
速くなっても8GB相当なら意味ないし これすごいな
トップアイドル級の整った子がいろんなアングルで無修正全開くぱぁ
グラビアいらないし、動画になったらAV業界も終わりそうだね >>924
4070搭載PCを4台用意してマルチでシーンごとに変換すればできるじゃん。
いまAI動画色々作ってるけどエフェクター以上のことはまだ出来ていない。 モザイク破壊って仕組み違うんかな
脱がせるのとなんら変わらない気がするが
モザイクを認識するか服を認識するかの違いにしか思えん 拡張機能のcutoffを適用すると同じシードでも構図が変わり人の形も歪になるのですが対策はありますか? あるだろうけど常人には無理だと思うぞ
理解してソース書き換えなきゃ無理じゃね >>855
すべてが初めてだったけど、hugging face見てとりあえずDiffusers動かせるようになるには30分ぐらいでした。そこから欲しい画像の生成は試行錯誤なのでめっちゃ時間かかってるけど…。
解説サイトもそこそこあるので読みやすいところ探すとよいよ。 MacついでにM1でwebui実行した時のスピードてどれくらいなの?
イラストはwin機でやってるけど気になった
512×512で何秒くらいか >922
ユニファイドメモリでメインメモリと共用だから、最大128GBだね
メモリ帯域は800GB/sだからなかなか速いよ
因みに4090のメモリ帯域は1008GB/s
でも現状グラボ性能は3090の半分以外
更に進化予定なので今後に期待だね >>934
ユニファイドメモリでそんな爆速なの?
それじゃあ理論上、8Kのhiresとかも生成出来るのかな
だとしたら凄まじい事だけど
M1-2持ってる人は高解像度どこまでいけるのか試して欲しいな >>934
それまじかできるなら凄まじい話になるな ローラの追加学習で、絵柄や質感を無視して、顔の造形だけ学習させることできないですかね?3dcgの画像を学習させてるんですが顔を似せようと強めにかけるともともとのcgの質感ごと反映される。顔が似つつ質感はフォトリアルリアル、みたいにしたいのです。 個人で楽しむ範疇で両津勘吉lora作りたいんですが全コマ学習させるぐらいじゃないとダメですかねぇ >>933
今手元にないから自分の覚えてる範囲でしかないけど768×768で1枚1分ぐらいっすかね LORAって学習というより画像検索データベースを追加するって感じに思えるから使用した画像の画風そのままになってしまう気がする >>938
追加学習は量より質
30枚くらいで、同じサイズで同じ位置(顔を中央に配置)
アングル被りは数枚に抑えて、多様なアングルを用意するといい 白長手袋着用させようと、white_opera_grovesとか、white_silk_long_glovesとか入れたら
絵全体が高貴な感じになってしまう >>939
ありがとう
3060よりちょい遅いくらいなんだねメモリ次第で化けるかもしれんけど
事務用に使ってるm1で週末やってみるわ >>938
全コマ入れたら連載初期と終盤では顔が全然違うからかえってよくなさそうw >>943
1枚1分なら3060は比較対象にならず、CPUとの比較になると思う >>942
アンダーバーって入れたほうがいいのか? >>946
学習時のタグ次第なんだろうけど、今回の場合groveが殴る気満々の奴で、繋げたら無くなった感 白黒のみで学習したやつにfull colorとか指定しても色付かないんだけど
着色するプロンプトってあります? >>911
自分も作りたかったんですがどこのサイトを参考にしたですか? RTX3060買おうと思うんですけどLHR版でも問題ないですか? としあき製VAE、2系統10個もあってわけわからん
解説してくださいとしあきさん レス数が950を超えています。1000を超えると書き込みができなくなります。