X

【StableDiffusion】画像生成AI質問スレ21

■ このスレッドは過去ログ倉庫に格納されています
1名無しさん@お腹いっぱい。 (ワッチョイ 9bf2-e8vO)
垢版 |
2023/12/22(金) 20:18:47.98ID:WCuIa5Ix0
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512
↑スレ立て時にはこれを3行に増やしてください

Stable Diffusionをはじめとする画像生成AIに関する質問用のスレッドです。
次スレは>>970が立ててください。

質問する人はなるべく情報開示してください

・使っているアプリケーション(1111ならどこから/何を読んでインストールしたか)や使っている学習モデルを明記する
・状況の説明は具体的に。「以前と違う画像が出力される」「変になった」では回答しようがない。どう違うのか、どう変なのかを書く
・状況やエラーメッセージを示すキャプチャ画像や出力画像をアップロードする。出力画像はimgurではなく、catboxなどアップロード時に出力パラメータが残るサービスへ
・ローカルならマシンの構成(GPUの種類は必須、VRAM容量やメインメモリの容量、CPUの種類もなるべく)を書く

テンプレは https://rentry.co/aiimggenqa

※前スレ
【StableDiffusion】画像生成AI質問スレ20
https://mevius.5ch.net/test/read.cgi/cg/1700315721/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
2024/01/09(火) 12:04:22.92ID:SeVXJ1jq0
>>179
https://chmod774.com/stable-diffusion-stylepile/
2024/01/09(火) 12:21:46.53ID:PmfoKrs20
>>179
10個ずつという仕組みがみつからなかったので保存する場所を変える方の作戦なら
https://gigazine.net/news/20220928-automatic1111-stable-diffusion-webui-settings/#3
182名無しさん@お腹いっぱい。 (ワッチョイ 5ff2-ipwt)
垢版 |
2024/01/09(火) 13:14:36.55ID:d9TgRENX0
>>179
バッチ回数を10にして、prompt from file or textboxに各プロンプトを入れるのではダメ?
183名無しさん@お腹いっぱい。 (ワッチョイ 5ff2-ipwt)
垢版 |
2024/01/09(火) 16:23:51.81ID:d9TgRENX0
>>182つづき
バッチ回数=Batch countのほうね
これならA10枚、B10枚、C10枚と生成されたよ
2024/01/09(火) 16:31:36.65ID:H0lwLFvG0
179です
レスありがとうございます!!
助かります!!
185名無しさん@お腹いっぱい。 (ワッチョイ dfda-JApz)
垢版 |
2024/01/11(木) 14:44:46.82ID:4VMOfF8e0
LoRAで学習させるときのPromptとNegative Promptは入れたほうがいい?
標準ではbest quality,Amazing,〜みたいなのが入っているけど
2024/01/12(金) 07:03:37.03ID:+YHzIJK/0
>>185
https://github.com/liasece/sd-webui-train-tools
これのことか・・さすがにわからない
ローカルでのLora学習はkohya_ssあたりが一番使われるので
2024/01/12(金) 19:58:34.09ID:koRFezhF0
https://mevius.5ch.net/test/read.cgi/cg/1703250505/322
>latent couple を使って複数人出力してるのですが
>現状、プロンプトは個別に適用されますがlolaは、共通で適用されてしまいます
>個別にLolaを適用するにはどうしたら良いでしょうか?

https://civitai.com/models/262118/mai-dragon-ball-super
https://civitai.com/models/262108/gine-dragon-ball

https://i.imgur.com/zgjdTsY.jpg
こんな感じ?
2024/01/13(土) 00:25:33.74ID:HTn+FCJQ0
なんの役にも立ってなくて草
2024/01/13(土) 09:14:48.79ID:OEMivJ210
どうやったのか書いてほしいと思うのだが
2024/01/13(土) 10:57:18.69ID:X4TL6Ts30
「Regional Prompter」使ったほうがいいよ
使い方も日本語で載ってるしね
https://github.com/hako-mikan/sd-webui-regional-prompter/blob/main/README.JP.md
2024/01/13(土) 11:21:35.18ID:PXOl/ND3r
目の色も髪の色もほぼ同じキャラ、しかも同一作風という「いかにもそれっぽく出やすい」代表格で作例(説明無し)を出すセンス……
2024/01/13(土) 11:26:33.86ID:Md+x5eaaa
>>190
これ凄いな
真面目にAI絵やってくならこれくらい使いこなさないといけないのかな

>>191
せめて髪色違いのキャラにしてほしかったよね
デフォだと色を別けるの運ゲーだし
2024/01/13(土) 21:15:06.06ID:FHc5xBx70
いやなんでもよかったんだけどw
civitaiみたらなんとなく目に入ったんで同じ人がつくったのがいいだろうと
作り方描かないのはそのまま転載されるからだよ
2024/01/13(土) 21:53:49.00ID:yWXQnLcHa
>>193
お前だけだぞ
つまらん事でしつこく意地張ってみっともない事してるのは
2024/01/14(日) 04:15:06.65ID:cyQ+AyIT0
Comfy UI で、githubから頂戴した他の方のWorkfloweのjpg画像をComfyにD&Dすると、
「When loading the graph, the following node types wer not found . と表示されます。
そのノードに対応した拡張機能をInstallしてないからだと思うのですが、

足りてない拡張機能を自動で一括でInstallしてくれる拡張機能はありませんか?
1つ1つ検索してInstallしてとなるとちと手間でして
2024/01/14(日) 04:23:53.35ID:ucUA8cRm0
comfy managerで見つかるnodeならinstall missing custom nodesで足りないものが分かるしそのまま入れられる
197あぼーん
垢版 |
NGNG
あぼーん
198名無しさん@お腹いっぱい。 (スッップ Sd22-Gvpc)
垢版 |
2024/01/14(日) 10:54:06.26ID:Z8ZBJsDyd
NovelAIなんですが、キャラを公式の絵柄で再現したいのですが、official artとofficial styleってどう違うんでしょうか?
2024/01/14(日) 11:15:17.03ID:Gfulp9NY0
両方試して公式に近い方採用すればいいのでは
200名無しさん@お腹いっぱい。 (ワッチョイ 82f7-2STM)
垢版 |
2024/01/16(火) 11:16:52.47ID:Ppa9HtRi0
StableDiffusionでキャラをスマホの中に写した画像ってどうやれば出やすいのでしょうか。
同人誌でよくある「お前の裸とったからな、言うこときけよ」みたいなシチュエーションに使われそうな
「キャラ本体」と「キャラを写しているスマホ」が生成画像の中に画像です。
「キャラを写しているスマホ」単体でも、撮られる側が持っている画像が出たりして難しいです。
2024/01/16(火) 12:10:27.94ID:9u4eNqZz0
AIで知り合い脱がせたほうが
もえるんでねーの?

https://undress.app/ref/
202名無しさん@お腹いっぱい。 (ワッチョイ 6ef2-6zsj)
垢版 |
2024/01/16(火) 13:57:36.63ID:Z7OyzWsL0
>>200
あれはそういうLoRAを使っているんじゃないかな
civitaiで探してみては
2024/01/16(火) 14:02:20.16ID:4j0Lqjzw0
>>196
他の部分を全く読んでいませんでした・・・助かりました
楽にインストールできました ありがとうございます!
204名無しさん@お腹いっぱい。 (スププ Sd22-Gvpc)
垢版 |
2024/01/16(火) 21:33:53.24ID:6LVEFMjqd
プロンプトの間は,だけで区切っていたのですが、「, 」と,の後ろはスペースで空けないといけないんでしょうか?
2024/01/16(火) 21:36:23.30ID:+yfa+mTW0
単に人間にとって区切りが分かりやすくなるってだけで空ける必要はないよ
206名無しさん@お腹いっぱい。 (スププ Sd22-Gvpc)
垢版 |
2024/01/16(火) 21:40:38.40ID:6LVEFMjqd
空けた方がいいというのは古いバージョンでの話だったんですか?
あとキャラ名の苗字と名前の間は半角スペースで開けると2人と認識されるんでしょうか?
2024/01/16(火) 22:39:41.48ID:+yfa+mTW0
すまんが俺は古い話は知らんので他の人にまかせる
無駄なスペース削除する拡張機能があるくらいだから気にしなくて良いのは間違いない

スペース開けて名前連ねた場合別々の人物として処理されることもあるし、それぞれの要素が入り混じった人物になることもあるし、片方の要素だけのこともある
2024/01/16(火) 22:41:07.28ID:GdlCMRHLM
>>200
スマホの画面以外成功した画像を作ったら、i2iのinpaint でスマホ画面塗りつぶして ヒロインちゃんの裸 とか書きたいプロンプト入れて出力

漫画なんかだと必然的に小さな画像になるし別コマの画像を切り貼りしてると思う
209名無しさん@お腹いっぱい。 (スププ Sd22-Gvpc)
垢版 |
2024/01/17(水) 04:11:19.41ID:S+aTZyTrd
名前は、苗字名前の間は_で区切る方がいいんですか?
210名無しさん@お腹いっぱい。 (ワッチョイ 4dee-6zsj)
垢版 |
2024/01/17(水) 08:07:47.37ID:suIFzcUD0
出力した結果見ればわかんだろ
わかんねぇならさなんかねぇんだよ
211名無しさん@お腹いっぱい。 (ワッチョイ 6ef2-6zsj)
垢版 |
2024/01/17(水) 08:49:57.55ID:ddjMzIXI0
>>206
かなり古いバージョンでは「1girl,smile」と「1girl, smile」で結果が変わっていたけど今は同じ結果になる、だったはず
名前の空白が必要かどうかや「_」区切りが必要かはモデルによる

どちらも自分で試してみては
2024/01/17(水) 09:16:53.72ID:uaxWXPSTH
SDのベースがdanbooru使ってると認めてるって話だから完全オリジナルじゃない限りアンダーバーに反応する可能性はある
タグが統一されてなくてどっちでも効く可能性もある
学習データのタグ見れないなら実践してみるしかない
2024/01/17(水) 09:26:12.65ID:BRE9YAt/0
名前って言ってるから何かのキャラなんでしょ?
キャラの場合は固有名詞として学習されてるから
アンダーバーが合った方が良いと聞いた記憶があるけど
多少違ってても柔軟に対応してくれるんじゃないかな

最近のキャラやマイナーキャラはそもそも学習されていないならどっちみち出ない
使ってるモデル次第やね
2024/01/17(水) 09:45:10.20ID:6Eo64Icn0
tagauto completeの設定いじらずデフォで使ってるけど
sports uniform → sportswear
みたいなdanbooru訂正?はどっちも効いてる気がする
2024/01/17(水) 09:47:38.00ID:XiubK58j0
反応のあるタグを取り出せたら良いんだけど。
ランダムシード固定の総当たりで辞書から英単語入れて、ステップ数と解像度低くして、色が違えば当たりとか、反応を調べるのできないのかな。
stream diffusion の秒100枚とはいかないだろうけど。
2024/01/17(水) 12:03:21.49ID:zwd82r+v0
>>215
英単語ってどれだけ単語あるとおもってるんだ…
217あぼーん
垢版 |
NGNG
あぼーん
2024/01/17(水) 13:03:53.55ID:XiubK58j0
>>216
何個あるんだ?
常用単語だけの辞書にどれだけ専門用語を加えるかで変わるだろうけどキャラ名は必要か。

1日86400秒だから反応する1秒1個自動判定するなら
864万調べるなら100日かかる。
でもトークンの反応を調べるだけの生成ならステップ数と解像度を減らせば1秒かからないはずで
秒100チェックできるなら1日回せばOKになる。

全ては単語数とチェック速度に依存する。

ただ、外れトークンにも影響されて出力が変わるなら機械的なチェックは不可能になるけど
2024/01/17(水) 13:21:35.52ID:zwd82r+v0
>>218
それで864万単語の一覧があって役に立つのか? 単語の一覧に反応する とあったら 嬉しいのか? 個人の頭の中にしか無い「期待」通りの反応するかしないのかをどう判断するんだ?
生成する人は辞書を引きながら一単語ずつから生成パラメーター作ってないのに辞書より(固有名詞もあって)大きい一覧から調べて使うのか?
インターネットで役に立ちそうな表現に役立ちそうなタグを引っ張ってきて自分の目の前のAIで生成するか 画像と呪文を公開しているサイトをみて呪文作るんじゃないのか?
2024/01/21(日) 07:13:20.42ID:Dkf+NCCJM
サンイチ
キュアピースのXL用LoRA無いやんけ
仕方ないんでネットで拾った低画質11枚で作ったわ
教師画像小さいのに無意味に1024で学習させたもんやから45分もかかったで
まあ、適当に衣装出ればええし顔も別LoRAで変えてあるんやがな
https://i.imgur.com/EalAcOK.jpg
2024/01/21(日) 07:13:49.29ID:Dkf+NCCJM
上、誤爆や
2024/01/21(日) 07:31:57.11ID:e0mlTpOK0
あら可愛い
223あぼーん
垢版 |
NGNG
あぼーん
2024/01/21(日) 20:27:40.07ID:DVsC4G6n0
RedRayz氏のGUIでLoRA学習をやってて、
keep_tokens_separatorを使うときは、
詳細設定のページのトークンのセパレータで、セパレータ|||を指定して、
トークン保持数の値は、0で良いでしょうか。
225名無しさん@お腹いっぱい。 (ワッチョイ 7ff2-zQB7)
垢版 |
2024/01/22(月) 13:12:10.22ID:/QMgm1SE0
>>224
作者さんがここ↓にく来るから、直接聞いてみるといいかも

なんJNVA部★321
https://fate.5ch.net/test/read.cgi/liveuranus/1705861083/
2024/01/22(月) 13:41:56.62ID:53nOnC3H0
セーブデータみたいなイメージで、PNG Infoからt2tやらi2iに送ってプロンプト書き換えてるんだけど、
転送する度にseedと設定(override setting)も送られてウザったいんだけど、この辺の転送するもの選ぶ設定ってどっかにありますか?
227名無しさん@お腹いっぱい。 (ワッチョイ 7ff2-zQB7)
垢版 |
2024/01/22(月) 15:16:54.13ID:/QMgm1SE0
>>226
それはないと思うなあ
txt2imgからimg2imgなどへ送るときにシード値やサイズも送信するかは設定の「User interface」にあったけど、この設定はPNG Infoからの送信では関係なかった
228名無しさん@お腹いっぱい。 (ワッチョイ 87da-0Ail)
垢版 |
2024/01/22(月) 15:50:29.10ID:DsqkQ/Lc0
kohya_ssで学習させようとしたんですが
RuntimeError: NaN detected in latents: C:\SD\kohya_ss\02-input\1_sd\sd (1).jpg (教師用の画像)
というエラーが出て止まります
原因はなんでしょうか
2024/01/22(月) 16:26:43.54ID:2reAM2zA0
>>228
--no_half_vae を追加してください
https://github.com/kohya-ss/sd-scripts/issues/636
2024/01/22(月) 16:47:31.31ID:53nOnC3H0
>>227
そうですよねー。
言われてる、シード値送るかみたい設定あってこれか!と思ったらPNGInfoは関係ないようで。
Override Settingのせいで新しいモデル試してたつもりなのに古いままで、しばらく気付かなかったって人結構いるんじゃないですかね?
2024/01/22(月) 17:28:19.79ID:CGwyMCzO0
>>225
ありがとうございます。そっちで聞いてみます。
232名無しさん@お腹いっぱい。 (ワッチョイ 87da-0Ail)
垢版 |
2024/01/22(月) 18:51:24.05ID:DsqkQ/Lc0
>>229
--no_half_vae をどこに記述すればよろしいのでしょうか?
2024/01/22(月) 19:12:23.00ID:znGoTJ4v0
AdvancedのAdditional parametersかな?
234名無しさん@お腹いっぱい。 (ワッチョイ 87da-0Ail)
垢版 |
2024/01/22(月) 20:11:15.75ID:DsqkQ/Lc0
>>229
>>233
ありがとございます 学習が開始できました
235名無しさん@お腹いっぱい。 (ワッチョイ c701-EFyZ)
垢版 |
2024/01/24(水) 02:07:42.50ID:JO59Mwhj0
すみませんガチ初心者です
Stabledifusionをローカルで導入した素の状態で使っているのですが、何日も生成していると、過去に生成した画像に似たものが多くなってきた気がするのですが、これは正常なんですか?
(R18系のイラストを最初に生成しようとしたときは何度やっても出なかったのが、今では何もそういう呪文を入れてなくてもR18系の画像が生成される…みたいな)
LoRAみたいなのは導入していません。リセットする方法があれば教えてほしいです。
236名無しさん@お腹いっぱい。 (ワッチョイ a751-zQB7)
垢版 |
2024/01/24(水) 04:23:35.05ID:1xQj0cIp0
モデル Check Pointをかえる
237名無しさん@お腹いっぱい。 (ワッチョイ c701-EFyZ)
垢版 |
2024/01/24(水) 05:03:51.27ID:JO59Mwhj0
>>235
ありがとうございます!やってみます。
238名無しさん@お腹いっぱい。 (ワッチョイ 7ff2-zQB7)
垢版 |
2024/01/24(水) 08:06:31.05ID:VPmHtnMF0
>>235
原理的にはこれまでのプロンプトに引きずられることはないんだけど、A1111はバグなのかそう感じられる画像が出ることがあるとよく言われるよね
モデルをいったん切り替えるだけでリセットされるというのは初耳
A1111を再起動しなければいけないと思ってた
2024/01/24(水) 08:41:27.24ID:PMGn219g0
マスピ顔の話か? masterpieceとか指定したらそんな顔しか出なくなる クオリティを高める弊害だ
2024/01/24(水) 10:30:49.92ID:dCHGDEhY0
>>235
基本的にずっと生成してたらそれが染みつく、みたいなのはない
R18がなかなか出なかった時代の画像が残ってるのであれば
png infoに突っ込んで今現在とプロンプトの違いを精査してみるといいかも
ある単語に気付いた試行錯誤を覚えてないとかだと思うよ
2024/01/24(水) 10:39:22.12ID:b3OWETMSM
キャッシュデータがあるからね
削除したはずのLoraの効果が残ってたり
同じようなな顔が連続するようなことはある
基本ランダムだから、永久には続かない
2024/01/24(水) 11:00:56.67ID:dCHGDEhY0
Lora学習でaaaa_v1-000010みたいに作りながら確認してる時に<lora:aaaa_v1:1>だけで効いちゃう
(この時png infoは000010になってる)
そのまま作り続けて000015、000020、最終的にaaaa_v1が完成しても
Loraタブでrefreshしないとaaaa_v1指定で000010が選ばれ続ける
この状態で00010削除すると、掴んだままなのかありませんエラーになる(aaaa_v1あるのに)

この謎仕様のせいでかなり頭抱えた時期があった、1.7現在も修正されてない
ほんと混乱するのでなんかあるたびにrefreshしてる
243あぼーん
垢版 |
NGNG
あぼーん
244名無しさん@お腹いっぱい。 (ワッチョイ 7ff2-zQB7)
垢版 |
2024/01/24(水) 14:09:05.62ID:VPmHtnMF0
>>243
グロ
2024/01/24(水) 14:57:32.51ID:nNiyDQL80
LoRAは何かが変わるまでキャッシュしているけど、ファイル名ではなくてエイリアス名かもね
246名無しさん@お腹いっぱい。 (ワッチョイ c794-5jDG)
垢版 |
2024/01/24(水) 17:51:10.54ID:5O3XDhSZ0
そもそも同じモデルで生成してれば似たような物が出るのは当たり前
構図とかポーズもそのモデルで出やすい物が出る
そこを代えてくプロンプトはあるけど、特定絵柄に特化してるタイプのモデルは効きにくい
汎用性があるモデルでも、指定すれば何でも出るというほどではない
2024/01/25(木) 13:03:40.27ID:CcxOAcFd0
https://mevius.5ch.net/test/read.cgi/cg/1703250505/518
> 最初optimizerの設定をadamW8bitにしていたのですがError no kernel image is available for execution on the deviceとなったのでadamWに変更したところのエラーです
1070tiなんでadamW8bitは動かないんだろうね

> CUDA out of memoryとあったので色々参考にSBwebui-user-batに--xformers --medvramを加えてみたりwebui.batのほうにset PYTORCH_CUDA_ALLOC_CONF=garbage_collection_threshold:0.6, max_split_size_mb:128
> を入れてみたりしたのですがあまり改善しませんでした
> そもそも何か根本的に間違っているのでしょうか?
これは勘違い、それはwebui側であってkohya_ssとは関係ない
248あぼーん
垢版 |
NGNG
あぼーん
249名無しさん@お腹いっぱい。 (ワッチョイ 7ff2-zQB7)
垢版 |
2024/01/25(木) 19:08:47.44ID:FDgC0t3O0
>>248
グロやね
2024/01/25(木) 19:51:14.12ID:CcxOAcFd0
って、247の元レスよく見たら笑った・・貼ってもらうまでもない、なるほどね
みんなよくやるらしい
2024/01/25(木) 20:57:39.64ID:E8dWQL8g0
SDXLでリアル系でLoRAの効きのいいモデルって何があるでしょうか?
fudukiMix_v20 をいま試しているのですが LoRA JP2 を追加しても全然変わらないのです
できればAnimagineベースでRefinerとして使いたいのです

SD1.5ではアニメモデルをベースにxxmix9realistic_v40でRefinerかけてADetailerという感じがお気に入りでした
理想 → https://i.imgur.com/6a1OH8B.jpg
2024/01/26(金) 02:26:06.16ID:uQLW+6450
>>247>>250
やっぱりwebuiとkohyaは別々なんですね…
kohyaを含めてCUDA out of memoryエラー?を調べてもSBの解決方法しか出なかったのでwebui側の問題かなと考えてしまいました
書き方からすると初歩的なミスなのでしょうがプログラミングなどの知識はないので何が間違っているのか何度見返してもわかりません
できれば噛み砕いて教えてくただけると助かります
253名無しさん@お腹いっぱい。 (ワッチョイ 8754-zQB7)
垢版 |
2024/01/26(金) 02:45:35.76ID:m9A1jw5P0
>>252
Kohya_ss起動した時の一番上Running on local URL: http://127.0.0.1:7860より上の
メッセージが見えるSSが見たいな
Kohya_ssのセットアップミスだと思うけど
後、CUDA out of memoryは単純にVRAMが足りないから処理続行出来ないってエラーだから
8GBしかVRAMが無い1070じゃそれなりにやりくりしないと厳しいよ
一応共有メモリを使うことで多少ならカバー出来るけど
メモリ搭載量が16GBしかないので共有メモリが8GB(メインメモリの半分)しか確保出来ないので
処理によっては8GB+8GBでは足りない感じなんじゃないかな(よっぽど無茶しなきゃ普通は12GB前後でおさまる筈)
2024/01/26(金) 07:42:23.87ID:wtP3HAwEr
>>251
fuduki 2.0はlora無しでも使えるようにしたモデル。loraを適用すると過学習になる可能性があるとのこと。対してfuduki1.5はloraの使用を前提としているので、目的によってはこちらがオススメ。
2024/01/26(金) 12:12:19.62ID:h9xQ5rB10
>>252
細かい事はわからんのだけどメモリ32GBと3060ti(8MB)でKohya_ss回してて、OutOfMemory対策で設定してるところ。もし参考になれば。
・LoRAtype:Standard(他は無理?)
・Trainbatchsize:1か2(Max resolutionと相談)
・Mixed precision、Save precision:fp16固定
・Max resolution:512ならTrainbatchsize2でも可能かも、752なら1固定
・Network Rank、Network Alpha:上げすぎは無理(128、1で問題ないと思ってる)
2024/01/26(金) 14:05:20.75ID:GkV37sHr0
>>252
レス遅れた、ごめん
https://i.imgur.com/C2w7ixb.png
一番上よく見るとdreamboothになってる、メモリめっちゃ消費するのでOOMになる

デフォの起動時のタブがそれで、見た目もほとんど変わらないので
> みんなよくやるらしい
https://www.reddit.com/r/StableDiffusion/comments/111w2gy/cuda_out_of_memory_when_using_kohya_ss/
2024/01/26(金) 23:01:59.11ID:Ah0YXq/40
>>254
ありがとうございます v1.5 で試してみますと確かに LoRA が乗ってきているのが分かりました
(同じ seed でこんなに違うのは初めてですが)
https://i.imgur.com/ExML79u.jpg

さらに 1.5 の方は素でも 2.0 より好み寄りでしたのでこれでいろいろ試していきたいと思います
258名無しさん@お腹いっぱい。 (ワッチョイ 87da-0Ail)
垢版 |
2024/01/27(土) 13:39:36.76ID:lW9Bt8xu0
初めて2週間ぐらいの初心者です グラボはgtx1660です
kohya_ssを使用して33枚の画像を繰り返し20回×15回=9900ステップで自作のloraを作成しました
教育用の画像は1024×1024の正方形で背景を白く加工しもので全画像でキャラクターが同じ服装をしています
stable-diffusionで自作のloraを使って画像を生成しましたが、微塵も反映されません
見た限りでは学習時と画像生成時にエラーもないようです
学習結果が反映されない理由として何が考えられるでしょうか?
2024/01/27(土) 15:11:18.77ID:faX9IDTC0
タグは?
2024/01/27(土) 15:22:46.37ID:Abkpp9gk0
kohyassの最初のタブでDreambooth選択していませんか
261名無しさん@お腹いっぱい。 (ワッチョイ 87da-0Ail)
垢版 |
2024/01/27(土) 15:36:48.89ID:lW9Bt8xu0
>>259
>>260
学習時にloraを選択しタグもいれています
プロンプトも試しましたが自作loraありとなしで同じ結果でした
2024/01/27(土) 16:06:15.85ID:LtO/bhc9M
>>258
添付してるテキストの書き方が間違っている可能性
263名無しさん@お腹いっぱい。 (ワッチョイ 87da-0Ail)
垢版 |
2024/01/27(土) 16:20:13.07ID:lW9Bt8xu0
>>262
自作loraのメタデータを見たときに設定したタグが全てあるので
たぶん間違ってないと思います
2024/01/27(土) 16:21:19.83ID:LtO/bhc9M
トリガーワードの設定ミス
2024/01/27(土) 18:02:05.53ID:8ds3cEts0
実はキャプションtxt一切なしでも一応学習はするし、トリガーワードなしでもLora入れてると反応する

>>258
エスパーじゃないので細かい設定見ないとなんとも・・jsonファイルをアップローダー等に上げて貼って
> 見た限りでは学習時と画像生成時にエラーもないようです
LossがずっとNaNとかになってない
2024/01/27(土) 18:32:51.51ID:mhiYRVDk0
1660系はfp16にバグがあって使えない
ttps://qiita.com/peka2/items/6e5bbcf3a3d175b703b1
この辺参考に設定変えて
267あぼーん
垢版 |
NGNG
あぼーん
268名無しさん@お腹いっぱい。 (ワッチョイ 87da-0Ail)
垢版 |
2024/01/27(土) 19:04:05.60ID:lW9Bt8xu0
>>266
ありがとうございます
設定を変えて学習してみます
2024/01/28(日) 00:50:34.05ID:2tgegJT/0
遅くなってすみません。
>>256 >>260
うわああああああああああ、その通りです
出来ました…
指摘されるまでタブがあったことすら気づきませんでした
本当にありがとうございます

>>253 >>255
丁寧にありがとうございます。スペック的にやはり最低限という感じなんですね…
今回は私のミスでしたが今後の参考にさせていただきます
ありがとうございました
270名無しさん@お腹いっぱい。 (ワッチョイ 358a-TUA6)
垢版 |
2024/01/28(日) 00:53:36.93ID:Y+EJL+670
kohya_ssの最大の欠点があのタブだと思う
あれは今でも油断してると変更忘れる
271あぼーん
垢版 |
NGNG
あぼーん
2024/01/28(日) 12:14:03.41ID:foNvcBq60
自分も一回間違えた後、kohya_gui.pyにパッチあててDreamboithとLoRAのタグの順番入れ替えるようにした
2024/01/28(日) 22:47:58.30ID:M9oLwnZS0
ドリームブースとLoRAのタブの中身が
レイアウトもパラメータがほとんど一緒というのが罠度高い
しかもデータの読み込みもLoRAのコンフィグを
ドリームブースのタブで読み込みしてもエラーにならなかったりトラップが複数あるw
2024/01/29(月) 01:11:03.26ID:/RorfY3B0
いやほんとにタブの中身ほぼ同じなんですね…
私も順番入れ替えるようにします、お騒がせしました
275名無しさん@お腹いっぱい。 (ワッチョイ 35f3-TUA6)
垢版 |
2024/01/29(月) 01:26:53.20ID:rzvaDXwn0
入れ替えって簡単にできるん?
kohya_gui.pyをエディタで開いて、それっぽいところを入れ替えてみたがエラー出て動かん
2024/01/29(月) 02:02:04.41ID:JC/gMScp0
kohya_gui.pyの以下の2行をDreamboothの上に移動しました。
with gr.Tab("LoRA"):
lora_tab(headless=headless)
277あぼーん
垢版 |
NGNG
あぼーん
2024/01/29(月) 12:29:07.79ID:4CdtnyAD0
ちょいと質問
今PCIE3.0×16のPCで1650使ってるんだか、流石に時間がかかってしかたがないのでグラボ買い換えるつもりなんだ
ただ、PCIE3.0のマザボに本来PCIE4.0用の3060とか4070とか挿したときの生成スピードの低下がどの程度かわからなくてさ

グラボ内で計算するので大差ないのか
本体とのやりとり発生するので大幅に低下するか知ってる人いたら教えて欲しい

PCの買い換えまでとなると流石に貯蓄の切り崩しがでかいので避けたいんだかどうやろ
2024/01/29(月) 12:33:18.52ID:/8rBDoj/M
>>278
ゲーム関係だと誤差みたいなもんとされてる
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況