X

【StableDiffusion】画像生成AI質問スレ01【NovelAI】

■ このスレッドは過去ログ倉庫に格納されています
2023/01/24(火) 11:50:04.82ID:Rr060Z0q
Stable Diffusionをはじめとする画像生成AIに関する質問用のスレッドです。
次スレは>980が立ててください。

テンプレは>2以降に
2023/02/24(金) 14:00:24.51ID:yrrDAqxl
ホーチミンがやらかしてるか
他のお行儀の悪いExtensionが原因かどっちだろうな
後者がめんどくさいパターン
2023/02/24(金) 14:04:47.37ID:yrrDAqxl
そもそもGradioのinputsにリストで渡すしか複数の値渡す方法ないの厄介なんよ……
俺が無知なだけで他に方法があるのかもしれんが
2023/02/24(金) 14:53:12.12ID:n9M1jpjB
念のためpythonもgitもアンインストールしてから公式のインストーラを試してみたらこれだけでいけたよ

ダウンロードしたzipを解凍
モデルファイルを配置
update.batを実行
run.batを実行

ほかに何もインストールする必要はなかった
2023/02/24(金) 15:09:41.24ID:rPOtmg2h
>>672-674
どうもありがとうございます。

まずは家帰ったら例のアズレンでチャレンジしたいと思います。(あれは凄いと思ったのがキッカケなので)
自炊っすかー自分のGPUは今3GBしかなくてすぐメモリオーバするんで
本腰入れてやるならやはり買い換えないと駄目ですよね
2023/02/24(金) 15:23:45.01ID:+VS1HH10
>>678
zipのrun.batのヤツはpre版だから精度悪い感じに思えたけど、特に背景が
pre版のupdate.bat押すとver1.5>2.0に上がるのかね?
2023/02/24(金) 15:28:18.96ID:e4ox0Vfq
としあきバッチで学習を行いたいのですが
モデルとか画像とか何をどこに置けばいいか全然
わからないので教えてください
2023/02/24(金) 15:34:53.19ID:f7Eh+Tjc
うつ伏せの人間をメインとして、手前に顔のどアップ 奥に足といった構図が何故か上手くできません・・・。
何かコツありましたらご教示頂きたく
683553
垢版 |
2023/02/24(金) 16:12:33.27ID:kI+YlM5r
これからRTX3060買ってdream boothするつもりなんやけど、モノが届くまでにすべきこととしては学習元の画像は512×512にリサイズしとくくらい?
2023/02/24(金) 16:15:28.51ID:69sbVIwr
>>683
LoRAでええやん
そっち調べとき
Dreamboothは多分Vramギリギリだと思うぞ
2023/02/24(金) 16:20:28.28ID:r2yvNwX/
皆さんに質問なんですけど、
画像サイズはどれくらいで作ってますか?
デフォルトの512×512ですか?
2023/02/24(金) 16:23:56.75ID:qeybarNY
大きいと顔だらけのオバケがたくさん描き出されるからなぁ
2023/02/24(金) 16:24:23.61ID:69sbVIwr
>>680
公式のワンクリ版は通常版と導入構成は違うけど、アップデートすれば基本的に中身は同じ
生成結果で劣るようなことは起きない

ただ、pythonが無い環境だと動かないextensionとかはある
あれに同梱されてるpythonはwebuiを動かすためだけのパス設定しかしてないから
688名無しさん@お腹いっぱい。
垢版 |
2023/02/24(金) 16:26:03.21ID:+VS1HH10
最初のseedとか決めるtxt2imgtの段階では低解像度4:3だね、800x600とか1024x768とか
そこから解像度上げるときはそっからimg2imgでアップスケール
あんま高い解像度だとデフォ設定だと多脚化したりモヤ生成になったり時間かかったりメモリサイズエラー(12GB)
2023/02/24(金) 16:30:09.74ID:r2yvNwX/
なるほど、
リサイズがよくわからなく大きいサイズで作ってました
960×1260です。

やはり小さいサイズで大量に作ってそこからリサイズがベストなんですね。
2023/02/24(金) 16:31:05.29ID:+VS1HH10
>>687
ありがとう、そうなるのか、中身が一緒なら良いか

確かに、ワンクリ版使っててちょっと凝った事しようとしてエラーで読み込ませれなかった事あった
それが契機で最近公式を自力で翻訳して面倒な通常版入れなおしたんだよね
691683
垢版 |
2023/02/24(金) 16:31:10.20ID:kI+YlM5r
>684
LoRAのつもりやった、サンクス!

>688
LoRAは512x512だと思てた…。
4:3なんや、、、そっちで準備しますわ!
2023/02/24(金) 16:34:16.81ID:+VS1HH10
>>691
ごめんアンカー忘れたけど>>685宛なんだワ
LoRAは週末にでも学習対象見つけてやってみるよ
693683
垢版 |
2023/02/24(金) 16:35:13.79ID:kI+YlM5r
各画像サイズはバラバラでもOK?

あと生首(首から上の画像)ってどんなサイズにしてます?
300x300くらいのしかないんやけど、、、
フォトショとかでアップスケールしなきゃダメ?
2023/02/24(金) 16:38:58.32ID:9HbRMumC
chilloutmix
sunshinemix

モデルデータはこれしか入れて無いんだけど
shinzo abe,のデータまで入ってんの?
2023/02/24(金) 16:45:19.35ID:n9M1jpjB
>>680
1111のバージョンと学習モデルのバージョンは別のものです
1.5とか2.1は公式の学習モデルのバージョンのことで、両方入れておいてどちらかを選んで使うこともできます
1111はバージョン番号で管理されていません(よね?)

公式のインストーラのはupdate.batすればgit cloneからuser-webui.batでインストールしたのと変わらないでしょう

>>687
> pythonが無い環境だと動かないextensionとかはある
えーそうなんか、今ちょうどpython入っていないからなにか試してみよう
zipインストーラ版で対策はあるのかな
2023/02/24(金) 16:48:02.43ID:ue6JrpIc
>>694
SDの公式モデルSD1.5か2.1は色んな著名人が学習されてる
当然アメリカ人のほうが入ってる率は高いけど
トランプ元大統領とかハリウッド俳優とか結構いっぱい出てくる

なので、そこから派生している全てのモデルには当然遺伝子として受け継がれてる
NAIなら二次元化したあべちゃんが出るよ
2023/02/24(金) 16:48:21.27ID:g1lvjV2j
としあきのlora使い方教えてよ
2023/02/24(金) 16:54:35.65ID:ue6JrpIc
>>695
そもそも中身のwebui部分はアプデ出来ても、追加でgitしろとかpipしろとかは全部出来ないからそこが一番不便かもな
バッチ書けば出来るけどそこまでする人はそもそもワンクリなんぞ使わないだろうし
そんでもNMKDよりは推すがね
2023/02/24(金) 17:01:27.61ID:+VS1HH10
>>695
automatic1111のpreと通常版でインストールされるStable Diffusionのバージョンが1.5ベースか2.0ベースかの違いと思ってて
Stable Diffusionのバージョン違いはいう通り学習データは違うし、
バージョンによってpromptの解釈が違うみたいな記事を読んだ気がする

automatic1111そのものはGUI化を手助けする便利なツールって認識
2023/02/24(金) 17:02:43.16ID:+VS1HH10
>>696
あれ俺このレス昔どっかで見た気がする
2023/02/24(金) 17:05:30.77ID:wPD2sSDa
txt2imgの↙使えなくなった?
2023/02/24(金) 17:25:57.26ID:ErGpTIAh
lora使うためのモデルや学習画像などのフォルダ
をどこに置けばいいんですか?
2023/02/24(金) 17:27:10.33ID:ErGpTIAh
>>702
毎回単発IDになってしまいますが同じ人です
お願いします
2023/02/24(金) 17:28:14.21ID:5YERkfpU
>>703
https://note.com/uunin/n/n3f09b93df575
ここにレクチャーありますん
2023/02/24(金) 17:31:27.57ID:ue6JrpIc
>>703
日本語フォルダとかじゃなければ基本どこでもいい
どうせ学習時にパスを指定するから
モデルもwebuiで使ってるモデルのパスを指定するし

>>704
それかなりビギナー向けの導入方法だから、本格的にやるならとしあきあたりを参考にしたほうがいいよ
2023/02/24(金) 17:47:21.96ID:n9M1jpjB
>>699
>automatic1111のpreと通常版でインストールされるStable Diffusionのバージョンが1.5ベースか2.0ベースかの違いと思ってて

そういう関係ではないと説明しているつもりなんだけど、どうすれば誤解が解けるのか…
学習モデルの1.5と2.1はどちらも自動ではインストールされず自分でダウンロードしてフォルダに入れるでしょ

zipインストーラ版に公式学習モデルのバージョン2.1だけをを入れて使うこともできるし、
git cloneするほうに公式学習モデルのバージョン1.5だけを入れて使うこともできるのよ

>Stable Diffusionのバージョン違いはいう通り学習データは違うし、
>バージョンによってpromptの解釈が違うみたいな記事を読んだ気がする

確かに、公式学習モデルの1.x系統と2.x系統はプロンプトの解釈が違ってて、出てくる絵が全然違うのはその通り
でもそれはAUTOMATIC1111/WebUIのインストール方法の違いとはまったく関係ない話だよ
2023/02/24(金) 17:47:24.34ID:kJFyq0tX
ちょっとここで聞いていいのかわからないんだけど質問させて
civitaiでモデルのレビューを画像付きでアップすると1日くらいでアップした画像が削除(image removed)されるんだけど理由がまったく分からないんで理由わかる人がいたら教えてください

具体的にはこんな画像でR18タグも念のためつけてる
i.imgur.com/8wxTmXF.png
i.imgur.com/QVqyYAd.png
i.imgur.com/5t9P2O8.png
i.imgur.com/V0hdQBZ.png

20枚中生き残ったのはこの1枚。どうして…
i.imgur.com/tZyjkdx.png
2023/02/24(金) 17:49:38.13ID:Moefi3Qz
安心と信頼のとしあき
2023/02/24(金) 18:09:48.74ID:kJFyq0tX
>>707
なんか確実じゃないけど分かったかも
Promptに loli って入ってるから消されたかもしれない
次からこの単語を入れてない画像をアップするようにしてみよう
2023/02/24(金) 18:38:06.39ID:CPYCvuE3
>>705
そのとしあきのが導入まではわかりやすいけど
その後使い方の説明が雑でわからない
2023/02/24(金) 18:44:15.07ID:Y4PAvQ+z
AIのChatGPTに聞いた方が簡潔にまとめて教えてくれるぞ
2023/02/24(金) 18:44:40.39ID:9HbRMumC
>>696
画像は全部モデルデータの中にあると
思ってたんだけど
Stable Diffusion web UIの中にも
入ってるの?

ネット切断してもトランプ大統領が出るってこと?
2023/02/24(金) 18:47:21.62
>>711
そいつポンコツだったよ
2023/02/24(金) 18:49:03.79ID:O3PVxFMk
>>712
画像と言う形では入って無いんじゃないかなぁ
2023/02/24(金) 18:51:26.48ID:QHsrIeTj
>>712
学習したデータとしてモデルファイルの中にいるんだよトランプさんは
あべちゃんも初音ミクもレディー・ガガもスパイダーマンもみんな一緒にね
オンラインにアクセスしているわけではないよ
2023/02/24(金) 18:54:30.04ID:+VS1HH10
>>712
画像データを作るベースの基本となるNovelAIに世界の著名人が一通り入ってる
モデルデータを作るときにはイチから作らずにその基本ベースの情報を使用する
そのためあらゆるモデルデータには、超薄いながらも著名人のデータが入ってる
なんで安倍とかトランプみたいな話するんだよw
2023/02/24(金) 18:56:11.81ID:9HbRMumC
>>714
入ってないデータはソフトが探してきてるの?
chilloutmix
sunshinemix
モデルデータはこれしか入れて無いんだけど
shinzo abe,のデータまで入ってんの?
安倍さんがアニメ画像で出てきて驚いたんです

ロリ画像とか作ってるから外部と通信するのがなんか嫌なんで
気にしてるところです
2023/02/24(金) 18:58:14.16ID:9HbRMumC
>>714->>716

なるほど安心しました
ありがとうね
2023/02/24(金) 19:05:21.03ID:yoEB2Wkw
>>717
通信もしてないし何か情報をダウンロードして生成してるわけでもないから心配すんなw
オフラインでも動くしどこにも通報されないから好きなだけ好きな画像を生成すればいいぞ

>>716
NovelAIはStablediffusion公式モデル1.4にdanbooru産のイラスト画像を追加学習して作られたものだよ
なのでNovelAIで出力される実写っぽい背景もトランプもあべちゃんも全てSD時代に学習されたものなのだ
2023/02/24(金) 19:08:11.40ID:O3PVxFMk
生成された絵をGoogleの画像検索に掛けても同じ絵は見つからなかったよ
2023/02/24(金) 19:19:48.00ID:M2wibWPN
Loraで近いと似てるのに、離れると全然別人になるのは
どう回避すればよいのでしょうか

素材は全身のバージョンを80枚、顔のアップを40枚程で学習したものを
それぞれ呼び出したりしてるんですがどう調合しても離れると顔が壊れてしまって

GPUの性能の問題?
2023/02/24(金) 19:32:32.95ID:qoigDgwQ
基本、よっぽど古いGPUじゃない限り、性能で絵は変わらんよ
遠近で同じ顔学習してない問題だと思う
2023/02/24(金) 19:35:00.23ID:QHsrIeTj
そもそも遠景が弱いのはSDの仕様
2023/02/24(金) 19:51:28.58ID:M2wibWPN
>>722,>>723
ありがとうございます
遠近で同じ顔の素材準備して学習してみます
2023/02/24(金) 20:36:48.43ID:n9M1jpjB
>>698
考えてみたら、そうなったらgitやpython 3.10.xをインストールすればいいだけの話だった
726名無しさん@お腹いっぱい。
垢版 |
2023/02/24(金) 21:02:05.15ID:p+krr9kl
>>711
ChatGPTは2021年9月までしか学習してないから普通に無理だと思うぞ。まぁでもコマンドプロンプトとか周りの問題ならいい感じに答えてくれるけど。
2023/02/24(金) 21:36:25.00ID:0Uy5JjfT
>>683
LoRAの成果画像を見ておくことがまずやっておくことだろうな
2023/02/24(金) 21:45:10.06ID:yqrLvruN
>>685
640
960
2023/02/24(金) 22:25:05.31ID:yqrLvruN
RTX3060のパソコンが
アークで129800円で売ってるんで
それ買えばいいよ
2023/02/24(金) 22:25:36.27ID:yqrLvruN
>>722
グラボの世代で変わるって話はどうなったんや
2023/02/24(金) 22:39:17.46ID:IkHwu+4x
かたくなに多人数出してくれない時と出してくれる時の差は何なんだろう
2023/02/24(金) 22:47:35.77ID:9HbRMumC
512.512で40秒くらい掛かるけど
いいグラボだと5秒でスパっと出るんですね
2023/02/24(金) 23:13:28.37ID:4EhI6V9u
>>730
変わるってだけで処理が極端に劣化してるわけでもあるまい
あとあれは性能(処理速度)じゃなくてもっと根底の問題なはず
2023/02/25(土) 00:22:38.28ID:ZtR4zMyT
>732
8秒で16枚です(バッチ)
2023/02/25(土) 05:12:23.28ID:K7Q9HNkG
(なんで生成速度の話で解像度もサンプリングステップも無しで何秒何枚とか言うんやろ)
2023/02/25(土) 06:30:41.85ID:khlw3qYx
>>735
まったくだ
2023/02/25(土) 06:36:08.73ID:ZtR4zMyT
それは簡単
ベースモデルで測らないと物差しにならないから
物差しがバラバラだと指標にはならないのです
2023/02/25(土) 06:43:11.54ID:khlw3qYx
これがZ
2023/02/25(土) 08:04:10.84ID:K7Q9HNkG
より簡単な導入を模索してみてはどうだろう
2023/02/25(土) 11:22:16.01ID:IyG+yWPm
>>735
始めたばかりの人にとってはAUTOMATIC1111の初期設定で回した場合なんじゃね
最初は多分変更しないだろうし
2023/02/25(土) 11:44:38.74
>>740
常識で考えたら普通はデフォ設定での話なんだけどねw
2023/02/25(土) 12:33:48.68ID:sVJxqPQ0
>>735
アスカベンチって言葉はメジャーじゃないですもの
2023/02/25(土) 13:31:42.78ID:Vr6StZKp
正直アスカベンチって単語を完全に理解した頃には、初期設定欠片も記憶にないぐらい使い倒した後だった
2023/02/25(土) 13:43:50.90ID:i3wqeiMx
つまり我々には新たなベンチが求められている?
2023/02/25(土) 14:16:59.00ID:UozfJXqO
最近のコントロールネットだの学習だのかませてる環境に比べたら
アスカベンチって軽すぎて
ベンチマークというよりはギリ動作するかどうかの確認用だよな
2023/02/25(土) 16:04:48.81ID:gE2V/5tL
1111版で画像が灰色になるのはどう直すのでしょうか?
2023/02/25(土) 16:10:58.31ID:6kI1Tnja
>>746
vae入れてなくて色褪せてるんじゃなくて?
2023/02/25(土) 16:55:50.85ID:gE2V/5tL
>>747
ありがとう
2023/02/25(土) 18:27:54.72ID:2nPLXsqm
http://imgur.com/4xJNdva.png
ローカル版使おうと思いPCを新調したいんですが
このスペックだと余裕で使える感じでしょうか?
2023/02/25(土) 18:30:09.28ID:IyG+yWPm
>>749
よ ゆ う
751名無しさん@お腹いっぱい。
垢版 |
2023/02/25(土) 18:38:27.45ID:eXTvv66M
>>749
Ryzenやめた方が良くない?CUDAの問題で
2023/02/25(土) 19:00:42.27ID:6AO/FmkI
関係ないぞ
2023/02/25(土) 19:16:13.78ID:yxniiG4A
グラボがNvidiaなら大丈夫
CPUは同じの使ってるわ
2023/02/25(土) 19:17:15.27ID:6Mru4oxr
loraの設定っていちいちやらないといけないんですか?
失敗ばかりなので毎回やるたびに英語の質問が多くて疲れるんですけど…
2023/02/25(土) 19:26:13.26ID:6tR0UApW
>>749
正直、vRAM量的には余裕ではないけど、平均値は越えてる
2023/02/25(土) 19:28:09.47ID:Nmq0Knyj
2年前に3060Tiが同じ値段だったと思うと感慨深いな
2023/02/25(土) 19:40:20.65ID:ZtR4zMyT
>749
正直VRAM命なので12MBは使えるのが1年あるか無いかだと思いますよ
1年後にこの言葉を思い出してください
それが革ジャンの戦略だし
2023/02/25(土) 20:04:50.55ID:EkBQ0CeH
みなさんありがとうございます。
>>757
言ってることがよくわからないのですがどういう意味でしょうか?
1年後にはAI技術が進化するからVRAM12だと1年後の技術にはついていけないという意味でしょうか
2023/02/25(土) 20:07:24.03ID:OI9iea2W
コマンドライン版なら一発なんじゃないか
試したことないけど
てかEasy Training Scriptsがまた更新されてるな
760名無しさん@お腹いっぱい。
垢版 |
2023/02/25(土) 20:08:00.29ID:bEJ2hjHF
おい!先輩術士!SD-WebUIの拡張にDreamBooth入れて学習しようとしてるんだが
うまくいかないぞ!PCスペックは満たしている。学習も完了する。
だけど学習完了したカスタムモデルを使って画像を作成するとflortの値が間違ってる
ってエラーが出る 助けてくだしゃぁ 学習途中のサンプル画像も真っ黒だ 
学習前はちゃんとサンプル画像でた 
761名無しさん@お腹いっぱい。
垢版 |
2023/02/25(土) 20:10:50.11ID:eXTvv66M
>>752-753
そーなんか、俺もちょうどmacから新調する所だからradeonにビビってた
まあ安牌でIntelにするけど
2023/02/25(土) 20:12:44.87ID:ZtR4zMyT
https://wikiwiki.jp/sd_toshiaki/%E4%B8%8D%E5%85%B7%E5%90%88%E3%81%AA%E3%81%A9
2023/02/25(土) 20:15:25.32ID:6tR0UApW
>>758
とりあえず
「AI画像生成におけるvramの優位性」について調べた方がいい
こだわりぐあいによっては半年経たぬまにグラボ買い換える羽目になる
少なくとも12GBは「何も気にせず生成できる」っていうスペックでは、ぜんぜん無い
2023/02/25(土) 20:19:51.73ID:IyG+yWPm
そうとも、どちらとも言えない
なので答えは誰もわからない
何気に、ものすごい少ないVRAMで色々出来るようになる可能性も無いわけではないから

ただ、今は3060vram12gbあたりが一番コスパ良く楽しめるグラボだってだけ
2023/02/25(土) 20:25:09.01ID:qHxrRCoX
パイソンのソースコード読める人ってSDがどうやって動いてるとか分かって使えるの?
それとも読めようが関係なくワイと同じように「なんかえっちな絵出てくる😊」って感じなん?
2023/02/25(土) 20:27:33.90ID:OI9iea2W
Python云々以上にAIの知識がないとちんぷんかんぷんだろうね
2023/02/25(土) 20:28:07.31ID:UozfJXqO
Python 自体はめちゃくちゃ読みやすいから何を呼び出してるかぐらいわかるだろ
その呼び出してるものの中身が全然わけわかめだろうけど
2023/02/25(土) 20:28:15.99ID:6tR0UApW
>>749 で書いてる「余裕で」のニュアンス次第で選ぶVRAMの量は全然変わってくるしな
因みに今3060(12GB)使ってるけど、現時点では生成時の処理速度はそんなに困ってないけどメモリ足りないで今まさに困りまくってる
なので使い方にも依るしなぁ
2023/02/25(土) 20:31:50.65ID:qHxrRCoX
パイソンだけじゃなくて論文も読んで理解できないとダメなのね
改良してる人たち凄まじいわ感謝します🙏
770名無しさん@お腹いっぱい。
垢版 |
2023/02/25(土) 20:32:24.39ID:bEJ2hjHF
>>762
反応してくれてありがとう;;
--precision full --no-halfは16x0系の描画バグ対策
だと文献で読んだが3080tiもあてはまるんだろうか
通常のt2iで作る画像が黒いわけじゃなくて
学習途中に経過をサンプルとして出力してくれる
もの(そうだと思ってるだけかも?)がすべて真っ黒なんです
とりあえず試してみます ありがとうございます
2023/02/25(土) 20:37:50.80ID:ZtR4zMyT
因みに
--no-harf-vaeは
4090でも効果あったよ
2023/02/25(土) 20:47:47.51ID:j9hYSOCT
単純にVAEに何かしら問題があってlatentから画像に出来てないんじゃないの
2023/02/25(土) 20:51:37.76ID:6kI1Tnja
>>768
でけえに越したことはないだろうけどたけえww
3060 12GBかなやっぱりコスパてきに進めちゃうのは
774名無しさん@お腹いっぱい。
垢版 |
2023/02/25(土) 20:52:55.69ID:nt+daEDA
遅くても良いから普通のメモリも使わせてくれれば良いのに
それなら32GB追加出来る
2023/02/25(土) 21:08:57.31ID:A6hO6RC2
Mac m1環境でWebUIをインストールして立ち上がるとこまで行ったけど
生成ボタン押しても反応ない

To create a public link, set `share=True` in `launch()`.
Error completing request
からはじまるエラーがずらーとでてChatGPTにきいたらアクセス権限じゃないかと言われ
みてみたけど問題なさそうでこのエラーがでるのは変わらず
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況