【StableDiffusion】AI画像生成技術10【NovelAI】

■ このスレッドは過去ログ倉庫に格納されています
2022/11/03(木) 00:10:16.15ID:0dW1bfVB0
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

入力されたテキストから画像を生成するAI技術に関して語るスレです
StableDiffusion: google colabやローカル環境で実行可能なAI画像生成
NovelAI: 有料サブスク型AI画像生成サービス
(DALLE・Craiyon・Midjourneyの話題もOK)

★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
(以下のスレッドへ移動してください)
【Midjourney】AI関連総合17【StableDiffusion】
https://mevius.5ch.net/test/read.cgi/cg/1667381701/
AIイラスト 愚痴、アンチ、賛美スレ part12
https://mevius.5ch.net/test/read.cgi/illustrator/1666872303/

テンプレまとめ
https://rentry.co/zqr4r
編集コード「5ch」

前スレ
【StableDiffusion】AI画像生成技術9【Midjourney】
https://mevius.5ch.net/test/read.cgi/cg/1666139334/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
2022/11/03(木) 00:13:42.52ID:0dW1bfVB0
スレタイのMidjourneyをNovelAIに変えた(スレタイが長すぎるというエラーのため)
それに合わせて>>1の説明文も一部改修
3名無しさん@お腹いっぱい。 (ワッチョイ 19ad-FQW+)
垢版 |
2022/11/03(木) 01:02:24.31ID:yx05OOaT0
立て乙
2022/11/03(木) 01:06:46.74ID:qx5XNQAV0
>>1
やっとワッチョイ導入か・・・
2022/11/03(木) 01:51:11.08ID:0dW1bfVB0
AUTOMATIC1111版のUIが良すぎて他使う気にならん
あとは1111版が、UIそのまま使えるRadeon対応してくれればいいのに
2022/11/03(木) 01:54:08.00ID:pfIzmvgua
幼女にジャックオーチャレンジさせてたら1日終わってた
2022/11/03(木) 03:23:29.59ID:knkL58+L0
おすすめプロンプト教えてください
2022/11/03(木) 03:32:22.49ID:pfIzmvgua
loli
2022/11/03(木) 07:42:21.57ID:bz6qi//D0
assertive female
2022/11/03(木) 11:26:02.22ID:v+lUlKfS0
ちょっと見ない間に随分お客さん増えたな
正直プロンプト勢はなんUに誘導して技術者だけ残したいが
2022/11/03(木) 11:27:05.72ID:HoMsumRC0
>>1
2022/11/03(木) 11:32:22.70ID:xyc2zBkF0
sukebe oppai
2022/11/03(木) 12:45:14.84ID:Mh5yKIPc0
スレ立てとワッチョイ導入乙
2022/11/03(木) 13:08:56.20ID:bzHnQdq90
https://www.bilibili.com/video/BV1Vg411h7of/
音声自動生成も凄いな
色々と真っ黒だけど
2022/11/03(木) 14:55:04.85ID:yeR/zH1L0
何か荒れてると思ったら、イラスト板の愚痴スレで直接技術スレに誘導してるんだな
そんなら技術的なことだけじゃなくて暴れたい人が来るわけだわ

ワッチョイ立て乙
2022/11/03(木) 15:03:33.23ID:HoMsumRC0
Text2LIVE、推奨VRAM32GBらしいけど、24GBじゃ流石に厳しいかな…
Dreamboothみたいに軽量化が進むのを待つか
2022/11/03(木) 15:09:12.45ID:pfIzmvgua
いやいや32て
Vじゃない方のRAMかよ
2022/11/03(木) 15:09:25.71ID:pfIzmvgua
4090でいくらだっけVRAM
2022/11/03(木) 15:17:11.75ID:ePtBBKpC0
>>16
グラボじゃなくてAI用アクセラレーターの容量だから、グラボでも出来るようになるの待つかAI用アクセラレーターを買ってまでチャレンジするかの選択では
2022/11/03(木) 15:32:05.46ID:9NeDnz+za
>>17
遅くなってもいいからメインメモリー32GBで動いてほしいよね

メインメモリーなら64GBでもたいした金かからないし
2022/11/03(木) 15:46:34.49ID:JQYkbX540
たしか24だったはず
2022/11/03(木) 17:58:40.61ID:xyc2zBkF0
1111の単語強調の新旧設定って何が違うんじゃろかい
2022/11/03(木) 18:02:57.00ID:pfIzmvgua
よく知らないけどgithubのfeatureのとこに書いてたりしないのか
2022/11/03(木) 18:35:37.30ID:1Er+KXW00
>>22
旧:(((1.331倍に強める))) [[[1.331倍に弱める]]]
新:(1.331倍に強める:1.331) (1.331倍に弱める:0.751)
2022/11/03(木) 18:40:10.97ID:yeR/zH1L0
弱める方も()になったのか
[xx:0,21]とか一瞬数字どっちだっけってなって分かりにくかったからええ変更やな
2022/11/03(木) 18:42:42.50ID:1Er+KXW00
>>22
旧は、() 一重で1.1倍、[] 一重で1/1.1で、かぶせるごとに同じ倍率で強化される。
新は、単純に数字で倍率を指定する。
2022/11/03(木) 18:47:27.69ID:xyc2zBkF0
>>24
>>26
さんくす
2022/11/03(木) 18:52:59.68ID:pfIzmvgua
あれ最近feature見て前からこれだと思ってたわ
数値指定いいよね
2022/11/03(木) 19:31:13.95ID:qx5XNQAV0
>>24
説明wikiを見た感じだと旧が廃止されたと言うより新書式が追加されたみたいだ
(((((単語)))))みたいに()が多過ぎる事が増えたし倍率指定可能になったのか
2022/11/03(木) 19:36:00.94ID:g0gnvvB40
一か月以上前の話なんだけど
2022/11/03(木) 21:26:48.01ID:7KsYE46a0
声の分野で数年かかった進化が三ヶ月で起きてしまったから一ヶ月とか大昔に感じてしまうな
2022/11/03(木) 21:31:18.32ID:+rNa9VK10
丸括弧を任意数重ねる ((A))→丸括弧1つに付き1.1倍に強める
角括弧を任意の数重ねる [[A]]→角括弧1つに付き1,1分の1に弱める
丸括弧にコロンで区切って数字 (A:1.1)や(A:0.9) →数字の倍率に強める。数字を1未満にすると弱める

角括弧にコロンで区切って数字 [A:0.5] →プロンプトの適用ステップの調整、この場合「全体の50%からAという要素を加える」。わりと複雑なのでこれ以上の説明は省略

案外知らないみたいなのでおさらいに。
角括弧とコロンは書き方が似てても強弱とは全く別のシステムだからな
2022/11/03(木) 23:00:15.69ID:ISzYQBe10
>>1ワッチョイ立て乙

ここの人の大半がwebUI使ってるのかな
自分はあえて自前のしょぼ環境で遊んでるから最近のwebUI専門っぽい流れについていけないや
わかっててこうしてるわけだから別にいいんだけど
34名無しさん@お腹いっぱい。 (ワッチョイ 19ad-ofdD)
垢版 |
2022/11/03(木) 23:25:44.33ID:yx05OOaT0
>>32
こういう基礎知識置いてくれるの嬉しい。
僕みたいな初心者にはとても助かるよ。
2022/11/04(金) 01:00:54.93ID:31NImAUF0
絵文字とか2バイトもじが表示されないの解決したので

https://github.com/AUTOMATIC1111/stable-diffusion-webui/issues/3333
36名無しさん@お腹いっぱい。 (ワッチョイ 19ad-ofdD)
垢版 |
2022/11/04(金) 01:59:52.69ID:wLqUXW4t0
ウーム、HNやらTI試そうと思ったけどグラボのメモリ不足かぁ。
やっぱり3060には厳しいのかな。
2022/11/04(金) 02:48:52.51ID:7eTG9Hbw0
VAE Selection実装されてるな。
設定画面でVAE固定で選べる。
NovelAIのVAEを他のモデルに当てても専用のVAEよりよくなるケースが多かってんでシンボリックリンクをリネームしていたのだが、もうそんなことをしなくて良いようだ。
2022/11/04(金) 04:01:36.96ID:VOICmpyG0
モデル比率変えて混ぜてvae噛ませて比較とかしてたからありがたいんだけど
settingの中じゃなくて普段からチェックポイントとvaeと2つ選択できるようになると更に嬉しいな
2022/11/04(金) 06:12:28.74ID:J0YqTZuXa
>>33
最近はデータ新規学習やモデルデータ自作とかが当たり前の世界になってきて正直ついていけない所がある
40名無しさん@お腹いっぱい。 (ワッチョイ 11a5-ofdD)
垢版 |
2022/11/04(金) 06:46:46.16ID:SNxR3W8u0
SDの画像圧縮技術がすごいらしいけど
pngやjpgじゃなくてその形式でファイルに吐き出すことはできんの?
2022/11/04(金) 06:57:22.01ID:zJd0zUkLa
それ言い出した奴がコード上げててバイナリ保存してるだろ
圧縮率高いっても圧縮復元に4GBのモデルデータが必要になるっていうある意味で本末転倒なやつだからな
2022/11/04(金) 07:27:25.04ID:DKex/1Gsa
辞書を使う圧縮形式なんて普通に使われてるぞ
問題は展開速度の方だよ
2022/11/04(金) 07:49:31.53ID:zJd0zUkLa
jpgなら6kbのとこがsdなら5kbになります。1枚で1kbもお得ってレベルの効率化だから4GBだったら400万枚に相当する
もちろん何千万枚何億枚も扱うってなら恩恵にあずかれるし
辞書はよく使われてるけどここまで効率悪い辞書はそうそう使われないよ
44名無しさん@お腹いっぱい。 (ワッチョイ 1901-T+yX)
垢版 |
2022/11/04(金) 08:01:20.33ID:LqHAYjHf0
画像閲覧タブが2つになってExtensionsからimage historyOFFったら一つになった
相変わらずプレビュー画像クリックで次の画像出ても生成情報は更新されないのな
2022/11/04(金) 08:08:12.95ID:zbxQmRf20
VRAM 10GBでDreambooth使えるようになったっていうから1080tiでウキウキで回してるけど面白いなこれ
なかなか思ったようにいかないのはHNとかと一緒か
2022/11/04(金) 08:51:30.64ID:uGl6tOed0
>>38
Quicksettings list に、sd_vae て書き足してみ。ちょっと楽になるから
2022/11/04(金) 11:40:13.83ID:ClK14nla0
>>46
38じゃないけどサンクス
まさにやりたいことだったわ
2022/11/04(金) 11:55:44.46ID:+i6frDEoM
SDで圧縮って言うなら、半分に縮小してUpscaleした方がはるかに効率いいと思います。
2022/11/04(金) 12:44:31.95ID:jYFExM140
復元コストを度外視するなら、モデル名と呪文とシード値のテキストで1kbくらいになるのでは
量子化の工程が入るから、圧縮っていうほど元画像の忠実再現性はないと思うが
2022/11/04(金) 15:38:29.17ID:GkxNCQjBr
>>46
ああ、quicksettingsってそこに反映されるのね。
ついでにHyperNetwotkとHyperNetwotk強度も出したらすごく快適になった。これまでX-Yプロットの凡例なしで適用してたわw
51名無しさん@お腹いっぱい。 (ワッチョイ 19ad-ofdD)
垢版 |
2022/11/04(金) 17:11:54.92ID:wLqUXW4t0
ModuleNotFoundError: No module named 'tensorflow.python'
って言われたんだけど、tensorflowはどこにぶち込めばいいんだろ。
2022/11/04(金) 17:28:59.37ID:ZKLNSgo60
7900XTXがかなりコスパよさそうなんだがAMDのカードでdreamboothってできる?
環境整ってんのかな
2022/11/04(金) 17:39:09.79ID:ClK14nla0
>>52
今のところ新規で買うならNVIDIA以外はありえんね
コスパならRTX3060 12GBが鉄板
2022/11/04(金) 17:55:29.74ID:uGhLLMgN0
Dreambooth GUIもnVidiaがターゲット
あとRX 7900 XTX買うなら値段的に近い3900買った方が安牌な気がする
2022/11/04(金) 18:41:32.22ID:aITtjuhqr
AI使うならNVIDIA買うべき。AMDはゲームとかで近い性能が出したい人向けであって、機械学習に使おうとしたら対応しないソフトだらけで泣くぞ。
2022/11/04(金) 18:44:42.16ID:ZKLNSgo60
やっぱりきついのかぁ
7900買うのはやめとくわサンクス
2022/11/04(金) 19:10:20.44ID:VOICmpyG0
>>46
ありがとうありがとう
まさにこれが欲しかった
2022/11/04(金) 20:05:12.94ID:qfRDEbNXd
ここでする話題か分からんが、mimicが再始動したけど、あれって自分で用意した画像以外にもなんかベースになってる学習素材があるのかな
だいたいの画像生成AIはなんかがオープンソースで公開されたのがきっかけらしいから、そこで学習された画像になるのか?
2022/11/04(金) 20:56:40.60ID:AAbme5950
>>58
普通にSDベースなんかなと思ってたけどどうなんやろうね
SDベースなら心情的なクリーンさは他のサービスと正直どっこいどっこいな気もするよなあ
2022/11/04(金) 21:09:36.67ID:Di8U1jsJ0
バストアップイラストだけのクリーン画像で作ったSDに
TIしてるだけじゃないか
2022/11/04(金) 21:30:15.89ID:aeshogBVd
無断で著作物を学習素材として使う=クリーンじゃないって話なら
今ある画像生成AIにクリーンなやつなんてひとつもないだろうな
合法ではあるけど
2022/11/04(金) 21:36:34.88ID:b2ctWRTD0
お気持ちの問題だ
残留農薬たっぷり中国産野菜でも国産有機無農薬と書いておけば美味しく食べられる
2022/11/04(金) 21:58:00.58ID:uGl6tOed0
最初のリリース時と違って自前で学習するのも当たり前になってしまったから、
mimicにどれほどの価値が見いだせるか正直よくわからんな
で、あれは結局TIなのだろうか。再始動ならDBはともかく、HNとかも取り入れてそうだけど
2022/11/04(金) 22:02:53.95ID:0jBXpnOSd
NAIはダンボールで学習してるから嫌い、mimicは自分の画像だからOKって流れできてるよね
2022/11/04(金) 22:07:57.71ID:+FFT574z0
構図がすげえ限定されてるから
TIベースの強制img2imgで似たようなことできると思う。というか出来る
66名無しさん@お腹いっぱい。 (ワッチョイ 9168-TUMG)
垢版 |
2022/11/04(金) 22:17:11.06ID:/crn/wJ90
mimicは環境が変わりすぎて今更再稼働したところでな……
67名無しさん@お腹いっぱい。 (ワッチョイ a95f-SxIP)
垢版 |
2022/11/04(金) 22:27:37.32ID:xe1O169b0
mimicはGANじゃないの?
StyleGAN2をAnimeFaceデータセットで学習させたのと似てる気がする
2022/11/05(土) 05:16:15.61ID:bDpl8kTka
SDもGANだけどw
SD1.4ベースではないだろうね
2022/11/05(土) 07:47:23.31ID:yue4HkzD0
stable diffusionは名前の通りdiffusion modelというノイズがどうこうという学習モデルの改良版のlatent diffusion model使っているんじゃないの
2022/11/05(土) 09:32:36.50ID:PrWUAu4H0
>>67
俺もそんな感じだと思う。SD発表前から自前のを作ってたし
2022/11/05(土) 12:23:57.71ID:/8fkZ/qR0
>>32
これってネガティブプロンプトに (A:1.3)とか書くと
Aを除去する効果が1.3倍になるってことでいいんかな
2022/11/05(土) 12:55:29.56ID:jKwGiDnld
>>71
方向性としてはそう
ネガティブプロンプトに強調をつけると強めに除去する
2022/11/05(土) 20:59:42.69ID:pBxwJWnba
(red) (hair)と(red hair)だと違う意味になる??
2022/11/05(土) 21:27:39.96ID:IKYcNs0K0
赤が画像全体にかかるか赤髪強調になるかぐらいの違い
2022/11/06(日) 12:20:39.48ID:mMotORCe0
>>73
旧仕様の1111なら、プロンプトのパース処理で '(' が出てきたらその時点でトークンの強度を1.1倍、 ')' が出てきたら1/1.1 みたいな処理になってたから、そのふたつに違いはないはず。
今のがどんな処理に変わってるのかはわかんね。
2022/11/06(日) 13:44:41.15ID:ssKzkWif0
AUTOMATIC1111にも実装されるかしら
https://twitter.com/Yamkaz/status/1589052487721717760?t=40Q_D0xinQVq_V6UgrQaGQ&s=19
https://twitter.com/5chan_nel (5ch newer account)
2022/11/06(日) 13:49:12.87ID:5fBMedEI0
sampler めっちゃ増えてたな
2022/11/06(日) 13:51:56.64ID:mja3HTm90
>>76
https://github.com/AUTOMATIC1111/stable-diffusion-webui/issues/4280
2022/11/06(日) 13:54:01.80ID:mja3HTm90
こっち貼ればよかった
https://github.com/AUTOMATIC1111/stable-diffusion-webui/commit/bbfdfa52c5f0ad4f0660b465b39416899c80a17a
2022/11/06(日) 14:00:52.28ID:1tzc6lHf0
もう実装済みやね
2022/11/06(日) 14:18:30.82ID:rscbsgkvM
red hairにしても服とか背景にも影響するよな
エリア限定する構文ないのかね
2022/11/06(日) 14:19:35.62ID:zjZl80ZJ0
>>81
これもNAI実装予定リストで見た記憶
2022/11/06(日) 14:26:28.49ID:ssKzkWif0
>>79
いつのまにいいい
2022/11/06(日) 14:57:19.29ID:rscbsgkvM
AM1111で{}使えてる?
()と{{}}が同じ効果のはずだけど()のが強い気がする
2022/11/06(日) 15:15:15.79ID:ssKzkWif0
>>84
そもそも使えない
Automatic1111とNAIはカッコの使い方や倍率が違うのよ
2022/11/06(日) 15:16:26.39ID:mnX/Jido0
NovelAIだと+~+で区切ると効果範囲を限定できるとか
記号は「+」でなくてもよく、限定する効果がより高まる記号もあるかもみたいな話だった

250 名前:今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 6988-P3uR)[sage] 投稿日:2022/11/05(土) 01:38:23.94 ID:ZK5ok5dV0 [1/9]
>> 229
技術部ディスコからの引用やけど
+shiny hage+ ←こんな感じで要素を意味のない記号で区切るとその要素が外に漏れない(っぽい
この場合「shinyがハゲにだけ掛かって他には影響を及ぼさない」(っぽい

これも引用やけど、「pixel」系の単語を背景と人物で切り離すのに成功した例

自分もある程度は試して効果実感しとるからwikiに書こうかと思っとるけど、もう少し検証したい
https://i.imgur.com/g4vvFqm.png
https://i.imgur.com/lq6V1e4.png
2022/11/06(日) 15:21:16.33ID:ssKzkWif0
>>86
だからそれは単なる眉唾だと何度言えば
効果はまったく期待出来ないよ
+とか使わなくてもガチャれば出来るし
あくまでも確率の問題
確定じゃない情報をwikiとかに書かないで欲しいんだが
88名無しさん@お腹いっぱい。 (ワッチョイ 9201-84Ua)
垢版 |
2022/11/06(日) 16:15:17.57ID:y+UNZPkx0
表情差分ってNovel AIだとどうやって生成するんですか?
2022/11/06(日) 16:26:39.26ID:ZrCejMl90
>>88
https://seesaawiki.jp/nai_ch/d/%c7%ed%a4%ae%a5%b3%a5%e9%a5%c6%a5%af
90名無しさん@お腹いっぱい。 (ワッチョイ 8101-Cw2/)
垢版 |
2022/11/06(日) 16:27:59.13ID:J2Iau4RU0
誰かおすすめの実写モデル教えてーや
2022/11/06(日) 16:40:59.93ID:mja3HTm90
LDSRの黒帯治ったらしい
2022/11/06(日) 16:50:56.47ID:mMotORCe0
>>91
先月半ばくらいには治ってたと思う。
2022/11/06(日) 16:53:25.98ID:mMotORCe0
>>91
んん、この環境作ったの21日だから、半ばじゃなく下旬やな……
2022/11/06(日) 16:58:36.32ID:mja3HTm90
https://github.com/AUTOMATIC1111/stable-diffusion-webui/commit/6603f63b7b8af39ab815091460c5c2a12d3f253e
95名無しさん@お腹いっぱい。 (ワッチョイ 7922-chQ5)
垢版 |
2022/11/06(日) 17:01:54.19ID:mMotORCe0
ということは、ここ最近使ってた縦横サイズがたまたま黒帯出ない条件になってたってことか?
2022/11/06(日) 17:02:44.33ID:ssKzkWif0
>>90
Stable Diffusion
97名無しさん@お腹いっぱい。 (ワッチョイ 8101-Cw2/)
垢版 |
2022/11/06(日) 17:10:13.80ID:J2Iau4RU0
>>96
ありがとうな!
98名無しさん@お腹いっぱい。 (ワッチョイ 9201-84Ua)
垢版 |
2022/11/06(日) 17:31:14.52ID:y+UNZPkx0
>>89
サンクス
2022/11/06(日) 18:10:57.41ID:4teYXyrB0
stable-diffusion-webuiで
Aesthetic Gradients使ってptファイル取り入れようとしたんだけど
AttributeError: 'dict' object has no attribute 'T'
になってできません。どうすればいいのでしょうか?
2022/11/06(日) 18:19:51.10ID:5fBMedEI0
DPM++ 2M Karrasが収束早くて使いやすいかなー
2022/11/06(日) 18:23:24.70ID:bgXqYp4l0
>>87
5%が10%になるならちょっと効果はありそうだけど
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況