X



【StableDiffusion】AI画像生成技術10【NovelAI】

■ このスレッドは過去ログ倉庫に格納されています
2022/11/03(木) 00:10:16.15ID:0dW1bfVB0
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

入力されたテキストから画像を生成するAI技術に関して語るスレです
StableDiffusion: google colabやローカル環境で実行可能なAI画像生成
NovelAI: 有料サブスク型AI画像生成サービス
(DALLE・Craiyon・Midjourneyの話題もOK)

★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
(以下のスレッドへ移動してください)
【Midjourney】AI関連総合17【StableDiffusion】
https://mevius.5ch.net/test/read.cgi/cg/1667381701/
AIイラスト 愚痴、アンチ、賛美スレ part12
https://mevius.5ch.net/test/read.cgi/illustrator/1666872303/

テンプレまとめ
https://rentry.co/zqr4r
編集コード「5ch」

前スレ
【StableDiffusion】AI画像生成技術9【Midjourney】
https://mevius.5ch.net/test/read.cgi/cg/1666139334/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
2022/11/05(土) 12:55:29.56ID:jKwGiDnld
>>71
方向性としてはそう
ネガティブプロンプトに強調をつけると強めに除去する
2022/11/05(土) 20:59:42.69ID:pBxwJWnba
(red) (hair)と(red hair)だと違う意味になる??
2022/11/05(土) 21:27:39.96ID:IKYcNs0K0
赤が画像全体にかかるか赤髪強調になるかぐらいの違い
2022/11/06(日) 12:20:39.48ID:mMotORCe0
>>73
旧仕様の1111なら、プロンプトのパース処理で '(' が出てきたらその時点でトークンの強度を1.1倍、 ')' が出てきたら1/1.1 みたいな処理になってたから、そのふたつに違いはないはず。
今のがどんな処理に変わってるのかはわかんね。
2022/11/06(日) 13:44:41.15ID:ssKzkWif0
AUTOMATIC1111にも実装されるかしら
https://twitter.com/Yamkaz/status/1589052487721717760?t=40Q_D0xinQVq_V6UgrQaGQ&s=19
https://twitter.com/5chan_nel (5ch newer account)
2022/11/06(日) 13:49:12.87ID:5fBMedEI0
sampler めっちゃ増えてたな
2022/11/06(日) 13:51:56.64ID:mja3HTm90
>>76
https://github.com/AUTOMATIC1111/stable-diffusion-webui/issues/4280
2022/11/06(日) 13:54:01.80ID:mja3HTm90
こっち貼ればよかった
https://github.com/AUTOMATIC1111/stable-diffusion-webui/commit/bbfdfa52c5f0ad4f0660b465b39416899c80a17a
2022/11/06(日) 14:00:52.28ID:1tzc6lHf0
もう実装済みやね
2022/11/06(日) 14:18:30.82ID:rscbsgkvM
red hairにしても服とか背景にも影響するよな
エリア限定する構文ないのかね
2022/11/06(日) 14:19:35.62ID:zjZl80ZJ0
>>81
これもNAI実装予定リストで見た記憶
2022/11/06(日) 14:26:28.49ID:ssKzkWif0
>>79
いつのまにいいい
2022/11/06(日) 14:57:19.29ID:rscbsgkvM
AM1111で{}使えてる?
()と{{}}が同じ効果のはずだけど()のが強い気がする
2022/11/06(日) 15:15:15.79ID:ssKzkWif0
>>84
そもそも使えない
Automatic1111とNAIはカッコの使い方や倍率が違うのよ
2022/11/06(日) 15:16:26.39ID:mnX/Jido0
NovelAIだと+~+で区切ると効果範囲を限定できるとか
記号は「+」でなくてもよく、限定する効果がより高まる記号もあるかもみたいな話だった

250 名前:今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 6988-P3uR)[sage] 投稿日:2022/11/05(土) 01:38:23.94 ID:ZK5ok5dV0 [1/9]
>> 229
技術部ディスコからの引用やけど
+shiny hage+ ←こんな感じで要素を意味のない記号で区切るとその要素が外に漏れない(っぽい
この場合「shinyがハゲにだけ掛かって他には影響を及ぼさない」(っぽい

これも引用やけど、「pixel」系の単語を背景と人物で切り離すのに成功した例

自分もある程度は試して効果実感しとるからwikiに書こうかと思っとるけど、もう少し検証したい
https://i.imgur.com/g4vvFqm.png
https://i.imgur.com/lq6V1e4.png
2022/11/06(日) 15:21:16.33ID:ssKzkWif0
>>86
だからそれは単なる眉唾だと何度言えば
効果はまったく期待出来ないよ
+とか使わなくてもガチャれば出来るし
あくまでも確率の問題
確定じゃない情報をwikiとかに書かないで欲しいんだが
88名無しさん@お腹いっぱい。 (ワッチョイ 9201-84Ua)
垢版 |
2022/11/06(日) 16:15:17.57ID:y+UNZPkx0
表情差分ってNovel AIだとどうやって生成するんですか?
2022/11/06(日) 16:26:39.26ID:ZrCejMl90
>>88
https://seesaawiki.jp/nai_ch/d/%c7%ed%a4%ae%a5%b3%a5%e9%a5%c6%a5%af
90名無しさん@お腹いっぱい。 (ワッチョイ 8101-Cw2/)
垢版 |
2022/11/06(日) 16:27:59.13ID:J2Iau4RU0
誰かおすすめの実写モデル教えてーや
2022/11/06(日) 16:40:59.93ID:mja3HTm90
LDSRの黒帯治ったらしい
2022/11/06(日) 16:50:56.47ID:mMotORCe0
>>91
先月半ばくらいには治ってたと思う。
2022/11/06(日) 16:53:25.98ID:mMotORCe0
>>91
んん、この環境作ったの21日だから、半ばじゃなく下旬やな……
2022/11/06(日) 16:58:36.32ID:mja3HTm90
https://github.com/AUTOMATIC1111/stable-diffusion-webui/commit/6603f63b7b8af39ab815091460c5c2a12d3f253e
95名無しさん@お腹いっぱい。 (ワッチョイ 7922-chQ5)
垢版 |
2022/11/06(日) 17:01:54.19ID:mMotORCe0
ということは、ここ最近使ってた縦横サイズがたまたま黒帯出ない条件になってたってことか?
2022/11/06(日) 17:02:44.33ID:ssKzkWif0
>>90
Stable Diffusion
97名無しさん@お腹いっぱい。 (ワッチョイ 8101-Cw2/)
垢版 |
2022/11/06(日) 17:10:13.80ID:J2Iau4RU0
>>96
ありがとうな!
98名無しさん@お腹いっぱい。 (ワッチョイ 9201-84Ua)
垢版 |
2022/11/06(日) 17:31:14.52ID:y+UNZPkx0
>>89
サンクス
2022/11/06(日) 18:10:57.41ID:4teYXyrB0
stable-diffusion-webuiで
Aesthetic Gradients使ってptファイル取り入れようとしたんだけど
AttributeError: 'dict' object has no attribute 'T'
になってできません。どうすればいいのでしょうか?
2022/11/06(日) 18:19:51.10ID:5fBMedEI0
DPM++ 2M Karrasが収束早くて使いやすいかなー
2022/11/06(日) 18:23:24.70ID:bgXqYp4l0
>>87
5%が10%になるならちょっと効果はありそうだけど
2022/11/06(日) 18:27:41.94ID:YVwO6VDq0
オリジナル魔法少女を生成するとして
魔法少女自体はともかく、おともの謎生物はどうやって指定すればいいのだろう
2022/11/06(日) 18:33:53.76ID:hD+dhGSQ0
謎生物をTIしたので生成して貼り付けるか
pixivから拾ってきたものをi2iしてフォトショで貼り付けろ
2022/11/06(日) 18:57:47.77ID:sLvQDmuk0
>>101
100%出ない奴は嘘だ載せるなって言ってるのは相手にしてなくていいと思う
AIの収束率上げる要素に使えないか?要検証っていう話なのに、違う次元の話をしてる
SNSやプロンプト公開してマネするなって言ってるアホと同レベルの技術阻害
2022/11/06(日) 19:03:39.78ID:IL9AxMIc0
dreambooth-gui精度カスだな
同オプションのshyvamと比べても
2022/11/06(日) 19:05:12.17ID:ssKzkWif0
>>104
散々試した結果、効果が見られなかったんだよ
なんJでも散々言われている
効果はない、と
プロンプトは一文字違うだけでも結果は変わる
それで変わっただけなのを効果だと勘違いすることはよくあること
新しい発見をした、と思いたいのだろうけど残念ながらなんの効果もないよという話なんだよ
というか色んな記号でサンドイッチしてみようなんてのはSDが出てきた初期から試されていることだしホント今更のこと
そもそもそんな便利な方法があったら、とっくに中国で発見されてる
日本は何週も遅れてる
2022/11/06(日) 19:07:45.90ID:FVjgtv1AM
>>85
変換スクリプトがどっかになかったっけ?
2022/11/06(日) 19:10:49.08ID:ssKzkWif0
>>107
そのままでは使えない
NAI構文→AUTOMATIC1111であれば、AUTOMATIC1111の拡張機能でワンタッチ変換ボタンが追加できるよ
109名無しさん@お腹いっぱい。 (ワッチョイ a2bd-Cw2/)
垢版 |
2022/11/06(日) 19:11:41.11ID:IL9AxMIc0
>>86
こんなんprompt全文公開しなきゃ追試もできないし情報としての価値はないに等しいね
そもそも実装にない記号勝手につけて効いた気がする!なんてオカルトにしか見えないから十分に検証されない限りwikiの類には書くべきではないだろ
2022/11/06(日) 19:15:03.03ID:zjZl80ZJ0
まぁ要検証→検証結果として効果なかった、って結論ならそれを否定する方が技術的には不適切だわな
2022/11/06(日) 19:39:25.71ID:pmoEqpk/0
>>105
精度って望んだオブジェクトが出てくる確率のこと?
2022/11/06(日) 19:50:19.81ID:keFl9jLQ0
>>86
引用とかする前にまず試しなさいよ。

+1 girl and 1 boy+,+a girl blue hair+, +a boy blonde hair+
とでも入力してランダムで20回ぐらい試せばわかる。
男と女、どっちが青髪・金髪になることもある。

結論:+で括っても無意味
2022/11/06(日) 20:03:38.09ID:cR/d+JAl0
DPM++めっちゃ速いな
もうDDIMいらないわ
2022/11/06(日) 20:09:50.80ID:bgXqYp4l0
+自体は文脈的には分割より加算に動くのは分からんでもない
もっと強いセパレータ記号見つかるといいけど
2022/11/06(日) 20:18:08.64ID:1tzc6lHf0
24枚生成で実験

1 girl and 1 boy+,a girl blue hair, a boy blonde hair
https://i.imgur.com/OAV36Sq.png
女青髪:11枚

+1 girl and 1 boy+,+a girl blue hair+, +a boy blonde hair+
https://i.imgur.com/yiQfoCi.png
女青髪:8枚

効果無しと判断するがねぇ
2022/11/06(日) 20:33:58.54ID:1tzc6lHf0
あ、スレに貼るときに+消し忘れがあったか(生成時は消してた)
まあ皆試せるからいいか
2022/11/06(日) 22:30:07.87ID:qK6gVkXn0
男同士あら~^
2022/11/06(日) 22:49:20.65ID:wZlauhKp0
正直なところコンマやピリオドですら隣同士で混ざるのに
それ以上の効果を持った区切り方があるとは思えないというところでこういう話は全部眉唾で聞いてる

コンマもそこで区切らないと別の意味の言葉や文になるって時に的確に入れるのが効き目高いぐらいで
意味もなくたくさん入れても分割効果は無いし
2022/11/06(日) 23:02:16.21ID:mja3HTm90
DPM-Solver++2M is the fastest solver currently.
https://github.com/LuChengTHU/dpm-solver#news

らしい
2022/11/06(日) 23:10:46.67ID:nPHA+tXu0
新しいサンプラー群使おうとXYのサンプラーに「Euler a,Euler」とか入力したら
「エラー 俺はそんなサンプラー知らん」て表示された
カンマで区切るんじゃなかったっけ??
2022/11/06(日) 23:20:38.33ID:mja3HTm90
どうせタイプ間違ってるだけ
2022/11/06(日) 23:26:33.73ID:nPHA+tXu0
自己解決した
最後にもカンマ付けてたわ

サンプラー増やすのはええけど、i2iの画像の真下に「幅 高さ」スライダー設置してくれんかなぁ
前から思ってたけどなんであんな画像の全体が見えなくなるくらい遠くに置くんやろ
使わんサンプラー消しゃええがなって話ではあるけど
2022/11/06(日) 23:40:32.10ID:mja3HTm90
https://github.com/AUTOMATIC1111/stable-diffusion-webui/pull/4372
2022/11/06(日) 23:45:28.16ID:nPHA+tXu0
やっぱ思ってる人いたのか
適用されるといいけど
もっといえば各項目の位置をカスタマイズ出来るようになれば最高やけど
2022/11/07(月) 00:00:29.75ID:5IWNjlRl0
むしろ日々の更新でAUTOMAちゃんが倒れないかが心配だわ
2022/11/07(月) 00:33:54.78ID:hFiMBhwM0
>>122
下までちゃんと見ないと、へんなscriptがオンになってて失敗するからさ……
2022/11/07(月) 11:22:10.11ID:HH6RD3xnM
ui.pyをいじればuiの位置動かせるぞ
2022/11/07(月) 11:25:24.76ID:5zpXdHne0
それだとpullするたび元に戻るのがツラいんよ
2022/11/07(月) 11:27:03.42ID:hU+0P0RT0
カスタマイズ待つより自力でプラグイン作って公開した方が早そうだな、使う側も技術者なら
OSS的には当たり前と言えば当たり前だけど
2022/11/07(月) 11:29:01.29ID:hU+0P0RT0
ワンクリックでui.pyに同じ変更を再現するバッチファイルが一番シンプルか
2022/11/07(月) 11:37:13.75ID:5zpXdHne0
>>129
そう思っていた時期もあったw
automaticの実装の速さに何度心を折られたことか

ニッチな機能ならエクステンションで組み込むのが良いけどな
2022/11/07(月) 12:14:29.70ID:OIs0U+27a
automatic1111ほんと早い
dpm solverの存在を知った時には既に実装されててびっくりした
2022/11/07(月) 12:17:09.41ID:OIs0U+27a
まあ普段使いはDDIMなんですけどね
2022/11/07(月) 12:42:15.89ID:k58fYZeMM
>>130
git stash
git pull
gitstash pop
で自動マージしてくれる
2022/11/07(月) 13:43:40.38ID:OIs0U+27a
>>115
無のトークン数が増えるって話じゃなかった?
2022/11/07(月) 13:44:39.13ID:OIs0U+27a
なんかこうカエルとネコを足して2で割るところを50くらいで割るみたいな
2022/11/07(月) 13:47:09.19ID:OIs0U+27a
あすまんStable Diffusionか

それについての話がここにあるらしい
https://github.com/AUTOMATIC1111/stable-diffusion-webui/pull/2138
2022/11/07(月) 13:58:32.29ID:OIs0U+27a
いかなる長さのトークンでも75トークンごとに分割して、分割されたプロンプトをひとかたまりと扱ってCLIPを実行して絵ができるというよりは
分割されたプロンプトの範囲で一つ一つのトークンごとにCLIPが実行され、その結果で絵ができる
75トークン目の単語は同分割範囲のプロンプトのことであれば認識できるが
76トークン目以降の単語はもはやその範囲のトークンではなく、どうたらこうたら

CLIPってのが俺はなんなのかわからんが
トークン数稼ぎに使える記号がいくつかあって
それに+を使いたいかコンマ+空白を使いたいかっていうお好みの問題なんじゃないかと認識してる
2022/11/07(月) 13:59:40.56ID:OIs0U+27a
ちなみに俺は2連続コンマを使ってる
Ctrl+BSで一気に消せるから楽
2022/11/07(月) 14:02:43.51ID:gKDVj8CJp
docker版はk-diffusionとかが古くて新しいサンプラーが表示されなかった
なかなか面倒臭い
2022/11/07(月) 14:11:03.31ID:OIs0U+27a
うわめっちゃ誤訳したかもしれない
やっぱおのおのの手段で翻訳して読んで
2022/11/07(月) 14:25:31.66ID:Udd7gJ+k0
>>125
乗り乗りの時は意外と無茶が出来るもんだよ。みんなが飽きて来たらやばいかもね
2022/11/07(月) 14:47:54.38ID:aZJdx2UV0
++括り(意味なし)とコンマカンマ以外で何か区切り的に強そうなのってなんだろ
2022/11/07(月) 15:58:02.10ID:u5bJ4eBCM
>>143
AND
2022/11/07(月) 16:07:11.48ID:4Ayu4K4Q0
その区切り文字が単語かつ画像のオブジェクトを別々に説明する区切り記号として
用いられてるラベルが付いた画像が学習データに大量に存在しない限り意味ないだろう事を考えると
, や . 並みに英文上で普遍的に区切りとして使われてる記号は ' と " じゃないか?

>>144
大文字だと1111で使われてるプロンプト分割用の特殊文字なっちゃうぞ
2022/11/07(月) 17:59:54.58ID:IxS2Pl330
意外と全角スペース辺りが強かったりしてな
2022/11/07(月) 18:25:35.23ID:hSrFIJ5Y0
※イメージしやすいようトークンを単語で置き換える

(1girl、、、、、、)75単語(、、、、、green)75単語
で昔は区切って変換かけてたから、76単語以降は1~75と関係ない要素で生成してしまう事があった。しかも記載ルール的に76単語目の比重が大きくなる
今は(1girl、、、、、、、、、、、、、green)で変換かけている。語順、単語を繰り返す、単語に重みを記載するなどで表現の幅が広がった

カンマで区切るまでの1文が長いほど計算には時間がかかる

A B and C Dの記載は、A BandC Dになる。ユーザーが欲しい(AB) and (CD)にはならない。
※ここ自信ない

\n(改行)の記載はまた違った結果になる
※ここは、ごちゃごちゃ書いてたけど改行なのかスペースなのか良く読み取れなかった

みたいに書いてあるから、正しい重みの表記をするか単語を繰り返す方が正解な気がする。本当かは知らんけど
2022/11/07(月) 19:06:22.38ID:0jpDSQ0E0
大丈夫かこのスレ
2022/11/07(月) 19:10:53.04ID:aZJdx2UV0
大丈ばない
2022/11/07(月) 19:16:20.89ID:K77Y0MAW0
電気ネズミは攻めすぎ

>写真は「Stable Diffusion」からAI Acceleratorを叩いているというデモだが、どうやってAI Acceleratorにアクセスしているのかまでの情報は明かされなかった。

https://ascii.jp/elem/000/004/111/4111884/2/
2022/11/07(月) 19:23:54.18ID:FbibxUKd0
モザイク貫通してるぞ
2022/11/07(月) 19:59:21.83ID:TroPMJqp0
絵を見せることより電気ネズミ呼ばわりのがヤバいやろ
2022/11/07(月) 20:03:23.57ID:4Ayu4K4Q0
>>147
ANDはプロンプトを分割してそれぞれ別々のconditionとしてサンプラー等に渡す1111の独自機能だろ?
上で話してる様な、プロンプトの単語が混ざりにくくする様な文字は無いかなぁ?
ってのとは全く別の話でしょ
2022/11/07(月) 20:33:47.99ID:q6HvvxN10
+も,も使って理想の絵に収束させれば理屈なんてなんでもいいんや
中二病がつけたタグ連想と英語文法通りに動かないとかHyperやUltraがどっちが強いとかんなもの学習元抜きで語る話じゃないしな
馬鹿なこと言ってる間に1枚でも多く回して理想に近づく方がいいんやで
2022/11/07(月) 20:48:05.83ID:4Ayu4K4Q0
まぁ原理的に考えたらプロンプトを任意に区切る文字なんて無いと思うが、
NAIがCLIPの最終レイヤー無視したら色が混ざりにくくなったって言ってたみたいに
思わぬ方法が効果あるかも知れんから色々試してみるのは悪くないと思う
2022/11/07(月) 21:37:50.60ID:3JdyLg6c0
>>150
Radeon RX 7000シリーズで新規実装されたAIアクセラレーターだな
これでSDが動くのなら、Radeonにも希望が見えてきたか!?
157名無しさん@お腹いっぱい。 (ワッチョイ 1968-8gy9)
垢版 |
2022/11/08(火) 00:41:46.00ID:NQa1kjoI0
RTX4090が24GBで1600ドル
RX7090 XTXが24GBで1000ドル
まあ9万円差で多少性能おちるくらいらしいからコスパいいRX7090が欲しいんだが
AI画像生成に不向きなのがなぁ
2022/11/08(火) 01:00:14.66ID:fLA13UoP0
TrainingLabのゴタゴタが早速GOLDMINEに纏められてて草
1111周りは面白い事が良く起きるな。今回は本人関係ないけど…
2022/11/08(火) 02:34:27.36ID:kSIqxSlk0
AI関連で使うならNVIDIAにしておけと。仮にStableDiffusionがRadeon対応したとしても関連するソフトや新しいソフトが出るたびに困るのが目に見えてる。
160名無しさん@お腹いっぱい。 (ワッチョイ a901-fRPT)
垢版 |
2022/11/08(火) 04:50:53.08ID:uSGzQ2ur0
メモリがたりませぬ
2022/11/08(火) 13:05:09.24ID:4bsLzCAbr
OSはWindowsを使うべきだしグラボはNVIDIAを選ぶべ
2022/11/08(火) 13:36:21.34ID:wumgVh5N0
今は金ないなら306012GB
あるなら4090が正解?
2022/11/08(火) 13:40:11.65ID:Ibse/TcX0
機械学習に関してはOSはUbuntuが安全牌
WSLgでWindowsでも殆ど問題なくなったがリアルUbuntuの方がトラブルは少ない
164名無しさん@お腹いっぱい。 (ワッチョイ 6502-FYet)
垢版 |
2022/11/08(火) 14:09:39.38ID:E16y2BtY0
>>162
もう少しでRTX4070以下やRX7000シリーズが出そろうのと
3000の在庫膨大だから待ちが正解

機械学習用途ですぐ買わないといけないなら
24GBのRTX3090か16GBのRTX A4000が正解
2022/11/08(火) 14:11:43.37ID:9KfeUYvTa
4090の150Wケーブル問題ってもう大丈夫?
買っていい?
166名無しさん@お腹いっぱい。 (ワッチョイ 6502-FYet)
垢版 |
2022/11/08(火) 14:12:30.48ID:E16y2BtY0
>>165
ダメ
2022/11/08(火) 14:14:57.71ID:9KfeUYvTa
わかりました
2022/11/08(火) 15:46:24.16ID:pO2WxVC60
Sandy世代の古いPCに3060挿してAI専用機にするってできるかな?
一応PCI-Ex16スロットと物理スペースはある。OSもたぶんWin10にできる
2022/11/08(火) 15:46:53.54ID:xxdKrteO0
円安だし待ってて安くなることなんてあんのかな
2022/11/08(火) 15:51:30.67ID:+uQEM3Z+0
AI需要を見込んだnvidiaがミドルスペ高vram出してくる可能性が
2022/11/08(火) 15:56:55.15ID:b6aAJ2VA0
待ってると12GB版3060の在庫が減って8GBに切り替わって居ちゃうから今がいいタイミングだと思うよ
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況