X



【StableDiffusion】AI画像生成技術10【NovelAI】
レス数が1000を超えています。これ以上書き込みはできません。
0001名無しさん@お腹いっぱい。 (ワッチョイ 1b5f-1+2k)
垢版 |
2022/11/03(木) 00:10:16.15ID:0dW1bfVB0
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

入力されたテキストから画像を生成するAI技術に関して語るスレです
StableDiffusion: google colabやローカル環境で実行可能なAI画像生成
NovelAI: 有料サブスク型AI画像生成サービス
(DALLE・Craiyon・Midjourneyの話題もOK)

★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
(以下のスレッドへ移動してください)
【Midjourney】AI関連総合17【StableDiffusion】
https://mevius.5ch.net/test/read.cgi/cg/1667381701/
AIイラスト 愚痴、アンチ、賛美スレ part12
https://mevius.5ch.net/test/read.cgi/illustrator/1666872303/

テンプレまとめ
https://rentry.co/zqr4r
編集コード「5ch」

前スレ
【StableDiffusion】AI画像生成技術9【Midjourney】
https://mevius.5ch.net/test/read.cgi/cg/1666139334/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
0003名無しさん@お腹いっぱい。 (ワッチョイ 19ad-FQW+)
垢版 |
2022/11/03(木) 01:02:24.31ID:yx05OOaT0
立て乙
0032名無しさん@お腹いっぱい。 (ワッチョイ 13a5-Tk+f)
垢版 |
2022/11/03(木) 21:31:18.32ID:+rNa9VK10
丸括弧を任意数重ねる ((A))→丸括弧1つに付き1.1倍に強める
角括弧を任意の数重ねる [[A]]→角括弧1つに付き1,1分の1に弱める
丸括弧にコロンで区切って数字 (A:1.1)や(A:0.9) →数字の倍率に強める。数字を1未満にすると弱める

角括弧にコロンで区切って数字 [A:0.5] →プロンプトの適用ステップの調整、この場合「全体の50%からAという要素を加える」。わりと複雑なのでこれ以上の説明は省略

案外知らないみたいなのでおさらいに。
角括弧とコロンは書き方が似てても強弱とは全く別のシステムだからな
0033名無しさん@お腹いっぱい。 (ワッチョイ 1102-0xIe)
垢版 |
2022/11/03(木) 23:00:15.69ID:ISzYQBe10
>>1ワッチョイ立て乙

ここの人の大半がwebUI使ってるのかな
自分はあえて自前のしょぼ環境で遊んでるから最近のwebUI専門っぽい流れについていけないや
わかっててこうしてるわけだから別にいいんだけど
0034名無しさん@お腹いっぱい。 (ワッチョイ 19ad-ofdD)
垢版 |
2022/11/03(木) 23:25:44.33ID:yx05OOaT0
>>32
こういう基礎知識置いてくれるの嬉しい。
僕みたいな初心者にはとても助かるよ。
0036名無しさん@お腹いっぱい。 (ワッチョイ 19ad-ofdD)
垢版 |
2022/11/04(金) 01:59:52.69ID:wLqUXW4t0
ウーム、HNやらTI試そうと思ったけどグラボのメモリ不足かぁ。
やっぱり3060には厳しいのかな。
0037名無しさん@お腹いっぱい。 (ワッチョイ 1901-xul/)
垢版 |
2022/11/04(金) 02:48:52.51ID:7eTG9Hbw0
VAE Selection実装されてるな。
設定画面でVAE固定で選べる。
NovelAIのVAEを他のモデルに当てても専用のVAEよりよくなるケースが多かってんでシンボリックリンクをリネームしていたのだが、もうそんなことをしなくて良いようだ。
0040名無しさん@お腹いっぱい。 (ワッチョイ 11a5-ofdD)
垢版 |
2022/11/04(金) 06:46:46.16ID:SNxR3W8u0
SDの画像圧縮技術がすごいらしいけど
pngやjpgじゃなくてその形式でファイルに吐き出すことはできんの?
0043名無しさん@お腹いっぱい。 (アウアウウー Sa9d-Tk+f)
垢版 |
2022/11/04(金) 07:49:31.53ID:zJd0zUkLa
jpgなら6kbのとこがsdなら5kbになります。1枚で1kbもお得ってレベルの効率化だから4GBだったら400万枚に相当する
もちろん何千万枚何億枚も扱うってなら恩恵にあずかれるし
辞書はよく使われてるけどここまで効率悪い辞書はそうそう使われないよ
0044名無しさん@お腹いっぱい。 (ワッチョイ 1901-T+yX)
垢版 |
2022/11/04(金) 08:01:20.33ID:LqHAYjHf0
画像閲覧タブが2つになってExtensionsからimage historyOFFったら一つになった
相変わらずプレビュー画像クリックで次の画像出ても生成情報は更新されないのな
0051名無しさん@お腹いっぱい。 (ワッチョイ 19ad-ofdD)
垢版 |
2022/11/04(金) 17:11:54.92ID:wLqUXW4t0
ModuleNotFoundError: No module named 'tensorflow.python'
って言われたんだけど、tensorflowはどこにぶち込めばいいんだろ。
0058名無しさん@お腹いっぱい。 (スプッッ Sd33-3bG1)
垢版 |
2022/11/04(金) 20:05:12.94ID:qfRDEbNXd
ここでする話題か分からんが、mimicが再始動したけど、あれって自分で用意した画像以外にもなんかベースになってる学習素材があるのかな
だいたいの画像生成AIはなんかがオープンソースで公開されたのがきっかけらしいから、そこで学習された画像になるのか?
0063名無しさん@お腹いっぱい。 (ワッチョイ f943-ee5o)
垢版 |
2022/11/04(金) 21:58:00.58ID:uGl6tOed0
最初のリリース時と違って自前で学習するのも当たり前になってしまったから、
mimicにどれほどの価値が見いだせるか正直よくわからんな
で、あれは結局TIなのだろうか。再始動ならDBはともかく、HNとかも取り入れてそうだけど
0066名無しさん@お腹いっぱい。 (ワッチョイ 9168-TUMG)
垢版 |
2022/11/04(金) 22:17:11.06ID:/crn/wJ90
mimicは環境が変わりすぎて今更再稼働したところでな……
0067名無しさん@お腹いっぱい。 (ワッチョイ a95f-SxIP)
垢版 |
2022/11/04(金) 22:27:37.32ID:xe1O169b0
mimicはGANじゃないの?
StyleGAN2をAnimeFaceデータセットで学習させたのと似てる気がする
0075名無しさん@お腹いっぱい。 (ワッチョイ 7922-chQ5)
垢版 |
2022/11/06(日) 12:20:39.48ID:mMotORCe0
>>73
旧仕様の1111なら、プロンプトのパース処理で '(' が出てきたらその時点でトークンの強度を1.1倍、 ')' が出てきたら1/1.1 みたいな処理になってたから、そのふたつに違いはないはず。
今のがどんな処理に変わってるのかはわかんね。
0086名無しさん@お腹いっぱい。 (ワッチョイ 5ef2-YZoV)
垢版 |
2022/11/06(日) 15:16:26.39ID:mnX/Jido0
NovelAIだと+~+で区切ると効果範囲を限定できるとか
記号は「+」でなくてもよく、限定する効果がより高まる記号もあるかもみたいな話だった

250 名前:今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ 6988-P3uR)[sage] 投稿日:2022/11/05(土) 01:38:23.94 ID:ZK5ok5dV0 [1/9]
>> 229
技術部ディスコからの引用やけど
+shiny hage+ ←こんな感じで要素を意味のない記号で区切るとその要素が外に漏れない(っぽい
この場合「shinyがハゲにだけ掛かって他には影響を及ぼさない」(っぽい

これも引用やけど、「pixel」系の単語を背景と人物で切り離すのに成功した例

自分もある程度は試して効果実感しとるからwikiに書こうかと思っとるけど、もう少し検証したい
https://i.imgur.com/g4vvFqm.png
https://i.imgur.com/lq6V1e4.png
0087名無しさん@お腹いっぱい。 (ワッチョイ d27c-84Ua)
垢版 |
2022/11/06(日) 15:21:16.33ID:ssKzkWif0
>>86
だからそれは単なる眉唾だと何度言えば
効果はまったく期待出来ないよ
+とか使わなくてもガチャれば出来るし
あくまでも確率の問題
確定じゃない情報をwikiとかに書かないで欲しいんだが
0088名無しさん@お腹いっぱい。 (ワッチョイ 9201-84Ua)
垢版 |
2022/11/06(日) 16:15:17.57ID:y+UNZPkx0
表情差分ってNovel AIだとどうやって生成するんですか?
0090名無しさん@お腹いっぱい。 (ワッチョイ 8101-Cw2/)
垢版 |
2022/11/06(日) 16:27:59.13ID:J2Iau4RU0
誰かおすすめの実写モデル教えてーや
0095名無しさん@お腹いっぱい。 (ワッチョイ 7922-chQ5)
垢版 |
2022/11/06(日) 17:01:54.19ID:mMotORCe0
ということは、ここ最近使ってた縦横サイズがたまたま黒帯出ない条件になってたってことか?
0097名無しさん@お腹いっぱい。 (ワッチョイ 8101-Cw2/)
垢版 |
2022/11/06(日) 17:10:13.80ID:J2Iau4RU0
>>96
ありがとうな!
0098名無しさん@お腹いっぱい。 (ワッチョイ 9201-84Ua)
垢版 |
2022/11/06(日) 17:31:14.52ID:y+UNZPkx0
>>89
サンクス
0104名無しさん@お腹いっぱい。 (ワッチョイ 618e-+nMC)
垢版 |
2022/11/06(日) 18:57:47.77ID:sLvQDmuk0
>>101
100%出ない奴は嘘だ載せるなって言ってるのは相手にしてなくていいと思う
AIの収束率上げる要素に使えないか?要検証っていう話なのに、違う次元の話をしてる
SNSやプロンプト公開してマネするなって言ってるアホと同レベルの技術阻害
0106名無しさん@お腹いっぱい。 (ワッチョイ d27c-84Ua)
垢版 |
2022/11/06(日) 19:05:12.17ID:ssKzkWif0
>>104
散々試した結果、効果が見られなかったんだよ
なんJでも散々言われている
効果はない、と
プロンプトは一文字違うだけでも結果は変わる
それで変わっただけなのを効果だと勘違いすることはよくあること
新しい発見をした、と思いたいのだろうけど残念ながらなんの効果もないよという話なんだよ
というか色んな記号でサンドイッチしてみようなんてのはSDが出てきた初期から試されていることだしホント今更のこと
そもそもそんな便利な方法があったら、とっくに中国で発見されてる
日本は何週も遅れてる
0109名無しさん@お腹いっぱい。 (ワッチョイ a2bd-Cw2/)
垢版 |
2022/11/06(日) 19:11:41.11ID:IL9AxMIc0
>>86
こんなんprompt全文公開しなきゃ追試もできないし情報としての価値はないに等しいね
そもそも実装にない記号勝手につけて効いた気がする!なんてオカルトにしか見えないから十分に検証されない限りwikiの類には書くべきではないだろ
0112名無しさん@お腹いっぱい。 (ワッチョイ a901-44tn)
垢版 |
2022/11/06(日) 19:50:19.81ID:keFl9jLQ0
>>86
引用とかする前にまず試しなさいよ。

+1 girl and 1 boy+,+a girl blue hair+, +a boy blonde hair+
とでも入力してランダムで20回ぐらい試せばわかる。
男と女、どっちが青髪・金髪になることもある。

結論:+で括っても無意味
0118名無しさん@お腹いっぱい。 (ワッチョイ 127f-sVBt)
垢版 |
2022/11/06(日) 22:49:20.65ID:wZlauhKp0
正直なところコンマやピリオドですら隣同士で混ざるのに
それ以上の効果を持った区切り方があるとは思えないというところでこういう話は全部眉唾で聞いてる

コンマもそこで区切らないと別の意味の言葉や文になるって時に的確に入れるのが効き目高いぐらいで
意味もなくたくさん入れても分割効果は無いし
0122名無しさん@お腹いっぱい。 (ワッチョイ a9f2-pSqO)
垢版 |
2022/11/06(日) 23:26:33.73ID:nPHA+tXu0
自己解決した
最後にもカンマ付けてたわ

サンプラー増やすのはええけど、i2iの画像の真下に「幅 高さ」スライダー設置してくれんかなぁ
前から思ってたけどなんであんな画像の全体が見えなくなるくらい遠くに置くんやろ
使わんサンプラー消しゃええがなって話ではあるけど
0138名無しさん@お腹いっぱい。 (アウアウウー Sacd-pdYN)
垢版 |
2022/11/07(月) 13:58:32.29ID:OIs0U+27a
いかなる長さのトークンでも75トークンごとに分割して、分割されたプロンプトをひとかたまりと扱ってCLIPを実行して絵ができるというよりは
分割されたプロンプトの範囲で一つ一つのトークンごとにCLIPが実行され、その結果で絵ができる
75トークン目の単語は同分割範囲のプロンプトのことであれば認識できるが
76トークン目以降の単語はもはやその範囲のトークンではなく、どうたらこうたら

CLIPってのが俺はなんなのかわからんが
トークン数稼ぎに使える記号がいくつかあって
それに+を使いたいかコンマ+空白を使いたいかっていうお好みの問題なんじゃないかと認識してる
0145名無しさん@お腹いっぱい。 (ワッチョイ 92a5-KAMn)
垢版 |
2022/11/07(月) 16:07:11.48ID:4Ayu4K4Q0
その区切り文字が単語かつ画像のオブジェクトを別々に説明する区切り記号として
用いられてるラベルが付いた画像が学習データに大量に存在しない限り意味ないだろう事を考えると
, や . 並みに英文上で普遍的に区切りとして使われてる記号は ' と " じゃないか?

>>144
大文字だと1111で使われてるプロンプト分割用の特殊文字なっちゃうぞ
0147名無しさん@お腹いっぱい。 (ワッチョイ 9202-8h+J)
垢版 |
2022/11/07(月) 18:25:35.23ID:hSrFIJ5Y0
※イメージしやすいようトークンを単語で置き換える

(1girl、、、、、、)75単語(、、、、、green)75単語
で昔は区切って変換かけてたから、76単語以降は1~75と関係ない要素で生成してしまう事があった。しかも記載ルール的に76単語目の比重が大きくなる
今は(1girl、、、、、、、、、、、、、green)で変換かけている。語順、単語を繰り返す、単語に重みを記載するなどで表現の幅が広がった

カンマで区切るまでの1文が長いほど計算には時間がかかる

A B and C Dの記載は、A BandC Dになる。ユーザーが欲しい(AB) and (CD)にはならない。
※ここ自信ない

\n(改行)の記載はまた違った結果になる
※ここは、ごちゃごちゃ書いてたけど改行なのかスペースなのか良く読み取れなかった

みたいに書いてあるから、正しい重みの表記をするか単語を繰り返す方が正解な気がする。本当かは知らんけど
0153名無しさん@お腹いっぱい。 (ワッチョイ 92a5-KAMn)
垢版 |
2022/11/07(月) 20:03:23.57ID:4Ayu4K4Q0
>>147
ANDはプロンプトを分割してそれぞれ別々のconditionとしてサンプラー等に渡す1111の独自機能だろ?
上で話してる様な、プロンプトの単語が混ざりにくくする様な文字は無いかなぁ?
ってのとは全く別の話でしょ
0154名無しさん@お腹いっぱい。 (ワッチョイ d28e-+nMC)
垢版 |
2022/11/07(月) 20:33:47.99ID:q6HvvxN10
+も,も使って理想の絵に収束させれば理屈なんてなんでもいいんや
中二病がつけたタグ連想と英語文法通りに動かないとかHyperやUltraがどっちが強いとかんなもの学習元抜きで語る話じゃないしな
馬鹿なこと言ってる間に1枚でも多く回して理想に近づく方がいいんやで
0155名無しさん@お腹いっぱい。 (ワッチョイ 92a5-KAMn)
垢版 |
2022/11/07(月) 20:48:05.83ID:4Ayu4K4Q0
まぁ原理的に考えたらプロンプトを任意に区切る文字なんて無いと思うが、
NAIがCLIPの最終レイヤー無視したら色が混ざりにくくなったって言ってたみたいに
思わぬ方法が効果あるかも知れんから色々試してみるのは悪くないと思う
0157名無しさん@お腹いっぱい。 (ワッチョイ 1968-8gy9)
垢版 |
2022/11/08(火) 00:41:46.00ID:NQa1kjoI0
RTX4090が24GBで1600ドル
RX7090 XTXが24GBで1000ドル
まあ9万円差で多少性能おちるくらいらしいからコスパいいRX7090が欲しいんだが
AI画像生成に不向きなのがなぁ
0160名無しさん@お腹いっぱい。 (ワッチョイ a901-fRPT)
垢版 |
2022/11/08(火) 04:50:53.08ID:uSGzQ2ur0
メモリがたりませぬ
0164名無しさん@お腹いっぱい。 (ワッチョイ 6502-FYet)
垢版 |
2022/11/08(火) 14:09:39.38ID:E16y2BtY0
>>162
もう少しでRTX4070以下やRX7000シリーズが出そろうのと
3000の在庫膨大だから待ちが正解

機械学習用途ですぐ買わないといけないなら
24GBのRTX3090か16GBのRTX A4000が正解
0166名無しさん@お腹いっぱい。 (ワッチョイ 6502-FYet)
垢版 |
2022/11/08(火) 14:12:30.48ID:E16y2BtY0
>>165
ダメ
0173名無しさん@お腹いっぱい。 (ワッチョイ a901-fRPT)
垢版 |
2022/11/08(火) 16:15:33.76ID:uSGzQ2ur0
12GBだと足りなくてひーひーしてる
0177名無しさん@お腹いっぱい。 (ワッチョイ 6502-FYet)
垢版 |
2022/11/08(火) 16:27:02.54ID:E16y2BtY0
>>173
ほんそれ
>>168
中途半端最低ラインの12GBでローカルなんて感じで買うと絶対に後悔する
今SSD128GBのメモリ4GBマシン買うくらい後悔する
ローカルでやりたいなら24GBがライン
そして出かけている間や寝ている間もフルで回すことになる機械学習では
RTX4090のコネクタ融解発火問題はかなりリスクある
なので今の選択肢としては >>164
0179名無しさん@お腹いっぱい。 (ワッチョイ 515f-8gy9)
垢版 |
2022/11/08(火) 16:39:50.78ID:Zd5rbbaX0
>>176
RTX 4090、変換ケーブルを使わなくても12VHPWRが融解。ATX 3.0電源のネイティブ接続でも融解したとの報告
ttps://www.nichepcgamer.com/archives/geforce-rtx-4090-s-12vhpwr-melts-even-with-atx-3-0-native-cable.html

こういう話もあるので、まだ注意が必要かと
0183名無しさん@お腹いっぱい。 (ワッチョイ 1968-8gy9)
垢版 |
2022/11/08(火) 18:52:36.16ID:NQa1kjoI0
学習ってそんな頻繁にやる?
たまにしかやらないならColabプレミアムでやれば別に高性能グラボいらんとちゃうん
0187名無しさん@お腹いっぱい。 (ワッチョイ a232-90Bh)
垢版 |
2022/11/08(火) 22:11:44.40ID:JnMRcSj70
dreamboothって複数概念覚えさせるととたんにクオリティ落ちない?
画像各40枚で対象1つと対象3つの学習結果比較したら
一つの事覚えさせた方がクオリティ高かった
対象3つの場合モデル3つそれぞれ作った方がよかった
いろいろ実験した結果
step数は画像1枚につき100stepぐらいがよさげ
step増やせばいいってもんでもないのが不思議
0188名無しさん@お腹いっぱい。 (ワッチョイ 12be-YZoV)
垢版 |
2022/11/08(火) 22:29:47.68ID:oR0Dl9aS0
>>187
わかる、だから人物とかなら、t2iは複数概念モデルでだしてから、1人ずつ単独モデルでi2iしてブラッシュアップさせるとかもありだと思うわ
0190名無しさん@お腹いっぱい。 (ワッチョイ a901-pSqO)
垢版 |
2022/11/09(水) 06:41:10.50ID:sFhJUtjL0
現状AIイラストって技術屋とプロンプターと絵描きの三種のスキルがクオリティに影響するけど、
このスレ居るぐらい技術の素養もあって絵も描けたら最強だな
>>189
ちなみに「どの部分は学習(db)で、どの部分はプロンプトで、どの部分は手描きで直すと一番良い」
みたいな最適手法とかってもうあったりする?
0194名無しさん@お腹いっぱい。 (ワッチョイ 6902-uVfP)
垢版 |
2022/11/09(水) 09:07:05.67ID:Ja9RbGdE0
結局のところ注文する側に絵描きと共通するスキルが必要なところからは逃れられないんだよな
素材はあるからポスター作ってって素人にやらせてもセンスあるものができないようにさ
0195名無しさん@お腹いっぱい。 (ワッチョイ a901-fRPT)
垢版 |
2022/11/09(水) 10:55:05.50ID:vMhRrDql0
イラスト描きに依頼したりするときに
イメージに乖離が生まれにくい
目的に近いものができるまで生成しまくって
それを持って打ち合わせしてこうしたいこうしたいすればつめやすい
素人の自分が打ち合わせするときに一番やっかいなのはあたりのイメージを伝えられないことだから
0196名無しさん@お腹いっぱい。 (ワッチョイ 5e8e-+nMC)
垢版 |
2022/11/09(水) 11:20:45.14ID:9y78rn2R0
技術屋としては絵で食って人と話す機会も多いけど、細部の観察力や再現性のこだわりや精度の次元が全く違うからなぁと思うことは多い
1枚絵で何を表現しているかとか、何を伝えたいかとか、人がものを描く場合配置から何からすべてのオブジェクトに理由や意味がある
そこには物語があって、描いている人間にも過程と苦悩と満足感がある。クライアントになんでここにと聞かれてもすべて答えられる程度には。特に外資は突っ込みが厳しいから明確に答えられなくともあいまいな返答すると仕事は取れないとも
いずれAIも奥行きや構図を理解して犬の目線や鳥の目線だったり人とは違う目線でも違和感がない絵が描けるようになってほしいとは言ってたね

子供が描く突拍子もない絵も子供が描くから親には意味があるわけだし
きれいだねうまいねって言われてるうちは人の領分には入ってこれないって
漫画の背景マンやトレス主体のアシスタントは仕事が楽になるだろとも言ってた

料理人同士の素材の仕入れや厳選とかこだわり味付けや仕込みの会話についていけないような
男の料理!スーパーの素材で、まずくなくて太らなければそれでいいよ!と思ってる自炊の話なんてできやしないわな
0197名無しさん@お腹いっぱい。 (ワッチョイ a901-pSqO)
垢版 |
2022/11/09(水) 11:27:18.43ID:sFhJUtjL0
まぁ自炊なら自炊で使い道もあるけど、それはビジネススレ向きの話題だからな
このスレだと「技術的にどうやるか」がテーマになるか
まぁそれは開発側レベルの試行錯誤になるから使う側の技術者ができることは多くないかもしれないが……

ただ、「奥行き」「構図」「オブジェクト」「それぞれの意図」とかのデザイン観点の候補を一覧化して、
エディタに搭載することでプロンプトコーディング時に候補表示とかはできるよな?

『絵描きの視点』を基本的な範囲だけでも搭載・網羅したIDEもどきが作れれば
技術的なアプローチからプロンプターの平均水準を引き上げられるんじゃないか
0198名無しさん@お腹いっぱい。 (ワッチョイ a901-pSqO)
垢版 |
2022/11/09(水) 11:31:57.74ID:sFhJUtjL0
Wikiに既存のブラウザ拡張とかNovelAI Managerは「観点」のサポートはしてないから、
最低限「イラストレーター・デザイナーが考慮する基本観点一覧」の入力ボックスとかプルダウンとか
作るだけでもエディタとしての質はかなり上がりそう
https://seesaawiki.jp/nai_ch/d/%a4%aa%a4%b9%a4%b9%a4%e1%a5%c4%a1%bc%a5%eb%a1%a6%a5%ea%a5%f3%a5%af%bd%b8
0201名無しさん@お腹いっぱい。 (ワッチョイ a901-jXE9)
垢版 |
2022/11/09(水) 13:04:20.17ID:IhS059tP0
やまかず @Yamkaz (2022/11/08 10:58:23)
言葉と塗りで意図した画像を生成

NVIDIAの画像生成AI「eDiffi」と一緒に提案されていた技術のStableDiffusion実装が公開されてる
https://github.com/cloneofsimo/paint-with-words-sd
https://ohayua.cyou/twimg/FhAaKMkaAAEwyyC.jpg
https://ohayua.cyou/tweet/1589799463430008832/Yamkaz

[引用元] AK @_akhaliq (2022/11/07 08:11:58)
Unofficial Implementation of Paint-with-words, method from eDiffi that let you generate image from text-labeled segmentation map

github: https://github.com/cloneofsimo/paint-with-words-sd
https://ohayua.cyou/twimg/Fg6qdO1XgAQQOOU.png
https://ohayua.cyou/tweet/1589395194348474369/_akhaliq
0204名無しさん@お腹いっぱい。 (ワッチョイ 12be-YZoV)
垢版 |
2022/11/09(水) 13:35:36.50ID:AOhS3Yra0
>>202
それは髪型だけを覚えさせるデータセットを作ればいい
512x512で〇〇hairって書かれた髪の毛部分の画像を覚えさせればいいんじゃない?
もしくはキャラを覚えさせて、i2i時にモデルを変更して、任意の服を指定すればいい
0212名無しさん@お腹いっぱい。 (ワッチョイ a232-xcLn)
垢版 |
2022/11/09(水) 17:23:33.25ID:u5p/ThrN0
>>190
求めるものによるかなあ
趣味で使う分には自分で描いたやつが一番いい
自己満の世界なので

自分の場合ラフ描くの苦手で仕上げ工程が得意だから
アイデアいっぱい出すのにはAIめちゃ使える

あと自分で描いてて描くのムズいなって思ったもの生成しようとすると
(斜め後ろから俯瞰気味で斧振り下ろしたマッチョ体型の獣人)
AIでも生成できんくて他の人も苦戦して描くの避けてるような構図は
学習データが圧倒的に不足してて描けないみたい

仕事で使うならもうAIで出したやつ手直しするぐらいで十分だと思う
他人からみたらわからんだろし

自動車系でデザイナーしてたことあったんだけど
仕事の進め方として一人じゃ仕事さばけないから
デザイン事務所にレンダ外注して出てきたものを手直しして会議にかけるっていう方法が業界のスタンダートだったんだけど
デザイン事務所はもうこれからきついと思う
デザイン事務所に外注してもあんまりズバリのものでてくることなくて
結局自分で手直ししてるのでそれならAIで大量に生成した中から自分でチョイスしたほうがいいだろし外注費も浮く
今はまだ発注する側のデザイナーは必要かもね
こっちもいずれ時間の問題だとは思うけど
イラストレーター業界はしらんけど多分業界構造は同じだと思う
0219名無しさん@お腹いっぱい。 (ワッチョイ 655f-I+3I)
垢版 |
2022/11/10(木) 01:26:10.49ID:YfXkzOc60
もう言ってるから書き込んでんだよなぁ……
シトラスより𝐒𝐮𝐢 𝐒𝐇𝐎𝐑𝐘𝐔𝐉𝐈って奴のがヤバかったわ

国内でまともなAIイラストコンテストが実施されるのはいつになるのやら
0224名無しさん@お腹いっぱい。 (ワッチョイ a9f2-pSqO)
垢版 |
2022/11/10(木) 07:15:40.70ID:UCrfMXH40
1ステップにめちゃくちゃ時間かかるサンプラーのDPM adaptiveってどういう代物?
ステップ数で絵柄も変わるしこれだけ異色の能力すぎ
他のサンプラーの数十ステップを1ステップに込めてます!て感じ
0228名無しさん@お腹いっぱい。 (オッペケ Sr79-OZX4)
垢版 |
2022/11/10(木) 13:31:27.03ID:ITXSn/1Yr
やっと3080買ったからプロンプト勢から卒業して学習に手をだそうと思うんだが、学習は細かい箇所の補完に向いてるて認識でいい?
NAIで大元つくって、手や装飾とかをinpaintで修正て形になるてことだよね
0231名無しさん@お腹いっぱい。 (ワッチョイ a901-Cw2/)
垢版 |
2022/11/10(木) 15:12:55.84ID:RI8st1+s0
『ModuleNotFoundError: No module named 'jsonmerge'』
webui-user.batを実行した後、一生このエラーに悩まされてる。

PowerShellで
pip uninstall jsonmerge
pip install jsonmerge==1.8.0(pip install jsonmergeも試した)
を実行しても上手くいかなかった。

調べたら同じ現象に悩まされてる海外ニキも居た。
誰か解決策わからん…?
0235名無しさん@お腹いっぱい。 (テテンテンテン MM96-yzAO)
垢版 |
2022/11/10(木) 15:52:56.46ID:cBhSr4wjM
novelAIは顔がハンコやね少なくともパッと見でわかるわ
0236名無しさん@お腹いっぱい。 (ワッチョイ 92d7-+nMC)
垢版 |
2022/11/10(木) 16:09:49.47ID:DfN/Vu6p0
DB環境作ろうとしてた時にvenvからpipでパッケージ更新かけようとすると
システム側のパッケージで依存関係うんぬんかんぬんで面倒なことになったので
よくわかってない頃適当にvenvの外で色々突っ込んでたパッケージ全削除してvenvの中だけで全部やるようにしたら解決した

単にターミナル開いてpip listで表示されるやつ全部uninstall(pipそのものは残しとく)
何かしら追加インストールする時はwebui等のvenv/Scripts/activate.bat(ps1)叩いてからやる
0239名無しさん@お腹いっぱい。 (ワッチョイ a901-Cw2/)
垢版 |
2022/11/10(木) 16:21:07.54ID:RI8st1+s0
>>236
ありがとう、試してみるわ!
0242名無しさん@お腹いっぱい。 (ワッチョイ a901-Cw2/)
垢版 |
2022/11/10(木) 17:53:28.67ID:RI8st1+s0
>>236
この方法でいけたわ。
マジで詰んでたから助かった…ありがとな!
0250名無しさん@お腹いっぱい。 (ワッチョイ 5ef2-YZoV)
垢版 |
2022/11/10(木) 20:28:26.59ID:RVZY7FQS0
>>240
そうそう
Extensionをアンインストールしたくてフォルダを削除したら起動しなくなったので、今日も別フォルダに再インストールしたよ
modelsやoutputフォルダなどは最初から別の場所に置いてあって、シンボリックリンクを旧フォルダから新フォルダへ移動するだけですむようにしてる
モデルデータは容量が大きいから、1つのフォルダにまとめておければ節約にもなる
0251名無しさん@お腹いっぱい。 (オッペケ Sr79-if/B)
垢版 |
2022/11/10(木) 20:34:17.43ID:iR77Cg/6r
>>248
イラストAI関連スレはアンチスレまで含めて全部勢い落ちてるよ
そもそも今できることは大体やり尽くしたし、予想されてた流れでもある

趣味勢はよほどモチベ高い層だけが残って、仕事で使う勢もまだ実用は無理

だから残った層も個人やdiscordで研究続けつつ実用レベルになる次の大きな変化を待ってる
今後も何度か段階的に波があって広まっていくんじゃないかな
0252名無しさん@お腹いっぱい。 (ワッチョイ a98e-+nMC)
垢版 |
2022/11/10(木) 20:34:28.01ID:NAya9Xsf0
>>237
それはrealistic入れるかどうかで、それをハンコとみんな言ってるわけで…
マスピ顔以外っていえばほとんどrealistic顔じゃん
追加学習情報についてどんどん世界に置いて行かれてるわ

中華モデルのAnything-V3.0はNAIの再学習だけど
https://rentry.org/sdmodels#anything-v30-38c1ebe3-1a7df6b8-6569e224

韓国HN使ったくらいになれば別顔だとは思う
https://arca.live/b/hypernetworks/60940948

eDiffi対応になればSDベースのSingleSamplerの旧学習モデルでのガチャがばかばかしくなるわけだし
今頑張ってもしたかがないのはわかるけどな
0255名無しさん@お腹いっぱい。 (ワッチョイ a901-Cw2/)
垢版 |
2022/11/10(木) 21:02:04.18ID:HxFJQAnc0
>>248
webUIのDBは15GBだと設定弄ってもOOM+エラー出てみんな詰んでるので使えなかった
対策待ち
クラスイメージ回り使いやすくて便利そうなんだけどなぁ
0258名無しさん@お腹いっぱい。 (ワッチョイ d922-8h+J)
垢版 |
2022/11/10(木) 21:56:50.42ID:RLxElvZA0
>>257
NovelAIのAdd Quality Tagのチェック外して、UCもデフォルト外してNoneにして

masterpiece,{{best quality}},{{ultra detailed}}{{disheveled hair}},detailed light,dispersion light,caustics,a girl

UC:
lowres, bad anatomy, bad hands, missing fingers, extra digit, fewer digits, cropped, signature, watermark, username, blurry,missing fingers,bad hands,missing arms

Seed:4214832537
Steps:50,Scale:11
0259名無しさん@お腹いっぱい。 (ワッチョイ d27c-pSqO)
垢版 |
2022/11/10(木) 22:00:45.73ID:GRPNBHmX0
NovelAIは顔がハンコ、ではなくNovelAIで生成されたキャラはマスピ顔が人気なので結果として同じ顔ばかり生成されてる、が正解
色んな絵柄を試してる人は多いけど結局エロばかりが目立ってるイメージ
0262名無しさん@お腹いっぱい。 (ワッチョイ d922-LdGK)
垢版 |
2022/11/10(木) 22:46:42.29ID:RLxElvZA0
まだ始まったばかりだし用途によって追加学習をするのがAIを使いこなすのに重要そうというのは同感だけれどもマスピ顔が多いのはNovelAIの特性と言うよりは
>>259
の言う通りじゃないかと。

midjourneyもv3でa beautiful girlとだけ指定するといかにも人種混ぜたようなユーザーがよく見る美人顔というのが生成される。
stable diffusionでは同じようにならないからmidjourneyの開発者が調整した美人顔と思われる
0270名無しさん@お腹いっぱい。 (ワッチョイ 9eda-Cw2/)
垢版 |
2022/11/11(金) 03:19:10.91ID:eZf8wnld0
昔流行ったモーフィングとアウトプットがあんま変わらん。
これで喜ぶのはケモナーか絵心ゼロのヘタコぐらいだろ

マツダの車はこれでデザインしてたのかって思ったわ
0272名無しさん@お腹いっぱい。 (アウアウウー Sacd-pdYN)
垢版 |
2022/11/11(金) 07:33:09.06ID:yIy8uRi5a
Anything3.0の絵だなーって絵がめちゃくちゃ増えたね
NAIと違ってこっちは落としたローカル勢しか使えないからこんなにモラルに欠けた連中が多かったのかとびっくりしている(A30使いながら)
0281名無しさん@お腹いっぱい。 (ワッチョイ 3601-84Ua)
垢版 |
2022/11/11(金) 10:42:24.38ID:NYi2vavi0
初期のyoutubeだってニコニコだって違法動画だらけだったけど気にせず見ていたわけだし、リークだろうと改造NAIだろうと今はカオスを楽しんだもん勝ちだわな
いずれは全て整備されてしまうよ
0288名無しさん@お腹いっぱい。 (アウアウウー Sacd-5g+C)
垢版 |
2022/11/11(金) 13:11:34.78ID:sLz/tzU3a
>>274
jpegに変換されるから関係ないよ
勝手に変換されるから透過のところが黒になったりしたかも
0289名無しさん@お腹いっぱい。 (アウアウウー Sacd-5g+C)
垢版 |
2022/11/11(金) 13:15:17.92ID:sLz/tzU3a
>>272
NAIはリークだったけど
Anythingは元素なんとかのチームがファインチューニングしたらしい

リークしたモデルをファインチューニングにしたらリークじゃなくなるんじゃね?
0290名無しさん@お腹いっぱい。 (アウアウウー Sacd-5g+C)
垢版 |
2022/11/11(金) 13:26:24.56ID:sLz/tzU3a
今の高速化されたStableDiffusionなら1000万円あれば1からモデルを作れるってさ
中国マネーを考えたら1から作ったとしてもおかしくないし
改造だとしたらNAIが元になってるか判別するのは不可能

何が言いたいかというとリークじゃなければAnythingは合法じゃね?
隠れる必要もない
0291名無しさん@お腹いっぱい。 (アウアウウー Sacd-5g+C)
垢版 |
2022/11/11(金) 13:30:59.22ID:sLz/tzU3a
Danbooruはよく知らんが売ってる同人誌の無断転載があったんだろ?

違法なものを学習させたモデルが合法だとするなら
違法にリークしたものを学習させたモデルは合法じゃね?

この辺の見解を著作権に詳しい人に聞きたいね

Anythingがファインチューニングされたものなら合法だと俺は思うよ
0293名無しさん@お腹いっぱい。 (アウアウウー Sacd-5g+C)
垢版 |
2022/11/11(金) 13:50:38.68ID:BMRnp5Pxa
ローカルでバレずに使うんじゃなくて

名前出して堂々と使うって意味な😅
0294名無しさん@お腹いっぱい。 (ワッチョイ 1968-8gy9)
垢版 |
2022/11/11(金) 13:52:51.65ID:SmXsVdFp0
別にいいだろ
版権エロ同人で荒稼ぎしてる連中も堂々としてんじゃん
あいつらが著作権とか言い出すのちゃんちゃらおかしいのよね
0295名無しさん@お腹いっぱい。 (アウアウウー Sacd-5g+C)
垢版 |
2022/11/11(金) 13:53:35.95ID:BMRnp5Pxa
ワッチョイ便利だな
今名前出してAnythingに言及してる人そんなにいないんだよ

ちゃんと1から説明する?
0296名無しさん@お腹いっぱい。 (アウアウウー Sacd-5g+C)
垢版 |
2022/11/11(金) 13:59:13.84ID:BMRnp5Pxa
まあ俺の見解だとファインチューニングされたAnythingは合法だからな
これから全員これを使ってくれ
0299名無しさん@お腹いっぱい。 (アウアウウー Sacd-5g+C)
垢版 |
2022/11/11(金) 14:03:13.24ID:BMRnp5Pxa
>>297
NAIと比べて
背景に強くなった
彩度が低くなった
中国人好みになった

聞いた話だがこれくらい
0300名無しさん@お腹いっぱい。 (ワッチョイ 1210-BzuK)
垢版 |
2022/11/11(金) 14:06:04.88ID:aeUm0acr0
NovelAIが本当にstable diffusionを俺らがやるようにただファインチューニングしただけなのか
ベースにしただけで建て付け?から色々変えたのかが肝では
そんなん俺らからはわからんが
0301名無しさん@お腹いっぱい。 (ワッチョイ 1210-BzuK)
垢版 |
2022/11/11(金) 14:08:43.66ID:aeUm0acr0
https://topcourt-law.com/ai-iot/learned-model-copyright
でいうところのパラメータ部分は別物になってるわけだから
NovelAIに独自の著作権が認められるだけの「プログラム部分」があるかどうかでしょ
0303名無しさん@お腹いっぱい。 (アウアウウー Sacd-5g+C)
垢版 |
2022/11/11(金) 14:14:16.49ID:BMRnp5Pxa
NAIのブログで全部言ってるぞ
VAEをあとから読み込み
hypernetwork
学習させる画像の加工方法
CLIPの2段目

全部公開されてるしAUTOMATIC1111に取り入れられた
現状何も違いはないよ
0304名無しさん@お腹いっぱい。 (アウアウウー Sacd-5g+C)
垢版 |
2022/11/11(金) 14:19:40.38ID:BMRnp5Pxa
Anythingが元素法典作ってるところがファインチューニングにしてるかどうか

これさえはっきりすれば本名出して堂々と使っても何も問題ない
0308名無しさん@お腹いっぱい。 (アウアウウー Sacd-5g+C)
垢版 |
2022/11/11(金) 14:26:32.88ID:BMRnp5Pxa
>>306
無断転載でも学習させることは合法です
0311名無しさん@お腹いっぱい。 (ワッチョイ ade0-chQ5)
垢版 |
2022/11/11(金) 14:35:56.40ID:v0zWMk2X0
違法DLしたデータでもAI通せば合法ならハッキングで盗んだデータもAI通せば合法だよな?
って先月言ってた奴がいたけどそれが早くも実現する悪党たちのフットワークの軽さよ
0313名無しさん@お腹いっぱい。 (ワッチョイ 3601-84Ua)
垢版 |
2022/11/11(金) 15:08:32.54ID:i4hnsemg0
現状リークNAIを使って逮捕されることはNAI
そもそもリークしたやつが逮捕されてNAIし公式も見守る姿勢を崩さNAI
法律の問題はさておき、罰がNAIなら気にしNAI
同じ理由でNHKにも金は払わNAI
0320名無しさん@お腹いっぱい。 (ワッチョイ b168-Uoj/)
垢版 |
2022/11/11(金) 15:39:09.13ID:vIGRYoi+0
anythingは背景の描き込みが緻密で、デフォでマスピ補正と人体の破綻阻止の補正がかかってる感じ
DPM++の20stepでも安定して良絵を量産してくれるから速くて快適。学習したHNも流用できて言うことなし

この辺りはエロスレよりふたばが詳しく検証してるはず
0324名無しさん@お腹いっぱい。 (ワッチョイ a901-fUD8)
垢版 |
2022/11/11(金) 16:15:21.31ID:AuhQOsCL0
画像生成の環境整える前にグラフィックドライバーも更新しておきたいてす、誰か助言ください…

画像生成用にドライバ更新したいのですがGeForce Experienceで確認するとgame readyドライバ、studioドライバの二種類あって…

画像生成の用途だとstudioドライバを選択した方がいいですか…?
0325名無しさん@お腹いっぱい。 (ワッチョイ 8101-YZoV)
垢版 |
2022/11/11(金) 16:28:10.66ID:GEcBgb+d0
>>274
GB、白抜き、普通背景をデータセットに各種入れといたほうがいいんじゃない
俺はそうしてる
0327名無しさん@お腹いっぱい。 (ワッチョイ f57c-4MHG)
垢版 |
2022/11/11(金) 16:39:58.47ID:XqEkO4ye0
違法性の話と著作権法の話がごっちゃになっとる
「AIへの学習目的での利用は著作権法では保護されない」というのと
「モデルリークが不正アクセス禁止法や不正競争防止法に抵触したり、損害賠償が通る可能性がある」というのは両立するぞ
0329名無しさん@お腹いっぱい。 (ワッチョイ 0deb-o+MF)
垢版 |
2022/11/11(金) 16:47:08.41ID:F9HHRpPa0
>>324
分かんなかったらgame
ゲームを全くやらないならstudioでもいいけど、あなたにメリットがあるかは不明

自分はblenderダヴィンチ使うからstudio使ってるけど、はっきり理由を説明できないなら基本的にgameでいいよ
世の中の95%以上の人はgame使ってるだろうしそれで問題になることは基本的にない
0331名無しさん@お腹いっぱい。 (ワッチョイ 8101-YZoV)
垢版 |
2022/11/11(金) 16:54:25.71ID:GEcBgb+d0
>>329
ドライバの違いで速度とか変わるの?
色の厳密さとか?
0332名無しさん@お腹いっぱい。 (ワッチョイ 515f-o+MF)
垢版 |
2022/11/11(金) 16:56:00.68ID:NcI++JGL0
Anyは特に工夫しなくてもNAIより高密度できれいな絵が出るかわりに、抽象表現の絵作りはNAIよりやりづらくなった感じはする
waifu1.2から1.3になったような安定化・収束傾向なので、気に入らない人もいるだろうな
0334名無しさん@お腹いっぱい。 (ワッチョイ 0deb-o+MF)
垢版 |
2022/11/11(金) 17:00:37.27ID:F9HHRpPa0
>>331
むっちゃ最適化されてるゲームで数フレーム変わるかもしれないみたいな感じじゃないか
あんま検証してる人見たことないけど

studioは一応精度とか安定性が高いってことになってるから
絶対ソフトが落ちたら嫌なクリエイターとかyoutuberならこっちだと思う
ただ基本的に微差。ゲフォはどちらでも最高の体験ができますって言ってる
0337名無しさん@お腹いっぱい。 (ワッチョイ 8101-YZoV)
垢版 |
2022/11/11(金) 17:28:02.97ID:GEcBgb+d0
>>334
>>335
ありがと、やっぱりそんなもんか
0355名無しさん@お腹いっぱい。 (ワッチョイ 23f2-BvCT)
垢版 |
2022/11/12(土) 03:32:10.56ID:XI1nMjFe0
Hypernetの内部に記録されるファイル名?って後から変更できない?…
初期に001って名前で作ったら画像コメント欄に記入されるファイル名が
001-500.ptも001-1000.ptも全部001って名前で記録されてしまって
どれがどのptを使ったのか全然わからない…
0368名無しさん@お腹いっぱい。 (アウアウウー Saa9-EmX0)
垢版 |
2022/11/12(土) 13:16:51.27ID:GcLtn+pua
1を基準に
アナルの広がり0.1のチェックポイントとgapeみたいな締まり10のチェックポイントを9:1くらいでマージしたら
[:spread anus:0.2]がアナルの広がり1くらいになるかもしれないってことでいいのか
そんな直観的なもんなの?マージって
0375名無しさん@お腹いっぱい。 (ワッチョイ 0522-vH5O)
垢版 |
2022/11/12(土) 15:46:18.29ID:B77kXyhU0
そのあと強度弱めで全体をもう一度i2iしてやると、上書き部分が馴染むのでなお良しです。
0377名無しさん@お腹いっぱい。 (ワッチョイ 23be-IBSA)
垢版 |
2022/11/12(土) 15:59:21.57ID:6VEDxjAt0
>>376
マスクにブラーかけるか、歪んだ後ノイズ薄めでi2iかけて歪んだ部分をごまかせばいいんじゃない
0379名無しさん@お腹いっぱい。 (ワッチョイ a37c-0qx4)
垢版 |
2022/11/12(土) 18:06:14.85ID:Dz/bYss/0
automatic1111は仕様なのかバグなのか、プロンプトを変更した時、最初の数枚だけ前回のプロンプトの影響を受けてるような挙動をするのは結構言われてるな
念のため必ず10連するようにしてるわ
0380名無しさん@お腹いっぱい。 (アウアウウー Saa9-ZJUc)
垢版 |
2022/11/12(土) 19:01:05.20ID:YeITB07Fa
DBで顔だけ覚えさせるときは5枚位で左右それぞれの向きにすればいい?
0383名無しさん@お腹いっぱい。 (ワッチョイ 0522-vH5O)
垢版 |
2022/11/12(土) 19:28:21.80ID:B77kXyhU0
まあ、同じseedで後でやり直して同じ結果になる以上、だったら1111にはプロンプト変更前と似た雰囲気の絵を出すseedを選別する機能があるかっていうとそんなわけないので。

それはさておき、傾向掴むのに10回くらい回す必要があるのは、それはそう。

同じプロンプトでこの二つが出てきたりするもんな……

https://i.imgur.com/8Z4AN8W.png
https://i.imgur.com/akDjizF.png
0385名無しさん@お腹いっぱい。 (ワッチョイ 2310-ZZlP)
垢版 |
2022/11/12(土) 20:01:13.70ID:D02zmtAG0
>>381
midjourneyはもはや画風を売りにしてないね
SDに(今のところ)ない新しい機能をいち早く付けて、それが強みになってる
全部リークされたりしない限りは上手いこと住み分けられるんじゃないかな
0388名無しさん@お腹いっぱい。 (ワッチョイ c568-/i6p)
垢版 |
2022/11/12(土) 20:29:06.29ID:WJK0oDyz0
質問です
yamlファイルってNAIはリークされてるから手に入りますけど
それ以外のモデル、Anything-V3.0とかを使う場合はどうすればいいんでしょうか?
NAIの使っても構わないのか、そもそもいらないのか…
0394名無しさん@お腹いっぱい。 (ワッチョイ cb7c-erDH)
垢版 |
2022/11/12(土) 22:56:53.70ID:ALakRml90
Midjourneyとの技術差が広がりつつある気がするけど、SD巻き返せるかな。PhotoshopとGIMPみたいな関係になったら悲しい
0399名無しさん@お腹いっぱい。 (ワッチョイ 23f2-BvCT)
垢版 |
2022/11/13(日) 04:26:09.87ID:qKK7ObVx0
XYのチェックポイント比較、ファイル名を改行とか出来んのかな
マージckptて名前が長くなりがちだから隣のファイル名と被って何が何なのか全然判読出来ん
縦にしたら横の画像にまで文字が入ってしまうし
0407名無しさん@お腹いっぱい。 (ワッチョイ dde0-vH5O)
垢版 |
2022/11/13(日) 13:47:24.82ID:yevUhSJZ0
パーティション切るときにCドライブは容量最小限にして基本Dドライブにしてたら
pythonがCドライブでしか動かんから容量カツカツでマジ苦しんでる
Cドライブ以外で動かす方法ってないのものか
0412名無しさん@お腹いっぱい。 (アウアウウー Saa9-EmX0)
垢版 |
2022/11/13(日) 14:01:16.65ID:HtAkdQiNa
>>410
だな
CLIP いんてろげーたー(スペル覚えてない)はCLIP的にプロンプトを解析
DeepDanbooru いんてろげーたーはDanbooruタグ的にプロンプトを解析するもので
同じ絵が出来ない理由はxformersにあるって聞いたことがある
何故かは知らない
0414名無しさん@お腹いっぱい。 (ワッチョイ 4543-gPc0)
垢版 |
2022/11/13(日) 14:40:35.90ID:ExvL4fU60
>>412
だいぶ前に生成した絵が同じプロンプトや設定にしているのに出ないっていうのは、
setting に Sampler parameters が出来てからじゃなかったかなという記憶
xformersはなんかはしょって高速化してるらしく、毎回生成が微妙に変わる
それもあってか、学習時に有効にしていると学習結果がおかしくなるらしい
0421名無しさん@お腹いっぱい。 (ワッチョイ ddda-nDAF)
垢版 |
2022/11/13(日) 18:01:31.31ID:pAiZRbel0
何考えて世に出したんだろな
オナ猿しか喜んでねぇじゃん
0422名無しさん@お腹いっぱい。 (ワッチョイ a37c-IoIj)
垢版 |
2022/11/13(日) 18:05:16.53ID:JIbugP4M0
>>419
だから>>405をやるんだってばよ
モデルとvaeがトップ画面にくるってばよ
CLIPも持ってきたいなら
sd_model_checkpoint,sd_vae,CLIP_stop_at_last_layers
だってばよ
他の項目を足したい時はconfig.jsonの中身をメモ帳で開けば、各設定の名前がわかるってばよ
0435名無しさん@お腹いっぱい。 (ワッチョイ d55f-/i6p)
垢版 |
2022/11/13(日) 20:00:25.22ID:8JsvszDW0
7.94GBなん?
うちのは7.17 GB (7,703,657,858 バイト)だわ

PS D:\stable-diffusion-webui\models\Stable-diffusion> certutil -hashfile Anything-V3.0.ckpt
SHA1 ハッシュ (対象 Anything-V3.0.ckpt):
42190820033b9aa7cfd4a27367e079e3d43a55f0
CertUtil: -hashfile コマンドは正常に完了しました。
0437名無しさん@お腹いっぱい。 (ワッチョイ 4555-FFna)
垢版 |
2022/11/13(日) 20:14:18.82ID:2x3YopWp0
>>433
普通の複雑度のキャラなら10で良い。
良いというのは絶対に十分ということで、実際は8とかそこらでも足りる。

昨日今日でメイドインアビスの「レグ」「ナナチ」「リコ」で二次創作作ったけど、
「リコ」が10→Riko
「ナナチ」が10と15の2モデル→NanachiOld, Nanachi
「レグ」が10→Regu
「レグの頭だけ」が10→ReguFace
「必ず3人が揃って写った画像」を15→MIAall
「1人か2人か3人のいずれかが写った画像」を20→MIAstyle
[MIAall|MIAstyle], [Regu|ReguFace], [NanachiOld|Nanachi], Riko
合計10×4+15×2+20=90で作ったのがこれ
https://i.imgur.com/6zX9dmP.png

正直超過剰だったと思う
それぞれ数十万ステップ回したけど安定仕切ったとは言えない
実際はナナチくらい複雑でも10で十分表現できる
0446名無しさん@お腹いっぱい。 (アウアウアー Saab-KEnC)
垢版 |
2022/11/13(日) 21:17:29.62ID:5Ob2a7pBa
anythingv3.0はなんか色が薄いな…中国の人の好きな塗りなのか?
サムネサイズだとおおっとなるけど小物ぐちゃぐちゃなのは変わらず
絵の情報量が増えすぎてる気がしなくもない

プロンプトの勝手もまあまあ違う模様
0448名無しさん@お腹いっぱい。 (ワッチョイ 4555-FFna)
垢版 |
2022/11/13(日) 21:21:58.55ID:2x3YopWp0
>>438
構図はある程度は制御できるし、ある程度は運任せ
今回も最初は2人のつもりだった

https://i.imgur.com/U9n2pri.png
最初は微妙でも、それっぽいキャラがそれっぽい位置に居さえすれば、
高画素化しつつ各キャラをマスクしてinpaintを繰り返すだけで質が上がっていくので大丈夫
むしろ最初は:0.9や:0.8くらいで絵を固めないでガチャしたほうが良い
そのあと場合や重みによって:1.0やそれ以上に上げていく

https://i.imgur.com/uqTpaZ6.png
今回はその過程でたまたまナナチが反対を向いた図にピンときたので
outpaintで温泉を拡張してレグも登場させることにした

https://i.imgur.com/2BrUmrG.png
どんだけ頑張っても(>_<と頭のバンドは自分で描いた)
頭だけのレグがうまくいかないので、
頭だけで学習し直して再チャレンジすることにした

https://i.imgur.com/6zX9dmP.png
最後にキャラ以外のところをマスクしてi2iしてガタツキを取って、
さらに全体で薄くi2iして完成
0449名無しさん@お腹いっぱい。 (ワッチョイ 4555-FFna)
垢版 |
2022/11/13(日) 21:35:04.92ID:2x3YopWp0
>>440
うまくいかないのは学習素材のせいもあるかもしれない
本当はキャラの大事な部分が見切れていない画像を準備して、背景を白抜きにした方がいいけどそれは面倒

1:1でない1枚の画像の使い方として、
余白をつけて縁の太い縮小画像にするやり方と、重要な部分をクロップして見切れた拡大画像にするやり方があるけど、
そのどちらかではなく、両方行って1枚の画像の情報を余すとこなく使うと良い。
余白を少なくするために、512x640とかで学習を試してみるのも良いかもしれない。

そして、ある程度回して、もし画像に望ましくない特徴が含まれていたら、
その特徴を与えているであろう素材を排除して、学習を続ける
学習率の指定は、まだ全然定まってないけどこんな感じに徐々に下げていく
1.0e-2:5000, 8.0e-3:10000, 6.5e-3:15000, 5.0e-3:20000, 4.0e-3:25000, 3.0e-3:30000, 2.5e-3:35000, 2.0e-3:40000, 1.5e-3:45000, 1.25e-3:50000,
1.0e-3:55000, 8.0e-4:60000, 6.5e-4:65000, 5.0e-4:70000, 4.0e-4:75000, 3.0e-4:80000, 2.5e-4:85000, 2.0e-4:90000, 1.5e-4:95000, 1.25e-4:100000,
1.0e-4:100000, 8.0e-5:125000, 6.5e-5:150000, 5.0e-5:175000, 4.0e-5:200000, 3.0e-5:225000, 2.5e-5:250000, 2.0e-5:275000, 1.5e-5:300000, 1.25e-5:325000, 1.0e-5
0450名無しさん@お腹いっぱい。 (ワッチョイ 4555-FFna)
垢版 |
2022/11/13(日) 21:38:17.61ID:2x3YopWp0
あ、あとテンプレートファイルは
キャラならsubject系よりstyle系を使ったほうが良さげな感触がする。
多分テンプレートファイルをきちんと作ればいい結果が出るだろうけどまだ試せてない
0451名無しさん@お腹いっぱい。 (アウアウアー Saab-KEnC)
垢版 |
2022/11/13(日) 21:42:46.81ID:foQwLLq4a
同じプロンプトでの違い
上がNAI、下がAny
https://i.imgur.com/1QgIgMC.png
https://i.imgur.com/EI3Eo2v.png


https://i.imgur.com/ooS5oRB.jpg
https://i.imgur.com/rO8tgpt.jpg

https://i.imgur.com/KRb7jkW.jpg
https://i.imgur.com/avYdgMM.jpg

さらにイラスト寄りへ調整してるっぽい?
元素法典のとこがやってるから

その他ミク、情報量多すぎて顔を隠すとすごい散らかった絵に見える
https://i.imgur.com/S5zPKdy.jpg
0454名無しさん@お腹いっぱい。 (ワッチョイ a37c-IoIj)
垢版 |
2022/11/13(日) 22:49:45.47ID:JIbugP4M0
>>445
好きな絵柄を追加学習させて絵に反映させたり、通常じゃ出て来ないキャラを覚えさせて絵に登場させたりとか出来るようになる
そういう学習はVRAMが大量に必要で、計算も何時間もかかる
ま、今は考えなくていいかもだけど、AI生成にハマると大抵手を出したくなるからみんなVRAM多めをオススメしてくるのさ
0465名無しさん@お腹いっぱい。 (スップ Sd43-mqg7)
垢版 |
2022/11/14(月) 01:58:05.61ID:mNYnIp+Cd
>>461
たしかwebuiのgithubにinpaintingモデルと普通のモデルをマージできるようにするプルリクエストが立ってたはず
自分の環境だとout of memory出てマージ後のモデルでの生成は失敗したけどVRAMが多ければ大丈夫だと思う
0471名無しさん@お腹いっぱい。 (ガックシ 064b-ZZlP)
垢版 |
2022/11/14(月) 13:16:38.37ID:zqWvFKV66
無料colabでbatch size2以上は無理だという先入観に囚われていたよ......SDくんもがんばってるんだね......
0476名無しさん@お腹いっぱい。 (ワッチョイ d55f-/i6p)
垢版 |
2022/11/14(月) 15:25:33.78ID:ZByjyKPV0
1111でDBしようとすると
RuntimeError: CUDA error: invalid argument
CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.
For debugging consider passing CUDA_LAUNCH_BLOCKING=1.
ってエラーが出るんだが、原因判る人います?
0477名無しさん@お腹いっぱい。 (アウアウウー Saa9-Svi4)
垢版 |
2022/11/14(月) 15:42:37.71ID:GzOm7fnta
わからんけどメモリ足りないんやろ
0479名無しさん@お腹いっぱい。 (ワッチョイ 1d7d-FFna)
垢版 |
2022/11/14(月) 15:46:18.21ID:86kInj2g0
NovelAIの運営は機能を増やしてくれるのかね
金を貰ってんだから機能追加して欲しい
0481名無しさん@お腹いっぱい。 (ワッチョイ c568-/i6p)
垢版 |
2022/11/14(月) 15:59:46.95ID:Zfl+QVNL0
自分もcolab版Auto1111の質問いいすか
画像生成しおわっても「generate」ボタンに戻らない時があって、(skipとか押しても戻らない)いちいち再リロードしないといけないんだけど
あれは何が原因で解決策はあるのでしょうか?
0485名無しさん@お腹いっぱい。 (アウアウウー Saa9-PKk0)
垢版 |
2022/11/14(月) 16:40:17.60ID:xM7N9VNTa
>>482
3090ならNMKDの方のDB使ってみれば?
任意のモデル選択できるし正規化画像要らなくて精度高いよ
0486名無しさん@お腹いっぱい。 (ワッチョイ 95ad-FFna)
垢版 |
2022/11/14(月) 16:44:24.95ID:3VJEl9640
>>481
ずっと前からissueに報告あがってるけど、解決してない
解決方法知りたいよな
https://github.com/AUTOMATIC1111/stable-diffusion-webui/issues/3150

実用上は、そのタブをあきらめて、
新しいタブで同URLのwebuiを開けば、再起動はしなくても使える。
それまで使ってた呪文やパラメータ設定とかは消えちゃうんで
新しいタブにコピー&ペーストしなきゃいけない(のは面倒だよねえ)
0487名無しさん@お腹いっぱい。 (アウアウウー Saa9-PKk0)
垢版 |
2022/11/14(月) 16:45:58.29ID:xM7N9VNTa
>>485
って言ったのは1111版DBはその手のエラー報告多くて対処がまだ確立されてないから
0490名無しさん@お腹いっぱい。 (ワッチョイ ed5f-BvCT)
垢版 |
2022/11/14(月) 16:49:25.55ID:kO/hhj+D0
>>460
おいおい、やばくね?
これ触って、SDをローカルで初めて動かした時以来の衝撃受けたんだけど
正直インペイント機能は今まで舐めてたけど、これくらい直感的に品質良く
絵を出力してくれるなら信者に鞍替えするわ
絵ガチャ>インペイントで修正の作業効率が超向上した

唯一の不満は、ローカルで完結するように作って欲しいところくらいかな
オンライン上にあるのはUI部分だけなんだろ?知らんけど
0495名無しさん@お腹いっぱい。 (ドコグロ MMab-6gqO)
垢版 |
2022/11/14(月) 17:42:00.12ID:FDtdlGv7M
拾ってきたNAI用プロンプト、手元の1111でほぼ再現できるときとできないときがある
どうも[]の控えめの指定がどっかに入るとズレが大きくなるようなんだが
変換の倍率が実は違うとか、prompt_parserの計算式が本家とは違うとか、なんかそれっぽい情報見たことある人おらん?
0498名無しさん@お腹いっぱい。 (ワッチョイ 4b8e-EHNx)
垢版 |
2022/11/14(月) 17:43:02.24ID:awfpi3Ng0
>>483 は、WebUI全般を改造しようとしてマナーが悪いからやめろって言われたり
専用モデル持ってこいとか24GB以外は知らんとか、拡張機能にしてオンオフできるようにしろとか
まだまだ動かん報告が多いね。オリジナルより顔固定のハンコ絵になるのは悪手だし、プルリク閉じてるし、生暖かく見守ろう
0502名無しさん@お腹いっぱい。 (アークセー Sxc1-6gqO)
垢版 |
2022/11/14(月) 17:58:59.78ID:ciz22DhJx
>>499
うーん?
NAI→WebUIプロンプト変換しとんのかってレベルの話ならしとる

変換通して強調はちゃんとそれっぽくなるんだけど
弱めるほうが入るとやっぱ大きく変わるんだよな…
もっと詳しい情報wikiにあった?結構読んだつもりなんやけどな
0508名無しさん@お腹いっぱい。 (アークセー Sxc1-6gqO)
垢版 |
2022/11/14(月) 19:00:49.03ID:ciz22DhJx
うーんわからん、プロンプト変えて検証始めたらそこまで大きく変わらんくなった
小数点以下の誤差レベルの差が本当にたまたま大きく変化する閾値またいじゃうプロンプトとシードの組み合わせだった感じかこれ?すまんな
0509名無しさん@お腹いっぱい。 (ワッチョイ 1d7d-FFna)
垢版 |
2022/11/14(月) 20:38:27.63ID:86kInj2g0
SD使いたいけど30万のPCが必要と言われて辞めてしまった
普通のPCで動くのが欲しいンゴ
0511名無しさん@お腹いっぱい。 (アウアウエー Sa13-vH5O)
垢版 |
2022/11/14(月) 20:50:56.21ID:8OwiiXi0a
あるいは、最近のゲームの必要スペックは急激に上昇してきてるから
あと数年はゲームを快適に遊べるゲーミングPC兼用の投資と考えて、思い切ってRTX3000クラスを買うのもありだと思う
0513名無しさん@お腹いっぱい。 (ワッチョイ a37c-IoIj)
垢版 |
2022/11/14(月) 22:56:57.22ID:P/iUL6OC0
お絵描きAIメインと割り切るのだったらCPUもだいぶ型落ちでいいし
vram12GBの3060さえ安く手に入れば20万は余裕で切るとは思う
それでも学生やニートや子育てパパとかには高いおもちゃかもね
0514名無しさん@お腹いっぱい。 (ワッチョイ ed5f-qdwE)
垢版 |
2022/11/14(月) 23:30:54.14ID:7waFkvX50
Web版一番上のサブスクで数週間遊んだがかなりハマった
3080使ってるんだが色々弄れるみたいだしスタンドアロン版に乗り換えるべきなんだろうか
Web版のほうが優れている部分ってあるの?
0519名無しさん@お腹いっぱい。 (ワッチョイ 03bd-64Pm)
垢版 |
2022/11/15(火) 01:07:45.01ID:+BbgLjot0
絵柄学習てキャラ学習よりステップ増やすべきだろうてことは分かるけどどれくらい増やせばいいんだろ
キャラ学習は出てくればそこで分かるけど絵柄学習だとどこが過学習ラインなのか全然わからない
0520名無しさん@お腹いっぱい。 (ワッチョイ 7501-vH5O)
垢版 |
2022/11/15(火) 01:21:54.32ID:l9hPClwU0
>>518
野獣先輩はココでもトレーニングしてるのか(驚愕
0521名無しさん@お腹いっぱい。 (ワッチョイ dde0-FFna)
垢版 |
2022/11/15(火) 01:40:24.97ID:j90Nt9cr0
3000枚ほどの画像でaestheticやろうとしたら容量多すぎなのかクラッシュして半端なとこで強制的に学習終了
ところが何故かそのptファイルを特定のmodelと組み合わせると嘘だろ?って神がかった絵が出てたんだよ
でもこの前そのファイルを間違って消して二度と神絵の数々を再現できなくなっちまった
ちょっとしたことで二度と同じ絵を再現できなくるAI絵のリスクを味わった
0522名無しさん@お腹いっぱい。 (ワッチョイ a5ad-FFna)
垢版 |
2022/11/15(火) 01:49:23.13ID:W5ExsNaB0
ckptをdiffersに変えたいんだけどトラブった...
diffuersファイル一式、omegaconf、Transformersも皆入れたんだけど次のエラーを吐くんだ。
ImportError: cannot import name 'DPMSolverMultistepScheduler' from 'diffusers' (C:\Users\Miya\Desktop\env\lib\site-packages\diffusers\__init__.py)

こいつ何...?有識者いたら教えてくれるととても喜ぶ。
0523名無しさん@お腹いっぱい。 (ワッチョイ 2310-ZZlP)
垢版 |
2022/11/15(火) 02:16:17.78ID:gwoYjZPz0
今更だけどWD1.3ってどの辺がダメだったんだっけ?
ダンボールタグじゃない普通の記法のプロンプトがNAIとかと比べて全然効かないの?
あと美少女ばっか出るみたいな感じ?
追加学習のベースとしてなら1.2よりいいんかな
0524名無しさん@お腹いっぱい。 (ワッチョイ d55f-vH5O)
垢版 |
2022/11/15(火) 02:37:08.93ID:AgWY/aZG0
1.2がdanbooru記法(アンダースコア連結 + アルファベット順)で学習されてて、1.3から普通の記法のはず
1.3は1.2ほどリアルによれず、NAIほどイラストによれなかった印象(というかNAIが破壊的すぎた)
Epoch6を過ぎたあたりから過学習気味になってたと思うから、追加学習のベースにするならそれより前の方がいいかも
0525名無しさん@お腹いっぱい。 (ワッチョイ 2310-ZZlP)
垢版 |
2022/11/15(火) 02:53:43.43ID:gwoYjZPz0
>>524
NAIがやばすぎただけで、イラストで使うなら問題ない感じかありがとう
個人的にNAIは使いたくNAIからね
0526名無しさん@お腹いっぱい。 (ワッチョイ 4b8e-EHNx)
垢版 |
2022/11/15(火) 02:55:51.33ID:V3l1becM0
>>523
NAIの破壊力に完全に負けてた。求められていたのはNAIだった
epoc小出しにして無駄にモデル数増えてプロンプト再現も難易度が高く不評も買った
完成版1.3に合わせたようにNovelAIリークが出回って、同じ学習元の無断投稿ダンボール使ってるならNAIでいいやって事に
タダでもダンボールのアンダースコアやアルファベット順で使い方が不評だったのもあって、あえて使う意味はマスピ顔以外がたまに出るかもって程度になってしまった
pixivで受けがいいのは版権やマスピ顔の巨乳やロリだった
日本ではepoc6くらいまでは投稿する人もプロンプトの公開がほとんどなくて
10月以降の新規でやるなら真似たいNAIのプロンプトを再現するにはNAIを使うって空気に押され
10月中旬の中華元素法典が出回って完全に止めを刺された感じ
マージベースにするにしても、実写はSD1.4か1.5とその改良のMidjorney_v4、2DはNAIかAnything_v3が人気
結果的に、このご時世の話題も情報量の少なさも合いまって、良い悪い抜きでめんどくさい感じになってる
いまは絵面学習ではなく構図学習だっていう事で1.4を頑張っているらしい
0537名無しさん@お腹いっぱい。 (ワッチョイ 1dd0-FFna)
垢版 |
2022/11/15(火) 09:42:27.09ID:eYp1WTV70
Anything-v3.0.ckptをconvert_original_stable_diffusion_to_diffusers.pyでdiffusers形式に変換しようとすると

Checkpoint Anything-v3.0.ckpt has both EMA and non-EMA weights.
In this conversion only the non-EMA weights are extracted. If you want to instead extract the EMA weights (usually better for inference), please make sure to add the `--extract_ema` flag.

と出る。
--extract_ema追加しても同じメッセージが出るのでお手上げ。
一応変換は出来るけど7GBから5GBに容量減ってるからEMAの部分が変換出来てないんだろうな...
0543名無しさん@お腹いっぱい。 (ワッチョイ a37c-BvCT)
垢版 |
2022/11/15(火) 11:49:49.58ID:+hrAUuEU0
>>541
>>542
ものによってはそれで出来ることもあるかもだけど、人物と背景とのマッチングが悪くなってしまうからねぇ
出来れば背景と人物は一緒に出したいよね
なので二次絵なら高解像度で生成して邪魔なものを消すってほうがベターかな
ただ、SD1.5で背景だけ作るって意味ではなかなか楽しかったのでお試しの価値はあるかも
0551名無しさん@お腹いっぱい。 (ワッチョイ dde0-vH5O)
垢版 |
2022/11/15(火) 13:33:17.02ID:j90Nt9cr0
出来るポーズと出来ないポーズに極端な差があるよな
最近の絵描きに特有の流れるような動きのポーズ?みたいのが全く出せない
言葉で表現できなくてタグ付け出来ないよう要素は無理ってことか
0552名無しさん@お腹いっぱい。 (ワッチョイ a37c-IoIj)
垢版 |
2022/11/15(火) 13:49:46.83ID:+hrAUuEU0
>>550
さっきまで優しかったのにいきなり変わったから何事?って思っただけw

>>551
指定は多分出来ないだろうね
そこまで詳細にポーズとして学習させてないだろうし
hard action poseみたいにジャンルを指定して強調すると色んなポーズはとってくれるが
0557名無しさん@お腹いっぱい。 (ワッチョイ f556-Lv2y)
垢版 |
2022/11/15(火) 15:21:15.02ID:CV22ZGhX0
知識乞食
0571名無しさん@お腹いっぱい。 (ワッチョイ 2536-k7jF)
垢版 |
2022/11/16(水) 00:15:23.83ID:W4z1fQJB0
画像生成AI「Midjourney」をアニメ風二次元イラストに特化させたモデル「niji・journey(にじジャーニー)」がクローズドベータテスターを一般募集中
https://gigazine.net/news/20221115-niji-journey/


にじジャーニー - niji・journey -(ベータ)
https://pipoya.notion.site/niji-journey-9426c1a703d44dadbc6f14f679c7540f
**クローズドβの一般募集が開始されました!**

- Midjourneyメンバーでなくとも登録可能です。
- メールアドレスを待機リストに登録すれば、順次招待されます。
※現在1日数人~10数人程度の増加で、品質を保つためゆっくり招待しているそうです。
- クローズドβ中は無料で画像生成出来ます。
- Discordを使用した画像生成サービスとなるため、別途Discordアカウントが必要です。
0573名無しさん@お腹いっぱい。 (ワッチョイ a37c-IoIj)
垢版 |
2022/11/16(水) 00:26:35.77ID:PRstzewt0
>>571
生成された絵を見た感じだとそんな凄味は感じないなぁ
むしろ本来のMJの良さが消えてる気がするけどこれは生成してる人達のプロンプト技術の問題かな?
SD系よりは断然聞き分けがいいらしいから使う人次第ってとこかね
0580名無しさん@お腹いっぱい。 (ワッチョイ c5ba-P3SJ)
垢版 |
2022/11/16(水) 06:05:26.67ID:kHLmxCoU0
>>577
確かにAUTOMATIC1111本人も質問とかここで気軽にやってねって書いてますね
5chのスレみたいな日本語で駄弁りながら的な所が良かったんですが
さすがにニッチすぎて無いですかね?ありがとうございます
0590名無しさん@お腹いっぱい。 (ワッチョイ ed5f-BvCT)
垢版 |
2022/11/16(水) 11:56:02.54ID:F5L9mPUa0
上位のAI絵見ると高解像度だし人物が小さくても顔はきれいに出てるし
手もちゃんとしてる(ここは加筆か?)同じAIでも良いものを出すには結構技術とマシン性能がいるんだよな
0596名無しさん@お腹いっぱい。 (ワッチョイ 23f2-5DY9)
垢版 |
2022/11/16(水) 12:48:30.88ID:obupqW7x0
1111、最終更新日が「4日前」に……
0601名無しさん@お腹いっぱい。 (ワッチョイ 237d-x4dY)
垢版 |
2022/11/16(水) 12:56:20.28ID:16CrbN780
>>594
手間はかかるけど自分は確立した
2キャラで生成ガチャ
必要なら背景を別に準備して組み合わせてi2i
inpaintで1キャラずつ補正
outpaintで拡張して追加のキャラを書く
それを繰り替えす
最後に背景だけでinpaint
オマケで全体でi2i
完成
0608名無しさん@お腹いっぱい。 (ワッチョイ 23a5-BvCT)
垢版 |
2022/11/16(水) 13:23:47.14ID:qeIr2R1L0
>>583
呪文はつまるところ概念の引っ張り合いだから、同じ概念の呪文は積めば積むほどそっちが強くなるし、
とっちらかった概念を色々詰め込むと目指す方向が定まらずどっちつかずの絵になるよ
そして呪文によっても同じ1語なら等価でも無く、マイナーキャラの名前みたいな全く学習してないとは言わんけど弱い呪文とか、
あるいはnsfwみたいにそれ一語で方向性がスパッと決まりかねないくらいの強力なワードもある

https://github.com/castorini/daam
どのプロンプトがどういうふうに効いてるかを視覚化するツールもあるし、これもそのうち1111に実装されるかもな
0619名無しさん@お腹いっぱい。 (アウアウウー Saa9-O1le)
垢版 |
2022/11/16(水) 15:34:03.70ID:j9QgQS0Pa
>>607
絵柄はCFGスケール低い方が好みだな
ネガティヴだけCFGスケール効かせて破綻無くす事できないのかなー
0620名無しさん@お腹いっぱい。 (ワッチョイ a501-WFXv)
垢版 |
2022/11/16(水) 15:57:24.40ID:s3y+vIRl0
>>608
これいいな
呪文がどこに作用してるのか見たいわ
0625マグネシウムホイール (ワッチョイ cdbd-FFna)
垢版 |
2022/11/16(水) 18:42:45.33ID:NNSVSRcB0
殺風景な画像→C:\Users\KYOKO\Desktop\ねこかず\ヒカキン_.png
0628名無しさん@お腹いっぱい。 (ワッチョイ c5ba-P3SJ)
垢版 |
2022/11/16(水) 20:04:08.52ID:kHLmxCoU0
>>622
ひとつは例えば「black long hair girl」を「blhg」みたいな造語に登録出来るTIの画像抜き簡易版を作る拡張です

通常のTIより軽い学習を30秒程回せば99%くらい意味が合致する圧縮造語作れます

もう一個は対象画像と「副詞,形容詞,名詞」みたいな三つ組指定の組み合わせフレーズとの合致率を表示する拡張です

素のIntertogatorみたいに合致タグだけ出すんじゃなくて一般の辞書ファイルから「extremely large apple」みたいな組み合わせを作って類似度ランキングにします
0630名無しさん@お腹いっぱい。 (ワッチョイ c5ba-P3SJ)
垢版 |
2022/11/16(水) 20:19:55.35ID:kHLmxCoU0
>>629
二つ目は例えば「そもそも英語でこれ何ていうのかわからないモノ」を名詞一覧からランキングで出したり
「gorgeousより場面に相応しい表現があるはずだけどマイナーすぎて知らない形容詞」を見つけたり
「なんか崩れててキモい手の画像」から「collapsedとmutatedとcreepy」要素のどれが強いかを判定したり出来ますね
0632名無しさん@お腹いっぱい。 (ワッチョイ c5ba-P3SJ)
垢版 |
2022/11/16(水) 20:36:40.00ID:kHLmxCoU0
>>631
1つ目のは正にそれですがもしかして既に有りましたか?
プロンプトのテキストを弄るんではなくTIの仕様を拝借して同等な新しい概念を持つサイズ1(から75まで好きなサイズ)のトークンにできます
まだ試験段階ですけどマスピ+ベスクオくらいなら1トークンに収めても機能する可能性があります
0634名無しさん@お腹いっぱい。 (ワッチョイ a501-BvCT)
垢版 |
2022/11/16(水) 20:49:37.05ID:5LBWraE20
>>630
上手く使いこなせれば強そうだが、danbooruタグ検索とかと重複してる部分はありそうかな
>>632
トークン節約できて一単語辺りの影響度が下がる問題も解決できるのか
シンプルかつ既存言語でも頻用されてる概念だし強い
逆にどう考えても便利すぎていつかは誰かが作りそうだから早めにコミットしてはいかが
0639名無しさん@お腹いっぱい。 (ワッチョイ c568-/i6p)
垢版 |
2022/11/16(水) 23:53:10.94ID:A9z8krEV0
モデルって.vae.ptみたいなのとセットだと思ってたのですが
それが必要ないモデルもあるんですよね?
Anythingモデルだとvaeが無いと色褪せるのは知ってますが
追加武装みたいなもんすか?
0645名無しさん@お腹いっぱい。 (ワッチョイ b58e-EHNx)
垢版 |
2022/11/17(木) 03:31:03.32ID:sLCGiQFV0
vaeは最後にもう1Step書き換えてくれる程度のもんだと思っとけばいいよ
トレントやhuggingfaceにあるAnything-V3.0のvaeはハッシュ見る限りNAIのコピー品だね
Waifu Diffusion VAE kl-f8-animeとかいろいろあるし使い分けだね
それ以外の出どころの分からないのは実績もないので自己責任で
0648名無しさん@お腹いっぱい。 (ワッチョイ 23f2-5DY9)
垢版 |
2022/11/17(木) 09:48:38.29ID:tR5FQwHD0
1111、最終更新日が「5日前」に……
0650名無しさん@お腹いっぱい。 (ワッチョイ ed5f-FFna)
垢版 |
2022/11/17(木) 10:17:03.91ID:VGZVKRU00
何故かlpw_stable_diffusionがDiffusers.utilsのPIL_INTERPOLATIONを読み込めないというエラーを吐いたが、当該箇所のPIL_INTERPOLATIONをPillowライブラリ側で代替したら普通に動くな
なおdynamic_modules_utils.pyの300行目にあるshutil.copyを止めないとファイル再取得によってlpw_stable_diffusionの書き換えが修正されるからそこも書き換えた
0653名無しさん@お腹いっぱい。 (スププ Sd43-QqIM)
垢版 |
2022/11/17(木) 13:13:14.78ID:KDIPCy67d
>>651
どんな環境でやってるのか知らないけど、一般的には(要素)と{要素}が両方使える環境はないと思うよ
AUTOMATIC1111とかのローカル系は(要素)表記で強調、NovelAI公式Webは{要素}表記で強調ってだけだから
0659名無しさん@お腹いっぱい。 (アウアウウー Saa9-EmX0)
垢版 |
2022/11/17(木) 13:44:47.58ID:AjStvslFa
お腹ちょっとだけ膨らませたい時とか後半のStepでだけpregnant効かせるとかしてる
[:pregnant:0.1]だか[:pregnant:0.9]だかどっちか忘れたけど
ちなみに効果を実感できているかと言われたら首を傾げる
0664名無しさん@お腹いっぱい。 (ワッチョイ 23d7-EHNx)
垢版 |
2022/11/17(木) 15:48:58.33ID:PCuNygCv0
(extra [arms|legs|fingers]:1.1)とかやってネガティブ圧縮に使ってるわ
強化数値はどのくらいが妥当になるのはは知らんので適当
0671名無しさん@お腹いっぱい。 (スププ Sd43-WM47)
垢版 |
2022/11/17(木) 18:02:28.02ID:BUstsHlCd
Novel AI関連のツイートで探してるのがあります。
割とNovel AIが出た初期のツイートで、座っている女の子の画像をベースにあくまでAIをイメージ補完や、構図の参考にするという使い方でした。
探しても出てこないんですが、どなたか出どころがわかる方がいたらリンクを貼ってくれたら幸いです。
0699名無しさん@お腹いっぱい。 (ワッチョイ a501-IC4t)
垢版 |
2022/11/18(金) 01:29:12.52ID:0JWvpgu/0
別に初代Coreシリーズとかでもたいして問題なくない?
接続バスの速度とかそんなにネックになってないでしょ。
メモリは16GB程度積むとして、あとはGPUだけ最新の物を搭載しろって話になる。
0708名無しさん@お腹いっぱい。 (ワッチョイ b58e-EHNx)
垢版 |
2022/11/18(金) 06:46:57.36ID:hQxixj4H0
開発や学習は基本VRAM24GBでシステムで32GBはないと何かを妥協しないといけなくなるって言ってるし
低VRAM環境はプログラムが完走するっていうだけで学習効率も速度も精度も落ちて思い通りにならなくてもまぁ仕方ないかなと
FP16とFP32でも同じものにならない訳だし当たり前っちゃ当たり前か
0714名無しさん@お腹いっぱい。 (ワッチョイ dde0-FFna)
垢版 |
2022/11/18(金) 09:35:12.14ID:m8Nd078r0
昨日NVIDIAのドライバが強制的にアップデートされてから動かなくなった
画像生成しようとするとあちこちで報告されてるこのエラーが出る↓
RuntimeError: CUDA error: an illegal memory access was encountered
CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.
For debugging consider passing CUDA_LAUNCH_BLOCKING=1.
0722名無しさん@お腹いっぱい。 (スププ Sd43-x4dY)
垢版 |
2022/11/18(金) 12:24:39.75ID:Af3wePXtd
マシで2年後の5090はメモリ256GBくらいにしてほしい
その頃には動画よりも高度なコンテンツまで波及してるだろうし
というかせっかく40902台手に入れられたのにnvlink.sliに対応してないのマジ凹むわ
0724名無しさん@お腹いっぱい。 (スフッ Sd43-8zR2)
垢版 |
2022/11/18(金) 12:27:08.96ID:DgGzrWFGd
その5090、300万円くらい?
0732名無しさん@お腹いっぱい。 (ワッチョイ 9be9-L0L7)
垢版 |
2022/11/18(金) 13:27:33.39ID:PAKsUItk0
>>731
数ヶ月前じゃ信じられない発言だぞそれ。VRAM20GBとか何処で使うんだよって誰しもが思ってた筈

stablediffusionの演算の為にgpu指定する機能とかほしい
0740名無しさん@お腹いっぱい。 (ワッチョイ 9be9-L0L7)
垢版 |
2022/11/18(金) 14:28:52.33ID:PAKsUItk0
A40だかA100は一枚1万ドルって何処かで見たな。それを40台使って学習して作ったmodelがnovelAIだろ。
0741名無しさん@お腹いっぱい。 (ワッチョイ 2502-CzAo)
垢版 |
2022/11/18(金) 14:29:10.09ID:K+4QG1A20
これ面白いな

StableDiffusion のTextual Inversion追加学習で敢えて変形した画像を学習させ、学習結果を「ネガティブプロンプトに」使うという試み。手が!手がちゃんと出てる!!

https://twitter.com/needle/status/1593428231901700101

https://pbs.twimg.com/media/Fhz9XxyUUAA8zrB?format=jpg&name=large

https://pbs.twimg.com/media/Fh0NG9WVIAAR8Oh?format=jpg&name=900x900
https://twitter.com/5chan_nel (5ch newer account)
0742名無しさん@お腹いっぱい。 (アウアウウー Saa9-BvCT)
垢版 |
2022/11/18(金) 14:35:02.21ID:6FNt9lDna
A100は価格コムにも載ってる(た)。3月の価格で80GBモデルで180万、40GBが130万ぐらい
乗ってる店に問い合わせたら取り寄せてくれると思うよ。円安だから1.5倍ぐらいは覚悟した方がいいだろうけど
0743名無しさん@お腹いっぱい。 (ワッチョイ f53e-H0Ic)
垢版 |
2022/11/18(金) 14:54:22.81ID:nYodbenM0
それでどんだけ消費電力がえぐいんだい?って思ったら
80GBのほうでも最大で300Wらしい
新車を買ったと思えば出せない金額ではないが
ここ最近のAI関連の飛躍的な進化でそれに最適化されていくだろうし
この金額だともっと突き抜けた性能が欲しくなる
0745名無しさん@お腹いっぱい。 (ブーイモ MM4b-Wqjf)
垢版 |
2022/11/18(金) 15:14:08.93ID:I1DEQct8M
よく見たら引リツに書いてあったわ

リンク先にある「bad_prompt.pt」をダウンロードして自環境の「\stable-diffusion-webui\embeddings」内に保存。その後、BadPromptにて「bad_prompt」を指定することで有効化されるようですね。後でやってみよう。
0749名無しさん@お腹いっぱい。 (ワッチョイ 23d7-EHNx)
垢版 |
2022/11/18(金) 15:32:24.26ID:VPRDR3i70
マルチGPU(SLIやnvlinkでない)に対応してくれたら3060を2枚みたいなのも手軽でいいなとは思った
1111のディスカッションでマルチGPU取り掛かってる人はいたみたいだけどその後どうなったんかな
0756名無しさん@お腹いっぱい。 (ワッチョイ 2502-CzAo)
垢版 |
2022/11/18(金) 17:10:31.13ID:K+4QG1A20
破綻してるものを学習させてネガティブプロンプトで出なくするって考え自体は応用性高そう
0757名無しさん@お腹いっぱい。 (ワッチョイ 158e-EHNx)
垢版 |
2022/11/18(金) 17:11:28.96ID:5tXNxV5z0
>>749
釣りだとは思うがもし下位GPUでSLIが有効になるようなことがあっても、12GBx2であって24GBになるわけじゃないからな…
マイニングと違って底辺発想は潰してあるもんだ。そんなに都合よくいかない
画面を上下2分割して描画できるって程度でしかない
0770名無しさん@お腹いっぱい。 (ワッチョイ 4555-FFna)
垢版 |
2022/11/18(金) 21:48:02.52ID:rRabsgmA0
bad_promptの手、これめちゃくちゃ優秀だわ
NAIのときは妥協するか、構図の工夫で乗り切り
Anyになってから、ようやくinpaintガチャを試す気が沸くくらいになってきたところだったのが
bad_prompt使うとこれまでの基準で正しい指と言える絵が50%くらい出てくる
手だけでなくて、目や構図も整形されてるので、ガチャ後にざっくり厳選しても、10%も残るわ。素晴らしい。
https://i.imgur.com/X5uxEIX.png

ただし欠点もあって、重みが強いとざらついてくること(上の絵で言う植物)
そしてスラットした指が出る代わりにケモ手が出なくなった
そして明らかにケモ手が出るシードやプロンプトで使うと強制的に手が出ない構図にされる

https://i.imgur.com/6ibrzwy.png
これが「, bad_prompt」をつけるだけでこうなるのは残念すぎると思う
https://i.imgur.com/1Fxjdmk.png
0776名無しさん@お腹いっぱい。 (ワッチョイ 5701-stRS)
垢版 |
2022/11/19(土) 07:23:30.03ID:a8LEZ5yz0
背景植物って葉っぱを高精度で出力するのanyが得意でnaiは雑にプロンプト作るとぼやけるよな
bad_promptに何学習させたのかが気になるけど高精度葉っぱ背景の方を否定して強制的にぼやけさせてる?
0779名無しさん@お腹いっぱい。 (ワッチョイ 57f2-lWU2)
垢版 |
2022/11/19(土) 07:59:38.95ID:lGip4gFP0
今までなかったのに最近めっちゃ黒塗り画像が出力されるのなんでやろ
同一プロンプトでも20枚作れば10枚くらい黒塗り
真っ黒かと思ったら数十ピクセルくらいの人間ぽい小さい画像があったり
euler aだと発生しないからDPM++特有の問題だろうか
0781名無しさん@お腹いっぱい。 (ササクッテロラ Spdf-eybm)
垢版 |
2022/11/19(土) 09:12:17.50ID:9kH0Eg7Wp
>>779
Anythingとか特定のモデル使うと真っ黒画像が混ざってくるからモデルの問題だと思う
NAIだとちゃんと出力されるし
0782名無しさん@お腹いっぱい。 (ワッチョイ 57f2-lWU2)
垢版 |
2022/11/19(土) 10:21:36.15ID:lGip4gFP0
>>781
俺も最初はエロ画像拒否的なモデルの問題かGPUメモリが足りないのが理由かと思ったけど、
DPM++では頻繁に発生するのにeuler aでは一切発生しないから、モデル起因説にはウ~ンなんだよなぁ…
調べたらmacではDPM++で真っ黒画像が出る問題があるっぽい
自分はwinなんで関係ないかもしれんけど
0791名無しさん@お腹いっぱい。 (ワッチョイ 4e99-WOaY)
垢版 |
2022/11/19(土) 12:25:37.30ID:8TsDY9ze0
うちもAnythingv3とそのブレンドモデルの場合だけ、真っ黒画像が時々出る
途中STEPの画像を表示する設定にしてると、あるSTEPで真っ黒になると残りのSTEPは全部真っ黒になる

メモリ不足ならエラーで止まるから、メモリ不足ではなさそう
計算値のどこかが一定の値を超えたせいで、以降の値が全部振り切った値になる系だと思われ

計算がおかしくなるCNNの箇所を特定すれば、モデルを直せる可能性はありそう