【StableDiffusion】AI画像生成技術10【NovelAI】

2022/11/03(木) 00:10:16.15

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

入力されたテキストから画像を生成するAI技術に関して語るスレです
StableDiffusion： google colabやローカル環境で実行可能なAI画像生成
NovelAI：有料サブスク型AI画像生成サービス
（DALLE・Craiyon・Midjourneyの話題もOK）

★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
（以下のスレッドへ移動してください）
【Midjourney】AI関連総合17【StableDiffusion】
https://mevius.5ch.net/test/read.cgi/cg/1667381701/
AIイラスト　愚痴、アンチ、賛美スレ part12
https://mevius.5ch.net/test/read.cgi/illustrator/1666872303/

テンプレまとめ
https://rentry.co/zqr4r
編集コード「5ch」

前スレ
【StableDiffusion】AI画像生成技術9【Midjourney】
https://mevius.5ch.net/test/read.cgi/cg/1666139334/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

2022/11/03(木) 00:13:42.52

スレタイのMidjourneyをNovelAIに変えた（スレタイが長すぎるというエラーのため）
それに合わせて>>1の説明文も一部改修

2022/11/03(木) 01:02:24.31

立て乙

2022/11/03(木) 01:06:46.74

>>1 乙
やっとワッチョイ導入か・・・

2022/11/03(木) 01:51:11.08

AUTOMATIC1111版のUIが良すぎて他使う気にならん
あとは1111版が、UIそのまま使えるRadeon対応してくれればいいのに

2022/11/03(木) 01:54:08.00

幼女にジャックオーチャレンジさせてたら1日終わってた

2022/11/03(木) 03:23:29.59

おすすめプロンプト教えてください

2022/11/03(木) 03:32:22.49

loli

2022/11/03(木) 07:42:21.57

assertive female

2022/11/03(木) 11:26:02.22

ちょっと見ない間に随分お客さん増えたな
正直プロンプト勢はなんUに誘導して技術者だけ残したいが

2022/11/03(木) 11:27:05.72

>>1 乙

2022/11/03(木) 11:32:22.70

sukebe oppai

2022/11/03(木) 12:45:14.84

スレ立てとワッチョイ導入乙

2022/11/03(木) 13:08:56.20

https://www.bilibili.com/video/BV1Vg411h7of/
音声自動生成も凄いな
色々と真っ黒だけど

2022/11/03(木) 14:55:04.85

何か荒れてると思ったら、イラスト板の愚痴スレで直接技術スレに誘導してるんだな
そんなら技術的なことだけじゃなくて暴れたい人が来るわけだわ

ワッチョイ立て乙

2022/11/03(木) 15:03:33.23

Text2LIVE、推奨VRAM32GBらしいけど、24GBじゃ流石に厳しいかな…
Dreamboothみたいに軽量化が進むのを待つか

2022/11/03(木) 15:09:12.45

いやいや32て
Vじゃない方のRAMかよ

2022/11/03(木) 15:09:25.71

4090でいくらだっけVRAM

2022/11/03(木) 15:17:11.75

>>16
グラボじゃなくてAI用アクセラレーターの容量だから、グラボでも出来るようになるの待つかAI用アクセラレーターを買ってまでチャレンジするかの選択では

2022/11/03(木) 15:32:05.46

>>17
遅くなってもいいからメインメモリー32GBで動いてほしいよね

メインメモリーなら64GBでもたいした金かからないし

2022/11/03(木) 15:46:34.49

たしか24だったはず

2022/11/03(木) 17:58:40.61

1111の単語強調の新旧設定って何が違うんじゃろかい

2022/11/03(木) 18:02:57.00

よく知らないけどgithubのfeatureのとこに書いてたりしないのか

2022/11/03(木) 18:35:37.30

>>22
旧：(((1.331倍に強める))) [[[1.331倍に弱める]]]
新：(1.331倍に強める:1.331) (1.331倍に弱める:0.751)

2022/11/03(木) 18:40:10.97

弱める方も()になったのか
[xx:0,21]とか一瞬数字どっちだっけってなって分かりにくかったからええ変更やな

2022/11/03(木) 18:42:42.50

>>22
旧は、() 一重で1.1倍、[] 一重で1/1.1で、かぶせるごとに同じ倍率で強化される。
新は、単純に数字で倍率を指定する。

2022/11/03(木) 18:47:27.69

>>24
>>26
さんくす

2022/11/03(木) 18:52:59.68

あれ最近feature見て前からこれだと思ってたわ
数値指定いいよね

2022/11/03(木) 19:31:13.95

>>24
説明wikiを見た感じだと旧が廃止されたと言うより新書式が追加されたみたいだ
(((((単語)))))みたいに()が多過ぎる事が増えたし倍率指定可能になったのか

2022/11/03(木) 19:36:00.94

一か月以上前の話なんだけど

2022/11/03(木) 21:26:48.01

声の分野で数年かかった進化が三ヶ月で起きてしまったから一ヶ月とか大昔に感じてしまうな

2022/11/03(木) 21:31:18.32

丸括弧を任意数重ねる ((A))→丸括弧１つに付き１．１倍に強める
角括弧を任意の数重ねる [[A]]→角括弧１つに付き１，１分の１に弱める
丸括弧にコロンで区切って数字 (A:1.1）や(A:0.9) →数字の倍率に強める。数字を１未満にすると弱める

角括弧にコロンで区切って数字　[A:0.5]　→プロンプトの適用ステップの調整、この場合「全体の50％からAという要素を加える」。わりと複雑なのでこれ以上の説明は省略

案外知らないみたいなのでおさらいに。
角括弧とコロンは書き方が似てても強弱とは全く別のシステムだからな

2022/11/03(木) 23:00:15.69

>>1ﾜｯﾁｮｲ立て乙

ここの人の大半がwebUI使ってるのかな
自分はあえて自前のしょぼ環境で遊んでるから最近のwebUI専門っぽい流れについていけないや
わかっててこうしてるわけだから別にいいんだけど

2022/11/03(木) 23:25:44.33

>>32
こういう基礎知識置いてくれるの嬉しい。
僕みたいな初心者にはとても助かるよ。

2022/11/04(金) 01:00:54.93

絵文字とか2バイトもじが表示されないの解決したので

https://github.com/AUTOMATIC1111/stable-diffusion-webui/issues/3333

2022/11/04(金) 01:59:52.69

ウーム、HNやらTI試そうと思ったけどグラボのメモリ不足かぁ。
やっぱり3060には厳しいのかな。

2022/11/04(金) 02:48:52.51

VAE Selection実装されてるな。
設定画面でVAE固定で選べる。
NovelAIのVAEを他のモデルに当てても専用のVAEよりよくなるケースが多かってんでシンボリックリンクをリネームしていたのだが、もうそんなことをしなくて良いようだ。

2022/11/04(金) 04:01:36.96

モデル比率変えて混ぜてvae噛ませて比較とかしてたからありがたいんだけど
settingの中じゃなくて普段からチェックポイントとvaeと2つ選択できるようになると更に嬉しいな

2022/11/04(金) 06:12:28.74

>>33
最近はデータ新規学習やモデルデータ自作とかが当たり前の世界になってきて正直ついていけない所がある

2022/11/04(金) 06:46:46.16

SDの画像圧縮技術がすごいらしいけど
pngやjpgじゃなくてその形式でファイルに吐き出すことはできんの？

2022/11/04(金) 06:57:22.01

それ言い出した奴がコード上げててバイナリ保存してるだろ
圧縮率高いっても圧縮復元に4GBのモデルデータが必要になるっていうある意味で本末転倒なやつだからな

2022/11/04(金) 07:27:25.04

辞書を使う圧縮形式なんて普通に使われてるぞ
問題は展開速度の方だよ

2022/11/04(金) 07:49:31.53

jpgなら6kbのとこがsdなら5kbになります。1枚で1kbもお得ってレベルの効率化だから4GBだったら400万枚に相当する
もちろん何千万枚何億枚も扱うってなら恩恵にあずかれるし
辞書はよく使われてるけどここまで効率悪い辞書はそうそう使われないよ

2022/11/04(金) 08:01:20.33

画像閲覧タブが2つになってExtensionsからimage historyOFFったら一つになった
相変わらずプレビュー画像クリックで次の画像出ても生成情報は更新されないのな

2022/11/04(金) 08:08:12.95

VRAM 10GBでDreambooth使えるようになったっていうから1080tiでウキウキで回してるけど面白いなこれ
なかなか思ったようにいかないのはHNとかと一緒か

2022/11/04(金) 08:51:30.64

>>38
Quicksettings list　に、sd_vae て書き足してみ。ちょっと楽になるから

2022/11/04(金) 11:40:13.83

>>46
38じゃないけどサンクス
まさにやりたいことだったわ

2022/11/04(金) 11:55:44.46

SDで圧縮って言うなら、半分に縮小してUpscaleした方がはるかに効率いいと思います。

2022/11/04(金) 12:44:31.95

復元コストを度外視するなら、モデル名と呪文とシード値のテキストで1kbくらいになるのでは
量子化の工程が入るから、圧縮っていうほど元画像の忠実再現性はないと思うが

2022/11/04(金) 15:38:29.17

>>46
ああ、quicksettingsってそこに反映されるのね。
ついでにHyperNetwotkとHyperNetwotk強度も出したらすごく快適になった。これまでX-Yプロットの凡例なしで適用してたわｗ

2022/11/04(金) 17:11:54.92

ModuleNotFoundError: No module named 'tensorflow.python'
って言われたんだけど、tensorflowはどこにぶち込めばいいんだろ。

2022/11/04(金) 17:28:59.37

7900XTXがかなりコスパよさそうなんだがAMDのカードでdreamboothってできる？
環境整ってんのかな

2022/11/04(金) 17:39:09.79

>>52
今のところ新規で買うならNVIDIA以外はありえんね
コスパならRTX3060 12GBが鉄板

2022/11/04(金) 17:55:29.74

Dreambooth GUIもnVidiaがターゲット
あとRX 7900 XTX買うなら値段的に近い3900買った方が安牌な気がする

2022/11/04(金) 18:41:32.22

AI使うならNVIDIA買うべき。AMDはゲームとかで近い性能が出したい人向けであって、機械学習に使おうとしたら対応しないソフトだらけで泣くぞ。

2022/11/04(金) 18:44:42.16

やっぱりきついのかぁ
7900買うのはやめとくわサンクス

2022/11/04(金) 19:10:20.44

>>46
ありがとうありがとう
まさにこれが欲しかった

2022/11/04(金) 20:05:12.94

ここでする話題か分からんが、mimicが再始動したけど、あれって自分で用意した画像以外にもなんかベースになってる学習素材があるのかな
だいたいの画像生成AIはなんかがオープンソースで公開されたのがきっかけらしいから、そこで学習された画像になるのか？

2022/11/04(金) 20:56:40.60

>>58
普通にSDベースなんかなと思ってたけどどうなんやろうね
SDベースなら心情的なクリーンさは他のサービスと正直どっこいどっこいな気もするよなあ

2022/11/04(金) 21:09:36.67

バストアップイラストだけのクリーン画像で作ったSDに
TIしてるだけじゃないか

2022/11/04(金) 21:30:15.89

無断で著作物を学習素材として使う＝クリーンじゃないって話なら
今ある画像生成AIにクリーンなやつなんてひとつもないだろうな
合法ではあるけど

2022/11/04(金) 21:36:34.88

お気持ちの問題だ
残留農薬たっぷり中国産野菜でも国産有機無農薬と書いておけば美味しく食べられる

2022/11/04(金) 21:58:00.58

最初のリリース時と違って自前で学習するのも当たり前になってしまったから、
mimicにどれほどの価値が見いだせるか正直よくわからんな
で、あれは結局TIなのだろうか。再始動ならDBはともかく、HNとかも取り入れてそうだけど

2022/11/04(金) 22:02:53.95

NAIはダンボールで学習してるから嫌い、mimicは自分の画像だからOKって流れできてるよね

2022/11/04(金) 22:07:57.71

構図がすげえ限定されてるから
TIベースの強制img2imgで似たようなことできると思う。というか出来る

2022/11/04(金) 22:17:11.06

mimicは環境が変わりすぎて今更再稼働したところでな……

2022/11/04(金) 22:27:37.32

mimicはGANじゃないの？
StyleGAN2をAnimeFaceデータセットで学習させたのと似てる気がする

2022/11/05(土) 05:16:15.61

SDもGANだけどｗ
SD1.4ベースではないだろうね

2022/11/05(土) 07:47:23.31

stable diffusionは名前の通りdiffusion modelというノイズがどうこうという学習モデルの改良版のlatent diffusion model使っているんじゃないの

2022/11/05(土) 09:32:36.50

>>67
俺もそんな感じだと思う。SD発表前から自前のを作ってたし

2022/11/05(土) 12:23:57.71

>>32
これってネガティブプロンプトに (A:1.3)とか書くと
Aを除去する効果が1.3倍になるってことでいいんかな

2022/11/05(土) 12:55:29.56

>>71
方向性としてはそう
ネガティブプロンプトに強調をつけると強めに除去する

2022/11/05(土) 20:59:42.69

(red) (hair)と(red hair)だと違う意味になる？？

2022/11/05(土) 21:27:39.96

赤が画像全体にかかるか赤髪強調になるかぐらいの違い

2022/11/06(日) 12:20:39.48

>>73
旧仕様の1111なら、プロンプトのパース処理で '(' が出てきたらその時点でトークンの強度を1.1倍、 ')' が出てきたら1/1.1 みたいな処理になってたから、そのふたつに違いはないはず。
今のがどんな処理に変わってるのかはわかんね。

2022/11/06(日) 13:44:41.15

AUTOMATIC1111にも実装されるかしら
https://twitter.com/Yamkaz/status/1589052487721717760?t=40Q_D0xinQVq_V6UgrQaGQ&s=19
https://twitter.com/5chan_nel (5ch newer account)

2022/11/06(日) 13:49:12.87

sampler めっちゃ増えてたな

2022/11/06(日) 13:51:56.64

>>76
https://github.com/AUTOMATIC1111/stable-diffusion-webui/issues/4280

2022/11/06(日) 13:54:01.80

こっち貼ればよかった
https://github.com/AUTOMATIC1111/stable-diffusion-webui/commit/bbfdfa52c5f0ad4f0660b465b39416899c80a17a

2022/11/06(日) 14:00:52.28

もう実装済みやね

2022/11/06(日) 14:18:30.82

red hairにしても服とか背景にも影響するよな
エリア限定する構文ないのかね

2022/11/06(日) 14:19:35.62

>>81
これもNAI実装予定リストで見た記憶

2022/11/06(日) 14:26:28.49

>>79
いつのまにいいい

2022/11/06(日) 14:57:19.29

AM1111で{}使えてる？
()と{{}}が同じ効果のはずだけど()のが強い気がする

2022/11/06(日) 15:15:15.79

>>84
そもそも使えない
Automatic1111とNAIはカッコの使い方や倍率が違うのよ

2022/11/06(日) 15:16:26.39

NovelAIだと+～+で区切ると効果範囲を限定できるとか
記号は「+」でなくてもよく、限定する効果がより高まる記号もあるかもみたいな話だった

250 名前：今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ 6988-P3uR)[sage] 投稿日：2022/11/05(土) 01:38:23.94 ID:ZK5ok5dV0 [1/9]
>> 229
技術部ディスコからの引用やけど
+shiny hage+　←こんな感じで要素を意味のない記号で区切るとその要素が外に漏れない（っぽい
この場合「shinyがハゲにだけ掛かって他には影響を及ぼさない」（っぽい

これも引用やけど、「pixel」系の単語を背景と人物で切り離すのに成功した例

自分もある程度は試して効果実感しとるからwikiに書こうかと思っとるけど、もう少し検証したい
https://i.imgur.com/g4vvFqm.png
https://i.imgur.com/lq6V1e4.png

2022/11/06(日) 15:21:16.33

>>86
だからそれは単なる眉唾だと何度言えば
効果はまったく期待出来ないよ
+とか使わなくてもガチャれば出来るし
あくまでも確率の問題
確定じゃない情報をwikiとかに書かないで欲しいんだが

2022/11/06(日) 16:15:17.57

表情差分ってNovel AIだとどうやって生成するんですか？

2022/11/06(日) 16:26:39.26

>>88
https://seesaawiki.jp/nai_ch/d/%c7%ed%a4%ae%a5%b3%a5%e9%a5%c6%a5%af

2022/11/06(日) 16:27:59.13

誰かおすすめの実写モデル教えてーや

2022/11/06(日) 16:40:59.93

LDSRの黒帯治ったらしい

2022/11/06(日) 16:50:56.47

>>91
先月半ばくらいには治ってたと思う。

2022/11/06(日) 16:53:25.98

>>91
んん、この環境作ったの21日だから、半ばじゃなく下旬やな……

2022/11/06(日) 16:58:36.32

https://github.com/AUTOMATIC1111/stable-diffusion-webui/commit/6603f63b7b8af39ab815091460c5c2a12d3f253e

2022/11/06(日) 17:01:54.19

ということは、ここ最近使ってた縦横サイズがたまたま黒帯出ない条件になってたってことか？

2022/11/06(日) 17:02:44.33

>>90
Stable Diffusion

2022/11/06(日) 17:10:13.80

>>96
ありがとうな！

2022/11/06(日) 17:31:14.52

>>89
サンクス

2022/11/06(日) 18:10:57.41

stable-diffusion-webuiで
Aesthetic Gradients使ってptファイル取り入れようとしたんだけど
AttributeError: 'dict' object has no attribute 'T'
になってできません。どうすればいいのでしょうか？

2022/11/06(日) 18:19:51.10

DPM++ 2M Karrasが収束早くて使いやすいかなー

2022/11/06(日) 18:23:24.70

>>87
5%が10%になるならちょっと効果はありそうだけど

2022/11/06(日) 18:27:41.94

オリジナル魔法少女を生成するとして
魔法少女自体はともかく、おともの謎生物はどうやって指定すればいいのだろう

2022/11/06(日) 18:33:53.76

謎生物をTIしたので生成して貼り付けるか
pixivから拾ってきたものをi2iしてフォトショで貼り付けろ

2022/11/06(日) 18:57:47.77

>>101
100%出ない奴は嘘だ載せるなって言ってるのは相手にしてなくていいと思う
AIの収束率上げる要素に使えないか？要検証っていう話なのに、違う次元の話をしてる
SNSやプロンプト公開してマネするなって言ってるアホと同レベルの技術阻害

2022/11/06(日) 19:03:39.78

dreambooth-gui精度カスだな
同オプションのshyvamと比べても

2022/11/06(日) 19:05:12.17

>>104
散々試した結果、効果が見られなかったんだよ
なんJでも散々言われている
効果はない、と
プロンプトは一文字違うだけでも結果は変わる
それで変わっただけなのを効果だと勘違いすることはよくあること
新しい発見をした、と思いたいのだろうけど残念ながらなんの効果もないよという話なんだよ
というか色んな記号でサンドイッチしてみようなんてのはSDが出てきた初期から試されていることだしホント今更のこと
そもそもそんな便利な方法があったら、とっくに中国で発見されてる
日本は何週も遅れてる

2022/11/06(日) 19:07:45.90

>>85
変換スクリプトがどっかになかったっけ？

2022/11/06(日) 19:10:49.08

>>107
そのままでは使えない
NAI構文→AUTOMATIC1111であれば、AUTOMATIC1111の拡張機能でワンタッチ変換ボタンが追加できるよ

2022/11/06(日) 19:11:41.11

>>86
こんなんprompt全文公開しなきゃ追試もできないし情報としての価値はないに等しいね
そもそも実装にない記号勝手につけて効いた気がする！なんてオカルトにしか見えないから十分に検証されない限りwikiの類には書くべきではないだろ

2022/11/06(日) 19:15:03.03

まぁ要検証→検証結果として効果なかった、って結論ならそれを否定する方が技術的には不適切だわな

2022/11/06(日) 19:39:25.71

>>105
精度って望んだオブジェクトが出てくる確率のこと？

2022/11/06(日) 19:50:19.81

>>86
引用とかする前にまず試しなさいよ。

+1 girl and 1 boy+,+a girl blue hair+, +a boy blonde hair+
とでも入力してランダムで20回ぐらい試せばわかる。
男と女、どっちが青髪・金髪になることもある。

結論：+で括っても無意味

2022/11/06(日) 20:03:38.09

DPM++めっちゃ速いな
もうDDIMいらないわ

2022/11/06(日) 20:09:50.80

+自体は文脈的には分割より加算に動くのは分からんでもない
もっと強いセパレータ記号見つかるといいけど

2022/11/06(日) 20:18:08.64

24枚生成で実験

1 girl and 1 boy+,a girl blue hair, a boy blonde hair
https://i.imgur.com/OAV36Sq.png
女青髪：11枚

+1 girl and 1 boy+,+a girl blue hair+, +a boy blonde hair+
https://i.imgur.com/yiQfoCi.png
女青髪：8枚

効果無しと判断するがねぇ

2022/11/06(日) 20:33:58.54

あ、スレに貼るときに＋消し忘れがあったか（生成時は消してた）
まあ皆試せるからいいか

2022/11/06(日) 22:30:07.87

男同士あら～^

2022/11/06(日) 22:49:20.65

正直なところコンマやピリオドですら隣同士で混ざるのに
それ以上の効果を持った区切り方があるとは思えないというところでこういう話は全部眉唾で聞いてる

コンマもそこで区切らないと別の意味の言葉や文になるって時に的確に入れるのが効き目高いぐらいで
意味もなくたくさん入れても分割効果は無いし

2022/11/06(日) 23:02:16.21

DPM-Solver++2M is the fastest solver currently.
https://github.com/LuChengTHU/dpm-solver#news

らしい

2022/11/06(日) 23:10:46.67

新しいサンプラー群使おうとXYのサンプラーに「Euler a,Euler」とか入力したら
「エラー　俺はそんなサンプラー知らん」て表示された
カンマで区切るんじゃなかったっけ？？

2022/11/06(日) 23:20:38.33

どうせタイプ間違ってるだけ

2022/11/06(日) 23:26:33.73

自己解決した
最後にもカンマ付けてたわ

サンプラー増やすのはええけど、i2iの画像の真下に「幅　高さ」スライダー設置してくれんかなぁ
前から思ってたけどなんであんな画像の全体が見えなくなるくらい遠くに置くんやろ
使わんサンプラー消しゃええがなって話ではあるけど

2022/11/06(日) 23:40:32.10

https://github.com/AUTOMATIC1111/stable-diffusion-webui/pull/4372

2022/11/06(日) 23:45:28.16

やっぱ思ってる人いたのか
適用されるといいけど
もっといえば各項目の位置をカスタマイズ出来るようになれば最高やけど

2022/11/07(月) 00:00:29.75

むしろ日々の更新でAUTOMAちゃんが倒れないかが心配だわ

2022/11/07(月) 00:33:54.78

>>122
下までちゃんと見ないと、へんなscriptがオンになってて失敗するからさ……

2022/11/07(月) 11:22:10.11

ui.pyをいじればuiの位置動かせるぞ

2022/11/07(月) 11:25:24.76

それだとpullするたび元に戻るのがツラいんよ

2022/11/07(月) 11:27:03.42

カスタマイズ待つより自力でプラグイン作って公開した方が早そうだな、使う側も技術者なら
OSS的には当たり前と言えば当たり前だけど

2022/11/07(月) 11:29:01.29

ワンクリックでui.pyに同じ変更を再現するバッチファイルが一番シンプルか

2022/11/07(月) 11:37:13.75

>>129
そう思っていた時期もあったｗ
automaticの実装の速さに何度心を折られたことか

ニッチな機能ならエクステンションで組み込むのが良いけどな

2022/11/07(月) 12:14:29.70

automatic1111ほんと早い
dpm solverの存在を知った時には既に実装されててびっくりした

2022/11/07(月) 12:17:09.41

まあ普段使いはDDIMなんですけどね

2022/11/07(月) 12:42:15.89

>>130
git stash
git pull
gitstash pop
で自動マージしてくれる

2022/11/07(月) 13:43:40.38

>>115
無のトークン数が増えるって話じゃなかった？

2022/11/07(月) 13:44:39.13

なんかこうカエルとネコを足して2で割るところを50くらいで割るみたいな

2022/11/07(月) 13:47:09.19

あすまんStable Diffusionか

それについての話がここにあるらしい
https://github.com/AUTOMATIC1111/stable-diffusion-webui/pull/2138

2022/11/07(月) 13:58:32.29

いかなる長さのトークンでも75トークンごとに分割して、分割されたプロンプトをひとかたまりと扱ってCLIPを実行して絵ができるというよりは
分割されたプロンプトの範囲で一つ一つのトークンごとにCLIPが実行され、その結果で絵ができる
75トークン目の単語は同分割範囲のプロンプトのことであれば認識できるが
76トークン目以降の単語はもはやその範囲のトークンではなく、どうたらこうたら

CLIPってのが俺はなんなのかわからんが
トークン数稼ぎに使える記号がいくつかあって
それに+を使いたいかコンマ+空白を使いたいかっていうお好みの問題なんじゃないかと認識してる

2022/11/07(月) 13:59:40.56

ちなみに俺は2連続コンマを使ってる
Ctrl+BSで一気に消せるから楽

2022/11/07(月) 14:02:43.51

docker版はk-diffusionとかが古くて新しいサンプラーが表示されなかった
なかなか面倒臭い

2022/11/07(月) 14:11:03.31

うわめっちゃ誤訳したかもしれない
やっぱおのおのの手段で翻訳して読んで

2022/11/07(月) 14:25:31.66

>>125
乗り乗りの時は意外と無茶が出来るもんだよ。みんなが飽きて来たらやばいかもね

2022/11/07(月) 14:47:54.38

++括り(意味なし)とコンマカンマ以外で何か区切り的に強そうなのってなんだろ

2022/11/07(月) 15:58:02.10

>>143
AND

2022/11/07(月) 16:07:11.48

その区切り文字が単語かつ画像のオブジェクトを別々に説明する区切り記号として
用いられてるラベルが付いた画像が学習データに大量に存在しない限り意味ないだろう事を考えると
, や . 並みに英文上で普遍的に区切りとして使われてる記号は ' と " じゃないか？

>>144
大文字だと1111で使われてるプロンプト分割用の特殊文字なっちゃうぞ

2022/11/07(月) 17:59:54.58

意外と全角スペース辺りが強かったりしてな

2022/11/07(月) 18:25:35.23

※イメージしやすいようトークンを単語で置き換える

(1girl、、、、、、)75単語(、、、、、green)75単語
で昔は区切って変換かけてたから、76単語以降は1～75と関係ない要素で生成してしまう事があった。しかも記載ルール的に76単語目の比重が大きくなる
今は(1girl、、、、、、、、、、、、、green)で変換かけている。語順、単語を繰り返す、単語に重みを記載するなどで表現の幅が広がった

カンマで区切るまでの1文が長いほど計算には時間がかかる

A B and C Dの記載は、A BandC Dになる。ユーザーが欲しい(AB) and (CD)にはならない。
※ここ自信ない

\n(改行)の記載はまた違った結果になる
※ここは、ごちゃごちゃ書いてたけど改行なのかスペースなのか良く読み取れなかった

みたいに書いてあるから、正しい重みの表記をするか単語を繰り返す方が正解な気がする。本当かは知らんけど

2022/11/07(月) 19:06:22.38

大丈夫かこのスレ

2022/11/07(月) 19:10:53.04

大丈ばない

2022/11/07(月) 19:16:20.89

電気ネズミは攻めすぎ

＞写真は「Stable Diffusion」からAI Acceleratorを叩いているというデモだが、どうやってAI Acceleratorにアクセスしているのかまでの情報は明かされなかった。

https://ascii.jp/elem/000/004/111/4111884/2/

2022/11/07(月) 19:23:54.18

モザイク貫通してるぞ

2022/11/07(月) 19:59:21.83

絵を見せることより電気ネズミ呼ばわりのがヤバいやろ

2022/11/07(月) 20:03:23.57

>>147
ANDはプロンプトを分割してそれぞれ別々のconditionとしてサンプラー等に渡す1111の独自機能だろ？
上で話してる様な、プロンプトの単語が混ざりにくくする様な文字は無いかなぁ？
ってのとは全く別の話でしょ

2022/11/07(月) 20:33:47.99

+も,も使って理想の絵に収束させれば理屈なんてなんでもいいんや
中二病がつけたタグ連想と英語文法通りに動かないとかHyperやUltraがどっちが強いとかんなもの学習元抜きで語る話じゃないしな
馬鹿なこと言ってる間に1枚でも多く回して理想に近づく方がいいんやで

2022/11/07(月) 20:48:05.83

まぁ原理的に考えたらプロンプトを任意に区切る文字なんて無いと思うが、
NAIがCLIPの最終レイヤー無視したら色が混ざりにくくなったって言ってたみたいに
思わぬ方法が効果あるかも知れんから色々試してみるのは悪くないと思う

2022/11/07(月) 21:37:50.60

>>150
Radeon RX 7000シリーズで新規実装されたAIアクセラレーターだな
これでSDが動くのなら、Radeonにも希望が見えてきたか!?

2022/11/08(火) 00:41:46.00

RTX4090が24GBで1600ドル
RX7090 XTXが24GBで1000ドル
まあ9万円差で多少性能おちるくらいらしいからコスパいいRX7090が欲しいんだが
AI画像生成に不向きなのがなぁ

2022/11/08(火) 01:00:14.66

TrainingLabのゴタゴタが早速GOLDMINEに纏められてて草
1111周りは面白い事が良く起きるな。今回は本人関係ないけど…

2022/11/08(火) 02:34:27.36

AI関連で使うならNVIDIAにしておけと。仮にStableDiffusionがRadeon対応したとしても関連するソフトや新しいソフトが出るたびに困るのが目に見えてる。

2022/11/08(火) 04:50:53.08

メモリがたりませぬ

2022/11/08(火) 13:05:09.24

OSはWindowsを使うべきだしグラボはNVIDIAを選ぶべ

2022/11/08(火) 13:36:21.34

今は金ないなら306012GB
あるなら4090が正解？

2022/11/08(火) 13:40:11.65

機械学習に関してはOSはUbuntuが安全牌
WSLgでWindowsでも殆ど問題なくなったがリアルUbuntuの方がトラブルは少ない

2022/11/08(火) 14:09:39.38

>>162
もう少しでRTX4070以下やRX7000シリーズが出そろうのと
3000の在庫膨大だから待ちが正解

機械学習用途ですぐ買わないといけないなら
24GBのRTX3090か16GBのRTX A4000が正解

2022/11/08(火) 14:11:43.37

4090の150Wケーブル問題ってもう大丈夫？
買っていい？

2022/11/08(火) 14:12:30.48

>>165
ダメ

2022/11/08(火) 14:14:57.71

わかりました

2022/11/08(火) 15:46:24.16

Sandy世代の古いPCに3060挿してAI専用機にするってできるかな？
一応PCI-Ex16スロットと物理スペースはある。OSもたぶんWin10にできる

2022/11/08(火) 15:46:53.54

円安だし待ってて安くなることなんてあんのかな

2022/11/08(火) 15:51:30.67

AI需要を見込んだnvidiaがミドルスペ高vram出してくる可能性が

2022/11/08(火) 15:56:55.15

待ってると12GB版3060の在庫が減って8GBに切り替わって居ちゃうから今がいいタイミングだと思うよ

2022/11/08(火) 15:59:40.59

そもそもローカルで学習動かしたい人ってどれくらいいるんだろう

2022/11/08(火) 16:15:33.76

12GBだと足りなくてひーひーしてる

2022/11/08(火) 16:18:11.99

8GBで泣いてる

2022/11/08(火) 16:18:52.29

>>173
DB12GBで可能になったっ聞いたけど

2022/11/08(火) 16:24:52.05

>>165
変換ケーブルなしでつなげるように新しいコネクタに対応した電源も買うなら問題なさそうな話になってきてる。

2022/11/08(火) 16:27:02.54

>>173
ほんそれ
>>168
中途半端最低ラインの12GBでローカルなんて感じで買うと絶対に後悔する
今SSD128GBのメモリ4GBマシン買うくらい後悔する
ローカルでやりたいなら24GBがライン
そして出かけている間や寝ている間もフルで回すことになる機械学習では
RTX4090のコネクタ融解発火問題はかなりリスクある
なので今の選択肢としては >>164

2022/11/08(火) 16:39:41.96

正直融解問題も毎世代あるお約束の初期不良みたいなもんだし気にせんでいいで、数万出荷して報告数20とかだし

2022/11/08(火) 16:39:50.78

>>176
RTX 4090、変換ケーブルを使わなくても12VHPWRが融解。ATX 3.0電源のネイティブ接続でも融解したとの報告
ttps://www.nichepcgamer.com/archives/geforce-rtx-4090-s-12vhpwr-melts-even-with-atx-3-0-native-cable.html

こういう話もあるので、まだ注意が必要かと

2022/11/08(火) 16:43:07.33

3060ならまあ安いし12GBモデル貴重になりそうな感はあるし
4090待ちの間に買っといてもいいんじゃないのかはある
自分はそう自分を騙したぞ！
金がないからな！

2022/11/08(火) 16:49:36.75

>>179
えぇ……
結構最近の話でこわい

自分ズボラでメンテとかせずグラボ酷使するタイプの人間だからもうちょい様子見るわ

2022/11/08(火) 16:50:52.34

3090Ti使ってるけど、ローカル学習の沼にハマると24GBでも全然足りない青天井だから…

2022/11/08(火) 18:52:36.16

学習ってそんな頻繁にやる？
たまにしかやらないならColabプレミアムでやれば別に高性能グラボいらんとちゃうん

2022/11/08(火) 19:30:22.55

>>169
中間選挙の結果で日米で金利差がどうなるか分からん
為替変動を見て数カ月待っても良いと思う
今すぐほしいとか言う人は知らん

2022/11/08(火) 19:59:56.35

>>163
元々機械学習はLinuxのほうが圧倒的に環境充実してて
Windowsでもある程度動かせるようになってきたのは最近の話だからな

2022/11/08(火) 21:53:32.50

>>177
で、あんたは何を使ってるの？

2022/11/08(火) 22:11:44.40

dreamboothって複数概念覚えさせるととたんにクオリティ落ちない？
画像各40枚で対象1つと対象3つの学習結果比較したら
一つの事覚えさせた方がクオリティ高かった
対象3つの場合モデル3つそれぞれ作った方がよかった
いろいろ実験した結果
step数は画像1枚につき100stepぐらいがよさげ
step増やせばいいってもんでもないのが不思議

2022/11/08(火) 22:29:47.68

>>187
わかる、だから人物とかなら、t2iは複数概念モデルでだしてから、１人ずつ単独モデルでi2iしてブラッシュアップさせるとかもありだと思うわ

2022/11/08(火) 22:41:27.44

>>188
その方法いいね今度試してみよ
自分の場合人力img2imgしてるｗ
元々ずっと絵描いてて学習データ大量にあったから自キャラ学習させてヘブン状態
革命が起こったわ

2022/11/09(水) 06:41:10.50

現状AIイラストって技術屋とプロンプターと絵描きの三種のスキルがクオリティに影響するけど、
このスレ居るぐらい技術の素養もあって絵も描けたら最強だな
>>189
ちなみに「どの部分は学習(db)で、どの部分はプロンプトで、どの部分は手描きで直すと一番良い」
みたいな最適手法とかってもうあったりする？

2022/11/09(水) 07:45:38.77

技術屋実質プロンプターだけど
絵は全く別の方向の力だよなあ
うらやましい

2022/11/09(水) 08:06:26.38

「貴様！どんな呪文でこのイラストを召喚した！？」
「何って……描いただけだが？」

2022/11/09(水) 08:56:53.08

何ィ！？i2iに自分の絵を食わせてネガティブにLow Qualityだとぉ！！？
プライドは無いのか貴様！！！

2022/11/09(水) 09:07:05.67

結局のところ注文する側に絵描きと共通するスキルが必要なところからは逃れられないんだよな
素材はあるからポスター作ってって素人にやらせてもセンスあるものができないようにさ

2022/11/09(水) 10:55:05.50

イラスト描きに依頼したりするときに
イメージに乖離が生まれにくい
目的に近いものができるまで生成しまくって
それを持って打ち合わせしてこうしたいこうしたいすればつめやすい
素人の自分が打ち合わせするときに一番やっかいなのはあたりのイメージを伝えられないことだから

2022/11/09(水) 11:20:45.14

技術屋としては絵で食って人と話す機会も多いけど、細部の観察力や再現性のこだわりや精度の次元が全く違うからなぁと思うことは多い
1枚絵で何を表現しているかとか、何を伝えたいかとか、人がものを描く場合配置から何からすべてのオブジェクトに理由や意味がある
そこには物語があって、描いている人間にも過程と苦悩と満足感がある。クライアントになんでここにと聞かれてもすべて答えられる程度には。特に外資は突っ込みが厳しいから明確に答えられなくともあいまいな返答すると仕事は取れないとも
いずれAIも奥行きや構図を理解して犬の目線や鳥の目線だったり人とは違う目線でも違和感がない絵が描けるようになってほしいとは言ってたね

子供が描く突拍子もない絵も子供が描くから親には意味があるわけだし
きれいだねうまいねって言われてるうちは人の領分には入ってこれないって
漫画の背景マンやトレス主体のアシスタントは仕事が楽になるだろとも言ってた

料理人同士の素材の仕入れや厳選とかこだわり味付けや仕込みの会話についていけないような
男の料理！スーパーの素材で、まずくなくて太らなければそれでいいよ！と思ってる自炊の話なんてできやしないわな

2022/11/09(水) 11:27:18.43

まぁ自炊なら自炊で使い道もあるけど、それはビジネススレ向きの話題だからな
このスレだと「技術的にどうやるか」がテーマになるか
まぁそれは開発側レベルの試行錯誤になるから使う側の技術者ができることは多くないかもしれないが……

ただ、「奥行き」「構図」「オブジェクト」「それぞれの意図」とかのデザイン観点の候補を一覧化して、
エディタに搭載することでプロンプトコーディング時に候補表示とかはできるよな？

『絵描きの視点』を基本的な範囲だけでも搭載・網羅したIDEもどきが作れれば
技術的なアプローチからプロンプターの平均水準を引き上げられるんじゃないか

2022/11/09(水) 11:31:57.74

Wikiに既存のブラウザ拡張とかNovelAI Managerは「観点」のサポートはしてないから、
最低限「イラストレーター・デザイナーが考慮する基本観点一覧」の入力ボックスとかプルダウンとか
作るだけでもエディタとしての質はかなり上がりそう
https://seesaawiki.jp/nai_ch/d/%a4%aa%a4%b9%a4%b9%a4%e1%a5%c4%a1%bc%a5%eb%a1%a6%a5%ea%a5%f3%a5%af%bd%b8

2022/11/09(水) 12:08:58.58

いつもの人かな

2022/11/09(水) 12:22:23.94

俺だよ俺