【Midjourney】AI画像生成技術6【StableDiffusion】

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 13:13:20.60

英語の文章が画像に！
背景に使うか？イラストのアイデア出しはもちろん、
与える英文を捏ね捏ねして思いがけず生成される秀逸画像ガチャで遊ぶのも楽しい
有料サブスクで商用利用まで可能なAI画像生成サービス

★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
（以下のスレッドへ移動してください）
【Midjourney】AI関連総合3【StableDiffusion】
https://mevius.5ch.net/test/read.cgi/cg/1663123507/
AIイラスト　愚痴、アンチ、賛美スレ part3
https://mevius.5ch.net/test/read.cgi/illustrator/1662093183/

テンプレまとめ
https://rentry.co/zqr4r
編集コード「5ch」

前スレ
【Midjourney】AI画像生成技術5【StableDiffusion】
https://mevius.5ch.net/test/read.cgi/cg/1662940688/

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 14:44:26.37

前スレの最後のほうの話題だけど
CLIPの学習では単語の関係性がベクトルデータに変換されているから
例えば鳥山明という単語に対応するベクトルデータ―の中身には
漫画家である、ジャンプ作家である、絵柄は○○さんとは10%類似、△△さんとは20%類似…
みたいな意味が全て数値の組に変換されて突っ込まれている
だからLAIONの学習データから特定の作家の画像だけ抜いたところで作家名を指定すると
やっぱりその作家の画風が反映されてしまう

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 15:12:36.51

もしかしてLAIONのCLIP Hを使うようになるSDv3ではGreg Rutkowskiその他アーティストが機能しなくなる？
https://twitter.com/emostaque/status/1571634871084236801
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 15:17:01.77

https://note.com/uunin/n/n725ae4601264
前スレでも貼ったがオススメのAutomtic1111インストール方法
ユーザーフォルダにキャッシュやゴミを作らないし1フォルダで完結してるっぽいので他の環境とも共存出来る
むしろ本家もそうして欲しいわ

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 15:21:02.80

>>3
機能しなくなることはまずないよ
同じプロンプト指定しただけだと新旧で生成画像の雰囲気ががらりと変わる可能性がある
そしてまたゼロからプロンプト模索必要な可能性があるってだけ

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 15:25:34.64

>>3
引用ツイート元が消えてるけど、LAIONからOptOutしたいみたいな話に違うよって訂正入れたとかかね

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 15:44:55.83

>>4
初心者にはおすすめできないかな
1111はよく大きな変更入るからトラブったときに原因切り分け難しい。ここで聞いてもわからないだろうし
環境汚さないって考えるほどなら最初から自分でanaconda使うのがいい
しかし本家からmanual installのセクション消えたっぽいのは残念だな。あれで簡単に作れたのに

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 15:50:12.70

初心者はそもそもそんな頻繁にアプデしないだろうし、Automatic1111を選択する時点で初心者ではない印象

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 15:51:13.67

そもそもわかる人前提って書いてあったわ

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 15:54:42.80

>>7
manual installはここに移ったんじゃね？
AUTOMATIC1111/stable-diffusion-webui/wiki/Install-and-Run-on-NVidia-GPUs#manual-installation

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 16:08:37.78

>>4
アップデートがgit pull一発というわけにはいかないとしたら、頻繁にアップデートしている今は不便やね

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 16:13:25.53

あくまでも最初の環境構築がちょっとだけラクってぐらいだな
個人的にはユーザーフォルダにゴミ作らないのは嬉しい
というかバッチファイル見たけどパスを追加するだけなのは盲点だったわ

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 16:14:12.18

>>10
ほんとだ。そんなとこにあったのか。readme.mdにリンクもっと分かりやすく用意しとけよ（逆ギレ

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 16:22:05.86

もしかしてLAIONのCLIP Hを使うようになるSDv3ではGreg Rutkowskiその他アーティストが機能しなくなる？
https://twitter.com/emostaque/status/1571634871084236801
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 16:22:54.87

アプデも多過ぎて何が新機能なのかすらわからん
重みとかもどこで説明してんのかな

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 16:23:19.06

>>14
ミスって書き込み押しちゃったすまん

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 16:24:43.58

最近1111のcolabで連続出力出来ないんだけど同じような人おる？

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 16:40:53.52

>>17
はーい。
グリッド外すと良いみたい。

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 16:53:44.37

NMKD stable diffusionを使ってるんだけど重み付けの方法次第でAutomatic1111のnegative promptと同じような設定できるのかな？

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 16:59:29.31

v2のtextual inversion colabでは厳しそうだな

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 17:03:43.13

お絵描き教室で「人間の肌は"はだいろ"じゃありません。よく観察しましょう」と言われるがプロンプト探索でも同じやな
例えばフリルの付いたドレスを着せたいならフリルと入れるのではなくアメリカのドレス通販サイトでフリルの付いたやつを探してそのブランド名を打ち込む

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 17:05:33.69

>>18
無知すぎて申し訳ないのだがグリッドとは…

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 17:08:15.24

>>19
おとなしく1111を導入しろ
サイト翻訳してよく読めば誰でも出来る

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 17:11:31.29

人物の属性にもかなり引っ張られるから、それを重みにしても結構良い感じにかかるね。
Drってやったらほぼ自動的に白衣を着るので、あえて白衣を着たとか付け加える必要は無かったりするし。

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 17:19:02.11

その辺はモデルのバイアス次第だから一概には言えんねえ

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 17:29:34.31

>>1乙

>>22
作った全部の画像を3x3とかにくっつけた絵を出す機能

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 17:30:18.84

>>18
localの1111でも最近たまにgrid画像生成のところでエラーが出るよ。
grid画像は生成し終わってて、追加のテキストファイルが生成されてないので、こいつを吐くところでエラー出してるみたい。

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 17:52:28.35

俺もNMKDしか使ってなかったけど頑張って1111導入してみよ

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 17:57:55.59

>>21
その辺は言語理解の方のAIの仕事でしょ

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 17:58:57.72

手持ちの死んだ漫画家の画像ファイル学習させて指定ワードの画像作れるんかな？

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 18:01:09.95

なんか1111調子悪いな
生成が途中で止まる

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 18:14:42.17

Negativeは本当に便利よ
前はうまく描いて欲しいところを延々とプロンプトに祝詞として書いた挙げ句あまり効きもせずにそこだけ注目されてズームはされるなんて悲劇も多かったが
Negativeに呪詛を書いておく分にはそもそもそこに近寄らずズームされないから調整がしやすい

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 18:36:29.03

TIエンベディングファイルに不審なコードが含まれてないか簡易チェックするスクリプト作ってみた
https://pastebin.com/ChWmscUK

python check.py embeddings.pt のようにファイルを指定して実行
手元で簡単に作った任意コード実行できるptファイルはこれで検知できたけど、抜け道はあるかも知れない

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 18:37:33.27

>>26
ありがとう。オフのやり方が分かんなかったので
1枚出力を間に挟めばとりあえず動くようになった。

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 18:39:09.47

いや、気の所為かもしれん…普通に連続で出来たわ

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 18:41:37.72

>>19
だいたいここに書いてあるよ
ttps://pajoca.com/nmkd-stable-diffusion-advanced/

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 20:36:14.71

>>34
グリッド画像を出力しない設定はSettingsタブの
「Do not save grids consisting of one picture」
で変えられます（オンで出力しない）

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 20:42:34.17

1111でpng chunk書き込まれてなくね？
png info入れてもデータなしになるんだが

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 20:49:35.71

>>38
settingsにチェック入れてる？
>‎ Save text information about generation parameters as chunks to png files

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 20:49:53.87

>>37
ありがとうございます！

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 21:11:34.51

>>37
それはbatch countが1の時だけだけど

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 21:12:26.09

>>39
いれてる
ってことは他の人はちゃんと書き込まれてるのか

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 21:20:28.28

> If PNG image is larger than 4MB or any dimension is larger than 4000, downscale and save copy as JPG
にチェック入れてて、PNGじゃないとかってオチではないよね・・

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 21:20:48.08

>>39
解決した
自動保存時しか書いてくれないんだな
saveボタンで保存してた

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 21:25:26.42

前スレの最後の方で質問させていただいた者ですが、おかげで理解できました。ありがとうございます
aiやるならWindowsの方が良さげなのですね
gpuについても大体分かったのですが、3060tiでもローカル関連で生成時間以外に不便なことってありますか？

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 21:36:28.61

>>45
AIはWindowsかどうかより、CUDA使えるGPUかどうかが大事。
3060TiはVRAMが8GBだからメモリの点では12GBの3060や24GBの3090Tiより（同時生成数とか最大サイズとかで）不利だけど、速度は3090Tiの40%位出るからいいんじゃない？
https://i.ibb.co/yd7SZ32/chartthin.png

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 21:38:32.96

ai一般論だったらlinux+nvidiaの方がいいな。sdだったらwindows+nvidiaでいいけど
3060tiはメモリ8GBかな。今のsd使う分には十分
だけど数か月後、一年後にはメモリ不足で不満になってる可能性あると思う

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 21:42:55.35

>>44
へぇー、普通にバグだね
気づかれてないってことはたぶん誰もボタンオンリー保存してないｗ

>>45
> GPUは今のところはメモリが命なのでRTX30で考えると
> RTX 3090 Ti>=RTX 3090>RTX 3080 Ti>=RTX 3080 12GB>RTX 3080>RTX 3060
> 3070シリーズはVRAMが8GBしかないので、回避が吉。
この人のこれ3060tiじゃなく3060ってのに注意ね
3060tiはVRAMを8GBしか積んでない

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 21:46:02.02

>>41
本当だね！オンにしたら1枚出したときにもう1枚同じのが出るようになって、しかも1枚はtxt2img-gridに保存されるので何ごと?? と思っていたところだった
ゴメン間違っていたよ>40

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 21:54:02.12

> RTX 3080 12GB>RTX 3080>RTX 3060
メモリの話ならここ変だな
真ん中は「3080 10GB」なのに「3060 12GB」より上ってことに

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 21:55:31.31

4ch見てたら前スレ734のプロンプトの主題に「台所」って突っ込んだポストがあって、その手があったかー！ってなった。
こんな風になるんだなぁ
https://imgur.com/NF72Lth.png

そんなわけで働いてる人描写を追加していろいろ出してみた。
司書の働く図書室
https://imgur.com/O3tH3Ey.jpg
研究者の働く研究室
https://imgur.com/aOMTqzu.jpg
錬金術師の働くアトリエ
https://imgur.com/kIoSaNn.jpg

いうて、普通に図書館だけ突っ込んでも女の子出てくるんだが……
https://imgur.com/FUYcrPc.jpg

それにしてもurban backgroundは改変されずに使われてるな、使い勝手いいのかしらん……

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 22:02:23.97

>>44
これずっとおま環だと思ってた

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 22:04:23.61

>>0046〜>>0048
ありがとうございます
速度を求めるなら最低限3060ti、質を求めるなら最低限3060（VRAM12GB）という感じみたいですね

速度も質も欲しい、のでもう少しパソコン買うのは様子見します
3080や3090入りのパソコン安くなって販売してほしいよ…

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 22:19:08.29

>>53
とりあえずグラボなしで買ってCPU内蔵のGPU使っておいて、後でグラボ買うのでもいいのよ？

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 22:21:54.34

バグはgitに報告しよう

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 22:53:12.48

それ用のパソコン見てるのですが
うーん27万円代でRTX 3080 12GB、64GB(32GB×2)って値段的にどうですか…？

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 22:54:20.46

>>56
他のスペックも見ないとなんとも

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 22:55:59.08

>>51
すばらしい

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 22:59:12.98

>>57
スペックはこういう感じです
Windows(R) 11 Home 64bit版 [正規版]
AMD Ryzen 7 5700X プロセッサー (3.40GHz [最大4.60GHz] / 8コア / 16スレッド / 32MB L3キャッシュ / TDP 65W)
【NVMe SSD】1TB SSD
ストレージ無し
NVIDIA GeForce RTX 3080 12GB LHR【HDMI x1 / DisplayPort x3】
【ASRock製】AMD B550 チップセット搭載マザーボード
850W ATX電源 80PLUS GOLD (日本製コンデンサ仕様)

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 23:01:14.22

highres, fixっていう機能使うと大きい画像でも変な絵になりにくくなるのかな

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 23:36:56.71

前スレ948さん
調べていただいてありがとうございます

念のためにもう一回zipで更新してみたらオプション通るようになりました
更新に失敗してたか、なんかしらの相性が出てたみたいです

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 23:37:17.05

>>59
ドスパラで見てもだいたいそんな値段になるみたいね。

俺の場合はとりあえずお試しで3060でいいかなって5万で買ってみて特に不満はない。

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 23:39:55.87

>>62
一緒ｗ
5年前のPCの980tiと入れ替えた
PC買うまで行くのはもったいないと判断、メモリもいっぱい載せてるし

**名無しさん＠お腹いっぱい。** · 2022/09/19(月) 23:40:19.14

3090か3080 12GBか3060 12GBを予算に応じて買えってのはいいけどさ
それ載ったPCの値段が適正かは他で相談した方がいいよ

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 00:04:14.80

お安いと評判のPalitで12GB 3080って11万くらいだから、それ以外のPC部分が16万とかまあそんなもんでしょ。

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 01:17:46.94

今日はなにか技術革新あった？(早漏感)

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 01:29:38.73

安ければいいなら3060 LHRを中古で買えば良い

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 01:40:22.37

マイニング死んだと思ったらSD特需か。Nvidiaには神風が吹いてるな
ユーザーには逆風でしかないが。特に日本は円安で二重苦だ…

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 01:48:19.47

画像生成でもこのレベルなら動画生成とか音楽生成になったらどんなGPU性能を求められてしまうんだ
来月にも音楽生成出るらしいし

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 01:55:12.90

音楽生成は画像生成と同じよ
波形画像を学んで波形画像を吐き出すわけだし

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 02:03:40.71

1660から3090やA5000までのスペックを比較して生成できるまでの時間測ってるサイトないかなあ

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 02:04:43.29

>>51
あ、プロンプトはこんな感じっス
prompt: kitchen, (((intricate human hands fingers))), modern style, detailed face, beautiful face, by greg rutkowski and alphonse mucha, d & d character, in front of an urban background, digital painting, concept art, smooth, sharp focus illustration, artstation hq
negative prompt: ((((mutated hands and fingers)))), (((portrait)))

マジでだたの台所の絵描いてるだけだなｗ

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 02:08:52.18

>>71
ここの>>1のテンプレまとめにあるこの図がまさにそれじゃろ？
A5000とかはないが。
https://i.ibb.co/yd7SZ32/chartthin.png

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 02:45:55.45

>>73
ありがとう、>>1読んでなかったわ…

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 03:04:41.09

>>59
へえ3080搭載BTOがやっと20万円代まで下がったんだねえ
一時期のGPU高騰が落ち着いて来たってのは本当だったのか
いい事だ

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 03:12:37.26

さすがHENTAIの国、日本だぜ！！

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 03:14:47.66

エロスレと間違えた…ｽﾏｿ…

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 06:19:04.18

https://huggingface.co/crumb/jit-traced-waifu-diffusion-unet
Waifuの名前がついた謎モデル来てたけどなんだろ、他のモデルに混ぜれるだろうか

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 06:42:51.56

DALLEがアップデートしたぞとメールが来た
どんなもんかレビューしてくれ

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 08:04:44.08

>>51
スチームパンク系のアドベンチャーゲームみたいだな

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 08:21:57.86

DALLE、未だに招待してくれんもん……

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 09:09:21.87

画像や動画よりも音声のほうがやばい気がするな
人間はなんだかんだで絵やコラ動画にはすぐ慣れて何とも思わなくなるけど
声優に好きなセリフ喋らせるとかVtuberにエロASMRさせるとかAIで実現したらヤバ味があると思う

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 09:11:31.68

声優を音源にした音声合成はすでにあるけどあまりそんなことにはなってないかな

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 09:13:46.68

どこまで自然に喋らせられるか、と言うか感情を乗せられるか次第かな。
これが難しいから、未だにゆっくりに毛の生えた状態なわけで。

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 09:16:35.53

>>60
縦長はきついけど横長画像には結構効く、確実に進歩してて怖いわ

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 09:24:56.03

いつの間にか、png infoに投げるだけで自動的にデータ出るようになっとるｗ
あとは、これをtxt2imageにボタン一発で反映させれるようになると嬉しいｗ

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 09:41:36.87

ちなみにこれは寝室です。
https://imgur.com/heSuj4s.png
そしてこれが夜の寝室
https://imgur.com/vvPISlh.png

夜にするの、今のところ背景のところに"under moon light"って追加してくそでか満月を召喚する以外の方法を見つけてないんだ……

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 10:14:56.86

>>86
いいねえー
しかもこれ、画像が入っているときに画像を落とすと自動的に入れ替わる仕様に変わってる
1111版はどんどん便利になっていくなあ

出てきたパラメータをtxt2imgやimg2imgへ転記する機能は要望が出てるんじゃないかな

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 10:18:44.73

新しいCLIPによるディープフェイク検出イニシアチブをまもなく発表
https://twitter.com/EMostaque/status/1572013393455845376

悪意のある利用は避けられないので、フェイクを検出するパートナー・コミュニティを作らなければならない

---

よく分からないんだけど、ディープフェイク固有の特徴量みたいなものを検出するってこと？
その特徴量を限りなく小さく消していくこともできる気がするんだけどどうなんだろう
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 10:22:06.68

>>87
良いね。夜は「部屋を暗くする」とか「夜景」とかかな。

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 10:22:35.21

>>84
今は提示された音声サンプルをトレースして、その通りに合成音声を調律するAIと
顔の動き、表情をトレースして発声に合わせたモーションをつけるAIが現場で使われてるよ
画像AIのTIみたいなもんで、全自動までは流石に少し遠いんだよな

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 10:28:27.24

>>89
やる姿勢見せなきゃいけないから見せてるだけで実際いたちごっこになりそう　まぁ流石にここにはそんな人間いないと信じたいが

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 10:58:46.36

>>89
AIによるフェイク検出の精度が上がるのはAIによる生成の精度も上げられることとイコールだよな...

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 11:01:50.29

AUTOMATIC1111版にパフォーマンス15%向上の最適化きたのに話題にならないの…？

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 11:18:51.29

馬鹿は自分が知ってることを人が知ってると思い込むんだよなｗ

>>94
どういう改善で性能アップしたんですか？

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 11:30:32.64

高速化よりもhighresfixとscale latentの方がホットでは？
トーテムポール問題に改善策が出た

その代わり人体は延長されるらしいが

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 11:32:17.13

昨日のアプデで--opt-split-attention がデフォルトで有効になったんだね
このことかな？
https://github.com/AUTOMATIC1111/stable-diffusion-webui/commit/cae5c5fa8d88a6d4206ec7d89e53685d53afe4c0

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 11:34:22.37

hlkyもautomatic1111も確かに高速になってる
けどコミットもissueも多すぎてどれで速いなってんのか分からないw

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 11:39:31.37

いつの間にか lexica.art でローカル画像の類似検索できるようになって
便利すぎだろ
https://twitter.com/sharifshameem/status/1571772061336633344
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 11:39:42.99

>>93
そこら辺は暗号通信と同じだろう
フェイク検出AIを誤魔化せるが電気代が500万かかるとかになる

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 11:48:05.37

>>99
やってみたけど、類似の幅が広すぎな気がする

https://i.imgur.com/eAa4D91.jpg

アジア人の女の一覧２，８１２画像がでてきてどうしろっていうんだろう

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 12:21:45.56

>>101
画像からテキストを類推、マッチング率何%以上のPromptと画像のセットを抽出するようになってんじゃない？
そのサイトの用途考えたらどうしろも何も無いと思うんだけど

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 12:25:04.37

>>101
確かに似ているのもあるけど9割以上が誤検知に近い判定だなぁ・・・
その類似画像も目元は流用された？程度で他は全然分からん
Googleの画像検索でも対象が全く同じでなければ全然アテにならないし

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 12:37:35.17

>>97
うわっマジじゃん…
出力変わっちゃうから勝手にはやめて欲しかったなぁ
でもsplit attentionは10%パフォーマンス減少のはずなのでこっちかな
https://github.com/AUTOMATIC1111/stable-diffusion-webui/commit/cf28445f10e4a6b6fbc9456d45128f163f66f764

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 13:03:08.15

GPU買おうとしてる人は1週間は待った方がいい
今晩NVIDIAが新商品発表するから、値下がるかもしれない

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 13:15:37.29

>>105
4000にがっかりして3000メモリ増量モデルの再評価だぞ

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 13:21:13.16

マイニング終了も今週末か来週に控えてるだろ
円安もあるし時期が悪いおじさんはいつまで経っても買えん

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 13:25:11.71

更新多くて楽しい時期だし4000番代待つよりもさっさと買って遊び始めたほうがいいと思うわ

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 13:35:08.44

3000番台は在庫処分ですでに補填入って在所処分は始まってるわけで
すぐには値下がりはしないし、年内の4000番台はハイエンドだけだし
今の円安で3割近く値上がりして今の相場なら激安もいいところだよな
指くわえて眺めてるより今はどんどん回した方が楽しいと思うぞ
一週間で2割下がるなら土下座くらいするさ。いくら下がると思ってんの(笑)

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 13:42:20.61

highres fix　一度512で作ってからそれをスケーリングして所望の解像度に直す機能

scale latent on　SD内部のlatent(画像にデコードされる前のdiffusionが行われている空間)を拡大し、その後もう一度ステップを回す
scale latent off　出力画像を拡大しimg2img

off
https://i.imgur.com/OeVoyxU.png
highres fix scale latent on
https://i.imgur.com/jJl0ogA.png

なるほど
offとonで全然違うがそもそもトーテムポール画像に価値は無いのでうまく出るようになっただけで革新だな

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 13:51:26.63

DiscordにDreamBoothでホロのぐらちゃんを学習させたモデルを公開している人がいたので使ってみた
前評判通りプロンプトに対して柔軟だし再現度も高い
https://i.imgur.com/C1LWwTB.jpg
https://i.imgur.com/8sCKAkR.jpg

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 13:58:30.59

ローカル1111を使っていますが、生成中もGPU使用率はほぼ15％、たまに50％近くになるけど一瞬
これは1111の設定でGPUを最大限使わない命令がされてますか？

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 14:00:23.00

エスパーじゃないのでわからん

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 14:01:37.04

>>111
Discordどこ？

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 14:03:54.91

>>112
せめてグラボぐらいかけとｗ
グラボ以外の部分の性能が問題なんじゃないの？
うちのだとGPU 3Dが90%、GPU copyが2%ぐらい

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 14:06:38.52

>>114
SD公式
https://discord.gg/stablediffusion

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 14:06:43.24

そこそこ有名でも認識されないアーティストがたくさんいるのに日本でしか有名でないであろうラッセンがばっちり認識されるのが不思議でしょうがない
まあトラだけで海景画は全然別物になるんだけど

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 14:10:48.88

>>115
すみません
GTX1070です！

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 14:15:32.71

>>111
Textual Inversionじゃなくてckptモデルなんですね

見つけられない人のために↓
☁DREAMER COMMUNITIE☁
🍥|anime
2022/09/20 06:39

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 14:17:18.87

>>119
ckpt読み込んだら1文字目大文字のGuraで呼び出せる

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 14:19:49.86

>>109
もう補填入ってんだ。ニュース出てる？

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 15:30:01.51

RTX3060の12GB版ってマイニング対策でCUDAの性能下げられてるとかそういう話なかったっけ、大丈夫かな？

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 15:40:56.41

https://github.com/eyriewow/merge-modelsのckptをブレンド出来るってのを試してみた。

Waifu
https://imgur.com/KstuT7t

Trinart
https://imgur.com/Zhx4Ntj

Waifu50　Trinart50
https://imgur.com/qI2Gj7A

いろいろブレンド試したら、結構、面白そうな感じ。
コーヒーと同じで、結局はオリジナルが一番ウメえとかになりそうだがｗ

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 15:45:12.15

>>122
LHR版はマイニング性能が抑えられているという話のことかな

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 15:58:23.71

>>124
あーLHR版ってのがあるんだ、多分それの事を聞いて覚えてたんだと思う。ありがとう
3060もそのLHR版があるみたいだし、適したカード探すの大変そうだなぁ

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 16:01:21.80

江戸の有名でない絵師とか彫刻家の名前でアニメちっくになるのおもろいね
やっぱ日本アニメの源流てこれかと思うわw

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 16:17:52.18

なんか勝手に納得してるようだが
LHRはイーサリアムのマイニングの速度が落ちるだけで別にそれ以外は関係無いぞ

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 16:20:45.84

>>123
>コーヒーと同じで、結局はオリジナルが一番ウメえとかになりそうだがｗ
わかる。めっちゃわかりみ

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 16:45:05.20

ワードの重み付けが全然違うからなあ
使いこなすには両方のワードの重み付けをある程度把握してないと無理だと思う

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 17:34:22.71

>>125
それは暗号通貨掘るプログラムが検知されてスピードダウンするだけで
AIは全然アルゴリズム違うから関係ないぞ

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 17:48:53.77

ググって見つけた過去スレのレスから来たんだけどこれ解決方法わかる人いる？
https://github.com/AbdBarho/stable-diffusion-webui-docker
動かそうとしているんだけど
docker compose --profile auto up --build
で↓のエラーが出てしまって進めないんだ cuda toolkitは入れているけどエラー変わらずでお手上げ状態

161名無しさん＠お腹いっぱい。2022/08/30(火) 15:24:50.21ID:kv64WKVJ
>>138
Windows10(insider previewでWSL2はインストール済）ですが
docker-compose.ymlのビルドで以下のエラーになりました。
nvidia-container-cli: initialization error: WSL environment detected but no adapters were found: unknown

また、entrypoint.shが、改行コードがCRLFのため動作しない（LFに変えればいいだけですが）でした

Windows11だと不要なのかもしれませんが、どうもcuda toolkitが必要なようです。
疲れたｗ

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 17:52:39.57

Highres, fixはESRGANとかのアップスケーラーを介さずにSDアップスケールができるって感じだな

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 17:54:54.81

>>131
それ書いたの私だけど、WindowsをH21H2に更新することで解決しました。
CMDから、winverで確認してH21H1だったらそれが原因だと思います。

私の場合、Windows updateで表示されなかったのでググって個別にH21H2をインストールしました。

cuda toolkitは特に不要です。（普通のGeforceドライバに入ってると思われる）

https://mevius.5ch.net/test/read.cgi/cg/1662940688/946

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 18:02:33.61

1111、こんなに更新が凄いと起動前にpullしとかないとアレってことに確実になっちゃうな。

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 18:16:02.09

定期的にバグも仕込まれるからそれはやらん方がいいと思うが

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 18:41:42.53

>>116
ありがとう

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 19:02:24.69

dockerで特定のcommitでresetしてwebui立ち上がるとこまで全自動だぞ

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 19:13:19.59

>>135
なるほど
webui-user.batの2行目に「git pull」、最終行に「exit」と書いて、起動のたびに何も考えず最新版にしてた

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 19:15:31.54

Snake PlisskenとかJack Burtonと入れてもカート・ラッセルの若かりし頃の姿が出てこないのはどうしてだろう

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 19:18:08.02

エロ板のプロンプト制作技術が高すぎる

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 19:23:18.41

>>140
何てスレか教えてくだしあ┌(_Д_┌ )┐

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 19:27:51.43

>>140
Midjourney】AIエロ画像情報交換【StableDiffusion
https://mercury.bbspink.com/test/read.cgi/erocg/1662132381/

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 19:34:01.11

なるほど
https://mercury.bbspink.com/test/read.cgi/erocg/1662132381/384
384 名前：...φ(・ω・`c⌒っ[sage] 投稿日：2022/09/20(火) 01:11:49.73 ID:63ysJ2H+ [1/3]
ワイは明日から出張でしばらく触れんから女の子のポーズ指定に関するワイのプロンプト研究結果をサンプル付きで貼るやで

https://i.imgur.com/Q08jlJE.png

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 19:43:57.61

pinkはこっちに張るなやー

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 19:50:22.03

>>142
サンガツ

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 20:13:40.10

いつの間にか、Automatic1111って、modelsフォルダに複数ckpt入れておくと
Settingタブで切り替えられるようになってんたんだな・・・

Automatic1111のリリースノートというか新機能・変更点をまとめてるページとかってどこかにあるのかな？

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 20:16:14.06

毎日のように信じられないような新しい技術が出てくるな
切り替えるだけじゃなくて混ぜられるみたいだし

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 20:21:12.81

>>90
(((nightscape)))くらい強化してやっとこれよ……
どんだけ外を明るくしたいんだよｗ
https://imgur.com/77SlClA.png

くそでか月がないからまあヨシ！

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 20:22:03.77

>>127 >>130
あ、そうなんだごめん怪情報流しちゃって。とりあえず12GB版3060は安心して買っていいって事かな

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 20:28:40.79

>>148
Negativeにsun lightとか入れてみた？

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 20:28:50.90

>>133
ありがとう！
おかげで起動できました

うちもWindows Updateに表示されていなくて手動Updateが必要でした
1年近くもUpdateが放置されていたとは。。

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 21:10:47.23

>>146
新機能の紹介みたいなんは知らんけど

これが機能一覧で
https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Features

これが更新履歴
https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Features/_history
最新と前のにチェック入れてcompareすれば更新部分が分かる

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 21:52:00.72

AI詳しくないから細かいことはわからんけど
先日のTensorFlowに続いてKerasベースでも実行できるようになったらしい
高速化とかMac環境に貢献してるとのこと
https://twitter.com/fchollet/status/1571874757582389250
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 21:54:37.59

ui-config.json範囲外でWebUIをちょっと修正しようとすると、じゃんじゃかエラーが出て手に負えない……
gradio ちゃんと学習せねばダメか

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 21:59:32.20

>>153
昨日 TensorFlow / Kerasで実装してMacで４倍速くなったって言ってて、同じ話かな？と思ったら違う人だったｗ
https://twitter.com/divamgupta/status/1571234504320208897

>>153のツイートの人だとコードが読みやすい、Macで２～３倍になった、と言ってる
昨日の人のほうが早いのか環境の違いとかなのか

Windowsで性能向上するのかが気になる
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 22:32:48.64

webUIの最新版webUI-user.bat消えた？

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 23:14:05.36

ごめん変なこと言った

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 23:51:53.28

Highres. fixはすごい！
https://imgur.com/Zuc1fRl.png

でもこれ寝室ではないよなって絵が結構な頻度で出てくるんだが……？
完全に夜にするのはとりあえず諦めたー

**名無しさん＠お腹いっぱい。** · 2022/09/20(火) 23:57:28.80

>>155 Colabで実行してみた 512x512で56秒@T4
メモリ容量が最適化されたらしい

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 00:02:12.62

>>159
通常はColab　１３秒とかそのぐらいだから、nVidiaだとKeras実装は逆に４倍遅いって感じですか
残念・・・

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 00:14:14.99

>>158
カメラの露出とかは？
https://promptomania.com/stable-diffusion-prompt-builder/

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 00:38:46.73

1111をアップデートしたらいきなりSD upscaleが動かなくなったが、どうやらrealesrganのweightsファイルの保存先が変更になったようだ。

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 00:41:55.58

それにしてもどうしてこんな変更があるんだ？
/usr/local/lib/python3.10/dist-packages/realesrgan/weights/
↓
/usr/local/lib/python3.10/dist-packages/weights/

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 00:43:18.71

気分とか美学とか割とある

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 00:47:38.40

外に出しちゃダメだろう……

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 00:52:33.74

>>158
>>72のポジとネガにちょっとずつ追加した。さらにネガに(((brightness light)))とかbrightness追加するといいかも
(((((darkness background, darkness night, under exposure)))))
ネガ (((correct exposure)))
https://i.imgur.com/kjB321G.jpg

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 01:06:44.46

>>166
協力感謝！
https://imgur.com/jtnS08y.png

これ、部屋は暗くなるけど窓の外が白いのは変わらないっすね。
というか、なにこのやべぇキッチンｗ

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 01:44:47.95

>>167
魔法使いがポーション作ってるみたい

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 01:52:49.87

服装の指定に引きずられて顔まで変化するのが困りものだな
髪色の指定だけでも顔分るしな、黒髪指定したら一気に顔がもっさりした感じになる
これはCLIPの仕様上避けられない奴だよな

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 01:58:10.77

色々なものが紐づいてるしな
スポーツウェア着せれば大人っぽくなるし、乳でかくすれば顔もエロくなる

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 02:15:53.53

ややスレチだが

NVIDIA、従来より最大4倍速い「GeForce RTX 4090」。1,599ドルで10月12日発売
https://pc.watch.impress.co.jp/docs/news/1441388.html
高すぎてお通夜とのこと

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 02:55:54.00

> 30 Socket774 (ﾜｯﾁｮｲ b73f-jztO)[12]2022/09/21(水) 01:42:52.29ID:WWhkvTAA0(12)
> 今日の革ジャンの生配信9割AIの話ししてたな
> 一部の人間にしか売る気がないのか

革ジャン＝NVIDIAのCEO、ね
マイニング景気終わってグダグダでこれしかないって状態との見方

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 02:56:13.61

1600ドルなら有りかなって思えるけど、日本だと30万円だしな

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 03:35:33.91

prompt matrixによると、"in front of urban background"が真っ白背景を生み出している模様。
https://i.imgur.com/SvpmMp4.jpg

"in front of night urban background"ではどうか。……他は全部夜景なのに、なぜ最後の最後で白くなるのか！
https://imgur.com/HtkAkgy.jpg

もちっと細かく見てみる。
どうやら、"in front of" "a night arban" "illustration"の3つがそろった時、引きの絵に変わって夜景が解除される模様。
どないせいっちゅーねん！
https://imgur.com/NFY2RHS.jpg

そして今回、アップで人間が2人近接すると腕の数がすごいことになるという知見を得たｗ

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 04:19:25.31

単純にnegativeに(blur), (bokeh), (fog)は効かないの？

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 05:58:21.95

>>172
4090一枚でガンガンファインチューニングできますという訳でもないしな...
さっさと3080かっといて正解だったわ

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 06:15:36.85

4090なんて今の為替だと20万軽く超えてくるしな(笑)
まぁ3070-8GBじゃいろいろ厳しかったので、4080-16GBあたりを買いそうだけど
モノがあればだなぁ

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 06:18:18.87

大富豪にぃに達が4090を大量に買って
安く投げ売りされた3080を僕が買う
winwin(´・ω・｀)

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 06:20:11.50

「1599x144=23万でしょ？」

公式
https://www.nvidia.com/ja-jp/geforce/graphics-cards/40-series/rtx-4090/
> \ 298,000 より
> 10 月12 日より順次発売。

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 06:22:37.51

> NVIDIAは9月21日、「GeForce RTX 4090」「GeForce RTX 4080」を発表した。
> 「GeForce RTX 4090」は10月12日より順次発売予定、価格は29万8000円からとなる。
> 「GeForce RTX 4080」は11月発売。価格はメモリ12GBが16万4800円、16GBが21万9800円となる。
ﾌｰﾝ

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 07:09:18.36

>>174
とりあえず、>>72をゴチャゴチャ触ってみたら、なんとか外の夜率は上がった気がする。

prompt:bright kitchen in front of the (( stary midnight city view )) and without citylights,, (((intricate human hands fingers))), modern style, detailed face, beautiful face, by greg rutkowski, d & d character, digital painting, concept art, smooth, sharp focus illustration, artstation hq,wide angle,((underexpose)) photo
negative prompt: ((((mutated hands and fingers)))), (((portrait))),(((fog))),(((correct exposure)))

室内を明るくして、外の夜景は強引に灯りを落として星を強調。室内が暗いと露光差で外が白飛びする現象はSDでも再現してるっぽい……
なお、ここまで夜夜言っても昼になる時もある模様。。。

https://imgur.com/a/yerjxiP

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 07:47:08.83

ポケモンで学習させたモデルが登場したらしい
https://i.imgur.com/Q62Gh8n.jpg
https://twitter.com/Buntworthy/status/1572214507468099586

国名を入力して生成した人もいた
https://i.imgur.com/Fsc3UtI.jpg
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 08:21:09.32

RTX40シリーズ、この値段ならcolabに居座りかな

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 08:50:39.56

>>182
エチオピアわりと好き

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 08:58:06.31

Waifuの場合、プロンプトの描き方が特殊らしい
https://wiki.installgentoo.com/wiki/Stable_Diffusion#Waifu_Diffusion

・Danbooruのタグを使う。元のタグのスペースは"_"で置き換える
・プロンプトははこの順番。カンマは使わずスペース区切り
　著作権タグ（作品名）キャラクタータグ一般タグアーティストタグ
・hiresなどのメタタグは使わない
・４種類のタグ内で複数タグが場合、数字、アルファベットでソートする

例：　https://wiki.installgentoo.com/wiki/File:SD-Waifu_diffusion_finetune_recipe_example.jpg

"kono_subarashii_sekai_ni_shukufuku_wo! megumin 1girl ^_^ backlighting blush brown_hair cape closed_eyes collar facing_viewer fingerless_gloves flat_chest gloves hat lens_flare short_hair short_hair_with_long_locks smile solo staff sunset witch_hat dacchi"

１　著作権タグ：　kono_subarashii_sekai_ni_shukufuku_wo!
２　キャラクタータグ：　megumin
３　一般タグ：　1girl ^_^ backlighting blush brown_hair cape closed_eyes collar facing_viewer fingerless_gloves flat_chest gloves hat lens_flare short_hair short_hair_with_long_locks smile solo staff sunset witch_hat
４　アーティストタグ：　dacchi

SDは、プロンプトを７７トークン化した後、英語の構文解析して７６８次元ベクトルに変換してからDiffusionにつっこんでるんだけど
Waifuは英語の構文無視した学習してるから、それに応じたプロンプトが有効ってことぽい？

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 09:29:12.32

4chan見るとみんな他モデルと同じプロンプトの気がするんだけどな

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 09:40:33.31

そりゃSDベースだから普通の英文も使えるじゃろ

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 09:43:44.84

Waifuでは効きやすいワードがあるってだけで、言ってみればタグで個別学習したみたいな感じになってる。
英文無視とまではいかなくて、kawaiiなんかが実質的に<style>化してるって感じ。

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 11:42:22.32

1111ってswinIRにまで対応したのか？
あれ確かEsrGenより高画質な超解像だったよな

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 12:27:47.14

>>185
それっぽいのが出てくるけど
これがめぐみんかと言われると誰だこれになるわ

この絵にめぐみんのタグは付けないほうがいいと思う

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 12:39:19.65

>>189
コミットログ見るに、SwinIRの実装コードは突っ込まれたけどUIがまだ対応してないように見える。

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 12:54:48.24

swinIRはかなり設定がピーキーなので使いにくいイメージ

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 13:36:29.77

https://raw.githubusercontent.com/JingyunLiang/SwinIR/main/figs/real_world_image_sr.png

**191** · 2022/09/21(水) 13:59:29.71

>>189
pthファイルダウンロードしてSwinIR/フォルダに置いたらもう使えた。誤情報すまん。

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 14:37:38.40

>>194
EsrGenと違ってSwinIRのptfファイルって全然配布されてなくない？

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 14:46:59.38

見つけた

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 16:32:09.51

早くも来週waifuの新ver登場か

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 16:34:40.16

rinnaさんところの日本語SDデモがhuggerfceに来てたけどほぼ使えなかった

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 16:36:20.37

SD1.5がもうクーロズドテストに入ってることを考えるとwaifu1.3は結構ビミョーな気がする。

**名無しさん＠お腹いっぱい。** · 2022/09/21(水) 16:55:07.59

sdは質より量で三次元二次元混在、タグはカオスだけど
waifuは量より質で二次元のみ画像厳選（スコアで絞ってる）、画像ソース一か所でタグ公開予定
だからwaifuはwaifuで期待できる