【StableDiffusion】AI画像生成技術11【NovelAI】

2022/11/24(木) 17:36:37.21

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

入力されたテキストから画像を生成するAI技術に関して語るスレです
StableDiffusion： google colabやローカル環境で実行可能なAI画像生成
NovelAI：有料サブスク型AI画像生成サービス
（DALLE・Craiyon・Midjourneyの話題もOK）

★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
（以下のスレッドへ移動してください）
【Midjourney】AI関連総合20【StableDiffusion】
https://mevius.5ch.net/test/read.cgi/cg/1669092302/
AIイラスト　愚痴、アンチ、賛美スレ part14
https://mevius.5ch.net/test/read.cgi/illustrator/1669117382/
テンプレまとめ
https://rentry.co/zqr4r
編集コード「5ch」

前スレ
【StableDiffusion】AI画像生成技術10【NovelAI】
https://mevius.5ch.net/test/read.cgi/cg/1667401816/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

2022/11/24(木) 17:39:00.20

いちおつ

2022/11/24(木) 17:41:22.97

におつ

2022/11/24(木) 18:27:05.59

さんおつ

2022/11/24(木) 19:31:11.05

よんおつ

2022/11/24(木) 21:24:32.12

ごおつ

2022/11/24(木) 21:24:49.81

HOS

2022/11/24(木) 21:26:38.86

(乙 :1.5)

2022/11/24(木) 21:32:31.42

前スレの初期並みにひどい生成画像見たら笑い止まらん
なんでああなる

2022/11/24(木) 21:38:35.83

ver0.2に退化しとるやないか

2022/11/24(木) 22:08:59.84

NSFW全滅だとアート系のヌードとかもダメなるってことだから、かえって使いにくいような気がするな2.0

2022/11/24(木) 23:02:59.37

なんらかのエラーだって言ってくれ
発売日を楽しみにしてたゲームがとんでもないクソゲーだった時の気分だ

2022/11/24(木) 23:05:47.26

sd2はインペイントを考えすぎてるのかな
ぴったり人が重なるレベルで同じポーズばかり出る
あと複数人は相変わらずダメ
「2人の写真、ひとりは赤髪ロングヘア、もう一人は青髪ショートヘア」みたいなのはできない

2022/11/24(木) 23:14:07.62

何が得意で何が苦手かはまだ追求されるだろうし、数日か数週間もすればSD2をベースにしたやつも色々出るだろ
この3ヶ月の密度が高すぎたせいもあろうけど生き急ぎすぎてもしょうがないぜ

2022/11/24(木) 23:59:35.53

SD1.5までで使えた「kawaii, loli face」は使いものにならない
512x512以上の解像度に設定すると劇遅だから512x512以外は使い物にならない
txt2img.pyのデフォルト値を変えといた方が使いやすい（--step 20、--n_iter 1、--n_samples 1、--n_rows 5、--seed -1など好きなように）
wm_encoder系はいらないからコメントアウトした方がいい（やらなくていい）
1111用のxformersはエラー出て使えない
シード固定ガチャの将来性は高そう
歩留まり悪い

masterpiece, best quality, photo of a girl, japanese girl in kyoto, dark hair, detailed hair, beautiful hair, beautiful face, detailed eyes, full body shot, highly detailed, sharp forcus, cinematic lighting, photoreal, photoshoot, photograph, realistic photo, dynamic pose
https://i.imgur.com/JoULB59.jpg

2022/11/25(金) 00:11:20.37

うーん…

2022/11/25(金) 00:17:11.37

これ見る限り、NSFW以外でも2.0は産廃感あるんだけどｗ

https://www.reddit.com/r/StableDiffusion/comments/z3ferx/xy_plot_comparisons_of_sd_v15_ema_vs_sd_20_x768/

2022/11/25(金) 00:24:41.91

やっぱ各所から色々詰め寄られてるんだろうか
今まで自由すぎたのかな

2022/11/25(金) 00:29:42.45

NSFWデータが人体の学習度に貢献してた説

2022/11/25(金) 00:31:04.41

あ、それはありそうw

2022/11/25(金) 00:32:32.12

ポリコレ民に汚染されてそう

2022/11/25(金) 00:40:13.95

>>17
nsfwだけじゃなくてGreg Rutkowskiみたいなまともな画像を出すときの定番だった現代アーティスト系の学習も排除されてるんだな
これは今までのSDみたいな使い物にはならなさそうだわ……

2022/11/25(金) 00:44:22.10

でもこんだけ配慮？されてるモデルだし良いもの出したら企業が使ってくれそう

2022/11/25(金) 00:47:52.53

AI絵師オワコンじゃん

2022/11/25(金) 00:49:38.20

どうせなんらかのフォークや制限解除版が出てくるだろ
公式には対処したってポーズであとは自己責任

2022/11/25(金) 00:54:07.01

「イラストやデザインの仕事はとても退屈。芸術的かどうか以前に君たちは道具(ツール)だよ。」

https://i.imgur.com/3nTGakN.png

ﾊｹﾞﾜﾗ

2022/11/25(金) 00:59:54.70

まあこれから色々発見されるでしょうw

2022/11/25(金) 01:02:21.40

企業安心して使えないよ
ピカチュウとかミッキーマウスとか権利あるのも普通に出るのは変わらずだから

クリップ変えたのしっぱいじゃないか？
photo of a Pikachu and a Mickey Mouse
https://i.imgur.com/0iLVTsA.png

2022/11/25(金) 01:25:20.08

あらまあ
何もかも中途半端な感じかねえ

2022/11/25(金) 01:29:14.58

結局権利や倫理的に怪しいソースを使ってさらに過剰学習という名のパク…
までしないとまともな絵は出ないのが現実だったってことか？？
それらを全部排除すると要求スペック爆上がりなのにこのザマと

2022/11/25(金) 01:30:17.79

別に俺アンチじゃないんだけどまじで出てくるものが微妙すぎて泣きそう

2022/11/25(金) 01:52:04.57

まあ宇宙開発とかでもロケット打ち上げ失敗とかしながら発展してるんだし
あれこれ分析して次に活かしてくれるでしょ

2022/11/25(金) 01:56:34.89

WebUIってネガティブもトークン数えられてるのか？
プロンプト入力欄の右側に数字が出てあって
ポジティブの方になんらかプロンプト書いてる時はどんどん数字が増加していくけどネガティブ書いてる時には動かないのが俺の環境なんだけど
hentai diffusionのドキュメント見てたら例のクソ長ネガティブしか入力してないのに右側の数字が120とか出てあって
どっちが正しいのやらよく分からん

基本的に77(75)トークン越えてプロンプト書いたら制御しにくくなって結果絵が崩壊し始めるからできればネガティブはカウントされて欲しくないんだが

2022/11/25(金) 01:57:45.19

>>32
コンプラ超えてこれだと次はもうブレイクスルーを待つしかない気がしてきた

2022/11/25(金) 01:59:26.25

いやこの考えを捨てよう…俺の中のネガティブプロンプトだ

2022/11/25(金) 02:03:57.51

結局の所強力なタグ付けとデータ量を持つ📦が最強って事でおk？

2022/11/25(金) 02:06:33.81

teddy bear sexが1000枚もない雑魚サイトがイキってんじゃねえぞ
teddy bear sexをよこせ

2022/11/25(金) 05:47:35.21

>>33
まぁ設定次第だけど、旧プロンプト解釈使用のチェック入れてれば75制限はワーニング出して特殊な処理になる
75超えて崩壊なんて言ったら中華元素法典のクソ長ネガティブ入れたら全部崩壊してるはずだろう

2022/11/25(金) 06:38:44.28

普通に考えればポジネガそれぞれ75ずつじゃないの？

2022/11/25(金) 06:50:19.24

エロはある程度画力ある絵orまとまった構図の良質なデータセットなのに
それを全部切り捨てたらこうなるという例だった
やっぱり、エロは正義

2022/11/25(金) 06:51:27.98

これから始めようとおもうのですが、過去の1.5を使うことって出来ますか？最新の2しか利用出来ないんでしょうか

2022/11/25(金) 07:08:45.43

今って前の環境のwifeがないくらいの状態ってこと？
ハードは進化してるだろうけど使うソフトがまだ整ってないから上手くいかない的な

2022/11/25(金) 07:15:07.64

グレッグさんが無効な上に激遅いな

cyber punk city landscape
https://i.imgur.com/lfuCl3p.jpg

ちょっと笑ってしまった
昔の画家の名前はまだ有効みたいだが

2022/11/25(金) 07:25:25.28

>>43
cyberpunk1990ぐらいな感じで笑う

2022/11/25(金) 07:47:23.93

>>41
ようこそようこそ1.5はここから落とせますよ（Filesのタブ）
https://huggingface.co/runwayml/stable-diffusion-v1-5

2022/11/25(金) 07:50:01.84

2.0はまだ学習1週目とかそういうのではなくて？

2022/11/25(金) 07:53:52.45

>>46
SD1.4+追加学習=>novelAI
だったことを考えると、まだ追加学習された例は出て来ていないみたいね

2022/11/25(金) 07:58:02.60

そもそもクリーンAIとしてはadobeの方が使われるだろうしなぁ
SD死んだか？派生は作られ続けるだろうけど

2022/11/25(金) 07:58:44.61

これからは追加のデータセットを有料販売していくのが一般的な形になりそう
無料デフォルトでは低品質のものしか出せず、アーティストの許諾付きの奴やR18は各支援サイトで数千円払えって感じで

2022/11/25(金) 08:04:07.89

>>41
イラスト特化とか、エロ特化とか色々あるから
素SDで色々試したら用途に合わせたモデル探すといい
その次はDBとTIだ

2022/11/25(金) 08:38:18.32

SD2.0ベースの二次元特化サービスで第二のnovelAIを狙っているとこ出てくるかもね

2022/11/25(金) 09:08:01.81

TwitterとかでEmadが投稿してたみたいなリアルな山の俯瞰視点の画像みたいなの出せないの？

2022/11/25(金) 09:15:12.93

CLIP部とUNet部とVAE部で各部だけ単独でGPUに載るようコードにmodl.to(device)追記して切り替えまくったら8GB VRAMでも動いたよSDV2
そのうちAUTOMATIC氏が対応するだろうけど悩んでいる人居るかもだから一応

2022/11/25(金) 09:25:46.52

ckpt に直接dreamboothかけて学習させたいが、そんなことって出来る？

2022/11/25(金) 09:27:12.57

直接は無理
必要な変換についての情報は過去スレにあったと思う

2022/11/25(金) 09:41:09.12

ダーティなことしなきゃまともな画像は生成できないってはっきりしちゃったのはなぁ
結局NAIみたいな路線しかないってことか？

2022/11/25(金) 09:44:30.13

2.0で一枚だけ山出せたけど、プロンプト追加してくと変なノイズになっちゃうな。それも何連続も、プロンプト最初に戻してもおかしいまま
ちょっと今のままだと使えないな
https://i.imgur.com/q2Or6ET.jpg

2022/11/25(金) 09:57:59.58

nijiが大幅な正当進化を遂げたのにSDは酷えな

2022/11/25(金) 10:01:46.20

AI画像ってのはあらゆる画像を生み出せることに意味があるんだ
指が5本の人間のイラストでいいなら人間が描けばいい
4本や350本の指がある生物を描いたりする人間には出来ない発想こそAIの真髄なんだよ？

2022/11/25(金) 10:19:27.84

お前が4本指350本指というものを思いつく時点で割と人間に思いつきうるものなんじゃない
あえてやらないだけで

2022/11/25(金) 10:25:06.20

俺は超優秀なアシスタントを手に入れた気分だわ
資料集めにインスピレーションになんかきっかけになりうるアイデア出しなど時間がかかってやる気出ないことをひたすら押し付けている
それも非常に素早く気に入ったもののバリエーションも満足するまで出してくれる
ブレスト的に必要な物量がある程度の品質を保って高速で用意してくれてそれを人が利用するのが自分なりの真髄だと思うわ

2022/11/25(金) 10:42:39.67

>>61
人は頑張って上手にかけるけど背景はだるくて仕方ないと言ってた知り合いがウキウキで背景やらせとるからハイブリッド絵師増えそうやな

2022/11/25(金) 10:46:41.49

履歴書が超優秀だったからアシスタント採用したら失敗した感じよ
ちょっと前までいたイチゴちゃんが経歴のわりに優秀だっただけに残念感が強い

2022/11/25(金) 10:52:47.32

SD日和ったなぁ
もっとグレーゾーンを突っ走って欲しかった
今やMJのほうがグレーだな

2022/11/25(金) 11:06:51.22

Emad氏のツイートだとまとも？な西洋画出てるし実行環境か制御の問題かしらね

2022/11/25(金) 11:11:12.93

昔の画家の絵画は出る　現代の作家と写真系が凄く弱くなった気がする

2022/11/25(金) 11:13:19.66

それはモデルの問題ってことなのかな
それならNAIみたいなのが出てきたら解決されそうだけど

2022/11/25(金) 11:15:33.23

https://twitter.com/hardmaru/status/1595808324066463747

こんなんで誰か飛びつくんか
https://twitter.com/5chan_nel (5ch newer account)

2022/11/25(金) 11:35:09.91

MJはほとんど叩かれてないのを見ると
結局クローズドでコソコソやってた方が楽だし得なんだろうなと思う
バカ正直にオープンでやる方が損するし停滞するという
少なくとも今はまだ人類はAI研究の意味と意義を理解できる段階にはないからな

2022/11/25(金) 11:43:29.14

へんに他企業がリリースする画像生成AIで倫理観の整理がされてしまう前にエグいのをオープンソースで出してしまってほしいが
コンプラで相当な時間割いてたからもう無理なんだろか
ポリコレ棒とかで叩かれまくってんだろか

2022/11/25(金) 11:52:18.91

なんだ、技術スレとか言いつつ自分でソースコードもいじれない無産だらけだったのか
結局AIが産まれようとどうしようと有能と無能の格差は永遠に埋まらないんだな

2022/11/25(金) 11:55:26.21

今頃気づいたのか。ここはインストール方法スレだからな

2022/11/25(金) 11:56:51.49

まず>>1やスレタイを見たほうがいいと思う

2022/11/25(金) 11:57:11.34

>>68
こういうキャプテンフューチャーとかレンズマンみたいなSFアニメ最近見てないわ。

2022/11/25(金) 11:59:08.53

技術スレなんだから俺はソースコード描きなおして改善した、という報告するならいいんじゃないかな
変な煽り入れるよりは

2022/11/25(金) 12:04:34.08

そもそもデータセットの問題にソースコードもなにもないという

2022/11/25(金) 12:04:46.85

オープンソースのプログラムは「フォーク」といって別のプロジェクトに分岐することができる
SD2.0があまり良くないならネットで呼びかけて人を集めてsd1.5を改造し直してnew SD2.0を作ることもできる
別に一人で作る必要はないしトップがプログラミングを出来ないやつでもいい
人を集めてプロジェクトをまとめればいいんだ

2022/11/25(金) 12:10:47.99

>>77
だったら自分でやりなさいよ口だけの無産くん

2022/11/25(金) 12:25:15.04

>>77
よし！まかせた！

2022/11/25(金) 12:29:16.93

>>77
プログラミング初心者だけど参加できますか？

2022/11/25(金) 12:31:41.64

emadの話が出てるが、抜けた学習は野良頼みということらしいな
https://www.reddit.com/r/StableDiffusion/comments/z3r5c7/i_have_compiled_emads_talk_about_20_in_the_last/

2022/11/25(金) 12:32:47.87

定期的に人が増えてしょうもない荒れ方するよなこのスレ
二日くらい放置しとくと戻ってる

2022/11/25(金) 12:33:08.04

責任はとらん！お前たちが好きに作れ！ということか
結局そこは変わらんのかw

2022/11/25(金) 12:33:55.67

今日はnewSD2.0開発の創始者がお出ましだ

2022/11/25(金) 12:38:24.84

>>82
ID:5FhaZ6LUaが一人で煽ってるだけだよ
スルーすれば済む話さ

2022/11/25(金) 12:46:53.42

ツールに対する細かい社会的な都合とかを無視したら、
「なんかいきなり退化してんなぁ……」としか思えんな
あまりにもクオリティの下がり方が残念過ぎる……

2022/11/25(金) 12:54:00.01

すぺっこてきにはローカルきついだろうか

2022/11/25(金) 13:07:06.25

こんなに超短時間で良くなってるのに物足りないと批判されるってヤバいと思う
まあこの人類の際限ない欲求を越えたときがシンギュラリティなんだろうな

2022/11/25(金) 13:13:34.04

>>88
そりゃいきなり将来性がなくなったからな
技術だけバラ撒いてあとはローカルコミュニティに丸投げっぽいし

2022/11/25(金) 13:14:35.47

>>87
今のところ768ｘ768は12GBで動くけど、それより下はメモリ配置やらなにやらやればできるかもって感じで書かれてるな(DBやNH等の拡張分は除く)
単純計算でもメモリは描画時のVRAM占有は2.25倍必要になるわな
とはいえ、SD1.4登場からのヶ月分のメモリ節約はそれなりに反映されてるから、SD1.4/1.5世代ほど余地は少ないとも言われている

2022/11/25(金) 13:41:12.84

>>81
好意的に解釈するならどうせお前ら好きに派生モデル作れるようになったんだから公式は万が一にも潰されないように身綺麗にしとくわってことかね

2022/11/25(金) 13:42:24.03

SD2.0は自分で使っていないのに判断は下せないかなと。
デモページ重すぎるのでローカルで使えるようになるの待ち

2022/11/25(金) 13:52:29.24

まだ何も触れてないので触ってから

2022/11/25(金) 13:54:37.29

昨日からローカルで使えるよ
ローカル=1111って意味なら使えないけど

2022/11/25(金) 14:40:51.99

隙間見て
a beautiful slavic vouge model girl
をデモページにかけた感じは密度上がって品質上がったように見えた

https://i.imgur.com/shBbFPI.png

2022/11/25(金) 15:04:54.29

試してみたけど、たしかに高解像度でも崩れにくいし景色とかはとても綺麗だ
人物も中々良い
エロ目的だと云々はこれベースのエロモデルまてばいいんじゃねーのとしか
ただ、diffusers で使おうとしてもところどころバギーで直すのめんどくせぇ

2022/11/25(金) 15:20:12.42

なるほど高解像度のほうがきれいになってるね　512ｘ2でやってたのがダメだったのか？

2022/11/25(金) 15:23:05.28

>>88
イラスト生成目的だとSD無印使う機会ないから良くも悪くもあんまりなにも
「超短期間で良くなってる」はMJとNAIと派生に対して思うことが多いな、ベースがSDなのは理解してるけど
なので性能というより「公開してること」が一番の強みのままかなぁと

2022/11/25(金) 15:27:54.98

MJはSDベースちゃうだろ

2022/11/25(金) 16:04:51.64

>>90
厳しそうだにゃー

2022/11/25(金) 16:05:26.14

MJは1部SD技術取り込んだとか何とか

2022/11/25(金) 16:21:26.79

>>90
なるほどね
１，２年後には1024x1024をデフォにしたモデルが出てくるだろうから
そのときは18GBか24GBのGPUに買い替えないとあかんのだろな。金がかかる趣味だ

2022/11/25(金) 16:26:00.06

>>95
ドアップ正面顔はほんとAI強いぜ

2022/11/25(金) 16:26:14.73

文字が出るようになってるな。日本語プロンプトもいける

a beautiful slavic vouge model girl
a beautiful japanese vouge model girl
photo of landscape, mt.fuji, sunset, cinematic lighting, beautiful sky
photo of night view of tokyo, bird eye angle
photo of a beautiful girl eating ramen with chopsticks
photo of a biohazard mark
photo of Stop traffic sign
photo of clock
photo of calender
photo of credit card
photo of 京都
photo of おっぱい

画像多いからまとめてうｐした。imgurがちゃんと？18禁扱いしてて笑う
https://imgur.com/a/Htrx37I

2022/11/25(金) 16:28:26.07

ラーメンは食えないのかなるほど

2022/11/25(金) 16:30:48.53

>>104
なんか夢でみる景色みたいで怖いw

2022/11/25(金) 17:06:38.91

都市伝説で異次元に行くと文字が変とか言う、それっぽい。

2022/11/25(金) 17:29:40.76

>>104
ラーメンみんなたのしそうｗ

2022/11/25(金) 17:30:33.43

>>104
台湾の雰囲気に似てるし、フォントやデザイン的にも中国の画像学習してる印象

2022/11/25(金) 18:45:37.21

日本人だって中央アフリカと南アフリカの違いはわかんないでしょう？
それと同じ

2022/11/25(金) 18:48:38.05

意味不明な文字が出るのは前からだね
マガジンカバーとかで偽の雑誌の表紙を出してくれるｗ

2022/11/25(金) 19:08:04.38

前よりは文字らしきものが文字になってるな
カレンダーとか以前からは考えられないほど原形をとどめてる

2022/11/25(金) 19:26:49.22

SD2.0のcolab notebookが出てきてるな
あとで試そう

2022/11/25(金) 21:46:53.02

異世界文字みたいなの作れて楽しいっちゃ楽しいけど

2022/11/25(金) 21:56:11.50

わしゃわしゃしてみた結果、写真的なのと奥行きは強そう
モデルが違うだけと言われたらそのような気もする

2022/11/25(金) 22:39:58.01

初です
一応1.5でステイでいい感じですか？

2022/11/25(金) 22:50:12.41

NovelAI系が目的ならステイどころか一生気にする必要ないよ

2022/11/25(金) 23:41:01.51

今後派生モデルが出れば状況は変わるかもしれん

2022/11/25(金) 23:43:38.90

先にNvidiaが発表したeDiffiが文字を正確に表記出来る事を考えると
やや周回遅れな感じはする

2022/11/26(土) 00:28:03.38

延期を繰り返すのはだいたいクソゲーってのはどこの世界も一緒なのな。はー、最初の威勢もなくなったし残念だわ。

2022/11/26(土) 01:36:22.18

SDの規模と資金力と技術でもクリーンな学習するとこうなるってことは
MJとNJはどんだけダーティな学習の仕方してんだろうって思ってしまった
絶対表に出せない手法使ってるんだろうな論文すら一切出さんし

2022/11/26(土) 01:42:50.08

SD2.0+eDiff+nsfw+masterpiece+style+最低でもダンボールタグの表現力(細部指定)が欲しいわけで…
ポリコレ抜きでも金出してるところがエログロペドダメだっていえばそれまでだしな
Midjorneyの高画質版でしかないわな。コンセプトアートもCGアートの受賞した奴からちょっと詳細になった程度だし
宇宙服やストームトルーパー出せますっていうだけじゃ…実写や人の手でいいのでは？っていう突っ込みも増える
(イギリスで黒人が幼女レイプしてる画像ポンポン出せる奴が許容はされないわな)

2022/11/26(土) 01:48:31.82

Checkpoint /content/drive/MyDrive/model3.ckpt has both EMA and non-EMA weights.
In this conversion only the non-EMA weights are extracted. If you want to instead extract the EMA weights (usually better for inference), please make sure to add the `--extract_ema` flag.

--extract_emaのフラグ君はどこに書き込めばいいの...？

2022/11/26(土) 03:16:15.88

>>123
起動時の引数だよ。って言うか別に必須ではないでしょ
書いてある通りemaじゃない値でいいならそのまま、emaの値使いたいなら引数付ける、って話かと

2022/11/26(土) 05:52:51.74

え　なんか改悪あったの
一ヶ月ぶりに契約しようかとおもったんだが

2022/11/26(土) 07:05:55.00

NovelAIの話じゃないよStablediffusion の話だよ
必要スペックが上がって画家名やエロが出なくなったよ

2022/11/26(土) 07:07:46.55

まだβだが今後二次元で契約ならNJ一択だな

2022/11/26(土) 07:11:23.44

>>126
NOBELAIはこれまで通り？

2022/11/26(土) 07:12:48.76

>>128
そのぐらいログ辿れw
これまで通り

2022/11/26(土) 07:15:33.14

>>129
ありだとん😯

2022/11/26(土) 07:16:17.61

つーかもしかしていつか規制で学習元が規制されてまとまじゃなくなる可能性もびらぞう

2022/11/26(土) 07:31:08.60

NJはエロ出ないぞ

2022/11/26(土) 07:39:57.86

自己発電用のつもりが無かったんでなｗ
絵描きとしてはＮＪは興味ある

2022/11/26(土) 07:57:37.76

anynai見てるからかnjのクオリティすげー低く見えるんだけど一般的にはそうでもないのかな
渋ランカーとお絵描きスレくらいの違い

2022/11/26(土) 08:45:04.75

ハンコ顔がカッチリ出るのは絵描きからするとあまり。いつも同じ絵じゃんって思っちゃう

2022/11/26(土) 08:45:48.62

使い手の問題が9.5割だと思うよそういうの

2022/11/26(土) 08:46:23.74

考えて数百トークン詰め込んで同じ絵じゃんとはならんと思う

2022/11/26(土) 08:48:07.00

あでもNJは適当に入れてもいい感じになるね
それもそこそこバラつくし

2022/11/26(土) 09:16:16.73

あとそう、NJは試してないから知らんけどプロンプトで突然絵柄が変わったり謎の解釈されるのが嫌なんだよね

2022/11/26(土) 09:19:41.47

指定しないからだと思う
謎の解釈じゃなくて指示してないんじゃない

2022/11/26(土) 09:21:23.88

なんUのスレとかpart20の方のスレで相談乗ってもらってくるといいよ

2022/11/26(土) 09:26:56.38

こっちはSD系だけど死ぬほど試して自分で呪文の傾向のメモも作ってるｗ
そのうえで言ってんのよｗ　ＮＡＩは知らん

2022/11/26(土) 09:31:49.09

そう

2022/11/26(土) 09:42:52.90

2.0は深度管理ができるようになったんじゃなかったか
絵を立体的にとらえることができたり
生成のStep数が少なくてすむようになったり
スペックが必要なのは768とか1024に対応する時だけで
512のままならそんなに変わらないとか何とか

2022/11/26(土) 09:44:04.31

絵描きでもプロンプターでもいいけど未来予想で短文連レスされると意味ある検証が流れるからできればやめてくれ
やったことの話だけしよ

2022/11/26(土) 09:49:04.20

すまん
ストレートに言うと使ってるならプロンプトと使ったモデルの詳細くらい言って欲しかった
終わり

2022/11/26(土) 09:52:40.38

有名人・アーティストは学習時点でプロンプトとの関連を無くしたから
指定して作るのは難しくなっている
NSFW関連は学習元から除外されているが出せないわけではない
デッサンが狂いやすいとか顔や手がおかしくなりやすいと言われているが詳細は不明
1.5の時点でもそんなに綺麗じゃなかったし

2022/11/26(土) 09:57:40.49

要するにハードが新しくなったからやれることやグラフィックはよくなったよ
それに合わせたソフト作ってもらえれば前以上のことできるよ
今はデフォルトのソフトしか動いてないからnsfwは出しにくいよってこと？

2022/11/26(土) 10:43:20.43

SD2はDreamBoothがすごいらしい？

2022/11/26(土) 10:53:07.27

SD2.0　はよ１１１１に対応してくれ
2.0以前に更新途絶えているが・・・

2022/11/26(土) 10:54:15.09

>>134
エロはできんけどしっかりプロンプト組めばクオリティ高いのできるぞ
ただクオリティ系盛るとすぐ3次寄りになるから調整が難しい
https://i.imgur.com/mQN8u7V.jpg
https://i.imgur.com/45nXNKa.jpg

2022/11/26(土) 11:10:22.07

セルアニメ風はそんなによくない。イラスト風はかなりよく見えるけどね

2022/11/26(土) 11:23:52.81

>>151
こんなのできるのか
すげえな

2022/11/26(土) 11:35:23.97

アニメ絵みたいな省略された絵の深度はちゃんと判定できるのだろうか

2022/11/26(土) 11:43:17.46

SD2.0ってckptのやつ？
2.0のckptがあれば動くって訳じゃないの？

2022/11/26(土) 11:44:18.77

>>151
これはヤバいな

2022/11/26(土) 11:45:30.41

https://gigazine.net/news/20221125-stable-diffusion-2-instant/
gigazineの記事を見ると「SD2.0はまだ微妙だけど、同じ条件だとSD1.4はもっと下」っていう印象だな
そう考えると、模索すべきはSD2のポテンシャルを発揮できるプロンプトの傾向なのか？

2022/11/26(土) 12:06:34.49

実行環境とスペックもありそう

2022/11/26(土) 12:22:54.82

>>155
それ単なる汎用の拡張子だから翻訳でも音声合成でも何のAIにでも使われてる

2022/11/26(土) 13:13:48.88

>>157
SD2.0を3Dで出すと完全に不気味の谷に落ちて行ってるよな…
SD1.4でbeautifulやkawaiiっていうのが重宝されたことを考えると需要と供給が乖離して言ってる
SD2.0つえええのただの切り取りで、出たばかりでサンプルプロンプトが屑だっていうだけかもしれんが

2022/11/26(土) 13:33:00.04

需要って最初から研究開発用途だぞ
開発者でもないしライト層でもない人は
そもそも1.4とか1.5使わずにwaifuやnai使うか自分で学習させる

2022/11/26(土) 13:45:37.63

colabだけどSDwebuiバージョンアップしたらなんか不安定になった

2022/11/26(土) 13:52:45.96

DBの拡張版がhuggingfaceから持ってこれるからSDv2のチューニングができるかと思ったが甘かったか

2022/11/26(土) 14:00:15.08

>>151
NAI単体じゃ無理だけどマージなら同じぐらいのクオリティはいけそうだな

2022/11/26(土) 15:02:49.65

>>151
すまん舐めてたすごいやん

2022/11/26(土) 18:17:52.13

剣とか銃が直線なのはいいね

2022/11/26(土) 19:16:09.77

>>151
ラーメンと箸はどうなりました？

2022/11/26(土) 19:50:46.86

あえて突っ込み入れるなら刃の方
握ってどうするんだと

2022/11/26(土) 20:05:16.31

SD2.0、Lexicaにある奴の同じプロンプトを入れても全然再現できないな
アート系はもうファインチューニングに期待するしかないのか

2022/11/26(土) 20:08:03.26

1.4, 1.5のいい感じのを2.0でi2iしたらどんな感じになるんね？

2022/11/26(土) 20:08:20.83

銃もどう握ってるんだってレベル

2022/11/26(土) 20:11:48.78

>>169
テキストエンコーダ変更したんだからプロンプト探索は一からやり直しじゃないの？

2022/11/26(土) 20:45:23.08

俺は1.5と心中するぞ

2022/11/26(土) 21:41:33.78

テキストエンコーダが変わって、具体的に以前のプロンプトがどう通らなくなってるのかなあ
なんとか意図どおり引っ張ろうとしてゴテゴテ言葉足すとかえって良くないとか、そういうことなのか？

2022/11/26(土) 22:17:37.11

DBのテキストエンコーダってなんなのかイマイチ分からんのだけど、
とりあえず使えば学習精度が上がるって認識でいいのかな

2022/11/26(土) 22:19:00.21

単語の表現範囲が狭いというか生成される画像にばらつきが少ないんだよな
1.5だとプロンプトがだめでもたまに当たりがでるけど、2だとハズレしか出ない

photo of a clockだとアラビア数字の時計だけ
full body of a girlだと首から下の画像だけ
head and body of a girlでも全身でないし生成画像が偏りまくってる（ちなみにこのプロンプトだと乳首普通に出る。ただし(以下略

2022/11/26(土) 22:39:23.07

>>175
CLIP学習させると埋め込む単語が1トークンになるとかどっかで見たような…
ただCLIPを固定して学習したのがSDだからCLIP弄るとその他すべての表現にも
影響が出てしまうんじゃないかな。あとはそれを許容する程度の問題？

2022/11/26(土) 22:41:17.44

full bodyには「豊満」って意味があるからだぞ
1.5で試してみたけど太めの女性の全身が出る（男性は出ない）
whole bodyだと正面と背面の二面図が出る
あと顔が画面から外れるのはスケールが強すぎる場合もある

2022/11/26(土) 22:46:25.02

AUTOMATIC1111版が2.0に対応

2022/11/26(土) 22:49:25.18

やっぱり更新止まってたのは２．０への対応だったのか

2022/11/26(土) 22:53:20.84

単語にはたくさんの意味があるけど、そのことを理解してくれてないってことかな
時計にはローマ数字もアラビア数字も日時計あるんだから様々なのを出してもらいたいけど出てこない
full bodyも色々な意味があるならその色々な意味で出してもらいたいけど出てこない

これ要するに今後プロンプトがよほど細かく解析されない限り、求める画像を出すのが難しいってことになる

2022/11/26(土) 23:11:00.05

CLIPスコアの上昇は解釈の幅が狭くなる事と同義なのかもしれん

2022/11/26(土) 23:15:47.55

waifuやnaiで使われてるbooruタグは素の1.5とか2.0では通用しないとか
full bodyよりもfull body shotの方がいいかも？とか
3 birdsよりもthree birdsの方が正確に三羽の鳥を描くとか
プロンプトを強調しようとしてスケールを上げると一部が強調されて全体的には遠ざかるとか
試してみないとわからないことだらけだよ

2022/11/26(土) 23:23:31.73

NAIは単語を適当に並べるだけでいいけどSD2は自然言語的に書く必要があるってことかな
英語苦手な自分にはつれぇわ……

2022/11/26(土) 23:34:52.25

自然言語的にする必要はないと思うよ
that構文はちょっとだけ理解してるっぽいけど大体無視されるし
受け身も理解してくれないのが多いし
andやonやinを増やしすぎても理解してくれないし
ただ通用するプロンプトが違うだけだと思う

2022/11/26(土) 23:51:43.60

1111が2.0に対応

2022/11/26(土) 23:59:13.31

なんかcolabが上手く動かんと思ったが、その辺のゴタゴタまわりで
DL先の仕様が変わってたりすんのかな

2022/11/27(日) 00:05:24.98

1111SD2きたんかー
とはいえ、エロ非対応とNJショックでなんか盛り上がらんな

2022/11/27(日) 00:09:51.41

SD2ベースのWaifuやAnyが来てからが本番や
今は時計の針が8月下旬まで戻った状態

2022/11/27(日) 00:26:10.22

anythingはNAIのリークが元だから
SD2ベースにはならんでしょ

2022/11/27(日) 00:45:01.60

しばらく2.0が盛り上がることはなさそうだな
NijiはNijiで制限も多いし
大人しく1.5で適当に遊んでるわ

2022/11/27(日) 02:10:39.72

今更SD1.xベースのWDがきてもマージの餌にしかならんからSD2ベースの世界を見せて欲しいなぁ

2022/11/27(日) 03:02:10.34

面白くなってきたぁあ

2022/11/27(日) 03:06:14.22

2023年はヤバい年になりそう

2022/11/27(日) 05:00:35.72

>>192
そこだよなぁ。一部期待している人も多いようだが…
NAIやAnythingと全く違った方向にはなりにくいだろうし、WD1.3だって1.2よりはましって判断してたわけだろ？
世界的に1.3のepoc小出しでどんどん悪くなるのが止められないモデル生成者扱いだ
学習終ったらまともになるって思いこんでる人もいたが結局そのままで
NAIリークで存在意義もかなり薄れてマージ素材になってしまった感じがな
WD1.4だしてSD2.0でまた学習するんかな…頑張ってほしいけどまた3ヶ月4か月後となると周回遅れ感が

2022/11/27(日) 06:22:26.38

中華ニキの技術力と組織力に期待だな
moe-ttsで感心したがオンラインで千人規模のチームワークができる民族は他におらんやろ

2022/11/27(日) 08:25:32.21

VRAM4GB環境使ってA1111でSD2やろうとしたけど
やっぱりうまく読み込めないんだね
最適化こないかな

2022/11/27(日) 09:31:38.42

SD2.0はDB向きらしい

2022/11/27(日) 09:34:39.66

自作ラノベをKindleで自己出版するつもりだけど
挿絵のイラストをAnythingにするのはライセンス関連で問題でるかな？
綺麗な挿絵欲しいけどライセンス問題は起こしたくない

2022/11/27(日) 09:42:14.69

完全に自己責任