X



【Midjourney】AI画像生成技術5【StableDiffusion】
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 08:58:08.25ID:7eP1MleX
英語の文章が画像に!
背景に使うか?イラストのアイデア出しはもちろん、
与える英文を捏ね捏ねして思いがけず生成される秀逸画像ガチャで遊ぶのも楽しい
有料サブスクで商用利用まで可能なAI画像生成サービス

★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
(以下のスレッドへ移動してください)
AIイラスト 愚痴、アンチ、賛美スレ
https://mevius.5ch.net/test/read.cgi/illustrator/1661305344/

前スレ
Midjourney】AI画像生成技術交換3【StableDiffusion
https://mevius.5ch.net/test/read.cgi/cg/1661762186/

テンプレまとめ
https://rentry.co/zqr4r
編集コード「5ch」

Midjourney】AI画像生成技術交換4【StableDiffusion
https://mevius.5ch.net/test/read.cgi/cg/1662332320/
0716名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 14:56:12.57ID:Ugl6jIw0
>>706
コード見間違ってて
トークン直接じゃなくて括ってる文字列から取得するident値を使ってた
なので一文字でも違えばいいみたい
トークン分割後に同じ文字列になった場合両方に影響が出る
多分覚えてても役に立たない豆知識
0717名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 15:04:53.46ID:TSNOtRCT
SDだけじゃなくMJでもよくあったけど
black hair girl in white bikiniで黒いビキニになりまくるアレなんとかしてほしい
どこがどこに掛かってるのか
0719名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 15:12:28.42ID:FxoRaI6I
そんな構造になってないはずなんだけど、どうも連想ゲームしてる感じはあるんだよなあ。
黒ビキニってのを学習しすぎて、ビキニといえば黒ですね! 白? 間違いでしょう。みたいなw
0721名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 15:40:21.33ID:QYKW/yyp
たぶんだけど、潜在変数に人間が望んだ特徴の分類が入ってなくて、
ビキニ(着る物)と黒(色の名前)で分類されて欲しいのに、両者のベクトル距離が近くなってる
とかじゃないかなって予想
アーティスト名で構図から人間の有無からと絵そのものが変わっちゃうのもたぶん同じ理屈じゃないかな

声質変換とかTTSとかでその辺うまく分類してくれないかって苦労した気がする
でもVQ-VAEの登場で、情報量を大きく制限することによって声質に関係しない発音情報のみを取り出せるようになった
おかげで声質と、発音記号に特徴を分解できるようになった

まぁSDで同じ理屈が通るかというと、わからんけど
あとただでさえモデルでかいから計算コスト高いモデルは採用できないって問題もあるか
0722名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 15:44:02.97ID:FxoRaI6I
-で括ったら一つの意味で他のトークンには関わらないみたいなこともできるようになると助かるね。
0724名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 15:48:30.17ID:irljJ+xn
white bikiniだと「white」と「bikini」ってふたつの単語があると考えちゃうからな
bikini is whiteにしてやると「ビキニは白」ってなってくれる
でもbikini color is whiteだと「ビキニ」と「色が白」のふたつになることある

girl at bearch, bikini is white, hair is black
https://i.imgur.com/ndp7kWL.png
あれ。ビーチはrいらなかったかな。どうでもいいけど
0729名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 16:24:33.65ID:TSYh0sGm
みんな飽きて来てるよなw
0731名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 16:32:34.94ID:TSNOtRCT
ロリ白レオタードをミュシャに合わせるとか禁じ手中の禁じ手だろ・・
というかこんな体綺麗に出るのか、やっぱ体操種目だから全身の学習画像が豊富なのかな
0733名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 16:44:55.77ID:M8rQZk0S
>>728
>686もややあやしかったが性癖についてはどうこう言わない、が>728はプロンプトを知りたい
人体が破綻していなくていいし手もなかなか
筋肉質なのは指定したからじゃなくて、体操選手だから自然にそうなるのかな
0734名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 16:55:19.94ID:gisD6INd
>>733
Prompt: full body of <主題>, (((intricate human hands fingers))), modern style, by greg rutkowski and alphonse mucha, d & d character, gradient white to gold, in front of an urban background, digital painting, concept art, smooth, sharp focus illustration, artstation hq
Negative prompt: ((((mutated hands and fingers)))), (((portrait)))

ですね。たまたま体操選手を主題に入れただけなんやで……。
modelはtrinart2_step60000.ckptを使用
0737名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 17:18:21.61ID:FxoRaI6I
>>732
早速回してきた! 概ね、期待した感じのUIだったけど、ちょっと意外な落とし穴もあった。
顔の周辺を繋げて貰おうとすると、「肌色成分が多いのはいけないと思います!」って言われて、真っ黒にされるw
これはチェックをはずさんとダメだわw

あとは動画ほど綺麗なつなぎ目にはならない。雑コラっぽい感じだけど、多分、調整でなんとかなりそう。

元画像
https://imgur.com/EBLiADe

拡張しようと頑張った画像
https://imgur.com/SbagXpN

肌色成分が多いところは容赦無く墨塗られるw これは改善可能。
つなぎ目はやっぱりちょっと怪しい。promptとCFGやSTEPで改善出来るかな?

けど、成熟したら、かなり使えそうだわ。
0738名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 17:20:45.07ID:gisD6INd
グレッグさん、アルフォンスさん、ジェレミーさんは入れておけば間違いない。
このプロンプト、<主題>に fire dragon とか入れてもミュシャとD&Dキャラクターの力で人化するから楽しい。
0740名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 17:55:25.83ID:M8rQZk0S
>>737
自分もやってみた

オリジナル https://i.imgur.com/lO5Ea6W.png
800x600に拡張 https://i.imgur.com/yK1W5Zu.png

左下がやや不自然だけど全体的には悪くない…が足を伸ばすところはもうちょっとがんばってほしかった
出てきたのをアンドゥできないのがつらい
あと枠の移動が重いのも(Chrome使用)つらい。「Outpaint」の左にあるキャンバスのアイコンをクリックしてから画像をドラッグすると全体をスクロールできるんだけど、これも動作がきわめて緩慢なので忍耐力が試される
この画像じゃないけどやっと残り1つだ、となってからNSFWで黒塗りにされると悲しい。肌色どころか人体ですらない風景だったのに
0742名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 18:05:18.68ID:M8rQZk0S
>>741
それなんだけど、UIは確かに拡張したいところを指定して実行、となっているけど
出てきた画像を却下してもう一度お願い、というのができないと1111版のOutpaintingと結局は同じかなと思った

1111版に「Outpainting mk2」が来てる。試してみよう試してみてね
0744名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 18:10:25.19ID:veIMvaIF
最新版の1111を入れてやるかーと思ったら三分前にまた更新されてて草

モデルが選択できるようになった?
0745名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 18:14:52.07ID:QxQOngCB
https://lexica.art/で単語検索しても全く関係ない絵しか出ないのなんなんだろ
プロンプト見ても検索した単語が使われてない
0746名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 18:20:13.95ID:1VWd1k5m
>>745
検索バーの右の調整ボタン押すとプロンプト検索か、意味検索的なやつかで選択できるよ
画像の類似検索ができるようになった都合で新しい検索方法がデフォルトになってる
0748名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 18:26:22.41ID:QxQOngCB
>>746
そんな変更があったのか!
ありがとうございます
0751名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 18:52:33.54ID:qZCWMipK
Mark2、ステップ数をやたらでかくしないとまともな結果にならないんだけど
そういうものなのか?
0752名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 18:58:32.14ID:S+9DsKqG
アウトペインティングはつなぎ目を自動修正できないのかなぁ
0753名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 18:59:08.17ID:temo01D7
>>709
中々面白い検証ありがとう
「,」は文章の意味とか、単語の関連性に断絶を与えるトークンなので、()で強調しまくると断絶がよく効くような感じやね
0755名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 19:02:12.76ID:temo01D7
アウトペインティングすげーって思ったけど
肌色成分が公官庁の開示文書みたく黒塗りになっちゃうのか
1111先生に頑張ってもらうしかないな
0757名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 19:04:48.12ID:gisD6INd
>>754
拡張サイズの入力はできなくて、方向をチェックすると勝手に拡張されるようになってる。
値の設定はscriptからoutpaintink mk2を選ぶと

Recommended settings: Sampling Steps: 80-100, Sampler: Euler a, Denoising strength: 0.8

と書いてある。
0761名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 19:26:01.31ID:5WCb9Mfb
アウトペインティングは人物をどこまで自然に拡張できるかを最も重視してる
人物がいい感じに拡張できるなら背景はまあどうでもいいわ
0762名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 19:37:47.48ID:gisD6INd
>>757
あれ、ちゃんと拡張するピクセル数とかMask blurを入力する場所あるな?
さっきはなんで見逃してたんだろう。
なので、Poor man'sと変わらない。

↓この2つが増えてるけど、まだ調べてないので何なのかわからぬ。
Fall-off exponent (lower=higher detail)
Color variation
0764名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 19:59:14.67ID:gisD6INd
Fall-off exponent (lower=higher detail)
これは、拡張する部分をどのくらい細かく描き込むかの設定か。1からぐいっと下げたらめっちゃ描き込みされたw
https://imgur.com/LkGesQL.png

Color variation
これは、元の絵の色からどのくらい変化を許すかの設定か。
数値大きくしたら顔が真っ赤になったw
https://imgur.com/gmDvh5Y.png

拡張するサイズが大きすぎると、追加するパーツもでかくなる傾向がある……気がする。
↑顔でかくね?
0765名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 20:24:01.73ID:S+9DsKqG
モデル比較作ったら切り替え早くてびっくりした
0766名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 20:43:40.99ID:b68cdcR2
自分ではまだ試してないけど、OutpaintしたいならKritaのPlugin使うのどうかな
1111から作ってるぽいしレイヤーになるから取り消しもできるような
0767名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 20:47:53.74ID:gisD6INd
>>756
わかった!Settingsで "Apply color correction to img2img results to match original colors." にチェックが入ってるとこんななるんだ(うちの環境では)!
0768名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 20:51:45.69ID:S+9DsKqG
>>728,734
4chanに貼ったらかなり好評だった…
0771名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 20:58:15.89ID:TSNOtRCT
ID:gisD6INd
色々ありがとう、参考になる
mk2デフォで拡張したらノイズしか出なくてなんのことやらだった

>>757
>値の設定はscriptからoutpaintink mk2を選ぶと
>Recommended settings: Sampling Steps: 80-100, Sampler: Euler a, Denoising strength: 0.8
>と書いてある。

赤字にしてくれたら気づくのに・・
0773名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 21:14:31.97ID:gisD6INd
SD upscaleはプロンプト使って描き直しするから、最初顔とか小さくてつぶれ気味になっててもきれいになるんよ。
0775名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 21:23:47.75ID:S+9DsKqG
モデル切り替え便利すぎる!
0779名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 22:20:51.14ID:iHoUBdMF
初心者すぎる質問で申し訳ないんだが…
1111のcolab版を使おうと思うんだけど
ckptファイルは毎回ダウンロードが必要なのかな?
0780名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 22:24:21.41ID:FxoRaI6I
colabは接続解除する度に全部消えちゃう仕様なので原則必要。
ただドライブに放り込んでおいて、そっからcolabのフォルダにコピーするのもあり。
けど、その手間はやっぱ必要。
全部ドライブにインストールするってのもてだとは思うけど。
0782名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 22:31:56.58ID:HGMxSSYv
ドライブにmodelとnotebookと同じ階層に入れておいてドライブにマウントしてディレクトリ移動じゃ駄目なの
0783名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 22:36:52.89ID:QxQOngCB
1111のアウトペインティングMK2やってみたけど、やっぱツギハギみたいになるなぁ…
kritaのアウトペインティングもそうだったけど…
この「そうじゃないんだよ…」感を払拭出来るアウトペインティングの実装には結構時間かかるんかな
0784名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 22:37:55.62ID:ekTauQtw
>>780-782
なるほど、マウントか
調べて試してみます。ありがとう
0785名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 22:37:57.09ID:Oxh2/A3E
ここ2,3日あんまり熱心に見てなかったけど、モデルはこんな感じかな?
(学習枚数=クオリティではないと思うけど一応書いておいた)

○オリジナル モデル 1.4
 LAION-2B-en 23億枚学習 ※詳細は公式参照

○とりんさま: 1.4ベース + アニメ・漫画系 8万枚追加学習(v1) + 1万枚追加学習(v2)
 https://huggingface.co/naclbit/trinart_stable_diffusion_v2
 モデルを入れ替えるだけでOK

○waifu: 1.4ベース + Danbooruイラスト 5.6枚追加学習
 https://huggingface.co/hakurei/waifu-diffusion
 モデルを入れ替えるだけでOK


○日本語版: モデルは1.4とは関係なくゼロから学習されたもの。コードも別のものが必要
 https://github.com/rinnakk/japanese-stable-diffusion

 stable diffusionのコード(ただし日本語のトークナイザ)で1億枚学習

 コードを StableDiffusionPipeline → JapaneseStableDiffusionPipeline に修正すれば動く??
0787名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 23:16:34.95ID:RXPB+LSI
outpainting mk2、同じprompt、同じseed与えてもなんか変

rightだけうまくいってるように見える
https://imgur.com/a/GYANwxm
0788名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 23:22:11.09ID:dVaFNesF
特定の絵師のイラスト6枚でTIしてみた
TIの設定はまだ模索中だけど生成にあたってはプロンプトを目的の絵柄に寄せた上でTIした単語を重ねると良い感じ
この場合プロンプトにloliを入れた上でTIを重ねると絵柄がかなり似た
TIなしとTIあり
https://i.imgur.com/HhEw96m.png
https://i.imgur.com/EdnadSD.png
https://i.imgur.com/YneUHpB.png
https://i.imgur.com/Gqfzj2Z.png
0790名無しさん@お腹いっぱい。
垢版 |
2022/09/17(土) 23:27:42.05ID:gisD6INd
>>787
右がうまくいくseed、左がうまくいくseed、両方がうまくいくseedといろいろあるんじゃね?

>>788
TIもそのうちやってみたい……うちのGPUは3060だけど
0800名無しさん@お腹いっぱい。
垢版 |
2022/09/18(日) 00:28:37.78ID:+2pQJ5Nn
このスレの魔術師のおかげで4chanも賑わってるよ
0801名無しさん@お腹いっぱい。
垢版 |
2022/09/18(日) 00:36:04.12ID:+fkiRLHE
以前やったやつ、左手が右手になってたの気が付かなかった
https://i.imgur.com/PI9GWNL.jpg

Glamour body shape, big boobs, huge tits, big breasts, light Brown hair, Wear glasses,
16 years old, kawaii japanese girl, Pink powder is sprayed directly on the naked body
so that it becomes the shape of a one-piece dress,Wearing a pink latex miniskirt,
both Hands behind the neck, show both armpits, stand in future city,
0803名無しさん@お腹いっぱい。
垢版 |
2022/09/18(日) 00:44:17.78ID:rwK6kaP7
しかし改めてスレ見ると美少女画像率高いな
たまにはイケメンを生成する呪文も研究してあげて
0807名無しさん@お腹いっぱい。
垢版 |
2022/09/18(日) 01:15:53.11ID:AwBLCkvw
>>802
入れたり出したり、貿易しているのです
まあそもそも4chan自体日本文化と日本の某掲示板をリスペクトしてる人が作った掲示板だしな、日本との繋がりはまあまあ深い
0808名無しさん@お腹いっぱい。
垢版 |
2022/09/18(日) 01:18:20.61ID:1Obv8XFB
>>806
Waifu

https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/sd_textual_inversion_training.ipynb

このcolabを使って学習
what_to_teach=style, Initializer_token=girl, training _rate=7e-04, train_steps=10000
学習元の画像は髪の色とかのバリエーションがついた同じ絵柄の絵を顔付近だけクロップして512x512に揃えて用意するのがコツらしい
今はここから更にステップ数を上げても効果があるか試してる
0809名無しさん@お腹いっぱい。
垢版 |
2022/09/18(日) 01:44:43.70ID:04hwITED
>>803
face photo of 24 year old japanese good looking actor, (((((((草なぎ剛))))))), SMAP
Negative prompt: korean
Steps: 80, Sampler: Euler, CFG scale: 7, Seed: 2228362882, Size: 512x512

https://imgur.com/a/yAKazy6
0811名無しさん@お腹いっぱい。
垢版 |
2022/09/18(日) 02:17:28.49ID:+2pQJ5Nn
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況