X



【Midjourney】AI画像生成技術5【StableDiffusion】
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 08:58:08.25ID:7eP1MleX
英語の文章が画像に!
背景に使うか?イラストのアイデア出しはもちろん、
与える英文を捏ね捏ねして思いがけず生成される秀逸画像ガチャで遊ぶのも楽しい
有料サブスクで商用利用まで可能なAI画像生成サービス

★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
(以下のスレッドへ移動してください)
AIイラスト 愚痴、アンチ、賛美スレ
https://mevius.5ch.net/test/read.cgi/illustrator/1661305344/

前スレ
Midjourney】AI画像生成技術交換3【StableDiffusion
https://mevius.5ch.net/test/read.cgi/cg/1661762186/

テンプレまとめ
https://rentry.co/zqr4r
編集コード「5ch」

Midjourney】AI画像生成技術交換4【StableDiffusion
https://mevius.5ch.net/test/read.cgi/cg/1662332320/
0003名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 10:06:01.89ID:P+USYJFh
Red ballだとseedによっては白いボールを出す時があるんだよね。わけてみたりまとめてみたりする。
‘’で括ったりしても、あんまり効果見えなかったりこの辺はやっぱ呪文よね。
0004名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 10:13:24.25ID:NiqPjgfP
SDってテキストと物体の関連付けは高いと思うけどUnetの識別能力が微妙だな
似たような色と形状があるだけで誤認識して勝手にそこに描き始める
名状し難きクリーチャーを見るの疲れたわ…
0007名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 10:41:46.53ID:qrbDdxqv
いや,ねんどろいどは二頭身だからだろ

Automatic1111版またスクリプト追加してるな
Pullするたびにアプデあって気持ちいい
0008名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 10:48:22.70ID:/4z4a+7R
clip frontでhiとかのdetail系だけパッとなんとなくで見た感じだけど案外違うんだな…

 hi detail 顔イラスト hi detailed 顔イラスト
 hi-detail 絵画 hi-detailed 顔イラスト

 high detail 建築・絵画 high detailed 雑多
 high-detail 建築・絵画 high-detailed 雑多

 highly detail 描画 highly detailed ミニチュア・フィギュア
 highly-detail 絵画 highly-detailed 雑多

 hyper detail 特定ブランド hyper detailed 細かい描画
 hyper-detail 特定ブランド hyper-detailed 細かい描画
0009名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 11:01:35.34ID:2OMfWC8V
ねんどろいどは
2等身で512x512におさまりやすい
通販ショップやレビューサイト等の物撮りで品質と構図が安定している
顔が占める面積がデカい
抽象化されていて細部の情報量が少ない

ここらで概念化がスムーズに行ったんだろうな
0010名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 11:05:45.01ID:LIUiLgPH
1111のスクリプトにあるバッチプロセスとはどういう代物ですか?
現在の生成設定✕指定枚数を児童で作成してくれる便利機能かと思ったけど、全然そういうものではない感じ?
インプットフォルダとアウトプットフォルダ設定だけで頭?状態
0011名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 11:13:11.09ID:4gjZUmrJ
ねんどろいどはポーズも限られてるし、誰かが絵描くにしてもバランスも似たような物しか描かないだろうし
結果として規格が統一されバランスの良いデータが。

ねんどろいど意外に海外含めもう少し等身高めのメジャーな人形規格ってないかなぁ。
0013名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 11:31:59.09ID:iu1fiXN8
>>12
前スレ立てた人が2に間違えたって書いてたのに・・
あと前スレが3スレ目で、下に4スレだけポツンとあるのももうちょっと
交換抜いて【】補正したのはいいけどすんごいズボラなスレ立てだね
0015名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 11:45:03.51ID:untpxQHo
>>1
乙乙

もう次スレ関連スレもてんぷりゃに入れればいいんじゃない?
あとdreamboothのやりかたnpakaさん解説来てたけど
40GBいるとかでかなりまだ無理っぽい
0016名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 11:51:25.08ID:uX3FKjDA
sd upscleようやくコツが掴めてきた
でも今頑張ってテク身に着けてもどうせすぐボタン一発で凄いの出るようんなるんだろ?
と思うと若干むなしさ感じるなw
0018名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 12:11:40.40ID:RCTanb+9
>>1
乙乙

prompt、オブジェクトとスタイルを分けてぶち込めるようにならないかなあ。
学習データでは一応、この二つは別物っぽいんだけど。
贅沢言えばカメラも分離して欲しいが、これはちょっとムリかな……
0020名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 12:28:59.25ID:2OMfWC8V
waifuでどうにか顔ドーンじゃなくて引きの画にならんだろうかと
Negative Promptsに((((portrait))))とぶち込んだら現実の顔成分がごっそり引っこ抜かれて二次元のカクカクとした目とアニメ塗りみたいになった

引きの画にはならなかった
0022名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 12:40:54.91ID:IKLGuAg0
Midjourneyで実在の人物で練習してるんだけど瞳が高確率でロンパったりグチャグチャになったりする……
目の情報入れてみても微妙に上手くいかないし何か良いワードある?
0023名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 12:54:00.11ID:RCTanb+9
ワードの問題と言うよりも、解像度な気がする。
メモリと勝負になるけど、解像度上げてみたらどうかな?
0024名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 12:54:37.86ID:untpxQHo
Craiyon基準だからWaifuで使えるか分からないけど
face portrait ⇒ 顔のみ
upper body portrait ⇒ 顔と上半身
full body portrait ⇒ 顔から腰ぐらい、足元まで行くことも
こんな感じの画像イメージわたしは効果あった
portraitのところを別のものにするとかで行けるかも 
0026名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:06:02.45ID:IKLGuAg0
>>23
初心者で申し訳ない……んだけど解像度上げってアップスケールのこと?
それとも--q 5とかのクオリティ上げるってコマンドの事なのかな
0028名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:08:27.92ID:RCTanb+9
>>26
いや、単純に最初に与える画像の大きさ。
まだ実験してないんで、アレなんだけど、単純に64×64以下の面積のブロックが他のブロックとの連続性が無いと崩れるんじゃないかな? と。
だから、引きだと必然的に顔の面積が少ないので描画がまともに実行出来てないんじゃないかなみたいな。
0029名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:11:18.66ID:nrOUqQyg
googlecolabってどの位の性能持ってるんだろう
高性能ならhdや2k4kの自動生成作らせようと思えばできるのかな
0030名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:13:05.98ID:2OMfWC8V
色々試してはいるんだけど顔に張り付く謎の力が働くプロンプトの時に効き目が途端に無くなるんだよね
どうしたもんだか

それはそれとしてportraitをNegativeにするのはアニメ顔にかなり効き目がいいことが分かった

waifu1.2
素(1girl, aqua_hair twintails, aqua_eyes)
https://i.imgur.com/48FJUuI.jpg
Negative portrait
https://i.imgur.com/BOokcDr.jpg
Negative ((portrait))
https://i.imgur.com/kWRFqpP.jpg
Negative ((((portrait))))
https://i.imgur.com/wWEI915.jpg
0031名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:13:38.55ID:vfH3LsoQ
>>22
何をどう練習してるのか知らんけど
1アニメ調ならMJは向いてないから諦めてDiffusionを使う
2取り敢えず同じPromptでEmma Watsonさんにお願いする
 それで崩れなければ、出したい人物の学習量が少ないせいで整わない可能性がある
3崩れるならPromptが論外なので公式のフィードで検索する https://www.midjourney.com/app/feed/all/
0032名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:15:02.63ID:RCTanb+9
+で
NVIDIA Tesla P100(16GB)
NVIDIA T4(16GB)

Pro+
NVIDIA Tesla V100(16GB)
NVIDIA Tesla A100(40GB)

でガチャらしいw
A100引けたら、結構高解像度いけそう。
0033名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:16:21.33ID:06MV2UCy
久々に来たが852話とかいうクッソ陰湿なゴミはそろそろ用済みになりそうか?
0034名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:18:29.48ID:iu1fiXN8
>>29
そもそも元のモデルが512x512用なんで
2048x2048作っても、同じパターンの繰り返しになるだけだったりする
https://www.reddit.com/r/StableDiffusion/comments/x6dhks/fork_for_automatic_memory_allocation_allows_for/
これとか凄い凄い言われてたけど、そもそもこんな画像作りたいか?って
結局、一発でやるのは意味ないので、過剰なVRAMは「今の技術では」必要ない

img2imgのアップスケールは元の整合性あるを拡大してから部分部分で変換させることで上手くいく
そこそこメモリがあれば実現できるし
0035名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:18:57.21ID:NOLXtzv9
>>33
Waifu使いませんでもTrinARTは使いまーす
やばいすごい!
ちなみにTrinARTでもダンボールのタグ使えまーす💕
0037名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:20:24.60ID:2OMfWC8V
>>32
良いGPU引けるまでインスタンスの破棄繰り返すのは違反行為だから気をつけなよ
なんか怪しまれて下位しか割り当たらなくなった人とか居るみたいだし
0038名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:20:29.74ID:untpxQHo
とりさんまは115000stepモデルでてる
キャラ特化モデルも早くリリースして欲しいけど
流石にまんまなキャラでやすいから著作権的に難しいか
0039名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:22:29.11ID:IKLGuAg0
>>28
正直半分ぐらい何言ってるか理解できてないけどありがとう
とりあえず画像の大きさ変えて色々トライしてみる

>>31
ありがとう
適当にハリウッドの有名人とか入れてなるべく実写に近い形で再現できるか練習してたんだけどとりあえずエマワトソンでやってみる
0043名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:26:06.38ID:RCTanb+9
実写ワードだと、濃くて写真がいっぱいあるトランプが一番効果わかりやすい気がするw
あんなの何枚も走らせたら、メンタルブレイク起こしそうだが
0044名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:27:42.34ID:Oqek9AKh
俺はcolabで回しまくってたら嫌がらせのようにロボット確認してくるようになった
操作止めると10秒後くらいに出てくる
0045名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:30:33.53ID:iu1fiXN8
無料colabってブラウザのそのタブを非アクティブにして一定時間でcaptchaじゃなかったっけ?
生成中の表示を眺めながら正座して待っとけと?イライラするんですぐやめてグラボ買っちゃったよ
0047名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:42:58.53ID:6NoPJtis
>>30
そのpromptだと情報が顔に偏るから、体に関する何かを加えるとよいのでは

1girl, aqua_hair twintails, aqua_eyes , blue one-piece dress, black belt, upper shot とか適当に

ttps://imgur.com/a/2xhgS3D
0048名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:53:43.74ID:nrOUqQyg
正常位騎乗位の命令でキャラクター指定をすれば奇形抜きのエロ大量生産んできるプログラミング誰か組んでください!
0049名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:55:26.78ID:X1bXMZ7N
StableDiffusionだけが目的ならグラボ買うよりcolabの方がお得感はある気もする
ちょっとがんばって30万のグラボを買うとすれば
colabなら同じ値段で25年戦える
0052名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:58:21.03ID:RCTanb+9
in xxxxxxって入れて、さらにlong shotとか入れるとかなり引きになる確率上がるよ。
人物入ってる時点で、それなりにポートレートにも重みかかるみたいだけど。
0053名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 13:59:23.23ID:untpxQHo
backgroundみたいな背景こうだよ指定を補足してみるとか

カメラで引きの撮影みたいな用語とかありそうだけどそう言う撮影用語は使えないのかしら
そもそも撮影用語が分からん
0055名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 14:04:12.81ID:Jp9s+Lkb
full body よりはstanding 等の状況説明のほうが全身は出やすいと思う
カメラ引いた都市とかはtop of view 、landscapeとか 怪獣映画みたいな低い視点の引きってのが難しいが
0056名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 14:05:24.34ID:2OMfWC8V
縦長にする、long shotはやったけど効かないのよね
超縦長にしたら見切れ横顔描いてきてブン投げたこともあったり
服装とかも指定してるんだけどどうしても顔に寄る

もちろんseed依存で5%ぐらいは引きの画が出るんだけどこれの収率を上げたい
背景指定するのはあまりやったこと無いからやってみるわ

それでも引きにならないガッチガチのプロンプトで一般にお出しできそうな構文のがあったら今度持ってくるからチャレンジしてみてくれ
0059名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 14:17:13.70ID:iu1fiXN8
aerial view(俯瞰)のつもりだったけど、検索したらyogaのポーズの意味もあるのか

aerial pose of 1girl, aqua_hair twintails, aqua_eyes

でぐちゃぐちゃの人体が出力される
https://i.imgur.com/11p0HFi.jpg
変わったポーズありながら俯瞰にもなってたり、ダブルで効いて全身入る感じか
0060名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 14:18:55.14ID:n7szH/NW
俯瞰はバーズビューがやっぱ鉄板
ただし、鳥混入率も上がる

何でやたらと頭とか肩から羽生えてるエンジェル系率上がるんだろうと思ってたら、鳥だった罠
0061名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 14:19:58.42ID:FCnr3Hbx
Waifuととりんさまでそれぞれ本家SDベースで学習した実写TIとの組み合わせをやってみたけど
とりんさまはいい感じに実写をアニメに落とし込んでくれて使いやすいけど衣装指定とか調整しにくい
Waifuもアニメ調にはなるんだけど実写そのままな中の人が出やすいけど衣装指定とかしやすい

アニメTIもやってみたいけど今ところ全敗なのでノウハウが切実に欲しい
0063名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 14:30:58.81ID:XBkBKrmq
遠景は別々に作って合成した方が早いような気がする
0065名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 14:38:33.72ID:iqorF6m9
髪型指定ができないんだけどみんなどうしてる?
4chanではフォトショでコラしてimg2imgって言われた
0066名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 14:46:00.94ID:6NoPJtis
>>65
ショートボブ short bob hairstyle
三つ編み braid hairstyle
おさげ pigtails
ポニテ ponytail hairstyle

ハゲ skinhead

とか書くだけでは。あれこれprompt付け足すうちに薄まって消えるかもだが
0069名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 15:01:13.80ID:VGMTb1zs
Emadさんインタビュー
https://signal.diamond.jp/articles/-/1407

Emadさんのインタビューなのにタイトルが深津なんてゴミの名前なのはなんなんだ
ダイヤモンド社に深津の同級生でもいるのか?

それはともかく内容はいい

・9月には音声、その後は動画、3D、言語、コードにも対応
 Dream Studioの完全版はアニメーションの作成にも対応する
・すべてをオープンソース化しますが、最新版はまずAPI経由で提供しする
・今は2GB(1.5のモデルサイズ)だが不要なものを取り除くことで100MBにできる
・数週間以内には、Stable Diffusionの独自モデルを構築するためのガイドラインを、クリエイター向けに公表する
 マーケットプレイスも構築していきます。そこでクリエイターは独自モデルで生成したコンテンツや、
 独自モデルの(クリエーターの)特性を他のクリエイターに販売する。
 もしあなたがピクセルアートに特化したモデルを作ったとしたら、ピクセルアートに関するアセットを求めるクリエイターは、
 汎用モデルではなく、あなたのモデルを利用することでしょう。
・StabilityAIが本格的な活動を開始したのは9カ月ほど前
 従業員数は75人で、世界で10番目に速いスーパーコンピューターを保有している
0073名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 15:08:19.86ID:8HzuZr0r
>>71
真正面顔になったときの鼻の輪郭線がおかしい(縦一直線になる)のは、MMDを学習したみたいな感じがする
0074名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 15:09:22.93ID:Wp+FQqeu
greg rutkowskiさん(本物)Twitterフォロワー2万2000人しかいないんだけど
こんなにお世話になってるんだからみんなフォローしたれよ・・・😢
0077名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 15:11:30.83ID:RCTanb+9
Gregさん、近いうちにネットでワシのオリジナル発掘出来んようになるって言ってるみたいね。
0080名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 15:17:25.87ID:rXESnT+m
他の似たような作風の人でもクオリティは上がるけどなんで皆Gregさんを使ってるんだろう
最初期に上手くいったプロンプトだから慣例的に使われてるのかね
0083名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 15:21:48.49ID:Jp9s+Lkb
gregさんは癖がなく使いやすい
他にもサンプル数が多い画家の名前が挙がってるけど
まさにその人の作風、みたいのが強く出てしまって使いにくい。
0087名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 15:32:47.05ID:XBkBKrmq
>>69
倫理とか下らないことを言い出したな
中国勢に負けるぞ
0088名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 15:35:55.68ID:RCTanb+9
有償で自分の絵に特化したモデルを作りますってのはアリだな。
これは魅力感じる人、多いんじゃないかね。
0090名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 15:58:51.76ID:uX3FKjDA
特定の作家の絵柄をコピーしてモデルを売る人が確実に出てくるよな
流石にいずれ問題になると思う
0092名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 16:08:22.98ID:b/Q6G26U
通常のプロンプトにanimeやら色んな言葉入れた後にネガティブプロンプトでanimeを指定してやるとイラスト感強く出るな
0093名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 16:17:02.13ID:T9wkiioe
>>71
それは珠玉の知識だわ
昨日被写界深度が浅くて困ってるって書いた者なんだけど、一撃で回避できる解決策やんありがとう
0094名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 16:19:45.77ID:untpxQHo
特定絵師の本人以外の販売は流石に炎上する程度には世の中の理性を信じたいが……難しいだろうな
0096名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 16:34:11.35ID:2OMfWC8V
midjourneyのnoオプションが便利で~って書いてた人居たけど確かにこれがあると無いとじゃ大違いだな
単純に出したくない物書くだけじゃなく画像から質感まで消し去れるとか強力にも程がある
0097名無しさん@お腹いっぱい。
垢版 |
2022/09/12(月) 16:34:24.64ID:T9wkiioe
Negativeって「,」で区切った先もマイナスの作用が続く感じなんですかね
それだと長文呪文使ってると呪文の再構築が結構大規模になりますね

もしくはPositiveみたいに言いなおせばそこから従来の呪文を再開できる感じ?
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況