X



Midjourney】AI画像生成技術交換2【StableDiffusion

レス数が950を超えています。1000を超えると書き込みができなくなります。
0001名無しさん@お腹いっぱい。
垢版 |
2022/08/22(月) 14:38:25.17ID:Cv/bdJEy
英語の文章が画像に!
背景に使うか?イラストのアイデア出しはもちろん、
与える英文を捏ね捏ねして思いがけず生成される秀逸画像ガチャで遊ぶのも楽しい
有料サブスクで商用利用まで可能なAI画像生成サービス

★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
(他のスレがありますのでそちらに移動してください)

前スレ
【Midjourney】 AI画像生成 【DALLE】
https://mevius.5ch.net/test/read.cgi/cg/1659786388/
0851名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 21:16:15.65ID:zmiqUmaN
>>831
食べ合わせが悪いものを混ぜると作画が大崩壊するね

俺もいい感じのリアルタッチ人物画を出せる呪文にたどり着いたけど
もう少しおっとりした目にしたいなって思って橋本環奈先生を混ぜたらその瞬間世界が崩壊したw
0852名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 21:17:30.35ID:BkACrwDk
拡散モデルってAVのモザイク消しを超大規模にやるみたいなもんって思っていい?
0857名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 21:57:16.35ID:ubryl2ee
AI画像にやっきになっている人の男女比が知りたい
あとSD発表されてからのgoogle colaboの使用率の変化
0858名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 22:13:36.12ID:1Gnup+rr
けっこう公式が中身の解説を出してくれているのが遊びがいあるなこれ
Pythonの勉強兼ねて遊んでるけど変に盛り上がると大手が買収飼い殺しが多いからマイナー文化でいて欲しいわ
0860名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 22:18:23.42ID:i7ddHUUW
これから100社単位で提携して各国語対応その他モデル構築する予定らしい
基盤モデルなんてこれからのど真ん中の技術だから、SDが主流かほかが巻き返すか知らないけどマイナーな訳はないと思う
0861名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 22:19:52.72ID:i7ddHUUW
Dalle、技術的には同じようなもんなんだろうけど、SDはオープンソースでみんなUI改造したりローカルで動かせるから勢いがいいよね
0862名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 22:21:56.59ID:60RqM723
初音ミク抜きミクさん試してみたけど、何回やってもくそでかツインテ描いてくれませんわ
つーかどっとうpって貼れないのね 2862938
0863名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 22:23:10.65ID:bWnmVXgB
DALL-Eはプロンプトに強制的に黒人を出現させるノイズが混入されたりするので使い物にならない
0864名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 22:23:40.93ID:QuNPQemV
大きめ画像はどっとうpをarchive.todayに通せば貼れる
0867名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 22:41:27.89ID:CxPKhoNE
img2img使えそうなcolab漁ってるけど全部setupが上手くいかねぇ
多分俺のやり方が悪いんだろうけど
なんかウェブサイト上とかで簡単に出来るの待つしかねーか
0868名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 23:07:06.62ID:7FoCDxFr
>>862
> つーかどっとうpって貼れないのね 2862938
今時どっとうpて・・削除する予定がないのなら普通にimgur使いなはれ
0869名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 23:15:57.08ID:uSo+PJF0
Midjourneyで女体がサランラップにぐるぐる巻きにされてテカテカしてる画像ばっかり生成してる人見つけちゃった……
あれも性癖なのだろうか
0871名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 23:28:39.34ID:i7ddHUUW
>>865
単調な模様ならプロシージャルテクスチャで作ったほうがいい気がする
文字生成とかもできないし、その辺使い分けはどうしてもいると思う
0875名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 23:40:35.25ID:6+18B8jR
google colabで「GPU使えませんよ」が解除されるのは時間経過ですか? それとも時刻到達でしょうか
0876名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 23:48:10.16ID:CkMkrgMz
クソ遅グラボだしほぼ毎日のアップデートに対応するのもしんどいからローカル環境は見送ってるけど
今は色んな人が改造版を作ってるぽくて、どれがどう優れてるとか一番良いとか全然わからんなぁ…
0877名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 23:48:50.75ID:i7ddHUUW
>>874
追加学習は数枚~でもいけるらしい。Google Colabで3時間程度だとか。
※リンクが貼れないので検索ワード: Stable Diffusionをいらすとやでファインチューニングする

上の日本語のものはいらすとやを学習させてるけど、元ネタの方が自分のペットを学習させて登場させてるので
多分固有名詞を追加できそう
dreambooth.github.io/

試してないから多分こんな感じ?レベルのボンヤリ理解(間違ってるかも)
0879名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 00:02:30.43ID:S01XYd9t
test
0880名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 00:05:11.89ID:8pofGjN6
>>878
これは完成度高い
Greg Rutkowskiすごいなw

いくつかランダムシードでやってみたけどどれも綺麗に出力された。いい呪文だ
0881名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 00:11:34.64ID:adcon1OP
>>878
左上すげえ

先頭に主語入れるだけでそこそこの絵を出せるテンプレをひたすら回すだけになってしまった
もう自動でやってほしい
0883名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 00:58:48.57ID:W3qecD7T
脱がせるとみんな胸がでかいんだけど、小さくするワードってある?slenderとか入れてもバインバイン。
0886名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 01:06:32.58ID:TKZ5Ug6s
>>878
色々やって気が付いたんだけど、意外と短文の方が強いんだよね

呪文は長ければ長い方がいいです的な説明が導入マニュアルに書いてあった気がするんだけど
意外と混ざることで良い要素が打ち消し合う力が強い
0887名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 01:08:06.63ID:adcon1OP
長いと身体とかぐちゃぐちゃになる
0891名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 01:39:49.16ID:hJAn0cka
>>886
多分最初触ったときは自分が出したい画を端的に一文書いて終わりにする奴が多いだろうから
そういう奴へのメッセージなんじゃないかな
効きもしない言葉を数個並べてもそれこそどうしようもないものが生まれるだけだし

>>890
flat chestとでも入れたらどうよ
0893名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 01:51:11.88ID:XY/qzhrx
>>892
一個一個見ていったら三回ぐらい出てくる奴が何人かいて、よくわからんが笑ってしまった
0894名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 01:55:07.21ID:TKZ5Ug6s
>>891
確かに
経験不足の間は、AIに対する説明不足もしくは説明不備のミスが多いやろうしな

多少理解が進んでくると、説明呪文の過剰の害が分かってくると
0895名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 01:55:43.29ID:8pofGjN6
>>892
いいね
digital concept art of anime cute girl in summer dress, detailed eyes, gorgeous face, ((turquoise colored twintail)), smooth details, digital cg art by Greg Rutkowski
k_euler_a, cfg 10, steps 50, seed 721628136

4枚一組で、左端はオリジナル(同じのが3段ある) Original image on the left.

1段目 turquoise -> green -> red  色違い
2段目 twintail -> ponytail -> bun 髪型違い
3段目 summer -> cocktail -> maid 夏ドレス、カクテルドレス、メイドドレス
0896名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 03:35:24.59ID:KUnhJn5S
考えてみると、AIという箱に文字列を打ち込むと絵を出力し、逆に絵をAIという箱に打ち込むと文字列を出力する、というのは、人間の知性の本質を突いてるよな

つまり対象を個別の要素に分解して、それを文字列なりイメージなりで認識するという抽象化能力が人間の認識的知性の本質
絵や文章というのはその個別の要素の組み合わせだということ

統合失調症患者がデティールが奇妙に歪んだ絵を書くのは、彼らが認識的知性において重要な統語能力=抽象化能力を脳機能の障害によって失っているからだろう

また同様に「言葉のサラダ」と言われる全体の繋がりを欠いた意味不明な文字列を口走ったり、他人の思考が流れてくると糖質患者が訴えるのも、同様に抽象化能力に障害があって、適切な言語化やイメージ化ができないからだとおもう

AIに例えるならば、アルゴリズムに奇妙な歪みがあって、APIを通して物体を絵や文字に変換しようとしても、適切に変換できないのが糖質患者なのかもしれない

だらだらと書いたけど、つまり何がいいたいかというとAIすげえな、ということ
0897名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 04:51:18.14ID:3oD6d6E1
もしかしてと思って試したけど5本指の手できなすぎワロタ
苦手ってそういう事じゃないんだよAIちゃん
https://i.imgur.com/pltGnjj.jpg

close up of anime girl hand, ((Five fingers)), digital cg art by Greg Rutkowski
Steps: 20, Sampler: k_euler_a, CFG scale: 7.5, Seed: 1842527531
0901名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 06:33:51.32ID:8pofGjN6
あんまり分かってないけど、画像を学習する時に、例えばこれは

https://i.imgur.com/RZr0oGw.jpg
「白と黒のぶち猫が座ってこっちを見ている」で、「顔が一つ、目が2つ、前足が2本の猫」とはならず、「指が5本」とか効かないのではって気もする
0902名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 06:44:07.66ID:eVfmuvS0
そろそろ3DCG版出て欲しいな
予定とかあんのかな?
0903名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 06:49:18.46ID:z+sZQrGZ
条件わからないけど生ゴミとか生首?画像出力されてビビることある
0905名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 06:52:29.70ID:8pofGjN6
>>43の「今後」のところに書いてるレベルなので、具体的には描いてないけど、3Dも予定あり、ですね

それはそうと今Google Colab混雑でGPU接続できないわ。まいった
0906名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 06:56:30.09ID:vsksoONt
普段使わないと思ってた人達までgpu使い始めたらgoogle悲鳴あげそう
いきなり規約改定が入る事を覚悟してゲーミングPCの準備をしておこう
0907名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 06:56:56.50ID:8pofGjN6
GUItardというか、https://github.com/hlky/stable-diffusionと同等のノートブックが公開されてる

https://colab.research.google.com/drive/1cd35l21ewU0fwWEnPjY_th5YORmMfZCd

ノートブックのUIじゃなくて、WEBサーバーを立ち上げるので、ローカルと全く同じUIになる
*現在バグで、PROGRESSBARSにチェックを入れないと起動できない
*モデルは事前にダウンロードして自分のGoogleドライブに入れる前提

構築にかなり時間がかかるのが欠点だけど、使い勝手的にはこれが一番いいはず。構築も上から順に実行するだけでシンプル。

・・・のはずだけどGPU接続できないから確認できないw
0910名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 07:04:56.47ID:tcfKhZjr
3 animals って入れるとすごいキメラが出てくるぞ
普通にキモいので閲覧注意
0912名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 07:18:40.85ID:E2pAsSUt
ファインチューニングしたモデルは簡単に配布できるから
そのうち各作家や作品毎のモデルもアングラで配布されるようになるんだろうな
予想より進化の速度やばいわマジでパンドラの箱が開いた
0913名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 07:28:13.29ID:y65qW5Ek
>>875
>671に「12時間だっけ」とはあるが確証なし
0916名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 07:36:42.48ID:8pofGjN6
あんまり分かってないけどファインチューニングって、例えばだけど「tanaka mamimi」の画像を数枚追加学習させると、
waterpaint, tanaka mamimi みたいな生成ができる、「reiji matsumoto」を学習させると、authored by reiji matsumotoが
できるになる、みたいなことかな?

既に、hlkyにtextual inversionとしてコードある。これもわからないけど、学習自体はhttps://github.com/rinongal/textual_inversion でやって
他でやると書いててできたembedding.ptを hlky版で使えるようにするみたいな機能なのかな?
https://github.com/hlky/sd-enable-textual-inversion


後別の話でhlkyはDocker関連ファイルも8時間前に用意された。
hlky勢いすごい
0917名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 07:47:52.45ID:06X0KUe/
ぶっちゃけ全く触ってこなかった分野なのでこれから色々学習していかないとなんだけど、スクリプト言語はPythonを勉強すればいいのかな?

ネットで他人が書いてるノートをコピーして実行は出来ても、自分でこういうことを追加したい、と思ってもうまくいかなくて
0918名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 07:49:18.75ID:3oD6d6E1
>>916
大体そうっぽい
SDが学習できてない要素をピンポイントで補う自作モデル みたいな
ちょっとやったくらいじゃ要素の一部を学習する程度だから今すぐどうこうってもんでもないと思うけど
0919名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 07:51:04.37ID:8pofGjN6
Emadさんのツイート
100MBってモデル(ckpt)がってこと???? 使用メモリはどうなんだろう

---
@EMostaque
#StableDiffusionは最終的に100メガバイトになり、最適化が進むと信じています。
今週は楽しい発表があります??。
あと6日...

For what it’s worth I believe #StableDiffusion will eventually get down to 100 megabytes, loads of optimisation to come.
We have some fun announcements this week coming ??
Already amazing to see what everyone is creating, we are going to accelerate that.

6 days in…
0920名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 07:56:31.39ID:8pofGjN6
>>917
言語はPythonだね
「やりたいこと」がなにかで、追加で色々勉強しないとだめだったりすると思うけどまずはPythonはいる
0922名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 08:11:56.51ID:1ZR01qcj
>>916
新しい機能を取り入れるスピードが速いから
hlky版に参加する開発者も増えてるね
0925名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 08:24:34.59ID:E2pAsSUt
img2imgは少し複雑な構図や服装になるとAIが全然理解できなくて
滅茶苦茶な絵を出力してくるからまだまだ限界があるのは感じるな
0926名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 09:55:00.70ID:8ac36usK
これは久しぶりに伽藍とバザールの対比が炸裂したソリューションだな
象牙の塔で研究されてたものがOSSにされた途端ものすごい勢いで進化していく
0927名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 09:55:37.93ID:q6r8reZ9
>>905
3Dの予定あんのね
サンクス
0928名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 10:17:25.44ID:rT/h5pqx
https://zenn.dev/hidetoshi/articles/20220731_pytorch-m1-macbook-gpu
MacBook Pro M1 Max のディープラーニング性能
※StableDiffusionじゃないけど同じPytorchの性能

CPU: 訓練時間 2148秒 テスト時間 90秒
GPU(MPS) 訓練時間 286秒 テスト時間 45秒 → 訓練4.6倍、テスト時間2倍高速化

Geforce 1080Ti:
訓練時間 55秒 テスト時間 1.3秒 → M1 Maxより訓練5倍、テスト35倍高速

2世代前、もうすぐ3世代目になる1080Tiよりも、M1 Maxは桁違いに遅い。意外だった
0931名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 11:05:42.71ID:uO71QwtQ
>>928
コスパ段違いやな
MAX搭載Macとか糞高いし
0934名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 11:07:18.19ID:uO71QwtQ
自作詳しくないから知らんけど1080TiのPCとか下手したらディスプレイ込みで10万以内で作れるんちゃうの?
0935名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 11:08:12.74ID:E2pAsSUt
>>932
キッズに悪用されまくるのが目に見えてるわw
今はまだ最低限のリテラシーある層しか利用できないから大きな問題になってないけどさ
これから一般層に降りてくるとやばいよな
0937名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 11:20:05.54ID:6+Vx5IWt
確かに1080tiってそんなに高額でもないな
メモリが多ければいいって話だし まあ今後最適化でまた違ってくるんだろうけど
0938名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 11:33:05.29ID:hJAn0cka
RTXからTensorコアが乗ってPytorchが加速されてるから
RTX2060でも1080Tiのさらに倍の推論性能
今コスパで行くなら2060 12GBがいい感じ

とはいえモデルの精度変更や刈り取りや圧縮が進んでいるので
今のVRAMこそ正義な状況がいつまで続くかという話だけれども
0939名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 11:42:43.27ID:E2pAsSUt
内部の計算速度に比べてメモリの入出力は極端に遅いから
今後もVRAM容量の節約と速度はずっとトレードオフの関係だろうけどね
出来るだけメモリに詰め込んで読み書き減らすのが正義なのは変わらない
0940名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 11:49:26.25ID:n8fO39XV
早く1024や2048サイズがメモリ4GBくらいの古代グラボでも数秒で出力出来る時代になりますように…
0941名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 12:09:02.17ID:TrEphkRn
>>928
M1はニューラルエンジン積んでるけどそれに最適化したらまた変わってくるんじゃない?しらんけど
ゆうて単体GPUはやっぱ強いよな
今はmacだけど結局ゲーム用にWinも併用してるわ
0942名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 12:09:16.82ID:E2pAsSUt
拡散モデルがアニメ絵やデフォルメ絵が苦手なのは確かだけど
それでもサンプルが豊富なドラゴンボールやポケモンはある程度学習出来ているから
萌え系が上手くいかないのはサンプル不足の影響もかなりありそう
AIは抽象的な男とか女とかは学習できなくて○○さんの描く女の子やドラゴンボールの孫悟空みたいに
具体的に指定しないと駄目だから萌え系は作品のサンプル数が圧倒的に足りていないんじゃない?
0944名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 12:24:12.69ID:0tWLLoMd
ドラゴンボールやポケモンは比較的画風が統一されてるけど、美少女イラストは人によって目鼻口のバランスが違う上に下手なのも混ざってるからな
0945名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 12:29:23.97ID:nqEfck//
ロボポン乳を許容する人もいれば許せない人もいるからそこら辺のバランスは顔に限らず難しい問題
0947名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 12:33:32.34ID:KdHuREsK
>>936
AIの描いた絵をAIが学習して
どんどん奇形化していきそう
0948名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 12:34:42.55ID:hJAn0cka
Rutkowski居なかったらStableDiffusionの評判が一段下がってるまである
Rutkowskiに足向けて寝られないわ
0949名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 12:38:42.40ID:Fb4Mj0XF
hlky版をVRAM4GBで動かせた
省メモリ版basujindalのturbo設定も実装されたから高速実行できる

方法は >>825 に加えて
scripts\relauncher.py をテキストエディタで開いてこのように追記する

python scripts/webui.py

python scripts/webui.py --optimized-turbo
0951名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 12:45:36.35ID:adcon1OP
>>942
> ポケモンはある程度学習出来ている
いや俺の経験じゃポケモンダメダメなんだけどどうやってる?
レス数が950を超えています。1000を超えると書き込みができなくなります。

ニューススポーツなんでも実況