Midjourney】AI画像生成技術交換3【StableDiffusion

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 17:36:26.27

英語の文章が画像に！
背景に使うか？イラストのアイデア出しはもちろん、
与える英文を捏ね捏ねして思いがけず生成される秀逸画像ガチャで遊ぶのも楽しい
有料サブスクで商用利用まで可能なAI画像生成サービス

★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
（以下のスレッドへ移動してください）
AIイラスト　愚痴、アンチ、賛美スレ
https://mevius.5ch.net/test/read.cgi/illustrator/1661305344/

前スレ
Midjourney】AI画像生成技術交換2【StableDiffusion
https://mevius.5ch.net/test/read.cgi/cg/1661146705/

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 17:37:42.05

■関連リンク
【Midjourney】 https://www.midjourney.com/
【StableDiffusion】https://stability.ai/
【DALL・E2】 https://openai.com/dall-e-2/
【craiyon】（旧DALL・E・mini） https://www.craiyon.com/

英語スキルはあるといいですが、別に今時なくても何とかなります
【Google翻訳】 https://translate.google.co.jp/
【DeepL翻訳】 https://www.deepl.com/translator

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 17:38:33.20

StableDiffusionの人の他社製品比較

https://twitter.com/EMostaque/status/1561349836980584455
・StableDiffusion、DALLE2、midjourneyは全て異なるものだ
・この分野は、去年（2021年１月）にOpenAIがCLIPを公開したことで始まった
　これにより画像生成のガイドが可能になった

●DALLE2
　・モデルかつサービス。インペインティングは最高の機能だが、ランダムなのでアイデア出しやより企業的な用途に最も適している。
　・来年にはコストが１０分の１以下になりAPIも公開されると思われる
　・トレーニングデータは著作権のあるイメージなので、オープンソースにはならないと思だろう
●MidJorney
　・VCの資金提供を受けたベンチャー、ではなく研究所
　・非常に独特な絵画のようなスタイルを持っている
　・一貫性に膨大な労力が必要。ランダム性が強いがある程度コントロールは可能
　・オープンソースとそうでない部分がある。
●StableDiffusion
　・アートからプロダクトまで、あらゆるタイプのイメージに対応する一般的な基礎モデルでもうすぐリリースされる
　・まもなくDreamStudioプロシューマーサービスを発表する
　・今まで皆さんが見ていたものベータ版のモデルテストから得られた生の出力で、前処理も後処理も行っていない
　　これらを使うことで格段に良くなり、きめ細かいコントロールに力を入れた
　・オープンソースのモデルなので、誰でも使うことができる。コードもデータセットもすでに公開されている
　　そのため、誰もがこのモデルを改良し、構築することができる
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 17:39:08.56

【ツイッター】
https://twitter.com/hashtag/midjourney
https://twitter.com/hashtag/dalle2
https://twitter.com/hashtag/stablediffusion
こんなのができます

【Midjourneyお役立ち情報】
https://github.com/willwulfken/MidJourney-Styles-and-Keywords-Reference
調べてみたら使いやすいPrompt wordはここに全部まとまってたわ
https://docs.google.com/spreadsheets/d/10i9Ip8tVSERAuMWbc6-H6BUFCoUGOQ91YzDvX--c4bk/edit#gid=0
各アーティストのまとめ
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 17:40:01.08

テンプレはとりあえずそのままにしました
「これ入れて」がいろいろあると思うので>1へ提案しておいてください

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:05:58.48

StableDiffusion各種

●ローカル環境用
公式 https://github.com/CompVis/stable-diffusion
basujindal版 https://github.com/basujindal/stable-diffusion （省メモリ・WebUI有・フィルタ解除済み）
hlky版 https://github.com/hlky/stable-diffusion （一番人気・WebUI有・フィルタ解除済み）
GRisk版 https://grisk.itch.io/stable-diffusion-gui （GUI・DL→解凍→実行だけ）

●Google Colab用
公式 https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb
https://colab.research.google.com/drive/1AfAmwLMd_Vx33O9IwY2TmO9wKZ8ABRRa
フィルタ解除版 https://colab.research.google.com/drive/1jUwJ0owjigpG-9m6AI_wEStwimisUE17

●ウェブサービス
Demo https://huggingface.co/spaces/stabilityai/stable-diffusion
Demo https://huggingface.co/spaces/huggingface/diffuse-the-rest
DreamStudio http://beta.dreamstudio.ai/

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:11:50.56

ついにイラストレーターの絵を学習させて似たようなイラストを作るAIが現る　
https://greta.5ch.net/test/read.cgi/poverty/1661760616/

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:15:58.49

>>1
乙！

hlky＆980ti（6GB）で念願の512x512いけたー！
webui.py他更新してるの気付いてなかった、頻度が凄すぎる、教えてくれた人ありがとう
--optimized-turboで速度3割増し、面積で8割増し、えらいこっちゃ！
--optimizedだけならなんと640x640までOKだったよ、速度めっちゃ落ちるけど
これ上位GPU持ってる人はかなり解像度上げられるんじゃ・・

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:31:54.02

たて乙

現時点で、最もよい導入方法（ローカル）やcolabとかもまとめてあったら便利だろうけど、
最適な方法が流動的すぎて無理だよなぁ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:37:44.98

誰か燃えてるミミックの画像つくってｗAIでｗ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:43:33.07

まとめ情報書き込みたいけどNGワードで書き込めない。なにが引っかかってるんだろう？

とりあえずファインチューニング(textual inversion)メモ

追加で自分のペット画像などを学習させて登場させることができる
・流れとしては画像を学習させembedding.ptを作る　→　それを--embedding_pathで指定する　→　プロンプトで指定する

・利用時はptファイルを --embedding_pathを指定すればOK。
(ldm) ~/stable-diffusion$ python3 ./scripts/dream.py --embedding_path /path/to/embedding.pt --full_precision

・追加学習させたものはそれぞれ、トークンプレースホルダーを割り当てる必要がある（*、@、・・・など）
　利用時は例えば"In the style of * , <other text>"となる。
　これは使い勝手が悪いので hlkyは、分かりやすい単語とプレースホルダーのマッピング設定を検討中
　https://github.com/hlky/sd-embeddings　ここにはアーニャ、tomokoの学習データがある。

・他にも既に学習データをテスト公開している人がいる。 Usada Pekora 5枚の学習に3090で１時間
　https://sd-textual-inversion-models.tumblr.com/

・学習方法
　https://github.com/hlky/sd-enable-textual-inversion
　Stable Diffusionをいらすとやでファインチューニングする

まだ情報がまとまっていないのでハードル高そう。full_precisionじゃないとダメなのかな？

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:44:01.16

>>9
書きたいけどNGワード連発されすぎて心が折れたｗ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:45:29.98

ぶっちゃけ飽きてこないか？

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:48:28.31

とりあえずcolabで動かしたい人はここがおすすめかも
コマンドは公式のリンクと同じ。hugging face とかの部分が最初わかりにくいかも
https://zenn.dev/k41531/articles/2459bbbe8e5cf3

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:51:08.34

>>13
最初だけだよな楽しいの

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:51:29.03

NGワードはすぐわかっちゃうと荒らしが対応するから秘密らしく、条件はよくわからない
「5ch ngワードサンプル集」で検索してみて、日本語アドレス酷いから貼らないけど
微妙に変えたり、2レスに分割するしかない

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:57:48.55

MANGO板で絞り込め

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:03:55.25

Stable Diffusion hlky版の構築手順

１　https://github.com/hlky/stable-diffusion/archive/refs/heads/main.zip をDLして展開する
　　Git使える場合更新に追従しやすいcloneの方が良い
　　git clone https://github.com/hlky/stable-diffusion.git
２　https://huggingface.co/CompVis/stable-diffusion-v-1-4-original で登録・同意して
　　モデル(sd-v1-4.ckpt)をDLして model.ckp にリネームして models/ldm/stable-diffusion-v1/ に置く
３　minicondaをインストールする
　　https://repo.anaconda.com/miniconda/Miniconda3-latest-Windows-x86_64.exe
４　webui.cmd　を実行する
５　http://localhost:7860/　をブラウザで開く

●以下はオプション
1. GFPGAN（顔補正）の有効化
https://github.com/TencentARC/GFPGAN/releases/download/v1.3.0/GFPGANv1.3.pth
をDLして src/gfpgan/experiments/pretrained_models/ に置く

2. RealESRGAN（高解像度化）の有効化
https://github.com/xinntao/Real-ESRGAN/releases/download/v0.1.0/RealESRGAN_x4plus.pth
https://github.com/xinntao/Real-ESRGAN/releases/download/v0.2.2.4/RealESRGAN_x4plus_anime_6B.pth
をDLして src/realesrgan/experiments/pretrained_models/ に置く

3. 省メモリ化
scripts/relauncher.py をテキストエディタで開いてこのように追記する
python scripts/webui.py
↓
python scripts/webui.py --optimized-turbo

上記の原本（英文）
https://github.com/hlky/stable-diffusion
他の解説（英文）
https://rentry.org/GUItard

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:12:06.94

Stable Diffusionの人、Crypto界隈をめっちゃ煽っててワロタ。
・SDのように分配強化されたインテリジェントなインターネットが真のWeb3/メタバースと言える
・最初から価値があれば(トークンのような)経済的インセンティブは不要
・ETHマージ後は不要になった全てのGPUで美しい画像や音を作るだろう
https://twitter.com/blog_uki/status/1564122819151032320?s=21&t=4aFlC0UNkMiRV64jPxMGjw
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:13:01.86

NGワードは単純にリンクURLが引っかかってたりとかではなく？

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:14:11.89

●StableDiffusionの情報ソース等
・Discord https://discord.gg/stablediffusion
・中の人のtwitter https://twitter.com/EMostaque
・海外情報reddit https://www.reddit.com/r/StableDiffusion/
・https://rentry.org/GUItard　環境構築情報は hlkyの方が早すぎて追いついてないので>>18を見たほうが良いが、その他TIPSは有用情報あり

・今後
　・モデル v1.5の公式ツイートあり。８月２９日時点で６日後（＝9月4日予定）。100MBになる！？
　・アニメ用モデルの公式ツイートあり（8/24のツイート　”すぐ"）
　・来月(=９月）は”audio"モデル、その後3D、ビデオ予定（時期不明）
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:18:48.10

StableDiffusion TIPS
●性能など
・画像生成時間は、解像度、step数、サンプラで違う。他のパラメータは多分あまり影響はない
　サンプラの差は大きい。k_euler_aとk_heunでは２倍差
　k_euler_a 、k_euler、DDIM、PLMS　＞　l_lms ＞ k_dpm_2_a、k_dpm2、k_heun

●ハード
・ローカル動作性能　https://i.ibb.co/yd7SZ32/chartthin.png 出典：https://rentry.org/GUItard
・K80(24GB)めっちゃ安いんだけどあり？　→　古いからStableDiffusionが使ってるPytorch動かない
・複数GPUにすれば高解像度にできる？　→　多分無理。複数GPU並行実行すればその分高速にはできる
・高解像度にしたい　→　3090(24GB)でも1024x1024無理。RealESRGANで高解像度化したほうがよさそう

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:24:29.39

MJはもう別スレがいい？ここじゃあまり語られないし

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:24:36.38

>>22
> 　サンプラの差は大きい。k_euler_aとk_heunでは２倍差
> 　k_euler_a 、k_euler、DDIM、PLMS　＞　l_lms ＞ k_dpm_2_a、k_dpm2、k_heun

し、知らなかった・・
「生成時間は」で不等号だから、当然k_euler_aが長くて、k_heunが短いんだろうけど
一応（遅）←・・・・→（早）みたいなのあったほうがわかりやすいかと

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:28:27.11

>>23
一緒でよくね
スレの流れが早いわけでもないから下手に分散させたら過疎るだけかと

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:30:25.84

>>24
「時間」じゃなくて、速度でした・・・
hlkyで、it/s = コンソールでのit/s表示. sec per image = ブラウザ上での生成時間情報。2080Ti

k_euler_a 7.76 it/s 6.84s per image
k_euler 7.68 it/s 6.87s per image
DDIM 7.59 it/s 6.9s per image
PLMS 7.50 it/s 6.95s per image

l_lms 5.89 it/s 10.08s per image

k_dpm_2_a 3.95 it/s 13.0s per image
k_dpm_2 3.91 it/s 13.16s per image
k_heun 3.91 it/s 13.12s per image

進歩が速いのであくまで現時点。ただ結構違う可能性がありますよ、ぐらいですね

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:32:33.25

k_euler_aはSampling Step 20くらいでいい感じになるのでなお早くできる

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:33:33.24

--turboの効果凄いな、ちゃんとメモリ節約出来てるのにオリジナル版並の速度が出る

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:36:30.39

img2img、バリエーション起こすのにいいわこれ
この用途だとscaleとstrength中間でスタートで様子見して、下手に大量にワード入れるより数ワードに絞った方が暴走せずいい感じになる

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:39:43.35

>>27
18で大丈夫

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:47:54.82

>>26
めっちゃ参考になる、ありがとう

>>27
これだね
https://twitter.com/Ethan_smith_20/status/1562644246150418432
https://pbs.twimg.com/media/Fa-gppeXoAAYpQH.jpg
redditだけど直画像貼れないので小さめのこっちでいいや
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:51:15.79

法律、権利関係の議論は熱くなりそうで別でやって欲しいんだけど、このサービス、技術的にどのぐらいのレベルなのか気になる

https://illustmimic.com/en/
本日、イラストレーターさんの絵の特徴を学んでイラストを生成するAI サービス mimic（ミミック）をリリースいたしました！
２回までイラストメーカー（イラスト生成AI）を無料で作成できますので、ご自分のイラストを学習させたい方は是非ご利用ください！

mimic（ミミック）では15枚?30枚程度のキャラクターイラストをアップロードすると、自動で顔部分を切り取り、
AIが特徴を学んでイラストを生成します。規約によりご自身が描いた画像のみアップロード可能ですのでご注意ください。

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:53:40.67

https://gigazine.net/news/20220829-diffuse-the-rest/

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:02:09.48

img2imgは構図維持するよりstrengthを大きくして
元画像は言葉で表現できない細かな情報伝えるのに使ったほうが面白いな
例えば手前のオブジェクトはくっきりで遠景だけぼかすみたいな指示も簡単にできる

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:04:17.39

>>34
Loopbackはやってる？
Strengthを0.2～0.3ぐらいにしてLoopback Batchを5回とか10回かけると構図維持したまま細部だけ変形していくよ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:09:08.05

>>26
ちな980tiの「a dog 512x512 cfg 7.5 step50 k_euler」で
hlkyの--optimized-turboで1枚＝1分32秒（0.54it/s＝1.84s/it）だったよ・・14倍差て、2080tiってそんな早いのか
AI画像は結構数撃ちゃ勝負みたいなところあるので、やっぱ高性能GPUは強いなぁ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:13:39.45

日本昔ばなしの絵を画像生成AI「Stable Diffusion」に描いてもらいました。

「桃太郎」
https://www.youtube.com/watch?v=uJVlrErpFXE

「かぐや姫」
https://www.youtube.com/watch?v=vr5i7EIbx48

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:14:05.70

>>32
今挑戦しようとしたら(もちろん自分が描いたやつね)処理に9000人待ちで生成どころじゃないのでなんとも言えない

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:21:17.66

>>32
waifulabsとかThis Anime Does Not ExistとかCreative AIとか
あの辺と同じ技術なんじゃね？
こいつらは雑多に食わせたモデル使ってるが学習データを特化すればできそう

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:26:00.47

はつねみくできたかわいい
https://i.imgur.com/j4Kqb4X.jpg

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:26:48.25

>>40
絵心あるように思えてしまうのが凄い

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:28:58.53

>>26 >>26
RTX2080でoptimized版に--turboでddim 50step 512×512 1枚あたり7.5秒だな
2080Tiと殆ど変わらないとは思えないんだが --turboで何か処理を間引いてるのか？

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:37:20.43

>>38
9000人はすごｗ
mimicの運営の会社、前からAI画像生成サービス色々やってる会社みたいだけど、
Midjourney、SDブームで注目度が高いところに発表したからプチブレイク（ちょい炎上気味）してる感じ

学習めっちゃ時間かかるのにオンラインサービスでやって採算大丈夫なのかな？
と思ったらまだ有料版の料金は書いてなかった

>>42
1割差ならそんなもんかも？
ディープラーニング性能どれがどのぐらい差があるのかよく分からないので、
ちゃんとしたベンチマークが欲しい

2080Ti　→　3090Ti　で性能2倍、今後出る4090は、更に2倍（予想）。速いGPU欲しくなる

StableDiffusionもバージョンアップで性能上がっていきそうですが

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:45:10.83

初音ミクは前スレのこれがめっちゃ良かった
turquoise colored twintail、とGreg Rutkowski みたいなキラーワードを見つけると高品質が担保されて、追加ワード微調整できる感じ

https://i.4cdn.org/g/1661704624784564.jpg
digital concept art of anime cute girl in summer dress, detailed eyes, gorgeous face, ((turquoise colored twintail)), smooth details, digital cg art by Greg Rutkowski
k_euler_a, cfg 10, steps 50, seed 721628136

１段目 turquoise -> green -> red　　色違い
２段目 twintail -> ponytail -> bun　髪型違い
３段目 summer -> cocktail -> maid　夏ドレス、カクテルドレス、メイドドレ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:50:05.21

SDは既存アニメキャラは意図的に出ないようにしてるみたいでそういう用途ならdalle miniのほうがええね

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:56:04.90

前スレの
> でも3090TI(24GB)でも960x640、もしくは896x896が限界、らしい
これ--optimizedだったら1024x1024行けるかな？

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:00:44.38

Craiyonのanimeエンハンスモデルが3090のシングルで数時間学習しただけで
あの性能なの見るとSD公式のアニメモデルが来ると凄いことになるのかもな

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:01:30.47

>>45
そこだけ妙に節操があるのはなんでなんだろうな
著作権なんて便所の糞と一緒に流しちまえとしか思ってない連中なのに

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:02:32.32

まだデータ集まってないけどベンチマーク
https://github.com/hlky/stable-diffusion/wiki/Benchmarking

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:14:50.14

どのみちSDでは縦横両方が512を超えると途端に破綻しやすくなるから後から超解像度したほうがマシ
MJの高解像度出力ってどういう仕組みでやってるんだろう？
あれがSDに降りてくれば凄いんだが

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:18:44.13

512x512で作ってから
同じプロンプトでimg2imgの1024x1024低Strengthかけるなんていうやり方もあるらしい

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:32:53.11

逆に絵から「このテキストで作る絵に近いですー」って出してくれれば
好みの絵つっこみまくったら共通ワード出せるのか

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:32:56.71

>>46
3090持ってないけど、11GB VRAMで --optimized-turbo　1024x640がいける。この時VRAM 10570 MB(95%)でほぼ限界。
オプションなしだとクラッシュする。
turboなしの--optimizedだと、VRAM 10774MBで変わらない（何故か若干多い）→ 遅いし現時点turboなしは意味がなさそう。

VRAM消費量が解像度比例なら、24GBあれば1024x1280いけそうな気がする

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:36:59.23

>>36勘違い、実験中で-turbo入れ忘れ
0.78it/s＝1.27it/s、約10倍差だった
（どうでもいい情報ごめん）

>>51
今それ試してるんだけど、ボケちゃって詳細が生成されるわけでもなくいまいち
ESRGanと変わらないというか・・strを0とか0.01、0.05、0.1とかいろいろやってみたけど
MDでいうlightでないupscaleみたいなのが欲しかったんだけど
大元の生成時の画像とseedと呪文等全部ちゃんと記録しといて、-turbo外して大きいのを作り直しとかがいいんじゃないだろうか

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:37:38.43

>>48
むしろ逆だよ
「なんかカッコいいアニメのポスター」で既存のアニメの絵が出てきたら使いにくいじゃん
フォトストックみたいに気軽に使えるものが欲しいんだろう

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:43:57.09

>>52
自分は試してないけど、画像から認識されたテキストを出してくれる CLIP Interrogator というものはあるよ
https://zenn.dev/knok/articles/cef8ee0697a040
https://colab.research.google.com/github/pharmapsychotic/clip-interrogator/blob/main/clip_interrogator.ipynb

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:46:10.20

>>53
最初から12GBとか大きいのには効果低いってことなんだろうか
あくまで小メモリ雑魚GPUへの救済

> VRAM消費量が解像度比例なら、24GBあれば1024x1280いけそうな気がする
ぐへへへ・・3090tiいっちゃうか？BTOで60万とかするけどｗ
解像度比例と思って面積範囲内で1:2くらいの縦長にしたらOut of memoryだったりしたのでよくわからない
まぁあんま正方形から外しちゃうとAI的に意味ないのでアレだけど

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:47:53.47

やっとGoogle ColabでGPUつかめた。

Google Colabで hlky同等。つまりNotebookで使うのではなくGradIO WebUIが起動するノート
https://colab.research.google.com/drive/1cd35l21ewU0fwWEnPjY_th5YORmMfZCd
事前に自分のGooglde Driveにmodel.ckptを配置しておく前提だけど、それ以外は上から順番に実行するだけでOK

起動がかなり遅いのがデメリットだけどWeb UIはやはり便利

こちらも同じくhlkyのGoogle Colab版。試してないので違いは分からない（動くかも未確認）
https://github.com/altryne/sd-webui-colab

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:53:37.99

例の炎上サイト、Tesla P100×1台分程度のリソースしか用意してないな
逆に言うと殆ど個人の趣味レベルの会社でもあんなサービス作れる時代なのか

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:54:30.29

貧弱なローカルPCでやってたらMJって凄いことしてるよなぁってヒシヒシと・・

①呪文を受けて512x512を4枚作って、半分のサムネにしてgrid表示
②upscale依頼を受けて1枚を1024x1024に同seedで「作り直し」で情報増加
③さらにupscaleで2048x2048化、これも作り直しで情報増加

②や③を同じ画像に対して繰り返すと内容が微妙に変わってたのが何なのかよくわからないけど

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:58:09.87

>>56
凡人の考えなんて３周遅れなんやね……、情報サンクス

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:04:58.37

AI勉強するか、と思ってサイト検索して、Python基礎、微分、線形代数、この辺まではまあ高校数学だから、そういうのあったなーでいいけど
行列偏微分のあたりでんんん？？？となって確率統計で時間かかってる。道は遠い

俺どうやって大学卒業したんだろう・・・。やっぱ勉強大事

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:06:02.96

>>59
画像ちっちゃいし顔だけだからじゃね

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:08:34.26

>>58
ちらっと中身見ただけだけど2個目の方はアクセスするためのパスワードかけられるっぽいね
別にアクセスされたからってそんなに困ることもないだろうけど気になる人はそっち使うといいかもしれない

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:13:25.30

>>60
かなり運用コスト高そうよな
微妙に変化するのはSDで言うところのi2iしてCFGを弄るイメージ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:17:21.62

anatomical chart(人体解剖図)という
入れると人体が正確になる代わりにやけに生々しくなる劇薬みたいなワードを発見した
あと真正面向く

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:17:47.43

>>60
MJは従業員10人の零細企業だけど有料プランの料金体系はawsオンデマンドの料金を超えないように設定されてて
既に利益は出ていると、そして常時エクサスケールのリソースが消費されている
地球シミュレータの数十倍となる計算量だけどawsなら金さえ払えばいくらでもリソース使えるから零細企業が
いきなりこんなマシンパワ―使えてしまうという凄い時代

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:21:46.52

>>62
AIの何やってるか知らんけど深層学習の原理は普遍近似定理
フーリエ解析や関数解析を勉強してないと定理の証明は理解できんぞ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:32:21.36

流速すげーなこのスレ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:38:23.03

AI、最初はおもろかったけどミミックだっけか、あそこまで露骨なの出てくると完全に無法地帯と化してきて引くわ
イラストレーターは今後自分の絵に転載禁止の他にAIへの出力及び学習禁止みたいな項目も書く必要が出てくるねぇ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:40:03.41

>>66
ヴィンチ村のレオナルドさんですか？

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:43:43.05

>>70
ここは技術交換スレだからそういうのはこっちでね
https://mevius.5ch.net/test/read.cgi/illustrator/1661305344/

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:44:04.77

ミミックの話題はこっちでよくね？スゲー盛り上がってて笑う

AIイラスト　愚痴、アンチ、賛美スレ
https://mevius.5ch.net/test/read.cgi/illustrator/1661305344/

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:45:58.43

あんなありがちな顔だけ生成マシンがここまで荒れるとは

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:50:36.98

hlkyにDokcerファイル、docker-compose.yml他が追加されて、Windowsでもdocker compose updだけで使えるぽい
https://github.com/hlky/stable-diffusion/discussions/93

WindowsのDocker Desktop って NVIDIA GPUの準仮想化に対応してんのね。知らなかった。
便利そうではあるけど、なんかトラブりそうで誰か人柱が欲しいｗ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:06:18.19

>>74
規約だと生成マシンのために用意する画像は自筆のものだけってことになってるけど
絶対他人の書いた画像をぶちこむ奴らが湧くから絵描きは普通に警戒すると思う

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:17:14.73

どのみちファインチューニングしたファイルがどんどん配られるようになるから反対しても無意味だよな
配布されてたぺこらの奴はまだまだ…って感じだけど品質の向上はどんどん進むだろうしな

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:18:47.75

>>64
って書いたけど実際動かしてみたらなぜかパスワード機能しなかった
webui.py書き換えて直接パスワード指定したらできたから結局どっちでもいいかも

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:25:26.62

この板にもAI愚痴スレ立てた方がいいの？
物申したいだけなら余所でやってほしいんだけど

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:32:15.28

賛美を抜いた愚痴アンチだけのスレが欲しい
または賛美スレもこの板に立てるとか

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:32:18.72

>>50
> どのみちSDでは縦横両方が512を超えると途端に破綻しやすくなるから後から超解像度したほうがマシ
> MJの高解像度出力ってどういう仕組みでやってるんだろう？
あの1024化は謎すぎる
前に縦長1:2で全身出そうとしたら最初の4枚の時点で破綻してたから、そんな凄いことはやってないとは思うけど

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:33:31.85

賛美がCG板で
愚痴アンチが向こう完走次第イラストレーター板
でいいんじゃないかな
板の特性的にその方が住み分けできる気がする

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:34:35.34

midjourneyが期間限定で--test,--testp,--creativeオプションを実装してるね

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:34:35.86

ID:l6B+4duJ

>>1
★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
（以下のスレッドへ移動してください）
AIイラスト　愚痴、アンチ、賛美スレ
https://mevius.5ch.net/test/read.cgi/illustrator/1661305344/

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:41:27.63

>>83
また定期的に期間限定やりやがってくやしい・・でも

> 1) A general purpose artistic mode you can use by typing --test
> 2) A photo-realism mode you can use by typing --testp
> If you want it to be more creative type --creative after your prompt

https://twitter.com/ro1was/status/1564256480701730816
マジかって感じ
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:43:39.19

いいんじゃなかろうか

https://i.imgur.com/kfTChZg.jpg

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:44:33.14

>>86
ほくろ
鎖骨にも見える服のシワ？
えっち！

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:45:39.73

https://twitter.com/kohya_ss/status/1564253194644992000
ねんどろまで・・
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:48:21.08

midjournyはこの先きのこれるのか？

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:49:16.88

手軽なAIで生き残れるでしょ
スマホでも出力できるし

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:49:24.96

Google Colabで現在のサンプラーを確認したりサンプラーを指定したりするのはどうやればいいのかしら

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:50:03.67

MDのtest、girlって入ってても結構な確率でオッサンとか出るな

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:56:07.08

midjourneyて適当に単語入れてもなんかいい感じ（雑！）になるけどあれってどの段階でどんな感じに調整してんだろ（あやふや！）

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:58:34.01

MJの勝手にいい感じになるのが面白いし、本来の創作からはかけ離れてるなとも思う
たまたまこんなの出たぞ！って自慢する遊びって感じ
「俺が考えて台を選んだからパチンコで勝ったぞ」みたいなレベルの

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:59:06.57

作成した画像だけで指定したプロンプトってわかったりする？

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 00:04:36.88

人間には無理だと思います

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 00:05:46.88

>>95
>>56みたいな？

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 00:10:06.04

--testで久々に入ってみたけどMJのrelaxモード遅っせぇ！
つか動きだしたらまぁ早いんだけど、(Waiting to start...)で数分、下手したら10分くらい止まる
ある時間内に受け付けられるfastモードの上限数があって、それ以下の場合に初めて受け付けてもらってるとかじゃないかな
ようはすべての有料キューの後回しにされてる

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 00:18:27.77

デコーダーもあるから一見出来そうに思えてやっぱり出力→入力への逆変換は不可能なんだよな
逆にそれが出来たら既存画像から髪の長さだけ変更とか構図だけちょっと変更とか服だけ脱がすとか自由自在に改変できてやばい
まあそれ用のAI学習すれば出来てしまうんだろうけど

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 00:22:41.38

ちなソースの中身見ると最初から各自で自由に改変・拡張できるように
滅茶苦茶親切に色んな機能があらかじめ用意されてるのな
短期間に機能追加が進むわけだ

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 00:25:43.51

>>99
seedが違うんで完璧に逆は無理だね
なおSDでseedまでわかる検索サイト
https://lexica.art/
日付が8月上旬に集中してるので、その頃のDiscordのβ情報だと思われる