Midjourney】AI画像生成技術交換3【StableDiffusion

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 17:36:26.27

英語の文章が画像に！
背景に使うか？イラストのアイデア出しはもちろん、
与える英文を捏ね捏ねして思いがけず生成される秀逸画像ガチャで遊ぶのも楽しい
有料サブスクで商用利用まで可能なAI画像生成サービス

★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
（以下のスレッドへ移動してください）
AIイラスト　愚痴、アンチ、賛美スレ
https://mevius.5ch.net/test/read.cgi/illustrator/1661305344/

前スレ
Midjourney】AI画像生成技術交換2【StableDiffusion
https://mevius.5ch.net/test/read.cgi/cg/1661146705/

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 17:37:42.05

■関連リンク
【Midjourney】 https://www.midjourney.com/
【StableDiffusion】https://stability.ai/
【DALL・E2】 https://openai.com/dall-e-2/
【craiyon】（旧DALL・E・mini） https://www.craiyon.com/

英語スキルはあるといいですが、別に今時なくても何とかなります
【Google翻訳】 https://translate.google.co.jp/
【DeepL翻訳】 https://www.deepl.com/translator

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 17:38:33.20

StableDiffusionの人の他社製品比較

https://twitter.com/EMostaque/status/1561349836980584455
・StableDiffusion、DALLE2、midjourneyは全て異なるものだ
・この分野は、去年（2021年１月）にOpenAIがCLIPを公開したことで始まった
　これにより画像生成のガイドが可能になった

●DALLE2
　・モデルかつサービス。インペインティングは最高の機能だが、ランダムなのでアイデア出しやより企業的な用途に最も適している。
　・来年にはコストが１０分の１以下になりAPIも公開されると思われる
　・トレーニングデータは著作権のあるイメージなので、オープンソースにはならないと思だろう
●MidJorney
　・VCの資金提供を受けたベンチャー、ではなく研究所
　・非常に独特な絵画のようなスタイルを持っている
　・一貫性に膨大な労力が必要。ランダム性が強いがある程度コントロールは可能
　・オープンソースとそうでない部分がある。
●StableDiffusion
　・アートからプロダクトまで、あらゆるタイプのイメージに対応する一般的な基礎モデルでもうすぐリリースされる
　・まもなくDreamStudioプロシューマーサービスを発表する
　・今まで皆さんが見ていたものベータ版のモデルテストから得られた生の出力で、前処理も後処理も行っていない
　　これらを使うことで格段に良くなり、きめ細かいコントロールに力を入れた
　・オープンソースのモデルなので、誰でも使うことができる。コードもデータセットもすでに公開されている
　　そのため、誰もがこのモデルを改良し、構築することができる
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 17:39:08.56

【ツイッター】
https://twitter.com/hashtag/midjourney
https://twitter.com/hashtag/dalle2
https://twitter.com/hashtag/stablediffusion
こんなのができます

【Midjourneyお役立ち情報】
https://github.com/willwulfken/MidJourney-Styles-and-Keywords-Reference
調べてみたら使いやすいPrompt wordはここに全部まとまってたわ
https://docs.google.com/spreadsheets/d/10i9Ip8tVSERAuMWbc6-H6BUFCoUGOQ91YzDvX--c4bk/edit#gid=0
各アーティストのまとめ
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 17:40:01.08

テンプレはとりあえずそのままにしました
「これ入れて」がいろいろあると思うので>1へ提案しておいてください

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:05:58.48

StableDiffusion各種

●ローカル環境用
公式 https://github.com/CompVis/stable-diffusion
basujindal版 https://github.com/basujindal/stable-diffusion （省メモリ・WebUI有・フィルタ解除済み）
hlky版 https://github.com/hlky/stable-diffusion （一番人気・WebUI有・フィルタ解除済み）
GRisk版 https://grisk.itch.io/stable-diffusion-gui （GUI・DL→解凍→実行だけ）

●Google Colab用
公式 https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb
https://colab.research.google.com/drive/1AfAmwLMd_Vx33O9IwY2TmO9wKZ8ABRRa
フィルタ解除版 https://colab.research.google.com/drive/1jUwJ0owjigpG-9m6AI_wEStwimisUE17

●ウェブサービス
Demo https://huggingface.co/spaces/stabilityai/stable-diffusion
Demo https://huggingface.co/spaces/huggingface/diffuse-the-rest
DreamStudio http://beta.dreamstudio.ai/

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:11:50.56

ついにイラストレーターの絵を学習させて似たようなイラストを作るAIが現る　
https://greta.5ch.net/test/read.cgi/poverty/1661760616/

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:15:58.49

>>1
乙！

hlky＆980ti（6GB）で念願の512x512いけたー！
webui.py他更新してるの気付いてなかった、頻度が凄すぎる、教えてくれた人ありがとう
--optimized-turboで速度3割増し、面積で8割増し、えらいこっちゃ！
--optimizedだけならなんと640x640までOKだったよ、速度めっちゃ落ちるけど
これ上位GPU持ってる人はかなり解像度上げられるんじゃ・・

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:31:54.02

たて乙

現時点で、最もよい導入方法（ローカル）やcolabとかもまとめてあったら便利だろうけど、
最適な方法が流動的すぎて無理だよなぁ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:37:44.98

誰か燃えてるミミックの画像つくってｗAIでｗ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:43:33.07

まとめ情報書き込みたいけどNGワードで書き込めない。なにが引っかかってるんだろう？

とりあえずファインチューニング(textual inversion)メモ

追加で自分のペット画像などを学習させて登場させることができる
・流れとしては画像を学習させembedding.ptを作る　→　それを--embedding_pathで指定する　→　プロンプトで指定する

・利用時はptファイルを --embedding_pathを指定すればOK。
(ldm) ~/stable-diffusion$ python3 ./scripts/dream.py --embedding_path /path/to/embedding.pt --full_precision

・追加学習させたものはそれぞれ、トークンプレースホルダーを割り当てる必要がある（*、@、・・・など）
　利用時は例えば"In the style of * , <other text>"となる。
　これは使い勝手が悪いので hlkyは、分かりやすい単語とプレースホルダーのマッピング設定を検討中
　https://github.com/hlky/sd-embeddings　ここにはアーニャ、tomokoの学習データがある。

・他にも既に学習データをテスト公開している人がいる。 Usada Pekora 5枚の学習に3090で１時間
　https://sd-textual-inversion-models.tumblr.com/

・学習方法
　https://github.com/hlky/sd-enable-textual-inversion
　Stable Diffusionをいらすとやでファインチューニングする

まだ情報がまとまっていないのでハードル高そう。full_precisionじゃないとダメなのかな？

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:44:01.16

>>9
書きたいけどNGワード連発されすぎて心が折れたｗ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:45:29.98

ぶっちゃけ飽きてこないか？

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:48:28.31

とりあえずcolabで動かしたい人はここがおすすめかも
コマンドは公式のリンクと同じ。hugging face とかの部分が最初わかりにくいかも
https://zenn.dev/k41531/articles/2459bbbe8e5cf3

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:51:08.34

>>13
最初だけだよな楽しいの

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:51:29.03

NGワードはすぐわかっちゃうと荒らしが対応するから秘密らしく、条件はよくわからない
「5ch ngワードサンプル集」で検索してみて、日本語アドレス酷いから貼らないけど
微妙に変えたり、2レスに分割するしかない

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 18:57:48.55

MANGO板で絞り込め

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:03:55.25

Stable Diffusion hlky版の構築手順

１　https://github.com/hlky/stable-diffusion/archive/refs/heads/main.zip をDLして展開する
　　Git使える場合更新に追従しやすいcloneの方が良い
　　git clone https://github.com/hlky/stable-diffusion.git
２　https://huggingface.co/CompVis/stable-diffusion-v-1-4-original で登録・同意して
　　モデル(sd-v1-4.ckpt)をDLして model.ckp にリネームして models/ldm/stable-diffusion-v1/ に置く
３　minicondaをインストールする
　　https://repo.anaconda.com/miniconda/Miniconda3-latest-Windows-x86_64.exe
４　webui.cmd　を実行する
５　http://localhost:7860/　をブラウザで開く

●以下はオプション
1. GFPGAN（顔補正）の有効化
https://github.com/TencentARC/GFPGAN/releases/download/v1.3.0/GFPGANv1.3.pth
をDLして src/gfpgan/experiments/pretrained_models/ に置く

2. RealESRGAN（高解像度化）の有効化
https://github.com/xinntao/Real-ESRGAN/releases/download/v0.1.0/RealESRGAN_x4plus.pth
https://github.com/xinntao/Real-ESRGAN/releases/download/v0.2.2.4/RealESRGAN_x4plus_anime_6B.pth
をDLして src/realesrgan/experiments/pretrained_models/ に置く

3. 省メモリ化
scripts/relauncher.py をテキストエディタで開いてこのように追記する
python scripts/webui.py
↓
python scripts/webui.py --optimized-turbo

上記の原本（英文）
https://github.com/hlky/stable-diffusion
他の解説（英文）
https://rentry.org/GUItard

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:12:06.94

Stable Diffusionの人、Crypto界隈をめっちゃ煽っててワロタ。
・SDのように分配強化されたインテリジェントなインターネットが真のWeb3/メタバースと言える
・最初から価値があれば(トークンのような)経済的インセンティブは不要
・ETHマージ後は不要になった全てのGPUで美しい画像や音を作るだろう
https://twitter.com/blog_uki/status/1564122819151032320?s=21&t=4aFlC0UNkMiRV64jPxMGjw
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:13:01.86

NGワードは単純にリンクURLが引っかかってたりとかではなく？

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:14:11.89

●StableDiffusionの情報ソース等
・Discord https://discord.gg/stablediffusion
・中の人のtwitter https://twitter.com/EMostaque
・海外情報reddit https://www.reddit.com/r/StableDiffusion/
・https://rentry.org/GUItard　環境構築情報は hlkyの方が早すぎて追いついてないので>>18を見たほうが良いが、その他TIPSは有用情報あり

・今後
　・モデル v1.5の公式ツイートあり。８月２９日時点で６日後（＝9月4日予定）。100MBになる！？
　・アニメ用モデルの公式ツイートあり（8/24のツイート　”すぐ"）
　・来月(=９月）は”audio"モデル、その後3D、ビデオ予定（時期不明）
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:18:48.10

StableDiffusion TIPS
●性能など
・画像生成時間は、解像度、step数、サンプラで違う。他のパラメータは多分あまり影響はない
　サンプラの差は大きい。k_euler_aとk_heunでは２倍差
　k_euler_a 、k_euler、DDIM、PLMS　＞　l_lms ＞ k_dpm_2_a、k_dpm2、k_heun

●ハード
・ローカル動作性能　https://i.ibb.co/yd7SZ32/chartthin.png 出典：https://rentry.org/GUItard
・K80(24GB)めっちゃ安いんだけどあり？　→　古いからStableDiffusionが使ってるPytorch動かない
・複数GPUにすれば高解像度にできる？　→　多分無理。複数GPU並行実行すればその分高速にはできる
・高解像度にしたい　→　3090(24GB)でも1024x1024無理。RealESRGANで高解像度化したほうがよさそう

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:24:29.39

MJはもう別スレがいい？ここじゃあまり語られないし

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:24:36.38

>>22
> 　サンプラの差は大きい。k_euler_aとk_heunでは２倍差
> 　k_euler_a 、k_euler、DDIM、PLMS　＞　l_lms ＞ k_dpm_2_a、k_dpm2、k_heun

し、知らなかった・・
「生成時間は」で不等号だから、当然k_euler_aが長くて、k_heunが短いんだろうけど
一応（遅）←・・・・→（早）みたいなのあったほうがわかりやすいかと

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:28:27.11

>>23
一緒でよくね
スレの流れが早いわけでもないから下手に分散させたら過疎るだけかと

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:30:25.84

>>24
「時間」じゃなくて、速度でした・・・
hlkyで、it/s = コンソールでのit/s表示. sec per image = ブラウザ上での生成時間情報。2080Ti

k_euler_a 7.76 it/s 6.84s per image
k_euler 7.68 it/s 6.87s per image
DDIM 7.59 it/s 6.9s per image
PLMS 7.50 it/s 6.95s per image

l_lms 5.89 it/s 10.08s per image

k_dpm_2_a 3.95 it/s 13.0s per image
k_dpm_2 3.91 it/s 13.16s per image
k_heun 3.91 it/s 13.12s per image

進歩が速いのであくまで現時点。ただ結構違う可能性がありますよ、ぐらいですね

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:32:33.25

k_euler_aはSampling Step 20くらいでいい感じになるのでなお早くできる

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:33:33.24

--turboの効果凄いな、ちゃんとメモリ節約出来てるのにオリジナル版並の速度が出る

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:36:30.39

img2img、バリエーション起こすのにいいわこれ
この用途だとscaleとstrength中間でスタートで様子見して、下手に大量にワード入れるより数ワードに絞った方が暴走せずいい感じになる

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:39:43.35

>>27
18で大丈夫

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:47:54.82

>>26
めっちゃ参考になる、ありがとう

>>27
これだね
https://twitter.com/Ethan_smith_20/status/1562644246150418432
https://pbs.twimg.com/media/Fa-gppeXoAAYpQH.jpg
redditだけど直画像貼れないので小さめのこっちでいいや
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:51:15.79

法律、権利関係の議論は熱くなりそうで別でやって欲しいんだけど、このサービス、技術的にどのぐらいのレベルなのか気になる

https://illustmimic.com/en/
本日、イラストレーターさんの絵の特徴を学んでイラストを生成するAI サービス mimic（ミミック）をリリースいたしました！
２回までイラストメーカー（イラスト生成AI）を無料で作成できますので、ご自分のイラストを学習させたい方は是非ご利用ください！

mimic（ミミック）では15枚?30枚程度のキャラクターイラストをアップロードすると、自動で顔部分を切り取り、
AIが特徴を学んでイラストを生成します。規約によりご自身が描いた画像のみアップロード可能ですのでご注意ください。

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 19:53:40.67

https://gigazine.net/news/20220829-diffuse-the-rest/

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:02:09.48

img2imgは構図維持するよりstrengthを大きくして
元画像は言葉で表現できない細かな情報伝えるのに使ったほうが面白いな
例えば手前のオブジェクトはくっきりで遠景だけぼかすみたいな指示も簡単にできる

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:04:17.39

>>34
Loopbackはやってる？
Strengthを0.2～0.3ぐらいにしてLoopback Batchを5回とか10回かけると構図維持したまま細部だけ変形していくよ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:09:08.05

>>26
ちな980tiの「a dog 512x512 cfg 7.5 step50 k_euler」で
hlkyの--optimized-turboで1枚＝1分32秒（0.54it/s＝1.84s/it）だったよ・・14倍差て、2080tiってそんな早いのか
AI画像は結構数撃ちゃ勝負みたいなところあるので、やっぱ高性能GPUは強いなぁ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:13:39.45

日本昔ばなしの絵を画像生成AI「Stable Diffusion」に描いてもらいました。

「桃太郎」
https://www.youtube.com/watch?v=uJVlrErpFXE

「かぐや姫」
https://www.youtube.com/watch?v=vr5i7EIbx48

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:14:05.70

>>32
今挑戦しようとしたら(もちろん自分が描いたやつね)処理に9000人待ちで生成どころじゃないのでなんとも言えない

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:21:17.66

>>32
waifulabsとかThis Anime Does Not ExistとかCreative AIとか
あの辺と同じ技術なんじゃね？
こいつらは雑多に食わせたモデル使ってるが学習データを特化すればできそう

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:26:00.47

はつねみくできたかわいい
https://i.imgur.com/j4Kqb4X.jpg

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:26:48.25

>>40
絵心あるように思えてしまうのが凄い

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:28:58.53

>>26 >>26
RTX2080でoptimized版に--turboでddim 50step 512×512 1枚あたり7.5秒だな
2080Tiと殆ど変わらないとは思えないんだが --turboで何か処理を間引いてるのか？

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:37:20.43

>>38
9000人はすごｗ
mimicの運営の会社、前からAI画像生成サービス色々やってる会社みたいだけど、
Midjourney、SDブームで注目度が高いところに発表したからプチブレイク（ちょい炎上気味）してる感じ

学習めっちゃ時間かかるのにオンラインサービスでやって採算大丈夫なのかな？
と思ったらまだ有料版の料金は書いてなかった

>>42
1割差ならそんなもんかも？
ディープラーニング性能どれがどのぐらい差があるのかよく分からないので、
ちゃんとしたベンチマークが欲しい

2080Ti　→　3090Ti　で性能2倍、今後出る4090は、更に2倍（予想）。速いGPU欲しくなる

StableDiffusionもバージョンアップで性能上がっていきそうですが

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:45:10.83

初音ミクは前スレのこれがめっちゃ良かった
turquoise colored twintail、とGreg Rutkowski みたいなキラーワードを見つけると高品質が担保されて、追加ワード微調整できる感じ

https://i.4cdn.org/g/1661704624784564.jpg
digital concept art of anime cute girl in summer dress, detailed eyes, gorgeous face, ((turquoise colored twintail)), smooth details, digital cg art by Greg Rutkowski
k_euler_a, cfg 10, steps 50, seed 721628136

１段目 turquoise -> green -> red　　色違い
２段目 twintail -> ponytail -> bun　髪型違い
３段目 summer -> cocktail -> maid　夏ドレス、カクテルドレス、メイドドレ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:50:05.21

SDは既存アニメキャラは意図的に出ないようにしてるみたいでそういう用途ならdalle miniのほうがええね

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 20:56:04.90

前スレの
> でも3090TI(24GB)でも960x640、もしくは896x896が限界、らしい
これ--optimizedだったら1024x1024行けるかな？

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:00:44.38

Craiyonのanimeエンハンスモデルが3090のシングルで数時間学習しただけで
あの性能なの見るとSD公式のアニメモデルが来ると凄いことになるのかもな

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:01:30.47

>>45
そこだけ妙に節操があるのはなんでなんだろうな
著作権なんて便所の糞と一緒に流しちまえとしか思ってない連中なのに

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:02:32.32

まだデータ集まってないけどベンチマーク
https://github.com/hlky/stable-diffusion/wiki/Benchmarking

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:14:50.14

どのみちSDでは縦横両方が512を超えると途端に破綻しやすくなるから後から超解像度したほうがマシ
MJの高解像度出力ってどういう仕組みでやってるんだろう？
あれがSDに降りてくれば凄いんだが

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:18:44.13

512x512で作ってから
同じプロンプトでimg2imgの1024x1024低Strengthかけるなんていうやり方もあるらしい

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:32:53.11

逆に絵から「このテキストで作る絵に近いですー」って出してくれれば
好みの絵つっこみまくったら共通ワード出せるのか

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:32:56.71

>>46
3090持ってないけど、11GB VRAMで --optimized-turbo　1024x640がいける。この時VRAM 10570 MB(95%)でほぼ限界。
オプションなしだとクラッシュする。
turboなしの--optimizedだと、VRAM 10774MBで変わらない（何故か若干多い）→ 遅いし現時点turboなしは意味がなさそう。

VRAM消費量が解像度比例なら、24GBあれば1024x1280いけそうな気がする

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:36:59.23

>>36勘違い、実験中で-turbo入れ忘れ
0.78it/s＝1.27it/s、約10倍差だった
（どうでもいい情報ごめん）

>>51
今それ試してるんだけど、ボケちゃって詳細が生成されるわけでもなくいまいち
ESRGanと変わらないというか・・strを0とか0.01、0.05、0.1とかいろいろやってみたけど
MDでいうlightでないupscaleみたいなのが欲しかったんだけど
大元の生成時の画像とseedと呪文等全部ちゃんと記録しといて、-turbo外して大きいのを作り直しとかがいいんじゃないだろうか

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:37:38.43

>>48
むしろ逆だよ
「なんかカッコいいアニメのポスター」で既存のアニメの絵が出てきたら使いにくいじゃん
フォトストックみたいに気軽に使えるものが欲しいんだろう

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:43:57.09

>>52
自分は試してないけど、画像から認識されたテキストを出してくれる CLIP Interrogator というものはあるよ
https://zenn.dev/knok/articles/cef8ee0697a040
https://colab.research.google.com/github/pharmapsychotic/clip-interrogator/blob/main/clip_interrogator.ipynb

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:46:10.20

>>53
最初から12GBとか大きいのには効果低いってことなんだろうか
あくまで小メモリ雑魚GPUへの救済

> VRAM消費量が解像度比例なら、24GBあれば1024x1280いけそうな気がする
ぐへへへ・・3090tiいっちゃうか？BTOで60万とかするけどｗ
解像度比例と思って面積範囲内で1:2くらいの縦長にしたらOut of memoryだったりしたのでよくわからない
まぁあんま正方形から外しちゃうとAI的に意味ないのでアレだけど

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:47:53.47

やっとGoogle ColabでGPUつかめた。

Google Colabで hlky同等。つまりNotebookで使うのではなくGradIO WebUIが起動するノート
https://colab.research.google.com/drive/1cd35l21ewU0fwWEnPjY_th5YORmMfZCd
事前に自分のGooglde Driveにmodel.ckptを配置しておく前提だけど、それ以外は上から順番に実行するだけでOK

起動がかなり遅いのがデメリットだけどWeb UIはやはり便利

こちらも同じくhlkyのGoogle Colab版。試してないので違いは分からない（動くかも未確認）
https://github.com/altryne/sd-webui-colab

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:53:37.99

例の炎上サイト、Tesla P100×1台分程度のリソースしか用意してないな
逆に言うと殆ど個人の趣味レベルの会社でもあんなサービス作れる時代なのか

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:54:30.29

貧弱なローカルPCでやってたらMJって凄いことしてるよなぁってヒシヒシと・・

①呪文を受けて512x512を4枚作って、半分のサムネにしてgrid表示
②upscale依頼を受けて1枚を1024x1024に同seedで「作り直し」で情報増加
③さらにupscaleで2048x2048化、これも作り直しで情報増加

②や③を同じ画像に対して繰り返すと内容が微妙に変わってたのが何なのかよくわからないけど

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 21:58:09.87

>>56
凡人の考えなんて３周遅れなんやね……、情報サンクス

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:04:58.37

AI勉強するか、と思ってサイト検索して、Python基礎、微分、線形代数、この辺まではまあ高校数学だから、そういうのあったなーでいいけど
行列偏微分のあたりでんんん？？？となって確率統計で時間かかってる。道は遠い

俺どうやって大学卒業したんだろう・・・。やっぱ勉強大事

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:06:02.96

>>59
画像ちっちゃいし顔だけだからじゃね

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:08:34.26

>>58
ちらっと中身見ただけだけど2個目の方はアクセスするためのパスワードかけられるっぽいね
別にアクセスされたからってそんなに困ることもないだろうけど気になる人はそっち使うといいかもしれない

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:13:25.30

>>60
かなり運用コスト高そうよな
微妙に変化するのはSDで言うところのi2iしてCFGを弄るイメージ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:17:21.62

anatomical chart(人体解剖図)という
入れると人体が正確になる代わりにやけに生々しくなる劇薬みたいなワードを発見した
あと真正面向く

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:17:47.43

>>60
MJは従業員10人の零細企業だけど有料プランの料金体系はawsオンデマンドの料金を超えないように設定されてて
既に利益は出ていると、そして常時エクサスケールのリソースが消費されている
地球シミュレータの数十倍となる計算量だけどawsなら金さえ払えばいくらでもリソース使えるから零細企業が
いきなりこんなマシンパワ―使えてしまうという凄い時代

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:21:46.52

>>62
AIの何やってるか知らんけど深層学習の原理は普遍近似定理
フーリエ解析や関数解析を勉強してないと定理の証明は理解できんぞ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:32:21.36

流速すげーなこのスレ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:38:23.03

AI、最初はおもろかったけどミミックだっけか、あそこまで露骨なの出てくると完全に無法地帯と化してきて引くわ
イラストレーターは今後自分の絵に転載禁止の他にAIへの出力及び学習禁止みたいな項目も書く必要が出てくるねぇ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:40:03.41

>>66
ヴィンチ村のレオナルドさんですか？

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:43:43.05

>>70
ここは技術交換スレだからそういうのはこっちでね
https://mevius.5ch.net/test/read.cgi/illustrator/1661305344/

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:44:04.77

ミミックの話題はこっちでよくね？スゲー盛り上がってて笑う

AIイラスト　愚痴、アンチ、賛美スレ
https://mevius.5ch.net/test/read.cgi/illustrator/1661305344/

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:45:58.43

あんなありがちな顔だけ生成マシンがここまで荒れるとは

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 22:50:36.98

hlkyにDokcerファイル、docker-compose.yml他が追加されて、Windowsでもdocker compose updだけで使えるぽい
https://github.com/hlky/stable-diffusion/discussions/93

WindowsのDocker Desktop って NVIDIA GPUの準仮想化に対応してんのね。知らなかった。
便利そうではあるけど、なんかトラブりそうで誰か人柱が欲しいｗ

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:06:18.19

>>74
規約だと生成マシンのために用意する画像は自筆のものだけってことになってるけど
絶対他人の書いた画像をぶちこむ奴らが湧くから絵描きは普通に警戒すると思う

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:17:14.73

どのみちファインチューニングしたファイルがどんどん配られるようになるから反対しても無意味だよな
配布されてたぺこらの奴はまだまだ…って感じだけど品質の向上はどんどん進むだろうしな

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:18:47.75

>>64
って書いたけど実際動かしてみたらなぜかパスワード機能しなかった
webui.py書き換えて直接パスワード指定したらできたから結局どっちでもいいかも

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:25:26.62

この板にもAI愚痴スレ立てた方がいいの？
物申したいだけなら余所でやってほしいんだけど

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:32:15.28

賛美を抜いた愚痴アンチだけのスレが欲しい
または賛美スレもこの板に立てるとか

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:32:18.72

>>50
> どのみちSDでは縦横両方が512を超えると途端に破綻しやすくなるから後から超解像度したほうがマシ
> MJの高解像度出力ってどういう仕組みでやってるんだろう？
あの1024化は謎すぎる
前に縦長1:2で全身出そうとしたら最初の4枚の時点で破綻してたから、そんな凄いことはやってないとは思うけど

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:33:31.85

賛美がCG板で
愚痴アンチが向こう完走次第イラストレーター板
でいいんじゃないかな
板の特性的にその方が住み分けできる気がする

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:34:35.34

midjourneyが期間限定で--test,--testp,--creativeオプションを実装してるね

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:34:35.86

ID:l6B+4duJ

>>1
★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
（以下のスレッドへ移動してください）
AIイラスト　愚痴、アンチ、賛美スレ
https://mevius.5ch.net/test/read.cgi/illustrator/1661305344/

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:41:27.63

>>83
また定期的に期間限定やりやがってくやしい・・でも

> 1) A general purpose artistic mode you can use by typing --test
> 2) A photo-realism mode you can use by typing --testp
> If you want it to be more creative type --creative after your prompt

https://twitter.com/ro1was/status/1564256480701730816
マジかって感じ
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:43:39.19

いいんじゃなかろうか

https://i.imgur.com/kfTChZg.jpg

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:44:33.14

>>86
ほくろ
鎖骨にも見える服のシワ？
えっち！

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:45:39.73

https://twitter.com/kohya_ss/status/1564253194644992000
ねんどろまで・・
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:48:21.08

midjournyはこの先きのこれるのか？

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:49:16.88

手軽なAIで生き残れるでしょ
スマホでも出力できるし

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:49:24.96

Google Colabで現在のサンプラーを確認したりサンプラーを指定したりするのはどうやればいいのかしら

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:50:03.67

MDのtest、girlって入ってても結構な確率でオッサンとか出るな

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:56:07.08

midjourneyて適当に単語入れてもなんかいい感じ（雑！）になるけどあれってどの段階でどんな感じに調整してんだろ（あやふや！）

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:58:34.01

MJの勝手にいい感じになるのが面白いし、本来の創作からはかけ離れてるなとも思う
たまたまこんなの出たぞ！って自慢する遊びって感じ
「俺が考えて台を選んだからパチンコで勝ったぞ」みたいなレベルの

**名無しさん＠お腹いっぱい。** · 2022/08/29(月) 23:59:06.57

作成した画像だけで指定したプロンプトってわかったりする？

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 00:04:36.88

人間には無理だと思います

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 00:05:46.88

>>95
>>56みたいな？

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 00:10:06.04

--testで久々に入ってみたけどMJのrelaxモード遅っせぇ！
つか動きだしたらまぁ早いんだけど、(Waiting to start...)で数分、下手したら10分くらい止まる
ある時間内に受け付けられるfastモードの上限数があって、それ以下の場合に初めて受け付けてもらってるとかじゃないかな
ようはすべての有料キューの後回しにされてる

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 00:18:27.77

デコーダーもあるから一見出来そうに思えてやっぱり出力→入力への逆変換は不可能なんだよな
逆にそれが出来たら既存画像から髪の長さだけ変更とか構図だけちょっと変更とか服だけ脱がすとか自由自在に改変できてやばい
まあそれ用のAI学習すれば出来てしまうんだろうけど

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 00:22:41.38

ちなソースの中身見ると最初から各自で自由に改変・拡張できるように
滅茶苦茶親切に色んな機能があらかじめ用意されてるのな
短期間に機能追加が進むわけだ

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 00:25:43.51

>>99
seedが違うんで完璧に逆は無理だね
なおSDでseedまでわかる検索サイト
https://lexica.art/
日付が8月上旬に集中してるので、その頃のDiscordのβ情報だと思われる

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 00:29:03.97

ローカルだと、エログロやロリも出力出来るの？

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 00:39:37.50

>>98
SD取り入れたらしきtestモードはパワーが必要らしいからな
test実装で人が増えた+みんなtestモードで遊んでる＝リラックスマン死亡
だからローカルで動かせるSDが神すぎる

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 00:59:18.12

MJのファインスケールの技術がSDに降りてきたら凄いんだけど
MJみたいな営利企業だどそこは秘匿されて論文すら公開されないんだよな

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 01:05:31.14

>>102
できるよloliってやると幼女に
pregnantってやると妊婦になる

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 01:15:50.76

>>102
はい、一生懸命プロンプト入れたらできますよ！
え？今日からMJを始めたい？いいですよ、それじゃあDiscordに登録してください

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 01:17:28.04

ローカルだった、間違えた
まぁ初心者が首を突っ込むとマナブさんに殴られるみたいな酷い状況になること請け合い

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 01:17:48.62

MJのtestでオリジナルねんどろいど試したがクオリティ高いな
ゲースロのデナーリスだけど
Daenerys.nendoroid, --test --ar 9:16
https://i.imgur.com/V8aG77Y.png

認識出来る人物だと何回かトライしたら本物のような物出してくれる
ただtest使える期間短いからみんな試してるのかrelaxだと遅くてつらい

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 01:41:36.82

--testで適当にアニメキャラ出したら色使いや絵柄がパンツ先生ってのにやたら似てる気が・・
まぁアニメ絵をコピーしてるアニメーターかなんかだから当たり前なんだろうか

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 02:33:57.47

ちょっと間違うと？平気で事故画像になるな
赤い髪って指定で頭から流血してる感じになったり水着指定したら何故かおっぱい丸出しとか
google driveに画像保存するタイプのnote bookは危なくて使えんわ
img2imgで大人体型の元絵をyong girlで変換すると何故かロリになったりするし

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 03:09:28.94

分かる
メンタル弱いからSDはスレに貼られてる画像でもびっくりすることあってMidjourney使ってるなあ
実写の人間の顔が生成されるのも怖いときある

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 03:18:39.40

ツイッターの#midjourneyの外人を何人かミュートしたことある
どの人も上手いんだけど、肋骨に肉と内臓みたいなのが収まってるのばっかあげる人とか
数回に一回ゾンビみたいなのが歯剥き出しで絶叫してる顔のアップみたいなの入れてくる人とか

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 05:10:35.62

110みたいなのはあるな
気を付けてもらいたいのは、googleのGPU借りて画像を生成してたら
ロり画像になってしまって垢ごと永久BANみたいな流れ。十分気を付けてくれ

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 06:35:45.34

memeplex.app使っている人はいる？

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 06:39:54.18

>>66
plastinationおすすめ

>>75
この際WSLおよびDockerはオーバヘッドになるだけなのでおすすめできない

>>95
https://replicate.com/methexis-inc/img2prompt

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 07:08:27.63

ロリどころか赤ちゃんから老人まで全裸にできるし、他に倫理的な問題がある表現もワード次第で大抵出せるから、今まで一般流通のなかった特殊性癖な人にとっては供給量が砂漠から海になるくらいの地殻変動が起きてる。

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 07:14:18.44

下手に国内法で規制とかしたら外国AI企業が発展して日本の著作権法で検索エンジン開発できませんでしたの再来になるな
クリスタが海外製お絵描きソフトにやられて下手くそ日本語訳のソフトを外国人サポートスタッフ相手に使い方を聞くことになるぞ☺

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 07:34:03.00

>>116,117
その辺も重要だと思うけど、別スレで
https://mevius.5ch.net/test/read.cgi/illustrator/1661305344/

映像作品の倫理、権利関連は専門的な話なので専用スレがあってもいいと思うけど法律板かどこかに必要なら立ててください。

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 07:37:44.28

huggingfaceとかColabに面白いツール結構あるんだが、一応学術的な用途のサイトをエンタメ乞食目的で拡散していいのかめちゃくちゃ悩むな

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 07:45:49.20

VRAM足りないって言われる、GPUでコスパのいいのなに？

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 07:54:41.69

>>120
3060 12gbかな

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 07:57:07.37

Colab pro使ってるけど512、ステップ数50、5枚一括生成辺りからもうプレビュー読み込めなくなってしまう
やっぱり1枚ずつ生成した方がいいのかな

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 08:30:48.98

>>121
thx

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 08:41:53.85

なぁ今やっとローカルに環境構築できたんだがcmdで一行ずつコピペするの大変だからpythonで①作業ディレクトリの設定、②promptの入力、③保存して次行くかor保存して次行くか、くらいまで人がやる作業減らしたいんだが誰かヒントをくれんか。

俺の能力は8/27までパソコンをペンタブを動かすための道具としか思ってなかったくらい。

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 08:47:26.10

>>124

>>18を試してみては
ブラウザ操作できるのが楽。出力は画面にも出るしoutputディレクトリにも自動保存される
手順2のckptファイルダウンロードは済みで、3のminicondaもインストール済みだと思うけど

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 09:32:47.09

背景が得意と言ってもちょっとイラスト風に指定すると
いかにもAI君が描きましたって画風になってしまって使いにくいな
最近流行の情報量の少ないクールな背景はimg2imgで詳しく指示してやらないとプロンプトだけでは難しいわ

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 09:33:31.51

pythonって環境汚れるから嫌なんだよな
dockerに出来るなら移行させるか

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 09:36:12.17

AIはイメージボード的に考えて自分でさらに描きこめる人じゃないと活用しにくいかもね。

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 09:38:31.47

>>127
anaconda/minicondaでもか？

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 09:46:51.92

環境が汚れるというかソフトによって細かくライブラリのver調整しないといけないから
共存が難しいんだよな、あっちが動く設定ではこっちが動かないみたいになる
condaコマンドで個別環境作っても結局共通のライブラリも調整しないといけないことがよくあるから
色々並行して開発するには仮想環境作らないといけないって話になって面倒になるからな

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 09:50:59.51

単純に複数フォーク使う場合はDockerの方が気分的にいいね
性能が気になるけどまだ動かしてみたって報告見つからないな

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 10:04:41.54

#stablediffusion が使えるPhotoshopプラグイン登場

https://video.twimg.com/ext_tw_video/1563160807847841794/pu/vid/640x360/6qT8U5WkKFck8BAT.mp4

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 10:24:39.31

>>132
例のサイトなんかより遥かに凄いな、もう誰でも絵を作れる時代

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 11:14:07.66

>>127
Docker楽だよ
今はリポジトリにDockerFileがあるからそれそのまま動かして構築完了まで待てばモデルのDLや配置からWebUI起動まで全自動でやってくれるよ
WindowsでもWSL2で適当なディストリビューション入れてDockerDesktopだけ準備すれば使えるからそんなにハードル高くないしね

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 11:18:11.10

>>131
うちはずっとWindows上のDockerでやってるけど速度的なオーバーヘッドは感じないよ
GPUは1080無印、k-lmsの50stepで一枚あたり27秒～30秒前後だからだいたい色んなところで報告されてる時間と同じぐらいだと思う

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 11:20:25.88

>>137
普通の使い方ならそうだけどGPUをdockerから参照させるのが(できるらしいけど)なんかトラブル起こしそうで試してない
問題なく動いてる？

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 11:23:57.78

レス先間違えたw
>>135
情報ありがとう。
手順とかどっかに書いてますかね？
dockerｰcompose upする前のnvidiaのdriver設定とかあると思うんですが、そのあたり

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 11:40:54.58

>>137
うちの場合、

・事前にWindows上でWLS2を使えるようにしておく(うちの場合はUbuntu22.04を入れたけどたぶん何でも良い)
・DockerDesktopをインストールする
・VSCodeをインストールする
・VSCodeにRemote-Container拡張とRemote拡張とDocker拡張を入れる
・適当に https://github.com/hlky/stable-diffusion をcloneなりZipでDLしてくるなりして展開したフォルダをVSCodeで開く
・VSCode上でF1キーを押して「Remote-Container:Rebuild Container」する
・VSCodeがなんか訊いてくるから docker-compose.ymlを使っておくんなまし的な選択肢を選ぶ

あとはしばらく放置するだけで起動までいけたよ
細かい設定とかは特に不要で出力ファイルのoutput先はちゃんとホスト側のoutputsフォルダになってるからDocker内とややこしいファイルのやりとりをする必要もなかった

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 11:45:27.55

一応参考資料

Stable Diffusionをローカルマシンで実行する(VSCodeとDevcontainerを使用)
https://zenn.dev/hayatok/articles/6141a9a46e4f48

うちは当初はこの↑の記事を参考にDockerでローカル環境作ってやってたんだけど今は https://github.com/hlky/stable-diffusion に公式のDockerFIleとdocker-compose.ymlが入ったからこれを使えば自前であれこれする必要はなくなったって話ね
最新バージョンならコンテナをビルドしたら自動でWebUIの起動までやってくれるはずだよ

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 11:47:40.85

一応念のためだけどVSCodeは拡張が便利だから使ってるだけで別に必須ではないよ
もちろん自分でdockerコマンドを叩いても問題なくいけるはず

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 11:54:40.02

出先でID変わってるけど137です
>>138
なるほど
GPU関係のドライバとか設定とかないんですね。
どういう仕組みなんだろうw

帰ったら試してみます。ありがとう！

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 12:04:42.27

>>141
正直dockerにはあんまり詳しくないんだけど、理屈としては

・Dockerfileの1行目のここでドライバとかはもう入った状態の(NVIDIAが提供してる)イメージをベースにしている
FROM nvidia/cuda:11.3.1-runtime-ubuntu20.04

・docker-compose.ymlの19～20行目のここでdockerコンテナに対してホストのGPUを使用する許可を与えている
devices:
- capabilities: [gpu]

ということだと思う
たぶん
知らんけど

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 12:05:37.25

ローカルで動かすには大変なんだね
DLしてポンと行けるようになるまで待つしかないか‥

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 12:06:07.82

>>58
これの二番目を構築したけど、ここ入力したプロンプト情報て制作者さんとかプロンプト公開サイトに流れますか？…

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 12:12:21.02

>>142
なるほど。ベースイメージがいい感じになってるってことですね(雑理解

>>144
流れないので安心してなんでも入れてOKですw

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 12:14:40.77

>>145
ありがとございます(^o^)／

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 12:15:05.99

>>125
ありがとう。でも開発者の手記みたいなやつ翻訳しながら構築したからminicondaとやらは導入してないぞ…必要そうなのpipでインストールした。

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 12:16:37.98

>>86
えっ？

これがいいとか思ってるなら精神病院に行けよ

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 12:17:24.50

Pythonのみ環境だったらあぶぶニキのnoteの手順がわかりやすいかも

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 12:21:12.88

ちなみに上の話の確認をする過程で軽くTwitterを検索してたらなんかGPUなしで(CPUで)StableDiffusionを動かせるDockerコンテナを作った人がいるみたいなので興味がある人は試してみてほしい

dandelion @dandelion1124 (2022/08/30 02:52:19)
Dockerコンテナで動かせるようにしました。10分くらいで作ったので雑なのは許してほしい。
https://github.com/atinfinity/stable_diffusion.openvino-docker
https://www.google.co.jp/url?q=https%3A%2F%2Ftwitter%2Ecom%2Fdandelion1124%2Fstatus%2F1564309989447315456

[引用元] からあげ @karaage0703 (2022/08/29 23:57:04)
@karaage0703 雑に動かし方をzennに投げておきます。Docker版やGitHub Action版は誰かに任せました
> Stable DiffusionをローカルのGPU無しのWindows PC(Intel CPU)で動かす方法 https://zenn.dev/karaage0703/articles/4901bf68536907 #zenn
https://www.google.co.jp/url?q=https%3A%2F%2Ftwitter%2Ecom%2Fkaraage0703%2Fstatus%2F1564265883995754496

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 12:30:22.21

>>18
アカウント登録不要のモデルデータ直リンク
https://www.googleapis.com/storage/v1/b/aai-blog-files/o/sd-v1-4.ckpt?alt=media

Docker版の参照先はここっぽかった

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 12:32:25.62

キム・ヒョンテ（Hyung-tae Kim）とかも結構ヒットする

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 12:46:18.62

>>151
なんかとんでもねえところに置いてあるなと思ったら
GoogleCloudに置いてるブログの直リンクがgoogleドメインに化けてるだけか

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 13:28:56.22

直リンクはあかん

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 13:51:10.79

マッチョな赤毛イケメン描いてって言ったら想像以上にリアルなエロいの出てきたんだけど、しかも1枚エロすぎて？黒塗りされてた
これローカルだとエロ画像も作成してくれるんかな

https://i.imgur.com/kOFUhyU.png
https://i.imgur.com/D6J0hVg.png
https://i.imgur.com/l2s3twu.png

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 13:58:38.62

>>155
ローカル版ならエロいのも出し放題だよ

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 14:43:28.22

>>156
マジか
家帰ったらやってみるわ

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 15:18:07.18

今写真か画像から3DCGにする技術あるって見たけどそういうソフトって知ってる？
組み合わせれば3DCGモデル作れそうなんだけどなぁ

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 15:20:41.98

仮に世界中全ての画像生成AIがサービス停止したとしても、ローカルに構築しておけば生成し放題。GPUと速度は比べ物にならないがIntel CPUのみでも動かせるようになったし、環境だけは持っておくべき。
https://zenn.dev/karaage0703/articles/4901bf68536907

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 15:23:13.13

フォトグラメトリーってヤツ、アップルスマホで動くらしいけど
まあメッシュはわりとゴチャゴチャなんてそのままじゃ使いにくい
リトポアプリで家具なんかは割と簡単にモデル化できるよ

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 15:24:50.21

>>138
Windows10(insider previewでWSL2はインストール済）ですが
docker-compose.ymlのビルドで以下のエラーになりました。
nvidia-container-cli: initialization error: WSL environment detected but no adapters were found: unknown

また、entrypoint.shが、改行コードがCRLFのため動作しない（LFに変えればいいだけですが）でした

Windows11だと不要なのかもしれませんが、どうもcuda toolkitが必要なようです。
疲れたｗ

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 15:44:04.82

macでローカルに試みてみたけどPyTorchのインストールで早くもつまずいた
こんなややこしい事よう出来るなみんな

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 15:44:11.02

凄いおもろいんだけど呪文周りが大変だねこれ
タグみたいにしてクリックしてどんどん追加出来るような感じのUIに進化して欲しい

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 15:49:51.81

>>158
NVIDIA Instant NeRF: NVIDIA Research Turns 2D Photos Into 3D Scenes in the Blink of an AI
https://www.youtube.com/watch?v=DJ2hcC1orc4

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 15:53:38.35

NeRFは複数角度からのイメージが必要で、それをSDが生成できるならその時点で3D生成できてることになる気がする

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 15:55:19.67

>>162
3DとかAIとかをMacでやってる人尊敬するわ

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 16:00:10.07

>>161
うちも環境はWindows10だけどもしかしたら最初に色々試行錯誤した時にcuda toolkitは入れたかもしれないすまん
entrypoint.shはこっちでは特に変更なしでも動いたけど何の差だろう……

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 16:01:30.71

>>164
グラボまだ高いよねぇ
自分はラデ使ってるから、乗り換えしないと使えなさそう
GTX1650～1660でもまだ2.2～2.7万するし、GT1030辺りでも動くならいいけど実質有料ソフト揃えるようなものかも

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 16:06:12.08

>>168
ちなみに1650は動かなかった
動くようになるっていうmodifyはやってみたけどcuda out of memoryになった

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 16:14:48.13

>>169
2年前にZBrushで描こうかなと思ったけどむずいんだよねぇ
やっぱ依頼かなぁ、今時間無いし
MMDレベルで顔だけで(胴体はフリーモデルから繋ぐ)演算ボーン込みとかなら相場いくらくらいだろう
5万くらいならグラボ買い替えるのとどっちが得か
作れる人が羨ましいなぁ、絵は描けてもBlenderでモデリングは駄目だった

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 16:17:43.86

>>167
いえいえ。まあこうなる気もしていましたｗ
InsiderPreviewに参加したら、Windows11に強制アップデート
Windows11になってるのに、Windows10の更新をパッチを入れろ→インストールすると当然エラー、
Windows11のベータが入ってるぽい？ちょい絶望中ですｗ

多分こんな感じかな？と思うのですが、
●Windows10
・WSL2
・Docker Desktop
・（nvidia driverは普通のでOK。Cuda on WSL Driverをクリックしても普通のDriverページに飛ぶ）

●WSL2(ubuntu20.04)
　・cuda-toolkit　？

●Dockerコンテナ
・Docker fileをbuildすればOK

cuda-toolkitがよく分からない。
https://qiita.com/ksasaki/items/ee864abd74f95fea1efa　の手順で
sudo apt-get install -y cuda-toolkit-11-2しても動作しない（同じエラーになる）

また気力が戻ったらまたチャレンジしてみます。とりあえずWindows11の操作になれようｗ

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 16:19:24.67

マイニング需要減退に4000番前の買い控えとが合わさったうえ
NVIDIAはマイニング景気が続くと思ってかなり以前に4000番用のチップを過剰生産してしまったそうな

> NVIDIA TSMCへのGeForce RTX 40 seriesの発注量を削減へ 2022/07/02(Sat)
> DigiTimesによると、AMDとNVIDIAがTSMCへのオーダーを見直しているという。
> DigiTimesはApple, AMD, NVIDIAがオーダーを変更していると述べている。AMDは7nm/6nmのオーダーを減らし、
> NVIDIAはGPU市場の飽和による次世代GPUの需要減に対処しようとしているという。
> 現在、NVIDIAはGeForce RTX 30 seriesの在庫を大量に抱えており、一方で市場も飽和しているため、
> これがシンプルにGeForce RTX 40 seriesの需要減の要因になっているという。

4000番売るために、3000番は値下げ防止にもう問屋に卸してない在庫限りとか
> GeForce RTX 3000シリーズの在庫処分？2022年8月26日
https://akiba-pc.watch.impress.co.jp/docs/wakiba/find/1434896.html
> 「上位GPUを中心に一部メーカーのモデルは、すでに発注ができない」という話もあり。

（ローカルSDのための技術交換です）

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 16:19:45.81

ZBrushでVroid弄った方が早いかなぁ
たかが私でも描けるような絵1枚で数万の費用とか発生する世界だったから早くこの方面進化して欲しい
0→1は無理でも手直しできるレベルなら使いこなせそうだし

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 16:29:15.30

>>172
今は時期が悪いおじさん「今は時期がいい」
ってこと？

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 16:29:28.01

>>168-170,172,173
別スレの誤爆？なにかのコピペ？
グラボが高いとかZBrushで作るとか一体何の話してるんだ

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 16:37:00.59

ローカルSDはゲーマーと視点がずれてるのが面白い
「VRAMなんて10GB以上は普通いらない」って世界だそうで、なお4080で16GB（爆速ではあるが）とか

自分は生成速度より最終的にいかに大きくかつ精密な画像作れるかが大事だと思うな
ツイッター見ててもMJの生成画像は1024x1024が標準で16:9指令で1792x1024って大きく緻密綺麗で人気だけど
SDで生成されたのは512x512で大抵見向きもされてない
ESRは新しい物を一切追加せず引き延ばすだけなんで解決になってない、waifuよりマシって程度

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 16:37:13.60

>>175
横からだけどもしかして起点になってる元レスの>>158と>>164がNGか何かで見えてない人？

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 16:38:12.60

>>175
AI総合スレみたいなのないからじゃない？
一応イラスト1枚から3DCGやアニメに繋がるから全く関係なくもないと思う
素材からの手直しも過程として似てるし

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 16:45:17.40

164までは分かるけどその後のレスの意味は俺も分からないなw
NeRFとかはスレの趣旨としていいと思うけど

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 16:47:24.25

>>176
> SDで生成されたのは512x512
同じように自力でアップスケールできるよ

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 16:48:52.99

自分で言うのもなんだけどGPUの話題は問題ないでしょ
生成速度と生成解像度に直結してるのでCUDA使うローカルSDとは切っても切れないし
colabのGPUガチャとも関連してるし、技術情報交換だよ
つか今までも前スレでもみんな普通に話してるんだけど、GPUで検索してみてよ

ZBrushは正直スレチだと思う、あんま知らんけどAIじゃないよね？

>>180
いいGPUがあればね・・

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 16:50:26.11

ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
（以下のスレッドへ移動してください）
AIイラスト　愚痴、アンチ、賛美スレ
https://mevius.5ch.net/test/read.cgi/illustrator/1661305344/

これ3DCGと関係ないじゃん
ここCG板だよ？

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 16:54:02.67

Stable Diffusion
https://egg.5ch.net/test/read.cgi/software/1661568532/

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 16:55:26.65

そっちって2D絵描いてるイラストレーター向けってかイラストレーター板に立ってるスレだよね
こちらはCG板に立ってるから3DCGも扱うんじゃないの？
最近のAI話題も大体2D絵の事だと思うし

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 17:01:37.98

一般の使用想定者は2D、いわゆるハンコ絵や背景の生成目的に使うが
ここの板に来てるのは3DCGに使う資料とか、変換するとか、あるいは他の目的とか
そうした用途で使用する人も想定できるんでないか、CG板だし

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 17:10:55.21

まぁ、AIは3DCGゲームデータをかなり学習してるようで密接ではあるんだよねぇ
MJでレンダリング系呪文使ってる人の多いこと

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 17:13:50.50

>>181
2DCG・3DCG板なんだけどなぁ…
前者しか知らないお客さん達の立てたスレなのかな？
これで資料作って参考にしたり加工したりして3Dイラスト作ってる人も居るよね
興味あるから来たけどここはあんま盛り上がってないみたいだね

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 17:13:51.66

猫の人(たかなんとかさん)が紹介してたバイドゥのお絵描きAI動作確認してみたけど
GPU使わないしおかしいなと思ったらがっつりwebAPI問い合わせしてるタイプだった

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 17:20:08.27

クリエイター目線で雑談質問含めて総合スレにした方が伸びると思うは分かる
技術って言っても一般クリエイターはプロ含めて道具を買ってその使い方の知識を学ぶだけだと思うし
クリエイターであって開発者ではないから、その辺りの定義は開発者の方がアップデートして情報公開してくれるんじゃないかな

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 17:21:14.93

フォトショのプラグインのあのデモ見る限り
ローカル版で頑張るよりフォトショのサブスクしたほうが全然効率良さそうなんだが
既にリリースされてるんだっけ？
ペイントツールと直接連携できるのはやっぱ強いわ

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 17:24:46.18

操作方法のマニュアルでなくて絵自体を上手くするテクニックとか？
AIにそれを再現させるんだよね、我々ユーザーの出来ることはある程度限界があるのでは
自分で描くなら完全再現できるけど、3DCGでも再現難しいしなぁ、自分はその点では3DCGに近いとむしろ思うかな
コマンドで調整するのと3DCGソフトで元の絵をなるべく再現するのって似てる工程な気もする

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 17:33:18.91

3Dプリンタでフィギィア造形とか
AIが完全な絵を描くにはむしろ立体的理解が必要なのか

3DCGがさらなる進化のカギを握るはありそうだ
3DCGのデッサンモデル人形で絵が上手くなったor時短できたって話もよく聞く
実際次のVerの別ラインナップではその辺りが出てきて他のAIツール群と提携しそうではある

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 17:42:36.07

>>189
別に伸びなくていいです
何だか知らないけど賑わってるからって理由でお客さんが流入するとろくなことない

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 17:47:53.87

Adobe化せずセットでも安価なサブスクにして欲しいなぁ
全部従来のクリスタみたいにオフラインでも使える感じで

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 17:48:48.90

途中の生成過程よく見てるとフラフラして面白いよね
腕が出たり消えたり、顔つきがふっと変わったり

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 17:51:24.00

フォトショもオフラインで使えるけどフォトショ自体少し高いよね
フリー含めたAI普及しそうな今なら尚更
まぁ代替え自体は同じようにあるけど

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 17:53:24.20

なんでフォトショの話してんだ？って人でそうだから、一応貼っとくね
https://twitter.com/wbuchw/status/1563162131024920576
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 17:53:49.41

解像度を高めるほうほうが見つからんな
一度生成した画像を4個に分割してesrgenで高画質リサイズして元のサイズに復元してから
img2imgに同じプロンプトで投入して見たんだけど(例、右下256×256の領域を512×512にしてからimg2img)
これやってもぼやけたままで細かいパターンが作られたりしないんだよね
img2imgは元がぼやけた画像ならそれに応じてぼやけさせてくるらしい

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 17:58:08.89

ってかこのソフトだけでは何もできないことぐらいCG描いてる人なら知ってるよね
出来たら〇dobe辺りが黙ってないと思うw
結局全員が使い出したら差別化が必要になるから

**名無しさん＠お腹いっぱい。** · 2022/08/30(火) 18:00:13.24

>>198
どうしようもないね・・いきなり最終サイズじゃないと接合部で整合性取れないし
ローカルだと化け物GPU所有するしか活路はないかと

MJは裏でなんかとんでもないことしてると思う、たまたま今貼った>>197をもっと高度にした何か
--ar 1:2 とかにした人間が頭二つになったりするので
間だけじゃなく、ハチの巣状に複数個所描画しながら、ステップ重ねてるとかかも