Midjourney】AI画像生成技術交換4【StableDiffusion

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 07:58:40.81

英語の文章が画像に！
背景に使うか？イラストのアイデア出しはもちろん、
与える英文を捏ね捏ねして思いがけず生成される秀逸画像ガチャで遊ぶのも楽しい
有料サブスクで商用利用まで可能なAI画像生成サービス

★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
（以下のスレッドへ移動してください）
AIイラスト　愚痴、アンチ、賛美スレ
https://mevius.5ch.net/test/read.cgi/illustrator/1661305344/

前スレ
Midjourney】AI画像生成技術交換3【StableDiffusion
https://mevius.5ch.net/test/read.cgi/cg/1661762186/

テンプレまとめ
https://rentry.co/zqr4r
編集コード「5ch」

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 08:02:50.34

ああ、しまった

漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
（以下のスレッドへ移動してください）
【Midjourney】AI関連総合【StableDiffusion】
https://mevius.5ch.net/test/read.cgi/cg/1661853927/

だった
次スレからここ更新してね、わざわざイラ板に飛ばすのも変だし

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 08:16:36.49

以上、たった１レスでスレ立てお終い！素晴らしい

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 08:42:01.36

KAWAII汎用プロンプトのnote有料記事の公開で
あの作者すげー尊敬してたけど一気に胡散臭くなってしまった
よく考えたら一つもプロンプト公開してないから当然信用なんてもの持てないな

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 08:57:59.56

他人のふんどしで金取るとか恥ずかしいよ

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 09:02:20.45

前スレ最後の方で出てたimagenだけど
プロンプト通り＝いい絵になるとは限らないんだよねぇ・・現状のDALLE2の人気のなさ見ても
MJみたいにある程度勝手に意匠加味してもらったガチャにみんな酔心してるような

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 09:22:21.12

シンプルUIに見えてちょっと複雑だけどプロンプト作りやすくていいな
https://promptomania.com/stable-diffusion-prompt-builder/

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 09:50:06.51

ERNIE-ViLGだと知名度あるアニメキャラ混ざるとどうしてもそっちに引っ張られるな
竹取物語のかぐや姫を指示しているのにかぐや様は告らせたいに引っ張られてそっちっぽい絵が出てくる

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 09:51:08.49

かぐや様一派も一枚岩じゃないからな

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 10:00:38.92

kritaのベータ版公開された！！
https://twitter.com/nicolaymausz/status/1566587687431294976
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 10:28:04.21

前スレ参考にAUTOMATIC1111のstable-diffusion-webui入れたけど
一番期待してたSDアップスケールという小さい画像の細部を再生成し大きな画像にする機能の使い方間違ってるのかな
つぎはぎ部分が全然スムーズじゃなくて一瞬でつぎはぎってわかる
それともそれがデフォなんだろうか
タイルアップスケールの数値やスケーラー選択とか適切な設定があったりする？

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 10:29:45.13

>>10
何が出来る系モデル？

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 10:33:33.87

>>12
SD自体はローカル or Google Colabで起動させて、Kritaからアウトペインティングとかできるプラグインぽい。

ちゃんと見てないけどアウトペインティング以外も機能あるかも？
https://twitter.com/NicolayMausz/status/1566081411240677377
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 10:43:08.67

前スレのシンプル構文貼ってくれた人ありがとうな

elf, fgo, mucha, photorealistic, anime blue colored eyes, detailed beautiful face, highly detailed, Armored Core

で謎にメカメカしい鎧を着た顔がそこそこに整った青い瞳のエルフさんが量産され始めた

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 10:43:11.35

>>12
まだインストール中で試せてないけど
このアウトペインティング動画を公開した人のプラグイン
https://www.reddit.com/r/StableDiffusion/comments/x4wtt0/outpainting_with_my_krita_plugin_for_stable

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 11:14:16.24

芸歴長い且つ若い現役女優ってエマ・ワトソン以外にいないのかなぁ
安定するから使ってるけど正直飽きた

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 11:26:36.38

若くないけど、オードリーヘップバーンとか若い時の画像ばっか学習してそうじゃね？

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 11:39:33.71

>>13
>>15
㌧㌧

オードリーさんはオードリーさん風の見た目の日本人みたいな指定にすると美人さんになる(オードリー(綴り忘れた) eyed style face Japanese なんとか)

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 11:44:11.83

kritaのローカル版試したけどkrita→コマンドプロンプトの
通信がうまくいってないのかボタン押しても無反応だな
様子見するか

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 11:53:04.36

オードリー・ヘプバーンはなんか拒食症みたいになってダメだったわ
30代の女優がいい感じ
若手はダメ
アリシア・ヴィキャンデル、フェリシティ・ジョーンズ、アナ・デ・アルマス
マーゴット・ロビーはやたらと皺を強調したがるので却下

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 11:55:45.48

あとレベッカ・ファーガソンは黒人出てきたわ

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 12:02:10.74

日本人美人さん辺りで認識してる人はいないのかしら

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 12:05:57.95

トランプ、オバマ、エマ・ワトソン、誰でも、個人名がそのものズバリの造形は出せないんだよね
出せないってのは倫理的な話じゃなくて今の実装的にオリジナル画像とは違うものになってしまう（元データが無いんだから当たり前だけど）

その辺、実用的に活用する時の大きな障害になる気がする

画像生成AIは１点ものの生成で、それをポーズやシーンなど変形させるのは別のAIということかもしれないけど

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 12:09:17.19

実装じゃなくて学習の問題だと思うぞ
きちんと過学習させたらそのものずばり出せるようになるはず

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 12:09:49.67

プラグインのローカル環境、てっきりAUTOMATIC1111でいいのかと思ってたら、動くのはそのフォーク版だったんかい。無駄に悩んだせいで時間切れになったからお試しはcolabでやるべきだった。
https://www.flyingdog.de/sd/en/
https://github.com/imperator-maximus/stable-diffusion-webui

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 12:12:59.75

イラストはもちろん写真でも写りとか加工で顔の変化はあるわけだからある程度まで似ていたら実用上の問題はない
むしろ誇張されてるぐらいのほうが本物らしいと感じるかも

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 12:17:26.45

実在の人物をどうこうしようって個人的に全く興味ないわ

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 12:19:09.10

>>26
オリジナル画像と違う画像になっても同一人物だと分かるからいいかって人と、シーンによって違うのは駄目だろ、直せって人がいるね
日本のアニメみたいに髪の色を極端に青とか赤とか変えて人物を区別するような作品だといいのかも。

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 12:19:44.31

実在人物そのものじゃなくてそれベースに何とかそう言う応用ならわかる
さすがにそのもの使ってフェイクなんとかはらめぇ

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 12:29:46.48

midjourneyで美女を生成させる呪文で、
slawic vogue star model
というのを見かけた。
世界的なファッション雑誌のVOGUEのスラブ系のモデル。
slawicをjapaneseやchineseにすると東洋系の特徴を濃厚に入れられてしまうけど、色々と入れ替え可能。

特定の芸能人ではないけど雑誌(の表紙?)を指定することで傾向を入れられる

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 12:32:27.74

そういやこれムハンマドって指定したら内部でどういう処理してるんだろうな

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 12:36:43.18

>>29
実在そのものフェイクいいだろ。アップしなきゃ問題ない

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 13:28:46.31

色々小技みたいなのを使ったプロンプト公開してる人いるんだけど、こういうテクニックってどこかにまとめて書いてあるの？
日本語と絵文字と記号？が使えるみたいだけど、この人はどこでそれを知ったんだ
https://twitter.com/alice_diffusion/status/1566448415848165376
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 13:44:02.71

日本語とか絵文字はエラーにならないってだけで、ちゃんと有効なのかどうかってのも謎だなあ……
この辺はもう情報集まらないとなんとも。
区切り文字も,とか|とか色々流儀があるみたいだし。

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 13:44:41.50

>>33
>Attention
>Using () in prompt increases model's attention to enclosed words, and [] decreases it. You can combine multiple modifiers:
https://github.com/AUTOMATIC1111/stable-diffusion-webui-feature-showcase

以前このスレでも同じ勘違いしてる人いたような
それとも別のフォークでは逆なの？

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 13:58:27.04

どっかにトークンリストがあればそれに載ってるか検索するだけなんだけど
未だに見つけられていない

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 14:03:41.44

>>33-34
学習データが画像うｐしてる人がつけてるタグをそのままパクってるだろうから
pixivとかの画像についてる日本語タグをそのまま列挙して入力してやっても
pixivのタグそのままだとイラスト指定がないから実写ばかりになったりはするけど
それなりに似てるのかな微妙だなって感じの画像が出るよ

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 14:33:23.32

>>35
https://github.com/AUTOMATIC1111/stable-diffusion-webui/commit/9427e4e290ef2a6f1d127e2ab2748629a51f31f5
以前の表記は逆だったみたい

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 14:35:50.82

>>4
あいつね。プロプント公開してないから何やってるか分かったもんじゃないよな。
目立つからベンチマークしてるけどしょうもなくなったらフォロー外すつもり

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 14:41:19.13

>>39
分かる
俺もずっとあいつでベンチマーク走らせてるわ

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 14:42:04.78

ベンチマーク？？

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 14:44:09.41

ブックマークだろ
察してやれよ

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 14:45:01.39

>>41
注目してるって意味で使った　誤用だったらすまん。

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 14:47:02.95

2人もこんなトンデモ誤用するものなのかなあって思った

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 14:48:22.12

ベンチマークとしてヲチしてるという意味で、別に普通に理解出来るだろ‥

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 14:57:36.43

俺が発端だけどしょうもなさすぎることでスレ消費するのは勿体ないのでここまでにしてもらえんじゃろか

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 14:57:56.41

今出てるプロンプト(笑)呪文(笑)ルーン(笑)なんてどうせ数ヶ月後には何の意味も価値もなくなってるw

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 15:01:36.84

鼻につくのはわからんでもないけど本人も時間の問題で役に立たなくなるって書いてるしほっとけって

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 15:03:53.55

オードリー・ヘップバーンAudrey Hepburnはお年を召してからの画像も学習しているだろうからとyoungをつけたら少しよくなった
あとはfrom roman holidayとかfrom sabrinaをつけたらどうかな
30代がよければfrom Breakfast at Tiffany's, from My Fair Lady, from How to Steal a Millionなど

アン・ハサウェイAnne Hathawayは眼が巨大だし笑顔になりやすいみたい

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 15:05:02.06

各種ウェイトの使い方

automatic1111版
()で強く、[]で弱くなる

hlky版
a forest under night sky: by Studio Ghibli:1.8 in the style of Starry Night:2.3
のような入力が可能（省略したら1.0）（使う時はカンマの代わりにウェイトを書く）

basujindal版
tabby cat:0.25 white duck:0.75 hybrid
のような入力が可能

本家はないはず。
artroom版、NMKD版、GRisk版などは不明。

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 15:23:43.48

>>47
それな
楽しいからいいんだけど身につくものはないし不毛な作業・・・

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 15:38:05.18

生成したいものに合わせたﾌｧｲｰﾝ用のデータセットはどっちに転んでも使えそうなのでちまちま貯めてる
呪文は...

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 16:00:55.06

SD日本語も効いてるよ
新海誠で人物書き出してみればわかる

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 16:06:23.18

>>25
時間切れって？
まだ試してないんだがベータ版時間制限あるの？

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 16:27:09.49

>>50
https://twitter.com/fladdict/status/1564178679462105088
じゃあこれは誤解？
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 16:32:11.67

エマ顔が強すぎるけど
＋クロエモレッツで丸顔童顔要素プラスできる（たまにブスになるけど
俺はこれにアナデアルマスとナタリーポートマン足すのを基本にしてる。
エマに似すぎず、若い美人系になりやすい。少なくとも3人くらいは混ぜた方がいい感じ。
↓色々試した感想
マーゴットロビー：眉上がってキリっとする
アンジェリーナジョリー：たらこ、しわ、エラ、ケツアゴ
アンハサウェイ：眉あがる、唇厚め
アナデアルマス：目でかくなる、鼻細くなる
ナタリーポートマン：整う、エマに近い

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 16:44:03.27

>>55
そうだと思う
LINEのやつ試したけど効いてないように見えるよ
https://i.imgur.com/Q3rko7b.jpg

効いてたらこうなる
https://i.imgur.com/DPIz759.png

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 16:48:47.71

単語A：1.3　単語：0.5　なんて形式の強弱フォーマットもあるけどこれ各フォークでの独自実装だわね

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 17:21:35.13

SDではイラスト調の顔は崩れるなんて話もたった1週間ほどの研究でどんどん覆って
人間が手で描くと何日かかるか分からないような顔が数秒で出てくるようになってしまったな
これ年内に人間の絵なんて完全に終了するでしょ、速度も品質も圧倒的な差がついて

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 17:28:29.94

>>59
SDで絵がいくらでも作れるからPixiv見なくていいや、とは全然ならんけどねｗ
https://mevius.5ch.net/test/read.cgi/cg/1661853927/

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 17:52:42.18

そろそろFine Tuningのノウハウきた？

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 17:56:49.18

>>52
ファインチューニング（textual inversion)のptファイルって、モデルが変わっても使えるのかな？
追加学習って言葉のイメージからモデルのバージョンが変わると使えなくなるように思いこんでた。

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 18:01:48.78

本家ととりんさまでとりあえず使えることは確認した

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 18:05:17.64

>>63
あり。　なら大丈夫かな
仕組み分かってないから何ができて何が駄目なのか分からないｗ

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 18:29:14.85

>>33
https://github.com/Maks-s/sd-akashic
こことここからのリンクにStable Diffusionについての情報が結構まとまってる
重要なのとしては以下

プロンプトは75単語までしか有効じゃない
大文字小文字は区別しない
Unicode文字が有効（だから絵文字とか日本語の単語ならOK）
同じプロンプト、同じシード値、同じ設定なら同じ絵が出てくる

あたりかな

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 18:36:54.33

>>14
アーマードコアは冗談で入れてみただけなんだけど、顔が整ったりはせず鎧が強化されただけなのが面白かった

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 18:41:02.28

>>62
詳しくないがptは多分無理だと思う
ここで言ってるのはトレーニングデータのセットのこと、要は画像フォルダ
人なら顔立ちや絵柄ごとに、ものや道具なら全体像がいろんな角度から写ったもので集めて保存してるだけ
新しいモデルが来たらスクリプト一発でfine tuningし直せるように準備してある

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 18:42:46.62

>>65
> プロンプトは75単語までしか有効じゃない

単語じゃなくてトークンなんだよね。
トークンって何？っていうのは明確に書いてる場所がわからないけど、過去スレで検証してた内容としてはこんな感じだった。

・日本語文字などUnicodeは１文字＝２トークン（Unicodeは２バイトとじゃないものもあるので文字によっては１文字＝３トークン、４トークンとかもありそう？）
・","も１トークンになる
・Girlとかの単語は、１トークン。　しかしSwimingは、”Swim"+”ing"の２トークン
　とかトークンカウントはよく分からない

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 18:48:22.17

>>68
トークンは読めてたけど大体単語と同意義だと思ってた
過去スレで検証済みだったのか
教えてくれてありがとう

トークンカウント、たぶん形態素解析ってやつかけて単語数をカウントしてるんだと思う
単語くらいしか知らない程度なのでこれ以上のことは言えないけど

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 18:54:28.15

トークンベースはたぶんBERTだならCentencePeace分割ぞ

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 19:36:43.83

トークンの話は混乱を招くだけな気もするから「そんなもんがあるんだ～」ﾊﾅﾎｼﾞｰくらいが良い気もする
分け方に規則みたいなものはないし

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 19:49:28.62

まあそうね。
過去スレも、なんかプロンプトの後ろの方無視されるんだけど？ってことから検証になってたからその辺注意ぐらいかな

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 19:56:40.89

今はhlkyとかAUTOMATIC1111のGUIなら制限教えてくれるようにもできるし

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 20:08:44.13

ライセンス表記ってどうすればいいの？
画像使う時も必要っぽいけど。

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 20:23:40.88

クリスタプラグインのnekoなんちゃら試しとるやつおらんか？

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 21:29:18.58

今はソースしか公開されてなくてビルド済みプラグインのリリースはまだらしいので居ないと思う
https://github.com/mika-f/nekodraw

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 21:31:47.62

そういやフォトショのプラグインってローカル環境必要なんだっけ？
新しいモバイル買って写真はそっちメインになるんだけどXeしかないのよな
dGPU付きの15インチも持ってはいるけど気軽にスタバとか行けない

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 21:36:05.19

>>76
今はUsageのとこから落とせそうだよ
俺はAMD環境だから試せないけど

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 21:36:17.02

ファイル鯖かデスクトップにサーバー立てるとかでもいいんだろうけど素人には難易度高すぎる
と思ったけどVPNからweb UIみたいにローカルの代わりに走らせてるマシンのポートに繋ぐとかでいいのかな

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 21:41:12.21

>>78
> 今はUsageのとこから落とせそうだよ

リンクが https:/github.comだから現時点ダミーな気がする

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 21:44:00.79

またひとつデスクトップアプリが増えたらしい　これはCPUでも動かせるオプションがあるみたい
https://gigazine.net/news/20220905-stable-diffusion-ui/
https://github.com/cmdr2/stable-diffusion-ui

>>78
Downloadリンクはあるけど、まだダミーみたいだった

>>79
gradioにインターネットで公開するオプションあるからパスワードかけてそれ使うのがいいかも
hlky版だと --share と --share-password オプションがあるので

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 21:57:50.30

ちなみにhlkyってなんて読むの？ハルキー？

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 21:59:57.13

GIGAZINEは体裁を整えただけの5ちゃんまとめと変わらないな
ライブドアニュースも記事パクってるの草

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 22:13:57.57

https://github.com/justinpinkney/stable-diffusion

生成画像からイメージバリエーションを生成するフォーク
・元々あるCLIPテキストエンコーダを削除して、CLIPイメージエンコーダに変えた
　インプットイメージに似ているが、細部が違うバリエーションを生成する
　（img2imgとは完全に違うアプローチ）

・モデルもファインチューニングしたものを用意(LAION aethetics v26+ datasetを学習)

---

CLIP＝言語ガイダンスだと思ってたら、CLIPイメージエンコーダなんてあるんだと初めて知った
モデルはこの機能と独立した改善版なのかな？

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 22:15:00.66

あそこ中身はただの週刊誌だからね
よくわからん身内の土地問題とかやってしかも敗訴らしいし

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 22:20:06.23

>>85
あれやってること完全ヤクザなんだよね。。。
あの事件以来gigazineは読まないようにしてる。

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 22:20:41.85

日本語で出力してみるのも楽しいな
リボンつけた猫のキャラとか中国のパチ物っぽいのでてくる

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 22:21:09.17

GIGAZINEの記事、１つしか見てないけど日本語で丁寧に解説してて役に立ついい内容だと思ったな
まあ、最新を追うなら英語ソース読むとか、自分で検証するとかってなるし、分かってる人が読む記事ではないと思うけど

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 22:24:47.18

お神輿が出したくて試したがだめだった
漢字ローマ字とポータブルシュライン（deeplとgoogleさんによる和訳）はお祭りっぽい感じにはなるけど本体が映らない
日本文化には弱いかね

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 22:30:43.72

>>84
意訳が過ぎやしないか？

CLIPに入力画像を解釈させてそれをプロンプト代わりにして
モデルにはCLIPを訓練したのと同じデータセットでファインチューニングしたものを使って
CLIPが見たものとSDが出すものを一致させるついでにちょっと変えてバリエーションを作るって話だぞ

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 22:33:31.64

>>90
そうなんだ？

これ見て書いちゃった
https://twitter.com/GaggiXZ/status/1566756889714724864
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 22:42:03.22

>>89
神輿は認識してるが、神輿の画像＝取手のあるものばかりじゃなく
地面に本体だけ置いてあるものや組み立て前のも含まれてるようだ
期待の物が出てくる確率はかなり低そう

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 22:56:59.03

((()))が怯えて弱いイメージで[[[]]]が硬く強いイメージなのに逆なのか…

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 23:00:01.94

>>92
まさにそれでミニチュア神社が鎮座する場面だらけ
キャリーとか入れるとそれを持ち上げる奇妙な絵になってしまうし、神輿で有名な祭りとかを指定しても駄目だった

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 23:16:20.10

学習してない概念はどう指定しても無理っぽい気がする
逆に学習してるものなら指定しなくてもバイアスから読み取ってから勝手にやってくれる気がする

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 23:26:50.21

御輿運ぶ取っ手っぽいものは英語圏に無いのかね
それにミニチュア神社乗せる荒技ぐらいしかもう無いでしょ

**名無しさん＠お腹いっぱい。** · 2022/09/05(月) 23:33:41.89

>>89
日本文化に弱いってのは実感してる
巫女さんや黒髪ポニテに導こうとしても
そうじゃない（緋袴）とか、白リボン結びは
色んな説明をプロンプトに突っ込んだが
どう詳しく書いても、既存キャラ名指定しても
描いてくれなかった
着物や浴衣やスク水はあんなに的確に書いてくれるクセに

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 00:22:30.63

何度かテストしてみた結果TIﾌｧｲｰﾝはある程度元画像は似通ったものにした方がいい感じ

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 00:40:34.05

よく目にするけどﾌｧｲｰﾝって表記は何かのミームなのか？

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 00:42:17.98

>>19
kritaを管理者実行したらkritaのプラグイン動いたわ
なかなかインペイントむずいな
物体を認識して付近に似たものを描画してくれるけど境界線がどうしても目立ってしまう

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 00:55:51.68

これ初期シードの影響大きいな
シード値一緒ならワード増やしたり減らしたりしても同じポーズとるわ
動詞変えたらさすがに多少違うポーズ取るけどそれでも顔は同じところから生えてくるし腕とかも同じように使おうとする

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 01:48:38.58

Autoエンコーダーが学習してないものは出力として再現不可能だから
img2imgで詳細な形を指定しようが全然無理っぽい

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 01:55:14.35

Kritaやっぱまだ使いづらいな
ベースの強さ的にもphotoshopが覇権とるか

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 02:07:43.55

ついに「CLIP STUDIO PAINT(クリスタ)」で画像生成AI「Stable Diffusion」を動かすプラグインが登場
https://gigazine.net/news/20220905-clip-studio-paint-stable-diffusion-nekodraw/

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 02:48:58.29

SDアップスケールは両方できるけどRemacriが使えたり細かい設定ができるヴォルデモート版のほうがいいな

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 03:43:54.98

ツイッターでもライセンスの書き方に迷ってる人は結構いるな。

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 06:12:33.13

革命起こっててワロタwwww

1050ti VRAM4GB、ターボオプションありで
512x894, 704x640 まで安定して出力できた
(元は 512x640, 576x576 辺りが限界)
https://i.imgur.com/2W2qLIP.jpg
https://i.imgur.com/jn4lgGR.jpg

hlky版で動作確認

【改良版の適用方法】
① ldm\modules\attention.py
この中身を↓に置き換える
https://raw.githubusercontent.com/Doggettx/stable-diffusion/d3c91ec937a4f1d4fc79b68875931bdb5550bb6e/ldm/modules/attention.py

② ldm\modules\diffusionmodules\model.py
この中身を↓に置き換える
https://raw.githubusercontent.com/Doggettx/stable-diffusion/d3c91ec937a4f1d4fc79b68875931bdb5550bb6e/ldm/modules/diffusionmodules/model.py

(該当箇所をうまく変更すればどのverでもいけるらしい)

【参考】
https://www.reddit.com/r/StableDiffusion/comments/x6dhks/fork_for_automatic_memory_allocation_allows_for

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 06:39:47.28

同じ画像サイズの出力スピードはどんなもん？
変わらないなら入れてみるかな

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 06:41:51.18

>>108
試してないけどredditに乗ってるコード見る感じ、メモリが超過しそうなら小刻みにする、って感じだから同じ解像度なら変わらないんじゃなかろうか
メモリが超過しそうかどうかの判定は追加されてるけど

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 06:42:00.15

https://twitter.com/meng_shengyu/status/1566785389855129601
Simon Meng @meng_shengyu (2022/09/05 22:48:41)

Currently develop a colab version of dreamfields which could generate 3D model and 360° videos by text & image prompt input.
Here is a flower tree video / 3D model generated by text prompts.

https://pbs.twimg.com/ext_tw_video/1566784113843077122/pu/vid/720x720/VpNqcdwz7t_uKu-b.mp4

3Dモデル版のサンプルですって
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 06:45:28.51

単語に+,-と数字の重みづけ同時にできるフォークってある？

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 06:54:32.20

hlky版が：数字、名前言えない人版が括弧式

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 06:57:29.95

>>112
「名前言えない人」ってなんですか？　統一教会関係？

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 06:58:52.95

>>107
8Gで1024ｘ960までは出せたわ
すげーな

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 07:02:16.72

11111の人版の通称がヴォルデモート版とか名前言えない人版とか

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 07:04:43.44

>>115
https://github.com/AUTOMATIC1111/stable-diffusion-webui
のこと？

幼稚なやつだな。くだらんこといってんじゃねーよ

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 07:10:17.30

dalleやkritaみたいなアウトペインティングのライブラリってないの？

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 07:11:02.67

>>115
無知ですまんけどAUTOMATIC1111と仮に言ったら何が起こるの？　誰かに怒られるとか？

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 07:18:13.81

4chanに書き込んだらBANされるとかなんとか
https://pastebin.com/raw/8SuS2LRy
そこらのネタはよく知らん、説明しないからいい加減ちょい鬱陶しいな

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 07:21:30.96

ああわかった
https://github.com/AUTOMATIC1111/4chan-captcha-solver
これを作った人だそうでｗ
なるほどなぁ

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 07:23:05.11

>>115は、ここを4chanと思い込んでるキチガイってわけじゃないんだろうが、まあアホだな

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 07:27:44.23

>>114
1024*960=983040 10万弱まではいけるんだろうというわけで1280*768をテスト、無事通過
https://i.imgur.com/c1Z1SnI.png

1280*832は案の定エラーで落ちた

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 07:32:43.52

>>122
1920x512
https://i.imgur.com/VTAiJtb.png

512x1920
https://i.imgur.com/t7tTf3A.png

Futuristic sci fi jet lands at runway of cyberpunk city, night photo, dark cinematic lighting, digital concept art
steps:20 cfg_scale:8 sampler:k_lms

3070tiで1枚およそ30秒

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 07:42:08.93

まぁ4chanはこのスレで書き込まれてる相当量の情報源らしいんで、敬意は払うが

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 08:10:56.92

>>107
すごい。情報ありがとう。
まさに今使っているのが1050tiで3060を夕べ買っちゃったんだけど、慌てて買わなくてもよかった説?
ほかのStable Diffusionでもパラメータを同じにして実行したら、改変スクリプト版とまったく同じ絵がちゃんと出てくるのかな。

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 08:16:15.51

巨大画像は同じ風景の繰り返しみたいなのしかないな
もっと情報の詰まった画像出すのは不可能なのか？

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 08:19:21.92

>>126
全体に整合性があるでかい絵を真面目に生成するならVRAMいっぱい使って作るしかないね
なんか技があるかもしれないけど

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 08:20:11.12

>>125
VRCHATしようぜ

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 08:22:07.44

>>107
AUTOMATIC1111版でも試したけど確かに上限突破してる

アウトペインティングで継ぎ足すようなアルゴリズムなんだろうか

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 08:27:14.31

>>129
コードを見るとこれからやる処理の必要メモリ量が、フリーのメモリ量より上回ってたら分割して実行するって感じぽい

if mem_required > mem_free:
steps = 2**(math.ceil(math.log(mem_required / mem_free, 2)))

slice_size = q.shape[1] // steps if (q.shape[1] % steps) == 0 else q.shape[1]
for i in range(0, q.shape[1], slice_size):

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 08:28:21.91

hlkyのバグなくなったら起こして

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 08:33:52.49

ああ畜生…家のオンボロPCがこれ程頼りないと思った事は無い
自由気ままに作れんとは

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 08:40:10.79

>>126
>>107 のRedditの似た質問に対する回答では
img2imgをうまいこと組み合わせるといいらしい

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 08:48:26.86

512x512でだけ学習してるので、長尺の画像を作るときにどうすればいいかを持ち合わせていない
1024x1024なら比較的まともな絵が得られるはず

別にメモリ節約のために画像をつなげている訳じゃない
VRAMが多くてもこれと同じ画像が出る

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 08:49:33.29

>>125
たぶん３０７０だとやれる幅広がるから間違った選択ではないと思う

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 08:51:39.23

結局モデルの学習サイズがネックになるんだね
小さい画像を高速で出して人間がつなぎ合わせるワークフローのほうが希望を感じるな

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 08:51:52.59

ガチャ回せる回数が増えるのは嬉しいね

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 08:52:03.31

AUTOMATIC1111の方で1600x960（1536000）まで行けたわ
1920x832(1597440)はムリだった
https://i.imgur.com/CVNpWHu.png

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 08:55:35.26

>>107
スゴイ助かると思ったけどうちだと576×576異常でエラーが吐き出されて激萎え

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 08:56:24.90

>>128
3060ならVRもへっちゃらだね。VRは興味はあるけど1050tiでは諦めてた。
1050tiはあと数年は使い続けるつもりだったのにStable Diffusionのことだけを考えてRTXデビューするから、RTXにはRTX voiceとかレイトレーシングとか「そんなことができるんだ」な機能がたくさんあると知って驚いてる。
夢が広がるなあ。

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 08:59:17.62

>>139
プログラム再起動した？

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 08:59:46.94

有名所のwebuiのdocker版作ってるみたい
帰ったら試す予定
https://github.com/AbdBarho/stable-diffusion-webui-docker

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 09:01:03.75

>>138
綺麗だねえ
下の方の小さい人と縦長のレイアウトでスケール感が素晴らしい

>>134
繰り返しぽいイメージになるのは512x512で学習してるからなのかな
言語ガイダンスの問題で、右の方にビルがあって、左には川がある、・・・みたいな複合的な要素があるイメージ生成が苦手とどっかで読んだのでそういう問題もあるのかなと思ってた

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 09:05:14.54

風景画を640から1024生成にした時のQualityの低さに落胆したけど、
その違和感や落胆の正体は　同じ細部をコピペしたようになる　なんだな
サイズでかくなって単純に嬉しいと思ってたが、まだでかいサイズでの学習結果が最適化されてないのか、
個人的には明らかに640の方が面白く良い絵を作れてる
現状、サイズを大きくすればバリエーションが本当になくなってる

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 09:13:56.88

>>138
GPUは何？

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 09:28:23.97

>>107
これって出力結果は全く変わらずに計算負荷だけ下がるの？
それとも結果自体に手を入れてる？？

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 09:37:54.82

>>146
結果は変わらないらしい
https://i.imgur.com/Z16Q8ub.jpg

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 09:38:31.83

その風景画でのサイズのクオリティ差っていうの、画像が見てみたいな
俺でかいサイズ作れないから
512までしか出してないんだ

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 09:40:01.25

>>147
ありがとう☺
個人的には結果を変えてもいいと思ってるけどpromptとseedが同じなら同じ結果が出るってのがSDの特徴でもあるしなー

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 09:40:42.67

>>141
プログラム書き換えてから立ち上げたからどうだろう
ノートパソコンのRTX2060だから貧弱なんかな？
メモリ合計１４１２７MB
表示メモリ（VRAM）８１４７MB

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 09:42:40.96

>>150
すまん途中で書き込んだ
共通メモリ　８１４７MB

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 09:44:33.00

MJは高解像度でも全体のバランスを取ってるけど
SDは高解像度だと同じパターンの繰り返しになるかんじ。上で出てる画像がちょうどそんな感じだけど

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 09:47:47.53

>>107
GTX1080 8G 576x576 までいけたわ
本家のローカルに入れただけだったが、今までは448ｘ448が限界だった
これ計算はかなりでかくてもやってるけど、保存前の？メモリ確保に耐えられないで落ちる
これ改善すればかなりデカくてもいけそうだな。

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 09:58:41.32

1111版Webuiだけど4GBのGTX980でも1024*576、960*640、896*896出せた
けど明らかに出来上がりがおかしい
出せるレベルではないくらいおかしい
可愛い子一人だけ出るプロンプトなのに可愛くない子二人出るし片方は髪の毛が離脱してハゲになってしまう…
過去の遺物的グラボだから起こるおま環？…
しかしColabを使わずとも640が出せるのは嬉しい
ｻﾝｸｽ

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 10:02:29.29

顔が二つ出る現象は512を大きく超えた時の典型的な現象
スペースが空いてるからそこにまた顔を見出して描き始めてしまう

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 10:08:31.25

正方形から外れた場合、伸びた方向に対してプロンプト要素を埋めようとしてなんとかって話はちょいちょい出るね
正方形で大きくしたらどうなんだろ

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 10:09:14.42

レベッカ・ファーガソンとか同姓同名の人物と合体してしまうのはどうしようもならないもんかね

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 10:14:33.55

スペース区切りとかでレベッカ(ファーガソン)さんとファーガソン(レベッカ)さんみたいな認識になってる可能性？
アンダーバーとかなにか記号で苗字名前くっつけてみるとか

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 10:14:39.32

縦長画像を作り始めると人間の鎖骨のあたりは実は額の曲線と似ているという謎の事実に気付かされる
似てるから繋がると思って生やしちゃうんだよなきっと

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 10:15:53.87

あ、同姓同名の複数人が悪魔合体か
byなんとかとか職業名頭につけるとかで個人指定強化してみるとか

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 10:18:18.81

スウェーデンの女優とかミドルネームとかつけても意味なかったよ

それよりドリスタで1.5使えるようになったらしい

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 10:35:03.04

マジじゃん
ローカル版も1～2週間後らしい
https://i.imgur.com/cBwNBD1.jpg

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 10:36:25.57

automaticでtiling機能が追加された
うっかりONにしたまま人間かくと酷いことになる

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 10:39:12.24

まともな作品作りに作ろうと思うとやっぱり背景の一部分に使うのですら
人間が描く絵よりクオリティ低すぎて駄目だなって感じるな
一見背景は人間より上手く見えるけど雰囲気だけでお金を取れる絵ではないなぁ
AIの絵って上手いのか下手なのか分からなくなってくる

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 10:39:15.73

手の消失はマシになったがそのかわりあらぬ方向に曲がった6本指の手が出現する
足の消失は改善がみられない
画風指定の時にby ～では効かなくなりpainted by ～、illustrated by ～等の明確な指定が必要になりトークンを浪費する

って1.5Betaでの評判で早く欲しいぜって人が少ない印象

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 10:43:36.04

1.5しょぼいのか
しばらく停滞しそうだな

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 10:43:48.11

>>164
スポイトツールとしてはまあまあ有用だと思う

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 10:45:30.44

人間に出せないような色合いとか発想に利用価値はあると思う
ただ手直しできる技術は必要かと

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 10:45:51.12

1.4 と 1.5 の比較画像とか見る限りではわりと良さそうな感じだったけどどうなんかな

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 10:52:50.57

nvidia Eosが運用開始されたら半日とかでトレーニング終わるのかな

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 10:54:53.50

プロンプトをAIに考えさせてそれ使ってゼロから学習しなおすとかじゃないからな
1.4に上乗せで学習させてるだけだからあんま期待できない

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 11:30:14.14

>>144
そもそも学習データが512ｘ512なんだから、
画像大きくしても基本的にはクオリティが落ちるだけだよ

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 11:34:13.95

女優の名前の前にyoungってつけたところで無関係の若い人と近影を合体させたみたいな別人が出てくるのどうにかならないか

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 11:35:24.60

dreamstudioから手で動かすだけならもう1.5が使えるっぽかったので雑検証
1.5 https://i.imgur.com/vaftBrf.png
1.4 https://i.imgur.com/yOuWiQ9.png

どっちもseedや設定は同じ、1.4側は2枚NSFWフィルタにやられて消えたけどseed変えてやり直すのがだるいので許して
seedもプロンプトワードもなんとなくは引き継げるが全く同じではなくなる程度の差
これだけ見ると1.4を選ぶ人も出そうだし流派が分かれるかも

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 11:52:29.83

>>142
試したけどWSL環境だとimg2imgがエラーになって使えない
issueには上がってて修正予定らしい

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 11:55:40.55

DSって名前を久しぶりに聞いた
いつしかそんなのあったなぁレベルに

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 12:01:06.18

>>162
楽しみやね

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 12:08:10.31

アニメ版モデルについてはなにかアナウンス来てないのかしら
すぐ(soon)発言から結構たってるような

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 12:10:42.65

DreamStudioはエロ隠しボケ画像でポンド消費するのに腹が立ってやめたんだった
そこは真っ黒に白文字で抵触しましたみたいな英語出す代わりに消費なしにすべきなのに
MJみたいにRelaxモードないのも辛い

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 12:15:06.18

>>175
issueにあるのってhlky本家にあるエラーだからそっちが直ったら反映するって感じに見える
docker-compose.ymlのcontextを変更したらhlky以外も使えると思うけどAUTOMATiC1111版もダメそう？

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 12:17:11.98

> 777名無しさん＠お腹いっぱい。2022/09/03(土) 04:28:26.47ID:LqC0C0nC
> hlkyのvariation機能試そうとしてアプデしたら
> webuiの連続最大生成数が250から50になっとる…
> この数値ってどっかでいじれたりする？

> 778名無しさん＠お腹いっぱい。2022/09/03(土) 05:10:12.24ID:3VRHtVkz>>781
> configs\webui\webui.yamlの19行目

こういうありがたい情報が蓄積されていくのが掲示板の良いところだよな

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 12:19:22.74

>>175
モード切り替えたりするといけるんでない？

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 12:21:02.73

webuiはn_iter実装は無いのかしら(batchだとメモリ足りない)

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 12:23:28.79

>>151
高画質いけました
暇だから動画見てたらそらGPU使うわなアホか俺

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 12:41:12.74

>>178
あれもしかすると動画生成版のことじゃねえのという話
続報は一切無い

それはそれとしてdanbooruデータセットで訓練したwaifu-diffusionがhuggingfaceのdiffuserパイプライン使って動くようになった
チェックポイントファイルは数日後公開だとか

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 12:54:08.38

>>152
今のところはそうみたいね。
大きい画像に顔のアップが一つだけドーンみたいなのもそのうちできるようになるさ。

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 13:03:11.86

RTX3060 (VRAM12GB)でファインチューニング実験メモ

入力 https://i.imgur.com/tXFyNgo.png
※ソフトはイージーポーザー
設定 https://i.imgur.com/7cwqkZ5.png
※非推奨のVRAMで無理やり動かすために設定をかなり下げている
出力 https://i.imgur.com/o6lCEgJ.png
※時間は Global Step 70K までで4hほど

質感や髪形くらいは覚えてくれて
服装など大きいもの？を学習させるのは大変そうだなという感覚

ドキュメントによると通常はGlobal Step 3K～7Kで良いらしいけど
自分の出力で20K～30Kのあたりが一番マシに見えるのは設定下げた分かも知れない
（ひょっとするともっと必要な可能性も）

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 13:26:19.33

4chanでテンプレにヴォルデモート版をpastebinで貼るとスレが消されて投稿者が規制回避の名目で10分間BANを食らうようになってしまった…

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 13:43:29.23

webuiの他に4chanのcaptcha抜くコード公開してるのか
そりゃbanされるわ

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 13:43:32.27

teenageとかyoungは名前の真ん前に置くとそこそこ別人になる(感覚的には輪郭が変わる)から間に別の特徴挟んで誤魔化すしかない
同系統の美人が欲しいだけなら前者の方法をとればいい

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 14:02:05.80

1111Webui使ってるけど…安全なんかな…………
情報とかプロンプトとか全部筒抜けになっていつか暴露されるんじゃ…………

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 14:05:17.43

いや4chanのほうが悪いに決まってんじゃん

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 14:16:12.77

少なくともAUTOMATIC1111はオフラインで動かせるから安心していいぞ
他のは知らない

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 14:16:31.13

>>191
オープンソースなんだから心配ならソース読めばいいんじゃね？

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 14:20:45.92

まあカスタマイズする際にコード隅から隅までみたけど
通信関連の実装なんて一切含まれてないよ
ひとつあるとすればGradioモジュールの部分くらいか
share=Trueにしてパブリックリンクを作らない限り通信は行われないが

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 14:23:10.36

>>145
3070ti 8GB

>>152
MJの高解像度はいきなりデカいのを生んでるわけじゃないからな
SDで言うなら512で出してうまい具合にi2iでアップスケールするようなもん
これ一般化されれがマジで凄いことになるんだけどなぁ

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 14:31:11.47

よくわからないけど安全なら良かった……

1111様、いつも使わせて頂きありがとうございます…

私は愚かな民衆ですが敵ではありません…

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 14:42:19.21

>>187
log/プロジェクト名/checkpointに保存されてるepoch=数字.pkcpみたいなファイルと同じ時刻のやつが一応一番スコアが良かった結果を指してる

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 14:59:19.67

automatic1111版少し導入に手間取ったけど使いやすいよな
hlkyのimg2imgの簡単なお絵かき機能欲しいとはおもったけど

**名無しさん＠お腹いっぱい。** · 2022/09/06(火) 15:05:26.81

>>173
クリント・イーストウッドだと

young clint eastwood from dirty harry
old clint eastwood from gran torino

みたいに書いたら若いのもじいさんのも出てきたよ

https://i.imgur.com/jBN60Wx.jpg