X



Midjourney】AI画像生成技術交換4【StableDiffusion
レス数が1000を超えています。これ以上書き込みはできません。
0001名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 07:58:40.81ID:aWfqEhq/
英語の文章が画像に!
背景に使うか?イラストのアイデア出しはもちろん、
与える英文を捏ね捏ねして思いがけず生成される秀逸画像ガチャで遊ぶのも楽しい
有料サブスクで商用利用まで可能なAI画像生成サービス

★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
(以下のスレッドへ移動してください)
AIイラスト 愚痴、アンチ、賛美スレ
https://mevius.5ch.net/test/read.cgi/illustrator/1661305344/

前スレ
Midjourney】AI画像生成技術交換3【StableDiffusion
https://mevius.5ch.net/test/read.cgi/cg/1661762186/

テンプレまとめ
https://rentry.co/zqr4r
編集コード「5ch」
0002名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 08:02:50.34ID:aWfqEhq/
ああ、しまった

漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
(以下のスレッドへ移動してください)
【Midjourney】AI関連総合【StableDiffusion】
https://mevius.5ch.net/test/read.cgi/cg/1661853927/

だった
次スレからここ更新してね、わざわざイラ板に飛ばすのも変だし
0004名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 08:42:01.36ID:RcdJdJk4
KAWAII汎用プロンプトのnote有料記事の公開で
あの作者すげー尊敬してたけど一気に胡散臭くなってしまった
よく考えたら一つもプロンプト公開してないから当然信用なんてもの持てないな
0005名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 08:57:59.56ID:ScLAAoNK
他人のふんどしで金取るとか恥ずかしいよ
0006名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 09:02:20.45ID:yZTCQ1su
前スレ最後の方で出てたimagenだけど
プロンプト通り=いい絵になるとは限らないんだよねぇ・・現状のDALLE2の人気のなさ見ても
MJみたいにある程度勝手に意匠加味してもらったガチャにみんな酔心してるような
0008名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 09:50:06.51ID:dEylwYeN
ERNIE-ViLGだと知名度あるアニメキャラ混ざるとどうしてもそっちに引っ張られるな
竹取物語のかぐや姫を指示しているのにかぐや様は告らせたいに引っ張られてそっちっぽい絵が出てくる
0011名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 10:28:04.21ID:/suqkbMS
前スレ参考にAUTOMATIC1111のstable-diffusion-webui入れたけど
一番期待してたSDアップスケールという小さい画像の細部を再生成し大きな画像にする機能の使い方間違ってるのかな
つぎはぎ部分が全然スムーズじゃなくて一瞬でつぎはぎってわかる
それともそれがデフォなんだろうか
タイルアップスケールの数値やスケーラー選択とか適切な設定があったりする?
0014名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 10:43:08.67ID:+CQ4bXTz
前スレのシンプル構文貼ってくれた人ありがとうな

elf, fgo, mucha, photorealistic, anime blue colored eyes, detailed beautiful face, highly detailed, Armored Core

で謎にメカメカしい鎧を着た顔がそこそこに整った青い瞳のエルフさんが量産され始めた
0016名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 11:14:16.24ID:GDhLR30+
芸歴長い且つ若い現役女優ってエマ・ワトソン以外にいないのかなぁ
安定するから使ってるけど正直飽きた
0018名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 11:39:33.71ID:yvSZaens
>>13
>>15
㌧㌧

オードリーさんはオードリーさん風の見た目の日本人みたいな指定にすると美人さんになる(オードリー(綴り忘れた) eyed style face Japanese なんとか)
0019名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 11:44:11.83ID:fJ0klnEA
kritaのローカル版試したけどkrita→コマンドプロンプトの
通信がうまくいってないのかボタン押しても無反応だな
様子見するか
0020名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 11:53:04.36ID:GDhLR30+
オードリー・ヘプバーンはなんか拒食症みたいになってダメだったわ
30代の女優がいい感じ
若手はダメ
アリシア・ヴィキャンデル、フェリシティ・ジョーンズ、アナ・デ・アルマス
マーゴット・ロビーはやたらと皺を強調したがるので却下
0023名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 12:05:57.95ID:ZAX7RjaD
トランプ、オバマ、エマ・ワトソン、誰でも、個人名がそのものズバリの造形は出せないんだよね
出せないってのは倫理的な話じゃなくて今の実装的にオリジナル画像とは違うものになってしまう(元データが無いんだから当たり前だけど)

その辺、実用的に活用する時の大きな障害になる気がする

画像生成AIは1点ものの生成で、それをポーズやシーンなど変形させるのは別のAIということかもしれないけど
0024名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 12:09:17.19ID:PbNT54P+
実装じゃなくて学習の問題だと思うぞ
きちんと過学習させたらそのものずばり出せるようになるはず
0026名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 12:12:59.75ID:67j0rToc
イラストはもちろん写真でも写りとか加工で顔の変化はあるわけだからある程度まで似ていたら実用上の問題はない
むしろ誇張されてるぐらいのほうが本物らしいと感じるかも
0028名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 12:19:09.10ID:GZxSfduF
>>26
オリジナル画像と違う画像になっても同一人物だと分かるからいいかって人と、シーンによって違うのは駄目だろ、直せって人がいるね
日本のアニメみたいに髪の色を極端に青とか赤とか変えて人物を区別するような作品だといいのかも。
0029名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 12:19:44.31ID:yvSZaens
実在人物そのものじゃなくてそれベースに何とかそう言う応用ならわかる
さすがにそのもの使ってフェイクなんとかはらめぇ
0030名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 12:29:46.48ID:owB0Caaw
midjourneyで美女を生成させる呪文で、
slawic vogue star model
というのを見かけた。
世界的なファッション雑誌のVOGUEのスラブ系のモデル。
slawicをjapaneseやchineseにすると東洋系の特徴を濃厚に入れられてしまうけど、色々と入れ替え可能。

特定の芸能人ではないけど雑誌(の表紙?)を指定することで傾向を入れられる
0034名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 13:44:02.71ID:tnsBe91i
日本語とか絵文字はエラーにならないってだけで、ちゃんと有効なのかどうかってのも謎だなあ……
この辺はもう情報集まらないとなんとも。
区切り文字も,とか|とか色々流儀があるみたいだし。
0036名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 13:58:27.04ID:+CQ4bXTz
どっかにトークンリストがあればそれに載ってるか検索するだけなんだけど
未だに見つけられていない
0037名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 14:03:41.44ID:PbNT54P+
>>33-34
学習データが画像うpしてる人がつけてるタグをそのままパクってるだろうから
pixivとかの画像についてる日本語タグをそのまま列挙して入力してやっても
pixivのタグそのままだとイラスト指定がないから実写ばかりになったりはするけど
それなりに似てるのかな微妙だなって感じの画像が出るよ
0039名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 14:35:50.82ID:I5oLVbZH
>>4
あいつね。プロプント公開してないから何やってるか分かったもんじゃないよな。
目立つからベンチマークしてるけどしょうもなくなったらフォロー外すつもり
0041名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 14:42:04.78ID:YEgAOobX
ベンチマーク??
0044名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 14:47:02.95ID:YEgAOobX
2人もこんなトンデモ誤用するものなのかなあって思った
0045名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 14:48:22.12ID:ScLAAoNK
ベンチマークとしてヲチしてるという意味で、別に普通に理解出来るだろ‥
0046名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 14:57:36.43ID:I5oLVbZH
俺が発端だけどしょうもなさすぎることでスレ消費するのは勿体ないのでここまでにしてもらえんじゃろか
0047名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 14:57:56.41ID:Vwn4XMAn
今出てるプロンプト(笑)呪文(笑)ルーン(笑)なんてどうせ数ヶ月後には何の意味も価値もなくなってるw
0048名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 15:01:36.84ID:5t5bdFnb
鼻につくのはわからんでもないけど本人も時間の問題で役に立たなくなるって書いてるしほっとけって
0049名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 15:03:53.55ID:PZqsQHOH
オードリー・ヘップバーンAudrey Hepburnはお年を召してからの画像も学習しているだろうからとyoungをつけたら少しよくなった
あとはfrom roman holidayとかfrom sabrinaをつけたらどうかな
30代がよければfrom Breakfast at Tiffany's, from My Fair Lady, from How to Steal a Millionなど

アン・ハサウェイAnne Hathawayは眼が巨大だし笑顔になりやすいみたい
0050名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 15:05:02.06ID:kel2IxsN
各種ウェイトの使い方

automatic1111版
()で強く、[]で弱くなる

hlky版
a forest under night sky: by Studio Ghibli:1.8 in the style of Starry Night:2.3
のような入力が可能(省略したら1.0)(使う時はカンマの代わりにウェイトを書く)

basujindal版
tabby cat:0.25 white duck:0.75 hybrid
のような入力が可能

本家はないはず。
artroom版、NMKD版、GRisk版などは不明。
0052名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 15:38:05.18ID:X0gZA6g9
生成したいものに合わせたファイーン用のデータセットはどっちに転んでも使えそうなのでちまちま貯めてる
呪文は...
0054名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 16:06:23.18ID:5/a6jdMW
>>25
時間切れって?
まだ試してないんだがベータ版時間制限あるの?
0056名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 16:32:11.67ID:5IncDLwm
エマ顔が強すぎるけど
+クロエモレッツで丸顔童顔要素プラスできる(たまにブスになるけど
俺はこれにアナデアルマスとナタリーポートマン足すのを基本にしてる。
エマに似すぎず、若い美人系になりやすい。少なくとも3人くらいは混ぜた方がいい感じ。
↓色々試した感想
マーゴットロビー:眉上がってキリっとする
アンジェリーナジョリー:たらこ、しわ、エラ、ケツアゴ
アンハサウェイ:眉あがる、唇厚め
アナデアルマス:目でかくなる、鼻細くなる
ナタリーポートマン:整う、エマに近い
0058名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 16:48:47.71ID:yvSZaens
単語A:1.3 単語:0.5 なんて形式の強弱フォーマットもあるけどこれ各フォークでの独自実装だわね
0059名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 17:21:35.13ID:MfD3e9Aa
SDではイラスト調の顔は崩れるなんて話もたった1週間ほどの研究でどんどん覆って
人間が手で描くと何日かかるか分からないような顔が数秒で出てくるようになってしまったな
これ年内に人間の絵なんて完全に終了するでしょ、速度も品質も圧倒的な差がついて
0062名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 17:56:49.18ID:1bIbTAPY
>>52
ファインチューニング(textual inversion)のptファイルって、モデルが変わっても使えるのかな?
追加学習って言葉のイメージからモデルのバージョンが変わると使えなくなるように思いこんでた。
0065名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 18:29:14.85ID:h8IzHV7Z
>>33
https://github.com/Maks-s/sd-akashic
こことここからのリンクにStable Diffusionについての情報が結構まとまってる
重要なのとしては以下

プロンプトは75単語までしか有効じゃない
大文字小文字は区別しない
Unicode文字が有効(だから絵文字とか日本語の単語ならOK)
同じプロンプト、同じシード値、同じ設定なら同じ絵が出てくる

あたりかな
0066名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 18:36:54.33ID:PZqsQHOH
>>14
アーマードコアは冗談で入れてみただけなんだけど、顔が整ったりはせず鎧が強化されただけなのが面白かった
0067名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 18:41:02.28ID:X0gZA6g9
>>62
詳しくないがptは多分無理だと思う
ここで言ってるのはトレーニングデータのセットのこと、要は画像フォルダ
人なら顔立ちや絵柄ごとに、ものや道具なら全体像がいろんな角度から写ったもので集めて保存してるだけ
新しいモデルが来たらスクリプト一発でfine tuningし直せるように準備してある
0068名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 18:42:46.62ID:1bIbTAPY
>>65
> プロンプトは75単語までしか有効じゃない

単語じゃなくてトークンなんだよね。
トークンって何?っていうのは明確に書いてる場所がわからないけど、過去スレで検証してた内容としてはこんな感じだった。

・日本語文字などUnicodeは1文字=2トークン(Unicodeは2バイトとじゃないものもあるので文字によっては1文字=3トークン、4トークンとかもありそう?)
・","も1トークンになる
・Girlとかの単語は、1トークン。 しかしSwimingは、”Swim"+”ing"の2トークン
 とかトークンカウントはよく分からない
0069名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 18:48:22.17ID:h8IzHV7Z
>>68
トークンは読めてたけど大体単語と同意義だと思ってた
過去スレで検証済みだったのか
教えてくれてありがとう

トークンカウント、たぶん形態素解析ってやつかけて単語数をカウントしてるんだと思う
単語くらいしか知らない程度なのでこれ以上のことは言えないけど
0071名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 19:36:43.83ID:o8EbExh/
トークンの話は混乱を招くだけな気もするから「そんなもんがあるんだ~」ハナホジーくらいが良い気もする
分け方に規則みたいなものはないし
0072名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 19:49:28.62ID:1bIbTAPY
まあそうね。
過去スレも、なんかプロンプトの後ろの方無視されるんだけど?ってことから検証になってたからその辺注意ぐらいかな
0074名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 20:08:44.13ID:0/+f7+AD
ライセンス表記ってどうすればいいの?
画像使う時も必要っぽいけど。
0075名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 20:23:40.88ID:PzfqlbaI
クリスタプラグインのnekoなんちゃら試しとるやつおらんか?
0077名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 21:31:47.62ID:Ox5Q16DG
そういやフォトショのプラグインってローカル環境必要なんだっけ?
新しいモバイル買って写真はそっちメインになるんだけどXeしかないのよな
dGPU付きの15インチも持ってはいるけど気軽にスタバとか行けない
0079名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 21:36:17.02ID:Ox5Q16DG
ファイル鯖かデスクトップにサーバー立てるとかでもいいんだろうけど素人には難易度高すぎる
と思ったけどVPNからweb UIみたいにローカルの代わりに走らせてるマシンのポートに繋ぐとかでいいのかな
0081名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 21:44:00.79ID:kel2IxsN
またひとつデスクトップアプリが増えたらしい これはCPUでも動かせるオプションがあるみたい
https://gigazine.net/news/20220905-stable-diffusion-ui/
https://github.com/cmdr2/stable-diffusion-ui

>>78
Downloadリンクはあるけど、まだダミーみたいだった

>>79
gradioにインターネットで公開するオプションあるからパスワードかけてそれ使うのがいいかも
hlky版だと --share と --share-password オプションがあるので
0082名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 21:57:50.30ID:5/a6jdMW
ちなみにhlkyってなんて読むの?ハルキー?
0083名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 21:59:57.13ID:+qFi5P8v
GIGAZINEは体裁を整えただけの5ちゃんまとめと変わらないな
ライブドアニュースも記事パクってるの草
0084名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 22:13:57.57ID:xxwP/D+V
https://github.com/justinpinkney/stable-diffusion

生成画像からイメージバリエーションを生成するフォーク
・元々あるCLIPテキストエンコーダを削除して、CLIPイメージエンコーダに変えた
 インプットイメージに似ているが、細部が違うバリエーションを生成する
 (img2imgとは完全に違うアプローチ)

・モデルもファインチューニングしたものを用意(LAION aethetics v26+ datasetを学習)

---

CLIP=言語ガイダンスだと思ってたら、CLIPイメージエンコーダなんてあるんだと初めて知った
モデルはこの機能と独立した改善版なのかな?
0085名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 22:15:00.66ID:ukdYrT7X
あそこ中身はただの週刊誌だからね
よくわからん身内の土地問題とかやってしかも敗訴らしいし
0086名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 22:20:06.23ID:t94ug+/s
>>85
あれやってること完全ヤクザなんだよね。。。
あの事件以来gigazineは読まないようにしてる。
0087名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 22:20:41.85ID:d76w8eR/
日本語で出力してみるのも楽しいな
リボンつけた猫のキャラとか中国のパチ物っぽいのでてくる
0088名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 22:21:09.17ID:xxwP/D+V
GIGAZINEの記事、1つしか見てないけど日本語で丁寧に解説してて役に立ついい内容だと思ったな
まあ、最新を追うなら英語ソース読むとか、自分で検証するとかってなるし、分かってる人が読む記事ではないと思うけど
0089名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 22:24:47.18ID:ukdYrT7X
お神輿が出したくて試したがだめだった
漢字ローマ字とポータブルシュライン(deeplとgoogleさんによる和訳)はお祭りっぽい感じにはなるけど本体が映らない
日本文化には弱いかね
0090名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 22:30:43.72ID:+CQ4bXTz
>>84
意訳が過ぎやしないか?

CLIPに入力画像を解釈させてそれをプロンプト代わりにして
モデルにはCLIPを訓練したのと同じデータセットでファインチューニングしたものを使って
CLIPが見たものとSDが出すものを一致させるついでにちょっと変えてバリエーションを作るって話だぞ
0092名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 22:42:03.22ID:wNgqRwHH
>>89
神輿は認識してるが、神輿の画像=取手のあるものばかりじゃなく
地面に本体だけ置いてあるものや組み立て前のも含まれてるようだ
期待の物が出てくる確率はかなり低そう
0094名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 23:00:01.94ID:ukdYrT7X
>>92
まさにそれでミニチュア神社が鎮座する場面だらけ
キャリーとか入れるとそれを持ち上げる奇妙な絵になってしまうし、神輿で有名な祭りとかを指定しても駄目だった
0095名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 23:16:20.10ID:A7pj4N4M
学習してない概念はどう指定しても無理っぽい気がする
逆に学習してるものなら指定しなくてもバイアスから読み取ってから勝手にやってくれる気がする
0096名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 23:26:50.21ID:+CQ4bXTz
御輿運ぶ取っ手っぽいものは英語圏に無いのかね
それにミニチュア神社乗せる荒技ぐらいしかもう無いでしょ
0097名無しさん@お腹いっぱい。
垢版 |
2022/09/05(月) 23:33:41.89ID:LX5lrhji
>>89
日本文化に弱いってのは実感してる
巫女さんや黒髪ポニテに導こうとしても
そうじゃない(緋袴)とか、白リボン結びは
色んな説明をプロンプトに突っ込んだが
どう詳しく書いても、既存キャラ名指定しても
描いてくれなかった
着物や浴衣やスク水はあんなに的確に書いてくれるクセに
0100名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 00:42:17.98ID:e0Q0PIBg
>>19
kritaを管理者実行したらkritaのプラグイン動いたわ
なかなかインペイントむずいな
物体を認識して付近に似たものを描画してくれるけど境界線がどうしても目立ってしまう
0101名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 00:55:51.68ID:+59eY0ZR
これ初期シードの影響大きいな
シード値一緒ならワード増やしたり減らしたりしても同じポーズとるわ
動詞変えたらさすがに多少違うポーズ取るけどそれでも顔は同じところから生えてくるし腕とかも同じように使おうとする
0102名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 01:48:38.58ID:6gsXsckD
Autoエンコーダーが学習してないものは出力として再現不可能だから
img2imgで詳細な形を指定しようが全然無理っぽい
0105名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 02:48:58.29ID:drnsx0qf
SDアップスケールは両方できるけどRemacriが使えたり細かい設定ができるヴォルデモート版のほうがいいな
0107名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 06:12:33.13ID:vbEo48vh
革命起こっててワロタwwww

1050ti VRAM4GB、ターボオプションありで
512x894, 704x640 まで安定して出力できた
(元は 512x640, 576x576 辺りが限界)
https://i.imgur.com/2W2qLIP.jpg
https://i.imgur.com/jn4lgGR.jpg

hlky版で動作確認

【改良版の適用方法】
① ldm\modules\attention.py
この中身を↓に置き換える
https://raw.githubusercontent.com/Doggettx/stable-diffusion/d3c91ec937a4f1d4fc79b68875931bdb5550bb6e/ldm/modules/attention.py

② ldm\modules\diffusionmodules\model.py
この中身を↓に置き換える
https://raw.githubusercontent.com/Doggettx/stable-diffusion/d3c91ec937a4f1d4fc79b68875931bdb5550bb6e/ldm/modules/diffusionmodules/model.py

(該当箇所をうまく変更すればどのverでもいけるらしい)

【参考】
https://www.reddit.com/r/StableDiffusion/comments/x6dhks/fork_for_automatic_memory_allocation_allows_for
0109名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 06:41:51.18ID:o/qxjB1W
>>108
試してないけどredditに乗ってるコード見る感じ、メモリが超過しそうなら小刻みにする、って感じだから同じ解像度なら変わらないんじゃなかろうか
メモリが超過しそうかどうかの判定は追加されてるけど
0110名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 06:42:00.15ID:+u20ioKI
https://twitter.com/meng_shengyu/status/1566785389855129601
Simon Meng @meng_shengyu (2022/09/05 22:48:41)

Currently develop a colab version of dreamfields which could generate 3D model and 360° videos by text & image prompt input.
Here is a flower tree video / 3D model generated by text prompts.

https://pbs.twimg.com/ext_tw_video/1566784113843077122/pu/vid/720x720/VpNqcdwz7t_uKu-b.mp4

3Dモデル版のサンプルですって
https://twitter.com/5chan_nel (5ch newer account)
0118名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 07:11:02.67ID:mJgmMHn3
>>115
無知ですまんけどAUTOMATIC1111と仮に言ったら何が起こるの? 誰かに怒られるとか?
0125名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 08:10:56.92ID:Pf+lXWoC
>>107
すごい。情報ありがとう。
まさに今使っているのが1050tiで3060を夕べ買っちゃったんだけど、慌てて買わなくてもよかった説?
ほかのStable Diffusionでもパラメータを同じにして実行したら、改変スクリプト版とまったく同じ絵がちゃんと出てくるのかな。
0126名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 08:16:15.51ID:HErCNKNd
巨大画像は同じ風景の繰り返しみたいなのしかないな
もっと情報の詰まった画像出すのは不可能なのか?
0127名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 08:19:21.92ID:/Md+xxjc
>>126
全体に整合性があるでかい絵を真面目に生成するならVRAMいっぱい使って作るしかないね
なんか技があるかもしれないけど
0128名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 08:20:11.12ID:U6h39kjS
>>125
VRCHATしようぜ
0129名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 08:22:07.44ID:vV6rzYos
>>107
AUTOMATIC1111版でも試したけど確かに上限突破してる

アウトペインティングで継ぎ足すようなアルゴリズムなんだろうか
0130名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 08:27:14.31ID:GLxajUmf
>>129
コードを見るとこれからやる処理の必要メモリ量が、フリーのメモリ量より上回ってたら分割して実行するって感じぽい

if mem_required > mem_free:
steps = 2**(math.ceil(math.log(mem_required / mem_free, 2)))

slice_size = q.shape[1] // steps if (q.shape[1] % steps) == 0 else q.shape[1]
for i in range(0, q.shape[1], slice_size):
0132名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 08:33:52.49ID:+QcAgDXK
ああ畜生…家のオンボロPCがこれ程頼りないと思った事は無い
自由気ままに作れんとは
0134名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 08:48:26.86ID:SS7I7xoh
512x512でだけ学習してるので、長尺の画像を作るときにどうすればいいかを持ち合わせていない
1024x1024なら比較的まともな絵が得られるはず

別にメモリ節約のために画像をつなげている訳じゃない
VRAMが多くてもこれと同じ画像が出る
0136名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 08:51:39.23ID:HErCNKNd
結局モデルの学習サイズがネックになるんだね
小さい画像を高速で出して人間がつなぎ合わせるワークフローのほうが希望を感じるな
0140名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 08:56:24.90ID:Pf+lXWoC
>>128
3060ならVRもへっちゃらだね。VRは興味はあるけど1050tiでは諦めてた。
1050tiはあと数年は使い続けるつもりだったのにStable Diffusionのことだけを考えてRTXデビューするから、RTXにはRTX voiceとかレイトレーシングとか「そんなことができるんだ」な機能がたくさんあると知って驚いてる。
夢が広がるなあ。
0143名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 09:01:03.75ID:HQ93fvrd
>>138
綺麗だねえ
下の方の小さい人と縦長のレイアウトでスケール感が素晴らしい

>>134
繰り返しぽいイメージになるのは512x512で学習してるからなのかな
言語ガイダンスの問題で、右の方にビルがあって、左には川がある、・・・みたいな複合的な要素があるイメージ生成が苦手とどっかで読んだのでそういう問題もあるのかなと思ってた
0144名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 09:05:14.54ID:J2nQenVI
風景画を640から1024生成にした時のQualityの低さに落胆したけど、
その違和感や落胆の正体は 同じ細部をコピペしたようになる なんだな
サイズでかくなって単純に嬉しいと思ってたが、まだでかいサイズでの学習結果が最適化されてないのか、
個人的には明らかに640の方が面白く良い絵を作れてる
現状、サイズを大きくすればバリエーションが本当になくなってる
0146名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 09:28:23.97ID:3huLIDIi
>>107
これって出力結果は全く変わらずに計算負荷だけ下がるの?
それとも結果自体に手を入れてる??
0148名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 09:38:31.83ID:vJGS0/8Q
その風景画でのサイズのクオリティ差っていうの、画像が見てみたいな
俺でかいサイズ作れないから
512までしか出してないんだ
0149名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 09:40:01.25ID:3huLIDIi
>>147
ありがとう☺
個人的には結果を変えてもいいと思ってるけどpromptとseedが同じなら同じ結果が出るってのがSDの特徴でもあるしなー
0150名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 09:40:42.67ID:pM8wujJ/
>>141
プログラム書き換えてから立ち上げたからどうだろう
ノートパソコンのRTX2060だから貧弱なんかな?
メモリ合計14127MB
表示メモリ(VRAM)8147MB
0152名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 09:44:33.00ID:VspCEmJa
MJは高解像度でも全体のバランスを取ってるけど
SDは高解像度だと同じパターンの繰り返しになるかんじ。上で出てる画像がちょうどそんな感じだけど
0153名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 09:47:47.53ID:8NwgWvzy
>>107
GTX1080 8G 576x576 までいけたわ
本家のローカルに入れただけだったが、今までは448x448が限界だった
これ計算はかなりでかくてもやってるけど、保存前の?メモリ確保に耐えられないで落ちる
これ改善すればかなりデカくてもいけそうだな。
0154名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 09:58:41.32ID:GRD8UH1H
1111版Webuiだけど4GBのGTX980でも1024*576、960*640、896*896出せた
けど明らかに出来上がりがおかしい
出せるレベルではないくらいおかしい
可愛い子一人だけ出るプロンプトなのに可愛くない子二人出るし片方は髪の毛が離脱してハゲになってしまう…
過去の遺物的グラボだから起こるおま環?…
しかしColabを使わずとも640が出せるのは嬉しい
サンクス
0155名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 10:02:29.29ID:SS7I7xoh
顔が二つ出る現象は512を大きく超えた時の典型的な現象
スペースが空いてるからそこにまた顔を見出して描き始めてしまう
0156名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 10:08:31.25ID:GtmYuMbk
正方形から外れた場合、伸びた方向に対してプロンプト要素を埋めようとしてなんとかって話はちょいちょい出るね
正方形で大きくしたらどうなんだろ
0157名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 10:09:14.42ID:drnsx0qf
レベッカ・ファーガソンとか同姓同名の人物と合体してしまうのはどうしようもならないもんかね
0158名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 10:14:33.55ID:BqP5lDRK
スペース区切りとかでレベッカ(ファーガソン)さんとファーガソン(レベッカ)さんみたいな認識になってる可能性?
アンダーバーとかなにか記号で苗字名前くっつけてみるとか
0159名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 10:14:39.32ID:4Vr2qjbo
縦長画像を作り始めると人間の鎖骨のあたりは実は額の曲線と似ているという謎の事実に気付かされる
似てるから繋がると思って生やしちゃうんだよなきっと
0160名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 10:15:53.87ID:BqP5lDRK
あ、同姓同名の複数人が悪魔合体か
byなんとかとか職業名頭につけるとかで個人指定強化してみるとか
0161名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 10:18:18.81ID:drnsx0qf
スウェーデンの女優とかミドルネームとかつけても意味なかったよ

それよりドリスタで1.5使えるようになったらしい
0164名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 10:39:12.24ID:6gsXsckD
まともな作品作りに作ろうと思うとやっぱり背景の一部分に使うのですら
人間が描く絵よりクオリティ低すぎて駄目だなって感じるな
一見背景は人間より上手く見えるけど雰囲気だけでお金を取れる絵ではないなぁ
AIの絵って上手いのか下手なのか分からなくなってくる
0165名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 10:39:15.73ID:SS7I7xoh
手の消失はマシになったがそのかわりあらぬ方向に曲がった6本指の手が出現する
足の消失は改善がみられない
画風指定の時にby ~では効かなくなりpainted by ~、illustrated by ~等の明確な指定が必要になりトークンを浪費する

って1.5Betaでの評判で早く欲しいぜって人が少ない印象
0166名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 10:43:36.04ID:VyD5Io0S
1.5しょぼいのか
しばらく停滞しそうだな
0168名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 10:45:30.44ID:VspCEmJa
人間に出せないような色合いとか発想に利用価値はあると思う
ただ手直しできる技術は必要かと
0170名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 10:52:50.57ID:pMsBKo3p
nvidia Eosが運用開始されたら半日とかでトレーニング終わるのかな
0171名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 10:54:53.50ID:taslP8uB
プロンプトをAIに考えさせてそれ使ってゼロから学習しなおすとかじゃないからな
1.4に上乗せで学習させてるだけだからあんま期待できない
0173名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 11:34:13.95ID:drnsx0qf
女優の名前の前にyoungってつけたところで無関係の若い人と近影を合体させたみたいな別人が出てくるのどうにかならないか
0174名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 11:35:24.60ID:4Vr2qjbo
dreamstudioから手で動かすだけならもう1.5が使えるっぽかったので雑検証
1.5 https://i.imgur.com/vaftBrf.png
1.4 https://i.imgur.com/yOuWiQ9.png

どっちもseedや設定は同じ、1.4側は2枚NSFWフィルタにやられて消えたけどseed変えてやり直すのがだるいので許して
seedもプロンプトワードもなんとなくは引き継げるが全く同じではなくなる程度の差
これだけ見ると1.4を選ぶ人も出そうだし流派が分かれるかも
0178名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 12:08:10.31ID:BqP5lDRK
アニメ版モデルについてはなにかアナウンス来てないのかしら
すぐ(soon)発言から結構たってるような
0179名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 12:10:42.65ID:6gBUp1lW
DreamStudioはエロ隠しボケ画像でポンド消費するのに腹が立ってやめたんだった
そこは真っ黒に白文字で抵触しましたみたいな英語出す代わりに消費なしにすべきなのに
MJみたいにRelaxモードないのも辛い
0180名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 12:15:06.18ID:uZ8ingWj
>>175
issueにあるのってhlky本家にあるエラーだからそっちが直ったら反映するって感じに見える
docker-compose.ymlのcontextを変更したらhlky以外も使えると思うけどAUTOMATiC1111版もダメそう?
0181名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 12:17:11.98ID:dn2pu82B
> 777名無しさん@お腹いっぱい。2022/09/03(土) 04:28:26.47ID:LqC0C0nC
> hlkyのvariation機能試そうとしてアプデしたら
> webuiの連続最大生成数が250から50になっとる…
> この数値ってどっかでいじれたりする?

> 778名無しさん@お腹いっぱい。2022/09/03(土) 05:10:12.24ID:3VRHtVkz>>781
> configs\webui\webui.yamlの19行目

こういうありがたい情報が蓄積されていくのが掲示板の良いところだよな
0185名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 12:41:12.74ID:qMLZHaIk
>>178
あれもしかすると動画生成版のことじゃねえのという話
続報は一切無い

それはそれとしてdanbooruデータセットで訓練したwaifu-diffusionがhuggingfaceのdiffuserパイプライン使って動くようになった
チェックポイントファイルは数日後公開だとか
0186名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 12:54:08.38ID:Pf+lXWoC
>>152
今のところはそうみたいね。
大きい画像に顔のアップが一つだけドーンみたいなのもそのうちできるようになるさ。
0187名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 13:03:11.86ID:vV6rzYos
RTX3060 (VRAM12GB)でファインチューニング実験メモ

入力 https://i.imgur.com/tXFyNgo.png
※ソフトはイージーポーザー
設定 https://i.imgur.com/7cwqkZ5.png
※非推奨のVRAMで無理やり動かすために設定をかなり下げている
出力 https://i.imgur.com/o6lCEgJ.png
※時間は Global Step 70K までで4hほど

質感や髪形くらいは覚えてくれて
服装など大きいもの?を学習させるのは大変そうだなという感覚

ドキュメントによると通常はGlobal Step 3K~7Kで良いらしいけど
自分の出力で20K~30Kのあたりが一番マシに見えるのは設定下げた分かも知れない
(ひょっとするともっと必要な可能性も)
0188名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 13:26:19.33ID:drnsx0qf
4chanでテンプレにヴォルデモート版をpastebinで貼るとスレが消されて投稿者が規制回避の名目で10分間BANを食らうようになってしまった…
0190名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 13:43:32.27ID:drnsx0qf
teenageとかyoungは名前の真ん前に置くとそこそこ別人になる(感覚的には輪郭が変わる)から間に別の特徴挟んで誤魔化すしかない
同系統の美人が欲しいだけなら前者の方法をとればいい
0191名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 14:02:05.80ID:GRD8UH1H
1111Webui使ってるけど…安全なんかな…………
情報とかプロンプトとか全部筒抜けになっていつか暴露されるんじゃ…………
0195名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 14:20:45.92ID:T2CPgTXz
まあカスタマイズする際にコード隅から隅までみたけど
通信関連の実装なんて一切含まれてないよ
ひとつあるとすればGradioモジュールの部分くらいか
share=Trueにしてパブリックリンクを作らない限り通信は行われないが
0196名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 14:23:10.36ID:+u20ioKI
>>145
3070ti 8GB

>>152
MJの高解像度はいきなりデカいのを生んでるわけじゃないからな
SDで言うなら512で出してうまい具合にi2iでアップスケールするようなもん
これ一般化されれがマジで凄いことになるんだけどなぁ
0197名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 14:31:11.47ID:GRD8UH1H
よくわからないけど安全なら良かった……

1111様、いつも使わせて頂きありがとうございます…

私は愚かな民衆ですが敵ではありません…
0198名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 14:42:19.21ID:BqP5lDRK
>>187
log/プロジェクト名/checkpointに保存されてるepoch=数字.pkcpみたいなファイルと同じ時刻のやつが一応一番スコアが良かった結果を指してる
0199名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 14:59:19.67ID:htXxGhWG
automatic1111版少し導入に手間取ったけど使いやすいよな
hlkyのimg2imgの簡単なお絵かき機能欲しいとはおもったけど
0201名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 15:07:22.04ID:vV6rzYos
>>198
そんな機能あったんだね ありがとう!
見てみたら16499が最もスコア良かったらしい
あんまり違いわからないけど、エンベディングファイル作ってからもガチャ回すから絞ってくれるの助かる
0203名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 15:53:56.02ID:6gsXsckD
ごちゃごちゃ背景は得意な割に絵に使えるような花とか小物とか家具とか
そいういう描くのは苦手なんだなぁ、それともプロンプト頑張れば素材系もいけるのかな
0208名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 17:27:30.95ID:DnP/MWg2
>>187
助かる
単純な置物とかじゃない人間の再現は難しそうだな
0209名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 17:36:06.90ID:drnsx0qf
teenage 名前, by Lilia Alvarado
で大体いけるかなって
しかしいくら試してもエミリア・クラークは若返らない
0212名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 17:45:28.50ID:+jYMZ+4K
>>187
画像5こ以上使うとあまりよくないとかいてあるけどそれより少ない枚数では試した?
0213名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 17:58:58.50ID:Vz+gZVMl
NMKD の1.3.0いつまでも絵が出ずにログに「Failed to move image 」が出てたら
設定からImage Output Folder に存在するフォルダを指定すること。
デフォルトだと存在しないフォルダのパスになっている
0214名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 18:01:56.76ID:VyD5Io0S
Emadさんによれば明日はもっと凄いアップデートが来るらしいな
楽しみ
0217名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 18:23:31.53ID:6gBUp1lW
>>211
ああそういうことか
今やってみようとしたけど簡単hlkyに慣れ過ぎて
分岐前のbasujindalのインストールの仕方がさっぱりわからないw
もういいや
0218名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 18:33:40.39ID:frhLprQk
縦×横が512の2乗を超えないにしてアスペクト比組んで、それをアップスケールするのがよさげ。
0220名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 18:49:29.92ID:7AjpcoTL
1024x1024とかやっても
例えば縦横に4個顔が並んでる画像みたいなのが生成されちゃう可能性が高いから
SDのtxt2imgでは無駄な高解像度はそこまで報われないな
0222名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 19:04:59.09ID:AjgaXsRm
いい加減飽きてきたんだが?
お前ら楽しいか?こんな創造性皆無の事に時間使って
0223名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 19:08:17.45ID:hf8pW55c
>>222
普通にあれこれ試すのは楽しいし少なくともそのレスを書き込むことよりも創造性のない行為ってのもなかなかないと思うぞ
0225名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 19:09:36.99ID:6gsXsckD
現状のAIは実質的には性能が低くて遅い画像検索エンジンってだけだからな
著作権問題をクリアできるからトレス批判されずに絵の制作に使えるぞ!
ってイラストレーターにしか実用上の価値はないんだよな
0226名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 19:11:46.97ID:Lh6Y3lSb
>>221
ブレンド昨日おもしろそう
ローカルで使いたい
0227名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 19:17:17.57ID:U6h39kjS
これを機にAIの勉強始めたり世の中に少なからぬ影響を与えてるぞ。
0229名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 19:21:43.83ID:AjgaXsRm
>>223>>224
悪い、俺は手と想像力をフル稼働させてクリエイティブするのが性に合ってる芸術家なんだは
他人のふんどしでクリエイティブするほど人生浪費するつもりはねえってだけ
0233名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 19:28:35.42ID:V6E/RJ6G
一応、多摩美の油画出身なんだがなあ
まさか芸術のど素人に甘くみられるとはw
0234名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 19:28:57.08ID:V6E/RJ6G
AIが凄いのであって君たちは相変わらず無能だよ?
0236名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 19:32:33.97ID:Oes3/OMX
>>1
> ★★★ 注意 ★★★
> ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
> 漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
0237名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 19:34:43.29ID:Vb6RtSHl
>>233
美大出身程度の雑魚がどうかしたのか
まともな人間なら業績を自慢しな。

高校時代に受験デッサン頑張りましたってのが人生のピークなんだろうが、それ凄いと思うのは美大不合格になったやつだけよ
0238名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 19:35:37.96ID:nPqEeu4Y
>>227
GPUの売上も少しだけ増えてるんじゃないかな

そういえば数年前からAI開発者向けにnvidiaがハイエンドGPU配ってたけど
そういうのが花開いてきた感じ
0239名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 19:36:55.19ID:gurGPI2b
正直面白いし、ゲームで使う背景をある程度作れるのでめっちゃ重宝してる

素材でシチュエーションにあったものを探す手間がなくなっただけでも自分的には革新的
0240名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 19:37:24.50ID:r1zYWDrE
SDのGUI入れてみたんだけどスペックは満たしてるはずなのに出力されるのが遅い
Midjourneyの速度に慣れるときついなと思いつつ
遅すぎるので何かがおかしいのかもしれないとも思っている
0241名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 19:38:39.21ID:/KCOH4ow
>>240
なぜサーバサイドのMJと比較するのか
0242名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 19:40:27.23ID:nPqEeu4Y
わいはCG作成過程の同じことを繰り返すような作業感にうんざりしてきたところ

そういう仕上げに近い方の過程はAIにまかせて
発想とかの上流過程に専念したい気分です
0244名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 19:41:54.71ID:r1zYWDrE
NMKD GUIで左下のステータスが(5/5)になってから
画像が出てくるまで初期設定の状態でどれだけかかるものなの?
0246名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 19:42:57.77ID:qIXl2FkQ
バニラSDで緩々遊んでたら進化が加速しててワロタ >>221

不連続な進化は自立志向型か従来志向型のリトマス試験紙
自分が自立志向型と思い込んでる従来思考型はこう言う時に炙り出される
0249名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 19:49:40.10ID:Oes3/OMX
いやだから画像サイズも書きなはれ・・
一定ではなく大きくなるほど単位時間も遅くなるので
0250名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 19:53:04.62ID:ZwZnVGnE
>>248
残念ながらその性能は正常ですね

サンプラーがこんな感じで、k_eulerと、k_heunだと倍ほど違うので、k_euler、k_euler_aを試してみてもいいかも
(早い←)k_euler_a 、k_euler、DDIM、PLMS > l_lms > k_dpm_2_a、k_dpm2、k_heun(→遅い)

後stepも25とかに減らしてみるとか

>>249
512x512で3090でこんなもんですよ
0252名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 20:00:42.84ID:Oes3/OMX
>>246
そいつ
> 無課金のcolabでも動くのではないかと思います
こんないい加減&無責任なことよく言うわ・・
無課金とかすぐ上限きて100枚も作れないし使い物にならん、いちいちcaptcha出るし

>>250-251
NMKDってそんな遅いのか
うちの3060でhlkyの--optimized-turbo、k_lms、50stepで512x512は4.00(it/s)位出る
0255名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 20:06:33.57ID:0LGlEDQ1
>>252
> NMKDってそんな遅いのか
NMKD使ったことないがhlkyでもそんなもん。

何言ってんのか分からんけど

> 3060でhlkyの--optimized-turbo、k_lms、50stepで512x512は4.00(it/s)位出る

そりゃそうだ。
it/s と sec見間違えてんのかな
0256名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 20:09:42.66ID:Oes3/OMX
いや知らんがな・・
> 画像サイズに対するit/sが(5/5)の隣にあるもののことなら2.84sになってる
って書いてきたからその通り答えただけだ、NMKDの表示がどうとかこっちが判断することじゃない
it/sって書いてないならこっちの瑕疵じゃない
0258名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 20:15:00.47ID:q39wj6ck
普通のゲームのキャラ絵見た時に
目が大きすぎるとか輪郭歪んでない?とか思うようになっちまった
aiが俺の不気味の谷を割り広げてる たすけてくれ
0260名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 20:19:17.34ID:r1zYWDrE
>>240 だけど解決したわ!
(5/5)になってるのに永遠に読み込み中なのがおかしい……と思ってたんだが
プリセットの画像保存先フォルダ「Images」を手動でインストール先に作成したら画像がやっと生成されるようになった

なんだMidjourneyより早いじゃん
聞いてたSDローカルのみんなの話と違いすぎてビビったわ
0262名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 20:26:30.83ID:OgnvFOf6
>>256
sと言ってるものをit/sと解釈するのはアホとしか言いようがない
0265名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 20:31:59.52ID:OgnvFOf6
>>264
IDなんか変えてないが?
お前無意味なチャチャしか書いてないじゃん。もう一つの方の雑談スレにでも行きなよ
0268名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 20:37:14.05ID:Oes3/OMX
> TypeError: string indices must be integers
hlkyのimg2imgのこれうぜぇ・・
なおmaskで一度なんか書いて、cropに戻すと治る
0270名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 21:57:40.06ID:zvxKfpAE
>>237
どした?藝大、多摩美、ムサビに落ちたクチか?
良かったなAIでお絵描きした気分になれてw
0271名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 22:00:49.01ID:r1zYWDrE
うーんSDローカルでしばらく触ってみたけど
Midjourneyの方が美術的に視覚的に好みだなあ
StableDiffusionは写真や豊富なソースを元にした良くも悪くもリアルな写実性があって、Midjourneyはアート風に割り切った「映え」な処理になる気がする
0272名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 22:28:31.16ID:sS8z3ARA
>>268
ありがとおおお、これ困ってたんだ
8月25日あたりまでバージョン戻せばエラーでなくなるからそこまで差し戻さねばならんかと思ってた
0274名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 22:33:55.14ID:oE9sLq8S
midjourneyはなんていうか、ベースコンセプトが内包されてる感じはする。
Sdみたいに無軌道じゃないというか。
0278名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 23:52:11.90ID:kzTzhZT5
Midjourneyは確かにMidjourney臭さ感じる
Artstationから持ってきすぎてる気がする
0279名無しさん@お腹いっぱい。
垢版 |
2022/09/06(火) 23:57:18.02ID:kXzhOMsx
>>221 をローカル実行できたからpaste.bin使ってうpしようかと思ったら
スマートフィルターにひっかかって公開できなかった。どういうことだよ
> Pastebin’s SMART filters have detected potentially offensive or questionable content in your Paste.
0280名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 00:05:23.38ID:hqhIf25Q
>>242
現状ではAIはその仕上げ工程が苦手だから殆ど時短にならないんだよなぁ
あるアニメータが今のアニメキャラの目は描くのに宇宙戦艦の
大量の窓全部描くのと同じ工数がかかるとぼやいてたその目が苦手で人間が入れるんじゃな
0281名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 00:53:20.37ID:BpR9LumE
MidjourneyとStable Diffusionのプロンプトによる比較サイトがあったと思うけど
Midjourneyには明らかにデフォルトで特定の作風への補正が与えられている
一方Stable Diffusionにはそういう補正がないので悪く言えばまとまりがない
0283名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 01:57:32.71ID:JUO4hLGe
>>221の勝手にローカル版こっちにうpした。GUIもコマンドライン引数もなし。全部スクリプト内で指定
内部的にimg2imgでもブレンドできるようになってたから、普通にSDやるよりも思い通りにやれる可能性ある
このやり方参考に改造してくと夢広がるかも
https://%64otup.org/uploda/%64otup.org2867350.py.html

noteにちょっとコード追加すると「アニメーションもいけます」ってあるけど、ちょっとどうしたらいいんだよって分からなかったけど
実行したら画像が連番出力されたからそれを単純にツールで動画変換すればいいだけだった
https://imgur.%63om/a/4XsLuDA
0285名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 06:19:28.74ID:7ujeTCJS
SDは背景制作用に無人化ボタン一発機能を実装して欲しいなぁ
いくら先頭強力単語で無人化しようとしてもちらほら出てくる
0286名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 06:50:04.76ID:Zeqx/mzK
MJはお絵描きAI、SDは画像合成AIを名乗ってるんだしデフォルトはそうなってるだろう
SDはオープンソースなんだから自分で好きにいじればいい
0287名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 07:04:23.72ID:FhkK5/0g
DALLE2が一番promptそのまま出してくる、雑コラ見たくなるのでお笑い系には強い
対してMJは強烈めっちゃ格好良くに味付けしてくるね、SDは両者の間くらいか

MJは色の加味が強すぎて、好きな色出してくれないって弊害まである
服の色とか細かく指定しても調和優先なのか勝手にシャッフルして無視してくることしばしば
スタイル指定なくてもだけど、あればあっただけとんでもないことに
一時期、同じpromptなのかみんな青とピンクの空になってたし
0292名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 08:21:46.63ID:e3maBfLf
>>242
これもすげえわかる
細かいところが得意じゃないんだろうな

とは言え惜しいね
現時点では絵描きにとって時短にはならんが
もうちょい精度が上がればな
自分の利用したい何かを
もっと学習させればいいのかねぇ
0294名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 08:51:15.61ID:l+bt6oxA
【Midjourney】AI関連総合2【StableDiffusion】
https://mevius.5ch.net/test/read.cgi/cg/1662463049/
こっちで

そういうの語りたいなら、せめて具体的なプロンプト談義でもしてくれ
> ★★★ 注意 ★★★
> ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
> 漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
0295名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 09:18:12.44ID:Zeqx/mzK
aestheicを入れるとフィルターとかハイライト入れまくったインスタ映え系の画像になる
人間はこういうのが好きなんだろう
0296名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 09:48:02.13ID:HBy5CqkQ
automatic1111版昨日使ってみた感じ
img2imgはバグがあるのかmaskした部分がズレる現象が起きたんでまともに動いてる時のhlkyの方が使いやすいかも
それ以外は安定して使いやすい
0299名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 10:58:58.12ID:X2rsqGXX
SDのSTEP数って150以上とかにしても、ほとんど意味なかった。
たまに突然変異するみたいだけど。
0300名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 11:06:54.68ID:peeXpuTU
150にしてたけど75に減らしても何も変わらないな

二倍速ガチャになったことのほうが恩恵あるわ
0301名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 11:08:41.04ID:2nvOVkCf
textual inversionでSDにMJの絵を食わせて”art by Midjourney”ってやったら同じような出力になるんだろうか
0302名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 11:12:40.90ID:xOgKY8Sf
やっぱ1111のインペイントってバグ発生してる?
ズレたりマスクした部分でも変わったり全然使えんかったけど使い方間違ってるのかと思ってた
フォトショでいじった画像を使った方が早いと言われてマスク部分を白で塗ったけど、白のまま出された
0303名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 11:17:10.21ID:lb4GgE/W
NMKD StableDiffusionGui-v1.3.0の出力フォルダ自動生成機能、プロンプトが多いとフォルダ名が途中で切れるんだけど
フォルダ名が切れてる部分より後ろでプロンプト足したり引いたりしても新しくフォルダが生成されずごちゃ混ぜになるの注意
0308名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 12:43:26.96ID:dBQ1TwVr
なんでこんな見てて不安になる作例をサンプルにするんだ……?!
まともに見比べて吟味してたら精神ダメージ受けそう
0310名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 13:03:02.89ID:mvTqOHhC
アニメ絵じゃないからかもだけどstep数が多いから良いって訳でもないよね
150でやってたけど見た目の破綻が少ないの優先だと下げた方が良い場合があるのに気がついた
変な所から生えてた腕が無くなったり崩壊気味だった顔がまともになったり
0312名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 13:10:59.46ID:Hhqynqiz
k_euler_aで50とか75とか回すなら
7~8ステップ以降は5つおきとかで途中ステップの画像保存した方が収量が多くて良いかもな
見てると早々に見られるようになった後は何度も変化繰り返してる
0314名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 13:19:45.20ID:JUO4hLGe
ステップに何を求めるかかな
求めるのが時短なら変化ないサンプラーでってことになるけど
似た雰囲気で精細さを求めるとかだったら最初から4kとかhigh resolutionみたいなプロンプト指定したりimg2imgに賭けるほうがよさげだし
ガチャ代わりならシード変えた方がいいし
ステップじゃなきゃできないとか、ステップ考えた方が効率いいってのがあまりない
0316名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 13:27:55.27ID:X2rsqGXX
img2imgのベースにPS1みたいな粗いモデルで構図だけぶっ込むと、絵画っぽくして出力してくれるとか面白そう。
0317名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 13:27:55.59ID:0ty9c0Fv
>>315
2Dから3Dばかり考えていたが、逆も使い道があるんだな
もう垣根も無くなりそう
0318名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 13:29:16.40ID:FBb1Vi+J
>>309
面白い。けど肝心のサンプラーはなんですか?
また"|"があるけど、これプロンプトマトリクスですか? 普通にやるとtrending pixiv fanbox以降は無視されるような

後、512x512以外だと(感覚的には不安定なので)検証には良くないような。
CFGも15ってめっちゃ大きいイメージある
0319名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 13:32:04.76ID:zjzeQQl2
将来的にはゲームのリアルタイムレンダリングにも使えないかな
コストがレイトレースやレイマーチ以上だろうけど...
0320名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 13:38:05.24ID:E0QFLZ6Q
これ背景をアルファチャンネルにするのって可能?
LRとかで被写体マスクかけてもいいんだろうけど
0321名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 13:40:57.87ID:FBb1Vi+J
>>315
これは割と使い道ありそう

どうやってblenderでリアルタイムレンダリングしてるのかが分からないな。
手動でレンダリング(F12)してるのかしら
0322名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 13:50:07.12ID:FBb1Vi+J
>>321
> どうやってblenderでリアルタイムレンダリングしてるのかが分からないな。
> 手動でレンダリング(F12)してるのかしら

コンポジターでファイル出力設定して自動レンダリングにチェックするだけだった。
blenderの話でスレチすみません。

PNGファイル監視して、img2imgするだけだから簡単にできますね
0323名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 13:54:42.49ID:zjzeQQl2
seed固定すればある程度画角が変わっても似たような画像になるのかな
0325名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 15:00:39.28ID:Ihx6BKzn
>>10
このkritaプラグインのインペイントを使いたいけど
Colab使用法で使ってもサーバーエラーになって使えない
Colabで構築してhttps://●●●●.gradio.app立ち上げて
URLをコンフィギュレーションに貼るだけじゃダメメ?
0328名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 15:06:12.34ID:H5M41GOr
深津って人、顔はともかくマジで誰なんだw
OpenAI かStabilityAIの人かと思ったら違うし何した人だろう?
0329名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 15:08:50.00ID:GYh+wYQh
>>322
blenderはpythonで動かしている層があってオープンソースだからpythonでプラグイン書ける人ならUI使わなくてもあれこれ動かせるはず
0330名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 15:10:05.09ID:20KA6+UR
>>325
管理者権限でKritaを起動して
URLの末尾にスラッシュ付けたらいけないぞ
0331名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 15:11:21.78ID:20KA6+UR
>>325
管理者権限でKritaを起動

URLの末尾に/を付けてはいけない

この2点で動くぞ
0333名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 15:13:58.58ID:crnIWB/R
>>329
そうだけど、blenderは自動レンダリングをフックできるAPIがないので、外部でファイル監視するのが現実的な気がする
Viewportで変更を加える都度にリアルタイムでSDでもレンダリングさせるには、だけど
0334名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 15:15:10.99ID:20KA6+UR
OpenAIなんてGAFAMより上のエンジニアだぞ

比較なんてしたら惨めになる
0335名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 15:16:49.20ID:0ty9c0Fv
>>324
酷いな
0336名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 15:20:28.48ID:Ihx6BKzn
>>330
ありがと!
でもやっぱサーバーエラーになっちゃうわ…
Colabの方にもエラーが表示されてる…

\AppData\Roaming\krita\pykrita\stable_diffusion_krita\sd_main.py", line 536, in getServerData
with urllib.request.urlopen(req) as f:
File "urllib\request.py", line 222, in urlopen
File "urllib\request.py", line 531, in open
File "urllib\request.py", line 640, in http_response
File "urllib\request.py", line 569, in error
File "urllib\request.py", line 502, in _call_chain
File "urllib\request.py", line 649, in http_error_default
urllib.error.HTTPError: HTTP Error 500: Internal Server Error

Colab

Traceback (most recent call last):
File "/usr/local/lib/python3.7/dist-packages/gradio/routes.py", line 260, in run_predict
fn_index, raw_input, username, session_state
File "/usr/local/lib/python3.7/dist-packages/gradio/blocks.py", line 685, in process_api
inputs = self.preprocess_data(fn_index, inputs, state)
File "/usr/local/lib/python3.7/dist-packages/gradio/blocks.py", line 591, in preprocess_data
processed_input.append(block.preprocess(raw_input[i]))
File "/usr/local/lib/python3.7/dist-packages/gradio/components.py", line 1061, in preprocess
return self.choices.index(x)
ValueError: 4 is not in list
0337名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 15:20:48.32ID:fR+cA5Sk
3Dモデリングのためのキャラ立ち絵を24時間SDぶん回してたらキャッシュ?でクロームがクラッシュして立ち上がらん事なったわ
みんなはこまめにキャッシュクリアしてくれ クロームの設定をちょいちょい元に戻すのダルすぎる
0338名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 15:24:04.77ID:GYh+wYQh
AIで色々な合成画像が作れるという話題がポツポツあっても話題が広まらなかったのが、
midjourneyに描かせた絵にAIが絵を描くとこうなるのか!
という独特の美しさがあったから研究者以外にも広まったと考えるとmidjourneyの開発者がブームの火付け役のような
0339名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 15:24:37.37ID:20KA6+UR
>>336
https://●●●●.gradio.app
にブラウザでアクセスしてgradioが動いてるか確認して

だめならmodel.ckptが読み込めてないとか
0340名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 15:27:02.68ID:JUO4hLGe
>>337
ぶん回すならコマンドラインが安定だよ
webUIはおためしにはいんだけどな

あと意外にGPU食ってるアプリあるからタスクマネージャーで調べた方がいい
うちだとテキストエディタがGPUメモリ600MB消費してて驚いたよ
0341名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 15:31:42.00ID:fR+cA5Sk
>>340
コマンドラインで動かしたいけど肝心な知識が・・・
俺がクロームで動かしてるから、神フォークでみんなが1000×500ぐらい行けるっていってるのに
それよりも妙に小さい画素だったのかも
0342名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 15:31:58.39ID:Ihx6BKzn
>>339
サイトURLは読み込み可能でサイトでは画像も生成可能です!
ということでmodel.ckptも読み込めてるはずです!

なのになぜ栗田はサーバーエラーを返しちゃうの…
0343名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 15:35:17.65ID:20KA6+UR
>>342
4番目がないってエラーが出てるから
パラメータいじったらエラーが出るんじゃね

ベータ版だからパラメータをいじってたら戻したほうがいい

あとはわからない
0344名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 15:38:32.67ID:20KA6+UR
一番上のプロンプトだけ入力してOKしてみるとか

Windows11ではうごいたんよ
0345名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 15:44:55.15ID:GYh+wYQh
ゲーム用のGPUのメモリーはグラフィック用だから多少データー化けしてもOKな設計になっていてECCでの保護とかされていないからそこは覚悟して
0347名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 15:56:21.59ID:20KA6+UR
>>346
同じエラー出たわ
プラグインアップデートしたら動かなくなってる
0349名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 16:44:43.32ID:X2rsqGXX
ありゃ? モデルバージョンアップ入った? Colabの出力結果が同じシードでも若干変わってる。
0353名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 17:29:53.77ID:9OVuPLmi
>>107
これ見てなかった、有用な情報ありがとう
hlkyはスライダーが1024までしかないけど、1111でサイズ最大の2048x2048まで行けたw
キメラ化するのとs/itは鬼のように落ちるけど、img2imgで最後の一発に使えばいいよね
0354名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 17:46:26.22ID:WzhwDaPx
これまでのアップスケールソフトすべてに言えることだけど
アート系はSDアップスケールでもキレイになりすぎてしまって元の画像の質感がごっそり失われる
0356名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 18:45:36.96ID:2/ozrobX
ファイーンっていうのやめないか?
0358名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 18:54:40.03ID:iPE4UVJc
1111版にプレビュー機能追加されてる!
4gbでも使えて超便利
4ステップごとに画像表示すると0.76倍速だった
0362名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 19:13:07.98ID:WzhwDaPx
refineをファイーンって言うの老人会のネタなのか知らないけど意味が全くわからなくて気持ち悪い
0364名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 19:54:34.04ID:ieX4ORq0
Discord

Q. txt2video、video2videoってどのぐらいのスペックのGPUが必要そう?
 未来のことだからわからないと思うけど、3060でも動くと思いますか?

Emad: .今後決める話だけど、最低でも100億パラメータのモデルになるだろうから、3090はいると思う

多分ビデオ生成、最初は動いてもオモチャみたいなもんだろうから飛びつく話じゃないとは思うけど
やっぱVRAMいるね

このAIプチブーム用にGeforceのVRAM大きいバージョンとか出してくれないかな
0367名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 20:03:30.97ID:OfBhuBKh
>>364
SDをCPUで走らせてるのもあるからな
そういうのは利便性(その生成速度を満足できるかって気分)との兼ね合いでしかない
0370名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 20:25:57.00ID:2/ozrobX
多くの人はlineとかのapiで満足するし、ローカル構築する人でも8gbもあれば十分だし20gb以上必要なのはTIとかそれ以上のことやろうとする人ぐらいだしな
そのためにわざわざvram増量版つくるかな
0375名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 21:40:37.41ID:GYh+wYQh
>>364
GPUはそんなに速くなくても良いからメモリー沢山積めるのを欲しがるようになるなんて、数ヶ月前までは考えもしなかった
0380名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 21:58:42.25ID:0ty9c0Fv
来年になったら動画生成が流行りになってて、4090でも手も足も出ないんだろうな
古いの並列に繋げて爆速にさせる技術とか無いんか
0383名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 22:23:24.09ID:GYh+wYQh
blenderのGPGPU使ったレンダラーは何回か新しいGPUが出てそれ対応のCUDA対応待ちになったことある。
0384名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 22:50:17.52ID:OfBhuBKh
レンダリングは影だ反射だ計算してくれる機能が追加されたり変更されたりするから対応必要になるんじゃないの?
逆に切られると使えないGPUもでてくる。DazStudioとか新しいバージョンだけGTX650以前の未対応になったし

SD(AI)だと基本は単純計算だから対応作業いらないと思うよ
0385名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 22:53:14.48ID:V8pVzmCt
>>380
一気に長時間作る前提で考えたらそうかもしれんが

10秒の動画生成
フレームレート補完
アップスケール
最後のフレーム引き継いで次の10秒間を生成

連結

こんな風に分割してやりゃええやん
0386名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 23:00:24.10ID:0yNh0oHJ
後、10秒って30FPSでも300フレームじゃん
一気にそこまで巨大な動画生成できるもんかなw

「最後のフレームを引き継ぐ」なんて可能な気がしない。
AIの思考が10秒で切れるってことはその後は全くの別シーンとして生成するしかない気がする
登場人物やシーン(背景)を固定(ファインチューニング)して連続性を保つことができればいいけど、それはそれで結構な手間がかかりそう

txt2videoと言っても、まともなものを作るにはtxt2imgとか桁違いのプロンプトが必要だし
来年ビデオモデルがリリースされるとて言っても最初はちょっと触って面白い、ってな感じのオモチャみたいなもんじゃないかね
0388名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 23:03:10.03ID:NXXx9vum
9xx(Maxwell) 動くが遅い
10xx(Pascal) 動くがそこそこに遅い
16xx(Turing without Tensor) 緑バグ
20xx(Turing) 動く
30xx(Ampere) 動くし速い
0390名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 23:14:14.82ID:0yNh0oHJ
>>389
StableDiffusionのvideoでDeforumみたいななもの(単純移動、拡大)なのかな?
txt2videoという言葉のイメージから、「走る」とか「笑う」とかそういうものを想像した

Deforumでいいなら既にDeforumでいい気もする
まあDeforumも動画みただけで動かしてはないから勘違いしてるかもだけど
0391名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 23:25:33.14ID:buk3nixQ
何日かSDのTI Fine tuningやって分かったことメモ
・ソース元画像は極力同じような構図、テーマに搾った方がいい(顔のみ、上半身のみ、かつ同じ人物など)
・最低5枚は必要ぽい、10枚と15枚の差はあまり見られない
・5枚と10枚も割と好みの差のになりそうなので両方やるといいかも
・epoch数重ねすぎると崩壊する、1個目と1番スコア良かったものあたり前後を1こずつぐらいを見比べて好みで使うのが多分いい感じ
⇒崩壊したら下で何かしらの概念に落ち着いてるので面白そうならつかえるかも
・アニメは未検証、Twitterでミャクミャク様などの成功報告あるのでできるようではある
0392名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 23:29:27.24ID:OfBhuBKh
>>386
普通のCGのキーフレームに当たる部分をプロンプトで設定してその間の保管をプロンプトの重みづけで変更してけばいい。引継ぎはimg2img
SDでの簡易実装が >>221,283
metahumanみたいに何かに特化して学習すれば実用的なの得られるだろうけど、SDの自由度でやってくとオモチャになるだろうね

>>388
うちはmaxwellだ。くっそおせえ
0393名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 23:33:26.93ID:WkRKoxRp
>>392
それは静止画像の補完なんだからtxt2videoではないね
txtの要素がない。

>>388
2080Tiは3070Ti、3080とほぼ変わらないし世代だけじゃなんとも言えないなw
3060以下は(性能的には)Google Colabの方がいい。使い勝手はローカルのほうがいいけどね
0395名無しさん@お腹いっぱい。
垢版 |
2022/09/07(水) 23:59:24.17ID:OfBhuBKh
>>393
今のSDは静止画学習だから仕方ない
例えば腕を下から上に上げるって動作の動画からフレーム切り出して動作そのものをクラス登録する
「right arm up to down with progress 10%」みたいにプロンプト設定したら、一割腕を持ち上げたところの画像が生成される。そんな感じにできたらいい
0396名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 00:20:23.02ID:z8EI1xXf
>>391
100枚とか1000枚とかも画像を用意すれば出来るのかな?
そこまでやったら傾向的な学習できたりしないだろうか
0397名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 01:34:14.87ID:Deb7MqKj
1111アップデートしたら>>107のビッグサイズ変更裏技が効かなくなった感じだ…
さっきまで作れてた640でもメモリエラーになってまう
俺の環境だけなのかな
0402名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 03:59:59.65ID:sMHflbqu
>>400
どこか別のtexttual_inversion(たしかWindows用)のほうで続きの走らせ方が書いてあるとこがあったと思う

ttps://github.com/nicolai256/Stable-textual-inversion_win
たぶんここのresumeとかいうところにコマンド例が書いてあったと思う

先日俺環でやってみたけどほんとにresumeしているのかは判断できなかった(たぶん食わせたサンプルの品質が良くなかった)
中途半端な情報で申し訳ないけど俺もう時間ないから寝るわすまん
0403名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 05:15:55.29ID:joQza10U
finetuneはエラーだらけですんなり動かないな。素直にクラウドでやった方がいいんだろうな
一応こんな修正で8GBのローカルでepoch回りだした(gpuが遅いからきちんと出力されるかは未確認)

https://github.com/lstein/stable-diffusion

をclone

>>400の修正に加えて

main.pyの頭に2行追加

import os
os.environ["PL_TORCH_DISTRIBUTED_BACKEND"] = "gloo"


main.py内にある変数 gpuinfo と ngpu への代入値を 1 に固定

main.py内にある if not cpu: の行の前に cpu = False を配置



実行

python main.py --base "./v1-finetune.yaml" -t --no-test --actual-resume "./models/ldm/stable-diffusion/model.ckpt" -n "xxx" --gpus 1 --data_root "./src_finetune"
0406名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 07:19:49.60ID:c4MbLNAM
>>402
resumeできたー
ガシガシ回してみる

あとtxt2imgに--W 256 --H 256を付けると8GBでも--n_samplesを増やせて検証には良さそう
0407名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 07:25:53.49ID:PTxFP5X8
>>391
ミャクミャク様いいね。40枚入力していたらしい
https://twitter.com/fururu3d/status/1566401564872704008

>>405
省メモリの設定変更についてはこのあたりに言及あった
https://towardsdatascience.com/how-to-fine-tune-stable-diffusion-using-textual-inversion-b995d7ecc095
https://github.com/hlky/sd-enable-textual-inversion#q-how-much-vram-does-this-require-why-am-i-receiving-a-cuda-out-of-memory-error
https://twitter.com/5chan_nel (5ch newer account)
0410名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 07:57:48.83ID:XuQAwOCZ
dreamboothは32GB以上のVRAMが必要らしい
colab pro+で運良くA100を引ければ回せそうではあるが
0414名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 08:40:36.78ID:bmB/np1h
ワイルドカードってありますか?
* on tableとかやりたいです
0418名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 09:12:11.18ID:bmB/np1h
>>415
>>416
ありがとうanimalsだと謎のキメラモンスターだったけどobjectsは融合してないね
何が違うんだろう
0420名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 09:35:21.66ID:GPkS8IeV
>>418
机の上の動物って絵や写真がなかなかないからだろうか
animals on tableで

SDは比較的、猫や犬出してくる、木の上の頭アップみたいなのとちょっとトロけるくらい
MJはイラスト風で机の向こうにいるみたいに並べて誤魔化してくる、10回に1回くらい成功で机に乗ってる
photography of live animals on table
って指定してやってもなんかいまいち

DALLE2はちゃんと動物の「置物」出してきてうまいと思った
live animalsでもなんとか対応してくる凄み
https://i.imgur.com/VR9QSLH.jpg
0421名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 09:44:38.75ID:bmB/np1h
うーむ、sdの学習元にanmalsタグが付いた画像がたまたまなかっただけかな
単数系複数形を理解しているわけではないのか

1x1から9999x9999までの掛け算表とイギリス人が入った箱と9999までの掛け算ができるイギリス人が入った箱を外部からの観測で区別することはできない
0422名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 10:37:07.24ID:RmcB12VY
特定の絵柄のキャラクターの色んな光景を出したい場合、finetuningで特定の絵柄を覚えさせてなんとかキャラクターを数枚出力
そのなんとか出力した数枚のキャラの絵をfinetuningでポーズ指定とかすればいけるんだろうか
0423名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 10:58:18.04ID:zK1/hsZt
何がそのキャラをそのキャラたらしめているかだと思う
顔・服装・その他特徴
顔だった場合、ただ色んな全身ポーズを与えるより
色んな角度の顔だけとかの方が効果的なんじゃないかと
エマがエイリアンでもエマに見えるように、顔の安定だけでもそう見えると思う
0424名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 11:24:58.08ID:8DwvcOFI
現在形、過去形、現在進行系でどれか適してるかがわからないし
服装だけでもinと is wearingのどっちが適してるのかもわからない

ディープラーニングってそういうもんだよなって言ってしまえばそうだけどもう少しプロンプトを定型で使いたい
0425名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 11:32:05.53ID:UceYt1Ld
TextualInversion 画像の全ての概念をプレースホルダに落とし込む
DreamStudio 覚えさせたい要素の一般的な画像を用意し、それと対比するような特定対象の画像を入れることで特定の要素のみをプレースホルダに落とし込む
(portrait of dog ↔ portrait of [V] dog でコーギーの写真を放り込むと[V]にコーギーの特徴だけが入る)

TextualInversionはプレースホルダをそれそのもの、画風、構図等で様々に使える一方、学習をやらかすと精度に影響が出るのに対し
DreamStudioは特定した要素を少ない世代で確実に覚えさせられる一方、それ以外の要素への応用はほぼできない上にプレースホルダの強度が強すぎて他のプロンプトによる指示を受け付けなくなる可能性があると
(コーギーの写真を入れるとその写真がベタッと貼り付いたような画像を作ってきてピカソ風にしてくれない等)

あるものをそのままSDの世界に入れたいならDreamStudioの手法が良いんだろうな
0426名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 11:53:47.36ID:GPkS8IeV
1111はsettingsに
> Save text information about generation parameters as chunks to png files
があって、チェックつけとくとPNGの頭に書き込まれてあるんだね
バイナリエディタ(あるいは強引にテキストエディタにぶち込む)くらいでしか見れないけど
設定テキスト無くしてもあとからわかるので安心
0429名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 12:16:17.82ID:VxNEwSpk
>>426
バイナリエディタというか、PNG text chunkなのでビューアあれば見ることができるよ

>>427
いつのまにか --save-metadata できるようになってたんだ。知らなかったw
0433名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 12:46:12.87ID:GPkS8IeV
>>431それはもち検索済みw
いちいちサイト開いて参照にドラッグとかやってられん

つかまぁバイナリでいいやん、選択してコピーもできるし
基本生成画像はexplorer上で管理してるのでwebui上は手間がね・・
0437名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 14:04:40.26ID:mQGOABEd
hlky版でシームレス画像生成オプションを追加する方法

リンク先の緑ラインで表示されている箇所をファイルに追記する
設定を切り替える場合はその都度relauncher.pyをテキストエディタで開いてオプションの
True/Falseを変更、再度立ち上げる必要あり
https://github.com/sd-webui/stable-diffusion/pull/267/files

https://i.imgur.com/o4GPvR2.jpg
https://i.imgur.com/LsMzVSZ.jpg
0439名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 14:15:31.14ID:UJMlbfOw
ernie-vilgの呪文を語り合いたいけどみんなどこに集まっているの?
Twitterは思ったほど盛りあがってないし…
0440名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 14:17:07.31ID:AAdpCwCj
wifu突っ込んでみたけど、どうもしっくりこないな……
モデル以外に何か突っ込むもんあるんか
0443名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 14:40:00.11ID:AAdpCwCj
ダンボールなんか行ったこともないから、コツみたいなのが全然わかんないな……
もうちょっと様子見で待とう
ノーマルでもそこそこ2次ガチャ引けるようになってきたし
0444名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 15:03:12.73ID:kyVkkdSV
1.4で二次絵のファインチューニングして結果は微妙だったけど
waifuで使うと結構綺麗に特徴出てきて面白い
0445名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 15:27:16.64ID:7+yRJQlP
Danbooruタグ人気順
https://danbooru.donmai.us/tags?commit=Search&search%5Bhide_empty%5D=yes&search%5Border%5D=count


touhou 1girl komeiji_koishi portrait
https://camo.githubusercontent.com/87abfaa6a46783378a435465110fc184afd0193748eddc031a011a5b8dc4dc4c/68747470733a2f2f63646e2e646973636f72646170702e636f6d2f6174746163686d656e74732f3837323336313531303133333938313233342f313031363032323037383633353338383937392f756e6b6e6f776e2e706e673f33383637393239
0446名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 15:47:40.87ID:n6+nNVZT
ダンボールのタグはweb表記のやつは多分そのまま使われてない(スペースとかカッコとかあるとおかしくなるので機械学習用に変更されてる)はずなので
データセット見るのが確実ではあるけどデータセットisどこなんじゃろ
帰宅したら確認してみよう
0447名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 15:47:41.66ID:S5bL/o9x
waifu diffsionは簡単なプロンプトでかわいいアニメキャラ出るけど、学習が東方キャラに偏ってる感じするな。
そしてEmad氏が"25/09/2022"とツイート。1.5かな。
0448名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 15:48:46.33ID:dOFTXDkz
>>425
多分dreamboothのことだよな?
これ見るとやはりTIのことをファイーンとか呼ぶのは紛らわしいし誤用だな
fine tuningもやめたほうがよいかも

The concurrent work of Gal proposes a textual inversion method that learns to represent visual concepts, like an object or a style, through new pseudo-words in the embedding space of a frozen text-to-image model. Their approach searches for the optimal embedding that can represent the concept, hence, is limited by the expressiveness of the textual modality and constrained to the original output domain of the model. In contrast, we fine-tune the model in order to embed the subject within the output domain of the model, enabling the generation of novel images of the subject while preserving key visual features that form its identity.
https://arxiv.org/pdf/2208.12242.pdf

dreamboothのほうがおもろそうだが実用化してるのこれ?
0449名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 15:54:27.52ID:XuQAwOCZ
>>448
dreamboothは有志の再現実装が公開されてる
そのまま動かすとVRAMを38.5GB消費するためV100 32GBで動かす場合でもメモリ節約が必須
0450名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 15:59:46.43ID:AAdpCwCj
ダンボールタグをどう食わせるかが大変そうだなあ…
適当に食わせたら、なんか混ざりそうだし。最後にくっつけるのが良いのかな。
0451名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 16:01:59.58ID:dOFTXDkz
>>449
えぐいな、一般人が使えるのは数年後か
0457名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 16:21:32.42ID:S5bL/o9x
学習してる東方キャラに偏りがあるな。比較的新しい作品のキャラも出てこない。どういう拾い方してるのかよくわからんが、作者の趣味といえばそれまでか。
0459名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 16:43:09.38ID:n6+nNVZT
>>448
フル学習じゃない2次調整系は全部fine tuningぞ(大枠)
ジャンル分けするなら
・TI, dreamboothは出口辺りに干渉するバイパスとか追加する系の差分学習(既存を変更せずに追加)
⇒modだとかmoduleだとかmodificationだとか呼ばれることがある、まだ新しい領域
 ⇒GPTだとmoduleで確定
・とりんさまとかWifuとかは既存の置き換えする追加学習
⇒こっちが単にfine tuningだとかadd trainとかなんか色々呼ばれる


ITとかの差分学習はmodとか呼べばいいんじゃないかしら(提案)
0460名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 17:00:56.27ID:PTxFP5X8
automatic1111版の今日の更新で
クリップボードからCtrl+Vでimg2imgに画像貼り付けられるようになった
0464名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 17:16:41.38ID:dOFTXDkz
誤用ではないか、まあまぎらわしいことには変わりない
dreamboothは70万くらいのグラボのA6000で動くらしい
良心的だー
0465名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 17:17:13.76ID:X78zHr7r
うげっSSDとんだ…良さげな呪文も作った絵も全部消えた…
特にローカルでやるときはPC酷使するので皆さんバックアップはちゃんとしておきましょう
0469名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 17:43:37.08ID:o3nOvUht
>>465
SSDが飛んだのはAIの酷使関係ないと思うけど
0470名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 17:46:35.78ID:sSJvtjGy
全くえっちな画像生成を目的としてない真面目なプロンプトの時に乳首が突然出てくる時がある
ラッキースケベみたいな気分
もしくはチリメンモンスターが出てきた気分
0471名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 17:49:02.42ID:AAdpCwCj
2次回してると、たまに師匠の亡霊が主人公見守ってるみたいなの出るよw
たぶん、人が二人になる亜種だと思うけど。
0472名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 17:49:18.01ID:7KhHsqDl
>>468
852わ臭がする
0475名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 17:58:57.82ID:AAdpCwCj
アウトペインティングっぽい補完で面白いなあ。
半年ぐらい経てばいろんな技術が出てきそう。
0477名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 18:01:52.47ID:AAdpCwCj
マイニング並とはいかないまでも、結構いろんなとこの寿命は縮めそうだからローカルでやるのはやっぱ腰が引ける。
Colabに1000円ぐらいお布施する方が精神的にはラクだわ。回してる間はサブで確認しつつゲーム出来るし。
0478名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 18:02:24.42ID:i/kRH6Ka
MidjourneyやDALL-E2で、ゲーム用アセット作るのって中々現実的ではないよね
コンセプトアートみたいなののスケッチはかなり助かるけど、コンセプトアートすら実際にはイメージ通りの構図ではないしね
言葉だけじゃなくて今後は全体のラフスケッチを渡したうえで言葉で指示するようになるのかも
0480名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 18:05:47.63ID:qM+23pgA
>>474
綺麗に大きく出来てるねえ

でも分割してimg2imgした後、結合で境界線がおかしくならずに結合できる仕組みが分からないな
なんでうまくいくんだろう
0481名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 18:05:52.24ID:AAdpCwCj
AI生成の泣き所はやっぱり統一感を出すのがキツいってとこだと思うわ。
ここが解決しないと、テクスチャとかプローシジャルの種とか部分の自動化にしか持ってけないと思う
0483名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 18:09:21.20ID:qM+23pgA
>>481
そもそも人間でも言葉で絵を書いてもらった場合、似た絵にするのは難しいんだよね

商用でまともに使うなら言葉じゃなくイメージベースのガイダンスが主流になりそうな気がする。
「もっとシャープなイメージで」「このキャラを座らせる」「目をもう少しツリ目に」とか、既存のイメージ+修正ガイダンスの技術がいるけど、既にそういうのあったりするのかな
0487名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 18:47:33.24ID:ws0fcC90
結局拡散モデルだけだと厳しくて「頭が1つで,腕は2本」みたいな知識が必要ってことなんだろうな
0488名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 18:57:25.54ID:ZxA66bHI
>>487
そういうフォルムの特徴を学習してるはずなんだけどね

バリエーションで変わっていいもの(ポーズ、細かい質感)と絶対変わらないもの(骨格、筋肉の構造)の区別が上手くいってないというか後者の学習不足なのかな
0489名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 19:00:23.06ID:AAdpCwCj
とりあえず人を1人描けって言われたらボーンを置いてそれに肉付けしていくみたいな方向性じゃ無いから、なかなか難しいんだろうね。
0491名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 19:45:19.48ID:oEls+M+S
waifuがドン引きするぐらい二次のクオリティ上がっててビビった。教えてくれた人ありがとう

公式1.4で練りに練って何十枚かに1枚は、セミ商業レベルの顔を作ってくれる呪文で
waifuだと2枚に1枚くらいは普通にフォロワー4桁絵師クラスの顔絵を吐いてくれるわ
0493名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 19:51:21.85ID:ElGmCm3c
>>490
AIにイラストの仕事させるのってゴリラに野球やらせるような感じだと思い始めてる
スピードもパワーも凄いんだけどちゃんとルール覚えて器用に動けるかというと…みたいな
0494名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 19:52:36.24ID:xrESwl5k
>>491
出始めの頃ちょろっと見に行って「こんなもんか」って印象でそれ以降見向きもしなかったけど
SDに触る前に紹介記事見つけて久しぶりにやったら、見違えるような物お出ししてきて驚いたね俺は
0496名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 21:16:43.37ID:tyEPbrsV
Mj のtestpで人物全体像作ると逆光ばかりになる
0497名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 21:32:24.53ID:erb2VKFY
>>415
mainブランチは更新されてないけど、devブランチのやつは治ってるね。
コミットid 67b6196 を動かしたらエラー吐かずにimg2img動いた
0501名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 21:55:05.96ID:saI81Esq
>>428
これのExample Codeでちゃんと動いている人いる?
出てくる画像が全部ぼやけててうまくできてる気がしないのだが…
hlkyのwebuiで既存モデルを>>462のcpktに置き換えたやったやつはうまくできてる
0502名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 22:04:47.90ID:eed88sxn
sdに「waifu」って入れても結構いいの出るな
0506名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 22:53:21.70ID:xCgYS4CN
>>462
メモリ足りなくて動かんわ
0510名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 23:35:14.96ID:yc8aYASo
waifuモデルは既存キャラ指定するとかなりの強度で顔のアップに張り付くな
512x512に切り出す時に顔のアップになるようにしてそれを使ってるんだろうか

オリジナルで使えてた上半身入れたりするプロンプトはほとんど使えないし、danbooruになるcowboy shotっていう構図指定も効かない
0511名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 23:38:54.87ID:oEls+M+S
waifuは顔のアップで学習してるんだと思うよ
正方形を超えると、なんか顔が伸びたりする癖があるし

構図が決まってるんならimg2imgで大解像度にした方がいいと思う
0512名無しさん@お腹いっぱい。
垢版 |
2022/09/08(木) 23:58:36.90ID:xp/Gn14H
3Dはモデル作るのはそれなりに苦労するけど、作ったモデルを好きにアレコレするのは結構簡単。
SDはボタンポチであっという間に色々作れるけど、出来たものをアレコレするのはほぼ不可能。
お互いに補完できればなあ。
0513名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 00:04:29.44ID:w0tjTQcP
>>512
べつに不可能じゃないよ
フォトバッシュとか学んで
0514名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 00:35:06.76ID:lV+xWUdV
まだ環境構築できてない初心者なんですが質問させてください
Minicondaのインストール自体は完了しているんですがwebui.cmdをクリックするとこんなエラーが出ます
たしかに該当のパスにそのファイルは無いんですが何か作成する必要があるんでしょうか…?
https://i.imgur.com/iwChvx3.png
0515名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 00:38:44.00ID:eMwMFZjS
>>514
1111さんの版のリドミの手動導入手順でやった方が環境cmdの謎エラー追うより簡単だと思う

とりんさま2にグラドル画像でTIしたやつやったら水着の二次絵になったから色々遊べそう
0516名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 00:44:31.38ID:iZ8P9fJo
フォトバッシュの記事読んでみたけどこんなんpix2pixとdreambooth搭載したAIがやるべき作業でしょ
0518名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 00:49:13.53ID:56SmY4UL
>>514
エラーじゃない、ただのメッセージ
「custom-conda-path.txtが見つかりません」
「anaconda3/miniconda3はC:\ほにゃらら で検出されました」

通常とは違う場所にcondaをインストールした場合は
webui.cmdを起動する前に指定する必要がある
そうでなければ気にする必要はない
0520名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 01:09:16.91ID:lV+xWUdV
>>515
回答ありがとうございます
テンプレのものを参考にやってみたんですがこうなりました…
pythonのバージョンもちゃんと合わせたはずなんですが
https://i.imgur.com/wZZwqbU.png
>>518
通常とは違う場所というのが分からないですねすいません…
インストール時に特にいじってはないんですが
0521名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 01:15:47.81ID:56SmY4UL
>>520
だから>>514はエラーでもなんでもないよ
「このファイルは存在しないので(1行目) ここのミニコンダを使う(2行目)」程度の意味合い
webui.cmd起動して放置していれば
そのうちインストールが終わってサーバーが起動するはず
サーバーが起動したら「localhost:7860」みたいなメッセージ出るから
ブラウザでそこにアクセス
0523名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 01:32:58.18ID:GFy+fnGq
>>520
変なところで書き込んじゃった
conda使ってるのかどうかしらないけど、python3にパス通ってないから動いてないのでパス通せばいい
わからんなら今時python2なんて使わないから消して入れなおせ
0524名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 01:58:20.40ID:56SmY4UL
AUTOMATIC1111/stable-diffusion-webui
>install Python 3.10.6 and check "Add Python to PATH" during installation. You must install this exact version.
>install git
>place into webui directory, next to .model.ckptwebui.bat
>(optional) place into webui directory, next to .GFPGANv1.3.pthwebui.bat
>run from Windows Explorer. Run it as normal user, not as administrator.webui.bat

・Python 3.10.6を「Add Python to PATH」にチェックを入れてインストールする。
・git をインストールする。
・「model.ckpt」「webui.bat」をstable-diffusion-webuiディレクトリに置きます。
・「webui.bat」をエクスプローラから実行します。管理者ではなく、通常のユーザーで実行してください。

一行目でチェック入れてない感じか?
0525名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 03:26:09.75ID:YZGSGLvJ
python2w
3と打ち間違えたんだろうな
conda env create -f environment.yaml
な感じでできるだけ自動でインストールさせるのがいい
0529名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 07:48:21.99ID:0hY1lZcv
>>528
意味がよくわからない・・10分の外出中に1枚なら起動して出ればいいし
1枚/10分って間隔で回すってこと?
よくわからないけど、autohotkeyあたりで大抵できる
0530名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 07:49:41.88ID:kqRrmuyd
waifu-diffusionやべぇな、簡単にいい絵が出てくるぞ
このペースじゃ年内にイラストレーターとかマジで終わりだろ
0531名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 07:56:30.76ID:6ADnR3W4
>>529
そそ
外出中、10分間隔で1枚生成くらいのバッチほし~
今その指定座標をクリックしてくれるアプリ使ってるけど、
もっと洗練された専用バッチあるかな~って~
0532名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 08:02:38.93ID:wUIlejED
Automatic11111でプロンプトを変えながら連続作成すればいいのでは
10分に1枚だけにしたいなら、後で削除したっていいんだし
0533名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 08:11:11.60ID:eMwMFZjS
10分に1回起動を含めてならbatで簡単に作れるけど毎回読み込み挟むからHDDがマッハ
コンソール版の方を本体改造が早い気がする
0534名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 08:19:30.99ID:L3GJdIaT
>>520
venvはPython3.3から標準で使えるようになった
スクショでは2.7なのでvenvが無いというエラーが出ている
3.10も入れたのなら2.7を消せば次は3.10が起動してくれると思う

>>531
10分に一度というのが重要なら指定座標クリックするアプリもそんなに悪くないと思った
アップデートの影響受けないし生成パラメータ変更も楽だし
0536名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 08:27:30.33ID:lV+xWUdV
>>521
解説ブログのようなインストール進行中の画面にならないんですよね
>>523
1111のやつはPython要求しますよね…?
>>524
入れたんですよね…
あとでインストールし直し試してみます
>>525
それはどこで実行すれば良いんでしょうか?
>>534
なるほど古いのが残っていた…?んですね
消してみます
0537名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 08:40:13.38ID:kqRrmuyd
waifu、呪文工夫したらフォロワー1万人レベルのエロ絵すら出てくるわ
ここまで進化してしまうとみんな絵を見ても何とも思わない時代来るな
0538名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 08:41:46.19ID:iZ8P9fJo
正直容量カツカツとかじゃなきゃminicondaじゃなくてanacondaでよくない?ってなる
ミニの方が初心者向けみたいな語感だけど実際は逆じゃないか?
0540名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 08:54:36.76ID:GFy+fnGq
そもそもcondaの仮想環境がいらないんだけどね
どこになんのpython入れてどれ使ってるかわかってない人もいるしね
AUTOMATIC1111版はvenvで全部やってくれるのにcondaなんて入れるからわけわからんくなるんだ
0542名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 09:15:18.96ID:9Ooy1GU9
3GBのモデルデータを毎回読み込み&展開しなきゃなんないのか
オンライン版は常時展開状態なんかな?
素直に学習画像の数を絞ってサイズを小さくしたほうが便利そう
0543名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 09:23:05.24ID:d3F4j6n7
AIニワカだけど、こんな感じで学習画像の量とモデルのサイズは別な気がする

言語・画像データ → (特徴を学習) → モデル(パラメータのウエイト)
0544名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 09:27:28.78ID:0hY1lZcv
>>462
これでようやくMJの--betaや--testに追いついたね、出力される顔の精度が全然違う
SD界隈が一気に盛り上がりそう
0546名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 09:56:43.76ID:+dRJKJI7
>>545
Exponential Moving AverageでEMA
学習を再開する時に必要な、今までどういう経緯で各々のパラメーターが推移してきたかというもので推論時には関係無い
SDの一般配布版はこれが省かれている(=推論専用)のでサイズが小さいが、別に付いていたからといってVRAMを多く食うわけでもない
0548名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 10:45:00.49ID:f0EDRWT4
waifu版すごいね
アニメ顔安定もいいけど
リアル顔指定してもよく出来た3DCGみたいになるのちょっと好き
簡単にckptモデル使い分けれるようにしておけば捗る
0550名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 11:39:37.30ID:YZGSGLvJ
> Waifu-Diffusion v1-2: A SD 1.4 model finetuned on 56k Danbooru images for 5 epochs
たった56k画像を5epochなんだな
これだったらうちのGPUでもできそうだ。3年ぐらいかかるけどw
3090だったら1か月か2か月ってとこなのかな
0553名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 13:13:01.20ID:HGUJWVd7
waifeそんなにいいのか
もう我慢できない

緑バグでる1600のグラボは捨てて新しいグラボ買うしかない

最低3600でいいのよね?
よりスペック高いグラボ買うと、CPUも新調しなくてはいけないしなぁ
0554名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 13:13:51.92ID:zD9vRI+j
waifu大体分かってきたわ
danbooruタグをプロンプトで使うならアンダーバーで単語間をちゃんとつなぐ
学習対象がかなり東方に偏っているため作風指定は東方のイラストをたくさん描いている人物ぐらいしか効かない
その他有名キャラは薄く入っているので作品タイトルでの概念指定は大型タイトルなら効く
東方であれば様々な作風のものが対象になっているため、特定のキャラを対象にしない汎用二次元モデルとしての性能は偏っている割に高い
0556名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 13:24:53.72ID:YZGSGLvJ
イーサリウムのアップデートが今月らしいし、それきたらマイニングが完全に終わるだろ
来月あたりマイニング疲労したグラボが安く出回るだろうし、新品ももう一段階価格落ちると思う
0559名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 13:49:36.49ID:PPZLDLjk
9月後半にRTX40XXシリーズ発表予定
RTX30XXは型落ち間近なのに当面は余剰在庫が解消できず
9月にかつてない規模の値下げ予定と台湾報道

円安で日本は多少相殺されるかもしれんけど
それを遥かに上回るレベルで下がりそうなので
来月あたり30XX在庫処分セールで買い時が来そう
0564名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 14:07:37.17ID:YZGSGLvJ
試しにcensoredつけて生成したらチンコ生えてきた
そうじゃない。モザイクかけるだけでいいんだよ・・・
0566名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 14:27:50.71ID:w3OMkbT4
>>530
手が苦手なのは変わりないから
手だけ付け加える職人は盛況だろう
あと同じ顔を描くのが苦手だからソシャゲには向かない
0570名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 15:18:31.12ID:xmm3V41K
Automatic1111版Colabのgradioってだれでもアクセスできるのな
俺のColabにエリザベス女王のプロンプトを勝手に送り付ける人がいる
0572名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 15:20:59.13ID:HGUJWVd7
>>568
オプションってなんのことですか?
no-halfはすでに試したんですけど、できても重すぎてとても厳しいのと
最新版にするたびに緑パグになるので自分では厳しかった
0573名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 15:34:49.62ID:zD9vRI+j
>>570
******.gradio.appってヤツにアクセスする形式だろ?
あれインターネット上に丸裸だからなぁ
ランダムな数字ってだけだからスキャンすればすぐに入れる
launch()のところにオプションを追加するとパスワード認証かけられるんだけど
0574名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 15:40:27.93ID:xmm3V41K
>>573
パスワード挑戦してみるわ

アドレス変えてもすぐにプロンプト送りつけくる
おそらく全員に送りつけてる
******.gradio.appって5桁の数字だしセキュリティないようなもんだ
0576名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 16:05:41.10ID:0hY1lZcv
1111のExtraタブの意味が全く分からない・・誰か教えてくれ
GFPGAN VisibilityとCodeなんたらは顔修正の両者を混ぜる重みかと思ったけど
最初の一回以降、スライダーをいろいろ動かしても結果が一切変わらない

あと上のResizeのデフォ2で1-4まで0.05刻みなのに、正数以外だとintegerのエラーが出たり
Upscaler1と2とかも混ぜるのかと思ったら2しかVisibilityがなかったりチンプンカンプンだ
0578名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 16:16:29.29ID:w0tjTQcP
>>575
そんなの自分でコラすればいいのに
AIにまるごと描かせようとする変な縛りプレイしてる人が多い
0579名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 16:21:02.56ID:/9aVz9SX
>>576
GFPGANもCodeなんたらもリアル顔を修正する機能
絵の顔は無視される
webui.batを実行せず手動でインストールした場合は自分でGFPGANをダウンロードして配置する必要がある(CodeFormerはインストールも)
0580名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 16:43:38.54ID:Bk/7v04f
Waifu やっぱ特性上、引きは弱いなー。ちょっと距離あると一気にキモくなる。まあ引きで書かれるイラストがほとんど無いからしゃーないが。
0581名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 16:49:56.91ID:zD9vRI+j
>>580
引きの絵を作る→顔の部分を正方形にトリミングして低Strength img2img→戻す
なんてのを考えたけどめんどくさいか
0582名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 16:53:03.36ID:0hY1lZcv
>>579
ごめん、それは知ってるし一回目はたぶん使えてる感じ
スライダーを動かしてやり直しってタイミングで
extras-imagesフォルダに連番で出力されるpngが何も変わらないんだ
0583名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 16:54:01.94ID:V08hSV9c
waifu、低strengthのimg2imgなら引きでもそこそこ仕事してくれる印象
初手をtxtでやった場合のバストアップとか、それよりもっと引きが弱め
0585名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 17:00:35.12ID:Bk/7v04f
そしてwaifu のsmile タグの強さよ。ダンボールタグ突っ込むと最優先でシュバっとしてくる感じ。
0586名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 17:11:13.21ID:R0krTcqk
twitterにdreamboothやってるぽい人居るな
0590名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 17:48:38.55ID:/O+40BOf
>>587
学習先や条件を搾られてると作画は安定するけど
絵が量産型ぽくなるのはMidと似た欠点に思えるね

16XXの緑バグはいつになったら直るのか・・・(16XX民)
0591名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 18:00:40.83ID:Bk/7v04f
バイアスかければ安定はするけど、味はファストフードみたいなもんでこれはまあ仕方ないのかなと。
今後はバリエーションを豊富にしつつ破綻を無くすって感じで進化が進むことを期待。
image2imageで構図を色々指定したら面白くなるかな? waifuってimage 2image走るのかな。
0593名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 18:09:47.52ID:g9+cY8J3
>>590
20xxからTensorコアを取っ払ってそれを補うために半精度浮動小数点の演算回路を継ぎ接ぎした間に合わせにも程がある設計なので
こいつで半精度浮動小数点を扱うのはCUDAの界隈では鬼門とされてるらしい
ドライバーが嘘を吐くとか性能が意図的に制限されてるとか
0594名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 18:19:40.10ID:56SmY4UL
Colabは最終出力をzippingしてローカルにダウンロード→ドライブから画像削除するスクリプト仕込んでもアカンのかね?
0596名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 18:25:59.93ID:Bk/7v04f
画像ファイルにしないで、そのまま保存してダウンロードしてからエンコかけたらいいんじゃない?
0597名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 18:50:25.57ID:i5XuI/TO
動画って絵を何枚も描かせる方向より
ボーン抜いてデッサン人形動かしたやつに絵を載せる方向のほうが楽か?
txtの動き部分から動画学習してtxt2motion、見た目部分から絵学習してtxt2img
合わせてtxt2anime
0598名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 18:58:58.94ID:S+OayL4V
ちょくちょく見かける とりんさまv2ってなんですか?
原作してもAIノベリストのしかでてこないけれど…
0601名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 19:10:17.67ID:S+OayL4V
ノベリストのとりんさまアートって言うのは知ってたけどとりんさまモデルとかSDって単語が絡んでたりしたからStable Diffusionに関係してるのかなって思ってた…
Twitter見てもノベリスト関係しか出てこないです
0602名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 19:13:06.73ID:0hY1lZcv
>>576
これ分かった
スライダー変えてgenerateしてもひとつ前の同じ画像が生成されるだけで効かない
upscalerの種類を変えてからgenerateすると起動する
upscalerが決まってて変えないから、再起動しかなくて気づかなかった

値変えてるのに同じUpscalerで起動しないって挙動が無意味なので完全なバグ
0604名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 20:00:47.59ID:ImBcerQC
waifu VRAM30GBいるらしいけどローカルで動かしてる猛者いるの?
0605名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 20:04:41.83ID:o8hMBOZG
>>597
デッサン人形に同じ雰囲気で載せるのができたら最強だけど
プロンプト使ってSDに何枚も描かせるのが現実的じゃないかな
表情は学習データ多いから今でも作れる。ポーズもfinetuneですぐできるようになるんじゃないのかな
https://i.imgur.com/feyI5Np.mp4
0606名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 20:13:39.35ID:2nozphgS
>>604
RTX3080 10GB
1111をwaifuのモデルに差し替えただけの状態で一応動いてる
0607名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 20:15:13.65ID:ZPN6z8cR
>>595
公開は検討中だとか
モデルはwebサービスのとりんさまアート(有料会員のみ使用可能)で使える

>>601
AIのべりすとの製作者がSDをファインチューンしたのがtrinartSDでそのバージョン2が今日公開された
https://huggingface.co/naclbit/trinart_stable_diffusion_v2
話題としてはwaifu diffusionに持っていかれたけどキャラクター特化モデルのポテンシャルは高そう
0610名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 20:30:05.02ID:/O+40BOf
>>593
一応、--precision fullオプションで回避できるみたいだけど
これ一部の機能を停止させて妥協してるって事なのかな?
cmdの立ち上げ箇所にでも追記すれば良いのだろうか・・・
0611名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 21:07:21.83ID:S+OayL4V
GoogleColab版でフィルタ外して出力してるとbanの可能性出てくるって板で見たのですが、子供っぽいえち系が対象なのですか?
成人キャラのえち系もbanされる可能性ありますかね…?
0613名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 21:17:28.58ID:gk4aN1Nh
>>611
Google ColabというかGoogleドライブに不適切な画像を置くとバンされるかもって話じゃないかな
真偽は分からない。

実際には、かなりすごい画像(AI無関係。もちろん実在の人間ではない)をGoogleドライブで配布してる人も
いて特に問題になってないからそんなことあるのかな?という気もするけどね。 厳しいのは実在の人物だけじゃないのかな

そもそもメインで使ってるGoogleアカウントでやる必要はない
0614名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 21:27:16.82ID:S+OayL4V
>>613
遊び心で本垢も気にせず遊んでしまった
水着に下着で遊んでたけど、時々隠してないの出てきつつもロリじゃなかったし。
でもふたば覗いてたら垢ban報告少しあったりで心配になりました
アメリカって二次系なら殆どロリ判定してきそうだし…
それ用の垢作ろうかな
0616名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 21:40:57.08ID:H6K1O1ay
Googleの俺ルールはあてにならないからな
colabはアカウント別にしてる
のでBANされても痛くも痒くもない
0617名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 21:42:40.56ID:eMwMFZjS
米国で病気の子供の症状を医者に見せるのにドライブ経由で共有したら
google先生に「児童ポルノうpしたな殺す」宣言された事例があったとか
0618名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 21:46:31.02ID:/03EGUT+
自分の子供がプールで遊んでる画像を保存しててアウトになった例もある
0619名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 21:47:19.36ID:1+6It50Q
1111がアップデートでマイナス言葉使えると聞いてインストールしたけど、
なんか形式が変わって省メモリ設定の方法変わった?…
0620名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 22:00:35.47ID:L3GJdIaT
>>619
webui-user.batに書くように変わったよ
直接書き換えてwebui-user.batを実行でもいいけど
>>609みたいにコピーして別名で置いておくと今後のバージョンアップで上書きされない
0621名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 22:04:09.99ID:1+6It50Q
>>620
ありがとうです
アップデート毎に書き換えなくて良くなったのですね
便利でありがたいです
0622名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 22:18:20.35ID:ZGUYeqvF
waifuプロンプト

1girl 女の子一人の意味 danbooruはこれ系がスタンダード化していて超強力 ~girl構文の代わりに使うのも良い 派生に2girl、1boy等々
standing ただ単に立たせて引きの絵が欲しい時の一択 超強力で副作用が少ないため足りなければガシガシ強さを上げられる
reference_sheet 設定資料の意 似たようなキャラが2、3人並ぶが解像度の関係で全員壊滅するので要テクニック 縦長の画像生成だと基本ポーズのキャラ一人が出てくる
sex 隠し味的に使うと色気が出るがプロンプトの他が弱いと容赦なく脱いで18禁に
navel へそ 露出していればへそが描かれて、フィットした着衣ならへそのラインが強調される
headgear SF系でよくある耳や頭のメカメカしい謎アンテナが付く
0623名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 22:24:44.51ID:o5Z1vyXg
本家diffusers sdで縦1024にするとよく顔が上下に2体出来るんだけど、改善されてるフォークとかあるの?
0624名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 22:29:39.28ID:Bk/7v04f
アスペクト比1:2を越えるとトーテムポールになるのはMJでも同じなので、アスペクト比を3:4ぐらいに抑えるしかない気がする
0625名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 22:30:43.94ID:S36CQomC
1111の新機能マイナス言葉?って
単語の前にマイナス一個つける? マイナス2個?
それともマイナスではなくnoをつけるだけ?
noだけでも効いた感じするし−noでも効いた感じする
とにかく効いた感じする
0626名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 22:31:48.03ID:V08hSV9c
>>622
1girlってwaifu専用やったんや
まあ現状だとwaifuしかもう使わんわって勢いで二次は優秀だから本家未対応でも構わんけども
0627名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 22:33:48.70ID:xmm3V41K
>>622
sexで瞳にハートが描かれたわ
0628名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 22:34:01.34ID:Bk/7v04f
jspaneseやべえな。Japanese animeとかJapanese light novelとかでも容赦なく和服になって富士山が聳え立ち桜が咲く
0630名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 22:40:37.82ID:V08hSV9c
japanese油断すると街並みが木造長屋とかになるから使いどころ難しい
ちゃんとjapaneseの弊害を打ち消す言葉を入れられないシチュでは害の方が大きい
0632名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 22:55:44.11ID:P1hRy//7
>>604
3060ti vlam8gbでうごいてるよー
作業内容はテンプレにある手順からモデルをwaifuに差し替えるだけでいけた
アニメ系強くていい感じ

https://i.imgur.com/v8IWLiN.jpg
0634名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 23:18:51.96ID:NmXa8Afu
この種のAI画像作成サービスで見事なものを作る(出力させる)人を「魔術師」と呼ぶ、っていうのを今日知った。
言い得て妙だ。
0641名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 23:49:04.84ID:0hY1lZcv
今見てたらcfgのstepも0.5より細かくできるのか
一つの当たりの前後を捜索したい時があるのでこれも嬉しい
0642名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 23:57:49.09ID:ZGUYeqvF
waifuのimg2img強力だな
いい感じの画風のプロンプト入れておくだけでどんな写真も二次元にできる
0643名無しさん@お腹いっぱい。
垢版 |
2022/09/09(金) 23:58:41.52ID:gk4aN1Nh
Dockerメモ
○Docker on windows Stable Diffusionインストール手順
・WSL2をインストールする
・docker desktopをインストールする
・git clone https://github.com/sd-webui/stable-diffusion-webui.git
・.env_docker.example をリネームして、.env_dockerにする
・docker compose up

後はモデルのダウンロード含め全てやってくれます。(時間はかかる)

★cuda用ドライバが必要とある記事がありますが、不要でした。
おそらく現時点ではcudaドライバも通常のドライバに同梱されている?(一応、studio driverでした)
★Windows10でWSL2は、Inside Previewが必要とある記事がありますが、現時点版で問題ありません。

○性能: 何度かやり直しましたが、なぜかDockerの方が1割ほど高速でした。謎・・・
・1080Ti、2022/9/9 22:00〜23:00頃版のhttps://github.com/sd-webui/stable-diffusion-webui
・プロンプト:girl seed:3107511606 width:512 height:512 steps:50 cfg_scale:7.5 sampler:k_euler_a

■直接起動: 19.94秒 (2.63 it/s) 2.62-2.63 it/s
Took 19.94s total (19.94s per image) Peak memory usage: 6528 MiB / 11264 MiB / 57.953%
50/50 [00:19<00:00, 2.63it/s]

■Docker起動: 17.81秒 (2.95 it/s) 2.80 - 2.96 it/s
50/50 [00:16<00:00, 2.95it/s]
Took 17.81s total (17.81s per image) Peak memory usage: 6611 MiB / 11264 MiB / 58.686%
0644名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 00:00:35.46ID:w6clbfvE
waifuのCFG scaleを5に下げたらめちゃくちゃ可愛くなった
俺のprompt要らないじゃん
0645名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 00:01:44.99ID:ZaqeNykA
まじで!?
公式だとCFG下げるとぼんやりした画像になるだけだから、上げるのデフォに考えてたわ
0646名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 00:06:22.70ID:+Piu7ipB
CFG上げると融通効かなくなって、SSR出ない代わりにSR率が上がり、CFG下げるとwaifuに丸投げ度高くなるのでSSR出るけどNも出まくる印象。
0647名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 00:08:35.18ID:eEaC99Qw
ちょっと違うけどMJの--sの逆みたいな感じだね、プロンプトに縛られない
小さいと大抵意味不明な画像になるんだけど、waifuなのも関係してるのかな
0649名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 00:52:02.87ID:3pApQF4T
バストアップではなく体も入れたい時は
ある程度画像サイズ大きくしないとあからさまにクオリティ落ちるな
0652名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 01:57:27.67ID:8OeOFuBd
talking-head-anime-3みたいなのあるからもう開発されてそうだけど
表情までガチャ引くより他のアプリ使って手作業したほうが早そう
0653名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 02:03:52.52ID:SMIYc4tc
表情以外も多少なら変わっていいならimg2imgで十分いける
顔部分以外許容できないってならimg2imgしてからフォトショで顔切り出して元画像に貼り付けかな
0656名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 03:53:36.21ID:k4vW++4t
>>576
CodeFormerは
強⇔弱
0⇔1
だけど間違って1にしてない?

>>579
人物写真風画像以外で使うと顔だけ作風が変わって変になると思うけど
0657名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 04:18:30.90ID:I2gHNbEA
ひゃっほう、AUTOMATIC1111版インストールしたsingularity image作って、WSL2のsingularityで動いたぜ!
3060も--medvram付けないとエラーになるのね……。
0659名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 07:39:46.48ID:f+mFBrjB
「anime girl」でアニメっぽい女の子が出てくるのはanimeとgirlの意味を合成しているわけでは無く「anime girl」で一つの単語として扱っている
これは長文であっても同じで連想配列から引いているようなもの
配列がめちゃくちゃ巨大だから人の目にはテーブルで引いているように見えないだけ
なのでテーブルにある文章ならいい感じの絵が出るがテーブルにないとそれっぽいコラ画像で誤魔化すことになる
まあnewとyorkを合成してもニューヨークにはならないので熟語を一つの単語として扱うのは仕方のないことなのだが
個人的にはないならないでエラー出して欲しい
0660名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 07:55:14.27ID:gCHe1Klh
使い切ったので追加で10$払ったけどmeters usage って何?
0661名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 08:13:02.75ID:6+vcRMNK
>>659
midjourneyでは、
a beautiful anime girl
でも
a beautiful anime lady
でもアニメ調の女性の絵が出て来たよ。
midjourneyではgirl、lady、womanのどれが良いか試すのよくやる。
0662名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 08:24:52.63ID:f+mFBrjB
>>661
そうそう
girl、lady、woman、sister、全部テーブルの違うカラムを参照している
他にもgirl in tokyoとgirl in ney yorkも全く違うものを指しているため人種から服装まで違うものが出力される
0664名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 08:45:52.19ID:TPYLp84j
単語のテーブルなんて無いよ
あるのはそういう出力がでる重みをもった学習済みネットワークだけだ
0665名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 08:46:00.15ID:JzIUFcgd
>>611
AIがまずそうな画像を削除する
されたら自重すればまあ
0668名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 08:57:26.78ID:eEaC99Qw
Kritaはねぇ・・一応SAIにとって代わろうとしたソフトなんだけど
起動の遅さも辛い、何やったらそんな時間かかるんだレベル、今立ち上げたら1分45秒掛かった
さすがに落として2回目は15秒で起動してきたが
0669名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 09:12:00.73ID:YF0IA75I
1111のローカル版でも同じ様なプロンプトを使い続けてると過去の生成イメージを引きずってる気がするけど勘違いかな?
プロンプトから外した要素なのにキャッシュを再利用されてる感じでその後の生成でも加えられ続けてるような
hlkyのcolab版でも同じような現象があって、それは高速生成の為に実際行われてたっぽいけど
ただの勘違いだろうか
0670名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 09:26:42.54ID:+Piu7ipB
それはあると思う。colabでもpromt変えて最初の数枚は前のpromtと干渉したような結果が返ってくる時がある
0671名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 09:32:16.72ID:kC0V19v4
GPTにしろなんにしろこの手のtransformer発展のやつは前回結果と全く同じ単語含んでるとキャッシュしてるのでその手のゴーストみたいな現象稀に起きる
0673名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 09:36:36.08ID:YF0IA75I
やっぱりある感じ?…
そういうキャッシュというかログみたいなの消すボタンないかな…キャッシュフォルダ削除みたいな…
もう一回.datから新しいローカルに立ち上げてみるか…
0674名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 09:36:43.12ID:5Py8yvoh
seedがあるんだから直前や少し前のプロンプトに結果がつられてるってのは理屈的におかしくね?
seedが結果から逆算されるものでもなし
0675名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 09:38:28.06ID:n6V+4y05
>>671
> GPTにしろなんにしろこの手のtransformer発展のやつは前回結果と全く同じ単語含んでるとキャッシュしてる

かなり重症のキチガイだな
0677名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 09:40:37.93ID:f+mFBrjB
同じ単語含んでたら似た結果が出るのは当たり前だろ
0678名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 09:41:42.00ID:6+vcRMNK
>>662
midjourney弄っていれば分かるけれど、流れて来る他のユーザーの生成画像の10分の1ぐらいは面白いイメージの合成にチャレンジしている。
an ancient chinese goblin toy
と入れると陶器で作られたゴブリンの像の写真みたいなのが生成される
それを
steam-powerd ancient chinese goblin toy
とかすると角みたいなのから蒸気出していたり鍋のようなの持っていたりする
こういうの全部テーブルとパクり元画像を用意出来ないでしょう
0680名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 09:49:49.52ID:kC0V19v4
>>675-677
"standing, only man"の後に"standing, only
girl"ってやったら
前回の"standing"のキャッシュに引っ張られて女の子だけじゃなくて男も出てくる可能性があるって話だよ
なんかよく分かってないのに無理にでもなにか言おうとする言葉汚い人駐留してるね

あと軽いwaifu版きた
https://huggingface.co/crumb/pruned-waifu-diffusion
0681名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 09:55:07.78ID:TPdSjrNx
キャッシュに引っ張られる、とか「テーブル」とかマジで病院行った方がいいよ
本気で頭が狂ってる
0683名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:00:39.24ID:5Py8yvoh
(汚い言葉のルーパチ君は無視で)

AIに
①おっぱいばかり作らせてる人が、次におっさんプロンプトで描かせた、オッサン絵seed12345、「乳首があるから影響受けてね?」
②お○んこばかり作らせてる人が、①のプロンプトとseedを聞いて全く同じオッサン絵が出てきた、「え?お○んこないじゃん?」

「seed固定したら当たり前だろ?固定しなかったらちゃんとお○んこに寄る別seedになるよ」

じゃ、②のAIに蓄積されたお○んこテレゴニーを、②のAIが
「おっさんプロンプト&seed12345の生成結果にお○んこがないからseed12345は避けよう」
ってアカシックレコードから逆算察知するアルゴリズムが働くの?
0684名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:00:47.17ID:yHyqCaQj
AI DungeonとかAIのべりすとでも似たような話(消したはずの過去のデータに引っ張られる)あったけど結局原因になりそうな仕組みとか根拠になるデータは出てないんじゃなかったっけ
プロンプトと関係ない画像が出るのはよくあることだけど前と似たような画像が偶然出てきた時だけ記憶に残るってだけじゃない?
0685名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:02:48.18ID:6+vcRMNK
テーブルとかただのコラージュ(寄せ集め)だとかの疑念を持ってたら、それじゃ出来ないハズの実験をしてその結果から確からしさを確認してから断言しないと
0686名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:02:53.17ID:kC0V19v4
テーブルマンの人言いたかったのはトークンの事ででしょ
ただトークンリスト上になくても似た単語や文字列から引っ張ってこれる可能性あるから認識しないってことは無いだろうけど
0687名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:04:42.93ID:JUvm7929
まじで引っ張られるならそのキャッシュが無い環境で同一シード同一プロンプト同一以下略でやった結果が異なることを見せてほしい
そしたら俺らの大半はテレゴニーが起きてるのを信じるよ、多分
少なくとも俺は信じるよ
0688名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:06:41.16ID:TPdSjrNx
実験とかする必要なんかないよ・・・
頭のおかしい妄想の相手したってそれ親切じゃないから
0689名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:07:10.48ID:TPdSjrNx
>>687
信じるとか信じないとかって話じゃないでしょ
「キャッシュ」ってなんだよw
0690名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:07:39.88ID:kC0V19v4
>>684
稀によく起きるってやつ(AIDでも体感1000個プロンプト開始して1回以下、でも起きると連発する)だし実害ないから誰も検証してないぽい
まあそう言う現象があるかもしれない程度の都市伝説ぐらいの感覚でいいと思う
0692名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:12:34.48ID:TPdSjrNx
>>691
あんたの脳内にはなにかあるんだろうが、Stable DiffusionでもMidjoruenyの話ではない。
あんたの妄想の話だからスレチだよ
別スレでやってくれ
0693名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:16:15.87ID:73uxErN5
1111版ならあり得るぞ
txt2imgもimg2imgも全部同じ処理だからな
0696名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:20:58.18ID:yHyqCaQj
AIのべりすとの「≡」とかもそうだけどよくわかってないのに断言する人が出て広まっちゃっても面倒くさいし検証できるならした方が良いと思う
0697名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:21:22.09ID:5Py8yvoh
同一プロンプト同一seed(最大桁数知らんけど有限)が
同環境なら誰がやっても必ず同じものになる世界でしょ?

プロンプト蓄積がメモリ管理の都合で結果に影響を及ぼすってんなら
seedを鯖で一括管理して、蓄積の影響を受けたローカルAIの「結果」に割り振るseedを決めつつ
蓄積のないAIは影響されてない場合のseedを割り振るみたいな仕組みが必要になっちゃう

まぁ、ないでしょう
seedの概念が完全に本末転倒だ、乱数の起点の種ってだけなのに
0698名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:21:58.89ID:7PpU3pyP
>>692
MJやSDの根幹技術のCLIPやそれぞれ入口でword認識に使ってるTokenizerはBEATだったりと
関連技術の話だしAIに美味いことどう単語食わせるかって話だからスレチでないぞ
ただ長々続ける話題でもないが
0699名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:23:43.53ID:+iObtE1T
テーブル
キャッシュ
都市伝説
1000回に1回以下

AI界の稲川淳二かな?
0700名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:24:59.72ID:TPdSjrNx
>>698
そういう実在する単語を混ぜながら狂ったことを言い続けるので、本物のキチガイだといってるんですよ
単に無知なだけじゃなく病気です
0702名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:29:47.63ID:7PpU3pyP
>>700
cashはVRAM上にモデルデータ本体と余力あれば効率化の為にベクトルのリスト駐留させたりで存在しない訳じゃないぞ
0703名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:32:46.20ID:bde4crvL
現在GoogleColab派なのですがwaifu-diffusionもSD同様にローカルだとオフラインで動かせるんですか?
0704名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:34:37.59ID:73uxErN5
1111版は毎回txt2imgとimg2imgのインスタンス作って初期化しているから画像が残ってるようには見えなかった
もしキャッシュがあるならStablediffuionのモデル自体にあるかもね
0705名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:35:29.64ID:kC0V19v4
>>703
emaなし版(8GBくらいあるでかいオリジナルの方)でローカルで動くことは確認した
自環境はメモリ16GBしかないので読み込みと展開完了するまでPCフリーズしたような状態になったけど
0707名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:37:54.30ID:XNj39oiC
オープンソースなんだから仕組みや挙動がおかしいって言うならソースコードから該当する部分引用すればいいだけ
自分の動かしてるプログラムが何やってるかわかってなさそうな人に付き合う必要は無い
0709名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:42:57.41ID:bde4crvL
>>0705
ありがとうございます
ちなみにwaifu-diffusionをローカルで動かすために必要なデータでダウンロードが必要なものって、sd-v1-2-full-ema.ckptの他にも何かありますか?
0714名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:53:44.59ID:mhxzZm57
ID:bde4crvL
>>1
> テンプレまとめ
> https://rentry.co/zqr4r
「ローカル環境構築手順」に丁寧に書いてあるから読んでくるんだ

とりあえず動かせた後にckptだけ入れ替えればOK
マンガン電池をアルカリ電池に変えるみたいなもの
0715名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:54:06.34ID:kC0V19v4
>>711
Waifu版はSD1.2ベースだから(震え声)

>>712
今あちこちで公開されてるSDのモデルは2形式あって
・ckptファイル形式(仮名)
なんか全部の情報が詰まってるぽいやつ、主にここで話題にされるもの
・公式ファイル形式(仮名)
https://huggingface.co/CompVis/stable-diffusion-v1-4
上記URLで配布されてるやつ、NSFW判定付きで職場でもお子様でも安全
使うのに公式ライブラリ経由とアカウント登録必要なのとNDFW表現規制ある(解除可能)のととかで
なんか色々不便なのでここではほぼ話題にならない
0716名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:55:32.73ID:VlM0DlWa
>>715
あの~完全に間違っている気がするんですが。。。
0720名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 10:58:48.52ID:wTSpJ7x4
テーブル
キャッシュ
都市伝説
1000回に1回以下
Waifu版はSD1.2ベース
モデルにckpt形式と公式ファイル形式がある

すご・・・・w
0721名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 11:00:22.49ID:+Piu7ipB
birs's-eye入れるとちゃんと見下ろしてくれるけど、たまに鳥さんそのものが映り込むw
くっそw
0723名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 11:02:22.47ID:f+mFBrjB
だってバーズアイで絶対俯瞰視点画像が出てくるようにしちゃうと逆に鳥の目のアップの写真が欲しい時に困っちゃうからね
0725名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 11:09:57.57ID:mhxzZm57
> ここだと1111版が推奨されてるぽい?
ずっとhlkyだったけど乗り換えたよ
痒いところに手が届くし、settingsは一か所にまとまってるしカスタマイズ性も高くて使う側のことめっちゃ考えてくれてる
hlkyは意味不明なUIに加えverupのたびに色んな配置をコロコロ入れ替えてくるので混乱してイライラする
0726名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 11:11:09.94ID:bde4crvL
>>0714
ありがとうございます、もう一度読み返してみます
>>0715
ckptファイル形式のやつを調べてみようと思います
>>0781
その1111版も確認します

みなさんありがとうございました
0728名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 11:15:52.97ID:yHyqCaQj
①「standing, only man」でseed1~8まで8枚生成
https://i.imgur.com/wQ6QIPc.jpg
https://i.imgur.com/hC7IGZJ.jpg
②「standing, only girl」でseed1~4まで4枚生成
https://i.imgur.com/LMno1QJ.jpg
③colabの接続を解除してもう一度「standing, only girl」でseed1~4まで4枚生成
https://i.imgur.com/I7vtbbb.jpg

いまいちどういう状況を指してるか分からないから自信ないけど検証はこれで良いんですかね?
0735名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 11:28:51.64ID:VlM0DlWa
hlkyは1111からフォークしたクセになぜが自分がオリジナルみたいな顔してるのが気持ち悪い
0736名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 11:30:42.14ID:xV7Cqz7T
1111とかのローカル版ってアプデとかで新しいバージョンが出たときってアンインストール→再インストールしないと駄目だよね?
0737名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 11:33:49.41ID:XaX3b2f1
>>663
あーとりあえず、10ドル分の追加料金払ったらそこまでしか使えないってことね…
0738名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 11:36:02.89ID:mhxzZm57
>>736
解凍してstable-diffusion-webui-masterに上書きでぶち込むだけで動くよ
もちコマンドプロンプトは落としてwebui.bat再起動からブラウザ再読み込みね(当たり前)
自分で設定したui-config.jsonだけはよけとくけど
0739名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 11:42:24.97ID:mhxzZm57
>>737
何言ってるのかわからんけど、いわゆる従量課金になる

> 10ドル分の追加料金払ったらそこまでしか使えない
「そこまで」なんてどこにもないし、料金は後払い
$10のサブスク使い切った→従量課金に勝手に移行して無限に使える(ただし単位価格は3割増し)

勝手に従量制に移行するのが危ないと判断したようで
警告を出すタイミングを選ばせてくるって話ね、「$5使ったぞーいいのか?」「$10使ったぞー?」って
0740名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 11:42:50.48ID:I2gHNbEA
git cloneしてたらgit pullするだけでいいんじゃない?
0741名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 11:57:12.88ID:kC0V19v4
調べたらwaifu版はSD1.4ベースだったわ
これに関してはうそ情報スマン

あとSDの配布されてるモデル形式が現行2種類あるのは本当だからね
ここだとckpt形式の方しかほぼ話題にならないから混乱の元にはならないとは思うが
0747名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 12:08:48.82ID:lFr2ZBe7
広告用の映像を間に受けないほうがいい
チェリーピック素材どころかAI使ってない素材の可能性もある
0748名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 12:09:39.09ID:SMIYc4tc
>>741
2種類も嘘
公式配布モデルではSD1.4以外使われてなけど公式でも4種類かな配布されてる
1.4に表現規制あるっていうのも嘘
ckpt形式の方しかほぼ話題にならないってのは何言ってるのか分からないけどどうせそれも違うんだろ
0749名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 12:11:00.92ID:xNII+bYq
>>742
デモは紛らわしいけど、あくまで編集メインなんじゃないかな。生成ではなく
ただのテキストコマンド入力みたいなもんかも?

>>745
完全にフェイクの可能性もあるのかw
AIでフェイク、だけじゃなくフェイクAIも・・・ 。難しい世の中になるねえw
0751名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 12:16:16.93ID:bde4crvL
wd-v1-2-full-ema.ckptの容量はどのくらいなのでしょうか?
7.17GBか、それとも7.2GB
とりあえずダウンロード始めたら後者になりました…ですがこの掲示板を遡ると7.17GBというレスもある…
最新版が更新されたのでしょうか?
0752名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 12:17:02.39ID:sB5FjkHW
マイクロソフトだかがディープフェイク判定AI作ったみたいなニュースあったけど
転売屋と転売対策みたいに無限にイタチごっこになる時代が来るんかね
怒られない範囲で悪用したい人間としては簡単にエロ画像エロ動画作れるAIバリバリ出てきて欲しいけど
0755名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 12:23:44.34ID:DQboyw0q
雰囲気悪くなるしSMIYc4tcも黙った方がいいんじゃないか

SDの動画版と音声も年内に来るんだっけ?
音声は英語基準だろうし日本語とか出来なさそうだからあまり期待してないけど
0756名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 12:29:39.55ID:bde4crvL
>>754
容量を気にしたのはバージョンが気になったからです
もしかして、ややこしいですが「元の PyTorch モデルのダウンロード リンク」からDLできるものが最新版だったりするのですか?
0757名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 12:33:26.73ID:sB5FjkHW
>>756
>>546
ということらしいので自分でなにか学習させるつもりがないなら
同じVerの画像生成専用に使える軽いやつがおすすめされる
0758名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 12:33:49.74ID:xNII+bYq
>>755
> 雰囲気悪くなるしSMIYc4tcも黙った方がいいんじゃないか
馬鹿なことを書いてるのをスルーすると本気に取る人も出てくるからちゃんと指摘したほうがいいと思う
この2人(1人?)はちょっと度が過ぎてるしね
ID:kC0V19v4
ID:7PpU3pyP


StableAIのaudioは、具体的にはなんだろうね

このkoe.aiとかは英語のサービスだけど、日本語でも割りといけたりする。
https://koe.ai/recast/
0759名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 12:36:50.07ID:f+mFBrjB
別にSD製の画像で直接商売する必要はないんだよね
例えばイラストレーターを育てる育成シミュレーションゲームを作る際にSDを使うことができる
0762名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 12:45:05.28ID:sB5FjkHW
ID:7PpU3pyPはともかくID:kC0V19v4は軽い版Waifu情報持ってきたりしてるし嘘言ってない気がする

いや煽り煽られは2chの華だぞ言われたらその通りなのでどうぞどうぞするしかないが
0764名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 13:03:14.02ID:+Piu7ipB
言葉に複数の意味があるから、その辺考えないと破綻しやすいなやっぱし。
例えば修道女なんかだと教会にいるのが当たり前だから、さらに教会の中でとか指定すると変な感じになりやすい。
けど森の中でとかすると割と普通。
同じように騎士とか侍とかだと男前提の言葉だから、ヒョイっとseedによっては騎士の少女とか書いても男が出てくる。
だから、◯◯を着たみたいなコスプレで考えるとそう言う紛れは無くなる気がする。
0765名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 13:05:36.95ID:cCha95+J
まだ微妙な場合も多いけどエロ画像作り放題の時代が来たし
エロ動画作り放題の未来も見えててまだまだ人類は捨てたものじゃないということか
0767名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 13:11:01.33ID:f+mFBrjB
例えば10万円欲しいときにGoogleで「10万円」と検索しないよね
バイトとか求人とか宝くじとか
画像生成も同じ。裸の女の子が欲しいからプロンプトに「裸」と入れるのはただのアホ
0771名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 13:21:25.20ID:cCha95+J
SDはいくつか英語以外の言語も認識してるんだっけ?
ふとnude以外に裸と裸的な他の言語の同じ意味の単語混ぜて補足強化できたりしないかなと思った

まあそんなことするより1111版なら()でくくばいいか
0772名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 13:29:19.45ID:vRHGVOhL
>>656
> 0⇔1
> だけど間違って1にしてない?
そういう話じゃなく>>602ね、なお最新版で修正されてたよ
> fix aggressive caching for extras tab
これかな?
0778名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 14:37:34.24ID:nxV/3jeW
オリジナル版とかはねんどろいどの写真がうまい具合にできてたから
世界が丸ごと二次元に寄ったせいでねんどろいどがSDキャラになっちまったんだな
0779名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 14:42:56.58ID:+Piu7ipB
多分、AIで崩れやすい目とか口とか手足の情報がねんどろいだとねんどろいどというだけで強烈にバイアスかかるからスパッと決まっちゃうんだろうな……
0781名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 15:39:17.55ID:8CtG8NSb
SDは学習元に露骨に近い絵は出さないようにしてるだけじゃないの
サンプルが多い作品はかなり本物に近づくからわざと版権外してるってことはないし
そもそもそんなの不可能でしょ
0782名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 16:12:27.62ID:k4vW++4t
学習しきれてない画家の名前入れると本物とは全然違うのに統一された作風になるのは恐ろしいというか紛らわしい
例えばby Noriyoshi Ohraiって入れると美人画が出てくるんだけど生頼範義の描いた人物画には似ても似つかないとか
0785名無しさん@お腹いっぱい。
垢版 |
2022/09/10(土) 16:43:57.96ID:k4vW++4t
中世の宗教画とかの人の名前入れるとそれっぽい感じのは出るんだけどなんか違うぞって
そういう時は出力と画像検索結果をにらめっこして決めてる