X



Midjourney】AI画像生成技術交換2【StableDiffusion
レス数が1000を超えています。これ以上書き込みはできません。
0001名無しさん@お腹いっぱい。
垢版 |
2022/08/22(月) 14:38:25.17ID:Cv/bdJEy
英語の文章が画像に!
背景に使うか?イラストのアイデア出しはもちろん、
与える英文を捏ね捏ねして思いがけず生成される秀逸画像ガチャで遊ぶのも楽しい
有料サブスクで商用利用まで可能なAI画像生成サービス

★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
(他のスレがありますのでそちらに移動してください)

前スレ
【Midjourney】 AI画像生成 【DALLE】
https://mevius.5ch.net/test/read.cgi/cg/1659786388/
0081名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 23:33:54.22ID:JmVG8zqE
今更midjourney遂げた凄まじい進化に驚愕してる
こりゃ今年中に来るかもしれんな
AIが実用的なエロ画像を生成出来るようになる時が
0084名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 23:36:29.11ID:o+8ULzIq
①適当な指示絵で髪の色や顔の形を指示
②img2imgで変換して好みの画像を選ぶ
③破綻した部分を大雑把に直す 謎のオブジェとか余分に生えた腕を消す
④重みを弱くして再変換

画像は出力画像が再入力できるからヤバイよ
②~④を繰り返せばそこそこ好みの絵ができたよ
0085名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 23:54:08.75ID:TdkLRr5D
うわー、つまってしまった

上にある
・Google Colab(フィルタ解除版) https://colab.research.google.com/drive/1jUwJ0owjigpG-9m6AI_wEStwimisUE17
を四苦八苦しながらやっているけど、
PROMPT入力して生成するところで、NameError: name 'pipe' is not definedと出て失敗してしまう。
アクセストークンが間違っているのかな? みてもわからないわ
0086名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:03:04.67ID:ktn3oZWh
>>85
なかなかヒントが少ないけどw

--> 116 "You specified use_auth_token=True, but a Hugging Face token was not"
117 " found."

もしこう出てるならトークン未設定か、huggingface_usernameかhuggingface_tokenが間違ってる
0090名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:21:45.50ID:qfvTN6Mb
ゲームやらないしGTX980で十分だわと思ってたけどグラボ買っちゃう勢いの技術だな
ただColabに毎月1000円課金する方が安く済むならそっちが良いけど、
課金しても無限にGPU使えるわけじゃないっぽいから悩むなぁ
0092名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:25:58.70ID:VYiQzdFX
ローカルで動かすのややこしいんだね
DLインストールしてポンとは行かないのか
0093名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:26:12.43ID:F5OuPmFA
マイニングだけじゃなくてイラスト作業でもGPUを酷使するのか...
日本でグラボが短期的に高騰しそう
0094名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:28:20.70ID:Je2EIVx2
オープン技術の黎明期あるあるだね
ちょっとしたらGPUある人向けにGUI組み込んだフリーソフト作る酔狂者が現れるかもしれない
0095名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:29:29.11ID:TTMJgFKc
>>94
redditにgimpのプラグインっぽいスクリーンショットあげてる人いた
0096名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:33:16.83ID:gT+8LwsL
>>87
このcolabのFor Gdriveってとこにあるuser_pathとfile_nameってなにをいれたらいいんですか?
0097名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:34:55.78ID:OfpVbaR2
呪文教えてくれって言ったのに全く反応がないのは
やっぱ出来が悪いのしか作れていないから?
難しいんだねぇ

自分的には力作で気に入ってるけどUP出来ないのも
けなされるのが怖いから?
0098名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:35:06.66ID:DLv+Kqg8
プロンプトの効果ってバージョンアップごとにごっそり変わりそう
っていうか何なら日々の学習で流動的に変わってそう
0099名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:35:18.06ID:bykfx2UB
人間に特化した、ちゃんと人間の顔と身体を理解してるAIモデルって作れないのかな?
現状だとちょっと精度低すぎて顔崩壊しすぎる
0100名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:35:56.31ID:Je2EIVx2
MJは256角4枚を俯瞰して好きなのを選んでアップスケールで1024角だから作った瞬間映えるんだよな
DreamStudioはいきなり1枚512角が最低ラインなんでゴミに金払わされる
・・あれ?逆かMJこそ無駄に作成させられてる?わからん
0101名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:36:45.19ID:ZxeWx7Jy
すいません、stable diffusionのimage to imageのやり方がよく分からないのですが、どこかやり方が載ってるところってあります?
0104名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:41:33.75ID:Je2EIVx2
>>97
前スレでずっと無視されてた人か

単にせっかくコツコツ試行錯誤して編み出した呪文をなんの見返りもなく教えたくないからだろう
ツイッターとかでも公表してる人あんまいないよ、しょーもない実験風のは書かれてるけど
852話とか言う人もかなり前だがキャラ設定画みたいなののレシピをさんざん上げてから公開してたし

だから>>82はありがたい
MJはDiscordでのぞき見できるから捗ったんだけど
Discordβ終わったSD(DS)はβやれなかった自分には手探り過ぎて放置してた
0105名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:42:02.98ID:VYiQzdFX
地味に、自分が吐き出した画像って愛着あるよね?ゴミでもなんか捨てづらい
これから動画も増えるだろうし、GPUもだがHDDも需要が増えるな
0107名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:45:40.88ID:F5OuPmFA
いいpromptを教えろって言ってもどの言葉がどの程度作用してるのかさっぱりわからないんだよな 
4kとかunreal engine5みたいなキーワードはあっても結局運だし
俺もポーズごとやアングルの定石が分かれば嬉しいと思ってるけど、現状を見るにそういうのはなさそう
0108名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:46:57.10ID:Je2EIVx2
今って選択肢が多すぎてワケワカ状態だな、SD系はもうなにがなんやらi2iまで言い出したら
ちょっと置いた方がいいかもしれん

自分はbetaで活気ついたMJいじりながらボロPC買い替えにでも動くか
0109名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:47:30.07ID:zyWvVtGI
>>99
リアル人間のなら2桁くらい公開されてるんじゃね
最近はファッションモデル用のAI素体を提供してる所もある
0111名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:50:36.02ID:Je2EIVx2
>>107
オカルトみたいな呪文も結構乱発されてんだよね
効いてるかは入れる場合と入れない場合の同seedでしっかり確認してから使うべき
MJはseed指定が一般的じゃなかったのでもうほんとオカルトで3行とかなってる人がザラにいた
0112名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:52:38.41ID:F5OuPmFA
今は自動イラスト生成黎明期で、本格的になるのは一部修正機能がとかより細かい絵柄の指定が実現できる学習済みモデルが配布されてからかな
今後は学習済みモデルでひと悶着ありそうだ
0113名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:53:59.10ID:VYiQzdFX
詠唱だのプログラムだので必死になる人達は良くも悪くも凄いな
どうせ来月にはもっと簡単お手軽になってるでしょ
俺はパソコン大先生じゃないから今は見て楽しむだけだな
0114名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:55:04.82ID:M/HLpgpi
あんまり長く書き連ねると途中で強制カットされるはずだぞ
トークンっていう言葉の固まりに上限数がある
最後の隠し味にと最後に書いた一文が丸々効いてないなんてことも
0115名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:56:15.84ID:TpN+ACPg
>>107
https://rentry.org/kretard このUI限定かもしれないけど、
create prompt matrixにチェックして、プロンプトのキーワードを | でつなぐとそのキーワード有り無しが出ますね

例えば
girl | on the beach | oil painting
とすると、以下の4枚の画像が生成されます。
- girl
- girl on the beach
- girl oil painting
- girl on the beach oil painting

1ワードずつ効果を探ってられないですが、高解像度のキーワードのあり・なし、効果を見るみたいな使い方なら便利かも
0116名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:58:40.17ID:bgMQ/0YX
>>82
うまいのいっぱいあっていいね
イラストレーターの名前入れるのかなり影響あるから
いい雰囲気のプロンプトはチェックしとこ
0117名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 01:01:06.93ID:Je2EIVx2
>>110
個人が公開してるわけないから、たぶんDiscord時代のログみたいなのから生成してるのかなぁ
日付がそんな感じの古さ
0120名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 01:13:36.34ID:TpN+ACPg
Emad (Discord)
Q Dalleのようなプロンプトでのインペインティングか、自動インペインティングかどっちかサポートする予定ないの?
A 両方でいいじゃん
0121名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 01:15:31.78ID:wNS4aEcK
SDにimg2txtみたいなものって無い?
イメージに近い画像1枚渡すからどういう単語を求めてるのかのヒントが欲しくて
別のRecognize系API使うしかないのかな
0122名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 01:16:14.78ID:TpN+ACPg
>>119
それはGdriveに既にmodelを保存している場合に実行するもので、その上の
!gdown ・・・



%cd stable-diffusion/ ・・・

かどっちかを実行していれば不要だと思います。

このノートは初心者には難しい
0123名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 01:18:22.66ID:Je2EIVx2
>>82で好きな絵探して呪文メモするのにはまってる
みんないろんなアーティスト知ってるな、というかDiscord時代に皆で試行錯誤した集合知なんだろうけど
0124名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 01:20:13.62ID:TpN+ACPg
>>119
ついでにその下のHuggingfaceもいらないと思います。
後、Optimized SDの下のSetup、Settingなどもいるのか要らないのか私には分かりません。よく読めば分かるんだろうけど
0125名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 01:24:00.66ID:gT+8LwsL
>>122
ありがとうございます
必要ないんですね
てっきりここでエラーがでるので、pathを入力してないせいだと思っていました
ちなみに、このエラーもわかったりしますか

本当に難しいです
初心者なのでわからないことばかりです

https://imgur.com/a/Y8K8y0u
0127名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 01:39:26.95ID:qfvTN6Mb
Colabでの出力だとシード数という概念はない感じ?
一回出た画像を再度出力とかは無理で保存するしかない感じ?
0128名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 01:54:24.11ID:TpN+ACPg
>>127
こっちのColabはSEEDで設定された値をmanual_seed()しているので、同じシードなら同じになります。
実際にやってみても再現できます。(ローカルで実行したものと同じSEEDならColabでも同じ画像ができる)
https://colab.research.google.com/drive/1jUwJ0owjigpG-9m6AI_wEStwimisUE17#scrollTo=Ucr5_i21xSjv

他のColabは使ってないので分かりません・・

このURLのノート、シンプルでいいんですがimg2imgに対応してないんですよね。悩ましい
0131名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 02:03:31.19ID:qfvTN6Mb
>>128
ありがとう
自分で調べて構築しなくてもめっちゃ便利な定型システムが用意されてたんだね…
そっちに移ります…
0132名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 02:06:30.11ID:zaA0cpZ4
佐藤航陽 著書「世界2.0 メタバースの歩き方と創り方」 @ka2aki86 (2022/08/25 02:02:11) [返信:フォロー/@のみ]
物理世界における視界は、AIにレコメンドされたYouTubeやTikTokのタイムラインのようなものだな。帰り道の解体跡地にどんなビルがあったかは覚えてないけど、自分が好きなアーティストの看板があればすぐ認識できる。物理世界も仮想空間も自分が気になってるもの以外は表示されないし認識もできない。
https://ohayua.cyou/tweet/1562485434235879424/ka2aki86
0134名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 02:14:58.16ID:YWrt340D
852話 @8co28 (2022/08/24 18:28:24)
#stablediffusion の #Img2Img (指定画像から画像を生成する)機能を使ってみました。
3分で描いた指示用雑絵(2枚目)に絵の要素のプロンプトを指示し1枚目を生成しました。
2枚とも生成時・指示時のもので、無編集。
いや、すごい……
https://ohayua.cyou/twimg/Fa6n5_SagAA0h10.png
https://ohayua.cyou/twimg/Fa6oOnIaQAcUSCy.jpg
https://ohayua.cyou/tweet/1562371233282682882/8co28
0135名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 02:59:50.50ID:gT+8LwsL
>>43
これのローカル環境ってやつがんばって試してみたけど
セットアップ完了していざ試したら

Traceback (most recent call last):
File "scripts/webgui.py", line 5, in <module>
import gradio as gr
ModuleNotFoundError: No module named 'gradio'

って文字がでてダメだった……
なにかを間違えたんだろうけどさっぱりわからん
難しいなぁ
0136名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 03:12:25.97ID:39A5KPuE
>>135
gradioはこの手順でダウンロードされるのでどちらか抜けているのでは
ステップ 5:新しいenvironment.yaml をダウンロードして waifu-diffusion-main に配置し、古いものを置き換えます (すべてのファイルとして保存します)
ステップ 10: 次のコマンドを実行します: 「conda env create -f environment.yaml」を実行
0137名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 03:13:44.39ID:39A5KPuE
後、これをやってない可能性もあるかも
ステップ 12: 次のコマンドを実行します: "conda activate ldx"
0138名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 03:23:33.13ID:gT+8LwsL
>>136
ありがとうございます。
思い返せば、このステップ5をよく理解せず、やった覚えがあって、

ステップ5で自分のやった手順を詳細に書き起こしてみます
https://pastebin.com/6gpWFLa4
↑のURLにログインする
ログインしたページの右上にあるdownloadを選択
environment.yaml.txtを取得
名前を変更して.txtを削除
それからwaifu-diffusion-main に配置

って手順でやりました……
素人なんでほぼフィーリングでやりました
このやり方が間違っていたんですね……
0139名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 03:28:51.27ID:gT+8LwsL
同時並行して、わかりやすいと教えて貰った
https://colab.research.google.com/drive/1jUwJ0owjigpG-9m6AI_wEStwimisUE17#scrollTo=Ucr5_i21xSjv
もやっているけど、どうしてもここでつまってしまう

ユーザーネーム、アクセストークンが間違っているかもというアドバイスをうけて
何度も見返しているけど、間違っている場所が見当たらない……

https://imgur.com/a/8zUsvm3
0141名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 03:32:47.67ID:gT+8LwsL
>>140
本当ですか……
ミラーとか元テキストとか意味がわからず無視したんですけど
これらって結局必要ないんですかね……?
0142名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 03:36:22.17ID:39A5KPuE
>>141
あれ?勘違いしてたかな

>>138の手順をやってenvironment.yamlを配置したんですよね。それでOKですという意味でした。
必要な手順です

mirrorやraw textはこちらからもダウンロードできます、ということなので、3つやる必要はありません。
0144名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 03:41:11.12ID:gT+8LwsL
>>142
mirrorやraw tex必要ないんですね
ありがとうございます
0145名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 03:46:27.50ID:39A5KPuE
>>143
srcに既存フォルダが有るとそうなると思います。

ステップ 9: /src に既存のフォルダーがある場合は、次のステップの前にそれらを削除します。

これが抜けてるのかな
0147名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 03:52:37.89ID:39A5KPuE
conda env create -f environment.yaml を2回実行した(多分、初期のファイルで実行した後、ダウンロードしたもので再実行?)と思われます。
一旦、

conda env remove -n ldx

で削除してから、再度conda env create -f environment.yaml をやればいいと思います。
0150名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 04:17:29.41ID:gT+8LwsL
うわぁああああ、また新しいエラーがでたぁああ
いつになったら、好きなエロい画像を作れるんだ……
0151名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 04:25:29.94ID:39A5KPuE
>>149
いい出来ですね!
各パラメータそんな小さい数字で調整して行くんですね。参考になります。
この絵からこのワードを足すとこれ、みたいに画像ををツリー状で操作できるようなUIとかあると便利そう。
誰か作って欲しい
0152名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 04:34:00.08ID:ckiBhtAH
Hirokazu Yokohara @Yokohara_h (2022/08/24 19:52:22)
将来的にはデジタル絵の主流の作り方はコレに似たものになると予想。意図通りにしたい部分を適切に都度指示していく感じ。3DCGなんかは元々そういう制作方法だよね
https://ohayua.cyou/tweet/1562392367784636419/Yokohara_h

[引用元] 852話 @8co28 (2022/08/24 18:28:24)
#stablediffusion の #Img2Img (指定画像から画像を生成する)機能を使ってみました。
3分で描いた指示用雑絵(2枚目)に絵の要素のプロンプトを指示し1枚目を生成しました。
2枚とも生成時・指示時のもので、無編集。
いや、すごい……
https://ohayua.cyou/twimg/Fa6n5_SagAA0h10.png
https://ohayua.cyou/twimg/Fa6oOnIaQAcUSCy.jpg
https://ohayua.cyou/tweet/1562371233282682882/8co28
0153名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 04:45:21.93ID:OfpVbaR2
>>149
--strength 0.3 --n_iter 2 --n_samples 5 --H 576 --W 768

-- ← このハイフンみたいなの2個は付けないとエラーになるの?

こういう約束事みたいなのが全然わかんないw
0155名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 05:24:44.37ID:zyWvVtGI
>>154
If your output is solid green, the half precision optimization may not be working for you:
GREEN SCREEN FIX:
delete ".half()" in webgui.py
(Note: this will raise vram usage drastically)

キミ成人してる?
フィルター解禁版は誰が見ても一発アウトな児ポも画像ファイルとして出てくるから適当に使わんほうがいいぞ
0156名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 05:37:07.73ID:gT+8LwsL
>>155
成人してます
ポルノ利用するつもりはないですけど、なんとかして使いたいです
0158名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 05:53:26.27ID:OfpVbaR2
>>155
フィルター解禁版使ってみたいけど

ハードル高過ぎ何をどうしたらいいかわからんw

馬鹿にでもわかるような解説出ないかなぁ
0159名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 05:54:51.60ID:L+T2AQMI
普通に使っててもフィルタかかるから解除版でいいよ

>>154
グリーンはフィルタとは関係なく、GPUが16xxとかだと出るみたいですね。
>>155さんの言うようにwebgui.pyの中にある156行目の.half()を削除してみてはどうでしょうか
(元)model = (model if opt.no_half else model.half()).to(device)
(修正後) model = (model if opt.no_half else model).to(device)

#行頭スペースなど変更せず、.half()だけ削除するよう注意
0161名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 06:40:13.22ID:gT+8LwsL
やっと生成できると思ってやっても下記のエラーがでます
わかるかたいませんか?
ローカル版で試してます

RuntimeError: CUDA out of memory. Tried to allocate 512.00 MiB (GPU 0; 6.00 GiB total capacity; 5.06 GiB already allocated; 0 bytes free; 5.18 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF
0162名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 06:47:36.41ID:MfvfcZ2+
>>161
本家はVRAM10GB要るから軽量版に変える
0164名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 06:57:25.60ID:69ljxOjZ
6GBでも動くはずなんだけど
https://rentry.org/kretard
Lighter on Vram: 512x512 img2img & txt2img tested working on 6gb

16xxはhalf()を止める必要があるから無理ってことぽい。
グリーンスクリーンが16xx限定か知らないけど

後、グリーンスクリーンは、起動時に以下のオプションで解消できると書いてますね。ソースコードいじらなくていいぽいけど
VRAM使用量が上がるから、解像度を低くする必要が有ると書いてる。
"python scripts/webgui.py --precision full --no-half"
0167名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 07:08:18.59ID:uM91UxfF
プロンプトって単語数の上限や優先順位ってあったりする?
最初の方に置いたら強く影響するとか、数十個以上入れると後半は無視されるとか
単語を詰めまくったら、どうも影響を一切反映しなくなった気がする単語とかあって
単語1個と50個でも生成時間が同じなのも不思議で
単語入れまくったら探査深度というか、画像検索は先っぽで終わる感じなのかな?
例えば1個だと50枚調べるけど50個だと各1枚で終了とか
0168名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 07:14:26.06ID:jzBSMp93
試行回数少ないからはっきりとは言えないが、構図や描写のクオリティは画像サイズにも依存してるっぽいな
256x256の出力結果は全く使い物にならなかったけど512x512に変えたらハイクオリティになった
単純にサイズに合わせて出力結果を変形させてるわけではないのかも
0169名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 07:15:01.03ID:gT+8LwsL
>>166
どうしてもimg2imgを使いたくて苦戦してますw

今は軽量版をどこで手に入れるのかわからずネットの海を彷徨ってます
0171名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 07:22:33.74ID:69ljxOjZ
>>167
トークンの数は75 (77?)で、それ以上は無視されるらしい

https://rentry.org/kretard
・トークンは75以下、大文字/小文字は関係ない、トークンは約30,000
・同じプロンプト、シード、修飾子は同じ結果になる

https://wiki.installgentoo.com/wiki/Stable_Diffusion
「Unicode 文字 (日本語の文字など) を使用する単語は、ASCII 文字を使用する単語よりも多くのトークンを必要とします。」とあるから
単純にワード=トークンじゃないっぽくて、トークンの定義が分かってないけど

後生成時間はstep数以外何も影響してない気がする
0173名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 07:32:01.96ID:uM91UxfF
>>171
ありがとうございます
やっぱ上限あるんですね…
自分もトークンがなんなのか良くわかってないけど…
0175名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 07:56:54.48ID:69ljxOjZ
複数環境共存できましたということで不親切なメモですが一応。 basjindalは昨日GUIが実装されたようでそこが変わっています。
●basjindalのインストール (waifuの共存)

【前提】 minicondaインストール済
https://github.com/basujindal/stable-diffusion から、code>download zip
miniconda で解凍した場所にcd

environment.yamlの冒頭をname: ldm-basに変更する(waifuと競合するから)
conda env create -f environment.yaml
モデルをコピーしてリネーム stable-diffusion-v1\model.ckpt
conda activate ldm-bas
pip install gradio

これでインストール完了。
python optimizedSD/txt2img_gradio.pyを起動すると、しばらくして
(img2imgなら python optimizedSD/img2img_gradio.py)

Running on local URL: http://127.0.0.1:7860/
でるので、ブラウザでアクセスすれば使えます。

次回からは、以下の2コマンドで利用可能
conda activate ldm-bas
python optimizedSD/txt2img_gradio.py

なお、basujindal、省メモリですがwaifuよりめっちゃ遅いです。basujindal 1.4 it/s、waifu 7.5 it/sぐらいで5倍ぐらい遅い
0176名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:22:57.95ID:Dtg22sej
なんか「SDでエロ作るのは危ない!」って騒いでる人いるけど言うほど引っかかりそうな法律とか規約あるか?
「Stable Diffusion Terms of Service」は紛らわしいけど中身読むとAI自体じゃなくてDiscordでやってたbetaの話なんだよな
0177名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:23:36.28ID:1uZk9t3I
ローカル環境で考えてるやつは電気代に注意しろよ~
寝る前にコマンド入れて一晩中生成とかやったら大変なことになるぞ☺
0178名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:25:06.62ID:gT+8LwsL
ローカル版画像サイズ小さくすればできた

>>169
この軽量版はやってみたけど、うまくいかなかった……
0181名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:44:16.43ID:hocSwwFi
手がもう崩壊してるから脱いだら悲惨なことになる
アニメ顔で実用に耐えるR18とかは一晩かかって出せるかどうか
絵描きだったら自分で描いたほうが早いw
個人的にそういう方向を追求するのは不毛に思うけどな
0183名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:47:54.74ID:odqqeXCg
言われてみれば、>>179めっちゃ可愛く出来てるけど、よく見りゃ左腕豪快に骨折してるね

AI画像生成、人体その他構造を考慮できるようになるのかな・・・
0184名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:50:26.50ID:6FMN8AvS
>>175
basujindal版は省メモリに全振りでピーク使用メモリ量が最小になるように
・モデルの分割投入
・混合精度
の2つを積極的に実装してる
モデルの分割投入はメモリの出し入れが激しいので単純に速度が落ちるし
混合精度も使ってるGPUの演算器構成によっては一部極端に演算速度が落ちる型があってネックになることがある

空いたメモリ分で同時生成したり出力解像度を上げることで実質的に多少低下分を取り戻せる
0185名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:51:16.15ID:jn2PTIMS
>>176
普段使いしているクラウド上にうっかりアップされていたら...とか、Colabで動かしてる時に生成されてGoogleアカウントごとBANとか
児ポまがいの画像が生成されて、何かの拍子に家宅捜索されたときに別件逮捕なんてこともあり得ない話ではない
0186名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:53:57.19ID:1uZk9t3I
アニメキャラが骨折してるなんて当たり前のことだからなあ
「三次元的に破綻していないドラえもんのイラスト」なんて物理的に存在しえないんだからAIが描こうが人間が描こうが関係ない
0187名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:54:42.83ID:6FMN8AvS
ID:OfpVbaR2 がまさに前スレで児ポ生成をやろうとしてたキチガイなんで
一緒に捕まりたくなきゃ触れないことをお勧めする
0188名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:55:43.39ID:hocSwwFi
それ今のAIだと、このキャラでいいから今度は脱がせて!みたいなことが現状できない
まあ一部で研究してるみたいだけどw顔はそのまま、みたいな指定やってるんでしょ
0189名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:55:45.51ID:DqzH7U06
StableDiffusionで素朴な疑問なのですが、conda版とローカル版の明確な違いってなんなのでしょうか?どなたか教えてください…。

一応認識としては、pcスペック関係無しにネット環境必須でGoogle負担のGPUで使用可能なのがconda版。GPUガチャ。
高スペックpc推薦でローカル環境さえ整えればネット環境有り(でGoogle介さず)にpcの内部GPUだけで使用可能になるのがローカル版。ローカルなのでGPUガチャ無し。

Twitterとかでちょこちょこ目にしたのですが、ローカル版ならオフラインで使用することも可能なのですか?
0192名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:00:06.02ID:6FMN8AvS
>>189
ColabはGoogleのGPUクラウドサーバーの余りをブラウザ経由で使わせてもらってる
業務用GPUで走るんでそこそこ速いしメモリもある
けれどもGoogleの機嫌一つで使わせてもらえなくなるかもしれない

ローカル版は文字通りローカルで自分が組んだ環境以上のことはできないが好きに使える
モデルデータも落としてくる場合であればインターネットが無くても使える
0193名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:00:13.66ID:DZNxogwv
RTX4070でいいかーと思ってたけど勢いで90買うまであるかもしれん
0194名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:01:45.90ID:QfU042L4
>>186
> アニメキャラが骨折してるなんて当たり前

昔はともかく最近はイラストもアニメも骨折してるようなのはあんまりないと思うw
表現のための3次元的な嘘はあるけど、流石に骨折はぼんやりみてても違和感があるからねえ
0195名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:04:03.25ID:Dtg22sej
>>185
別件逮捕ってそれもうSD関係なくないか…
そんなんで特定のサービスに対して「逮捕される可能性が~」とか言われるとそれこそ大丈夫なのかって思っちゃう
0196名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:04:07.30ID:69YAqvqT
顔だけアニメ風が出来ないんだよな
アーティスト名とかアズレン/グラブルみたいな作品名を入れると体にも影響して全体が崩れる
それにヌードとか入れるとやっぱりポルノサイトとかヌーディスト系の画像学習してるらしく
そっちの低品質なデータに引っ張られて顔も残念になりやすい
0197名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:09:22.36ID:DqzH7U06
>>192ありがとうございます。
え、本当にネット環境無しで使えるんですか…うわぁ…

一応ローカル版する為に必要なスペックのpcが最低で20万くらいの額と以前おそわったのですが、img2imgも同様のパソコンで使えるのでしょうか?
0198名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:10:30.48ID:QfU042L4
>>189
conda → Google Colab?

#condaというとローカルPCでPython環境を使うときのcondaとごっちゃになってるのか、Google Colabのそういう呼び方があるのか・・・

起動時間:  PC=比較的速い、 Colab=数分以上はかかる
性能: 30x0 , 20x0 > Colab T4 > 1xxxx >>65
VRAM: Colab(15GB)は大抵のコンシューマGPUより多い
ネット: PC=利用時不要、 Colab=必須
使用可能時間: PC=無制限、 Colab=制限あり しばらく使ってないと勝手に切れてまた起動数分待ちがダルい
複数環境お試し: PC=手順面倒かも?、 Colab=簡単

まあローカルGPUが20x0あるならローカル環境を使う、それ以下ならColabを使う

性能はColabを何回か使ってるけど、経験的には特に速くなったり遅くなったりはしてない。
遅いT4、速いT4なんてあるの?って気もする
0200名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:21:23.33ID:K1IGqCp0
もう少し用途に特化したAIが複数あるといいのかな?
人間+背景のみという前提で人間を部位ごとに丁寧にカスタマイズするというのは技術的にはできそうで精度も上がると思うんだけど
0201名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:29:36.79ID:QfU042L4
>>197
text2imgとimg2imgはいくつかやった感じ生成速度は変わらない

3060(12GB)なら15万円~
https://kakaku.com/pc/gaming-pc/itemlist.aspx?pdf_Spec115=200&pdf_Spec317=11-&pdf_so=p1
ここに乗ってるやつよりHDD容量とかは増やしたほうがいいと思うけど

多分だけど、3060(12GB)はちょうどGoogle Colab(T4 15GB)と同じ程度の速度っぽい(512x512で 3.5 it/s程度)

そういう意味じゃ性能が変わらずメモリが多いものが無料であるのに買うの?って気がしなくもない
まあAI画像生成以外にもゲームとか3Dソフトのblenderとか色々できるから、そういうものにも興味があればいいと思う
0202名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:32:51.10ID:+h3QnAhq
M1最適化されたらMacBook Air辺り買うのがコスパはいいんじゃない
0203名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:34:30.17ID:DqzH7U06
>>0198ありがとうございます、こちらも分かりやすいです。
Colabは、Google Colaboratoryのことです。紛らわしくなってしまったみたいで申し訳ないです。
Googleの機嫌で使えなくなるのは痛いので近いうちにローカル版使いたい…
0207名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:46:20.50ID:zyWvVtGI
>>196
https://twitter.com/cut_pow/status/1561151751373348866
数日前のだがdisco diffusionの方でマスキングが結構進んでたな
プロンプトを途中で分割できる機能でも頑張れば可能だと思われる
まぁ1つのツールで全部対応するのは得手不得手あるから用途によって使い分けるのが現実的じゃね
https://twitter.com/5chan_nel (5ch newer account)
0208名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:52:35.54ID:jy8fd1JG
これでまたGPU不足になりそうかね
創作用途だからマイニングと違ってヘイト対象にはならないかもしれないが
0209名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 10:08:05.20ID:8+FfZIrW
省メモリのGUI版に更新したけど表示されたWebページに飛んでも真っ白のまま変わらない
ブラウザ変えてみても同じだった
3.1.7の最新版gradioもインストールしてるんだけどなぁ
0210名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 10:09:59.93ID:WgxQgIco
>>208
金がもらえるわけじゃないから新作の人気ゲームが出た程度の影響でしょ
0211名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 10:10:06.17ID:LY2UcQV2
Chromeで日本語翻訳がONになってるとかない?

省メモリ版はしらんけど、waifu版は、日本語翻訳ONだとimg2imgが真っ白になるし、txt2imgもパラメータ変更不可能になる
0212名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 10:36:03.63ID:NZeLqYXb
>>206 >>208
google colabで無料でできること知れ渡れば
にわかがいちいち何万もするグラボ買うなんてしないだろうし
デスクトップすら持ってない人にはもっと大きな出費になるし杞憂なのでは?
マイニングバブルでのファームが買っていた量って数十万数百万個レベルだぞ
0213名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 10:36:25.19ID:69YAqvqT
こっちではGUI版ちゃんと動いてはいるけどブラウザを開いてると
GPUリソースが大量に消費される謎バグがあって普段使いとは別ブラウザで起動して
すぐにタスクバーにしまわないと駄目だな
0214名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 10:44:06.12ID:6FMN8AvS
>>213
4chanだと、Gradioの動作中アニメーションとプログレスバーのせいでブラウザの表示動作が常時GPUを食うようになって生成速度が落ちると言われてて
対策としてK-lms最新版のwebguiではアニメーション切られた

民間療法としてはその通り最小化するか別のタブに切り替えてアニメーション動作を止めるか
ブラウザのGPUアクセラレーションを切るか
別のマシンから遠隔操作するかだとさ
0215名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 10:48:56.18ID:PcxrIwK4
>>211
ブラウザのプライベートモードで実行してもダメだった
原因はわからんけどブラウザからgradioのスクリプトを読み込む時にエラーが起こってたみたい
gradioのissueを参考にして少し修正加えたら一応は動くようにはできた

optimizedSD/txt2img_gradio.py の最後にある
demo.launch() を
demo.launch(share=True) に変更
0217名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 10:51:31.94ID:6FMN8AvS
>>215
share=Trueはまずくないか?
そのオプションはxxxxxx(ランダム数字).gradio.appっていうURLで誰でも外からアクセスできるようにするヤツだぞ
0218名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 10:58:04.44ID:PcxrIwK4
>>217
確かにそのリスクはあるね
URLもシンプルだから総当たりすれば余裕で悪用できるし別の方法探したほうがよさげだね
0219名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 11:05:44.87ID:GsZbGmTm
すごい周回遅れの質問でごめんなんだけど

ローカル版って公式の設定ファイルいじれば制限解除できるわけじゃなくて
有志のカスタマイズ版をインストールしなきゃいけないって認識でok?

解説とか見ながら普通にローカル環境作っちゃったからローカル版の制限解除にどうしたら移行できるのかわからん
0220名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 11:08:56.14ID:69YAqvqT
情報量の多い背景の場合は人間の絵師を完全に超えているな
これで人間やアニメ絵がちゃんと描けるようになったら一部の有名人以外は
マジで終わりだね、さっさとそうなって欲しいわ
0224名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 11:27:14.43ID:wTZV2nUk
promptに絵描きの名前を入れると破綻が少なくイメージが近い絵が出るんだけど
これは果たして本当にAIオリジナルと言えるのか
0227名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 11:59:15.36ID:b8sl+t7g
環境構築とプロンプトでスレ分けたほうが良い
0228名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 12:03:31.97ID:ASukCAWM
自治厨だらけ
0229名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 12:07:06.14ID:b8sl+t7g
>>224
作家名や作品名を入れるのが著作権違反になるだろうね
0230名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 12:11:19.23ID:69YAqvqT
何だかんだでみんな上手くいったプロンプトは隠すから例のサイトもあんま上手くいかないって言う
0232名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 12:20:04.17ID:ZFbHQUra
バズってる整った画像見るとフォトショのゆがみツールとかで直してるんじゃね?とか思ってしまう
0234名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 12:32:25.44ID:TlvKzERq
今の段階だとそのまま使うんじゃなくて手直しするほうが効率いいだろうね
イメージ通りの服や道具みたいな構造物を破綻なく生成が難しいから

作品作りに実用するとしたら線画で細部を書いてそれを補助線として活用して
AI塗りを乗っけるみたいな方向だろう
0237名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 12:40:48.68ID:bgMQ/0YX
細部の調整は加筆して誘導すればimg2imgでなんとかなりそうではある
ただ、うまくいかない原因がワードにあることも。
illustrationとか入れると全身画の時に顔潰れやすいとか
ワードの組み合わせで解消できるかもしれんけど
0238名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 12:41:36.36ID:hocSwwFi
人物はだいたいガチャみたいな感じ。たまに元の絵そのものみたいのが出るし
https://i.imgur.com/stfDukr.png
こういうのはアイディアに使えそうだけど
ツィでみたのはもうちょっとデッサンよかった気がするんだが、、難しいな
0239名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 12:54:27.00ID:uCLwesYu
>>199
この話題に限らずお前みたいに痛いところを突かれたからって相手はこういう奴に違いない!みたいな無理矢理な返しをする奴はキモイよ
頭の悪さが露呈してるよ
0241名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 13:41:14.40ID:NlWt3JDX
エロ微妙じゃね
単に綺麗な高画質裸見せられても抜けないしな
自分の性癖にマッチした絵柄作れんと..
0245名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 14:41:34.59ID:M/HLpgpi
>>243
CLIP InterrogatorっていうColabのnotebookでしょ
StableDiffusionで使われてるCLIPだけ抜き出して画像から認識されたトークンの固まりを見せてくれる
0248名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 14:50:39.39ID:WCWmOzW9
>>43の上から三番目の奴を進めていって最後までガイド通りに勧めたつもりです
IPアドレスみたいなのからブラウザでインターフェースを開けたまでは良かったんですが
仮出力でtext2imgでcatだけ打ち込んでも下の画像のエラーが吐き出されて困ってます。
誰か助けてください。

もしかしてGPUが貧弱だってエラーが出てるんでしょうか? 私のPCのグラボはRTX2060
あとgoogle colaboの時に入力したトークンを このやり方だと入力してないのでそこも怪しいと思ってます。

”ERROR” ?ee; 4.07GiB reserved in total by pyTorch) if reserved memory is >> allocated memory

https://imgur.com/a/Ii4R0jq
0249名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 14:51:36.43ID:RAP75DmM
こういうので二次創作したり作家名入れて生成してるやつ盗作やってるのに近いな
自分で楽しむだけならいいが公開したら盗作と認定して問題ない
0250名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 14:52:34.34ID:6YPP1xAX
>>134
これのやり方全然わからん
pythonなんたら入れるだけいうから、コピペで入れたがエラー
input.jpgをcontentフォルダにstable~フォルダ作ってもダメ
0253名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:00:08.91ID:bW+JTxuc
syntax errorって書き間違いとかだから一番簡単では・・
自分で書き換えた部分がおかしいしかありえない
0256名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:07:33.06ID:6YPP1xAX
colabでのやり方見つけたと(やり方書いてないが)かいうのはググると出てくるからそもそもできないんのかな
0259名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:17:00.10ID:vxd1o7Th
Pythonというかプログラミングが何もわからないまま書いてある通りにcolabで始めて適当に書いてあるコード繋げ合わせて10枚出力できるようになったんだけど、毎回11枚分動いてて最初の1枚は見れない…
0260名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:26:41.40ID:bW+JTxuc
>>258
間違った
「^」で直接の場所が出てるはず、例えば

prompt = "A fantasy landscape, trending on artstation"
      ^
SyntaxError: invalid character in identifier

Pゴシックだからズレてるだろうけど、これは
prompt(半角スペース)=(全角スペース)"A fantasy ...
になってる、(""内はokでも、構文中で全角なんて認められない)
0261名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:31:09.28ID:69YAqvqT
何言ってるのか分からない人いるなとずっと思ってたけど
事前に用意してあるnote bookじゃなくてcolabに手動でインストールしてる人がいるのね
まあWindowPCに入れるよりは大分楽だろうけど手動セットアップは多少は苦労するわな
0263名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:36:27.76ID:M/HLpgpi
>>248
そうだそうだTips忘れてたわ
GFPGANの300MBぐらいのpthファイルをダウンロードしてきたと思うんだが
これを指定された場所に入れると顔の補正処理が有効になって余計にVRAM食って512x512の画像はVRAM6GBでは出力が無理になるんだわ
削除して立ち上げ直すと通ると思うよ

それでも足りないと言われるならHeightとWidthを512から減らすしかない
0264名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:39:05.22ID:k+pssYjE
>>260
どうも入力したワードでなくoptimized_img2img.pyを実行させる構文の表記自体が受け付けられてない
できたできた言っているしよくわからないなこれ
0265名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:43:41.96ID:bW+JTxuc
もしかして既存のnotebookとかじゃなく自分でcolab上に一から環境作ってるの?
それはさすがにわかんないわ、自分よりはるかに高等
0266名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:47:10.53ID:69YAqvqT
予想しない凄い画像出てくるときと全然駄目なときの落差が激しいな
youngって1単語追加するだけで絵がガタガタになったりしおる
0268名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:52:15.57ID:M/HLpgpi
>>266
若いって一言に言われても色々ある
それこそこれこそが自分が思う若さだ!っていう画像をCLIP Interrogatorに入れてその結果からキーワードを拾うといいのでは
0270名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 16:00:07.90ID:hocSwwFi
広い意味がある単語だと安定しないぽいね
Hayao Miyazaki new movie poster とかいれたら
ボブネミミッミみたいのが出て笑ったわ
0271名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 16:01:08.01ID:69YAqvqT
初心者→colabにセットアップ済のnote bookを使用
マニア→colabに手動でセットアップ
PG経験者→自宅PCに環境構築

出来なくはないけど完全初心者が自宅PCに構築するのは面倒だから
まずはnote bookを使おう、リソース制限されても月額1000円でpro使えるし
0273名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 16:09:17.70ID:bW+JTxuc
PCまぁまぁ詳しいけど、絵は練習したが人にお出しできるレベルは描けずタブレットが埃かぶってる
・・・というあるある層が殺到してる気がする、まぁ俺なんだが
CG板とは思えない賑わい
0274名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 16:11:28.24ID:M/HLpgpi
>>272
256はサイズが小さ過ぎて出力が破綻しやすくなると思う
タスクマネージャのGPUのVRAM使用量とにらめっこして、他にVRAM使ってるソフトがあれば終了させた方がいい
0.2GBぐらいがデスクトップだけの状態の標準
0281名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 16:45:24.80ID:isNyMC5f
めちゃくちゃ楽しいな。無限にやっちゃう
絵描けないけど自分だけの作品作れるの最高
ところで解像度もっと高くできないの?生成された画像が小さすぎる
0282名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 16:50:16.04ID:hocSwwFi
>>281
みんなどういう環境でやってるか知らないけど私はここで指定してるね
image = pipe(prompt, height=512, width=512)["sample"][0]
0287名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 17:52:34.76ID:o0loqUTt
不細工な顔のついた肉塊ばっかしかできない
ぐぐるたびたび切れるけど何でだろというか今朝作った垢のパスがわかんなくなってログインできなくなったw
0288名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 17:54:17.95ID:y9jnFobJ
>>286
そこらは単語でいくらでも制御できるでしょ
例えばMJだとflat designとか入れたら紙みたいな背景になるよ、SDも似たのあるはず
そこらの単語を調べて順次細かさを上げて行けばいい

・・って言うのは建前で、現状のAIって単純明快な線はめっちゃ下手糞なんだよねぇ
みんなimg2imgで修正してまで回してるのがその証拠
ごちゃごちゃ色つけて装飾するから粗が目立たないって誤魔化しが今の精いっぱい
0289名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 17:54:28.22ID:69YAqvqT
矛盾の無いように出来るだけ詳細に説明する必要があるな
girlだけだと滅茶苦茶になる
髪の色、年齢、表情、姿勢、背景、動作、服装を整合性の取れるように付けないといけない
それでもイラスト系の単語は体を壊すけど
0293名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 18:00:32.85ID:Kv3mpmre
なんか粘土ペタペタ貼ってるような作画だし、手直しするにしても線画からやらないと辻褄あわないんが難しい。
カラーラフくらいにはなるけど、色は自分で決めたくなっちゃう。
絵描きの雑感。
0295名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 18:01:08.92ID:y9jnFobJ
表面質感はほんと凄いよね
ゲームから学習しまくった結果なんだろうけど
特にアメリカ人はリアル系ゴテゴテ大好きだし
0296名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 18:02:31.26ID:y9jnFobJ
MJの--noは優秀
デフォだと、すぐピンクとか青蛍光とか入れてくるので、いろいろぶっこんでるわ
ちな複数は
--no pink,blue,fire
みたいな指定じゃないと動かない
0298名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 18:53:10.42ID:+HzDG7fi
>>297
コメント欄にもあるけど、一部グラフィックカードだと黒い画像しか出ないバグがあるみたい
(Stable Diffusion自体の問題で、本来は実行コマンドを調整して直すところがGUI側にその機能がない)
0299名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 19:06:38.22ID:LY2UcQV2
>>275
試してみました。 お手軽!だけどイマイチなので今後に期待
Stable Diffusion GRisk GUI 0.1 https://grisk.itch.io/stable-diffusion-gui

・rarファイルをダウンロードして、展開、Stable Diffusion GRisk GUI.exeを実行するだけで動く
・他のローカル環境と競合しない
・出力は画面上ではなく、フォルダ出力で自動的にプレビューできないので(今のところ)使い勝手はかなりいまいち
・HPに書いているようにSEEDは機能しない。Save In Gridもチェックできない、など開発中
・デフォルトが64x64になっているのでとりあえず動く人は多そう。普通は512x512で使うと思うけど
・私の環境(2080Ti)では、若干遅い。
https://rentry.org/kretard 7.3 it/s
GRisk 5.0 it/s
 basujindal 1.4 it/s
0300名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 19:10:11.10ID:LY2UcQV2
>>297,298
黒い画像というか、(デフォルトでは)resultsフォルダにPNGが出力されて、そもそも画面に画像プレビュー欄がないような

後txt2imgのみでimg2imgもいまのところない
0301名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 19:22:35.73ID:M/HLpgpi
GRiskって人はGitHubに転がってるキーボードポチポチしないと動かない便利そうなソフトを
GUIつけてWindowsで動くようにしたものをPatreonで配って稼いでる人
基本機能装備できたら配布版は更新止まって後はPatreon版に全部乗るようになるからそのつもりで使った方がいい
0302名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 19:31:07.71ID:wzypMg/1
SDはドラレコに弱すぎる
版権にも弱い
Craiyonだと簡単に出せるものがSDで出せなかったりする
進化の余地があることはわかるんだけどね
0303名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 19:31:39.74ID:RxPy6RIE
既出だけど、https://rentry.org/kretard のプロンプトマトリックスいいね
https://github.com/hlky/stable-diffusion-webui

キーワードを | でつなぐと、そのキーワードのあり・なしの組み合わせを一気に作ってくれる
(最初のワードは全てに入る)

girl | artstation | makoto shinkai | detailed face | highly detailed

だとこうなる。 https://i.imgur.com/mUcR4CN.jpg
0307名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 19:47:00.27ID:y9jnFobJ
980tiのCUDA駄目だった人間だけど、微妙~にNVIDIAのドライバver上げたら動いたよ
5日遅れでやっと追いついた

ローカルSDやったけどやっぱ遅いね、さすがVRAMが6GB
512x512のstep50が、1枚で3分半かかる、4枚で7分、5枚で8分

ローカルimg2imgはnonetypeエラーで止まったけど、--Wと--Hしてなかったのが原因だった
デフォでインプットの512x512のままにしてくれるみたいな親切な設計ではなかった
ツイッターの人のコマンド参考にすると文字制限で端折ってるので駄目ね・・
0311名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:07:24.28ID:F5OuPmFA
手でちょこちょこ修正して感じたけど、人物の絵の歪みが定量化されたら簡単にクオリティの高い人物イラストが生成される
生成された絵のうち「歪んだ絵」と「正しい絵」の数値化をすればいいだけだし、時間の問題かも
0312名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:10:28.76ID:tLC8w+Jc
4000番代でグラボ買い替えようかなとは思ってたけど欲求がさらに高まってきた
メモリ12GB以上のものにせねばならぬ
0314名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:15:44.67ID:69YAqvqT
>>311
そのタイプのAIは何年も前からあってあんまり話題にならなかった
今回の拡散モデルは絵のクオリティが全然違うから盛り上がってる
0315名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:16:40.67ID:NlGf4jm2
「AIがこれ描いたの!?」系の話題は最初だけだろうし変にこだわらずにガンガン手を入れちゃって良い気もしてきた
AIのべりすともそうだけどだんだんAIに書かせてるのか書かされてるのか分からなくなってくる感じが逆に楽しい
0316名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:19:35.77ID:69YAqvqT
拡散モデルは原理的に実写や細かいディテールのある画像に強くて平坦なアニメ絵に弱いから
それがアニメ用の学習モデルでどれくらい改善するのか気になる
個人的にはもう一段のブレークスルーが必要だと予想してるんだけど
0317名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:19:44.16ID:F5OuPmFA
AIの存在はクリエーターの活動に溶けて何がAIで何がAIじゃないのか分からなくなると同時に、既視感のあるデザインやイラストが増えるんじゃないかな
イラストの数が少なくかつ学習の難しい特徴を持つ絵柄だけが個性として生き残っていきそう
0318名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:25:02.58ID:69YAqvqT
凄く単純に言えばノイズを加えた画像から元画像を復元するよう学習させたのがMJやSDの拡散モデル
実写画像はノイズ加えても元の情報が残っているからこの学習が上手くいくけど
殆どが平坦で同じピクセルが並んでるアニメ絵にノイズを加えるとそこにはただのノイズしかなくて情報を持っていない
4chanでの下手な絵を学習してるのが原因では?という説は誤りでアニメ絵を学習出来ないのは原理的な限界
そこを改善できるのか?が注目だよね
0320名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:35:51.32ID:d0yfrXSy
陰影も一種の塗りのパターン化だからそこを詰めてパターン認識の蓄積で行けるんじゃないかなあ
すでにイラストに陰影込みで彩色するのあるけどそのまま転用は無理にしても
拡散モデルと切り離してそれ用に作る方が良さそう
0322名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:38:28.32ID:EJyQ1pV0
Emadさんのツイート。「生成」じゃなくて、「生成的検索」というのが面白いね。
「分散型&動的な次世代プロトコル」ってのがある程度具体的な話になってるのか、ただのビジョンなのか

@EMostaque
The intelligent internet.
Personalised generative search models for everyone that compress knowledge.
Image, audio, text & more.Distributed & dynamic - a protocol for the next generation.

This is how we build the foundation to activate human potential @StabilityAI
---
知的なインターネット。
知識を圧縮する、すべての人のためのパーソナライズされた生成的検索モデル。
画像、音声、テキスト、その他。分散型&動的な次世代プロトコル。

人間の潜在能力を活性化させる基盤はこうして作られる @StabilityAI
0323名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:40:32.30ID:EJyQ1pV0
>>319
「Stable Diffusion GRisk GUI 0.1」の正式版ってことですね
ベース(ソースコード、モデル)は公式の正式版そのものだけど、
GUIを付けて簡単に実行できるようにしたGRiskの正式版、ってことね
0324名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:42:58.56ID:EJyQ1pV0
>>318
なるほど、だからアニメ用モデルを別にリリースしますみたいな話になるのね
勉強になる

それはそれとしてデッサンが崩れてるヘタクソな絵が出てくると元データのせいでは?って思いたくなるw
0325名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:49:02.20ID:F5OuPmFA
写実的なイラストを描いてるタイプのイラストレーターをpromptに入れると絵柄が安定するけど、平面的な絵のイラストレーターだと不安定なのはそのせいか
0327名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 21:03:20.53ID:EJyQ1pV0
>>326
公式のcolab前からあったような?と思ったらこれ、新しいAPIのデモですね。
DreamStudioのメンバーシップないとAPI KEYがなくて使えない
0330名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 21:17:40.84ID:WCWmOzW9
頑張ってSDをローカルに入れたけど500×250ぐらいの出力が限界で全然綺麗じゃないわ
うーん流石にPC買い替えしたくなる
0332名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 21:22:08.65ID:69YAqvqT
waifulabやmakegirlsは本物/偽物を見破るAIとこの判定を突破するAIの対決による
相互学習でそれらしい絵を出す学習モデルでアニメ絵には向いてるんだよね
0333名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 21:22:37.76ID:bgMQ/0YX
顔潰れないようにワード詰め込むと、なかなか立ち絵になってくれない
ただ、有名人入れなくてもキレイな顔出るようになってきた
ワード選びのバランスが難しい
0335名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 21:32:04.99ID:y9jnFobJ
windowsが古くて260文字以上に未対応(レジストリもポリシーも不可)
img2imgで呪文入れまくるとフォルダが作れないという情けない状態
pythonわからないのでどう変更したらいいものか・・

os.makedirs(opt.outdir, exist_ok=True)
outpath = opt.outdir
sample_path = os.path.join(outpath, "_".join(opt.prompt.split())[:255])

このあたりだとは思うんだが、255減らしても駄目だった
つかそんなフォルダ名にするなよ・・
0343名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 22:03:13.63ID:69YAqvqT
プロンプトをフォルダ名にするのって後からでもプロンプト分かるから結構便利なんだよな
windowsのフォルダ名制限が厳し過ぎるのがいかんわ
どうせ物理的なアドレスと何も関係ないラベルなのに何で制限あるねんっていう
0344名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 22:05:01.43ID:AUsdt6Tp
imagetoimageをgoogleのcolabで使いたいんだがやり方まとめられた日本語のサイトってある?
翻訳かけながら色々やったけどうまく行かなかった…
0345名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 22:12:46.78ID:EJyQ1pV0
>>43 の最初の方のcolab (img2imgできる方)は今は動かない気がする
なんか特殊な手順とかあるのかもしれないけど

どっかに動くimg2imgのColabないかな
0346名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 22:18:27.66ID:EdzYCuJ8
>>329
遅い上に高い
月千円プランでAIに食わせるのに使われるのがせいぜいだろこんなん
0347名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 22:18:38.41ID:69YAqvqT
Crypkoみたいに没個性過ぎると沢山いる絵描きにAIさんという1人の新人絵師が加わりました
って感じになるだけだから特に何もインパクトはなく数年が経過しちゃったんだよね
MJやSDはあらゆる画風を出せるってのがこれまでになくてこりゃやばいってなった
既に実写系なら特定のアーティストの画風パクれるもんな、、、Wlopとか人気過ぎだろみたいな
0353名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 22:24:36.22ID:wzypMg/1
https://i.4cdn.org/g/1661411406913791.png
https://boards.4channel.org/g/thread/88284357#p88285430

female pope, big tits, highly detailed, intricate, magic the gathering, d&d, award winning, top rated, skinny, fantasy, oil on canvas
以下も入れたかな
dark, gloomy, desaturated, greg rutkowski
https://i.4cdn.org/g/1661412160633735.png
https://boards.4channel.org/g/thread/88284357#p88285554

beautiful handsって入れろよ
https://boards.4channel.org/g/thread/88284357#p88285665
0354名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 22:28:23.74ID:WCWmOzW9
>>331
同士いた~ 風呂入って考えたけど、PC買い替えるよりGOOGLE COLABOの月1000円コース申し込んだ方が
なんかあったとき融通効きそうでこっちを前向きに考えてます。
0355名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 22:31:13.04ID:uCLwesYu
>>242
ID:OfpVbaR2
ちゃんと文章見えてるか?まさに俺が指摘した通りの返しになってんじゃん?
自己紹介して自滅してループして死ぬだけの虚しい人生お疲れ
0356名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 22:41:59.45ID:y9jnFobJ
>>343も一理あるので

def left(text, n):
return text[:n]
・・・
sample_path = left(os.path.join(outpath, "_".join(opt.prompt.split())[:255]),150)

にしたよ、頭から150文字取る
たぶん本来は255の方でなんかするんだろうけど、動いてるからいいや
0361名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 23:25:04.57ID:V9wOObE6
basujindal版って最初からcheck_safetyが消されてるんだな。
grepして無いなあと思ってたがCompVisのtxt2img.pyとdiff取ったらcheck_safetyの部分がスパッと削除されてたわ。
0367名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 00:47:42.88ID:SWDfWijj
>>366
これすげえよな
img2imgに完全に残す部分のマスク自由選択機能と
弱いimg2imgを段階的にかけていくフローが搭載されてる
世界最強に近いフロントエンド
0371名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 00:57:27.04ID:o3NpW9jG
現時点でbeautifulとかcuteみたいな形容詞はほとんど無駄かも
https://i.4cdn.org/g/1661442205411192.jpg
https://boards.4channel.org/g/thread/88287881#p88290273
広く使われる言葉はダメかも (かわいいとかの方が有効?)
https://boards.4channel.org/g/thread/88287881#p88290351

綺麗な出力が欲しいってだけならgreg rutkowskiほぼ一択
ミュシャはおそらくトレーニング不足
https://i.4cdn.org/g/1661442369934289.jpg
https://boards.4channel.org/g/thread/88287881#p88290314
https://i.4cdn.org/g/1661442716455937.jpg
https://boards.4channel.org/g/thread/88287881#p88290385
0374名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 01:19:04.35ID:SjnZS+HX
>>366
インストール中

>>371
> 綺麗な出力が欲しいってだけならgreg rutkowskiほぼ一択
みんな入れてるよね
検索してもD&Dのドラゴンみたいな画像しか出ないからなんでかなぁって思ってた
0377名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 01:23:39.25ID:nqlpUObU
呪文の単語数や文字数の上限があるらしいのですが具体的な文字数単語数ってわかりますでしょうか
0383名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 01:39:55.94ID:o3NpW9jG
> If your conda installation is somewhere that isn't \Programdata\miniconda3, adjust the path in webui.cmd accordingly
おま環だった
0385名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 01:43:52.48ID:SjnZS+HX
>>380
ありがとう、httpだった・・キター!

> あとこのガイド
> conda env create -f environment.yaml
> を飛ばしちゃってない?
webui.cmdでバッチ化した模様
0389名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 02:20:26.92ID:2/9t2zeE
しかしやりたいのは向こうにとってはペドの日本人的若い女の子のえろだけどメモリ2GBではどうしようもないから数年後かなあ
というか基本の部分蓄積できてからのほうがよさそうだ
0390名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 02:36:32.03ID:h91oFyDt
数十年後

「AI国際連盟はAI創作の発展に図らずも寄与したとして
Greg Rutkowski氏に貢献賞とゲーミングPC「ガレリア」(提供ドスパラ)を贈呈しました」

Greg Rutkowski氏「びっくりです。勝手に名前を使われ創作という名のパクリに利用されていたら賞を貰えました」
0391名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 02:52:18.78ID:YJdMz7aW
自分で作り上げたロリショタデータでハードコアポルノ動画とか
作れるようになったらAI 規制法とか出来るんだろうなぁ
0398名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 03:28:11.81ID:31QdF/+f
>>397
prompt
actress, teen, blue eyes, dark hair, pale skin, intricate, top rated, highly detailed, illustrated by Greg Rutkowski | by Greg Rutkowski | by Greg Rutkowski, by Greg Rutkowski
Steps: 250, Sampler: k_lms, CFG scale: 4.5, Seed: 1540371425, Prompt Matrix Mode.

デフォ:actress, teen, blue eyes, dark hair, pale skin, intricate, top rated, highly detailed, illustrated by Greg Rutkowski
V1:actress, teen, blue eyes, dark hair, pale skin, intricate, top rated, highly detailed, illustrated by Greg Rutkowski , by Greg Rutkowski
V2:actress, teen, blue eyes, dark hair, pale skin, intricate, top rated, highly detailed, illustrated by Greg Rutkowski , by Greg Rutkowski, by Greg Rutkowski
V3:actress, teen, blue eyes, dark hair, pale skin, intricate, top rated, highly detailed, illustrated by Greg Rutkowski , by Greg Rutkowski , by Greg Rutkowski, by Greg Rutkowski
0400名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 04:42:55.08ID:Ar08D0Fk
街歩いてたら看板の字がバグってて異世界に行ってしまった系の都市伝説みたいな写真描けるので楽しい。
0401名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 04:48:32.39ID:J5H4Y39B
>>399
このwikiのEmphasisの項にも[]は現状機能してないっぽいとあるね
https://wiki.installgentoo.com/wiki/Stable_Diffusion

あと同じ強調呪文の繰り返しも効果あるって書いてるので
ID:o3NpW9jGさんの検証結果とも一致する
0402名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 04:51:18.61ID:JIdTrYQS
>>366
GUItardの新機能抜粋 https://rentry.org/GUItard
・設定が手順が楽になった

★マスクペインティング: 画像の変更したい特定の部分のみを再生成するための強力なツール
・ループバック: 最後に生成されたサンプルを自動的にimg2imgにフィードバックする。
・Prompt Weighting (NEW):プロンプトの重み付け。プロンプト内の異なる用語の強さを調整

・サンプラーが増えた
 ・k_euler_aとk_dpm_2_aサンプラーは、同じシードとプロンプトから、非常に異なる、より複雑な結果をもたらします
 ・他のサンプラーとは異なり、k_euler_aは低いステップから高品質の結果を生成できます。50 ではなく 10 で試してみてください
---

マスクペインティングのやり方分かる人いますか?
アルファ消去するとそこ補完してくれるのかな?とか思ったけどうまくいかない(消した部分がそのまま黒くなる)
0403名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 05:08:55.62ID:JIdTrYQS
>>402
自己解決。単純に元画像の上にマスクを書き込むことが出来ました。

元画像の表示サイズが小さくて塗りにくい。もうちょっと改善して欲しい。
生成もちょっと試した感じでは自然にならなかった。

後多分バグで、「マスク部分を再作成」で複数生成すると、1枚目はそうなるけど、2枚目は逆にマクス部分以外を再生成になってる気がする。

ついでに、インペインティング可能なノート
https://colab.research.google.com/drive/1whhIiXxjQjbBuiq4lqwh-AlLIjh3l1OB
0407名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 05:57:00.57ID:2VbkagvJ
美しいポートレートはちょいちょい生成できるようになってきたが
シチュエーションころうと思い始めると途端に難しくなるな
0410名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 06:05:48.55ID:S/rJEOX+
海外ではおばさんとかにもbeautiful ladyとか普通に言うから
もうただの挨拶みたいになってるんだよな
0411名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 06:06:15.28ID:JIdTrYQS
512x512生成のざっくり性能。少し更新

it/s = 1秒で何ステップ実行できるか。(例) 50 stepで1080Tiの場合、50step / 2.3 it/s = 21.7秒かかる

16xx(6GB) ---  512x512では動作しない ※
980ti(6GB) 0.36 it/s (2.81 s/it)
1070Ti(8GB) 1.60 it/s
1080Ti(11GB) 2.30 it/s
Google Colab(T4) 3.2 it/s ~ 3.8 it/s
3060 3.5 it/s
2060 4.6 it/s
3070 6.3 it/s
2080Ti 7.3 it/s ~ 7.73 it/s
3090 10.8 it/s

注 16xxは6GBメモリだが、出力がグリーンスクリーンになる問題があり、full精度にしないと動かない。
   そのためVRAM消費量が増え、512x512では動作しない。解像度を下げる必要あり。
0414名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 08:46:38.94ID:UDqjZjWY
もうすぐこれらの3D生成版が出来るってマジ?!
objやFBXを一瞬で作ってくれるの?!
0416名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 09:24:52.48ID:YzJhqtmk
>>414
3D用のA学習Iモデルをリリースする予定ってツイートがあったのは確かだけど、
 (1) 画像・テキストペアデータは50億のデータデータセット(LAION)があったけど、3Dモデルが何十億もころがってるわけない
 (2) CLIP(画像と言語の対応関係をWEB学習)+DDIM(ノイズ付与+復元学習による高精度化)は使えないので全く別のAIになるはず
なので、何がどの程度できるものなのかは全然分からないね

画像よりははるかにハードルが高いのは確かでどうなることやら
0419名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 09:31:07.84ID:SsqIEZdF
スクリーントーンが最初出てきた時も「人間のかけ網と比べたら月とスッポン」って言われたけど結局普及したよね
AIもそうなるよ
0420名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 09:36:18.84ID:E2Vlw8ZM
>>416
めっちゃ素人考えだけど、今のMidjourneyもStableDiffusionも、学習時点で
「これは笑ってこちらを見ているエマ・ワトソン(美人)(緑の服)のイメージ」と画像をテキスト情報に判別してから学習している
(ファイル名とか画像についてるタグだけ見てるわけじゃない)

ならポーズ判別して学習してもいいはずで、ポーズが確定するならそこから3Dモデル+テクスチャにすることもできそう?
いや服はかなり難しいか・・・。ポーズだけじゃなく服の形状理解しないといけないからそれは流石に無理っぽい

まあ妄想の域を出ないから今の技術の使い方を考えつつ待つしか無い

ちょっと調べた感じ、MidjourneyやStableDiffusionの技術は最新ではないのでもっとスゲーのがMicrosoftあたりから出そうな気もする

>>418
来月リリースされる"audio"モデルってなんだろうね
雨、衝撃音、みたいなサウンド、音楽、人の声とか色々あるけど
0421名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 09:37:45.50ID:S/rJEOX+
動画作ってると効果音がすごく困る。フリーサイトでは全然思ったものがないし
そういうことが減るといいけどなぁ
0422名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 09:40:37.37ID:UDqjZjWY
>>416
フリーデータ収集タイプだと時間かかりそうだなぁ…
著作権的にもクリアなAIが一から生成するタイプになってくれたらありがたい…
ある物体の各方向の画像から3Dデータを作って、それを原本的に使うとか…
よくわからんけど…
0425名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 10:04:37.59ID:ggEkXtQg
基本的な事を聞くようで申し訳ないけどAIの画像生成ってプロシージャルとは違うの?
自分の手元に出てきた画像が既存の絵や他人の画像生成と同じになる可能性はほぼゼロ?
0427名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 10:17:48.42ID:9bRVI9C4
>>425
言葉の定義の問題かもしれないけど、普通使う意味のプロシージャルとは違うね
他と同じになる可能性は当然ある

テキストエンコーダ+イメージジェネレータの組み合わせで

1.画像を「こっちを見てる猫」「ロボットのような半面を持つサルバドール・ダリの鮮やかな肖像画」・・・みたいに分析して画像と関連付ける
https://i.imgur.com/rNl4e0Y.jpg
https://i.imgur.com/RZr0oGw.jpg

2.(拡散確率モデルの場合)のノイズを加えて元に戻す方法を学習をして画像生成を行う
https://i.imgur.com/vStOKue.jpg

各社色んなモデルがある
https://i.imgur.com/3vUZLoy.jpg

元のスライド見たほうがいいと思うけど一応抜粋。 https://www.slideshare.net/cvpaperchallenge/foundation-models
0428名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 11:11:58.16ID:lsjqrsdd
>>426
めっちゃ完成度高くていいな
greg rutkowski でググるともっと激しいタッチの絵がいっぱいでこの絵とは似てないけどなんでこうなるんだろうw
0430名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 11:29:40.70ID:aaawy5+6
>>429
自然言語じゃなくて、決められたタグで生成するのね
使用感としては生成するというより、単に画像検索してるだけな感じであまり面白くはない

いくつか見た感じ、顔も体の構造も壊れたものが少ない
(足が割れてたり、顔半分が潰れてたり、乳首が3つあったりするものが稀にあるけど)
人体が破綻しないようなAIを使ってるのか、人力で画像選別してるのかどうなんだろう
0431名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 11:31:54.78ID:Wquv7ko0
>>425
言葉のイメージとしてプロシージャル生成は、髪型はパターン2、目はパターン4、口元はパターン3で顔を組立てる、みたいな感じがある
0437名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 11:48:11.43ID:MgLgG5kM
検索するとセーラー服おじさんもDALLに熱中してるみたい
AIでもなかなかあの姿は生成できないだろうに
0439名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 12:06:23.71ID:DjD0+uFq
人物の手足グニャグニャは現時点では以下のように
指定画像から画像を生成するのが一番かなーと思う
でも手の指はむずかしい

#stablediffusion の #Img2Img (指定画像から画像を生成する)機能を使ってみました。
3分で描いた指示用雑絵(2枚目)に絵の要素のプロンプトを指示し1枚目を生成しました。
2枚とも生成時・指示時のもので、無編集。
https://pbs.twimg.com/media/Fa6n5_SagAA0h10.png
https://pbs.twimg.com/media/Fa6oOnIaQAcUSCy.jpg
0440名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 12:12:20.33ID:SjnZS+HX
>>305の人がそこらは詳しくレポしてくれてたんだけど、消されちゃってる
手修正交えてi2iで回してたけど、とにかく上手くいってない感じだった
0441名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 12:26:40.68ID:4KWrOa+f
来月リリースする"audio"ってなんだろうと思ってたけど、githubに作業中の項目書いてるね
1つ目は声を高くしたり低くしたいみたいな音声変換?(よくわからん)
2つ目はtxt2imgに、既存のGLIDEも使えるようにするってこと? >>427の絵を見るとtext encoderがclipからtransformerになる?
3つ目はテキストから音声読み上げ(TTS)、文字から音を生成?

https://github.com/huggingface/diffusers

A few pipeline components are already being worked on, namely:

1. BDDMPipeline for spectrogram-to-sound vocoding
2. GLIDEPipeline to support OpenAI's GLIDE model
3. Grad-TTS for text to audio generation / conditional audio generation
0443名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 12:40:15.22ID:MJLahhC0
Colabに構築したシステムに書き込んでるプロンプト情報や出力情報も、やっぱ本家に収集されてる?…
それならちょっと恥ずかしくなってきた(´-`)……
0446名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 12:50:51.86ID:MJLahhC0
>>445
そうだったの?!!!!
「エロい絵っぽいから黒塗りしとく」って言われたんで完全に監視されてるんだと思って一時間前から一切作るのやめてた!
海の向こうの人間たちに「こいつさっきからキモい絵ばっか作ってんな」「こいつの個人情報全世界に公開してやろうぜ」
って流れになってんじゃないかと思ってビクビクしてた…
収集されてないなら胸を張って作れる(´-`)!
0447名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 12:53:03.14ID:SWDfWijj
>>441
BDDMPipeline スペクトログラム(周波数と時間軸で音の成分を表現した画像)から実際に音を作る仕組み
→前段に「欲しい音のスペクトログラム画像を作るAI」が居れば音が作れるという下ごしらえ

GLIDEPipeline プロンプトへの忠実性としては世界最高峰と言える画像生成手法GLIDEをオープン実装する

Grad-TTS まだGANが主流で前時代的となったText To Speech(文章を読ませる音声合成)にdiffusionを導入する
0448名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 12:57:02.09ID:DjD0+uFq
AI画像コミュニティで #stablediffusionの #Img2Imgに3Dモデルを指示画像使用している人がいたのでクリスタの3Dでポーズ取り、目だけ描き込み→生成
設定補正小(2枚目) 補正中(3枚目) 補正大(4枚目)
指示文に髪・服・装飾などの情報は入れてない
指示絵が描けなくても3D人形使えれば絵になる
https://pbs.twimg.com/media/FbC0GrwaAAIhCTf.jpg
https://pbs.twimg.com/media/FbC0HKpagAA4KIm.png
https://pbs.twimg.com/media/FbC0Yt5aMAM3E4f.png
https://pbs.twimg.com/media/FbC10cCagAIJm5o.png

参考で
0449名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 12:57:40.24ID:4KWrOa+f
>>447
ありがと!
なるほど1番目はエンドユーザーが直接使うものではなさそうですね
来月でる"audio"モデルというのは、BDDMPipelineなのか、Grad-TTSなのか。 後者なら遊べそうなので期待
0450名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 13:11:57.16ID:IKhnqUWq
pixiv kawaii digital artでかわいい絵の命中率上がってた気がしたけど、もっといい呪文あったんだ…感動的
0451名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 13:17:53.64ID:QGhIHI1C
某所ではミュシャと水木しげるを同時召喚することで絵柄の癖を相殺して安定した顔を生み出す呪文が開発されたと聞く
いよいよもって黒魔術あるいは一周回ってサイバーパンクじみてきて面白い
0452名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 13:19:53.31ID:3lA/3zYt
後ろの方にKyoto Animationを入れると少しだけ絵が柔らかくなる
後ろの方にtrending on artstationでさらにイラストっぽくなるがこっちは壊れやすさも増す
anime.pixivは破壊力が強すぎて使っちゃダメ
0455名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 14:08:09.29ID:SsqIEZdF
普通に25yo girl in akihabara, sweet lolita fashion とかで可愛い女の子出るよね
変な呪文唱える必要ないよ
0461名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 14:26:09.52ID:4KWrOa+f
>>460
このスレでもそうだよw
0467名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 15:30:07.25ID:3lA/3zYt
学習元のデータセットのLION-5Bの58億5千万枚の画像には世界中から無差別に収集したアウトなのが大量に含まれてるのに
それをネットで公開して世界中にバラ撒いても許されるってのが規制の厳しい日本じゃ考えられんな
法律無視して単純所持で逮捕されるような画像を勝手に大量収集しても許されるグーグルみたいな特権的巨大企業しか
AIって無理じゃね?って想定が一気に崩されて世界が変わった
0468名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 15:36:19.31ID:zu61kmTt
>>467
それは真逆で機械学習のデータについては日本は無法地帯ってレベルで緩いよ

まあアレクサとか盗聴器を家庭に設置するようなことはできてないけど、法律規制の問題じゃない
0472名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 16:19:43.86ID:Yh7v5au2
>>434
メモリ少なすぎるだけでは
手元のMacメモリ64GBで1分ちょいだった
とはいえCPUで無理くり動かしてるだけだからMetal最適化待ちだな
0473名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 16:20:01.25ID:3lA/3zYt
およそこの世界のありとあらゆる画像データ公開されちゃったから
AIの技術革新が進めばおよそ何でもできるようになっていくんだろうな
パンドラの箱が開かれた感じ
0474名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 16:30:24.12ID:dE3nz1Ed
元々の仕組みからすればもっと分割してレンダリングするとか
少メモリで高解像度いけるようになるよねぇ
そうなったらもっと遊べると思うんだよなー
解像度上がるだけで細部潰れるのとか解決しそうなんだよね
0476名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 16:40:36.69ID:3lA/3zYt
img2imgは現状だと落書きをマシにするにはいいけど元データの品質がある程度高いと劣化にしかならないね
クリスタの3D人形レベルならいいけどMMDで出力したキャラですら劣化するから3Dでいいなと
逆に背景は3Dでは処理が重くて厳しい高層ビルから見下ろした風景とかを上手くやれば出せるから有用度高いね
0477名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 16:43:01.41ID:AfXBNqcc
>>366
質問です
これ手順通りにやったんだけど
6GMあるのにグリーンスクリーンになります

それで下記の通り説明されてたんだけど……

グリーンスクリーンの修正:
次のパラメーターを使用して webui.cmd を編集します:
" python "%CD%"\scripts\webui.py --precision full --no-half"
(注: これにより vram の使用率が大幅に上昇します)、解像度を下げる必要がある場合があります。

このパラメーターの使用方法がわかりません……
わかる方教えてください
0479名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 16:52:49.08ID:UyUIEwKp
現状でもストーリーや文脈のないキレイなだけのイラストはAIガチャだけで生成されるからこれから様々なメディアに大量に投稿されるかも。それも今の数十、数百倍
AIを用いたイラストを使ってるってだけで毛嫌いされる時期が訪れるかもしれん
0480名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 16:53:16.43ID:3lA/3zYt
正直今のレベルならキャラは3Dソフトのほうが全然いいけど権利問題を誤魔化せるって利点があるんだよね
イリュージョンの3Dを下絵にして大ヒットして億単位の売り上げ出した某同人ゲームが著作権で叩かれて
販売停止された事件があったみたいにずっと絵の省力化には著作権問題が付きまとってきた
メーカー側が著作権フリー宣言してるソフトでも今度はユーザー製のMOD使ってるとやっぱり袋叩きでみんな委縮
AIは世間が理解できなくて許される雰囲気あるから一度誰かが先行して商業OKな実績出来たら雪崩を打って使われ出すと思う
0483名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 17:04:46.97ID:WL/0wI51
>>477
「scripts」フォルダのなかの「relauncher.py」ってファイルの
os.system("python scripts/webui.py")
って行を
os.system("python scripts/webui.py --precision full --no-half")
にすればいい
0484名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 17:09:32.44ID:3lA/3zYt
>>482
これまでは法律も証拠も関係なく似ているというだけで叩かれてアウトだった
髪型が似ているとか似たような構図が特定の作品との間で多いというだけで差し替えや販売停止
それに比べてAIだと多分画風丸パクリでも許される流れになってきてる
0486名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 17:11:49.02ID:loAKIiRJ
>>477
書いている通りですが、

webui.cmd というファイルがあると思うので、それを編集して以下の行を書き換えればいいと思います。

python "%CD%"\scripts\webui.py



python "%CD%"\scripts\webui.py --precision full --no-half


多分Geforce 16xxだと思いますが、解像度を下げる必要があり正直実用的じゃない気がします。
Google Colabを使ったほうが良さそう
0487名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 17:12:11.33ID:K8bYA1rq
colabは導入簡単で良いね
ただこれで触ると楽しいからもっと良い環境で使いたくなる
0492名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 17:59:57.24ID:3lA/3zYt
img2imgに写真食わせて背景作ると初心者が写真トレスしたときにありがちな
間違いとか誤魔化し多発するから絵を描く人にはやっぱり一発で分かるね
描かない人はそこまで気にならないだろうけど有名絵師の写真トレスとかも
同業者は叩かないだけで全然バレバレだからね
0496名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 18:26:04.94ID:3lA/3zYt
GUI版で重くなるのあのアニメーションが原因じゃないな
別ブラウザでもとにかくjavascriptでアニメするようなページ開いてると同じことになるわ
0497名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 18:26:49.10ID:180gjllU
前スレから沸いてるペドガイジ↓一応自分が馬鹿という自覚はあるらしいね

158名無しさん@お腹いっぱい。2022/08/25(木) 05:53:26.27ID:OfpVbaR2
>>155
フィルター解禁版使ってみたいけど

ハードル高過ぎ何をどうしたらいいかわからんw

馬鹿にでもわかるような解説出ないかなぁ
0501名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 19:01:04.36ID:3lA/3zYt
いったんアニメ絵は忘れてまず基準になるようなフォトリアルな
現実そのものの服装出せるプロンプトってどんなんなんだろ
例えば学生服とかで
0502名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 19:01:37.96ID:AfXBNqcc
>>488
>>483
お礼言うの忘れてたんでありがとうございます。

できはしたんですけど
重たすぎてすぐ固まってしまい
自分の環境じゃ厳しかったです
0503名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 19:02:34.16ID:AfXBNqcc
>>500
最終手段はそうします……
すでに昨日別件で4chで聞きました……
0504名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 19:15:12.31ID:3lA/3zYt
>>499
そこはインストール先決めてるだけだから
マウントされた/content/drive以下の好きなフォルダを指定するだけだよ
あとこの設定だとグーグルドライブに出力した画像が保存されるから
アウト画像生成すると通報されるぞ
0507名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 19:51:46.42ID:+7yKirg9
>>499
これはモデルを既に自分のGDriveに保存している場合、それを使うという設定で、他の方法でダウンロードしているなら実行不要です。

上にある以下の2つのどちらかを実行すればOK。その下のHuggingfaceも不要です。
!gdown
%cd stable-diffusion
0510名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 20:23:34.06ID:AfXBNqcc
>>504
>>507
ありがとうございます。

重ねての質問で申し訳ないですが、
Load modelでもエラーが起きます
これもわかったりしませんか?

https://imgur.com/JfsHVj4
0511名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 20:31:50.87ID:MJhko+at
>>510
モデルがないってエラーだから>>507のモデルをダウンロードしてないか、ノートのバグかどっちかでは
ただモデルダウンロードしても、俺はそのノートブックが動かせたこと無い(他のノートは問題なく動く)ので詳しいことは動かせた人に聞くしか・・・

後動かしてるのがOptimizedSDだけど、それめっちゃ遅いから止めた方がいい
みたいなこともあってそのノート俺は嫌い
0512名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 20:41:00.53ID:AfXBNqcc
>>511
そうなんですね……
なんとか自分のPCでもImage 2 Imageを動かしたくて調べてます……
ただ素人なんで苦戦してますが……

おすすめのノートあれば教え欲しいです
0515名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 22:26:45.33ID:itcnfXXK
3DCGのtエクスチャ用途にバリバリハマってるわ…
これ2048+2048とかできんのか??

512じゃ解像度たらんのよー
0516名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 22:35:02.89ID:bvKjza8h
>>515

>>342
テクスチャといえばこのシームレステクスチャも便利そうね。試してないけど

解像度は3090(24GB)でも896x896が限界らしい
メモリ最適化版なら多分もっと行けると思うけど
0522名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 23:08:44.11ID:cTO6c8YE
キャラがへなちょこと不気味の谷を超えて可愛くなり、おっぱいも見飽きた今、いったい何をするべきか。
0523名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 23:13:46.33ID:o3NpW9jG
ひたすら無駄な詠唱を削るためにwebuiのマトリックス機能でテストするといい
その分他の属性にリソースを割くことができる
0524名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 23:24:31.09ID:bvKjza8h
>>512
これはキャラも背景も一定してないから、ベースのアニメをimg2imgでインプットして同じプロンプトで画像生成してるだけな気がする。
一定しないのを演出風に見せてるだけで
0528名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 23:39:39.69ID:16ttzI0o
生成できた絵で上手くいったやつ上げてほしい
手直しなしの状態で
0529名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 23:43:31.08ID:SWDfWijj
k_euler_aサンプラーすごいな
説明書き通り20stepぐらいで収束する

けどk_lmsと違う絵になるのが玉に瑕
破綻するわけじゃないからプロンプトとの相性次第か
0530名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 23:48:03.82ID:bvKjza8h
サンプラーの違いは、 https://rentry.org/GUItard の一番下に分かり易いのあるけど
k_euler_a、k_dpm_2_aが独自の進化するような感じ

k_euler_aは、サンプル数増やすと正常進化じゃなくて、変異が大きく見える

この例が一般的な傾向になってるか分からないけど
0532名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 23:58:16.37ID:16ttzI0o
>>531
ありがとう
眉毛?に笑ってしまった
0537名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 00:09:53.10ID:55tw+Qxr
>>533
すげえなこれ
ある程度複雑なポーズとかはi2iじゃないと難しいかな
0541名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 00:17:40.04ID:x6WjdKCc
Colab構築版img2imgはjpg保存の選択とか出来ないのかな
リアル系画像だとデフォルトpngよりデータサイズが数倍大きくなっちゃって大量作成すると一日で合計1GB超えちゃう…
0542名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 00:18:31.60ID:0Q+OyymB
>>538
質問がわかりにくいねw
GUItardならランダムシードの結果のシードがいくつか出る

ファイル名がシード値になってたりするけど、どのツール使ってるかで違うね
0544名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 00:19:18.97ID:55tw+Qxr
>>538
なんちゅうか「そういうAIだから」と言われればそれまでだが
画風の振れ幅がすごいな

>>539
あいつの場合絵師だから、ほぼ全部自分で描いて
「AIが一発で描きました!ヤバイヤバイ!」ってやろうと思えばできるんだよな
0546名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 00:25:39.67ID:4eKDvHgi
AI絵を自分の絵って詐欺、の逆かw
教えてもらったほうが参考になるっちゃなるけど、まあいいんじゃないの
0548名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 00:28:55.26ID:LudICNb0
>>537
テキストだとポーズは諦めた方が早いと思う
腕とか足制御してそこから顔が当たるのお祈りするよりportrait paintingで胸から下バッサリ捨てた方がまだ当たりやすい気がする
手を出すと数とか形もぐにゃぐにゃのままだしね
0549名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 00:32:27.94ID:55tw+Qxr
>>548
そこはやっぱりそうなのか
なんかAIの得手不得手が人間のそれとあまりに違いすぎて混乱するな
0552名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 00:47:53.87ID:yp8wo02v
pixivの古い絵辿ればわかるけど
もともと写真加工背景によくある萌えキャラ絵を色合わせして描いてた人なんで水を得た魚状態
AI背景生成とは運命的な出会いだろう

本人にしてみれば、昔からやってたからここまでできるんだ=バズったしもう断り要らなくね?
みたいな、よくわからない増長があるんだろうな
0555名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 01:16:40.26ID:OU07VRpA
980tiだが、>>366がなぜか512x448以下じゃないと動かない、直打ちのOptimizedSDは問題なかったのに
全然動かないよりはマシだけどモヤモヤする、ほんのちょっとどこかから持ってこれんものか・・
0557名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 01:23:26.52ID:OU07VRpA
>>556
ありがとう、でもまだ入れてない

あとimg2imgでできた画像が微妙に拡大されてるのが嫌だ、なぜ100%で表示しないのか
くわえてCopy selected image to inputが滅茶苦茶時間かかるのが謎
元にコピーするだけなのになぜ「drawing」?生成したのをD&Dしたら一瞬
0558名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 01:47:02.35ID:mZXdx8Aa
これって作成した画像を商用で使う時もMITライセンスの規定通り
Copyright (c)2022〇〇
Released under the MIT license
リンクアドレス

みたいにする必要あるの?
それともソフトウェアを再配布や販売した時だけ?
0559名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 02:02:58.32ID:rGPZhQgU
>>547
これ参考にやってみたけど、
画像みたいにでてできないや……
model.ckpt'はちゃんとマイドライブに入れているんだけどなぁ
ここ数日img2imgのため時間無駄にしてるなー
わかる方教えほしいです

https://imgur.com/a/m3C1COd
0560名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 02:31:06.50ID:OU07VRpA
craiyon元にimg2imgで変なのしか出なくてつまらんと思ってたけど、自分で描いた>>439下みたいな単色付き雑絵元に
新海とかgreg rutkowski とか入った呪文で、strength0.5、step50の5つくらいバッチで回したらいきなり面白くなってきた
これほんと革命だわ・・
craiyon出力のごちゃついた絵じゃなく、ほんと単純な線こそいい
0561名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 05:42:09.17ID:soUy0mxj
Pythonコマンドから実行がなんとなくゴテゴテしてなくて最速だと思ってたけど
WebUI版の方が読み込み済みプロセス流用で1回生成あたりは早くなるのね

本家 35秒
basujindal版(CUI) 64秒
hlky版(GUItard) 13秒
0562名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 06:33:52.08ID:nfjXgkLu
あからさまに誰かのtwitterアカウントの痕跡が出て笑った
https://i.imgur.com/3zL6XsS.png
0566名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 09:02:25.99ID:nSJ/aIoh
>>558
プログラムだけ
生成物には関係ない
0570名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 11:47:17.91ID:fS1mdW6z
プロンプトの区切り方に決まりや強調方法はあるのでしょうか?
小文字のカンマ「,」が基本だと思うのですが、ピリオド「.」でも問題なしですか?
[] () のカッコ類でも強調されたり逆に弱くなったりという話がありましたが、結局あれは効果変わらずでしょうか?
他者のプロンプトを見ると!!!A!!!というビックリマークで区切っている人を見かけたのですが、強調効果があったりするのでしょうか?
0571名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 11:47:40.73ID:fMA4vNNF
SDの背景絵見慣れ過ぎて人間の絵描きが描く背景がヘタクソに見えるようになってしまった
キャラもいずれはそうなるんだろうな
0572名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 12:12:57.57ID:tXCVIlYH
>>570
実験した人が居て
「影響はあるがどれが良いかは分からない」というのが結果
カンマとピリオドでは違うし、他の区切りに使うような文字を使っても違う
けれどもどれがベストかは分かってない

他の単語とかと同じくそのまま解析に突っ込まれてニューラルネットに入るので、カンマを入れると特定の動きを毎回するのではなく、ただの文中の1文字でしかない
0573名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 13:02:43.84ID:fS1mdW6z
>>572
影響自体はあるんですね!
プロンプトでの記号使用も奥が深い…
今まで文章の終わりもカンマにしていましたが、プロンプトでもピリオドの方が適切っぽいですね
0574名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 13:05:24.28ID:RhrP3rKu
>>514
それはimg2txt
0576名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 13:48:32.03ID:PbRMjqpJ
メインの詠唱はしっかりした文章の方が理解されやすい気はしてる
セレブ顔混ぜたり、おまじない系は羅列でも割と効果ある感じ。
0578名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:19:36.12ID:OU07VRpA
>>82で見かけたヤケクソな呪文
Watercolor painting in style of krenz cushart ilya kuvshinov kyoani, makoto shinkai, hideaki anno, mochiduki key, studio ghibli, madhouse, white fox, studio trigger, gainax, violet evergarden, granblue fantasy, fate grand order, kinmoza!, kanamemo, hanayamata, shirobako, yuyushiki, k-on!, nichijou, lucky star, a-channel, umaru-chan, nyaruko-san, devilman, claymore, kiseijuu, code geass, guilty crown, umamusume, idolmaster, kancolle, touhou project, nier automata, k-on, yuruyuri, cygames, production i.g, wit studio, p.a.works, ufotable, mappa, toei animation. cute girls doing cute things trending on artstation pixiv makoto shinkai smiling super detailed eyes eyebrowless symmetry face visual novel
0579名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:23:04.33ID:feJDv8ZX
ゔぁぁああ服が出ねぇぇぇ
「一枚の服だけ」が欲しいのに出ねぇぇ
一枚の服って指定してるだろうがあぁぁ
0580名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:24:29.53ID:RhrP3rKu
4chan.org/g/sdg
見てるんだけどなんかみんなイライラし始めてて笑えなくなった
0583名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:33:59.92ID:RhrP3rKu
>>582
えっちな画像貼るなって一人でわめき散らかしてる奴がいるせいかな
0585名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:35:03.56ID:peOhpSjK
平均的にいい部分だけ残るみたいな場合もあるよな
カレー粉みたいにめちゃくちゃになる言葉もあるけど…
0586名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:38:02.03ID:IOaKe0eq
>>583
なるほどw
まあ情報共有系、プロンプト・作品発表(R18/一般)は分けたほうがスムーズな気もする

こっちはまだそんな流れ早くないからいいけど
0587名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:41:02.66ID:WOqtrjL/
Emma Watsonって混ぜるとどんな状況からだろうと全部エマワトソンになるから笑うわ
人物におけるカレー粉的存在
0588名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:44:57.89ID:55tw+Qxr
>>577
萌え絵とかエロ絵っていう低俗な世界だからイナゴ共が大挙して研究して発展するのよね
これが例えば医療用AIだったら、いくらオープンソースにしても誰も見向きもせずに進化しない
仕方ないことではあるが何とも情けない話だな
0589名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:45:22.57ID:nfjXgkLu
エマワトソン頼んでもないのに出てくる時あるよな
開発側がファンなのか
0590名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:48:03.02ID:IOaKe0eq
エマ・ワトソンはちゃんと美人だからいいわ
海外で美人とされる女ゴリラが出てくるのはちょっと勘弁だな
0591名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:54:03.42ID:WOqtrjL/
画像処理の論文で必ずと言っていいほど出てくる例の謎の女性のポートレートも
元をたどると研究者がその辺に置いておいたポルノ雑誌から適当にスキャンしたエロ写真だしなぁ
0592名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:56:38.11ID:fMA4vNNF
デジタル化が進んで便利になり3Dも写真加工も使えるようになり
昔は絵を描くのが簡単になってコストが下がると思われていたんだけど
現実には逆にイラストの作画コストはインフレし続けゲームに使われるCG枚数は減少の一途を辿った
最近のゲームのイベントCG枚数は昔に比べて1/10くらいに減ってしまっている
宮崎駿は写真やCG使う風潮に「そんなもん時間かかり過ぎだろ、手で描けよ!」ってキレてた話は一部で有名
せっかくAIが出来てもみんな下絵を自分で描いて〜修正用やリサイズは別AIで〜ループバックで〜って
たった数日で既に工数のインフレが進んでるの超速で歴史の繰り返しをしているの笑ってまうわ
0593名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 15:03:16.63ID:PbRMjqpJ
エマ単体だと大抵そっくりかちょいイケメンになる
自分の場合
Ana de Armas (目でかくなる・鼻細くなる美人
miss universe (ポーズ綺麗・遠くても顔潰れにくい・たまにブス
こういうのも混ぜてみてる
良い感じに似なくて美人になる有名人だれか見つけてー
0596名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 15:08:23.13ID:OU07VRpA
今見たらアンチスレ結構賑わってるじゃん、古塔抜いてイラ板トップだ・・すごい
是非そっちでやって盛り上げてあげてくださいな
0597名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 15:27:29.50ID:lzcC8D0a
>>588
まさに規模の経済って奴やな
実用性や自分達への見返りを鑑みても100%医療AIへの発展に全力ベットすべきなんだがそこがまた人間故の性
0600名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 15:37:10.07ID:TtPvHroS
興味が仮にあっても自分で使えない物のOSSに貢献するのは難しい。動作がOKなのかどうか医者にヒアリングしないとわからないしね
医療AIやるならお金もらえるわけで、OSSに市場を破壊されにくい医療AIの方がいい面もあるね

>>598
めっちゃかっこいい
けど革命ってほどではないかな。
0602名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 15:41:34.57ID:RhrP3rKu
>>600
思いついたものをポンポン画像化できるのはかなり便利じゃない?
0605名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 15:47:11.78ID:soUy0mxj
pixivデイリー1位のイラストに似せるというプロンプトの練習をしてみた
日替わりでお題が出るので楽しいかもしれない
0606名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 15:52:03.30ID:RhrP3rKu
ここで検索して人形かケーキしか出なかったらハズレワードな気がする
https://rom1504.github.io/clip-retrieval
0609名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 16:13:12.57ID:cYyPub3G
死んだ後に自分そっくりの絵柄で自分の名前を冠してエロ絵生成されまくっとるとか俺なら泣きたいww
0611名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 16:17:00.08ID:RhrP3rKu
でもミュシャの絵なんてほとんどえっちじゃん
0613名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 16:19:35.87ID:RhrP3rKu
女性の絵をたくさん描いてるってのもあるかも
0616名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 16:29:58.40ID:tXCVIlYH
>>615
ESRGANの公開モデルとかは写真向けだから緻密な絵画風のを入れるとノイズ扱いされると思う
モデルがチューンされてれば別だけれども
0618名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 16:43:09.31ID:fMA4vNNF
AIの絵にはエロさは全くないな、学習データの問題もあるっぽい
アウトな画像からも学習してるけど圧倒的に多いのは表の健全な画像だからな
そっちにかなり引きずられてる
0620名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 17:01:35.16ID:JbODh9Pl
>>599
現代アートって正にそんなのばっかだからw
0621名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 17:02:32.58ID:JbODh9Pl
>>618
まあそもそもサービス提供元がエロとグロを規制してるから仕方ない
0622名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 17:03:19.49ID:8cZ3F7HA
エロ系はlaionのデータ眺めてみると動画サイトのサムネとタイトルみたいのばっかりでそういうのも良くない気がする
キャプションと画像がちゃんと結びついてない
0628名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 17:39:01.10ID:nm8KAVsJ
>>623
しようと思えばAI開発者なら出来るけど大きな社会的責任負ってまでやろうとは思わんだろ
エロとかはアングラ系がやってくれるだろうからそれまで待つしか無い
0629名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 17:39:10.10ID:RhrP3rKu
>>623
インド版は作ってるらしい
0634名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 19:08:40.54ID:RhrP3rKu
LenaはPlayboyの切り抜き
0636名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 19:29:45.45ID:OU07VRpA
outputsのsamplesにちゃんとプロンプトをテキストで残せるようになったのか、嬉しい
しかしまたフォルダにプロンプト名・・と思って>>578入れたらちゃんと切り捨ててくれてた
やっぱ多すぎるとほとんど無駄なんだな

> Watercolor painting in style of krenz cushart ilya kuvshinov kyoani, makoto shinkai, hideaki anno, mochiduki key, studio ghibli, madhouse, white fox, studio trigger, gainax, violet evergarden, granblue fantasy, fate grand order, kinmoza!, kanamemo, hanayamata, shirob
ここまでしか効いてない、思ったより少なかった
以下切り捨て

> Warning: too many input tokens; some (133) have been truncated:
> ako , yuyushiki , k - on !, nichijou , lucky star , a - channel , umaru - chan , nyaruko - san , devilman , claymore , kiseijuu , code geass , guilty crown , umamusume , idolmaster , kancolle , touhou project , nier automata , k - on , yuruyuri , cygames , production i . g , wit studio , p . a . works , ufotable , mappa , toei animation . cute girls doing cute things trending on artstation pixiv makoto shinkai smiling super detailed eyes eyebrowless symmetry face visual novel
shirobakoのshirobまで認識されてるからノイズになりそう?
0637名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 19:57:55.16ID:RhrP3rKu
え、ファイル名に入ってないと切り捨てられてるって意味なの
0638名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 19:58:38.47ID:fMA4vNNF
アジア系やアニメ、ゲーム系が上手くいかないのは画像認識AI側の問題もあるっぽい
LAIONで日本の著名タレントで検索かけると無関係な日本人女性の写真が大量に混同されてる
アニメやイラストでもこの手の認識ミスが大量にあって画像認識段階でこけてる
0639名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 20:00:26.27ID:OU07VRpA
>>637
いやOSのファイル名の長さは関係ない
上で書いてる人いたけど、トークンに制限がある>>114

ちなパスが255文字意識してるらしく、SDのある場所によってはかなり短くなるので
同シードでプロンプトがあまり長いとケツの方が違ってもパスとファイル名同じになって上書きされちゃう模様
(自分の環境ではフォルダがghibliで終わってる)
stable-diffusion-mainはドライブのルートに置くべきか

なお、>>578のカンマなくしたらそれだけ多く認識されて当然画像も変わった
詰め込みたい場合は区切りなしがいいみたい

>>638
>>594
0641名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 20:13:08.53ID:nzmlNcBC
PC弱者、英語弱者すぎていつ使えるようになるやら、、
0642名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 20:20:21.89ID:OU07VRpA
今のAI「一般」の画像収集が難でアニメ顔上手くいかない話とかアンチ賛美スレでワイワイみんなやってるから、そっちでやればいいと思う
つかみんな結構面白そうな会話してて読みこんでしまったw

ここはMJでどうやったらアニメ顔だせるかな?とかの具体的な話するスレでは?
技術評価じゃなく技術交換なんだし
0646名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 20:53:15.14ID:R2jl8lfR
anaconda入れる意味あったかとかcdnnの入れる場所はcudaの場所でよかったのかとかよくわからん右往左往しつつようやっとStableDiffusion動かせたけど1枚2分かかる
うん、>>43のgoogle colabでいいや…
0647名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 20:54:56.88ID:hfPVoEGY
>>642
Stable DiffusionはLAION-5B使ってるって分かってるんだから別に一般でもないだろ
なぜ普通にやったらできないかって話はどうやればできるかにも繋がるだろうし
0648名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 21:00:37.68ID:tXCVIlYH
Nendoroid

StableDiffusionフォーク先の話題から拾ったがやけにうまく学習されてるな
アニメ絵の顔面崩壊具合を見てると奇跡に近い安定性
0650名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 21:27:50.90ID:Wfou7ymM
>>649
redditのほうでやってる人は見たが、hlkyで対応してくれるのええな
ただESRGANの何が良いって顔修正してくれる所だから、一部だけ適用みたいなの出来れば最高なんだけどな
0652名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 21:32:20.69ID:tXCVIlYH
>>650
色々とごっちゃになってない?

GFPGAN 顔を認識して歪み等々を修正してくれる 解像度は上がらない
ESRGAN 画像全体にノイズ除去をかけて超解像してくれる 顔が歪んでてもほぼそのまま
0655名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 21:36:16.94ID:7Dof+O/R
詠唱が上手い人、特に既存のアーティストのミックス、パロディ、再構築で個性出せるような人は、今後音楽で例えるならDJみたいな価値を持つようになるんかね
0656名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 21:38:45.11ID:nfjXgkLu
スペルマスターw
0658名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 21:41:51.39ID:TtPvHroS
詠唱が上手い、と言ってもモデルがアップデートすると変わるんだよね
0659名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 21:42:43.80ID:hfPVoEGY
>>499のnotebook、
・pytorch-lightningのinstallをURLで
・Load modelのckptをフルパスで指定
でやったら(少なくとも自分の環境では)動きましたね
ただLoad modelでなぜかやたらRAMを使ったのでColab Proじゃないと厳しいとかあるかもしれない
0660名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 22:01:00.65ID:OU07VRpA
どうせ駄目だろうって試してなかったGFPGAN
>>652で存在思い出したのでやったら980tiで動いたわ・・こりゃ捗る
512x448が448x448までになっちゃったけど、歪なサイズなんて意味ないし、丁度よかったw
0663名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 22:18:16.02ID:sF4/noKa
3DCGメインで普通のゲフォを使ってたけど
この流れで次はちゃんとQuadro買わないとダメなんかなと思い始めてる
0664名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 22:26:32.38ID:TtPvHroS
省メモリ版のbasujindalがアップデートして、--turboでオリジナルと同等のスピードになったらしい。(+1GB消費)
解像度上げる時は省メモリで、普通は--turboとかにすると便利かも

https://github.com/basujindal/stable-diffusion

後キーワードの重みを数字指定できるようになってる
--prompt tabby cat:0.25 white duck:0.75 hybrid

>>663
Quadroって意味ありますかね?
0665名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 22:33:13.36ID:sF4/noKa
>>664
今この瞬間はゲフォで戦えてるけど
もっと高解像度な画像を吐くAIが主流になったら
普通に要求GPUメモリが20~30GBとかになっちゃうんじゃないかと危惧してます
0668名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 22:50:50.01ID:EUqBBWer
Midjourney Discordの登録者数が95万人(ピーク100万人だったけど無料枚数終わった&StableDiffusionでちょい下がった)
Geforceグラボが四半期で1000万枚(平均単価15万円)
少しだけ人気のゲームが販売された、程度の影響じゃないかな

騒いでるのはクリエーターでまだまだニッチ。一般にブレイクはしてない気がする。今後分からないけど
後企業のAIサービス用GPUとかがめっちゃ売れたりするかも
0669名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 23:12:17.16ID:4VRmLpiv
直に金にできるものじゃないからマイニングほどのパワーはないかと
それこそ必要スペックの高いゲームが流行るかどうかくらい?
しかし使い方が悪いのか、世界変革させられないぜ
0670名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 23:28:20.33ID:kGYLanZ1
>>667 >>669
RTX3080未満のグラボ持ちなら
Colabの方が電気代すらかからない無料でしかも速いからいいと思うんだが

ヤバイ画像作りたいってのなら話は別だが
0671名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 23:36:14.02ID:OU07VRpA
無料colabはストレスが・・ちょっとフォーカス外したらcaptcha出てきたり
離籍して戻ったら途中まで起動したのが全部終わって生成部が動かなくなってたり
あと100枚行かないうちに上限出て12時間だっけ?置かないといけなかったので
ガンガン画像作るとなると実用性が

ローカルPCだと翌日スリープから復帰したらそのままいきなりブラウザ上のgenerateボタンだけで生成が動く上、無制限
コマンドカタカタのはやたら遅かったけど、GUIのやつは最適化されてるのか全然遅くないので驚いてる
0672名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 23:46:18.81ID:DZyXZAfP
絵を描く人もやってると思うが物の名前や画家を調べるのも楽しい
遊ぶにも知識は大切だわ
0673名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 23:51:27.42ID:RhrP3rKu
存命の大物女優でやるとどうしても顔が長くなる
1970sとか1980sとか入れても
0676名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:12:44.55ID:QuNPQemV
>>674
別人になる…
0679名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:19:22.61ID:5g5iYiJ4
>>675
GPUのVRAMを増やす
でも3090TI(24GB)でも960x640、もしくは896x896が限界、らしい

マルチGPUだと、512x512を2枚同時実行はできるけど、現時点では多分解像度を増やすのは無理な気がする

A6000(48GB) 66万円でも単純計算で1920x1080は無理で1920x640とか? 個人じゃきついね
0681名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:28:09.66ID:bWnmVXgB
StableDiffusionのデモで動かしてた時はA100の80GBを大量に入れたGPUクラスターで動かしてたんだとさ
そりゃ1024x1024の画像がバカスカできる訳だわ
0682名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:28:24.91ID:oC+XzzYP
Midjourney、StableDiffusionの前からGoogleのImagenとかがあって同じことが出来た。
しかし計算量・必要メモリ量が膨大でコンシューマGPUでは512x512なんて全然無理だった
Difffusionの何が凄いかというと、必要メモリ量を64分の1に削減してコンシューマ向けGPUでも計算可能にしたこと

内部的には512x512どころか64x64解像度で計算して、計算結果を512x512に戻してる
それでやっと6GBメモリとかなんだよね
0683名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:29:16.88ID:IYnowAka
>>676
midjourneyでは"15 years old "を頭につけて女優さんの名前で、顔が短くはならないけど年輪が刻まれていない雰囲気にはなった。
別人かどうかは見立て次第だけれど
0684名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:31:01.69ID:PaLIc/uC
プログラム作成者の人達、プロンプトの具体的限度文字数とか教えてくれないのかな
絶対俺無駄に入れまくってるから具体的に「256バイト以内です~」とか言ってくれると大変ありがたいんだけど
プログラム作成者ですら文字数上限を理解してないとかありえるのかな
0685名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:42:27.26ID:oC+XzzYP
>>684
トークン数は75
けど俺は”トークン”が何かがよく分かってない。CLIP(テキスト解析)の説明を読めば書いてるはずだけど難しいw

swiming, girl は2トークンだと思うけど、swiming girl は2トークンなのか、1トークンなのかどっちか分からん
0688名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:49:00.72ID:+1zbSHkB
でも>>578のカンマスペースハイフン全部なくした
Watercolorpaintinginstyleofkrenzcushartilyakuvshinovkyoanimakotoshinkaihideakiannomochidukikeystudioghiblimadhousewhitefoxstudiotriggergainaxvioletevergardengranbluefantasyfategrandorderkinmoza!kanamemohanayamatashirobakoyuyushikikon!nichijouluckystarachannelumaruchannyarukosandevilmanclaymorekiseijuucodegeassguiltycrownumamusumeidolmasterkancolletouhouprojectnierautomatakonyuruyuricygamesproductioni.gwitstudiop.a.worksufotablemappatoeianimation.cutegirlsdoingcutethingstrendingonartstationpixivmakotoshinkaismilingsuperdetailedeyeseyebrowlesssymmetryfacevisualnovel
トークン数1?も最後まで警告なくちゃんと読み込んで萌え風になるんだよね・・どうなってんだろ
0689名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:50:50.37ID:PaLIc/uC
>>685
そこ謎だよなぁw…
「1単語ごとなら75個までです!」とか優しく言ってくれるとわかりやすいけど、絶対そこまで適用されてないし

>>686
って、本当に77単語までOKなの?…
実感として77単語も入れたら後ろ半分くらい効果を全く感じないんだが、本当に本当なのかな?……
77単語入れず30単語くらいでも明らかに最前と最後で適用されてる感違うし…
う~ん…むらむらする…
0690名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:54:02.03ID:oC+XzzYP
日本語だと多くのトークンを消費、とか書いてて謎が深まる

https://wiki.installgentoo.com/wiki/Stable_Diffusion
> 特定のポイント以降のすべて (カウント方法に応じて 75 または 76 の CLIP トークン) は、単純に切り取られます
> Unicode 文字 (日本語の文字など) を使用する単語は、ASCII 文字を使用する単語よりも多くのトークンを必要とします。
0692名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 01:03:22.06ID:bWnmVXgB
トークンっていうのは、AIが言葉に振ってるIDみたいなもの
入れられた言葉をトークン表と照らし合わせながら拾っていく

例えば、helloであればhelloという固まりのトークンがあるのでこれで一つ
hello allだとhelloとスペースとallで3つ
hjfj ftjb(意味のない羅列)だとh j f j スペース f t j bで9つ

翻訳みたいなことをされて実際の処理に投入される
日本語は2バイト文字だからただでさえ2倍のサイズな上に
ほとんどトークン表に登録されていないのでほぼそのまま文字数x2=トークン数でバカスカ食う

トークン表は言語を学習するときに勝手にAIが選ぶので追加とか削除はできない
0693名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 01:12:03.13ID:60RqM723
はえ〜、なるほど
ちょっと目先を変えて日本語試してみてたけど、やはりそういう不利があるのか
0694名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 01:16:43.84ID:lj5/NLyY
トークンオーバーフローしたらワーニング出すように修正しようかな、と思ってソースみたら
既に、GUItardは対応してた。以下のメッセージで何が無視されたかが出るはず

"Warning: too many input tokens; some ({len(overflowing_words)}) have been truncated:\n{overflowing_text}\n"
0695名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 01:17:08.40ID:PaLIc/uC
>>692
勉強になります!

意味のわかる英単語(多くの画像検索結果が出る) 1トークン
スペース 1トークン
意味のわからない英単語(画像検索結果が殆ど出ないetc.?) 1文字につき1トークン

これの合計で75~77トークン以内に収めたら良い感じっぽいですかね?
目安がわかりやすくなった!

スペースとカンマは同じですか? 違うトークンとして認識されるんでしょうか??

「A B, C D」 AスペースBカンマスペースCスペースD =8トークン?
「A B,C D」 AスペースBカンマCスペースD =7トークン?
0697名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 01:38:15.02ID:bWnmVXgB
>>695
すまん例にスペース使っちゃったけど今調べたらスペースは多分トークンの外だわ
カンマは1トークン

なのでカンマでブチブチ区切るととんでもない勢いでトークン数が消費されていく
0701名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 01:45:03.98ID:aku20RdR
エロには厳しいみたいだけど、作った背景とかを
エロゲーやエロ漫画の背景に使うのもダメなのかな?
0704名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 01:56:23.10ID:+1zbSHkB
>>701
> エロには厳しいみたいだけど
確かにMJとDSは有料サービスなんでうるさいんだけど、
SDはコード丸見えなんで早々に良心回路外されて無法地帯化してる
0707名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 01:58:59.49ID:PaLIc/uC
>>697
実験してたらこうなったのでスペースも関係ありかと思っちゃいましたがそうでもないのですね!

,,,,~,,,,many cats,(カンマ148個+many cats,) 猫が出る 
,,,,~,,,,many cats,(カンマ149個+many cats,) 猫が出ない
,,,,~,,,,cats,(カンマ148個+cats,) 猫が出る
,,,,~,,,,many cats,(カンマ149個+cats,) 猫が出る
,,,,~,,,,many cats,(カンマ150個+cats,) 猫が出る
,,,,~,,,,many cats,(カンマ151個+cats,) 猫が出ない

>>699
「即位する」「即位した」でもトークン使用量が違うんですか!?
奥が深いなぁ……


とりあえず単語1トークン、カンマ1トークンを基本の目安として考えてみます!
その目安で簡易的な「プロンプト適用上限を超えています」とか表示されたら便利だなぁ
0708名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:03:36.54ID:M0HRyyB5
>>681
>>682
VRAM80Gをクラスタでwwwww

テクスチャ用途で2048夢見てたが、ムリポだな…
なんとか512か1024をアップスケールして2048にするしかねーわ
0709名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:04:31.04ID:lj5/NLyY
例えばこれは12トークンになるっぽい。
aとかtheとか意味があるのかないのか。単語だけ切り出して意味ない気がするけど、文脈を見て関係あるのかな

a girl on the beach, white , swiming

'<|startoftext|>', 'a</w>', 'girl</w>', 'on</w>', 'the</w>', 'beach</w>', ',</w>', 'white</w>', ',</w>', 'swim', 'ing</w>', '<|endoftext|>',

a
girl
on
the
beach
,
white
,
swim
ing



●webui.py
info = model.cond_stage_model.tokenizer([prompt], truncation=True, max_length=max_length, return_overflowing_tokens=True, padding="max_length", return_tensors="pt")
ovf = info['overflowing_tokens'][0]
overflowing_count = ovf.shape[0]
+ iid = info['input_ids'][0]
+ vocab = {v: k for k, v in tokenizer.get_vocab().items()}
+ t = [vocab.get(int(x), "") for x in iid]
+ print(t)

if overflowing_count == 0:
return
0710名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:07:02.21ID:lj5/NLyY
即位する 11
'<|startoftext|>', 'a', '?', '3', 'a?', '?', 'a?', '?', 'a?', '?</w>', '<|endoftext|>'

即位した 11
['<|startoftext|>', 'a', '?', '3', 'a?', '?', 'a?', '?', 'a?', '?</w>', '<|endoftext|>'
0711名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:18:13.04ID:PaLIc/uC
>>709
文章におけるトークン使用量の計算難しそうですね…
「swim」と「ing」を分けて計算されるんですか…
現在進行swiming分解済み単語とカンマだけなら10トークンぽいのに、12トークン…

「hayao miyazaki」等の人物名も2トークン扱いかな…
「hayao-miyazaki」でも2トークンかな…
0712名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:24:36.74ID:zmiqUmaN
>>707
なかなか興味深いですね
それ見て思ったのはカンマを二個並べると、トークン=意味としてのカンマと、純粋な区切りとしてのカンマを交互に認識していって
約150個のカンマが、AI的には70数個のトークン(中身はカンマ)として認識されて最後に77個目に猫をねじ込めるかどうかという挙動になってるように思えます。ただの仮説ですが
0713名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:26:29.55ID:1MaKtggW
そもそも人間が文章を見て何トークンか数えるのは無理だと思う
ましてUnicodeなんか出てきたら>>710みたいに文字ですらない単位で分けられちゃうし
0714名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:28:07.17ID:sBwVz76V
>>711
>「swim」と「ing」を分けて計算

>>699にあるURLの
>例えば「国王が即位する」という文をトークンに分けると、「国王/が/即位/する」という分け方になり、4トークン
>一方「国王が即位した」という文の場合、「即位した」で1トークンであるため、「国王/が/即位した」の3トークン

に近い挙動だね
0715名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:31:56.22ID:lj5/NLyY
>>711
swim と ingは、2トークなんだけど、</w>はingにだけついていて、1ワードだという認識はありそう

じゃあ</w>の単位で認識するのか?というと「可愛い巨乳女」は
'<|startoftext|>', 'a?', ' ̄', 'a', '?', '?', 'a??', 'a', '・', '¨', 'a1', '3', 'a\', '3</w>', '<|endoftext|>'

最後だけ</w>がついているけど、ちゃんと可愛い、巨乳、女、が生成される


>>668の冒頭だけ取り出すとこう
Watercolor painting in style of krenz cushart ilya kuvshinov kyoani
['<|startoftext|>', 'watercolor</w>', 'painting</w>', 'in</w>', 'style</w>', 'of</w>', 'k', 'ren', 'z</w>', 'cush', 'art</w>', 'ilya</w>', 'ku', 'v', 'shino', 'v</w>', 'kyo', 'ani</w>', '<|endoftext|>'

Watercolorpaintinginstyleofkrenzcushartilyakuvshinovkyoani
'<|startoftext|>', 'water', 'color', 'painting', 'inst', 'yle', 'of', 'k', 'ren', 'z', 'cush', 'art', 'ily', 'aku', 'v', 'shino', 'v', 'kyo', 'ani</w>', '<|endoftext|>'

こっちは,paintingが1つ
swimingは現在進行系の形容詞、paintingはく名詞として解釈されているのか1トークンになってる?
0716名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:49:20.46ID:1MaKtggW
形容詞とか名詞みたいな人間にとってどうかはトークンには関係ない
まして日本語だったら「可愛い巨乳女」は「可愛い巨乳å\³」みたいな意味不明な文字に見えてるはず
(もっと言うと「a¯aaa·¨a13a\3」でそれがトークンに分けられてる)
人間には分からんとしか言えんから理解するのは無理
0717名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:52:51.98ID:zmiqUmaN
何て言うか、厳密に数える方法を探索するというより
無駄にトークン数を浪費してしまう典型的パターンを突き止めて、共有しとく意義はあると思う
0718名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:53:53.32ID:P4svKH72
>>716
あなたは理解できてないんでしょうけどCLIPは理解してますね
0719名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 03:00:34.41ID:1MaKtggW
>>718
実際それは割とマジで(正確にはCLIPじゃないけど)AIは「a¯aaa·¨a13a\3」っていう文字列と可愛い巨乳女の画像を結びつけて学習してるから「可愛い巨乳女」って入れたら可愛い巨乳女が出てくる
0720名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 03:03:47.49ID:P4svKH72
可愛い巨乳女、は人間は理解できるし、CLIPも理解している
>>716は全く意味不明
0722名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 03:12:26.51ID:CkMkrgMz
生成における文章の力は強烈だけどトークンの計算が面倒そうだな
単語だけなら37,38個認識してもらえるぽいこと知れて良かった
0723名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 03:23:25.64ID:zmiqUmaN
単語数、トークン数で思うのはさ、よくある強力呪文の例文に
in the skyってよく入ってるけど、AIが冠詞theを有意に活用してるのかはまあまあ疑わしいので(人間がtheを入れることで気持ちよくなってるだけ説)
theと省けば文末の単語を一個余分に認識させられる可能性があるみたいな、そういうハックは解き明かされてほしい
もう寝るので他力本願ですいません
0724名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 04:05:54.47ID:Pft0DBuS
今日の学びはbronde short hairを入れると髪型サンプル画像のせいか構図のほうも首から上だけのパターンに引っ張られやすいということ…
0725名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 04:12:50.68ID:aku20RdR
>>702
わからないので小学生にもわかるように教えて。
生成した画像は作成者自身が権利を持つのでアダルト作品にも使えるってこと?
0726名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 04:26:49.29ID:1MSCQb34
>>725
間違ってるよ

AIが生成した画像に著作権は認められないので
「作成者自身が権利を持つ」のではなく
誰も権利を持たない誰でも使っていいフリー素材になる

もちろんAIの画像をさらに手作業で加工すれば
自分の権利を主張できる

またStable Diffusionのライセンスでは
「人に危害を加えたり、倫理的に問題があったり、
誤った情報を広めたりするために使うことは認められていない」
具体的に何がダメなのかは自己責任で考えてくれ
0727名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 04:30:00.81ID:QuNPQemV
欧米人じゃなくて日本人が欲しいって人は"hanako"とか入れてみて
0728名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 05:02:57.95ID:YyqL61iy
肖像権と著作権勘違いしてるのが講釈してるな
そして最後は自己責任とか。最初から自己責任でいいじゃん草生えるわ
0729名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 05:44:38.26ID:YyqL61iy
↑呪文唱えた人とAIと演算リソースを提供した人が全権利を放棄(明記)した場合はフリーになるけどな
0730名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 06:28:55.83ID:1MSCQb34
>>729
「全権利」って具体的に、何法の何権の話をしているの?
少なくとも著作権は誰も持ってないから著作権以外だよね

まさか法律をよくわかってない人がとりあえず「権利」
という言葉を使ってみただけで
それが何権かは自分にも分からないわけじゃないよね
0731名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 06:52:35.39ID:ldRK+y0p
「お前の言うことは間違ってる、不十分だ」ではなく、端的に「これはこうです」って言う方がいいね
著作権以外にも、意匠権、商標権とか、知的財産権はある

私自身はあまり興味はないので調べる気はしないけど

権利で思い出したけど、StableDiffusionの生成した画像は、これはAI生成画像ですって見えない電子透かしが入ってる
0732名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 07:09:41.58ID:VpEyRdfH
背景はフリー素材に近いものだから漫画に使うのは大丈夫でしょ
実在人物のエロ画とかはやめといたほうがいい
0733名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 07:13:29.30ID:+1zbSHkB
>>731
> 権利で思い出したけど、StableDiffusionの生成した画像は、これはAI生成画像ですって見えない電子透かしが入ってる
マジ?
0734名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 07:19:16.02ID:kIetuXjV
>>733
公式にちゃんと書いてるね
an invisible watermarking of the outputs, to help viewers identify the images as machine-generated.
機械生成画像であることを識別できる、目に見えない電子透かしが入っています

画像の色調補正とか、上から何かを追加で書き込んだりしても残る
といっても激しく加工すると消えるけど

実際的にこれで何か困るかって言うと多分困らない。自分で描きましたドヤァ、の人の嘘がバレるぐらいかなw
0738名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 08:27:24.74ID:VSjN8Npn
AI生成の画像に著作権がないは間違い
著作権がない画像が生成されればその画像には著作権はないが著作権がある画像が生成されればユーザーがその著作権を認識した時点で著作権侵害となる
例えば「鬼滅の刃の画像」とプロンプトに入力し鬼滅の刃の著作権がある画像が生成されればその時点で侵害
鬼滅の刃を知らないユーザーが「大ヒット漫画の画像」と入力し鬼滅の刃の著作権のある画像が生成され公開し、権利者から指摘されれば指摘された時点で侵害
0739名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 08:30:09.63ID:fvXQzTIT
AI生成画像が、偶然既存の著作権がある画像と同じものを生成した場合、「著作権侵害にならない」
両方に著作権がある状態になる、と弁護士が言ってた
0740名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 08:32:12.00ID:VpEyRdfH
そんなこと言ってたら漫画のファンアートが一切描けなくなる
類似したキャラで大々的に商品展開しなきゃ問題にはならないと思うよ
0741名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 08:32:58.60ID:VSjN8Npn
「AI画像に著作権がない」というのはAI開発者の著作権はないと言う意味
フォトショップでイラストを描いてもadobe社に著作権が発生しないのと同じ
0743名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 08:38:58.73ID:VSjN8Npn
>>739
画像を学習させたAIで学習元に似た画像が生成された場合は偶然とは言えない
既に完了した行為については違法性はないが権利元が「あなたが使用した画像生成AIはこう言う仕組みで我々の著作権を侵害しています」と告知されれば告知された時点から違法となる
ツイッターなどにあげた画像は閲覧が可能な期間ずっと公衆送信権の対象となるので告知を受けた時点で速やかに削除しなければならない
既に頒布済みの紙の同人誌などは回収しなくてよい
0745名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 08:50:19.91ID:IYnowAka
>>723
画像とその画像に対しての説明文の対応を学習していると、
説明文によく使われる言い回しが効果的とか噂だけれどもトークンに分解されるなら関係無いのかな
0746名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 08:50:58.49ID:9sIRYw75
法律上の著作権の認定は極めて厳しく意図的な丸コピーの継続反復でもないと殆ど認められないから
実際には民間による私刑が横行してて、米国では基本当事者間の訴訟で解決してくれというスタンスでこれを公認
このため法律ではなくyoutubeなどのプラットフォーマーや消費者のお気持ちで権利侵害かどうかは決まってしまう
現状は企業などの強者が違反を申し立てればプラットフォーマーは無条件に公開停止/発禁処分を取っている。法律は無関係
0747名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 08:52:31.96ID:VSjN8Npn
ただSDはアニメ漫画関係はかなり気を使ってるようなので気にする必要はないだろう
「鬼滅の刃の画像」と入れても中華製のパチモンみたいなのが出てくる
これはこれでなんか問題ありそうな気もするが
0749名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 09:24:29.13ID:j/CvemEf
>>745
トークンに分解されていても、それぞれのトークンが独立して(重みに応じて)作用しているわけではないですね

例えば、girl having glass と gil wearing glassはこうなる
https://i.imgur.com/aDQBOGE.jpg
https://i.imgur.com/qWXjSac.jpg

また、girl having glass, wearing red dress だとこうなる
https://i.imgur.com/v0iDH2L.png

つまり、単純にhave, wearがあるからそれっぽく配置しているわけではなく、英語の分法に沿ってどこにかかっているトークンかを理解していることになる

真面目に勉強するか・・・
0750名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 10:13:09.98ID:9sIRYw75
AIがどんどん進歩していけば未来ではプロンプトの工夫なんてのもなくなって
プロンプト検索サイトで好みの画像探したらseedをちょっと変えたり
単語ちょっと追加してだけでリリースってなると思う
0751名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 10:16:07.70ID:A/NVkY1w
電子透かしはinvisible-watermarkというライブラリを使ってるみたいだ
hlky版やbasujindal版はこの機能が削除されている
0752名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 10:21:00.61ID:j/CvemEf
basujindal >>664みたいに--turboで速くなってこっちがいいのか、と思ったら
GUItardも4GBで動く--optimizedオプションがついてた

動き速いなあ
0753名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 10:36:59.17ID:CkMkrgMz
4GBでもサクサク動くimg2imgのGUI作ってくれたら助かるが流石にまだ難しいかな
0755名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 11:00:44.83ID:j/CvemEf
例えば24GBのGPUが2枚あるとして、512x512の画像生成を2つ同時に走らせるのはできるはずだけど、
合計48GBとして使って1920x1080の画像を生成できると書いてる人はいない気がする

できるのかな?
0757名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 11:37:25.97ID:NJZkMsOM
>>755
デモンストレーションのはGPU大量に使ってやっているから出来るんじゃないかなあ
デモ用のチューンで配布版は出来ないかもしれないけど
0758名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 11:47:19.26ID:GaCie3ZH
nvidia GPUで24GBより上ってなると、A6000の48GB 70万円弱になっちゃうから
Google Colab Pro+ の51GBメモリ(月額5243円)はめっちゃお得だね

>>756
なるほど
よく分かってないけど、これ4倍、8倍・・・みたいに繰り返し使えたりするのかな?
0759名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 12:09:11.84ID:fr/le0b0
>>750
つか自動で勝手に作ってくれる世界になると思うよ
今でさえ各個人の蓄積されたデータからパーソナライズ化された広告や様々なサービスのオススメが勝手に自動で出てくるように
メタバースとかだとか将来確実にこのサイトみたいな世界が実現するのは明らかに思える
https://ascii.jp/elem/000/004/102/4102731/
0760名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 12:18:26.61ID:VpEyRdfH
サイズでかいから上げないけど風景などはRealESRGANで結構いい感じになるなぁ
壁紙にしてもいいかな、って感じ 肖像画などはものによるね
0761名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 12:23:51.37ID:T3xBxkwV
>>758
512x512を入れてみたら2048x2048が出てきた(4倍の間違いだった)
再度大きいのを入れても2048止まりなので上限はあるみたい

ちなみに最新は長いプロンプトで生成されない不具合がありそうだったので少し古いバージョンまで落とした
https://github.com/hlky/stable-diffusion/tree/554bd068e6f2f6bc55449a67fe017ddd77090f28
0762名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 12:32:27.33ID:GaCie3ZH
>>761
ありがと
試してみようかな
webuiまたUI結構改善されてんのね

アップグレードどうすりゃいいんだw
conda env remove -n ldo して最初からやってほうがいいかな
0764名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 13:31:03.08ID:xrzp3NUk
webuiでimg2img使うとエラーでる
TypeError: process_images() missing 2 required positional arguments: 'gobig_strength' and 'gobig_steps'

同じ人いますか?
0765名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 13:40:25.53ID:T3xBxkwV
>>761自己レス
>長いプロンプトで生成されない不具合
出力時の保存パスがちょっと長くなる修正が入ったようで、そこで自分の環境ではWindowsのパスの長さの限界超えたらしかった
C:\直下に移動して無事最新でも動くようになった

>>764
つい数時間前にそのあたりのコード入れたり消したりしてたからバージョン変えれば大丈夫そう
0766名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 13:41:53.27ID:Qji7WGLS
webuiといってもどのバージョンか分からない
とりあえず、このwebuiでimg2imgだと、サンプリングメソッド=DDIMは動くけどそれ以外はエラーになるね。
https://github.com/hlky/stable-diffusion

エラー内容は違うから別のフォークだと思うけど

File "scripts/webui.py", line 1112, in sample
samples_ddim, _ = K.sampling.__dict__[f'sample_{sampler.get_sampler_name()}'](model_wrap_cfg, xi, sigma_sched, extra_args={'cond': conditioning, 'uncond': unconditional_conditioning, 'cond_scale': cfg_scale}, disable=False)
ValueError: not enough values to unpack (expected 2, got 1)
0768名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 13:59:35.34ID:bWnmVXgB
Nendoroid構文色々試してるけどメチャクチャ強力だなこれ
プロンプトの前半に入れた瞬間にデカ顔2等身写真風になる
0769名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 14:24:57.38ID:mklj/Fkv
colabからのセットアップですらエラーになって
自分の知識の無さにゲンナリする
0770名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 14:27:18.09ID:mklj/Fkv
https://i.imgur.com/ogzfy8n.jpg

引数が足りてないとかそんなんかなあ。分からん
0771名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 15:04:03.44ID:9sIRYw75
既に各種ペイントツールのプラグイン対応が進んでいるし
背景や小物はもうAI使って描いていくのが常識になるんだろうね
0773名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 16:54:42.22ID:+1zbSHkB
WebUIの

「sort samples by prompt」は使わないことにした
呪文をいろいろ試してるときにフォルダを分けられると逆に手間が増える
生成時にすぐいいの選別するし、次点みたいなのは後から自分でフォルダ分けた方がわかりやすい

「write sample info files」もexplorerで縮小画像一覧が市松模様になって見にくくなる
cfg値やらはだいたい自分ルールがあるし、呪文は別にテキストで残してあるので
seedは連番ファイル名のうち、一番小さい数字のやつってわかるし

つか生成ファイル名の連番ルール間違ってるね、seedが1234567890の時
-0001-1234567890.png
-0002-1234567890.png
-0003-1234567890.png
にすべきなのに
-0001-1234567890.png
-0001-1234567891.png
-0001-1234567892.png
ってなってる、カウンターに用意した0001が無意味
0774名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 17:07:24.22ID:It+E3STB
これからも色んなAIがでるみたいだし、
今のうちにハイスペPCを買っといたほうがいいのかな……
20万で足りる?
0775名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 17:08:27.05ID:QuNPQemV
そういう文句はここじゃなくてissueまでって書いてあるぞ
0776名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 17:08:43.97ID:Qji7WGLS
シード指定で複数生成した場合、シードを1つずつ増やして生成されるんだから合ってると思う
0777名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 17:10:16.13ID:+1zbSHkB
>>776
いや無指定だし、infoのファイルの中見たら全部同じseedになってたよ
pngファイルだけseedが増えて行ってるへんちくりんな状態だった
0778名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 17:11:38.69ID:QuNPQemV
確かにyamlファイルのseedは間違ってる
でもその文句はここで言っても仕方がない
0779名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 17:12:08.11ID:Qji7WGLS
同じシードなら同じ画像になる
無指定ならランダムなので連番でもない
0781名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 17:23:12.93ID:+1zbSHkB
a dogを「無指定」+yaml生成で3つつくると
-0001-3671057218_a_dog.png ---- yaml内seed: 3671057218
-0001-3671057219_a_dog.png ---- yaml内seed: 3671057218
-0001-3671057220_a_dog.png ---- yaml内seed: 3671057218
ファイル名のseedが合ってて、yaml内がおかしい

>>779
無指定はランダム起点の連番、よってランダムではない
0782名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 17:25:28.70ID:Qji7WGLS
どちらにせよ連番画像でシードが同じはずと考えるのはおかしい
0784名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 17:30:01.28ID:+1zbSHkB
MJの記憶が焼き付いてて
同一seedの--s無指定(2500)での変化が頭から離れなかったのだ(言い訳)
0787名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 17:54:31.93ID:Zg4EoMEl
マイニングが落ち着いて
https://akiba-pc.watch.impress.co.jp/docs/wakiba/find/1434896.html
安くなったんじゃなく、バブル価格が元に戻ったくらいのところなんだっけ
4000番で在庫がさらに値下がりして安価に手に入らないかなぁ

GPUの話題はスレ違いって言われそうだけど
ローカルやるには切実すぎる問題だから、技術交換の範疇でいいよね?
0788名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 17:56:33.37ID:8FnHIO5z
現行のAIってGPUに仕事ぶん投げまくるのが基本だから徐々に需要が高まると思うな
短期的にはわからん
0789名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 17:59:43.96ID:FPRn3NgC
>>774
3060(12GB)のPCなら15万円ちょっとで買える
けど、その場合、無料のGoogle Colabと同じ性能でメモリが半分なんだよね

今すぐ買いたい、何かやりたいなら買えばいいと思うけど
この後、どのぐらいの必要スペックのどんなソフトが出てくるかわからないのがね

個人で普通に買えるもの(人によるけど)としては3090Tiで50万円ぐらいのやつかな
10月〜12月頃発売予定の4090も同じぐらいの価格帯で性能が倍になるらしいからこれも悩ましい

その上ってなるとA6000(48GB)の70万円(GPUのみ)
この上はもう1000万円を超える

現時点では50万円ぐらい出して24GBの3090か、予算内の11GB以上の奴か、って感じかな
0790名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 18:02:40.51ID:Zg4EoMEl
マイニング業者が転向してColabもどきみたいなの始めたら面白そう、月額300円で使い放題みたいな
それでも24時間ぶん回し続ける採掘よりは儲からないか
0792名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 18:06:13.13ID:ZThPhglJ
これベータの生成上限(200枚?)いくと
画面右下にyouなんとかで会員情報確認しろって英語で出てくる?
0793名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 18:13:48.91ID:X7jvA0kV
クアドロじゃなくてGTXで買うなら4000番待ちのほうが賢い気がする


ゲーム目的なら3070くらいがあれば十分だしあとは4000がこなれたころに買い換えっててもあるけど
元々求めているところが一般的には最上位でもまだ足りんって感じだし
拘りがないならGoogleに月6000円払ったほうが安上がりだと思うわ
0794名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 18:23:54.68ID:Zg4EoMEl
3080価格推移
https://i.imgur.com/CcqEg3g.png
バブル崩壊と分かってても衝撃的
NVIDIAは4000番出す前に市場の3000系があまりに下落したら在庫回収しちゃいそう
なお、採掘業者産の中古はヘタってるから、保証期間残っててもやめた方がいいって話も

>>792
DreamStudioの話かな?
無料枚数の4割くらい使ったところで放置してるわ、ちょっと肌増えたらすぐ画像ぼかしてくるし
ここでその状態知ってる人いるのかなぁ、むしろあなたが先駆者になって教えてほしい

>>793
googleさんはエッチ画像作ってないかスーツ着たお兄さんたちが眼鏡を光らせて見てそうだし
拘ってないけど、ドキドキするよね
0795名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 18:28:41.28ID:FQRqw5xU
n_iter 枚出した時に
一枚目以降はstepが変わるとシードも変わってるのかな
1枚目しか収束していかないから良い絵が出ても居なくなって困る
0796名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 18:49:31.08ID:iwlcp4gq
全身の絵が欲しい場合full bodyでいいんだろうか
boobs入れると引っ張られてバストアップばっかになる気がする
0799名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 19:07:32.68ID:Zg4EoMEl
MJはfull bodyに加えて9:16とかにしつつ
knee socksとか入れたら描かなきゃってなるのか全身になりやすかった
long legsとか入れたらどうかな

SDは正方形でもMJよりは全身出してくれることが多いけど
ガチャするより自分で落書きがにimg2imgで呪文被せるのが一番早い気がする
絵はmspaintレベルのこんなんでいいので
https://assets.st-note.com/img/1661433702833-NJIm9AzgDM.jpg
0800名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 19:14:06.99ID:bWnmVXgB
足に言及すると足を描こうとしてくれるから全身画像になりやすいのは確か
なんだったらfull bodyだって書いてんのにバストショットじゃねえかってなるのより信頼性高い
0801名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 19:27:24.64ID:9sIRYw75
img2imgを使うとこの位の画像なら数分で作れてしまうのが恐ろしい
絵が描ける人ならこれを下敷きに修正する作業なんてあっという間に終わるぞ
0805名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 19:42:49.31ID:jvpUgcGf
>>796
512x256みたいに縦長にしてまず全身像であることを説明してから「胸は小さめ」「足は裸足」とか言及してくと成功しやすいと思う。
0807名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 19:55:16.63ID:jvpUgcGf
「脇の下を見せる」にしても「両手は組んで頭の後ろに」って説明文入れたほうが正確に描写してくれる。
0809名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:03:23.92ID:ytrXo6jw
導入で手こずって3日経つけどまだStableDiffusion導入できません
Windows11のWSLで1から環境構築して使えるようにしている記事とかありせんか?
ある記事ではCUDA入れろとか、ある記事ではCUDAの記述なかったりとかでどれも1から導入しても何かが足りなくて必ず躓いてしまうんです

現状はWSLインストールコマンドでインストールされたubuntuにアナコンダとCUDAを入れてみたんですがStableDiffsionのtext2img描画コマンド?でGPUがCUDA対応してないとかで弾かれて躓いてます(Windows側にNvidiaドライバーは入ってます)
たぶん導入やそれ以前の問題でこうなってるんじゃないかなと思い、1から手順通りに従って完全に動作するマニュアルみたいなものが欲しいんですが
そんな都合のいいものはないですかね?

Linux初心者です
0811名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:07:02.72ID:QuNPQemV
Gregテンプレでも初音ミクって入れるとこんなに日本人っぽい絵になるんだよね
https://i.imgur.com/6WR4Iuk.png

やっぱりバッチの一枚目が一番プロンプトを意識した絵になる確率が高い気がする
0812名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:11:50.55ID:ytrXo6jw
>>810
なんの知識もない状態なので……
WSL環境ではUbuntu上(中?)にCUDAインストールしなくてもいいんでしょうか?
Windows側のシステム環境変数にubuntuパスのCUDAがどうも記述されてなかったので有効になってないのかなと
何がどうなってるのか本当に分かってないです
0813名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:12:43.38ID:9sIRYw75
エロを出したいときに直接nakedやnudeと指定すると引きずられて一気に絵が崩れる
裸にしたいときは裸でいそうなシチュエーションを間接的に指定したほうがいいな
0816名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:15:22.27ID:bWnmVXgB
どのガイドを見ればWSLを入れだすことになるんだろうか
イキって独自導入記事書いてる変な人のヤツでも見たのか?
0817名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:16:24.58ID:QuNPQemV
>>813
nudist naturalist pornstarあたり…
0818名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:17:30.56ID:ytrXo6jw
>>815
Windows11環境だとコマンド一つで仮想linux環境が出来て簡単という話を見たからです
それとWindows標準の機能というのが個人的に安心できる点だったのもあります

皆さんはどういう環境で動かされてるんですか?
0819名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:17:57.23ID:QuNPQemV
WSLはオーバーヘッドあるからやめたほうがいいぞ
どう考えてもやる必要がない
0822名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:20:13.45ID:sBwVz76V
人体が微妙に崩れてるのは明らかなんだから
上から3Dモデルに同じようなポーズ取らせてから手直しするなりすりゃいいんじゃない

>>813
nudeでも、上手いというか写実的なイラストを描く人、具体的にはgreg師匠あたりに描かせると
実はこっそり描いてませんでした?ってくらい整ってる率が高い
なので崩壊要因が他のPromptなパターンもあるからセパレータでいろいろ試したほうがいいね
0824名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:25:28.09ID:Pft0DBuS
初期?のAIの出した崩れた女体でしか性的興奮を覚えなくなったなんとかフィリアみたいな人もどこかに生まれているかもしれない…
0825名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:28:18.65ID:uvkTBquu
>>818
今(2022/8/28 20:00時点)の主流はこれかな

前提:モデル(sd-v1-4.ckpt)はダウンロード済み

https://github.com/hlky/stable-diffusion/wiki/Installation

1 git clone https://github.com/hlky/stable-diffusion.git
2 モデルをmodels\ldm\stable-diffusion-v1\ にmodel.ckpとリネームしておく
3 minicondaをインストールする
 https://repo.anaconda.com/miniconda/Miniconda3-latest-Windows-x86_64.exe
4 webui.cmd を実行する
5 Launch Waifu Diffusion で起動する → http://localhost:7860/ とかURLがでてくるのでブラウザでそのURLを開く

●以下はオプション
1. Download the GFPGAN pre-trained model
https://github.com/TencentARC/GFPGAN/releases/download/v1.3.0/GFPGANv1.3.pth
place it in /src/gfpgan/experiments/pretrained_models/

2. Download RealESRGAN_x4plus.pth and RealESRGAN_x4plus_anime_6B.pth
https://github.com/xinntao/Real-ESRGAN/releases/download/v0.1.0/RealESRGAN_x4plus.pth
https://github.com/xinntao/Real-ESRGAN/releases/download/v0.2.2.4/RealESRGAN_x4plus_anime_6B.pth
place them in /src/realesrgan/experiments/pretrained_models
0826名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:28:19.74ID:FQRqw5xU
グラビア的なセクシーポーズにしたかったら pin up girl とかいいよ
イラスト多めぽいから色がケバくなりがちだけども
on the bed とか on the couch みたいに状況設定すると
それなりなポーズをとってくれる
0828名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:31:47.55ID:uvkTBquu
>>820 のGUItardの手順は昨日までは良かったけど、今時点では古いと思う。
・webuiを別途ダウンロードする手順だけどマージされてる(最新ではないけど)
・webui.cmdは設定だけで起動しなくなってる。 Launch Waifu Diffusion で起動
・ldoのリネームもwebui.cmdでいい感じにしてくれるので不要になっている

勘違い、間違いがあったらごめん
0829名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:34:44.50ID:IhsqNdNl
今はローカル用のpc無くてStableDiffusionをGoogleColabで利用してるんだけど、近いうちにStableDiffusionが規制される可能性ってありますかね?

Colabで耐えててpcを揃えた頃にローカル版含めてStableDiffusionはインストール出来ませんになってたらって思うと不安しかない…
それともオープンソースだからそんな心配はないのですかね…?
0830名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:35:07.40ID:u/IBBuD1
エロい絵の加筆みたいなことをやってもらいたかったんだが、まだまだ現代の技術では無理だったようですね・・・
絵師が上半身しか描いてないから下半身もAIに描いてもらおうって思っただけなのに・・・
肝心な部分が文字で見えなくなってるから文字だけでも消してくれないかなとかね・・・
0833名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:37:52.88ID:sBwVz76V
>>829
規制解除版がgithubから消される可能性はあるけど、解除方法なんかはネットで語り継がれるんじゃないか
てか今使えなくてもとりあえずファイル一式落としておけばいいよ
0834名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:43:20.99ID:3C/JWEjb
粛々とAIに描かせた美少女画像を貼ってだべれる匿名掲示板的な居場所が欲しいんだがどこか無いものか
TwitterはBANやらなんやらでこういうのは向いてない
ここはなんか技術の話という感じで違いそうだが他に流速のありそうな板も見当たらず
みんなどこに居るんだ
0835名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:44:03.87ID:QuNPQemV
4chanの/h/とかに行きなされ
0836名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:44:52.53ID:IhsqNdNl
>>0833
あれ、StableDiffusionってコードを打ち込んでネットからインストールしてく手順でローカルに入れるものだと思ってました。

ファイル一式を落とせるとこってありましたか?
0837名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:54:44.42ID:pqJVfBkN
>>829
現状、deep fakeの実行がColabのBAN対象になってるから
少なくとも制限解除版が実行不可になる可能性は十分あり得ると思う
0839名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:56:12.06ID:3C/JWEjb
>>835
できれば日本語で…でもありがとう
久々に楽しいお祭り騒ぎだと思ったが時代だなあ
国内の匿名インターネット空間が壊滅していることに気づいてしまった
0840名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:57:50.42ID:QuNPQemV
>>839
ふたばはどう?
0841名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 20:57:53.64ID:QKH/kr3+
>>832
そうですね。あくまで今時点はあってないってことで


>>836
一旦インストールしておけばオフラインで使えるよ

zipで固めて他の環境にも持っていける
minicondaのインストールは必要だけど
0844名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 21:00:43.34ID:QKH/kr3+
>>834
画像の公開はDiscordやTwitterが多いんじゃないかな。確かに匿名の場所は活発じゃないかも
ここも作品・プロンプトスレと分離してもいいかもね
0847名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 21:12:52.10ID:IhsqNdNl
>>838
モデルの落とし方は分かりましたがリポジトリがよく分かりません…。
そのリポジトリは二番目のurlのどこにありますか?
プログラム用語情弱で申し訳ないです…
0849名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 21:15:31.47ID:ubryl2ee
>>834
日本版discodeつくってみて
0850名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 21:15:44.37ID:QKH/kr3+
>>847
>>825の1番目の手順

git入ってなければgitもインストールする必要がある
(とりあえずzipダウンロードもできるけど後々gitはインストールしておいた方がいい)
0851名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 21:16:15.65ID:zmiqUmaN
>>831
食べ合わせが悪いものを混ぜると作画が大崩壊するね

俺もいい感じのリアルタッチ人物画を出せる呪文にたどり着いたけど
もう少しおっとりした目にしたいなって思って橋本環奈先生を混ぜたらその瞬間世界が崩壊したw
0852名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 21:17:30.35ID:BkACrwDk
拡散モデルってAVのモザイク消しを超大規模にやるみたいなもんって思っていい?
0857名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 21:57:16.35ID:ubryl2ee
AI画像にやっきになっている人の男女比が知りたい
あとSD発表されてからのgoogle colaboの使用率の変化
0858名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 22:13:36.12ID:1Gnup+rr
けっこう公式が中身の解説を出してくれているのが遊びがいあるなこれ
Pythonの勉強兼ねて遊んでるけど変に盛り上がると大手が買収飼い殺しが多いからマイナー文化でいて欲しいわ
0860名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 22:18:23.42ID:i7ddHUUW
これから100社単位で提携して各国語対応その他モデル構築する予定らしい
基盤モデルなんてこれからのど真ん中の技術だから、SDが主流かほかが巻き返すか知らないけどマイナーな訳はないと思う
0861名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 22:19:52.72ID:i7ddHUUW
Dalle、技術的には同じようなもんなんだろうけど、SDはオープンソースでみんなUI改造したりローカルで動かせるから勢いがいいよね
0862名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 22:21:56.59ID:60RqM723
初音ミク抜きミクさん試してみたけど、何回やってもくそでかツインテ描いてくれませんわ
つーかどっとうpって貼れないのね 2862938
0863名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 22:23:10.65ID:bWnmVXgB
DALL-Eはプロンプトに強制的に黒人を出現させるノイズが混入されたりするので使い物にならない
0864名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 22:23:40.93ID:QuNPQemV
大きめ画像はどっとうpをarchive.todayに通せば貼れる
0867名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 22:41:27.89ID:CxPKhoNE
img2img使えそうなcolab漁ってるけど全部setupが上手くいかねぇ
多分俺のやり方が悪いんだろうけど
なんかウェブサイト上とかで簡単に出来るの待つしかねーか
0868名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 23:07:06.62ID:7FoCDxFr
>>862
> つーかどっとうpって貼れないのね 2862938
今時どっとうpて・・削除する予定がないのなら普通にimgur使いなはれ
0869名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 23:15:57.08ID:uSo+PJF0
Midjourneyで女体がサランラップにぐるぐる巻きにされてテカテカしてる画像ばっかり生成してる人見つけちゃった……
あれも性癖なのだろうか
0871名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 23:28:39.34ID:i7ddHUUW
>>865
単調な模様ならプロシージャルテクスチャで作ったほうがいい気がする
文字生成とかもできないし、その辺使い分けはどうしてもいると思う
0875名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 23:40:35.25ID:6+18B8jR
google colabで「GPU使えませんよ」が解除されるのは時間経過ですか? それとも時刻到達でしょうか
0876名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 23:48:10.16ID:CkMkrgMz
クソ遅グラボだしほぼ毎日のアップデートに対応するのもしんどいからローカル環境は見送ってるけど
今は色んな人が改造版を作ってるぽくて、どれがどう優れてるとか一番良いとか全然わからんなぁ…
0877名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 23:48:50.75ID:i7ddHUUW
>>874
追加学習は数枚~でもいけるらしい。Google Colabで3時間程度だとか。
※リンクが貼れないので検索ワード: Stable Diffusionをいらすとやでファインチューニングする

上の日本語のものはいらすとやを学習させてるけど、元ネタの方が自分のペットを学習させて登場させてるので
多分固有名詞を追加できそう
dreambooth.github.io/

試してないから多分こんな感じ?レベルのボンヤリ理解(間違ってるかも)
0879名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 00:02:30.43ID:S01XYd9t
test
0880名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 00:05:11.89ID:8pofGjN6
>>878
これは完成度高い
Greg Rutkowskiすごいなw

いくつかランダムシードでやってみたけどどれも綺麗に出力された。いい呪文だ
0881名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 00:11:34.64ID:adcon1OP
>>878
左上すげえ

先頭に主語入れるだけでそこそこの絵を出せるテンプレをひたすら回すだけになってしまった
もう自動でやってほしい
0883名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 00:58:48.57ID:W3qecD7T
脱がせるとみんな胸がでかいんだけど、小さくするワードってある?slenderとか入れてもバインバイン。
0886名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 01:06:32.58ID:TKZ5Ug6s
>>878
色々やって気が付いたんだけど、意外と短文の方が強いんだよね

呪文は長ければ長い方がいいです的な説明が導入マニュアルに書いてあった気がするんだけど
意外と混ざることで良い要素が打ち消し合う力が強い
0887名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 01:08:06.63ID:adcon1OP
長いと身体とかぐちゃぐちゃになる
0891名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 01:39:49.16ID:hJAn0cka
>>886
多分最初触ったときは自分が出したい画を端的に一文書いて終わりにする奴が多いだろうから
そういう奴へのメッセージなんじゃないかな
効きもしない言葉を数個並べてもそれこそどうしようもないものが生まれるだけだし

>>890
flat chestとでも入れたらどうよ
0893名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 01:51:11.88ID:XY/qzhrx
>>892
一個一個見ていったら三回ぐらい出てくる奴が何人かいて、よくわからんが笑ってしまった
0894名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 01:55:07.21ID:TKZ5Ug6s
>>891
確かに
経験不足の間は、AIに対する説明不足もしくは説明不備のミスが多いやろうしな

多少理解が進んでくると、説明呪文の過剰の害が分かってくると
0895名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 01:55:43.29ID:8pofGjN6
>>892
いいね
digital concept art of anime cute girl in summer dress, detailed eyes, gorgeous face, ((turquoise colored twintail)), smooth details, digital cg art by Greg Rutkowski
k_euler_a, cfg 10, steps 50, seed 721628136

4枚一組で、左端はオリジナル(同じのが3段ある) Original image on the left.

1段目 turquoise -> green -> red  色違い
2段目 twintail -> ponytail -> bun 髪型違い
3段目 summer -> cocktail -> maid 夏ドレス、カクテルドレス、メイドドレス
0896名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 03:35:24.59ID:KUnhJn5S
考えてみると、AIという箱に文字列を打ち込むと絵を出力し、逆に絵をAIという箱に打ち込むと文字列を出力する、というのは、人間の知性の本質を突いてるよな

つまり対象を個別の要素に分解して、それを文字列なりイメージなりで認識するという抽象化能力が人間の認識的知性の本質
絵や文章というのはその個別の要素の組み合わせだということ

統合失調症患者がデティールが奇妙に歪んだ絵を書くのは、彼らが認識的知性において重要な統語能力=抽象化能力を脳機能の障害によって失っているからだろう

また同様に「言葉のサラダ」と言われる全体の繋がりを欠いた意味不明な文字列を口走ったり、他人の思考が流れてくると糖質患者が訴えるのも、同様に抽象化能力に障害があって、適切な言語化やイメージ化ができないからだとおもう

AIに例えるならば、アルゴリズムに奇妙な歪みがあって、APIを通して物体を絵や文字に変換しようとしても、適切に変換できないのが糖質患者なのかもしれない

だらだらと書いたけど、つまり何がいいたいかというとAIすげえな、ということ
0897名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 04:51:18.14ID:3oD6d6E1
もしかしてと思って試したけど5本指の手できなすぎワロタ
苦手ってそういう事じゃないんだよAIちゃん
https://i.imgur.com/pltGnjj.jpg

close up of anime girl hand, ((Five fingers)), digital cg art by Greg Rutkowski
Steps: 20, Sampler: k_euler_a, CFG scale: 7.5, Seed: 1842527531
0901名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 06:33:51.32ID:8pofGjN6
あんまり分かってないけど、画像を学習する時に、例えばこれは

https://i.imgur.com/RZr0oGw.jpg
「白と黒のぶち猫が座ってこっちを見ている」で、「顔が一つ、目が2つ、前足が2本の猫」とはならず、「指が5本」とか効かないのではって気もする
0902名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 06:44:07.66ID:eVfmuvS0
そろそろ3DCG版出て欲しいな
予定とかあんのかな?
0903名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 06:49:18.46ID:z+sZQrGZ
条件わからないけど生ゴミとか生首?画像出力されてビビることある
0905名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 06:52:29.70ID:8pofGjN6
>>43の「今後」のところに書いてるレベルなので、具体的には描いてないけど、3Dも予定あり、ですね

それはそうと今Google Colab混雑でGPU接続できないわ。まいった
0906名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 06:56:30.09ID:vsksoONt
普段使わないと思ってた人達までgpu使い始めたらgoogle悲鳴あげそう
いきなり規約改定が入る事を覚悟してゲーミングPCの準備をしておこう
0907名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 06:56:56.50ID:8pofGjN6
GUItardというか、https://github.com/hlky/stable-diffusionと同等のノートブックが公開されてる

https://colab.research.google.com/drive/1cd35l21ewU0fwWEnPjY_th5YORmMfZCd

ノートブックのUIじゃなくて、WEBサーバーを立ち上げるので、ローカルと全く同じUIになる
*現在バグで、PROGRESSBARSにチェックを入れないと起動できない
*モデルは事前にダウンロードして自分のGoogleドライブに入れる前提

構築にかなり時間がかかるのが欠点だけど、使い勝手的にはこれが一番いいはず。構築も上から順に実行するだけでシンプル。

・・・のはずだけどGPU接続できないから確認できないw
0910名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 07:04:56.47ID:tcfKhZjr
3 animals って入れるとすごいキメラが出てくるぞ
普通にキモいので閲覧注意
0912名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 07:18:40.85ID:E2pAsSUt
ファインチューニングしたモデルは簡単に配布できるから
そのうち各作家や作品毎のモデルもアングラで配布されるようになるんだろうな
予想より進化の速度やばいわマジでパンドラの箱が開いた
0913名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 07:28:13.29ID:y65qW5Ek
>>875
>671に「12時間だっけ」とはあるが確証なし
0916名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 07:36:42.48ID:8pofGjN6
あんまり分かってないけどファインチューニングって、例えばだけど「tanaka mamimi」の画像を数枚追加学習させると、
waterpaint, tanaka mamimi みたいな生成ができる、「reiji matsumoto」を学習させると、authored by reiji matsumotoが
できるになる、みたいなことかな?

既に、hlkyにtextual inversionとしてコードある。これもわからないけど、学習自体はhttps://github.com/rinongal/textual_inversion でやって
他でやると書いててできたembedding.ptを hlky版で使えるようにするみたいな機能なのかな?
https://github.com/hlky/sd-enable-textual-inversion


後別の話でhlkyはDocker関連ファイルも8時間前に用意された。
hlky勢いすごい
0917名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 07:47:52.45ID:06X0KUe/
ぶっちゃけ全く触ってこなかった分野なのでこれから色々学習していかないとなんだけど、スクリプト言語はPythonを勉強すればいいのかな?

ネットで他人が書いてるノートをコピーして実行は出来ても、自分でこういうことを追加したい、と思ってもうまくいかなくて
0918名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 07:49:18.75ID:3oD6d6E1
>>916
大体そうっぽい
SDが学習できてない要素をピンポイントで補う自作モデル みたいな
ちょっとやったくらいじゃ要素の一部を学習する程度だから今すぐどうこうってもんでもないと思うけど
0919名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 07:51:04.37ID:8pofGjN6
Emadさんのツイート
100MBってモデル(ckpt)がってこと???? 使用メモリはどうなんだろう

---
@EMostaque
#StableDiffusionは最終的に100メガバイトになり、最適化が進むと信じています。
今週は楽しい発表があります??。
あと6日...

For what it’s worth I believe #StableDiffusion will eventually get down to 100 megabytes, loads of optimisation to come.
We have some fun announcements this week coming ??
Already amazing to see what everyone is creating, we are going to accelerate that.

6 days in…
0920名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 07:56:31.39ID:8pofGjN6
>>917
言語はPythonだね
「やりたいこと」がなにかで、追加で色々勉強しないとだめだったりすると思うけどまずはPythonはいる
0922名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 08:11:56.51ID:1ZR01qcj
>>916
新しい機能を取り入れるスピードが速いから
hlky版に参加する開発者も増えてるね
0925名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 08:24:34.59ID:E2pAsSUt
img2imgは少し複雑な構図や服装になるとAIが全然理解できなくて
滅茶苦茶な絵を出力してくるからまだまだ限界があるのは感じるな
0926名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 09:55:00.70ID:8ac36usK
これは久しぶりに伽藍とバザールの対比が炸裂したソリューションだな
象牙の塔で研究されてたものがOSSにされた途端ものすごい勢いで進化していく
0927名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 09:55:37.93ID:q6r8reZ9
>>905
3Dの予定あんのね
サンクス
0928名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 10:17:25.44ID:rT/h5pqx
https://zenn.dev/hidetoshi/articles/20220731_pytorch-m1-macbook-gpu
MacBook Pro M1 Max のディープラーニング性能
※StableDiffusionじゃないけど同じPytorchの性能

CPU: 訓練時間 2148秒 テスト時間 90秒
GPU(MPS) 訓練時間 286秒 テスト時間 45秒 → 訓練4.6倍、テスト時間2倍高速化

Geforce 1080Ti:
訓練時間 55秒 テスト時間 1.3秒 → M1 Maxより訓練5倍、テスト35倍高速

2世代前、もうすぐ3世代目になる1080Tiよりも、M1 Maxは桁違いに遅い。意外だった
0931名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 11:05:42.71ID:uO71QwtQ
>>928
コスパ段違いやな
MAX搭載Macとか糞高いし
0934名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 11:07:18.19ID:uO71QwtQ
自作詳しくないから知らんけど1080TiのPCとか下手したらディスプレイ込みで10万以内で作れるんちゃうの?
0935名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 11:08:12.74ID:E2pAsSUt
>>932
キッズに悪用されまくるのが目に見えてるわw
今はまだ最低限のリテラシーある層しか利用できないから大きな問題になってないけどさ
これから一般層に降りてくるとやばいよな
0937名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 11:20:05.54ID:6+Vx5IWt
確かに1080tiってそんなに高額でもないな
メモリが多ければいいって話だし まあ今後最適化でまた違ってくるんだろうけど
0938名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 11:33:05.29ID:hJAn0cka
RTXからTensorコアが乗ってPytorchが加速されてるから
RTX2060でも1080Tiのさらに倍の推論性能
今コスパで行くなら2060 12GBがいい感じ

とはいえモデルの精度変更や刈り取りや圧縮が進んでいるので
今のVRAMこそ正義な状況がいつまで続くかという話だけれども
0939名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 11:42:43.27ID:E2pAsSUt
内部の計算速度に比べてメモリの入出力は極端に遅いから
今後もVRAM容量の節約と速度はずっとトレードオフの関係だろうけどね
出来るだけメモリに詰め込んで読み書き減らすのが正義なのは変わらない
0940名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 11:49:26.25ID:n8fO39XV
早く1024や2048サイズがメモリ4GBくらいの古代グラボでも数秒で出力出来る時代になりますように…
0941名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 12:09:02.17ID:TrEphkRn
>>928
M1はニューラルエンジン積んでるけどそれに最適化したらまた変わってくるんじゃない?しらんけど
ゆうて単体GPUはやっぱ強いよな
今はmacだけど結局ゲーム用にWinも併用してるわ
0942名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 12:09:16.82ID:E2pAsSUt
拡散モデルがアニメ絵やデフォルメ絵が苦手なのは確かだけど
それでもサンプルが豊富なドラゴンボールやポケモンはある程度学習出来ているから
萌え系が上手くいかないのはサンプル不足の影響もかなりありそう
AIは抽象的な男とか女とかは学習できなくて○○さんの描く女の子やドラゴンボールの孫悟空みたいに
具体的に指定しないと駄目だから萌え系は作品のサンプル数が圧倒的に足りていないんじゃない?
0944名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 12:24:12.69ID:0tWLLoMd
ドラゴンボールやポケモンは比較的画風が統一されてるけど、美少女イラストは人によって目鼻口のバランスが違う上に下手なのも混ざってるからな
0945名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 12:29:23.97ID:nqEfck//
ロボポン乳を許容する人もいれば許せない人もいるからそこら辺のバランスは顔に限らず難しい問題
0947名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 12:33:32.34ID:KdHuREsK
>>936
AIの描いた絵をAIが学習して
どんどん奇形化していきそう
0948名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 12:34:42.55ID:hJAn0cka
Rutkowski居なかったらStableDiffusionの評判が一段下がってるまである
Rutkowskiに足向けて寝られないわ
0949名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 12:38:42.40ID:Fb4Mj0XF
hlky版をVRAM4GBで動かせた
省メモリ版basujindalのturbo設定も実装されたから高速実行できる

方法は >>825 に加えて
scripts\relauncher.py をテキストエディタで開いてこのように追記する

python scripts/webui.py

python scripts/webui.py --optimized-turbo
0951名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 12:45:36.35ID:adcon1OP
>>942
> ポケモンはある程度学習出来ている
いや俺の経験じゃポケモンダメダメなんだけどどうやってる?
0959名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 13:49:28.10ID:S01XYd9t
>>955
>>1ちゃんと読め
0961名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 14:05:45.27ID:nqEfck//
コスプレねーちゃん書かせたいのにアニメ要素入れたら目が大きくなるのどうにかならないかマン
0962名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 14:12:03.14ID:8X7deHaR
>>950
設定弄れないし、PCだと秒で終わる処理に数分かかるけど、スマホでも動くのはいいね。

>>958
ここはものすごく参考になりそうだ、ありがとう。
0965名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 14:20:13.63ID:saj0ui6g
商業で利用して売上があって後から著作権侵害認定されたら規模に比例して賠償金額が上がる
だから商業で使うならものすごく気を使って生成しなきゃいけないのは当然

趣味の個人アカウントで無料で公開する分にはリスクは少ないだろう
0966名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 14:26:32.55ID:TKZ5Ug6s
>>958
アイデアとして、pixivがいいんじゃないかとは思って入れてはいたんだけど
fanboxのが強いのは言われてみればその通りやわ
0967名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 14:29:43.84ID:Yz5GxV+J
>>964
img2imgの元画像に良さそう
0968名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 14:33:23.82ID:hJAn0cka
いくらドンピシャだとしてもアレコレ含んでそうな言葉には注意する
ド素人が認識すら危うい魑魅魍魎を混ぜているcursedな言葉を入れる時は特に注意するかそもそも入れない
ってのでpixivってド直球をプロンプトに入れてる人は少ない印象
0973名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 15:31:16.37ID:E2pAsSUt
ファインチューニングの研究が進めばSDでも同じこと出来るのは時間の問題だよね
というか今でも頑張れば出来るのか?
0974名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 15:41:52.85ID:gsESt66C
漫画家で絵柄を再現したらアシスタントとか亡き漫画家の続編絵ができたり?
まあ悪用する奴はいるだろうけど
0975名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 15:48:55.36ID:oX9i99+h
>>973
できる
ってか最初からembeded pathのオプションあるw
0979名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 16:01:23.53ID:bBsfaBGG
ファインチューニングしても使用者が想定してるものが出るとは限らないからな…
むしろ出るならすごい
0980名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 16:02:37.36ID:TKZ5Ug6s
>>978
いいね


なんかさ、AI画像ではgeforce3060がメモリ的にコスパいい説も有力だけど
個人レベルで機械学習させるのが流行ってくるとしたら、やっぱ中高級のGPUがええことになるんやろな
0983名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 16:10:02.57ID:0bMk5NBW
Pythonはじめて触ったもので、どなたか教えてください

Stable Diffusionをcolabで動かしていて、下記コードを使用しています

ここに「縦×横サイズ」「cfg scale」「ステップ数」の指定が出来るようにするにはどのようにコード書けばいいでしょうか?


from torch import autocast
from IPython.display import display
#import matplotlib.pyplot as plt
prompt = ""

for i in range(5):
with autocast("cuda"):
image = pipe(prompt)["sample"][0] # image here is in [PIL format](https://pillow.readthedocs.io/en/stable/)
display(image)
0986名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 17:09:18.86ID:3SqGfZxt
というか否定モードが欲しいね
「small breasts」とか入れても逆に胸が強調されちゃう
ピンクの象を想像しないでください問題
0988名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 17:14:39.91ID:zrVIZvjl
Twitterでmimicというサービスが騒がれていたけど
二次元に対応してるやん!と思ったら
顔しか生成できないのね

多分、近いうちにAIが二次元を理解するだろうから、すぐ産廃になりそう
0989名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 17:28:05.70ID:adcon1OP
>>988
これは?
顔はこれで作って体をSDに描いてもらうのも悪くはないんじゃない?
https://waifulabs.com/
0990名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 17:29:22.71ID:E2pAsSUt
>>988
DALL E2は自動的に絵柄揃えて描き足しが出来るから
顔だけ生成できれば全身絵が出力できる
顔はmimicで有名絵師の絵を完コピ、DALLで全身生成、背景はMJ
既にこうやって作った高品質な絵を上げてる奴もいるよ
0996名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 17:48:58.47ID:3SqGfZxt
>>987
そのものズバリじゃん
ありがとう
0997名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 17:51:32.86ID:1He7nitR
やたら時間と手間はかかるだろうけど
顔生成して、ポーズ生成して、置換してもらって、中割描いてもらってで
遠くない未来にノースキルの人がアニメ作れるようになるかも、という想像ができるくらいまで来てるのはすごいね

日本語も効く言葉あるけど、英語混ぜると後ろに置いても一気に乗っ取られるなぁ
日本語でやるなら日本語オンリーじゃないと厳しいか
0999名無しさん@お腹いっぱい。
垢版 |
2022/08/29(月) 17:53:43.19ID:zrVIZvjl
すでにやっている人がいるというのは妄想ではないのでは?
10011001
垢版 |
Over 1000Thread
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 7日 3時間 16分 14秒
10021002
垢版 |
Over 1000Thread
5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。


───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────

会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。

▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/

▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
レス数が1000を超えています。これ以上書き込みはできません。

ニューススポーツなんでも実況