X



Midjourney】AI画像生成技術交換2【StableDiffusion
レス数が1000を超えています。これ以上書き込みはできません。
0001名無しさん@お腹いっぱい。
垢版 |
2022/08/22(月) 14:38:25.17ID:Cv/bdJEy
英語の文章が画像に!
背景に使うか?イラストのアイデア出しはもちろん、
与える英文を捏ね捏ねして思いがけず生成される秀逸画像ガチャで遊ぶのも楽しい
有料サブスクで商用利用まで可能なAI画像生成サービス

★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
(他のスレがありますのでそちらに移動してください)

前スレ
【Midjourney】 AI画像生成 【DALLE】
https://mevius.5ch.net/test/read.cgi/cg/1659786388/
0002名無しさん@お腹いっぱい。
垢版 |
2022/08/22(月) 14:39:17.08ID:Cv/bdJEy
■関連リンク
【Midjourney】 https://www.midjourney.com/
【StableDiffusion】https://stability.ai/
【DALL・E2】 https://openai.com/dall-e-2/
【craiyon】(旧DALL・E・mini) https://www.craiyon.com/

英語スキルはあるといいですが、別に今時なくても何とかなります
【Google翻訳】 https://translate.google.co.jp/
【DeepL翻訳】 https://www.deepl.com/translator
0003名無しさん@お腹いっぱい。
垢版 |
2022/08/22(月) 14:40:16.65ID:Cv/bdJEy
StableDiffusionの人の他社製品比較

https://twitter.com/EMostaque/status/1561349836980584455
・StableDiffusion、DALLE2、midjourneyは全て異なるものだ
・この分野は、去年(2021年1月)にOpenAIがCLIPを公開したことで始まった
 これにより画像生成のガイドが可能になった

●DALLE2
 ・モデルかつサービス。インペインティングは最高の機能だが、ランダムなのでアイデア出しやより企業的な用途に最も適している。
 ・来年にはコストが10分の1以下になりAPIも公開されると思われる
 ・トレーニングデータは著作権のあるイメージなので、オープンソースにはならないと思だろう
●MidJorney
 ・VCの資金提供を受けたベンチャー、ではなく研究所
 ・非常に独特な絵画のようなスタイルを持っている
 ・一貫性に膨大な労力が必要。ランダム性が強いがある程度コントロールは可能
 ・オープンソースとそうでない部分がある。
●StableDiffusion
 ・アートからプロダクトまで、あらゆるタイプのイメージに対応する一般的な基礎モデルでもうすぐリリースされる
 ・まもなくDreamStudioプロシューマーサービスを発表する
 ・今まで皆さんが見ていたものベータ版のモデルテストから得られた生の出力で、前処理も後処理も行っていない
  これらを使うことで格段に良くなり、きめ細かいコントロールに力を入れた
 ・オープンソースのモデルなので、誰でも使うことができる。コードもデータセットもすでに公開されている
  そのため、誰もがこのモデルを改良し、構築することができる
https://twitter.com/5chan_nel (5ch newer account)
0004名無しさん@お腹いっぱい。
垢版 |
2022/08/22(月) 14:42:45.11ID:Cv/bdJEy
【ツイッター】
https://twitter.com/hashtag/midjourney
https://twitter.com/hashtag/dalle2
https://twitter.com/hashtag/stablediffusion
こんなのができます

【Midjourneyお役立ち情報】
https://github.com/willwulfken/MidJourney-Styles-and-Keywords-Reference
調べてみたら使いやすいPrompt wordはここに全部まとまってたわ
https://docs.google.com/spreadsheets/d/10i9Ip8tVSERAuMWbc6-H6BUFCoUGOQ91YzDvX--c4bk/edit#gid=0
各アーティストのまとめ
https://twitter.com/5chan_nel (5ch newer account)
0005名無しさん@お腹いっぱい。
垢版 |
2022/08/22(月) 14:48:18.61ID:Cv/bdJEy
テンプレはまぁ黎明期なんで適当で・・流動的に
スレが今後も続くなら勝手に追加or削除してください
0008名無しさん@お腹いっぱい。
垢版 |
2022/08/22(月) 15:37:10.50ID:NxWgAhzV
DreamStudio垢作って入るとこまで来たけど
パラメーターの意味やコマンドの説明とかどこかにない?
Cfg Scaleはだいたいどのくらい近づけるか
Stepsはなんだろう、そのくらい拡散させるか?で高い方が消費する?

あと、無料の残り回数ってどうやったら見られるんだろう
MJと違って説明してるサイトみたいなのが皆無でわけがわからない
0010名無しさん@お腹いっぱい。
垢版 |
2022/08/22(月) 17:14:03.48ID:NxWgAhzV
わかった
右上の自分の垢アイコンクリックしてmembershipに「£」って単位である
*** generationsっておおよその残りが表示される、下に購入もある
あと左のaccount settingsからsafe mode(NSFWフィルター)のオフがあったみたいだけど
今の無料verでは現状外されてる?らしく、どこにも見当たらない

cfg scaleはデフォの7(少なくとも5あたり)にしとかないと文字通りのが出てこない、MJの--sの逆みたいな感じ
stepはどれだけ精彩にするかみたいな感じ?MJの--qに近い感じか

steps 50のデフォ設定で無料の2.000が0.02減るので、無料では100回試行可能
クオリティ上げるとそれ以下になる感じ、steps 10の最低だと0.004減った、cfg 7でも凄くいい加減な抽象画みたいに

デフォのA dream of a distant galaxy・・の文字列がいちいち入るのはなんとかならないんだろうか
0011名無しさん@お腹いっぱい。
垢版 |
2022/08/22(月) 17:17:20.65ID:w7NMTPr2
craiyonで練習してMJ使ってきたが俺はcraiyonの方が好きだったな
MJは俺には絵画的すぎた
craiyonって旧名Dalleminiなんだっけ
じゃあDalle2が後継なのかな?
すごいと噂のSDも次やってみたいけど
使い方ぜんぜん載ってないな
0013名無しさん@お腹いっぱい。
垢版 |
2022/08/22(月) 17:26:35.60ID:NxWgAhzV
> 使い方ぜんぜん載ってないな
ほんとこれ
redditとかでは喧々囂々やってるみたいなんだけど、英語だしね
https://www.reddit.com/r/StableDiffusion/
あれこれ情報を共有していければいいね

https://twitter.com/hashtag/dreamstudio
実質今日からだから、みんな試行錯誤状態だね
MJ見たいにガチャで突発的にとんでもないのは生まれず、ジワジワ寄せていくような印象?
どことなくDALLE2に近いような
https://twitter.com/5chan_nel (5ch newer account)
0014名無しさん@お腹いっぱい。
垢版 |
2022/08/22(月) 17:37:15.03ID:w7NMTPr2
>>13
そうだね、無事スレが賑わうと良いな

620 名無しさん@お腹いっぱい。 sage 2022/08/21(日) 09:58:08.78 ID:4bnS4Iwr
DALL-E 2 、 Midjourney 、 StableDiffusionの比較
https://twitter.com/fabianstelzer/status/1561019187451011074

Midjourneyはすごい映えるってか、ライティングを派手にしがち
https://twitter.com/5chan_nel (5ch newer account)

俺も前スレのこれ見てDALL-E 2とSDはちょっと近いなと思ってた

SD試してくるわ
https://twitter.com/5chan_nel (5ch newer account)
0016名無しさん@お腹いっぱい。
垢版 |
2022/08/22(月) 17:58:04.52ID:NxWgAhzV
DSは正式にはDreamStudio Liteなのか、無料はliteなのかよくわからん
どのみちSDのDiscord終わったから、他人のテキストがパクれないのが辛い・・
MJはそでれかなり勉強させてもらったんだけど
redditでだいたい書いてる人いるけど、すべては明かしてない感じだし

£100で10K generationsだから、1回0.01ポンド、1.61円か
MJのFastモードの1/4くらいだけど、MJは無料のRelaxで期間中はいつまでも生成できるからなぁ
使い切った後の無料で作った枚数の方がもう多くなったよ、気楽だし
0018名無しさん@お腹いっぱい。
垢版 |
2022/08/22(月) 18:15:31.29ID:541PksLt
>>15,17
メイドインアビスの人物は自分で書いてる気がする。
ナナチっぽいケモノ耳キャラはMidjourneyでmade in abyssとすれば出てくるけど、リコやリグは多分出す方法がないはず

その辺ちゃんと書いてくれると参考になって嬉しいけど、今後はわざわざ書かなくなる人が増えそう
0019名無しさん@お腹いっぱい。
垢版 |
2022/08/22(月) 18:19:02.01ID:NxWgAhzV
DSは
https://note.com/abubu_nounanka/n/n20d548c4994b
> 最大品質の「解像度1024*1024ステップ数150」では、一度に28.2の計算コストがかかります

最大一発で28枚分(45円)はちょっとなぁ・・でもいいの出来たら同seedで突っ込んでみたくなっちゃうし
そこら結構、常に金が密接に絡んできてて、ケチな自分には窮屈な印象がある
relaxモードあったら嬉しいんだけど、ないよなぁ
0023名無しさん@お腹いっぱい。
垢版 |
2022/08/22(月) 19:12:23.41ID:mJiRi32m
>>22
4chanお祭り騒ぎだね
彼らにはめっちゃ期待してる
0026名無しさん@お腹いっぱい。
垢版 |
2022/08/23(火) 00:34:29.11ID:YfpQWt2D
Stable Diffusionはネットに繋がないローカルPCで使えるの?
0027名無しさん@お腹いっぱい。
垢版 |
2022/08/23(火) 00:39:45.77ID:wOHCe40x
見た感じ無料で何回でもローカルで使えるけど最低でもVRAM10GBは必要かな?
もし3080以上要求されるならちょっとハードル高いよな
0028名無しさん@お腹いっぱい。
垢版 |
2022/08/23(火) 00:48:18.30ID:QFPulAhi
980ti(VRAM6GB)でやったらCUDAがねぇよって止まった、対応してるGPUなのに
ドライバとかCUDA toolkitとかインストールしてたらPC立ち上がらなくなってセーフモードから復元
・・諦めた
0029名無しさん@お腹いっぱい。
垢版 |
2022/08/23(火) 00:48:31.20ID:B9jo2Sb1
>>26
インストールはダウンロードがいるのでネット接続いるけど、インストール完了したらネットに繋がなくても使える

バージョンは最新じゃないけどこの手順で動く
https://mevius.5ch.net/test/read.cgi/cg/1659786388/630

昨日正式リリース版0.2.3が公開されて、モデルも最新版が数時間以内に公開されるはず。
https://github.com/huggingface/diffusers/releases/tag/v0.2.3

>>27
公式はそうだけど、省メモリでも動くクローンを誰か作ってくれるはず・・・
そういう場合は無理にローカルで動かさずgoogle colabのほうがいいけど
0030名無しさん@お腹いっぱい。
垢版 |
2022/08/23(火) 01:07:30.82ID:YfpQWt2D
>>29
なるほどサンクス
dreamstudioはウェブ版って感じなのね

完全にローカルで動くなら、肖像権上等、ロリ、エログロみたいなアウトも出力するAIが遠からず出るんだろうな
そしてそのAIを保有してたらアウトな法律も追って出るだろうし

アダルト特化AIが出るのを待つか‥速攻でDLして金庫に補完するか‥
0036名無しさん@お腹いっぱい。
垢版 |
2022/08/23(火) 23:57:45.73ID:QFPulAhi
>>16
自己レス
> MJのFastモードの1/4くらいだけど
DSは512x512で、MJは1024x1024なんだから当たり前の話だった
とりわけMJが高いわけではない
0037名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 09:18:13.63ID:l/29Ttzd
DreamStudioやろうとして、間違えてStableDiffusionのサブスクリプションの登録をしてしまった。登録解除フォームが見当たらなかったから問い合わせからサブスク解除希望送ったけどこれで大丈夫でしょうかね、、、アホですみせん。
0038名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 12:20:16.80ID:lSgIFxuv
あれは放置したままのあのサイトが悪い
当時一旦切られたDiscordのStableDiffusionの無料βの追加募集フォームだったんだけど、事態が早く動いて尻切れトンボ
もうDiscordのSDそのものが閉鎖されて普通に有料サブスクまであるDreamStudioが動いてるのに

自分も登録したままだけどなんの音沙汰もないけど、
同じメールアドレスの登録で普通にDreamの方使えたし一切気にしなくてOK
無視無視
0039名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 12:47:36.70ID:qUqKG484
GTX1080(VRAM8GB) Windows11 WSLで低VRAM版が動いてる
苦労したのはgit lfsインストール前にcloneした学習データでエラーが出てたことに気が付かなかった事
0040名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 13:32:21.21ID:AduC0iug
>>38
ありがとうちょっと安心した。
メールアドレスだけだからそもそも何も金かからんとは思うけど
サブスク=金かかるって気がするからちょと怖かった。
0042名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 19:04:11.23ID:MizOilz4
this image was not displayed because our detecion model detected unsafe content
こんなん出たんだけど、表示するにはどうすればいいの?
0043名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 19:34:39.39ID:or+gwnRD
●StableDiffusion 2022/8/24時点(model 1.4)のリソース等
・Google Colab https://colab.research.google.com/drive/1AfAmwLMd_Vx33O9IwY2TmO9wKZ8ABRRa
・Google Colab(フィルタ解除版) https://colab.research.google.com/drive/1jUwJ0owjigpG-9m6AI_wEStwimisUE17
・ローカル環境等(フィルタ解除版) https://rentry.org/kretard
・Discord https://discord.gg/stablediffusion
・中の人のtwitter https://twitter.com/EMostaque
・海外情報reddit https://www.reddit.com/r/StableDiffusion/

・今後
 ・モデル v1.5の公式ツイートあり(時期不明)
 ・アニメ用モデルの公式ツイートあり(”すぐ")
 ・来月は”audio"モデル、その後3D、ビデオ予定(時期不明)

●アーティストごとの傾向等
DDのアーティストごとの傾向
https://weirdwonderfulai.art/resources/disco-diffusion-70-plus-artist-studies/
https://docs.google.com/spreadsheets/d/14xTqtuV3BuKDNhLotB_d1aFlBGnDJOY0BRXJ8-86GpA/

SDのアーティストごとの傾向
https://proximacentaurib.notion.site/e2537cbf42c34b7e9a9a4126f81dfd0d?v=7b4a3c03fb654045be324eb71acc57e6

このリンク集も参考になる
https://pharmapsychotic.com/tools.html

https://weirdwonderfulai.art/resources/disco-diffusion-modifiers/
https://twitter.com/5chan_nel (5ch newer account)
0046名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 21:31:17.12ID:aJBVxFrq
今はGoogleでStable Diffusion試みてるんですけれどパイプラインの準備ってところでエラーでて進みません。
このでコマンドの書き換えとかあるのでしょうか?
0047名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 21:38:50.65ID:or+gwnRD
>>46
どこかの実行を飛ばしてしまってるか、Hugging faceのアクセ設定ができてないかじゃないかという気がするけど
 (1)使ってるノートのURL
 (2)実行した各項目のスクショ
 (3)エラー内容のスクショ
があればなにか分かるかも
0048名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 21:43:23.21ID:MizOilz4
使いたいけどプログラミングとか全然分からない
img2imgとかもどうするんだStable Diffusionをローカルに取り込んだらエロも描かせれるのかな
0050名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 21:51:48.27ID:h+X3gobT
img2img は txt2imgよりメモリ食ってる気がする
うちは8GRAMだから高速版は448x448が限界で7.8〜7.9G消費
そのサイズでimg2imgだと落ちるから少し小さいのじゃないと回らなかったよ
0053名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 22:10:15.32ID:gCykF9CA
>>52
> (2)実行した各項目のスクショ
> (3)エラー内容のスクショ

名に書いてあるかコピペでも手書きでもいいし
みんなエスパーじゃないんだから・・
0054名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 22:13:56.87ID:gCykF9CA
失礼、名に→何
実行結果がズラズラ出てるところにまさかカタカナで「エラー」とだけ出てるわけじゃないでしょ?
> パイプラインの準備ってところでエラーでて進みません
0055名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 22:20:56.41ID:or+gwnRD
>>52
今やってみましたけど問題なく動きますね。なんだろう?トークンのコピペミス、コードのコピペミスぐらいしかないような
---------------------------------------------------
!pip install diffusers==0.2.4 transformers scipy ftfy
YOUR_TOKEN="<ここだけアクセストークンに書き換える>"
from diffusers import StableDiffusionPipeline

# StableDiffusionパイプラインの準備
pipe = StableDiffusionPipeline.from_pretrained("CompVis/stable-diffusion-v1-4", use_auth_token=YOUR_TOKEN)
pipe.to("cuda")

prompt = "japanese cat skipping"
image = pipe(prompt)["sample"][0]
image.save(f"japanese_cat_skipping.png")
---------------------------------------------------

また、ガイドはシンプルなので基本の勉強のため良いと思いますが、実際に使うなら>>43のリンクのノートの方が便利だと思います。
0057名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 22:25:51.58ID:aJBVxFrq
>>0053
>>0054
お騒がせしてすみません!自己解決できました!
どうやらアクセストークンの入力時が原因でした。
トークン入力時にサンプルの余計な文字を残したまま実行をしていたみたいで…。
そのコードのとこだけだと実行して間違っていても緑チェックはついてしまうのですね。
結果その次のパイプラインのコードでエラーをはいても、トークンにはチェックがついてて原因はパイプラインの方にある……と思い込んでしまいました。
本当にお騒がせしました…
0058名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 22:33:08.96ID:TiDffnf9
あーあ
もうロリエロ作られてんじゃん
終わったな
0059名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 22:35:17.30ID:694xotOP
Midjourneyのブラウザから見られるコミュニティページの自分の名前を変更する方法はありますか?
気に入ったユーザーをフォローしたいのですが相手に名前を知られたくないので適当な名前にしたいです
0060名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 22:49:08.47ID:or+gwnRD
>>57
解決したなら良かったですw

これやってみてちょっと気になったのが、これ>>43の2番目のノートよりかなり遅いですね。
image = pipe(prompt,height=512, width=512,num_inference_steps=50,guidance_scale=8.0,)["sample"][0]

Gigazineのガイド: 1.80 it/s
>>43の2番目のガイド: 3.8 it/s

#StableDiffusionの実行時間はプロンプトによらず大体ステップ数に比例するので 50ステップで 3.8 it/sなら 50/3.8 = 13.2秒

それぞれ2回やってみましたが結果は同じでした。2回だけなのでたまたまということもあるかもですが
0065名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 22:55:39.27ID:or+gwnRD
ちなみに512x512で、ざっくり性能でこんな感じ

● it/s =1秒で実行できるステップ数
980 0.36 it/s (2.81 s/it)
1070Ti(8GB) 1.60 it/s
1080Ti(11GB) 2.30 it/s
Google Colab(T4) 3.2 it/s ~ 3.8 it/s
2060 4.6 it/s
2080Ti 7.3 it/s ~ 7.73 it/s

1080Tiと2080Tiは https://rentry.org/kretard

Google Colab(T4 15GB)はこれ https://colab.research.google.com/drive/1jUwJ0owjigpG-9m6AI_wEStwimisUE17#scrollTo=Ucr5_i21xSjv

プロンプトはこの条件で測定しました。プロンプトは性能に関係ない気がしますが一応
beautiful long haired anime girl, fire dress, portrait, flames everywhere, highly detailed, digital painting, artstation, concept art, smooth, sharp focus, illustration, art by artgerm and greg rutkowski and alphonse mucha
Steps: 50, Sampler: k-diffusion, CFG scale: 15, Seed: 1
0068名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 22:58:59.26ID:OpxdHRin
自宅でAIにエロ絵なんていくらでも作らせる時代に規制なんて無駄…
とはならずに普通にアップルやグーグルやMSにPCやスマホの中身まで
リアルタイム監視されて通報されるようになるだけだよな
既にグーグルもアップルもクラウドやメールは監視して自動通報してるし
それが自宅の端末にまで適用されるだけ
0069名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 23:00:31.01ID:694xotOP
>>61
名前がペンネームと同じなので変えたいのです
ディスコサーバーの名前も変更しても、ブラウザ版のコミュニティページには反映されておりませんでした
画像はプライベートモード課金して全部隠しています
0072名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 23:04:03.90ID:uPPGgz9u
完全ローカルでネット遮断で動かせる、ロリ、エログロokなAIがリリースされたらすぐにDLして保存しなければならない
まあそれの単純所持も規制されそうだが
0073名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 23:06:27.76ID:R028Iasl
>>56
多分だけど俺もそこで詰まった
もし俺と同じ理由で出来てないなら
チェックボックスにチェックしてから回したらいけたで
詳しくはこれ翻訳して読んでくれ
https://news.ycombinator.com/item?id=32556641
辛いかもしれんが一つ前の段落?の中にチェックボックスが隠れてたから探してみてくれ
見当違いだったらすまん

簡易版っぽいけど軽いし多分無料でやれるから慣れるまでの最初はなかなかええと思うけどな
0075名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 23:11:24.62ID:694xotOP
>>74
丁寧にありがとうございます

ブラウザ版というのは、ブラウザ版discordのことではなくて
Midjourney側の「Community Feed」などのページのことです
そこで自分のプロフィールを「View as visitor」モードに切り替えても名前が最初に設定したペンネームのままなんですよね

ブラウザのMidjourneyのページにプロフィールを編集できるような設定箇所が見当たらないので、名前を変える方法が無く困っています
0081名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 23:33:54.22ID:JmVG8zqE
今更midjourney遂げた凄まじい進化に驚愕してる
こりゃ今年中に来るかもしれんな
AIが実用的なエロ画像を生成出来るようになる時が
0084名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 23:36:29.11ID:o+8ULzIq
①適当な指示絵で髪の色や顔の形を指示
②img2imgで変換して好みの画像を選ぶ
③破綻した部分を大雑把に直す 謎のオブジェとか余分に生えた腕を消す
④重みを弱くして再変換

画像は出力画像が再入力できるからヤバイよ
②~④を繰り返せばそこそこ好みの絵ができたよ
0085名無しさん@お腹いっぱい。
垢版 |
2022/08/24(水) 23:54:08.75ID:TdkLRr5D
うわー、つまってしまった

上にある
・Google Colab(フィルタ解除版) https://colab.research.google.com/drive/1jUwJ0owjigpG-9m6AI_wEStwimisUE17
を四苦八苦しながらやっているけど、
PROMPT入力して生成するところで、NameError: name 'pipe' is not definedと出て失敗してしまう。
アクセストークンが間違っているのかな? みてもわからないわ
0086名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:03:04.67ID:ktn3oZWh
>>85
なかなかヒントが少ないけどw

--> 116 "You specified use_auth_token=True, but a Hugging Face token was not"
117 " found."

もしこう出てるならトークン未設定か、huggingface_usernameかhuggingface_tokenが間違ってる
0090名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:21:45.50ID:qfvTN6Mb
ゲームやらないしGTX980で十分だわと思ってたけどグラボ買っちゃう勢いの技術だな
ただColabに毎月1000円課金する方が安く済むならそっちが良いけど、
課金しても無限にGPU使えるわけじゃないっぽいから悩むなぁ
0092名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:25:58.70ID:VYiQzdFX
ローカルで動かすのややこしいんだね
DLインストールしてポンとは行かないのか
0093名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:26:12.43ID:F5OuPmFA
マイニングだけじゃなくてイラスト作業でもGPUを酷使するのか...
日本でグラボが短期的に高騰しそう
0094名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:28:20.70ID:Je2EIVx2
オープン技術の黎明期あるあるだね
ちょっとしたらGPUある人向けにGUI組み込んだフリーソフト作る酔狂者が現れるかもしれない
0095名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:29:29.11ID:TTMJgFKc
>>94
redditにgimpのプラグインっぽいスクリーンショットあげてる人いた
0096名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:33:16.83ID:gT+8LwsL
>>87
このcolabのFor Gdriveってとこにあるuser_pathとfile_nameってなにをいれたらいいんですか?
0097名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:34:55.78ID:OfpVbaR2
呪文教えてくれって言ったのに全く反応がないのは
やっぱ出来が悪いのしか作れていないから?
難しいんだねぇ

自分的には力作で気に入ってるけどUP出来ないのも
けなされるのが怖いから?
0098名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:35:06.66ID:DLv+Kqg8
プロンプトの効果ってバージョンアップごとにごっそり変わりそう
っていうか何なら日々の学習で流動的に変わってそう
0099名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:35:18.06ID:bykfx2UB
人間に特化した、ちゃんと人間の顔と身体を理解してるAIモデルって作れないのかな?
現状だとちょっと精度低すぎて顔崩壊しすぎる
0100名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:35:56.31ID:Je2EIVx2
MJは256角4枚を俯瞰して好きなのを選んでアップスケールで1024角だから作った瞬間映えるんだよな
DreamStudioはいきなり1枚512角が最低ラインなんでゴミに金払わされる
・・あれ?逆かMJこそ無駄に作成させられてる?わからん
0101名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:36:45.19ID:ZxeWx7Jy
すいません、stable diffusionのimage to imageのやり方がよく分からないのですが、どこかやり方が載ってるところってあります?
0104名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:41:33.75ID:Je2EIVx2
>>97
前スレでずっと無視されてた人か

単にせっかくコツコツ試行錯誤して編み出した呪文をなんの見返りもなく教えたくないからだろう
ツイッターとかでも公表してる人あんまいないよ、しょーもない実験風のは書かれてるけど
852話とか言う人もかなり前だがキャラ設定画みたいなののレシピをさんざん上げてから公開してたし

だから>>82はありがたい
MJはDiscordでのぞき見できるから捗ったんだけど
Discordβ終わったSD(DS)はβやれなかった自分には手探り過ぎて放置してた
0105名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:42:02.98ID:VYiQzdFX
地味に、自分が吐き出した画像って愛着あるよね?ゴミでもなんか捨てづらい
これから動画も増えるだろうし、GPUもだがHDDも需要が増えるな
0107名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:45:40.88ID:F5OuPmFA
いいpromptを教えろって言ってもどの言葉がどの程度作用してるのかさっぱりわからないんだよな 
4kとかunreal engine5みたいなキーワードはあっても結局運だし
俺もポーズごとやアングルの定石が分かれば嬉しいと思ってるけど、現状を見るにそういうのはなさそう
0108名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:46:57.10ID:Je2EIVx2
今って選択肢が多すぎてワケワカ状態だな、SD系はもうなにがなんやらi2iまで言い出したら
ちょっと置いた方がいいかもしれん

自分はbetaで活気ついたMJいじりながらボロPC買い替えにでも動くか
0109名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:47:30.07ID:zyWvVtGI
>>99
リアル人間のなら2桁くらい公開されてるんじゃね
最近はファッションモデル用のAI素体を提供してる所もある
0111名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:50:36.02ID:Je2EIVx2
>>107
オカルトみたいな呪文も結構乱発されてんだよね
効いてるかは入れる場合と入れない場合の同seedでしっかり確認してから使うべき
MJはseed指定が一般的じゃなかったのでもうほんとオカルトで3行とかなってる人がザラにいた
0112名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:52:38.41ID:F5OuPmFA
今は自動イラスト生成黎明期で、本格的になるのは一部修正機能がとかより細かい絵柄の指定が実現できる学習済みモデルが配布されてからかな
今後は学習済みモデルでひと悶着ありそうだ
0113名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:53:59.10ID:VYiQzdFX
詠唱だのプログラムだので必死になる人達は良くも悪くも凄いな
どうせ来月にはもっと簡単お手軽になってるでしょ
俺はパソコン大先生じゃないから今は見て楽しむだけだな
0114名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:55:04.82ID:M/HLpgpi
あんまり長く書き連ねると途中で強制カットされるはずだぞ
トークンっていう言葉の固まりに上限数がある
最後の隠し味にと最後に書いた一文が丸々効いてないなんてことも
0115名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:56:15.84ID:TpN+ACPg
>>107
https://rentry.org/kretard このUI限定かもしれないけど、
create prompt matrixにチェックして、プロンプトのキーワードを | でつなぐとそのキーワード有り無しが出ますね

例えば
girl | on the beach | oil painting
とすると、以下の4枚の画像が生成されます。
- girl
- girl on the beach
- girl oil painting
- girl on the beach oil painting

1ワードずつ効果を探ってられないですが、高解像度のキーワードのあり・なし、効果を見るみたいな使い方なら便利かも
0116名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 00:58:40.17ID:bgMQ/0YX
>>82
うまいのいっぱいあっていいね
イラストレーターの名前入れるのかなり影響あるから
いい雰囲気のプロンプトはチェックしとこ
0117名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 01:01:06.93ID:Je2EIVx2
>>110
個人が公開してるわけないから、たぶんDiscord時代のログみたいなのから生成してるのかなぁ
日付がそんな感じの古さ
0120名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 01:13:36.34ID:TpN+ACPg
Emad (Discord)
Q Dalleのようなプロンプトでのインペインティングか、自動インペインティングかどっちかサポートする予定ないの?
A 両方でいいじゃん
0121名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 01:15:31.78ID:wNS4aEcK
SDにimg2txtみたいなものって無い?
イメージに近い画像1枚渡すからどういう単語を求めてるのかのヒントが欲しくて
別のRecognize系API使うしかないのかな
0122名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 01:16:14.78ID:TpN+ACPg
>>119
それはGdriveに既にmodelを保存している場合に実行するもので、その上の
!gdown ・・・



%cd stable-diffusion/ ・・・

かどっちかを実行していれば不要だと思います。

このノートは初心者には難しい
0123名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 01:18:22.66ID:Je2EIVx2
>>82で好きな絵探して呪文メモするのにはまってる
みんないろんなアーティスト知ってるな、というかDiscord時代に皆で試行錯誤した集合知なんだろうけど
0124名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 01:20:13.62ID:TpN+ACPg
>>119
ついでにその下のHuggingfaceもいらないと思います。
後、Optimized SDの下のSetup、Settingなどもいるのか要らないのか私には分かりません。よく読めば分かるんだろうけど
0125名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 01:24:00.66ID:gT+8LwsL
>>122
ありがとうございます
必要ないんですね
てっきりここでエラーがでるので、pathを入力してないせいだと思っていました
ちなみに、このエラーもわかったりしますか

本当に難しいです
初心者なのでわからないことばかりです

https://imgur.com/a/Y8K8y0u
0127名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 01:39:26.95ID:qfvTN6Mb
Colabでの出力だとシード数という概念はない感じ?
一回出た画像を再度出力とかは無理で保存するしかない感じ?
0128名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 01:54:24.11ID:TpN+ACPg
>>127
こっちのColabはSEEDで設定された値をmanual_seed()しているので、同じシードなら同じになります。
実際にやってみても再現できます。(ローカルで実行したものと同じSEEDならColabでも同じ画像ができる)
https://colab.research.google.com/drive/1jUwJ0owjigpG-9m6AI_wEStwimisUE17#scrollTo=Ucr5_i21xSjv

他のColabは使ってないので分かりません・・

このURLのノート、シンプルでいいんですがimg2imgに対応してないんですよね。悩ましい
0131名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 02:03:31.19ID:qfvTN6Mb
>>128
ありがとう
自分で調べて構築しなくてもめっちゃ便利な定型システムが用意されてたんだね…
そっちに移ります…
0132名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 02:06:30.11ID:zaA0cpZ4
佐藤航陽 著書「世界2.0 メタバースの歩き方と創り方」 @ka2aki86 (2022/08/25 02:02:11) [返信:フォロー/@のみ]
物理世界における視界は、AIにレコメンドされたYouTubeやTikTokのタイムラインのようなものだな。帰り道の解体跡地にどんなビルがあったかは覚えてないけど、自分が好きなアーティストの看板があればすぐ認識できる。物理世界も仮想空間も自分が気になってるもの以外は表示されないし認識もできない。
https://ohayua.cyou/tweet/1562485434235879424/ka2aki86
0134名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 02:14:58.16ID:YWrt340D
852話 @8co28 (2022/08/24 18:28:24)
#stablediffusion の #Img2Img (指定画像から画像を生成する)機能を使ってみました。
3分で描いた指示用雑絵(2枚目)に絵の要素のプロンプトを指示し1枚目を生成しました。
2枚とも生成時・指示時のもので、無編集。
いや、すごい……
https://ohayua.cyou/twimg/Fa6n5_SagAA0h10.png
https://ohayua.cyou/twimg/Fa6oOnIaQAcUSCy.jpg
https://ohayua.cyou/tweet/1562371233282682882/8co28
0135名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 02:59:50.50ID:gT+8LwsL
>>43
これのローカル環境ってやつがんばって試してみたけど
セットアップ完了していざ試したら

Traceback (most recent call last):
File "scripts/webgui.py", line 5, in <module>
import gradio as gr
ModuleNotFoundError: No module named 'gradio'

って文字がでてダメだった……
なにかを間違えたんだろうけどさっぱりわからん
難しいなぁ
0136名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 03:12:25.97ID:39A5KPuE
>>135
gradioはこの手順でダウンロードされるのでどちらか抜けているのでは
ステップ 5:新しいenvironment.yaml をダウンロードして waifu-diffusion-main に配置し、古いものを置き換えます (すべてのファイルとして保存します)
ステップ 10: 次のコマンドを実行します: 「conda env create -f environment.yaml」を実行
0137名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 03:13:44.39ID:39A5KPuE
後、これをやってない可能性もあるかも
ステップ 12: 次のコマンドを実行します: "conda activate ldx"
0138名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 03:23:33.13ID:gT+8LwsL
>>136
ありがとうございます。
思い返せば、このステップ5をよく理解せず、やった覚えがあって、

ステップ5で自分のやった手順を詳細に書き起こしてみます
https://pastebin.com/6gpWFLa4
↑のURLにログインする
ログインしたページの右上にあるdownloadを選択
environment.yaml.txtを取得
名前を変更して.txtを削除
それからwaifu-diffusion-main に配置

って手順でやりました……
素人なんでほぼフィーリングでやりました
このやり方が間違っていたんですね……
0139名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 03:28:51.27ID:gT+8LwsL
同時並行して、わかりやすいと教えて貰った
https://colab.research.google.com/drive/1jUwJ0owjigpG-9m6AI_wEStwimisUE17#scrollTo=Ucr5_i21xSjv
もやっているけど、どうしてもここでつまってしまう

ユーザーネーム、アクセストークンが間違っているかもというアドバイスをうけて
何度も見返しているけど、間違っている場所が見当たらない……

https://imgur.com/a/8zUsvm3
0141名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 03:32:47.67ID:gT+8LwsL
>>140
本当ですか……
ミラーとか元テキストとか意味がわからず無視したんですけど
これらって結局必要ないんですかね……?
0142名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 03:36:22.17ID:39A5KPuE
>>141
あれ?勘違いしてたかな

>>138の手順をやってenvironment.yamlを配置したんですよね。それでOKですという意味でした。
必要な手順です

mirrorやraw textはこちらからもダウンロードできます、ということなので、3つやる必要はありません。
0144名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 03:41:11.12ID:gT+8LwsL
>>142
mirrorやraw tex必要ないんですね
ありがとうございます
0145名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 03:46:27.50ID:39A5KPuE
>>143
srcに既存フォルダが有るとそうなると思います。

ステップ 9: /src に既存のフォルダーがある場合は、次のステップの前にそれらを削除します。

これが抜けてるのかな
0147名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 03:52:37.89ID:39A5KPuE
conda env create -f environment.yaml を2回実行した(多分、初期のファイルで実行した後、ダウンロードしたもので再実行?)と思われます。
一旦、

conda env remove -n ldx

で削除してから、再度conda env create -f environment.yaml をやればいいと思います。
0150名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 04:17:29.41ID:gT+8LwsL
うわぁああああ、また新しいエラーがでたぁああ
いつになったら、好きなエロい画像を作れるんだ……
0151名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 04:25:29.94ID:39A5KPuE
>>149
いい出来ですね!
各パラメータそんな小さい数字で調整して行くんですね。参考になります。
この絵からこのワードを足すとこれ、みたいに画像ををツリー状で操作できるようなUIとかあると便利そう。
誰か作って欲しい
0152名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 04:34:00.08ID:ckiBhtAH
Hirokazu Yokohara @Yokohara_h (2022/08/24 19:52:22)
将来的にはデジタル絵の主流の作り方はコレに似たものになると予想。意図通りにしたい部分を適切に都度指示していく感じ。3DCGなんかは元々そういう制作方法だよね
https://ohayua.cyou/tweet/1562392367784636419/Yokohara_h

[引用元] 852話 @8co28 (2022/08/24 18:28:24)
#stablediffusion の #Img2Img (指定画像から画像を生成する)機能を使ってみました。
3分で描いた指示用雑絵(2枚目)に絵の要素のプロンプトを指示し1枚目を生成しました。
2枚とも生成時・指示時のもので、無編集。
いや、すごい……
https://ohayua.cyou/twimg/Fa6n5_SagAA0h10.png
https://ohayua.cyou/twimg/Fa6oOnIaQAcUSCy.jpg
https://ohayua.cyou/tweet/1562371233282682882/8co28
0153名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 04:45:21.93ID:OfpVbaR2
>>149
--strength 0.3 --n_iter 2 --n_samples 5 --H 576 --W 768

-- ← このハイフンみたいなの2個は付けないとエラーになるの?

こういう約束事みたいなのが全然わかんないw
0155名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 05:24:44.37ID:zyWvVtGI
>>154
If your output is solid green, the half precision optimization may not be working for you:
GREEN SCREEN FIX:
delete ".half()" in webgui.py
(Note: this will raise vram usage drastically)

キミ成人してる?
フィルター解禁版は誰が見ても一発アウトな児ポも画像ファイルとして出てくるから適当に使わんほうがいいぞ
0156名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 05:37:07.73ID:gT+8LwsL
>>155
成人してます
ポルノ利用するつもりはないですけど、なんとかして使いたいです
0158名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 05:53:26.27ID:OfpVbaR2
>>155
フィルター解禁版使ってみたいけど

ハードル高過ぎ何をどうしたらいいかわからんw

馬鹿にでもわかるような解説出ないかなぁ
0159名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 05:54:51.60ID:L+T2AQMI
普通に使っててもフィルタかかるから解除版でいいよ

>>154
グリーンはフィルタとは関係なく、GPUが16xxとかだと出るみたいですね。
>>155さんの言うようにwebgui.pyの中にある156行目の.half()を削除してみてはどうでしょうか
(元)model = (model if opt.no_half else model.half()).to(device)
(修正後) model = (model if opt.no_half else model).to(device)

#行頭スペースなど変更せず、.half()だけ削除するよう注意
0161名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 06:40:13.22ID:gT+8LwsL
やっと生成できると思ってやっても下記のエラーがでます
わかるかたいませんか?
ローカル版で試してます

RuntimeError: CUDA out of memory. Tried to allocate 512.00 MiB (GPU 0; 6.00 GiB total capacity; 5.06 GiB already allocated; 0 bytes free; 5.18 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF
0162名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 06:47:36.41ID:MfvfcZ2+
>>161
本家はVRAM10GB要るから軽量版に変える
0164名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 06:57:25.60ID:69ljxOjZ
6GBでも動くはずなんだけど
https://rentry.org/kretard
Lighter on Vram: 512x512 img2img & txt2img tested working on 6gb

16xxはhalf()を止める必要があるから無理ってことぽい。
グリーンスクリーンが16xx限定か知らないけど

後、グリーンスクリーンは、起動時に以下のオプションで解消できると書いてますね。ソースコードいじらなくていいぽいけど
VRAM使用量が上がるから、解像度を低くする必要が有ると書いてる。
"python scripts/webgui.py --precision full --no-half"
0167名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 07:08:18.59ID:uM91UxfF
プロンプトって単語数の上限や優先順位ってあったりする?
最初の方に置いたら強く影響するとか、数十個以上入れると後半は無視されるとか
単語を詰めまくったら、どうも影響を一切反映しなくなった気がする単語とかあって
単語1個と50個でも生成時間が同じなのも不思議で
単語入れまくったら探査深度というか、画像検索は先っぽで終わる感じなのかな?
例えば1個だと50枚調べるけど50個だと各1枚で終了とか
0168名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 07:14:26.06ID:jzBSMp93
試行回数少ないからはっきりとは言えないが、構図や描写のクオリティは画像サイズにも依存してるっぽいな
256x256の出力結果は全く使い物にならなかったけど512x512に変えたらハイクオリティになった
単純にサイズに合わせて出力結果を変形させてるわけではないのかも
0169名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 07:15:01.03ID:gT+8LwsL
>>166
どうしてもimg2imgを使いたくて苦戦してますw

今は軽量版をどこで手に入れるのかわからずネットの海を彷徨ってます
0171名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 07:22:33.74ID:69ljxOjZ
>>167
トークンの数は75 (77?)で、それ以上は無視されるらしい

https://rentry.org/kretard
・トークンは75以下、大文字/小文字は関係ない、トークンは約30,000
・同じプロンプト、シード、修飾子は同じ結果になる

https://wiki.installgentoo.com/wiki/Stable_Diffusion
「Unicode 文字 (日本語の文字など) を使用する単語は、ASCII 文字を使用する単語よりも多くのトークンを必要とします。」とあるから
単純にワード=トークンじゃないっぽくて、トークンの定義が分かってないけど

後生成時間はstep数以外何も影響してない気がする
0173名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 07:32:01.96ID:uM91UxfF
>>171
ありがとうございます
やっぱ上限あるんですね…
自分もトークンがなんなのか良くわかってないけど…
0175名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 07:56:54.48ID:69ljxOjZ
複数環境共存できましたということで不親切なメモですが一応。 basjindalは昨日GUIが実装されたようでそこが変わっています。
●basjindalのインストール (waifuの共存)

【前提】 minicondaインストール済
https://github.com/basujindal/stable-diffusion から、code>download zip
miniconda で解凍した場所にcd

environment.yamlの冒頭をname: ldm-basに変更する(waifuと競合するから)
conda env create -f environment.yaml
モデルをコピーしてリネーム stable-diffusion-v1\model.ckpt
conda activate ldm-bas
pip install gradio

これでインストール完了。
python optimizedSD/txt2img_gradio.pyを起動すると、しばらくして
(img2imgなら python optimizedSD/img2img_gradio.py)

Running on local URL: http://127.0.0.1:7860/
でるので、ブラウザでアクセスすれば使えます。

次回からは、以下の2コマンドで利用可能
conda activate ldm-bas
python optimizedSD/txt2img_gradio.py

なお、basujindal、省メモリですがwaifuよりめっちゃ遅いです。basujindal 1.4 it/s、waifu 7.5 it/sぐらいで5倍ぐらい遅い
0176名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:22:57.95ID:Dtg22sej
なんか「SDでエロ作るのは危ない!」って騒いでる人いるけど言うほど引っかかりそうな法律とか規約あるか?
「Stable Diffusion Terms of Service」は紛らわしいけど中身読むとAI自体じゃなくてDiscordでやってたbetaの話なんだよな
0177名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:23:36.28ID:1uZk9t3I
ローカル環境で考えてるやつは電気代に注意しろよ~
寝る前にコマンド入れて一晩中生成とかやったら大変なことになるぞ☺
0178名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:25:06.62ID:gT+8LwsL
ローカル版画像サイズ小さくすればできた

>>169
この軽量版はやってみたけど、うまくいかなかった……
0181名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:44:16.43ID:hocSwwFi
手がもう崩壊してるから脱いだら悲惨なことになる
アニメ顔で実用に耐えるR18とかは一晩かかって出せるかどうか
絵描きだったら自分で描いたほうが早いw
個人的にそういう方向を追求するのは不毛に思うけどな
0183名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:47:54.74ID:odqqeXCg
言われてみれば、>>179めっちゃ可愛く出来てるけど、よく見りゃ左腕豪快に骨折してるね

AI画像生成、人体その他構造を考慮できるようになるのかな・・・
0184名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:50:26.50ID:6FMN8AvS
>>175
basujindal版は省メモリに全振りでピーク使用メモリ量が最小になるように
・モデルの分割投入
・混合精度
の2つを積極的に実装してる
モデルの分割投入はメモリの出し入れが激しいので単純に速度が落ちるし
混合精度も使ってるGPUの演算器構成によっては一部極端に演算速度が落ちる型があってネックになることがある

空いたメモリ分で同時生成したり出力解像度を上げることで実質的に多少低下分を取り戻せる
0185名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:51:16.15ID:jn2PTIMS
>>176
普段使いしているクラウド上にうっかりアップされていたら...とか、Colabで動かしてる時に生成されてGoogleアカウントごとBANとか
児ポまがいの画像が生成されて、何かの拍子に家宅捜索されたときに別件逮捕なんてこともあり得ない話ではない
0186名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:53:57.19ID:1uZk9t3I
アニメキャラが骨折してるなんて当たり前のことだからなあ
「三次元的に破綻していないドラえもんのイラスト」なんて物理的に存在しえないんだからAIが描こうが人間が描こうが関係ない
0187名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:54:42.83ID:6FMN8AvS
ID:OfpVbaR2 がまさに前スレで児ポ生成をやろうとしてたキチガイなんで
一緒に捕まりたくなきゃ触れないことをお勧めする
0188名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:55:43.39ID:hocSwwFi
それ今のAIだと、このキャラでいいから今度は脱がせて!みたいなことが現状できない
まあ一部で研究してるみたいだけどw顔はそのまま、みたいな指定やってるんでしょ
0189名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 08:55:45.51ID:DqzH7U06
StableDiffusionで素朴な疑問なのですが、conda版とローカル版の明確な違いってなんなのでしょうか?どなたか教えてください…。

一応認識としては、pcスペック関係無しにネット環境必須でGoogle負担のGPUで使用可能なのがconda版。GPUガチャ。
高スペックpc推薦でローカル環境さえ整えればネット環境有り(でGoogle介さず)にpcの内部GPUだけで使用可能になるのがローカル版。ローカルなのでGPUガチャ無し。

Twitterとかでちょこちょこ目にしたのですが、ローカル版ならオフラインで使用することも可能なのですか?
0192名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:00:06.02ID:6FMN8AvS
>>189
ColabはGoogleのGPUクラウドサーバーの余りをブラウザ経由で使わせてもらってる
業務用GPUで走るんでそこそこ速いしメモリもある
けれどもGoogleの機嫌一つで使わせてもらえなくなるかもしれない

ローカル版は文字通りローカルで自分が組んだ環境以上のことはできないが好きに使える
モデルデータも落としてくる場合であればインターネットが無くても使える
0193名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:00:13.66ID:DZNxogwv
RTX4070でいいかーと思ってたけど勢いで90買うまであるかもしれん
0194名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:01:45.90ID:QfU042L4
>>186
> アニメキャラが骨折してるなんて当たり前

昔はともかく最近はイラストもアニメも骨折してるようなのはあんまりないと思うw
表現のための3次元的な嘘はあるけど、流石に骨折はぼんやりみてても違和感があるからねえ
0195名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:04:03.25ID:Dtg22sej
>>185
別件逮捕ってそれもうSD関係なくないか…
そんなんで特定のサービスに対して「逮捕される可能性が~」とか言われるとそれこそ大丈夫なのかって思っちゃう
0196名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:04:07.30ID:69YAqvqT
顔だけアニメ風が出来ないんだよな
アーティスト名とかアズレン/グラブルみたいな作品名を入れると体にも影響して全体が崩れる
それにヌードとか入れるとやっぱりポルノサイトとかヌーディスト系の画像学習してるらしく
そっちの低品質なデータに引っ張られて顔も残念になりやすい
0197名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:09:22.36ID:DqzH7U06
>>192ありがとうございます。
え、本当にネット環境無しで使えるんですか…うわぁ…

一応ローカル版する為に必要なスペックのpcが最低で20万くらいの額と以前おそわったのですが、img2imgも同様のパソコンで使えるのでしょうか?
0198名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:10:30.48ID:QfU042L4
>>189
conda → Google Colab?

#condaというとローカルPCでPython環境を使うときのcondaとごっちゃになってるのか、Google Colabのそういう呼び方があるのか・・・

起動時間:  PC=比較的速い、 Colab=数分以上はかかる
性能: 30x0 , 20x0 > Colab T4 > 1xxxx >>65
VRAM: Colab(15GB)は大抵のコンシューマGPUより多い
ネット: PC=利用時不要、 Colab=必須
使用可能時間: PC=無制限、 Colab=制限あり しばらく使ってないと勝手に切れてまた起動数分待ちがダルい
複数環境お試し: PC=手順面倒かも?、 Colab=簡単

まあローカルGPUが20x0あるならローカル環境を使う、それ以下ならColabを使う

性能はColabを何回か使ってるけど、経験的には特に速くなったり遅くなったりはしてない。
遅いT4、速いT4なんてあるの?って気もする
0200名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:21:23.33ID:K1IGqCp0
もう少し用途に特化したAIが複数あるといいのかな?
人間+背景のみという前提で人間を部位ごとに丁寧にカスタマイズするというのは技術的にはできそうで精度も上がると思うんだけど
0201名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:29:36.79ID:QfU042L4
>>197
text2imgとimg2imgはいくつかやった感じ生成速度は変わらない

3060(12GB)なら15万円~
https://kakaku.com/pc/gaming-pc/itemlist.aspx?pdf_Spec115=200&pdf_Spec317=11-&pdf_so=p1
ここに乗ってるやつよりHDD容量とかは増やしたほうがいいと思うけど

多分だけど、3060(12GB)はちょうどGoogle Colab(T4 15GB)と同じ程度の速度っぽい(512x512で 3.5 it/s程度)

そういう意味じゃ性能が変わらずメモリが多いものが無料であるのに買うの?って気がしなくもない
まあAI画像生成以外にもゲームとか3Dソフトのblenderとか色々できるから、そういうものにも興味があればいいと思う
0202名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:32:51.10ID:+h3QnAhq
M1最適化されたらMacBook Air辺り買うのがコスパはいいんじゃない
0203名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:34:30.17ID:DqzH7U06
>>0198ありがとうございます、こちらも分かりやすいです。
Colabは、Google Colaboratoryのことです。紛らわしくなってしまったみたいで申し訳ないです。
Googleの機嫌で使えなくなるのは痛いので近いうちにローカル版使いたい…
0207名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:46:20.50ID:zyWvVtGI
>>196
https://twitter.com/cut_pow/status/1561151751373348866
数日前のだがdisco diffusionの方でマスキングが結構進んでたな
プロンプトを途中で分割できる機能でも頑張れば可能だと思われる
まぁ1つのツールで全部対応するのは得手不得手あるから用途によって使い分けるのが現実的じゃね
https://twitter.com/5chan_nel (5ch newer account)
0208名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 09:52:35.54ID:jy8fd1JG
これでまたGPU不足になりそうかね
創作用途だからマイニングと違ってヘイト対象にはならないかもしれないが
0209名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 10:08:05.20ID:8+FfZIrW
省メモリのGUI版に更新したけど表示されたWebページに飛んでも真っ白のまま変わらない
ブラウザ変えてみても同じだった
3.1.7の最新版gradioもインストールしてるんだけどなぁ
0210名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 10:09:59.93ID:WgxQgIco
>>208
金がもらえるわけじゃないから新作の人気ゲームが出た程度の影響でしょ
0211名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 10:10:06.17ID:LY2UcQV2
Chromeで日本語翻訳がONになってるとかない?

省メモリ版はしらんけど、waifu版は、日本語翻訳ONだとimg2imgが真っ白になるし、txt2imgもパラメータ変更不可能になる
0212名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 10:36:03.63ID:NZeLqYXb
>>206 >>208
google colabで無料でできること知れ渡れば
にわかがいちいち何万もするグラボ買うなんてしないだろうし
デスクトップすら持ってない人にはもっと大きな出費になるし杞憂なのでは?
マイニングバブルでのファームが買っていた量って数十万数百万個レベルだぞ
0213名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 10:36:25.19ID:69YAqvqT
こっちではGUI版ちゃんと動いてはいるけどブラウザを開いてると
GPUリソースが大量に消費される謎バグがあって普段使いとは別ブラウザで起動して
すぐにタスクバーにしまわないと駄目だな
0214名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 10:44:06.12ID:6FMN8AvS
>>213
4chanだと、Gradioの動作中アニメーションとプログレスバーのせいでブラウザの表示動作が常時GPUを食うようになって生成速度が落ちると言われてて
対策としてK-lms最新版のwebguiではアニメーション切られた

民間療法としてはその通り最小化するか別のタブに切り替えてアニメーション動作を止めるか
ブラウザのGPUアクセラレーションを切るか
別のマシンから遠隔操作するかだとさ
0215名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 10:48:56.18ID:PcxrIwK4
>>211
ブラウザのプライベートモードで実行してもダメだった
原因はわからんけどブラウザからgradioのスクリプトを読み込む時にエラーが起こってたみたい
gradioのissueを参考にして少し修正加えたら一応は動くようにはできた

optimizedSD/txt2img_gradio.py の最後にある
demo.launch() を
demo.launch(share=True) に変更
0217名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 10:51:31.94ID:6FMN8AvS
>>215
share=Trueはまずくないか?
そのオプションはxxxxxx(ランダム数字).gradio.appっていうURLで誰でも外からアクセスできるようにするヤツだぞ
0218名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 10:58:04.44ID:PcxrIwK4
>>217
確かにそのリスクはあるね
URLもシンプルだから総当たりすれば余裕で悪用できるし別の方法探したほうがよさげだね
0219名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 11:05:44.87ID:GsZbGmTm
すごい周回遅れの質問でごめんなんだけど

ローカル版って公式の設定ファイルいじれば制限解除できるわけじゃなくて
有志のカスタマイズ版をインストールしなきゃいけないって認識でok?

解説とか見ながら普通にローカル環境作っちゃったからローカル版の制限解除にどうしたら移行できるのかわからん
0220名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 11:08:56.14ID:69YAqvqT
情報量の多い背景の場合は人間の絵師を完全に超えているな
これで人間やアニメ絵がちゃんと描けるようになったら一部の有名人以外は
マジで終わりだね、さっさとそうなって欲しいわ
0224名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 11:27:14.43ID:wTZV2nUk
promptに絵描きの名前を入れると破綻が少なくイメージが近い絵が出るんだけど
これは果たして本当にAIオリジナルと言えるのか
0227名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 11:59:15.36ID:b8sl+t7g
環境構築とプロンプトでスレ分けたほうが良い
0228名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 12:03:31.97ID:ASukCAWM
自治厨だらけ
0229名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 12:07:06.14ID:b8sl+t7g
>>224
作家名や作品名を入れるのが著作権違反になるだろうね
0230名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 12:11:19.23ID:69YAqvqT
何だかんだでみんな上手くいったプロンプトは隠すから例のサイトもあんま上手くいかないって言う
0232名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 12:20:04.17ID:ZFbHQUra
バズってる整った画像見るとフォトショのゆがみツールとかで直してるんじゃね?とか思ってしまう
0234名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 12:32:25.44ID:TlvKzERq
今の段階だとそのまま使うんじゃなくて手直しするほうが効率いいだろうね
イメージ通りの服や道具みたいな構造物を破綻なく生成が難しいから

作品作りに実用するとしたら線画で細部を書いてそれを補助線として活用して
AI塗りを乗っけるみたいな方向だろう
0237名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 12:40:48.68ID:bgMQ/0YX
細部の調整は加筆して誘導すればimg2imgでなんとかなりそうではある
ただ、うまくいかない原因がワードにあることも。
illustrationとか入れると全身画の時に顔潰れやすいとか
ワードの組み合わせで解消できるかもしれんけど
0238名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 12:41:36.36ID:hocSwwFi
人物はだいたいガチャみたいな感じ。たまに元の絵そのものみたいのが出るし
https://i.imgur.com/stfDukr.png
こういうのはアイディアに使えそうだけど
ツィでみたのはもうちょっとデッサンよかった気がするんだが、、難しいな
0239名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 12:54:27.00ID:uCLwesYu
>>199
この話題に限らずお前みたいに痛いところを突かれたからって相手はこういう奴に違いない!みたいな無理矢理な返しをする奴はキモイよ
頭の悪さが露呈してるよ
0241名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 13:41:14.40ID:NlWt3JDX
エロ微妙じゃね
単に綺麗な高画質裸見せられても抜けないしな
自分の性癖にマッチした絵柄作れんと..
0245名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 14:41:34.59ID:M/HLpgpi
>>243
CLIP InterrogatorっていうColabのnotebookでしょ
StableDiffusionで使われてるCLIPだけ抜き出して画像から認識されたトークンの固まりを見せてくれる
0248名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 14:50:39.39ID:WCWmOzW9
>>43の上から三番目の奴を進めていって最後までガイド通りに勧めたつもりです
IPアドレスみたいなのからブラウザでインターフェースを開けたまでは良かったんですが
仮出力でtext2imgでcatだけ打ち込んでも下の画像のエラーが吐き出されて困ってます。
誰か助けてください。

もしかしてGPUが貧弱だってエラーが出てるんでしょうか? 私のPCのグラボはRTX2060
あとgoogle colaboの時に入力したトークンを このやり方だと入力してないのでそこも怪しいと思ってます。

”ERROR” ?ee; 4.07GiB reserved in total by pyTorch) if reserved memory is >> allocated memory

https://imgur.com/a/Ii4R0jq
0249名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 14:51:36.43ID:RAP75DmM
こういうので二次創作したり作家名入れて生成してるやつ盗作やってるのに近いな
自分で楽しむだけならいいが公開したら盗作と認定して問題ない
0250名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 14:52:34.34ID:6YPP1xAX
>>134
これのやり方全然わからん
pythonなんたら入れるだけいうから、コピペで入れたがエラー
input.jpgをcontentフォルダにstable~フォルダ作ってもダメ
0253名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:00:08.91ID:bW+JTxuc
syntax errorって書き間違いとかだから一番簡単では・・
自分で書き換えた部分がおかしいしかありえない
0256名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:07:33.06ID:6YPP1xAX
colabでのやり方見つけたと(やり方書いてないが)かいうのはググると出てくるからそもそもできないんのかな
0259名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:17:00.10ID:vxd1o7Th
Pythonというかプログラミングが何もわからないまま書いてある通りにcolabで始めて適当に書いてあるコード繋げ合わせて10枚出力できるようになったんだけど、毎回11枚分動いてて最初の1枚は見れない…
0260名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:26:41.40ID:bW+JTxuc
>>258
間違った
「^」で直接の場所が出てるはず、例えば

prompt = "A fantasy landscape, trending on artstation"
      ^
SyntaxError: invalid character in identifier

Pゴシックだからズレてるだろうけど、これは
prompt(半角スペース)=(全角スペース)"A fantasy ...
になってる、(""内はokでも、構文中で全角なんて認められない)
0261名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:31:09.28ID:69YAqvqT
何言ってるのか分からない人いるなとずっと思ってたけど
事前に用意してあるnote bookじゃなくてcolabに手動でインストールしてる人がいるのね
まあWindowPCに入れるよりは大分楽だろうけど手動セットアップは多少は苦労するわな
0263名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:36:27.76ID:M/HLpgpi
>>248
そうだそうだTips忘れてたわ
GFPGANの300MBぐらいのpthファイルをダウンロードしてきたと思うんだが
これを指定された場所に入れると顔の補正処理が有効になって余計にVRAM食って512x512の画像はVRAM6GBでは出力が無理になるんだわ
削除して立ち上げ直すと通ると思うよ

それでも足りないと言われるならHeightとWidthを512から減らすしかない
0264名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:39:05.22ID:k+pssYjE
>>260
どうも入力したワードでなくoptimized_img2img.pyを実行させる構文の表記自体が受け付けられてない
できたできた言っているしよくわからないなこれ
0265名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:43:41.96ID:bW+JTxuc
もしかして既存のnotebookとかじゃなく自分でcolab上に一から環境作ってるの?
それはさすがにわかんないわ、自分よりはるかに高等
0266名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:47:10.53ID:69YAqvqT
予想しない凄い画像出てくるときと全然駄目なときの落差が激しいな
youngって1単語追加するだけで絵がガタガタになったりしおる
0268名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 15:52:15.57ID:M/HLpgpi
>>266
若いって一言に言われても色々ある
それこそこれこそが自分が思う若さだ!っていう画像をCLIP Interrogatorに入れてその結果からキーワードを拾うといいのでは
0270名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 16:00:07.90ID:hocSwwFi
広い意味がある単語だと安定しないぽいね
Hayao Miyazaki new movie poster とかいれたら
ボブネミミッミみたいのが出て笑ったわ
0271名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 16:01:08.01ID:69YAqvqT
初心者→colabにセットアップ済のnote bookを使用
マニア→colabに手動でセットアップ
PG経験者→自宅PCに環境構築

出来なくはないけど完全初心者が自宅PCに構築するのは面倒だから
まずはnote bookを使おう、リソース制限されても月額1000円でpro使えるし
0273名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 16:09:17.70ID:bW+JTxuc
PCまぁまぁ詳しいけど、絵は練習したが人にお出しできるレベルは描けずタブレットが埃かぶってる
・・・というあるある層が殺到してる気がする、まぁ俺なんだが
CG板とは思えない賑わい
0274名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 16:11:28.24ID:M/HLpgpi
>>272
256はサイズが小さ過ぎて出力が破綻しやすくなると思う
タスクマネージャのGPUのVRAM使用量とにらめっこして、他にVRAM使ってるソフトがあれば終了させた方がいい
0.2GBぐらいがデスクトップだけの状態の標準
0281名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 16:45:24.80ID:isNyMC5f
めちゃくちゃ楽しいな。無限にやっちゃう
絵描けないけど自分だけの作品作れるの最高
ところで解像度もっと高くできないの?生成された画像が小さすぎる
0282名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 16:50:16.04ID:hocSwwFi
>>281
みんなどういう環境でやってるか知らないけど私はここで指定してるね
image = pipe(prompt, height=512, width=512)["sample"][0]
0287名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 17:52:34.76ID:o0loqUTt
不細工な顔のついた肉塊ばっかしかできない
ぐぐるたびたび切れるけど何でだろというか今朝作った垢のパスがわかんなくなってログインできなくなったw
0288名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 17:54:17.95ID:y9jnFobJ
>>286
そこらは単語でいくらでも制御できるでしょ
例えばMJだとflat designとか入れたら紙みたいな背景になるよ、SDも似たのあるはず
そこらの単語を調べて順次細かさを上げて行けばいい

・・って言うのは建前で、現状のAIって単純明快な線はめっちゃ下手糞なんだよねぇ
みんなimg2imgで修正してまで回してるのがその証拠
ごちゃごちゃ色つけて装飾するから粗が目立たないって誤魔化しが今の精いっぱい
0289名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 17:54:28.22ID:69YAqvqT
矛盾の無いように出来るだけ詳細に説明する必要があるな
girlだけだと滅茶苦茶になる
髪の色、年齢、表情、姿勢、背景、動作、服装を整合性の取れるように付けないといけない
それでもイラスト系の単語は体を壊すけど
0293名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 18:00:32.85ID:Kv3mpmre
なんか粘土ペタペタ貼ってるような作画だし、手直しするにしても線画からやらないと辻褄あわないんが難しい。
カラーラフくらいにはなるけど、色は自分で決めたくなっちゃう。
絵描きの雑感。
0295名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 18:01:08.92ID:y9jnFobJ
表面質感はほんと凄いよね
ゲームから学習しまくった結果なんだろうけど
特にアメリカ人はリアル系ゴテゴテ大好きだし
0296名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 18:02:31.26ID:y9jnFobJ
MJの--noは優秀
デフォだと、すぐピンクとか青蛍光とか入れてくるので、いろいろぶっこんでるわ
ちな複数は
--no pink,blue,fire
みたいな指定じゃないと動かない
0298名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 18:53:10.42ID:+HzDG7fi
>>297
コメント欄にもあるけど、一部グラフィックカードだと黒い画像しか出ないバグがあるみたい
(Stable Diffusion自体の問題で、本来は実行コマンドを調整して直すところがGUI側にその機能がない)
0299名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 19:06:38.22ID:LY2UcQV2
>>275
試してみました。 お手軽!だけどイマイチなので今後に期待
Stable Diffusion GRisk GUI 0.1 https://grisk.itch.io/stable-diffusion-gui

・rarファイルをダウンロードして、展開、Stable Diffusion GRisk GUI.exeを実行するだけで動く
・他のローカル環境と競合しない
・出力は画面上ではなく、フォルダ出力で自動的にプレビューできないので(今のところ)使い勝手はかなりいまいち
・HPに書いているようにSEEDは機能しない。Save In Gridもチェックできない、など開発中
・デフォルトが64x64になっているのでとりあえず動く人は多そう。普通は512x512で使うと思うけど
・私の環境(2080Ti)では、若干遅い。
https://rentry.org/kretard 7.3 it/s
GRisk 5.0 it/s
 basujindal 1.4 it/s
0300名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 19:10:11.10ID:LY2UcQV2
>>297,298
黒い画像というか、(デフォルトでは)resultsフォルダにPNGが出力されて、そもそも画面に画像プレビュー欄がないような

後txt2imgのみでimg2imgもいまのところない
0301名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 19:22:35.73ID:M/HLpgpi
GRiskって人はGitHubに転がってるキーボードポチポチしないと動かない便利そうなソフトを
GUIつけてWindowsで動くようにしたものをPatreonで配って稼いでる人
基本機能装備できたら配布版は更新止まって後はPatreon版に全部乗るようになるからそのつもりで使った方がいい
0302名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 19:31:07.71ID:wzypMg/1
SDはドラレコに弱すぎる
版権にも弱い
Craiyonだと簡単に出せるものがSDで出せなかったりする
進化の余地があることはわかるんだけどね
0303名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 19:31:39.74ID:RxPy6RIE
既出だけど、https://rentry.org/kretard のプロンプトマトリックスいいね
https://github.com/hlky/stable-diffusion-webui

キーワードを | でつなぐと、そのキーワードのあり・なしの組み合わせを一気に作ってくれる
(最初のワードは全てに入る)

girl | artstation | makoto shinkai | detailed face | highly detailed

だとこうなる。 https://i.imgur.com/mUcR4CN.jpg
0307名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 19:47:00.27ID:y9jnFobJ
980tiのCUDA駄目だった人間だけど、微妙~にNVIDIAのドライバver上げたら動いたよ
5日遅れでやっと追いついた

ローカルSDやったけどやっぱ遅いね、さすがVRAMが6GB
512x512のstep50が、1枚で3分半かかる、4枚で7分、5枚で8分

ローカルimg2imgはnonetypeエラーで止まったけど、--Wと--Hしてなかったのが原因だった
デフォでインプットの512x512のままにしてくれるみたいな親切な設計ではなかった
ツイッターの人のコマンド参考にすると文字制限で端折ってるので駄目ね・・
0311名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:07:24.28ID:F5OuPmFA
手でちょこちょこ修正して感じたけど、人物の絵の歪みが定量化されたら簡単にクオリティの高い人物イラストが生成される
生成された絵のうち「歪んだ絵」と「正しい絵」の数値化をすればいいだけだし、時間の問題かも
0312名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:10:28.76ID:tLC8w+Jc
4000番代でグラボ買い替えようかなとは思ってたけど欲求がさらに高まってきた
メモリ12GB以上のものにせねばならぬ
0314名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:15:44.67ID:69YAqvqT
>>311
そのタイプのAIは何年も前からあってあんまり話題にならなかった
今回の拡散モデルは絵のクオリティが全然違うから盛り上がってる
0315名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:16:40.67ID:NlGf4jm2
「AIがこれ描いたの!?」系の話題は最初だけだろうし変にこだわらずにガンガン手を入れちゃって良い気もしてきた
AIのべりすともそうだけどだんだんAIに書かせてるのか書かされてるのか分からなくなってくる感じが逆に楽しい
0316名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:19:35.77ID:69YAqvqT
拡散モデルは原理的に実写や細かいディテールのある画像に強くて平坦なアニメ絵に弱いから
それがアニメ用の学習モデルでどれくらい改善するのか気になる
個人的にはもう一段のブレークスルーが必要だと予想してるんだけど
0317名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:19:44.16ID:F5OuPmFA
AIの存在はクリエーターの活動に溶けて何がAIで何がAIじゃないのか分からなくなると同時に、既視感のあるデザインやイラストが増えるんじゃないかな
イラストの数が少なくかつ学習の難しい特徴を持つ絵柄だけが個性として生き残っていきそう
0318名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:25:02.58ID:69YAqvqT
凄く単純に言えばノイズを加えた画像から元画像を復元するよう学習させたのがMJやSDの拡散モデル
実写画像はノイズ加えても元の情報が残っているからこの学習が上手くいくけど
殆どが平坦で同じピクセルが並んでるアニメ絵にノイズを加えるとそこにはただのノイズしかなくて情報を持っていない
4chanでの下手な絵を学習してるのが原因では?という説は誤りでアニメ絵を学習出来ないのは原理的な限界
そこを改善できるのか?が注目だよね
0320名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:35:51.32ID:d0yfrXSy
陰影も一種の塗りのパターン化だからそこを詰めてパターン認識の蓄積で行けるんじゃないかなあ
すでにイラストに陰影込みで彩色するのあるけどそのまま転用は無理にしても
拡散モデルと切り離してそれ用に作る方が良さそう
0322名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:38:28.32ID:EJyQ1pV0
Emadさんのツイート。「生成」じゃなくて、「生成的検索」というのが面白いね。
「分散型&動的な次世代プロトコル」ってのがある程度具体的な話になってるのか、ただのビジョンなのか

@EMostaque
The intelligent internet.
Personalised generative search models for everyone that compress knowledge.
Image, audio, text & more.Distributed & dynamic - a protocol for the next generation.

This is how we build the foundation to activate human potential @StabilityAI
---
知的なインターネット。
知識を圧縮する、すべての人のためのパーソナライズされた生成的検索モデル。
画像、音声、テキスト、その他。分散型&動的な次世代プロトコル。

人間の潜在能力を活性化させる基盤はこうして作られる @StabilityAI
0323名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:40:32.30ID:EJyQ1pV0
>>319
「Stable Diffusion GRisk GUI 0.1」の正式版ってことですね
ベース(ソースコード、モデル)は公式の正式版そのものだけど、
GUIを付けて簡単に実行できるようにしたGRiskの正式版、ってことね
0324名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:42:58.56ID:EJyQ1pV0
>>318
なるほど、だからアニメ用モデルを別にリリースしますみたいな話になるのね
勉強になる

それはそれとしてデッサンが崩れてるヘタクソな絵が出てくると元データのせいでは?って思いたくなるw
0325名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 20:49:02.20ID:F5OuPmFA
写実的なイラストを描いてるタイプのイラストレーターをpromptに入れると絵柄が安定するけど、平面的な絵のイラストレーターだと不安定なのはそのせいか
0327名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 21:03:20.53ID:EJyQ1pV0
>>326
公式のcolab前からあったような?と思ったらこれ、新しいAPIのデモですね。
DreamStudioのメンバーシップないとAPI KEYがなくて使えない
0330名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 21:17:40.84ID:WCWmOzW9
頑張ってSDをローカルに入れたけど500×250ぐらいの出力が限界で全然綺麗じゃないわ
うーん流石にPC買い替えしたくなる
0332名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 21:22:08.65ID:69YAqvqT
waifulabやmakegirlsは本物/偽物を見破るAIとこの判定を突破するAIの対決による
相互学習でそれらしい絵を出す学習モデルでアニメ絵には向いてるんだよね
0333名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 21:22:37.76ID:bgMQ/0YX
顔潰れないようにワード詰め込むと、なかなか立ち絵になってくれない
ただ、有名人入れなくてもキレイな顔出るようになってきた
ワード選びのバランスが難しい
0335名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 21:32:04.99ID:y9jnFobJ
windowsが古くて260文字以上に未対応(レジストリもポリシーも不可)
img2imgで呪文入れまくるとフォルダが作れないという情けない状態
pythonわからないのでどう変更したらいいものか・・

os.makedirs(opt.outdir, exist_ok=True)
outpath = opt.outdir
sample_path = os.path.join(outpath, "_".join(opt.prompt.split())[:255])

このあたりだとは思うんだが、255減らしても駄目だった
つかそんなフォルダ名にするなよ・・
0343名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 22:03:13.63ID:69YAqvqT
プロンプトをフォルダ名にするのって後からでもプロンプト分かるから結構便利なんだよな
windowsのフォルダ名制限が厳し過ぎるのがいかんわ
どうせ物理的なアドレスと何も関係ないラベルなのに何で制限あるねんっていう
0344名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 22:05:01.43ID:AUsdt6Tp
imagetoimageをgoogleのcolabで使いたいんだがやり方まとめられた日本語のサイトってある?
翻訳かけながら色々やったけどうまく行かなかった…
0345名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 22:12:46.78ID:EJyQ1pV0
>>43 の最初の方のcolab (img2imgできる方)は今は動かない気がする
なんか特殊な手順とかあるのかもしれないけど

どっかに動くimg2imgのColabないかな
0346名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 22:18:27.66ID:EdzYCuJ8
>>329
遅い上に高い
月千円プランでAIに食わせるのに使われるのがせいぜいだろこんなん
0347名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 22:18:38.41ID:69YAqvqT
Crypkoみたいに没個性過ぎると沢山いる絵描きにAIさんという1人の新人絵師が加わりました
って感じになるだけだから特に何もインパクトはなく数年が経過しちゃったんだよね
MJやSDはあらゆる画風を出せるってのがこれまでになくてこりゃやばいってなった
既に実写系なら特定のアーティストの画風パクれるもんな、、、Wlopとか人気過ぎだろみたいな
0353名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 22:24:36.22ID:wzypMg/1
https://i.4cdn.org/g/1661411406913791.png
https://boards.4channel.org/g/thread/88284357#p88285430

female pope, big tits, highly detailed, intricate, magic the gathering, d&d, award winning, top rated, skinny, fantasy, oil on canvas
以下も入れたかな
dark, gloomy, desaturated, greg rutkowski
https://i.4cdn.org/g/1661412160633735.png
https://boards.4channel.org/g/thread/88284357#p88285554

beautiful handsって入れろよ
https://boards.4channel.org/g/thread/88284357#p88285665
0354名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 22:28:23.74ID:WCWmOzW9
>>331
同士いた~ 風呂入って考えたけど、PC買い替えるよりGOOGLE COLABOの月1000円コース申し込んだ方が
なんかあったとき融通効きそうでこっちを前向きに考えてます。
0355名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 22:31:13.04ID:uCLwesYu
>>242
ID:OfpVbaR2
ちゃんと文章見えてるか?まさに俺が指摘した通りの返しになってんじゃん?
自己紹介して自滅してループして死ぬだけの虚しい人生お疲れ
0356名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 22:41:59.45ID:y9jnFobJ
>>343も一理あるので

def left(text, n):
return text[:n]
・・・
sample_path = left(os.path.join(outpath, "_".join(opt.prompt.split())[:255]),150)

にしたよ、頭から150文字取る
たぶん本来は255の方でなんかするんだろうけど、動いてるからいいや
0361名無しさん@お腹いっぱい。
垢版 |
2022/08/25(木) 23:25:04.57ID:V9wOObE6
basujindal版って最初からcheck_safetyが消されてるんだな。
grepして無いなあと思ってたがCompVisのtxt2img.pyとdiff取ったらcheck_safetyの部分がスパッと削除されてたわ。
0367名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 00:47:42.88ID:SWDfWijj
>>366
これすげえよな
img2imgに完全に残す部分のマスク自由選択機能と
弱いimg2imgを段階的にかけていくフローが搭載されてる
世界最強に近いフロントエンド
0371名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 00:57:27.04ID:o3NpW9jG
現時点でbeautifulとかcuteみたいな形容詞はほとんど無駄かも
https://i.4cdn.org/g/1661442205411192.jpg
https://boards.4channel.org/g/thread/88287881#p88290273
広く使われる言葉はダメかも (かわいいとかの方が有効?)
https://boards.4channel.org/g/thread/88287881#p88290351

綺麗な出力が欲しいってだけならgreg rutkowskiほぼ一択
ミュシャはおそらくトレーニング不足
https://i.4cdn.org/g/1661442369934289.jpg
https://boards.4channel.org/g/thread/88287881#p88290314
https://i.4cdn.org/g/1661442716455937.jpg
https://boards.4channel.org/g/thread/88287881#p88290385
0374名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 01:19:04.35ID:SjnZS+HX
>>366
インストール中

>>371
> 綺麗な出力が欲しいってだけならgreg rutkowskiほぼ一択
みんな入れてるよね
検索してもD&Dのドラゴンみたいな画像しか出ないからなんでかなぁって思ってた
0377名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 01:23:39.25ID:nqlpUObU
呪文の単語数や文字数の上限があるらしいのですが具体的な文字数単語数ってわかりますでしょうか
0383名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 01:39:55.94ID:o3NpW9jG
> If your conda installation is somewhere that isn't \Programdata\miniconda3, adjust the path in webui.cmd accordingly
おま環だった
0385名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 01:43:52.48ID:SjnZS+HX
>>380
ありがとう、httpだった・・キター!

> あとこのガイド
> conda env create -f environment.yaml
> を飛ばしちゃってない?
webui.cmdでバッチ化した模様
0389名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 02:20:26.92ID:2/9t2zeE
しかしやりたいのは向こうにとってはペドの日本人的若い女の子のえろだけどメモリ2GBではどうしようもないから数年後かなあ
というか基本の部分蓄積できてからのほうがよさそうだ
0390名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 02:36:32.03ID:h91oFyDt
数十年後

「AI国際連盟はAI創作の発展に図らずも寄与したとして
Greg Rutkowski氏に貢献賞とゲーミングPC「ガレリア」(提供ドスパラ)を贈呈しました」

Greg Rutkowski氏「びっくりです。勝手に名前を使われ創作という名のパクリに利用されていたら賞を貰えました」
0391名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 02:52:18.78ID:YJdMz7aW
自分で作り上げたロリショタデータでハードコアポルノ動画とか
作れるようになったらAI 規制法とか出来るんだろうなぁ
0398名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 03:28:11.81ID:31QdF/+f
>>397
prompt
actress, teen, blue eyes, dark hair, pale skin, intricate, top rated, highly detailed, illustrated by Greg Rutkowski | by Greg Rutkowski | by Greg Rutkowski, by Greg Rutkowski
Steps: 250, Sampler: k_lms, CFG scale: 4.5, Seed: 1540371425, Prompt Matrix Mode.

デフォ:actress, teen, blue eyes, dark hair, pale skin, intricate, top rated, highly detailed, illustrated by Greg Rutkowski
V1:actress, teen, blue eyes, dark hair, pale skin, intricate, top rated, highly detailed, illustrated by Greg Rutkowski , by Greg Rutkowski
V2:actress, teen, blue eyes, dark hair, pale skin, intricate, top rated, highly detailed, illustrated by Greg Rutkowski , by Greg Rutkowski, by Greg Rutkowski
V3:actress, teen, blue eyes, dark hair, pale skin, intricate, top rated, highly detailed, illustrated by Greg Rutkowski , by Greg Rutkowski , by Greg Rutkowski, by Greg Rutkowski
0400名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 04:42:55.08ID:Ar08D0Fk
街歩いてたら看板の字がバグってて異世界に行ってしまった系の都市伝説みたいな写真描けるので楽しい。
0401名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 04:48:32.39ID:J5H4Y39B
>>399
このwikiのEmphasisの項にも[]は現状機能してないっぽいとあるね
https://wiki.installgentoo.com/wiki/Stable_Diffusion

あと同じ強調呪文の繰り返しも効果あるって書いてるので
ID:o3NpW9jGさんの検証結果とも一致する
0402名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 04:51:18.61ID:JIdTrYQS
>>366
GUItardの新機能抜粋 https://rentry.org/GUItard
・設定が手順が楽になった

★マスクペインティング: 画像の変更したい特定の部分のみを再生成するための強力なツール
・ループバック: 最後に生成されたサンプルを自動的にimg2imgにフィードバックする。
・Prompt Weighting (NEW):プロンプトの重み付け。プロンプト内の異なる用語の強さを調整

・サンプラーが増えた
 ・k_euler_aとk_dpm_2_aサンプラーは、同じシードとプロンプトから、非常に異なる、より複雑な結果をもたらします
 ・他のサンプラーとは異なり、k_euler_aは低いステップから高品質の結果を生成できます。50 ではなく 10 で試してみてください
---

マスクペインティングのやり方分かる人いますか?
アルファ消去するとそこ補完してくれるのかな?とか思ったけどうまくいかない(消した部分がそのまま黒くなる)
0403名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 05:08:55.62ID:JIdTrYQS
>>402
自己解決。単純に元画像の上にマスクを書き込むことが出来ました。

元画像の表示サイズが小さくて塗りにくい。もうちょっと改善して欲しい。
生成もちょっと試した感じでは自然にならなかった。

後多分バグで、「マスク部分を再作成」で複数生成すると、1枚目はそうなるけど、2枚目は逆にマクス部分以外を再生成になってる気がする。

ついでに、インペインティング可能なノート
https://colab.research.google.com/drive/1whhIiXxjQjbBuiq4lqwh-AlLIjh3l1OB
0407名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 05:57:00.57ID:2VbkagvJ
美しいポートレートはちょいちょい生成できるようになってきたが
シチュエーションころうと思い始めると途端に難しくなるな
0410名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 06:05:48.55ID:S/rJEOX+
海外ではおばさんとかにもbeautiful ladyとか普通に言うから
もうただの挨拶みたいになってるんだよな
0411名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 06:06:15.28ID:JIdTrYQS
512x512生成のざっくり性能。少し更新

it/s = 1秒で何ステップ実行できるか。(例) 50 stepで1080Tiの場合、50step / 2.3 it/s = 21.7秒かかる

16xx(6GB) ---  512x512では動作しない ※
980ti(6GB) 0.36 it/s (2.81 s/it)
1070Ti(8GB) 1.60 it/s
1080Ti(11GB) 2.30 it/s
Google Colab(T4) 3.2 it/s ~ 3.8 it/s
3060 3.5 it/s
2060 4.6 it/s
3070 6.3 it/s
2080Ti 7.3 it/s ~ 7.73 it/s
3090 10.8 it/s

注 16xxは6GBメモリだが、出力がグリーンスクリーンになる問題があり、full精度にしないと動かない。
   そのためVRAM消費量が増え、512x512では動作しない。解像度を下げる必要あり。
0414名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 08:46:38.94ID:UDqjZjWY
もうすぐこれらの3D生成版が出来るってマジ?!
objやFBXを一瞬で作ってくれるの?!
0416名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 09:24:52.48ID:YzJhqtmk
>>414
3D用のA学習Iモデルをリリースする予定ってツイートがあったのは確かだけど、
 (1) 画像・テキストペアデータは50億のデータデータセット(LAION)があったけど、3Dモデルが何十億もころがってるわけない
 (2) CLIP(画像と言語の対応関係をWEB学習)+DDIM(ノイズ付与+復元学習による高精度化)は使えないので全く別のAIになるはず
なので、何がどの程度できるものなのかは全然分からないね

画像よりははるかにハードルが高いのは確かでどうなることやら
0419名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 09:31:07.84ID:SsqIEZdF
スクリーントーンが最初出てきた時も「人間のかけ網と比べたら月とスッポン」って言われたけど結局普及したよね
AIもそうなるよ
0420名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 09:36:18.84ID:E2Vlw8ZM
>>416
めっちゃ素人考えだけど、今のMidjourneyもStableDiffusionも、学習時点で
「これは笑ってこちらを見ているエマ・ワトソン(美人)(緑の服)のイメージ」と画像をテキスト情報に判別してから学習している
(ファイル名とか画像についてるタグだけ見てるわけじゃない)

ならポーズ判別して学習してもいいはずで、ポーズが確定するならそこから3Dモデル+テクスチャにすることもできそう?
いや服はかなり難しいか・・・。ポーズだけじゃなく服の形状理解しないといけないからそれは流石に無理っぽい

まあ妄想の域を出ないから今の技術の使い方を考えつつ待つしか無い

ちょっと調べた感じ、MidjourneyやStableDiffusionの技術は最新ではないのでもっとスゲーのがMicrosoftあたりから出そうな気もする

>>418
来月リリースされる"audio"モデルってなんだろうね
雨、衝撃音、みたいなサウンド、音楽、人の声とか色々あるけど
0421名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 09:37:45.50ID:S/rJEOX+
動画作ってると効果音がすごく困る。フリーサイトでは全然思ったものがないし
そういうことが減るといいけどなぁ
0422名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 09:40:37.37ID:UDqjZjWY
>>416
フリーデータ収集タイプだと時間かかりそうだなぁ…
著作権的にもクリアなAIが一から生成するタイプになってくれたらありがたい…
ある物体の各方向の画像から3Dデータを作って、それを原本的に使うとか…
よくわからんけど…
0425名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 10:04:37.59ID:ggEkXtQg
基本的な事を聞くようで申し訳ないけどAIの画像生成ってプロシージャルとは違うの?
自分の手元に出てきた画像が既存の絵や他人の画像生成と同じになる可能性はほぼゼロ?
0427名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 10:17:48.42ID:9bRVI9C4
>>425
言葉の定義の問題かもしれないけど、普通使う意味のプロシージャルとは違うね
他と同じになる可能性は当然ある

テキストエンコーダ+イメージジェネレータの組み合わせで

1.画像を「こっちを見てる猫」「ロボットのような半面を持つサルバドール・ダリの鮮やかな肖像画」・・・みたいに分析して画像と関連付ける
https://i.imgur.com/rNl4e0Y.jpg
https://i.imgur.com/RZr0oGw.jpg

2.(拡散確率モデルの場合)のノイズを加えて元に戻す方法を学習をして画像生成を行う
https://i.imgur.com/vStOKue.jpg

各社色んなモデルがある
https://i.imgur.com/3vUZLoy.jpg

元のスライド見たほうがいいと思うけど一応抜粋。 https://www.slideshare.net/cvpaperchallenge/foundation-models
0428名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 11:11:58.16ID:lsjqrsdd
>>426
めっちゃ完成度高くていいな
greg rutkowski でググるともっと激しいタッチの絵がいっぱいでこの絵とは似てないけどなんでこうなるんだろうw
0430名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 11:29:40.70ID:aaawy5+6
>>429
自然言語じゃなくて、決められたタグで生成するのね
使用感としては生成するというより、単に画像検索してるだけな感じであまり面白くはない

いくつか見た感じ、顔も体の構造も壊れたものが少ない
(足が割れてたり、顔半分が潰れてたり、乳首が3つあったりするものが稀にあるけど)
人体が破綻しないようなAIを使ってるのか、人力で画像選別してるのかどうなんだろう
0431名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 11:31:54.78ID:Wquv7ko0
>>425
言葉のイメージとしてプロシージャル生成は、髪型はパターン2、目はパターン4、口元はパターン3で顔を組立てる、みたいな感じがある
0437名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 11:48:11.43ID:MgLgG5kM
検索するとセーラー服おじさんもDALLに熱中してるみたい
AIでもなかなかあの姿は生成できないだろうに
0439名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 12:06:23.71ID:DjD0+uFq
人物の手足グニャグニャは現時点では以下のように
指定画像から画像を生成するのが一番かなーと思う
でも手の指はむずかしい

#stablediffusion の #Img2Img (指定画像から画像を生成する)機能を使ってみました。
3分で描いた指示用雑絵(2枚目)に絵の要素のプロンプトを指示し1枚目を生成しました。
2枚とも生成時・指示時のもので、無編集。
https://pbs.twimg.com/media/Fa6n5_SagAA0h10.png
https://pbs.twimg.com/media/Fa6oOnIaQAcUSCy.jpg
0440名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 12:12:20.33ID:SjnZS+HX
>>305の人がそこらは詳しくレポしてくれてたんだけど、消されちゃってる
手修正交えてi2iで回してたけど、とにかく上手くいってない感じだった
0441名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 12:26:40.68ID:4KWrOa+f
来月リリースする"audio"ってなんだろうと思ってたけど、githubに作業中の項目書いてるね
1つ目は声を高くしたり低くしたいみたいな音声変換?(よくわからん)
2つ目はtxt2imgに、既存のGLIDEも使えるようにするってこと? >>427の絵を見るとtext encoderがclipからtransformerになる?
3つ目はテキストから音声読み上げ(TTS)、文字から音を生成?

https://github.com/huggingface/diffusers

A few pipeline components are already being worked on, namely:

1. BDDMPipeline for spectrogram-to-sound vocoding
2. GLIDEPipeline to support OpenAI's GLIDE model
3. Grad-TTS for text to audio generation / conditional audio generation
0443名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 12:40:15.22ID:MJLahhC0
Colabに構築したシステムに書き込んでるプロンプト情報や出力情報も、やっぱ本家に収集されてる?…
それならちょっと恥ずかしくなってきた(´-`)……
0446名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 12:50:51.86ID:MJLahhC0
>>445
そうだったの?!!!!
「エロい絵っぽいから黒塗りしとく」って言われたんで完全に監視されてるんだと思って一時間前から一切作るのやめてた!
海の向こうの人間たちに「こいつさっきからキモい絵ばっか作ってんな」「こいつの個人情報全世界に公開してやろうぜ」
って流れになってんじゃないかと思ってビクビクしてた…
収集されてないなら胸を張って作れる(´-`)!
0447名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 12:53:03.14ID:SWDfWijj
>>441
BDDMPipeline スペクトログラム(周波数と時間軸で音の成分を表現した画像)から実際に音を作る仕組み
→前段に「欲しい音のスペクトログラム画像を作るAI」が居れば音が作れるという下ごしらえ

GLIDEPipeline プロンプトへの忠実性としては世界最高峰と言える画像生成手法GLIDEをオープン実装する

Grad-TTS まだGANが主流で前時代的となったText To Speech(文章を読ませる音声合成)にdiffusionを導入する
0448名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 12:57:02.09ID:DjD0+uFq
AI画像コミュニティで #stablediffusionの #Img2Imgに3Dモデルを指示画像使用している人がいたのでクリスタの3Dでポーズ取り、目だけ描き込み→生成
設定補正小(2枚目) 補正中(3枚目) 補正大(4枚目)
指示文に髪・服・装飾などの情報は入れてない
指示絵が描けなくても3D人形使えれば絵になる
https://pbs.twimg.com/media/FbC0GrwaAAIhCTf.jpg
https://pbs.twimg.com/media/FbC0HKpagAA4KIm.png
https://pbs.twimg.com/media/FbC0Yt5aMAM3E4f.png
https://pbs.twimg.com/media/FbC10cCagAIJm5o.png

参考で
0449名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 12:57:40.24ID:4KWrOa+f
>>447
ありがと!
なるほど1番目はエンドユーザーが直接使うものではなさそうですね
来月でる"audio"モデルというのは、BDDMPipelineなのか、Grad-TTSなのか。 後者なら遊べそうなので期待
0450名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 13:11:57.16ID:IKhnqUWq
pixiv kawaii digital artでかわいい絵の命中率上がってた気がしたけど、もっといい呪文あったんだ…感動的
0451名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 13:17:53.64ID:QGhIHI1C
某所ではミュシャと水木しげるを同時召喚することで絵柄の癖を相殺して安定した顔を生み出す呪文が開発されたと聞く
いよいよもって黒魔術あるいは一周回ってサイバーパンクじみてきて面白い
0452名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 13:19:53.31ID:3lA/3zYt
後ろの方にKyoto Animationを入れると少しだけ絵が柔らかくなる
後ろの方にtrending on artstationでさらにイラストっぽくなるがこっちは壊れやすさも増す
anime.pixivは破壊力が強すぎて使っちゃダメ
0455名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 14:08:09.29ID:SsqIEZdF
普通に25yo girl in akihabara, sweet lolita fashion とかで可愛い女の子出るよね
変な呪文唱える必要ないよ
0461名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 14:26:09.52ID:4KWrOa+f
>>460
このスレでもそうだよw
0467名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 15:30:07.25ID:3lA/3zYt
学習元のデータセットのLION-5Bの58億5千万枚の画像には世界中から無差別に収集したアウトなのが大量に含まれてるのに
それをネットで公開して世界中にバラ撒いても許されるってのが規制の厳しい日本じゃ考えられんな
法律無視して単純所持で逮捕されるような画像を勝手に大量収集しても許されるグーグルみたいな特権的巨大企業しか
AIって無理じゃね?って想定が一気に崩されて世界が変わった
0468名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 15:36:19.31ID:zu61kmTt
>>467
それは真逆で機械学習のデータについては日本は無法地帯ってレベルで緩いよ

まあアレクサとか盗聴器を家庭に設置するようなことはできてないけど、法律規制の問題じゃない
0472名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 16:19:43.86ID:Yh7v5au2
>>434
メモリ少なすぎるだけでは
手元のMacメモリ64GBで1分ちょいだった
とはいえCPUで無理くり動かしてるだけだからMetal最適化待ちだな
0473名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 16:20:01.25ID:3lA/3zYt
およそこの世界のありとあらゆる画像データ公開されちゃったから
AIの技術革新が進めばおよそ何でもできるようになっていくんだろうな
パンドラの箱が開かれた感じ
0474名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 16:30:24.12ID:dE3nz1Ed
元々の仕組みからすればもっと分割してレンダリングするとか
少メモリで高解像度いけるようになるよねぇ
そうなったらもっと遊べると思うんだよなー
解像度上がるだけで細部潰れるのとか解決しそうなんだよね
0476名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 16:40:36.69ID:3lA/3zYt
img2imgは現状だと落書きをマシにするにはいいけど元データの品質がある程度高いと劣化にしかならないね
クリスタの3D人形レベルならいいけどMMDで出力したキャラですら劣化するから3Dでいいなと
逆に背景は3Dでは処理が重くて厳しい高層ビルから見下ろした風景とかを上手くやれば出せるから有用度高いね
0477名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 16:43:01.41ID:AfXBNqcc
>>366
質問です
これ手順通りにやったんだけど
6GMあるのにグリーンスクリーンになります

それで下記の通り説明されてたんだけど……

グリーンスクリーンの修正:
次のパラメーターを使用して webui.cmd を編集します:
" python "%CD%"\scripts\webui.py --precision full --no-half"
(注: これにより vram の使用率が大幅に上昇します)、解像度を下げる必要がある場合があります。

このパラメーターの使用方法がわかりません……
わかる方教えてください
0479名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 16:52:49.08ID:UyUIEwKp
現状でもストーリーや文脈のないキレイなだけのイラストはAIガチャだけで生成されるからこれから様々なメディアに大量に投稿されるかも。それも今の数十、数百倍
AIを用いたイラストを使ってるってだけで毛嫌いされる時期が訪れるかもしれん
0480名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 16:53:16.43ID:3lA/3zYt
正直今のレベルならキャラは3Dソフトのほうが全然いいけど権利問題を誤魔化せるって利点があるんだよね
イリュージョンの3Dを下絵にして大ヒットして億単位の売り上げ出した某同人ゲームが著作権で叩かれて
販売停止された事件があったみたいにずっと絵の省力化には著作権問題が付きまとってきた
メーカー側が著作権フリー宣言してるソフトでも今度はユーザー製のMOD使ってるとやっぱり袋叩きでみんな委縮
AIは世間が理解できなくて許される雰囲気あるから一度誰かが先行して商業OKな実績出来たら雪崩を打って使われ出すと思う
0483名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 17:04:46.97ID:WL/0wI51
>>477
「scripts」フォルダのなかの「relauncher.py」ってファイルの
os.system("python scripts/webui.py")
って行を
os.system("python scripts/webui.py --precision full --no-half")
にすればいい
0484名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 17:09:32.44ID:3lA/3zYt
>>482
これまでは法律も証拠も関係なく似ているというだけで叩かれてアウトだった
髪型が似ているとか似たような構図が特定の作品との間で多いというだけで差し替えや販売停止
それに比べてAIだと多分画風丸パクリでも許される流れになってきてる
0486名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 17:11:49.02ID:loAKIiRJ
>>477
書いている通りですが、

webui.cmd というファイルがあると思うので、それを編集して以下の行を書き換えればいいと思います。

python "%CD%"\scripts\webui.py



python "%CD%"\scripts\webui.py --precision full --no-half


多分Geforce 16xxだと思いますが、解像度を下げる必要があり正直実用的じゃない気がします。
Google Colabを使ったほうが良さそう
0487名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 17:12:11.33ID:K8bYA1rq
colabは導入簡単で良いね
ただこれで触ると楽しいからもっと良い環境で使いたくなる
0492名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 17:59:57.24ID:3lA/3zYt
img2imgに写真食わせて背景作ると初心者が写真トレスしたときにありがちな
間違いとか誤魔化し多発するから絵を描く人にはやっぱり一発で分かるね
描かない人はそこまで気にならないだろうけど有名絵師の写真トレスとかも
同業者は叩かないだけで全然バレバレだからね
0496名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 18:26:04.94ID:3lA/3zYt
GUI版で重くなるのあのアニメーションが原因じゃないな
別ブラウザでもとにかくjavascriptでアニメするようなページ開いてると同じことになるわ
0497名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 18:26:49.10ID:180gjllU
前スレから沸いてるペドガイジ↓一応自分が馬鹿という自覚はあるらしいね

158名無しさん@お腹いっぱい。2022/08/25(木) 05:53:26.27ID:OfpVbaR2
>>155
フィルター解禁版使ってみたいけど

ハードル高過ぎ何をどうしたらいいかわからんw

馬鹿にでもわかるような解説出ないかなぁ
0501名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 19:01:04.36ID:3lA/3zYt
いったんアニメ絵は忘れてまず基準になるようなフォトリアルな
現実そのものの服装出せるプロンプトってどんなんなんだろ
例えば学生服とかで
0502名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 19:01:37.96ID:AfXBNqcc
>>488
>>483
お礼言うの忘れてたんでありがとうございます。

できはしたんですけど
重たすぎてすぐ固まってしまい
自分の環境じゃ厳しかったです
0503名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 19:02:34.16ID:AfXBNqcc
>>500
最終手段はそうします……
すでに昨日別件で4chで聞きました……
0504名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 19:15:12.31ID:3lA/3zYt
>>499
そこはインストール先決めてるだけだから
マウントされた/content/drive以下の好きなフォルダを指定するだけだよ
あとこの設定だとグーグルドライブに出力した画像が保存されるから
アウト画像生成すると通報されるぞ
0507名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 19:51:46.42ID:+7yKirg9
>>499
これはモデルを既に自分のGDriveに保存している場合、それを使うという設定で、他の方法でダウンロードしているなら実行不要です。

上にある以下の2つのどちらかを実行すればOK。その下のHuggingfaceも不要です。
!gdown
%cd stable-diffusion
0510名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 20:23:34.06ID:AfXBNqcc
>>504
>>507
ありがとうございます。

重ねての質問で申し訳ないですが、
Load modelでもエラーが起きます
これもわかったりしませんか?

https://imgur.com/JfsHVj4
0511名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 20:31:50.87ID:MJhko+at
>>510
モデルがないってエラーだから>>507のモデルをダウンロードしてないか、ノートのバグかどっちかでは
ただモデルダウンロードしても、俺はそのノートブックが動かせたこと無い(他のノートは問題なく動く)ので詳しいことは動かせた人に聞くしか・・・

後動かしてるのがOptimizedSDだけど、それめっちゃ遅いから止めた方がいい
みたいなこともあってそのノート俺は嫌い
0512名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 20:41:00.53ID:AfXBNqcc
>>511
そうなんですね……
なんとか自分のPCでもImage 2 Imageを動かしたくて調べてます……
ただ素人なんで苦戦してますが……

おすすめのノートあれば教え欲しいです
0515名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 22:26:45.33ID:itcnfXXK
3DCGのtエクスチャ用途にバリバリハマってるわ…
これ2048+2048とかできんのか??

512じゃ解像度たらんのよー
0516名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 22:35:02.89ID:bvKjza8h
>>515

>>342
テクスチャといえばこのシームレステクスチャも便利そうね。試してないけど

解像度は3090(24GB)でも896x896が限界らしい
メモリ最適化版なら多分もっと行けると思うけど
0522名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 23:08:44.11ID:cTO6c8YE
キャラがへなちょこと不気味の谷を超えて可愛くなり、おっぱいも見飽きた今、いったい何をするべきか。
0523名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 23:13:46.33ID:o3NpW9jG
ひたすら無駄な詠唱を削るためにwebuiのマトリックス機能でテストするといい
その分他の属性にリソースを割くことができる
0524名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 23:24:31.09ID:bvKjza8h
>>512
これはキャラも背景も一定してないから、ベースのアニメをimg2imgでインプットして同じプロンプトで画像生成してるだけな気がする。
一定しないのを演出風に見せてるだけで
0528名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 23:39:39.69ID:16ttzI0o
生成できた絵で上手くいったやつ上げてほしい
手直しなしの状態で
0529名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 23:43:31.08ID:SWDfWijj
k_euler_aサンプラーすごいな
説明書き通り20stepぐらいで収束する

けどk_lmsと違う絵になるのが玉に瑕
破綻するわけじゃないからプロンプトとの相性次第か
0530名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 23:48:03.82ID:bvKjza8h
サンプラーの違いは、 https://rentry.org/GUItard の一番下に分かり易いのあるけど
k_euler_a、k_dpm_2_aが独自の進化するような感じ

k_euler_aは、サンプル数増やすと正常進化じゃなくて、変異が大きく見える

この例が一般的な傾向になってるか分からないけど
0532名無しさん@お腹いっぱい。
垢版 |
2022/08/26(金) 23:58:16.37ID:16ttzI0o
>>531
ありがとう
眉毛?に笑ってしまった
0537名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 00:09:53.10ID:55tw+Qxr
>>533
すげえなこれ
ある程度複雑なポーズとかはi2iじゃないと難しいかな
0541名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 00:17:40.04ID:x6WjdKCc
Colab構築版img2imgはjpg保存の選択とか出来ないのかな
リアル系画像だとデフォルトpngよりデータサイズが数倍大きくなっちゃって大量作成すると一日で合計1GB超えちゃう…
0542名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 00:18:31.60ID:0Q+OyymB
>>538
質問がわかりにくいねw
GUItardならランダムシードの結果のシードがいくつか出る

ファイル名がシード値になってたりするけど、どのツール使ってるかで違うね
0544名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 00:19:18.97ID:55tw+Qxr
>>538
なんちゅうか「そういうAIだから」と言われればそれまでだが
画風の振れ幅がすごいな

>>539
あいつの場合絵師だから、ほぼ全部自分で描いて
「AIが一発で描きました!ヤバイヤバイ!」ってやろうと思えばできるんだよな
0546名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 00:25:39.67ID:4eKDvHgi
AI絵を自分の絵って詐欺、の逆かw
教えてもらったほうが参考になるっちゃなるけど、まあいいんじゃないの
0548名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 00:28:55.26ID:LudICNb0
>>537
テキストだとポーズは諦めた方が早いと思う
腕とか足制御してそこから顔が当たるのお祈りするよりportrait paintingで胸から下バッサリ捨てた方がまだ当たりやすい気がする
手を出すと数とか形もぐにゃぐにゃのままだしね
0549名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 00:32:27.94ID:55tw+Qxr
>>548
そこはやっぱりそうなのか
なんかAIの得手不得手が人間のそれとあまりに違いすぎて混乱するな
0552名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 00:47:53.87ID:yp8wo02v
pixivの古い絵辿ればわかるけど
もともと写真加工背景によくある萌えキャラ絵を色合わせして描いてた人なんで水を得た魚状態
AI背景生成とは運命的な出会いだろう

本人にしてみれば、昔からやってたからここまでできるんだ=バズったしもう断り要らなくね?
みたいな、よくわからない増長があるんだろうな
0555名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 01:16:40.26ID:OU07VRpA
980tiだが、>>366がなぜか512x448以下じゃないと動かない、直打ちのOptimizedSDは問題なかったのに
全然動かないよりはマシだけどモヤモヤする、ほんのちょっとどこかから持ってこれんものか・・
0557名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 01:23:26.52ID:OU07VRpA
>>556
ありがとう、でもまだ入れてない

あとimg2imgでできた画像が微妙に拡大されてるのが嫌だ、なぜ100%で表示しないのか
くわえてCopy selected image to inputが滅茶苦茶時間かかるのが謎
元にコピーするだけなのになぜ「drawing」?生成したのをD&Dしたら一瞬
0558名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 01:47:02.35ID:mZXdx8Aa
これって作成した画像を商用で使う時もMITライセンスの規定通り
Copyright (c)2022〇〇
Released under the MIT license
リンクアドレス

みたいにする必要あるの?
それともソフトウェアを再配布や販売した時だけ?
0559名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 02:02:58.32ID:rGPZhQgU
>>547
これ参考にやってみたけど、
画像みたいにでてできないや……
model.ckpt'はちゃんとマイドライブに入れているんだけどなぁ
ここ数日img2imgのため時間無駄にしてるなー
わかる方教えほしいです

https://imgur.com/a/m3C1COd
0560名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 02:31:06.50ID:OU07VRpA
craiyon元にimg2imgで変なのしか出なくてつまらんと思ってたけど、自分で描いた>>439下みたいな単色付き雑絵元に
新海とかgreg rutkowski とか入った呪文で、strength0.5、step50の5つくらいバッチで回したらいきなり面白くなってきた
これほんと革命だわ・・
craiyon出力のごちゃついた絵じゃなく、ほんと単純な線こそいい
0561名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 05:42:09.17ID:soUy0mxj
Pythonコマンドから実行がなんとなくゴテゴテしてなくて最速だと思ってたけど
WebUI版の方が読み込み済みプロセス流用で1回生成あたりは早くなるのね

本家 35秒
basujindal版(CUI) 64秒
hlky版(GUItard) 13秒
0562名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 06:33:52.08ID:nfjXgkLu
あからさまに誰かのtwitterアカウントの痕跡が出て笑った
https://i.imgur.com/3zL6XsS.png
0566名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 09:02:25.99ID:nSJ/aIoh
>>558
プログラムだけ
生成物には関係ない
0570名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 11:47:17.91ID:fS1mdW6z
プロンプトの区切り方に決まりや強調方法はあるのでしょうか?
小文字のカンマ「,」が基本だと思うのですが、ピリオド「.」でも問題なしですか?
[] () のカッコ類でも強調されたり逆に弱くなったりという話がありましたが、結局あれは効果変わらずでしょうか?
他者のプロンプトを見ると!!!A!!!というビックリマークで区切っている人を見かけたのですが、強調効果があったりするのでしょうか?
0571名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 11:47:40.73ID:fMA4vNNF
SDの背景絵見慣れ過ぎて人間の絵描きが描く背景がヘタクソに見えるようになってしまった
キャラもいずれはそうなるんだろうな
0572名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 12:12:57.57ID:tXCVIlYH
>>570
実験した人が居て
「影響はあるがどれが良いかは分からない」というのが結果
カンマとピリオドでは違うし、他の区切りに使うような文字を使っても違う
けれどもどれがベストかは分かってない

他の単語とかと同じくそのまま解析に突っ込まれてニューラルネットに入るので、カンマを入れると特定の動きを毎回するのではなく、ただの文中の1文字でしかない
0573名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 13:02:43.84ID:fS1mdW6z
>>572
影響自体はあるんですね!
プロンプトでの記号使用も奥が深い…
今まで文章の終わりもカンマにしていましたが、プロンプトでもピリオドの方が適切っぽいですね
0574名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 13:05:24.28ID:RhrP3rKu
>>514
それはimg2txt
0576名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 13:48:32.03ID:PbRMjqpJ
メインの詠唱はしっかりした文章の方が理解されやすい気はしてる
セレブ顔混ぜたり、おまじない系は羅列でも割と効果ある感じ。
0578名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:19:36.12ID:OU07VRpA
>>82で見かけたヤケクソな呪文
Watercolor painting in style of krenz cushart ilya kuvshinov kyoani, makoto shinkai, hideaki anno, mochiduki key, studio ghibli, madhouse, white fox, studio trigger, gainax, violet evergarden, granblue fantasy, fate grand order, kinmoza!, kanamemo, hanayamata, shirobako, yuyushiki, k-on!, nichijou, lucky star, a-channel, umaru-chan, nyaruko-san, devilman, claymore, kiseijuu, code geass, guilty crown, umamusume, idolmaster, kancolle, touhou project, nier automata, k-on, yuruyuri, cygames, production i.g, wit studio, p.a.works, ufotable, mappa, toei animation. cute girls doing cute things trending on artstation pixiv makoto shinkai smiling super detailed eyes eyebrowless symmetry face visual novel
0579名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:23:04.33ID:feJDv8ZX
ゔぁぁああ服が出ねぇぇぇ
「一枚の服だけ」が欲しいのに出ねぇぇ
一枚の服って指定してるだろうがあぁぁ
0580名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:24:29.53ID:RhrP3rKu
4chan.org/g/sdg
見てるんだけどなんかみんなイライラし始めてて笑えなくなった
0583名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:33:59.92ID:RhrP3rKu
>>582
えっちな画像貼るなって一人でわめき散らかしてる奴がいるせいかな
0585名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:35:03.56ID:peOhpSjK
平均的にいい部分だけ残るみたいな場合もあるよな
カレー粉みたいにめちゃくちゃになる言葉もあるけど…
0586名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:38:02.03ID:IOaKe0eq
>>583
なるほどw
まあ情報共有系、プロンプト・作品発表(R18/一般)は分けたほうがスムーズな気もする

こっちはまだそんな流れ早くないからいいけど
0587名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:41:02.66ID:WOqtrjL/
Emma Watsonって混ぜるとどんな状況からだろうと全部エマワトソンになるから笑うわ
人物におけるカレー粉的存在
0588名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:44:57.89ID:55tw+Qxr
>>577
萌え絵とかエロ絵っていう低俗な世界だからイナゴ共が大挙して研究して発展するのよね
これが例えば医療用AIだったら、いくらオープンソースにしても誰も見向きもせずに進化しない
仕方ないことではあるが何とも情けない話だな
0589名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:45:22.57ID:nfjXgkLu
エマワトソン頼んでもないのに出てくる時あるよな
開発側がファンなのか
0590名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:48:03.02ID:IOaKe0eq
エマ・ワトソンはちゃんと美人だからいいわ
海外で美人とされる女ゴリラが出てくるのはちょっと勘弁だな
0591名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:54:03.42ID:WOqtrjL/
画像処理の論文で必ずと言っていいほど出てくる例の謎の女性のポートレートも
元をたどると研究者がその辺に置いておいたポルノ雑誌から適当にスキャンしたエロ写真だしなぁ
0592名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 14:56:38.11ID:fMA4vNNF
デジタル化が進んで便利になり3Dも写真加工も使えるようになり
昔は絵を描くのが簡単になってコストが下がると思われていたんだけど
現実には逆にイラストの作画コストはインフレし続けゲームに使われるCG枚数は減少の一途を辿った
最近のゲームのイベントCG枚数は昔に比べて1/10くらいに減ってしまっている
宮崎駿は写真やCG使う風潮に「そんなもん時間かかり過ぎだろ、手で描けよ!」ってキレてた話は一部で有名
せっかくAIが出来てもみんな下絵を自分で描いて〜修正用やリサイズは別AIで〜ループバックで〜って
たった数日で既に工数のインフレが進んでるの超速で歴史の繰り返しをしているの笑ってまうわ
0593名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 15:03:16.63ID:PbRMjqpJ
エマ単体だと大抵そっくりかちょいイケメンになる
自分の場合
Ana de Armas (目でかくなる・鼻細くなる美人
miss universe (ポーズ綺麗・遠くても顔潰れにくい・たまにブス
こういうのも混ぜてみてる
良い感じに似なくて美人になる有名人だれか見つけてー
0596名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 15:08:23.13ID:OU07VRpA
今見たらアンチスレ結構賑わってるじゃん、古塔抜いてイラ板トップだ・・すごい
是非そっちでやって盛り上げてあげてくださいな
0597名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 15:27:29.50ID:lzcC8D0a
>>588
まさに規模の経済って奴やな
実用性や自分達への見返りを鑑みても100%医療AIへの発展に全力ベットすべきなんだがそこがまた人間故の性
0600名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 15:37:10.07ID:TtPvHroS
興味が仮にあっても自分で使えない物のOSSに貢献するのは難しい。動作がOKなのかどうか医者にヒアリングしないとわからないしね
医療AIやるならお金もらえるわけで、OSSに市場を破壊されにくい医療AIの方がいい面もあるね

>>598
めっちゃかっこいい
けど革命ってほどではないかな。
0602名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 15:41:34.57ID:RhrP3rKu
>>600
思いついたものをポンポン画像化できるのはかなり便利じゃない?
0605名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 15:47:11.78ID:soUy0mxj
pixivデイリー1位のイラストに似せるというプロンプトの練習をしてみた
日替わりでお題が出るので楽しいかもしれない
0606名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 15:52:03.30ID:RhrP3rKu
ここで検索して人形かケーキしか出なかったらハズレワードな気がする
https://rom1504.github.io/clip-retrieval
0609名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 16:13:12.57ID:cYyPub3G
死んだ後に自分そっくりの絵柄で自分の名前を冠してエロ絵生成されまくっとるとか俺なら泣きたいww
0611名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 16:17:00.08ID:RhrP3rKu
でもミュシャの絵なんてほとんどえっちじゃん
0613名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 16:19:35.87ID:RhrP3rKu
女性の絵をたくさん描いてるってのもあるかも
0616名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 16:29:58.40ID:tXCVIlYH
>>615
ESRGANの公開モデルとかは写真向けだから緻密な絵画風のを入れるとノイズ扱いされると思う
モデルがチューンされてれば別だけれども
0618名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 16:43:09.31ID:fMA4vNNF
AIの絵にはエロさは全くないな、学習データの問題もあるっぽい
アウトな画像からも学習してるけど圧倒的に多いのは表の健全な画像だからな
そっちにかなり引きずられてる
0620名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 17:01:35.16ID:JbODh9Pl
>>599
現代アートって正にそんなのばっかだからw
0621名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 17:02:32.58ID:JbODh9Pl
>>618
まあそもそもサービス提供元がエロとグロを規制してるから仕方ない
0622名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 17:03:19.49ID:8cZ3F7HA
エロ系はlaionのデータ眺めてみると動画サイトのサムネとタイトルみたいのばっかりでそういうのも良くない気がする
キャプションと画像がちゃんと結びついてない
0628名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 17:39:01.10ID:nm8KAVsJ
>>623
しようと思えばAI開発者なら出来るけど大きな社会的責任負ってまでやろうとは思わんだろ
エロとかはアングラ系がやってくれるだろうからそれまで待つしか無い
0629名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 17:39:10.10ID:RhrP3rKu
>>623
インド版は作ってるらしい
0634名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 19:08:40.54ID:RhrP3rKu
LenaはPlayboyの切り抜き
0636名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 19:29:45.45ID:OU07VRpA
outputsのsamplesにちゃんとプロンプトをテキストで残せるようになったのか、嬉しい
しかしまたフォルダにプロンプト名・・と思って>>578入れたらちゃんと切り捨ててくれてた
やっぱ多すぎるとほとんど無駄なんだな

> Watercolor painting in style of krenz cushart ilya kuvshinov kyoani, makoto shinkai, hideaki anno, mochiduki key, studio ghibli, madhouse, white fox, studio trigger, gainax, violet evergarden, granblue fantasy, fate grand order, kinmoza!, kanamemo, hanayamata, shirob
ここまでしか効いてない、思ったより少なかった
以下切り捨て

> Warning: too many input tokens; some (133) have been truncated:
> ako , yuyushiki , k - on !, nichijou , lucky star , a - channel , umaru - chan , nyaruko - san , devilman , claymore , kiseijuu , code geass , guilty crown , umamusume , idolmaster , kancolle , touhou project , nier automata , k - on , yuruyuri , cygames , production i . g , wit studio , p . a . works , ufotable , mappa , toei animation . cute girls doing cute things trending on artstation pixiv makoto shinkai smiling super detailed eyes eyebrowless symmetry face visual novel
shirobakoのshirobまで認識されてるからノイズになりそう?
0637名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 19:57:55.16ID:RhrP3rKu
え、ファイル名に入ってないと切り捨てられてるって意味なの
0638名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 19:58:38.47ID:fMA4vNNF
アジア系やアニメ、ゲーム系が上手くいかないのは画像認識AI側の問題もあるっぽい
LAIONで日本の著名タレントで検索かけると無関係な日本人女性の写真が大量に混同されてる
アニメやイラストでもこの手の認識ミスが大量にあって画像認識段階でこけてる
0639名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 20:00:26.27ID:OU07VRpA
>>637
いやOSのファイル名の長さは関係ない
上で書いてる人いたけど、トークンに制限がある>>114

ちなパスが255文字意識してるらしく、SDのある場所によってはかなり短くなるので
同シードでプロンプトがあまり長いとケツの方が違ってもパスとファイル名同じになって上書きされちゃう模様
(自分の環境ではフォルダがghibliで終わってる)
stable-diffusion-mainはドライブのルートに置くべきか

なお、>>578のカンマなくしたらそれだけ多く認識されて当然画像も変わった
詰め込みたい場合は区切りなしがいいみたい

>>638
>>594
0641名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 20:13:08.53ID:nzmlNcBC
PC弱者、英語弱者すぎていつ使えるようになるやら、、
0642名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 20:20:21.89ID:OU07VRpA
今のAI「一般」の画像収集が難でアニメ顔上手くいかない話とかアンチ賛美スレでワイワイみんなやってるから、そっちでやればいいと思う
つかみんな結構面白そうな会話してて読みこんでしまったw

ここはMJでどうやったらアニメ顔だせるかな?とかの具体的な話するスレでは?
技術評価じゃなく技術交換なんだし
0646名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 20:53:15.14ID:R2jl8lfR
anaconda入れる意味あったかとかcdnnの入れる場所はcudaの場所でよかったのかとかよくわからん右往左往しつつようやっとStableDiffusion動かせたけど1枚2分かかる
うん、>>43のgoogle colabでいいや…
0647名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 20:54:56.88ID:hfPVoEGY
>>642
Stable DiffusionはLAION-5B使ってるって分かってるんだから別に一般でもないだろ
なぜ普通にやったらできないかって話はどうやればできるかにも繋がるだろうし
0648名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 21:00:37.68ID:tXCVIlYH
Nendoroid

StableDiffusionフォーク先の話題から拾ったがやけにうまく学習されてるな
アニメ絵の顔面崩壊具合を見てると奇跡に近い安定性
0650名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 21:27:50.90ID:Wfou7ymM
>>649
redditのほうでやってる人は見たが、hlkyで対応してくれるのええな
ただESRGANの何が良いって顔修正してくれる所だから、一部だけ適用みたいなの出来れば最高なんだけどな
0652名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 21:32:20.69ID:tXCVIlYH
>>650
色々とごっちゃになってない?

GFPGAN 顔を認識して歪み等々を修正してくれる 解像度は上がらない
ESRGAN 画像全体にノイズ除去をかけて超解像してくれる 顔が歪んでてもほぼそのまま
0655名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 21:36:16.94ID:7Dof+O/R
詠唱が上手い人、特に既存のアーティストのミックス、パロディ、再構築で個性出せるような人は、今後音楽で例えるならDJみたいな価値を持つようになるんかね
0656名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 21:38:45.11ID:nfjXgkLu
スペルマスターw
0658名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 21:41:51.39ID:TtPvHroS
詠唱が上手い、と言ってもモデルがアップデートすると変わるんだよね
0659名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 21:42:43.80ID:hfPVoEGY
>>499のnotebook、
・pytorch-lightningのinstallをURLで
・Load modelのckptをフルパスで指定
でやったら(少なくとも自分の環境では)動きましたね
ただLoad modelでなぜかやたらRAMを使ったのでColab Proじゃないと厳しいとかあるかもしれない
0660名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 22:01:00.65ID:OU07VRpA
どうせ駄目だろうって試してなかったGFPGAN
>>652で存在思い出したのでやったら980tiで動いたわ・・こりゃ捗る
512x448が448x448までになっちゃったけど、歪なサイズなんて意味ないし、丁度よかったw
0663名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 22:18:16.02ID:sF4/noKa
3DCGメインで普通のゲフォを使ってたけど
この流れで次はちゃんとQuadro買わないとダメなんかなと思い始めてる
0664名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 22:26:32.38ID:TtPvHroS
省メモリ版のbasujindalがアップデートして、--turboでオリジナルと同等のスピードになったらしい。(+1GB消費)
解像度上げる時は省メモリで、普通は--turboとかにすると便利かも

https://github.com/basujindal/stable-diffusion

後キーワードの重みを数字指定できるようになってる
--prompt tabby cat:0.25 white duck:0.75 hybrid

>>663
Quadroって意味ありますかね?
0665名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 22:33:13.36ID:sF4/noKa
>>664
今この瞬間はゲフォで戦えてるけど
もっと高解像度な画像を吐くAIが主流になったら
普通に要求GPUメモリが20~30GBとかになっちゃうんじゃないかと危惧してます
0668名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 22:50:50.01ID:EUqBBWer
Midjourney Discordの登録者数が95万人(ピーク100万人だったけど無料枚数終わった&StableDiffusionでちょい下がった)
Geforceグラボが四半期で1000万枚(平均単価15万円)
少しだけ人気のゲームが販売された、程度の影響じゃないかな

騒いでるのはクリエーターでまだまだニッチ。一般にブレイクはしてない気がする。今後分からないけど
後企業のAIサービス用GPUとかがめっちゃ売れたりするかも
0669名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 23:12:17.16ID:4VRmLpiv
直に金にできるものじゃないからマイニングほどのパワーはないかと
それこそ必要スペックの高いゲームが流行るかどうかくらい?
しかし使い方が悪いのか、世界変革させられないぜ
0670名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 23:28:20.33ID:kGYLanZ1
>>667 >>669
RTX3080未満のグラボ持ちなら
Colabの方が電気代すらかからない無料でしかも速いからいいと思うんだが

ヤバイ画像作りたいってのなら話は別だが
0671名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 23:36:14.02ID:OU07VRpA
無料colabはストレスが・・ちょっとフォーカス外したらcaptcha出てきたり
離籍して戻ったら途中まで起動したのが全部終わって生成部が動かなくなってたり
あと100枚行かないうちに上限出て12時間だっけ?置かないといけなかったので
ガンガン画像作るとなると実用性が

ローカルPCだと翌日スリープから復帰したらそのままいきなりブラウザ上のgenerateボタンだけで生成が動く上、無制限
コマンドカタカタのはやたら遅かったけど、GUIのやつは最適化されてるのか全然遅くないので驚いてる
0672名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 23:46:18.81ID:DZyXZAfP
絵を描く人もやってると思うが物の名前や画家を調べるのも楽しい
遊ぶにも知識は大切だわ
0673名無しさん@お腹いっぱい。
垢版 |
2022/08/27(土) 23:51:27.42ID:RhrP3rKu
存命の大物女優でやるとどうしても顔が長くなる
1970sとか1980sとか入れても
0676名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:12:44.55ID:QuNPQemV
>>674
別人になる…
0679名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:19:22.61ID:5g5iYiJ4
>>675
GPUのVRAMを増やす
でも3090TI(24GB)でも960x640、もしくは896x896が限界、らしい

マルチGPUだと、512x512を2枚同時実行はできるけど、現時点では多分解像度を増やすのは無理な気がする

A6000(48GB) 66万円でも単純計算で1920x1080は無理で1920x640とか? 個人じゃきついね
0681名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:28:09.66ID:bWnmVXgB
StableDiffusionのデモで動かしてた時はA100の80GBを大量に入れたGPUクラスターで動かしてたんだとさ
そりゃ1024x1024の画像がバカスカできる訳だわ
0682名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:28:24.91ID:oC+XzzYP
Midjourney、StableDiffusionの前からGoogleのImagenとかがあって同じことが出来た。
しかし計算量・必要メモリ量が膨大でコンシューマGPUでは512x512なんて全然無理だった
Difffusionの何が凄いかというと、必要メモリ量を64分の1に削減してコンシューマ向けGPUでも計算可能にしたこと

内部的には512x512どころか64x64解像度で計算して、計算結果を512x512に戻してる
それでやっと6GBメモリとかなんだよね
0683名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:29:16.88ID:IYnowAka
>>676
midjourneyでは"15 years old "を頭につけて女優さんの名前で、顔が短くはならないけど年輪が刻まれていない雰囲気にはなった。
別人かどうかは見立て次第だけれど
0684名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:31:01.69ID:PaLIc/uC
プログラム作成者の人達、プロンプトの具体的限度文字数とか教えてくれないのかな
絶対俺無駄に入れまくってるから具体的に「256バイト以内です~」とか言ってくれると大変ありがたいんだけど
プログラム作成者ですら文字数上限を理解してないとかありえるのかな
0685名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:42:27.26ID:oC+XzzYP
>>684
トークン数は75
けど俺は”トークン”が何かがよく分かってない。CLIP(テキスト解析)の説明を読めば書いてるはずだけど難しいw

swiming, girl は2トークンだと思うけど、swiming girl は2トークンなのか、1トークンなのかどっちか分からん
0688名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:49:00.72ID:+1zbSHkB
でも>>578のカンマスペースハイフン全部なくした
Watercolorpaintinginstyleofkrenzcushartilyakuvshinovkyoanimakotoshinkaihideakiannomochidukikeystudioghiblimadhousewhitefoxstudiotriggergainaxvioletevergardengranbluefantasyfategrandorderkinmoza!kanamemohanayamatashirobakoyuyushikikon!nichijouluckystarachannelumaruchannyarukosandevilmanclaymorekiseijuucodegeassguiltycrownumamusumeidolmasterkancolletouhouprojectnierautomatakonyuruyuricygamesproductioni.gwitstudiop.a.worksufotablemappatoeianimation.cutegirlsdoingcutethingstrendingonartstationpixivmakotoshinkaismilingsuperdetailedeyeseyebrowlesssymmetryfacevisualnovel
トークン数1?も最後まで警告なくちゃんと読み込んで萌え風になるんだよね・・どうなってんだろ
0689名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:50:50.37ID:PaLIc/uC
>>685
そこ謎だよなぁw…
「1単語ごとなら75個までです!」とか優しく言ってくれるとわかりやすいけど、絶対そこまで適用されてないし

>>686
って、本当に77単語までOKなの?…
実感として77単語も入れたら後ろ半分くらい効果を全く感じないんだが、本当に本当なのかな?……
77単語入れず30単語くらいでも明らかに最前と最後で適用されてる感違うし…
う~ん…むらむらする…
0690名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 00:54:02.03ID:oC+XzzYP
日本語だと多くのトークンを消費、とか書いてて謎が深まる

https://wiki.installgentoo.com/wiki/Stable_Diffusion
> 特定のポイント以降のすべて (カウント方法に応じて 75 または 76 の CLIP トークン) は、単純に切り取られます
> Unicode 文字 (日本語の文字など) を使用する単語は、ASCII 文字を使用する単語よりも多くのトークンを必要とします。
0692名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 01:03:22.06ID:bWnmVXgB
トークンっていうのは、AIが言葉に振ってるIDみたいなもの
入れられた言葉をトークン表と照らし合わせながら拾っていく

例えば、helloであればhelloという固まりのトークンがあるのでこれで一つ
hello allだとhelloとスペースとallで3つ
hjfj ftjb(意味のない羅列)だとh j f j スペース f t j bで9つ

翻訳みたいなことをされて実際の処理に投入される
日本語は2バイト文字だからただでさえ2倍のサイズな上に
ほとんどトークン表に登録されていないのでほぼそのまま文字数x2=トークン数でバカスカ食う

トークン表は言語を学習するときに勝手にAIが選ぶので追加とか削除はできない
0693名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 01:12:03.13ID:60RqM723
はえ〜、なるほど
ちょっと目先を変えて日本語試してみてたけど、やはりそういう不利があるのか
0694名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 01:16:43.84ID:lj5/NLyY
トークンオーバーフローしたらワーニング出すように修正しようかな、と思ってソースみたら
既に、GUItardは対応してた。以下のメッセージで何が無視されたかが出るはず

"Warning: too many input tokens; some ({len(overflowing_words)}) have been truncated:\n{overflowing_text}\n"
0695名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 01:17:08.40ID:PaLIc/uC
>>692
勉強になります!

意味のわかる英単語(多くの画像検索結果が出る) 1トークン
スペース 1トークン
意味のわからない英単語(画像検索結果が殆ど出ないetc.?) 1文字につき1トークン

これの合計で75~77トークン以内に収めたら良い感じっぽいですかね?
目安がわかりやすくなった!

スペースとカンマは同じですか? 違うトークンとして認識されるんでしょうか??

「A B, C D」 AスペースBカンマスペースCスペースD =8トークン?
「A B,C D」 AスペースBカンマCスペースD =7トークン?
0697名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 01:38:15.02ID:bWnmVXgB
>>695
すまん例にスペース使っちゃったけど今調べたらスペースは多分トークンの外だわ
カンマは1トークン

なのでカンマでブチブチ区切るととんでもない勢いでトークン数が消費されていく
0701名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 01:45:03.98ID:aku20RdR
エロには厳しいみたいだけど、作った背景とかを
エロゲーやエロ漫画の背景に使うのもダメなのかな?
0704名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 01:56:23.10ID:+1zbSHkB
>>701
> エロには厳しいみたいだけど
確かにMJとDSは有料サービスなんでうるさいんだけど、
SDはコード丸見えなんで早々に良心回路外されて無法地帯化してる
0707名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 01:58:59.49ID:PaLIc/uC
>>697
実験してたらこうなったのでスペースも関係ありかと思っちゃいましたがそうでもないのですね!

,,,,~,,,,many cats,(カンマ148個+many cats,) 猫が出る 
,,,,~,,,,many cats,(カンマ149個+many cats,) 猫が出ない
,,,,~,,,,cats,(カンマ148個+cats,) 猫が出る
,,,,~,,,,many cats,(カンマ149個+cats,) 猫が出る
,,,,~,,,,many cats,(カンマ150個+cats,) 猫が出る
,,,,~,,,,many cats,(カンマ151個+cats,) 猫が出ない

>>699
「即位する」「即位した」でもトークン使用量が違うんですか!?
奥が深いなぁ……


とりあえず単語1トークン、カンマ1トークンを基本の目安として考えてみます!
その目安で簡易的な「プロンプト適用上限を超えています」とか表示されたら便利だなぁ
0708名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:03:36.54ID:M0HRyyB5
>>681
>>682
VRAM80Gをクラスタでwwwww

テクスチャ用途で2048夢見てたが、ムリポだな…
なんとか512か1024をアップスケールして2048にするしかねーわ
0709名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:04:31.04ID:lj5/NLyY
例えばこれは12トークンになるっぽい。
aとかtheとか意味があるのかないのか。単語だけ切り出して意味ない気がするけど、文脈を見て関係あるのかな

a girl on the beach, white , swiming

'<|startoftext|>', 'a</w>', 'girl</w>', 'on</w>', 'the</w>', 'beach</w>', ',</w>', 'white</w>', ',</w>', 'swim', 'ing</w>', '<|endoftext|>',

a
girl
on
the
beach
,
white
,
swim
ing



●webui.py
info = model.cond_stage_model.tokenizer([prompt], truncation=True, max_length=max_length, return_overflowing_tokens=True, padding="max_length", return_tensors="pt")
ovf = info['overflowing_tokens'][0]
overflowing_count = ovf.shape[0]
+ iid = info['input_ids'][0]
+ vocab = {v: k for k, v in tokenizer.get_vocab().items()}
+ t = [vocab.get(int(x), "") for x in iid]
+ print(t)

if overflowing_count == 0:
return
0710名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:07:02.21ID:lj5/NLyY
即位する 11
'<|startoftext|>', 'a', '?', '3', 'a?', '?', 'a?', '?', 'a?', '?</w>', '<|endoftext|>'

即位した 11
['<|startoftext|>', 'a', '?', '3', 'a?', '?', 'a?', '?', 'a?', '?</w>', '<|endoftext|>'
0711名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:18:13.04ID:PaLIc/uC
>>709
文章におけるトークン使用量の計算難しそうですね…
「swim」と「ing」を分けて計算されるんですか…
現在進行swiming分解済み単語とカンマだけなら10トークンぽいのに、12トークン…

「hayao miyazaki」等の人物名も2トークン扱いかな…
「hayao-miyazaki」でも2トークンかな…
0712名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:24:36.74ID:zmiqUmaN
>>707
なかなか興味深いですね
それ見て思ったのはカンマを二個並べると、トークン=意味としてのカンマと、純粋な区切りとしてのカンマを交互に認識していって
約150個のカンマが、AI的には70数個のトークン(中身はカンマ)として認識されて最後に77個目に猫をねじ込めるかどうかという挙動になってるように思えます。ただの仮説ですが
0713名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:26:29.55ID:1MaKtggW
そもそも人間が文章を見て何トークンか数えるのは無理だと思う
ましてUnicodeなんか出てきたら>>710みたいに文字ですらない単位で分けられちゃうし
0714名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:28:07.17ID:sBwVz76V
>>711
>「swim」と「ing」を分けて計算

>>699にあるURLの
>例えば「国王が即位する」という文をトークンに分けると、「国王/が/即位/する」という分け方になり、4トークン
>一方「国王が即位した」という文の場合、「即位した」で1トークンであるため、「国王/が/即位した」の3トークン

に近い挙動だね
0715名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:31:56.22ID:lj5/NLyY
>>711
swim と ingは、2トークなんだけど、</w>はingにだけついていて、1ワードだという認識はありそう

じゃあ</w>の単位で認識するのか?というと「可愛い巨乳女」は
'<|startoftext|>', 'a?', ' ̄', 'a', '?', '?', 'a??', 'a', '・', '¨', 'a1', '3', 'a\', '3</w>', '<|endoftext|>'

最後だけ</w>がついているけど、ちゃんと可愛い、巨乳、女、が生成される


>>668の冒頭だけ取り出すとこう
Watercolor painting in style of krenz cushart ilya kuvshinov kyoani
['<|startoftext|>', 'watercolor</w>', 'painting</w>', 'in</w>', 'style</w>', 'of</w>', 'k', 'ren', 'z</w>', 'cush', 'art</w>', 'ilya</w>', 'ku', 'v', 'shino', 'v</w>', 'kyo', 'ani</w>', '<|endoftext|>'

Watercolorpaintinginstyleofkrenzcushartilyakuvshinovkyoani
'<|startoftext|>', 'water', 'color', 'painting', 'inst', 'yle', 'of', 'k', 'ren', 'z', 'cush', 'art', 'ily', 'aku', 'v', 'shino', 'v', 'kyo', 'ani</w>', '<|endoftext|>'

こっちは,paintingが1つ
swimingは現在進行系の形容詞、paintingはく名詞として解釈されているのか1トークンになってる?
0716名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:49:20.46ID:1MaKtggW
形容詞とか名詞みたいな人間にとってどうかはトークンには関係ない
まして日本語だったら「可愛い巨乳女」は「可愛い巨乳å\³」みたいな意味不明な文字に見えてるはず
(もっと言うと「a¯aaa·¨a13a\3」でそれがトークンに分けられてる)
人間には分からんとしか言えんから理解するのは無理
0717名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:52:51.98ID:zmiqUmaN
何て言うか、厳密に数える方法を探索するというより
無駄にトークン数を浪費してしまう典型的パターンを突き止めて、共有しとく意義はあると思う
0718名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 02:53:53.32ID:P4svKH72
>>716
あなたは理解できてないんでしょうけどCLIPは理解してますね
0719名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 03:00:34.41ID:1MaKtggW
>>718
実際それは割とマジで(正確にはCLIPじゃないけど)AIは「a¯aaa·¨a13a\3」っていう文字列と可愛い巨乳女の画像を結びつけて学習してるから「可愛い巨乳女」って入れたら可愛い巨乳女が出てくる
0720名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 03:03:47.49ID:P4svKH72
可愛い巨乳女、は人間は理解できるし、CLIPも理解している
>>716は全く意味不明
0722名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 03:12:26.51ID:CkMkrgMz
生成における文章の力は強烈だけどトークンの計算が面倒そうだな
単語だけなら37,38個認識してもらえるぽいこと知れて良かった
0723名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 03:23:25.64ID:zmiqUmaN
単語数、トークン数で思うのはさ、よくある強力呪文の例文に
in the skyってよく入ってるけど、AIが冠詞theを有意に活用してるのかはまあまあ疑わしいので(人間がtheを入れることで気持ちよくなってるだけ説)
theと省けば文末の単語を一個余分に認識させられる可能性があるみたいな、そういうハックは解き明かされてほしい
もう寝るので他力本願ですいません
0724名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 04:05:54.47ID:Pft0DBuS
今日の学びはbronde short hairを入れると髪型サンプル画像のせいか構図のほうも首から上だけのパターンに引っ張られやすいということ…
0725名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 04:12:50.68ID:aku20RdR
>>702
わからないので小学生にもわかるように教えて。
生成した画像は作成者自身が権利を持つのでアダルト作品にも使えるってこと?
0726名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 04:26:49.29ID:1MSCQb34
>>725
間違ってるよ

AIが生成した画像に著作権は認められないので
「作成者自身が権利を持つ」のではなく
誰も権利を持たない誰でも使っていいフリー素材になる

もちろんAIの画像をさらに手作業で加工すれば
自分の権利を主張できる

またStable Diffusionのライセンスでは
「人に危害を加えたり、倫理的に問題があったり、
誤った情報を広めたりするために使うことは認められていない」
具体的に何がダメなのかは自己責任で考えてくれ
0727名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 04:30:00.81ID:QuNPQemV
欧米人じゃなくて日本人が欲しいって人は"hanako"とか入れてみて
0728名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 05:02:57.95ID:YyqL61iy
肖像権と著作権勘違いしてるのが講釈してるな
そして最後は自己責任とか。最初から自己責任でいいじゃん草生えるわ
0729名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 05:44:38.26ID:YyqL61iy
↑呪文唱えた人とAIと演算リソースを提供した人が全権利を放棄(明記)した場合はフリーになるけどな
0730名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 06:28:55.83ID:1MSCQb34
>>729
「全権利」って具体的に、何法の何権の話をしているの?
少なくとも著作権は誰も持ってないから著作権以外だよね

まさか法律をよくわかってない人がとりあえず「権利」
という言葉を使ってみただけで
それが何権かは自分にも分からないわけじゃないよね
0731名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 06:52:35.39ID:ldRK+y0p
「お前の言うことは間違ってる、不十分だ」ではなく、端的に「これはこうです」って言う方がいいね
著作権以外にも、意匠権、商標権とか、知的財産権はある

私自身はあまり興味はないので調べる気はしないけど

権利で思い出したけど、StableDiffusionの生成した画像は、これはAI生成画像ですって見えない電子透かしが入ってる
0732名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 07:09:41.58ID:VpEyRdfH
背景はフリー素材に近いものだから漫画に使うのは大丈夫でしょ
実在人物のエロ画とかはやめといたほうがいい
0733名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 07:13:29.30ID:+1zbSHkB
>>731
> 権利で思い出したけど、StableDiffusionの生成した画像は、これはAI生成画像ですって見えない電子透かしが入ってる
マジ?
0734名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 07:19:16.02ID:kIetuXjV
>>733
公式にちゃんと書いてるね
an invisible watermarking of the outputs, to help viewers identify the images as machine-generated.
機械生成画像であることを識別できる、目に見えない電子透かしが入っています

画像の色調補正とか、上から何かを追加で書き込んだりしても残る
といっても激しく加工すると消えるけど

実際的にこれで何か困るかって言うと多分困らない。自分で描きましたドヤァ、の人の嘘がバレるぐらいかなw
0738名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 08:27:24.74ID:VSjN8Npn
AI生成の画像に著作権がないは間違い
著作権がない画像が生成されればその画像には著作権はないが著作権がある画像が生成されればユーザーがその著作権を認識した時点で著作権侵害となる
例えば「鬼滅の刃の画像」とプロンプトに入力し鬼滅の刃の著作権がある画像が生成されればその時点で侵害
鬼滅の刃を知らないユーザーが「大ヒット漫画の画像」と入力し鬼滅の刃の著作権のある画像が生成され公開し、権利者から指摘されれば指摘された時点で侵害
0739名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 08:30:09.63ID:fvXQzTIT
AI生成画像が、偶然既存の著作権がある画像と同じものを生成した場合、「著作権侵害にならない」
両方に著作権がある状態になる、と弁護士が言ってた
0740名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 08:32:12.00ID:VpEyRdfH
そんなこと言ってたら漫画のファンアートが一切描けなくなる
類似したキャラで大々的に商品展開しなきゃ問題にはならないと思うよ
0741名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 08:32:58.60ID:VSjN8Npn
「AI画像に著作権がない」というのはAI開発者の著作権はないと言う意味
フォトショップでイラストを描いてもadobe社に著作権が発生しないのと同じ
0743名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 08:38:58.73ID:VSjN8Npn
>>739
画像を学習させたAIで学習元に似た画像が生成された場合は偶然とは言えない
既に完了した行為については違法性はないが権利元が「あなたが使用した画像生成AIはこう言う仕組みで我々の著作権を侵害しています」と告知されれば告知された時点から違法となる
ツイッターなどにあげた画像は閲覧が可能な期間ずっと公衆送信権の対象となるので告知を受けた時点で速やかに削除しなければならない
既に頒布済みの紙の同人誌などは回収しなくてよい
0745名無しさん@お腹いっぱい。
垢版 |
2022/08/28(日) 08:50:19.91ID:IYnowAka
>>723
画像とその画像に対しての説明文の対応を学習していると、
説明文によく使われる言い回しが効果的とか噂だけれどもトークンに分解されるなら関係無いのかな