X



【StableDiffusion】AI画像生成技術12【NovelAI】
レス数が1000を超えています。これ以上書き込みはできません。
0001名無しさん@お腹いっぱい。 (スププ Sd5f-QsTn)
垢版 |
2022/12/13(火) 11:34:39.73ID:/i9hUBW/d
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

入力されたテキストから画像を生成するAI技術に関して語るスレです
StableDiffusion: google colabやローカル環境で実行可能なAI画像生成
NovelAI: 有料サブスク型AI画像生成サービス
(DALLE・Craiyon・Midjourneyの話題もOK)

★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
(以下のスレッドへ移動してください)
【Midjourney】AI関連総合24【StableDiffusion】
https://mevius.5ch.net/test/read.cgi/cg/1670840740/
AIイラスト 愚痴、アンチ、賛美スレ part17
https://mevius.5ch.net/test/read.cgi/illustrator/1670392645/
テンプレまとめ
https://rentry.co/zqr4r
編集コード「5ch」

前スレ
【StableDiffusion】AI画像生成技術11【NovelAI】
https://mevius.5ch.net/test/read.cgi/cg/1669278997/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
0003名無しさん@お腹いっぱい。 (アウアウウー Sa6b-y3Lv)
垢版 |
2022/12/13(火) 11:45:58.40ID:xeSmLPRba
いちおつ

前スレの続きだがAIが特徴だと認識出来るものは既に十分学習している物との「相違」なんだろうな

Blood borneの例は事前学習物との相違が多すぎて画像の全要素を特徴だと認識してしまったんだろう

俺もElysium V1に手錠という要素がほとんどなかったので30枚程度の手錠画像から学習させようとしたけど、背景や表情や服装しか学習されなかった
0006名無しさん@お腹いっぱい。 (アウアウウー Sa6b-Eu4/)
垢版 |
2022/12/13(火) 12:25:46.23ID:+WPoeIPla
実際のところ「りんご」の絵を描けと言われたらリンゴの木を描いたらいいのかリンゴの実を描けばいいのか切り分けられて皿に盛られたりんごを描けばいいのか人間でも判断できんだろ
0010名無しさん@お腹いっぱい。 (アウアウウー Sa6b-T23y)
垢版 |
2022/12/13(火) 14:51:00.65ID:opdXtkO8a
一乙です
crop不要と聞いてモンキーパッチ拡張機能というのを導入してみたんですが、これってどういう原理なんでしょう?
タグ付けされた背景までの描画差を学習対象にしている(からテキストに背景タグも付けた方が良い)という認識は正しいですか?
0011名無しさん@お腹いっぱい。 (ワッチョイ dfa5-u86g)
垢版 |
2022/12/13(火) 16:40:58.94ID:TsvbAX1g0
>>4
an apple drawn on framed canvas みたいないラベルが付いてれば
リンゴのみをリンゴとして学ぶはず。結局品質のいいラベルが重要なんだよな
ラベルが不正確だったり不完全だと学習もそれに応じて質が下がる
0012名無しさん@お腹いっぱい。 (ワッチョイ ff7c-nYmL)
垢版 |
2022/12/13(火) 17:27:22.48ID:ddfZGe6r0
ラベル付けも大事だけど結局要は学習量でしょ 凄い詳しいラベル付けした学習データあってもそれと関連したラベル付いた学習データ大量に無いと統計予測上手く出来なくて機能しないだろうし
0016名無しさん@お腹いっぱい。 (ワッチョイ 7fb9-y3Lv)
垢版 |
2022/12/13(火) 19:10:18.88ID:UNODKyzy0
リンゴ情報が全くない状態で、白い背景にリンゴがポンと置かれた物をappleと学習させると、

・日本国旗と類似
・白い背景
・画面に対してどのくらいのサイズの赤い丸
・丸の下側には影がある
・光が右上方から差し込んでいる

みたいなのを特徴だと認識して、girl with appleで巨大な国旗振ってる女
girl holding an appleでは巨大リンゴに抱きついてる女
みたいになるだろうな
0020名無しさん@お腹いっぱい。 (アウアウウー Sa6b-jmuY)
垢版 |
2022/12/13(火) 19:54:24.58ID:rOn4Qg8Wa
>>19
初期のredditから追ってるが
似せる画像を用意する必要がある派と
自動生成で似せなくてもいい派に分かれる
正則化画像の影響も小さいしどっちがいいのかわからん
0021名無しさん@お腹いっぱい。 (アウアウウー Sa6b-jmuY)
垢版 |
2022/12/13(火) 19:55:41.89ID:rOn4Qg8Wa
>>20
☓似せる画像
○似た画像
0024名無しさん@お腹いっぱい。 (ワッチョイ dfa5-u86g)
垢版 |
2022/12/13(火) 20:24:45.80ID:TsvbAX1g0
正則化画像はオーバーフィッティングを防ぐ意味があるから
どちらかと言えば似てない方が良いんじゃないの?
似てないって言っても上位概念の画像であるのが前提だろうけど
0026名無しさん@お腹いっぱい。 (ワッチョイ a701-KKgq)
垢版 |
2022/12/13(火) 21:21:59.52ID:5AI2oR7J0
>>19
DreamBoothのやり方は最初に実装されたXavierXiao版のGitHubでほぼ説明されてるからな
緑の大きいゴミコンテナを学習させるのに正則化画像としてコンテナ画像を生成してる
https://github.com/XavierXiao/Dreambooth-Stable-Diffusion

ただ、sksは銃の名前と被ってるから現在は非推奨
https://twitter.com/kohya_ss/status/1587574306082521089
https://twitter.com/5chan_nel (5ch newer account)
0029名無しさん@お腹いっぱい。 (ワッチョイ df33-KKgq)
垢版 |
2022/12/13(火) 22:42:38.11ID:pNS/3iFy0
学習元が出てくると鼻息荒げるヤツはせめて出力した環境を書けよ

>>19
正則化画像が無いと過学習になって失敗するぞ
大抵の場合はデフォで用意してくれてると思う
自分で数字弄ったら知らん
0032名無しさん@お腹いっぱい。 (ワッチョイ a701-jpzT)
垢版 |
2022/12/13(火) 23:48:15.37ID:Ydp+T/5N0
>>28
TIみたいに「リンゴ」のワードだけ学習させるならそれで足りる
が、DBは「ホワイトバックグラウンド」の意味も学習し直して、そっちにリンゴの意味が染み込んでしまう
正則化画像に白背景の画像(+「ホワイトバックグラウンド」キャプション)を含ませておけば、「ホワイトバックグラウンド」が白背景という意味だと思い返してくれる

ざっくりとした俺の理解だとこう
0033名無しさん@お腹いっぱい。 (ワッチョイ a7bd-u86g)
垢版 |
2022/12/14(水) 10:35:38.62ID:y7OUeunz0
>>31
両方同時にやるんやで。
まずDBでキャラの要素そのものを新たに覚えさせ
そいつをDAで引っ張り出す。
DAは知らないものは引っ張り出せないが、
知っているものについてはそれなりに有能に正しく引き出してくれるからね。
--------------------------------------------------------------------------------
呪文は(DB:1.0),(DA:0.8),
ぐらいがバランス良いなと個人的には思う。
DAの方を0.8より強めると絵が荒くなったりポーズが学習素材を真似しがちになる。
学習素材の枚数・質・学習ステップはまだ模索中。
----------------------------------------------------------------------------------------------
一応自キャラを 自分の上位互換同系統の絵柄で再現できている現状だと
DBは30枚 3000ステップ DAは同じ素材30枚 4万ぐらい って感じだ。
画風についてはHNの担当なので ガチで『こんな感じの絵柄で うちの子を』となると
結局3つとも重ねることになる。
初期ごろはポーズにも限度がついて回るが
そうやって出てきた絵を更に餌としてバージョンを更新していけば
そのうち好きな動きをさせられるようになるんでないかな。
ポーズそのものについてはblenderあたりを軽く学習して『雑なモデル』でいいから作れるようになれれば
結構いけるはず。
つまり最終的にはi2iも視野に入れる。 なんやかんやあるもの全部使うことになるんや。
0037名無しさん@お腹いっぱい。 (ガックシ 068f-vDC+)
垢版 |
2022/12/14(水) 14:23:46.55ID:kdcMfuWH6
WD1.3.5、0.3エポックでこれ!?すげえええって思ってたらベースにeimis混ざってるって聞いて興醒め
0040名無しさん@お腹いっぱい。 (ガックシ 068f-vDC+)
垢版 |
2022/12/14(水) 14:38:51.60ID:kdcMfuWH6
と思ったら、なんか今からharuがNAIの中の人に「eimisってNAIのリーク派生?大丈夫そ?」って聞くらしい
面白くなってきたな
0043名無しさん@お腹いっぱい。 (ガックシ 068f-vDC+)
垢版 |
2022/12/14(水) 14:43:54.85ID:kdcMfuWH6
リーク気にしない人は今更WDなんて追わずにanything3.0にんほってるわけで
1.4はともかく1.3.5に期待してた人はリークに少なからず嫌悪感ある人たちだと思うんだよな
haruはこのモデルをGPUのテストくらいにしか考えてなかったらしいからちょっと温度差があるかも
0045名無しさん@お腹いっぱい。 (ガックシ 068f-vDC+)
垢版 |
2022/12/14(水) 14:53:20.68ID:kdcMfuWH6
もしかしてだけどこの人、eimisがNAI派生であることを知らなかった?(いや、確定はしてないんだが)
ピュアピュアか?
0046名無しさん@お腹いっぱい。 (ワッチョイ a702-RQ6t)
垢版 |
2022/12/14(水) 14:54:26.95ID:CVnYxK5t0
もう1.4だけに集中した方がいい気がする
ここまで待ってるんだし延長しようが何しようが待つがな
0047名無しさん@お腹いっぱい。 (ガックシ 068f-vDC+)
垢版 |
2022/12/14(水) 14:54:56.13ID:kdcMfuWH6
絵柄がNAIとは全く違うように見えた、NAI派生だとしたら何でんなもんhaggingfaceに載ってるんだ!シット!
って言ってるように見える
俺が盛大に翻訳間違えてる可能性もあるが
0048名無しさん@お腹いっぱい。 (ガックシ 068f-vDC+)
垢版 |
2022/12/14(水) 14:59:40.63ID:kdcMfuWH6
・1.3.5はharuが1人で作ってて、他のメンバーは何も知らん
・目的は新しく使えるようになった高性能のGPUのテスト
・テストで0から学習するのもなんだから、ある程度完成されてるとりんさまをベースに使った

ここまでは日本語情報出てて確定
そこになんでeimis混ぜたのかわからんくて皆ブチ切れてる
なぜかharuもブチ切れてる
0049名無しさん@お腹いっぱい。 (ガックシ 068f-vDC+)
垢版 |
2022/12/14(水) 15:01:55.30ID:kdcMfuWH6
本命は1.4で、1.4はsd2.1ベースなのは変わらず
こっちはチームで作ってるから、今回のゴタゴタとはまた別の話だと信じてるけど
0050名無しさん@お腹いっぱい。 (ワッチョイ dfbe-KKgq)
垢版 |
2022/12/14(水) 15:14:13.04ID:JbomWJ4W0
まぁ何にせよいい感じのができればいいじゃん(いいじゃん)
0057名無しさん@お腹いっぱい。 (アウアウウー Sa6b-jmuY)
垢版 |
2022/12/14(水) 18:18:01.27ID:M8UUk/5Sa
>>40
これワンチャンNAIからお墨付きもらえる
そしたら法律的にこれ使うしかないわ
0058名無しさん@お腹いっぱい。 (アウアウウー Sa6b-jmuY)
垢版 |
2022/12/14(水) 18:19:47.65ID:M8UUk/5Sa
NAIが認める可能性は高いぞ
なぜなら2ヶ月前にオープンソースにすると言っているから
0062名無しさん@お腹いっぱい。 (オッペケ Sr1b-NTZW)
垢版 |
2022/12/14(水) 18:59:08.76ID:BxXOnlLMr
WD1.2は本当にちょうどよかった
SD1.4から程々に全部二次元に寄った感じで

そこからガラリと変えようとするとSD1.4の学習結果がボロボロ消えていくからうまく学習させないと微妙な方向にしか行かないんだろうな
0063名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/14(水) 19:34:04.78ID:iNz1bmNX0
wd1.3.5の現状 東方aiから
・haruが1人でテスト感覚で作ってた
・haruはeimisがNAI派生だと本気で思わなかった
・wd1.4はチームで作ってて、間違いなくsd2.1ベース NAIや派生は使わない
・1.3.5は開発中止ではない?NAIの人に確認取ってokもらったら続行かも

まぁ1.3.5なんてモデルは最初からなかったものだとして考えるしかない
一番最悪なのは、これで1.4がズッコケて1.3.5が一番よかったってなること
0064名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/14(水) 19:36:21.10ID:iNz1bmNX0
色々不安なsd2.1ベースで、一気にdanbooruの外にまで学習画像を広げて、本当にNAI以上のものを作れるのかすごく不安
だからこそ、一回NAIと同じやり方でNAIと同じものを作っといて欲しかった.....
0065名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/14(水) 19:37:52.39ID:iNz1bmNX0
id変わってるけどkdcMfuWH6と同一人物
なんか間違ってたらごめんね
0066名無しさん@お腹いっぱい。 (ワッチョイ dfa7-K/Lo)
垢版 |
2022/12/14(水) 19:40:40.15ID:QMKmeBPT0
WD1.4は完全別ラインで動いてるしスタッフが相当金注ぎ込んでるんだな
1.4でなくSDに合わせて2.0とでもした方が良いのでは
1.35の方がむしろharu氏が深く関わったdanbooruでのトレーニングモデルだし継続するなら1.4の名がふさわしい
0068名無しさん@お腹いっぱい。 (ワッチョイ 478e-DDnY)
垢版 |
2022/12/14(水) 22:11:56.87ID:NEoXRvfJ0
実写が問題ありすぎて使い物にならんからなぁ
人物なんて怖くて使えんだろ。魔法使い系のワード入れるとたまにエマワトソン出てくるしな
知らない人物がひょいと出てそれ知り合いじゃんって連絡されたら、著作権肖像権うんぬんより名誉棄損の方が問題わ
今のまま2D特化でマージして遊べる方が気楽でいい
0073名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/15(木) 02:09:57.41ID:Qo1Yl4360
>>71
kdcMfuWH6です
さっきは省いたけど、東方aiでそこの作者が陰謀論めいた話をして暴れ回ってて
その中で、a certainthingについてはwd1.4と同じことをした、とゲロってる
つまりeimisなどリーク派生モデルをマージした可能性がある
実際、modelとthingで明らかに生成画像の質が異なる
生成画像を学習しただけでここまでのクオリティが出せるのかは大いに疑問
0074名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/15(木) 02:12:56.49ID:Qo1Yl4360
>>72
それを箱庭がまさに今やってる
リーガルだし面白い試みだとは思ってるけど、生成物は.....。
少なくとも簡単なプロンプトで神絵が出ることはない=NJの代わりには全然ならない
興味があれば追ってみては
0075名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/15(木) 02:15:28.67ID:Qo1Yl4360
NJ、MJに関しては、remixをはじめとした、automaticにない独自機能がたくさんあるから、SDで代替は不可能な気はする
絵柄だけ似ても全然意味ない
逆にmjで普通のimg2imgは(多分)できない、追加学習もできないので、完全に分岐したなと
0077名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/15(木) 02:49:42.69ID:Qo1Yl4360
NAIの人の回答が出た
・eimisの作者は、NAIリークの使用を明確に否定
・NAIの人は、eimisがNAI派生かを明言せず
・でも、「色々と加工して作られていること」と故意でないことを理由に1.3.5の配布を一応認める
・しかし、haruは今回の件でナーバスになっており、2.1ベースで学習をやり直したいと主張

一応、今回の件で1.3.5は完全にシロのお墨付きがついた
eimis自体はグレーなまま
0079名無しさん@お腹いっぱい。 (ワッチョイ df10-vbep)
垢版 |
2022/12/15(木) 03:12:50.78ID:Qo1Yl4360
連投規制のためまたID変わったけど

長々と連投すまん
個人的にWDには並々ならぬ思い入れというか期待があるので、つい熱くなってしまった
完全な公認というより、内々でまぁいいけど......って言われたくらいのノリらしいので、あくまで自己責任で

最後に、エロスレの方にはあったけど、はぎんぐに残ってる1.3.5のログを
https://huggingface.co/hakurei/waifu-diffusion-v1-4/blob/9fa4a42a9c4a0948472fa909e6c1a39be0dda699/models/wd-1-4-float32-booru-110k.ckpt
今もダウンロードできる
作者が消したものをダウンロードする倫理的問題はしらん
0080名無しさん@お腹いっぱい。 (ワッチョイ df10-vbep)
垢版 |
2022/12/15(木) 03:13:24.19ID:Qo1Yl4360
変わってなかった
0083名無しさん@お腹いっぱい。 (ワッチョイ a78e-DDnY)
垢版 |
2022/12/15(木) 04:00:40.91ID:7mMwp/Lx0
WDの中身が何かのマージだっていう事がショックだけどな
いくらテストだって言ってもwd-1-4-float32-booru-110k.ckptこの名前でマージ品それも2種混合を出してきてるわけだし
よほど学習がうまくいってないかプライドが低いのかわからんけどWD1.2以降ずっとグダグダで
仕切り直してくれると思ったらもっとぐだぐだになってたっていうね
リリースできない言い訳に内情ごたごたですとか、NAIリークは攻撃か宣伝か知らんけど、別の意味で知名度下げて世界に恥晒すだけだから…
0084名無しさん@お腹いっぱい。 (アウアウウー Sa6b-jmuY)
垢版 |
2022/12/15(木) 04:26:12.40ID:NqdkDGnna
叩かれたから学習はこれ以上やらないだろうし配布も無理だろうな
NAIが問題ないなら俺はそれでいいのにな
叩いた奴らは謝ってこいよ
0085名無しさん@お腹いっぱい。 (アウアウウー Sa6b-jmuY)
垢版 |
2022/12/15(木) 04:36:12.07ID:NqdkDGnna
世界に恥を晒すなら日本人が足の引っ張り合いしてる方が恥さらしだな
0094名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/15(木) 09:42:27.86ID:Qo1Yl4360
天下のharuが画風全然違うって言ってるから......
0098名無しさん@お腹いっぱい。 (ガックシ 068f-vDC+)
垢版 |
2022/12/15(木) 10:52:09.76ID:p/99ljoV6
AIを糾弾してるんじゃなくてリークを糾弾してるんだけど
もはやマージやら何やらでぐちゃぐちゃになって、確実性のある判別手段を失ってるので、全部グレーになってしまっているという
なんでオープンソースのコンテンツでこんなことになってるんですか?(すっとぼけ)
0104名無しさん@お腹いっぱい。 (ガックシ 068f-vDC+)
垢版 |
2022/12/15(木) 11:21:23.29ID:p/99ljoV6
それはそれとして最近技術革新ないな......
dreamboothが速くなるloraってやつくらい?
技術者も皆WD1.4(などの、sd2.1ベースのアニメモデル)待ち?
0105名無しさん@お腹いっぱい。 (アウアウウー Sa6b-BaBv)
垢版 |
2022/12/15(木) 11:24:51.51ID:Sne3wF9Ta
ここまでの技術革新ですら十分に理解して扱えていて活用出来ていて新しい技術ばっちこいという体勢であるとは
自分はとても言えないのでwd1.4までこの間まなだらかであってくれと祈るばかり
0106名無しさん@お腹いっぱい。 (ガックシ 068f-vDC+)
垢版 |
2022/12/15(木) 11:26:19.33ID:p/99ljoV6
NAIはそりゃ裏でSD2.1ベースのバージョン2を開発してるだろうけど
それをまたクローズドにしたら、またハッキングされない限り
2.1ベースのアニメモデルは現状WDとunstableしか発表されてない
しかもunstableがどこまでイラストに寄ってくれるかも定かじゃない
WDがコケたら進化が完全に止まるおそれもある
0108名無しさん@お腹いっぱい。 (アウアウウー Sa6b-BaBv)
垢版 |
2022/12/15(木) 11:29:18.37ID:Sne3wF9Ta
例えばdepthがあれば適当にかけ算するだけで座標がわかるから
今まで画像1枚だった背景に奥行きを与えてブラーなどのポストプロセスをかけられたり
パーティクルを跳ねさせたりできるわけじゃん?
VFX的にはすごく面白いと思うんだけど実際に手を動かしてはいない…………………………………………………………………………………………………………………………
0110名無しさん@お腹いっぱい。 (ガックシ 068f-vDC+)
垢版 |
2022/12/15(木) 11:45:19.84ID:p/99ljoV6
>>108
ちょっと気になるからすまんけど紹介記事かなんかのリンク貼ってほしい
技術系、一度アンテナから漏らすとググり方がわからん
0111名無しさん@お腹いっぱい。 (アウアウウー Sa6b-BaBv)
垢版 |
2022/12/15(木) 12:02:50.87ID:Sne3wF9Ta
座標の再構成は
reconstruction of world position from depth

ポストプロセスはかかる強さをdepthをそのままかけ算するだけ

パーティクルを跳ねさせるのは座標の再構成できるんならパーティクルの座標がそこを下回ったり上回ったりでコリジョンが起きるようなんか上手く出来ないかなっていう妄想
多分できるけどまだやってない
0114名無しさん@お腹いっぱい。 (ワッチョイ 7f8e-DDnY)
垢版 |
2022/12/15(木) 12:18:55.25ID:3qnzTmRK0
>>113
ファーウェイから通信事業奪ったとか業界2位の建築屋潰すとかでかいニュースにってからだな
当面はmeituがミスって潰されるようなことでもなければ影響ないというか周知できんだろ
AI生成で著作権違反?ディープフェイク?ニッチな世界で悪い事してる奴らが潰されて当然なわけで
0117名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/15(木) 13:07:18.02ID:Qo1Yl4360
>>111
ありがとう
ググったら出てきたけど何がなんだかさっぱりで
俺には過ぎた代物だということがわかった
blenderかじったくらいじゃ太刀打ちできないよう
0121名無しさん@お腹いっぱい。 (アウアウウー Sa6b-jmuY)
垢版 |
2022/12/15(木) 13:32:54.55ID:DivQ3BdFa
そいつ本当に外国人なのか怪しい
シードに114514使うか?
淫夢ネタじゃないのか?
いや海外で流行ってるのならあり得るのか…
0122名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/15(木) 13:33:36.77ID:Qo1Yl4360
>>118
WD側はその計算機を、全部SDベースだからモデルが似るのは当たり前って話はしてるな
この製作者、これ持って東方aiチャットで暴れてるから

>>120
>>79からダウンロードできる
0124名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/15(木) 13:35:06.21ID:Qo1Yl4360
>>123
まさにまったく同じ話をWDの人もしてる
0131名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/15(木) 14:17:14.31ID:Qo1Yl4360
>>130
不健全なんだよなぁ
0133名無しさん@お腹いっぱい。 (アウアウウー Sa6b-EyWG)
垢版 |
2022/12/15(木) 14:21:30.13ID:pK5AdWHYa
中国の規制は人間の顔とか現実的なもの生成する時はマーク付けろって感じで2次元は対象に入ってる感はないな
国外向けコンテンツはこの規制気にすんなって言ってる辺りAIそのものを規制する感はあんまり無さげ
0134名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/15(木) 15:52:56.99ID:Qo1Yl4360
なんかgradioが重過ぎ
こういう時どうすりゃいいんだっけ
0136名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/15(木) 15:58:08.40ID:Qo1Yl4360
それはやったけどダメだ
ジェネレートフォーエバーが2から6枚くらいで止まる
0138名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/15(木) 16:12:42.34ID:Qo1Yl4360
colabだぜ
0140名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/15(木) 16:56:01.04ID:Qo1Yl4360
>>139
おお、これは有用そう
ありがとう!
0142名無しさん@お腹いっぱい。 (ワッチョイ 2743-FUlb)
垢版 |
2022/12/15(木) 17:40:47.74ID:ET5iLKOR0
automatic1111で、Depth-guided modelの512-depth-ema.ckptに対応したというので試しているけど、
なんかうまくいかん。具体的にはこれどうやって使うん? 深度マップの画像はdepth map scriptなんかで作れば良いの?
0144名無しさん@お腹いっぱい。 (ワッチョイ 678e-DDnY)
垢版 |
2022/12/15(木) 20:25:09.54ID:BqENuH4E0
>>141
i2i使ったツイカス自演は日本でも初期に大量に起きてただろ…俺の絵大人気!AIで盗作されたって
懸念っていうような話でも何でもない、削除依頼出して対応しなければ訴ええばいいという結論で終わってる
ネットで騒いでるだけで怖くない存在になってきてるからな、盗作する奴は気兼ねなくやる
0146名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/15(木) 21:01:40.58ID:Qo1Yl4360
パクリ主張するならモデル、seed、プロンプトは必須だわな
0147名無しさん@お腹いっぱい。 (ワッチョイ a701-KKgq)
垢版 |
2022/12/15(木) 21:30:10.35ID:prISoiMk0
>>106
Unstable DiffusionはSD2.0モデルを活用するとしか発表してない
AphroditeAIとかいう謎のシステムを使って
シンプルなプロンプトで高品質な生成をできるようにするらしいから
長文プロンプト必須のSDベースではない可能性もある

>>116
Emadが来週と言ってたらしいぞ
海外ではそろそろクリスマス休暇に入るから予定通りに出るかは微妙だけど
0156名無しさん@お腹いっぱい。 (オッペケ Sr1b-YvQn)
垢版 |
2022/12/16(金) 08:31:17.21ID:ZDYYyIKhr
>>148
これイラストレータースレで最初期に言われてたけどchatGPT出たから現実的になったな

つってもプロが満足する品質が出せるか? とは思わないでもないが
まぁプロンプト練る部分とか、調整前提で基本設定組んでくれるだけでも楽になるか
0159名無しさん@お腹いっぱい。 (ワッチョイ dfa7-K/Lo)
垢版 |
2022/12/16(金) 09:54:50.63ID:d/vllCLr0
もはやchatGPTにもi2i的な感じで画像で指示したいわ
この絵のこんな感じを再現できるように適切に言語化してくれみたいな
んで出来た絵を元にもっとこうしてみたいな追加指示できたら
0160名無しさん@お腹いっぱい。 (スププ Sdff-hQ34)
垢版 |
2022/12/16(金) 09:57:34.19ID:RVY1SQQvd
chatGPTの文脈を理解する力はかなり高いからこの調子でもうちょっと技術が進歩したらイラストの世界でもキャラクターとか背景の文脈を保った出力ができるようになるかもなあ
0161名無しさん@お腹いっぱい。 (アウアウウー Sa6b-Eu4/)
垢版 |
2022/12/16(金) 10:31:47.49ID:6rKjEPmga
人間「ここがバーンでドカーンなんだよ!お前のはギビギビなの!こんなの使えねえんだよ!」
お絵描きAI「申し訳ございません。これでどうですか?」
人間「そうそう、いい感じ、あとはここら辺にひまわりっぽいタンポポを散らしといて」
お絵描きAI「わかりました」
0164名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/16(金) 12:42:13.49ID:iYemqD010
chatGPTは人雇って出力の評価してた
画像生成AIも、そのうちGAFAが何千万の画像に全部人力でキャプションつけて学習させるぞ
0165名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/16(金) 12:44:26.60ID:iYemqD010
そう考えるとdanbooruがどれだけAI学習に理想的なデータかわかるな
正味danbooru学習規制されたらアニメモデルは終わると思う
0166名無しさん@お腹いっぱい。 (アウアウウー Sa6b-3TNT)
垢版 |
2022/12/16(金) 13:12:12.59ID:T49O0/dqa
ダンボールのメリットは大規模学習データを整えやすい(理想的なデータとは言ってない)ってのと
あれがユーザーズマニュアルとして機能するから程度だし
つぶれても終わることはないよ
0167名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/16(金) 13:15:07.47ID:iYemqD010
>>166
blipやdeepdanbooruがつけるキャプションのゴミさに対して、段ボールは人力で全ての画像に基準が一貫した正確なキャプションが既についている
この学習におけるメリットはデカいと思う
0170名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/16(金) 13:19:44.22ID:iYemqD010
SDで理解不能な難解さだったプロンプトが、WDからNAIにかけてで、段ボールタグコピペで大体どうにかなるようになったのもデカい
元素法典も中身は大体段ボールのタグだしな
0171名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/16(金) 13:22:03.40ID:iYemqD010
自然言語じゃないのとタグの語彙が足りないのはそうだけど
全部人力なんてさっきも言った通り大企業でもないと無理なんだから、今の技術での現実的にはかなり理想的に近いのでは
0173名無しさん@お腹いっぱい。 (ワッチョイ 7f8e-DDnY)
垢版 |
2022/12/16(金) 13:25:55.99ID:Hf9J5Yr90
まぁ言語問題もあるけど、構造上3Dを理解してエミュレートしてるわけじゃないから
ダメな元絵だけじゃなく指が隠れたりする構図の画像学習すると指の本数が減っても異常だと感じなくなっちゃうしな
depthとは言わず奥行きで学習よりもレイヤー分けや人体だけでも3D構造理解させて描かせたいわ
SD3.0には期待している
0174名無しさん@お腹いっぱい。 (アウアウウー Sa6b-Eu4/)
垢版 |
2022/12/16(金) 13:29:44.38ID:TKsYvA1Aa
初期の画像生成は自然言語理解のレベルを測るための指標にしか過ぎなかったわけだけど(机の上にあるりんご、りんごが机の下にありますなど)
画像生成という点だけで見れば別に自然言語理解は不要だからね、正確な指示を与えたいという話ならjavascriptでも使った方が早い
0176名無しさん@お腹いっぱい。 (オッペケ Sr1b-YvQn)
垢版 |
2022/12/16(金) 14:02:55.55ID:OFP0Lmjlr
>>159,161
ドラえもんとか映画ウォーリーで機械が何でもやってくれるから体力が退化して自力で歩けなくなった人類みたいなのがいたけど、そんな感じだな、ウォーリーは知能も低下してたし
実際Google検索とタップで文字書かなくなるので似たようなもんか

逆にその分スマホ使うのに特化して脳発達してるけど、AI以降はなんかしら発達するんだろうか
0178名無しさん@お腹いっぱい。 (ワッチョイ dfd7-DDnY)
垢版 |
2022/12/16(金) 15:33:04.74ID:wgqxARzJ0
スクリプトまでいかなくても
なんかjson的な文法でidとpromptみたいなプロパティの簡単な構造体作れて
object,behaviour,sceneみたいにブロック分けて書けたらいいなとか思ったりしてる
0179名無しさん@お腹いっぱい。 (ワッチョイ c75f-3TNT)
垢版 |
2022/12/16(金) 15:59:27.56ID:Vvy6MeTY0
学習用のタグとして美術記述言語みたいなスクリプトがあってもいいだろうけど、
プロンプトでそんなの弄りたくないな。そういう細かい部分こそAIにお任せしたい
バカみたいだけど、>>161みたいな指示出しに対応してくれるAIがやっぱ理想形だと思う
0180名無しさん@お腹いっぱい。 (ワッチョイ 7f8e-DDnY)
垢版 |
2022/12/16(金) 17:39:22.12ID:240QdKXk0
>>179
でも、それが今のガチャに時間取られるっていう現実を生んでるわけで…
iPhoneに楽しくなれる曲かけて!って言って楽しくなったことがないって文句言うだけの人が増えるだけ
後ろ向きな性格な人やルーズな人間を満足させるAIは100年たっても無理だと思うぽ
0184名無しさん@お腹いっぱい。 (ワッチョイ a701-YvQn)
垢版 |
2022/12/16(金) 19:06:12.40ID:rKbJmSYC0
>>179,180
そもそも何をやりたいかなんだと思う
「いちいちプログラミングとか設計なんてめんどくさいしアイデアだけあればそれっぽいアプリ作って欲しい」と同じだと思う
それはノーコードでそこそこ満たせる

でもノーコードのお手軽さとエンジニア使って単価100万かけて(あるいはそのぐらい本格的な個人開発で)設計書にしろアジャイルにしろ何かしらの精度出したい開発はそもそもジャンルが違うから
0186名無しさん@お腹いっぱい。 (ワッチョイ e701-RiIV)
垢版 |
2022/12/16(金) 19:44:08.97ID:FFSUaELp0
親を人質に取られて脅されてる人が使わされてるやつ
AUTOMATIC1111のリポジトリ開いた瞬間傍で銃持って待機してる人に射殺される
0187名無しさん@お腹いっぱい。 (ワッチョイ df10-vDC+)
垢版 |
2022/12/16(金) 20:06:01.41ID:iYemqD010
automaticとnmkdとinvokeがあるが
ありとあらゆるextensionがautomaticにしか対応していない
そもそもの機能も足りてない
0189名無しさん@お腹いっぱい。 (ワッチョイ 2743-FUlb)
垢版 |
2022/12/16(金) 22:17:07.66ID:ptDDKx3v0
>>185
基本的な画像生成に関してはそんなに違いは無い。
あれこれやりだすと足りなくて、automatic1111に流れていく人が多いし自分もそうだった

>>188
マージやモデル剪定とかでよく使ってるなあ。
1.8ではモデルの形式変換もついたので、そのへんの便利機能は使っていくかもだ
0193名無しさん@お腹いっぱい。 (ワッチョイ bef2-zxNf)
垢版 |
2022/12/17(土) 08:55:51.05ID:pura8guQ0
@Yamkaz: 新しいAIイラスト生成サービス
「HolaraAI」が公開!
https://holara.ai/holara/
より良い色とスタイルを得るため、そして他のすべての人と公平になるために、Stable Diffusion 1.5を多くの独自手法を用いて学習させたものとのこと。以下は個人的に出力したもの、編集なしです #HolaraAI https://twitter.com/Yamkaz/status/1603861730232524800/photo/1
https://twitter.com/5chan_nel (5ch newer account)
0194名無しさん@お腹いっぱい。 (ワッチョイ ea10-zw/P)
垢版 |
2022/12/17(土) 11:21:33.36ID:d7ZUSjac0
またクローズドですか......
0198名無しさん@お腹いっぱい。 (アウアウウー Sa9f-JDfe)
垢版 |
2022/12/17(土) 12:43:45.43ID:z/JHv6cva
大した労力使わなくてもモデルマージするだけでサービスインできてほぼ放置で儲かる
そしてNAIまんまだとばれるしやばい(訴えられるなどの可能性ある)けど
NAIマージなら疑われても外部からそれを証明するすべはない
運営側にはメリットしかない
0202名無しさん@お腹いっぱい。 (オッペケ Srb3-zN+2)
垢版 |
2022/12/17(土) 14:41:07.40ID:BcTKEGvsr
>>196
言うほど目新しさないか?
NAIより顔良いし背景の質感違うし、サブ候補としては十分アリだと思ったが

モデル導入できる奴はともかく一般向けにマージモデルごとにサービス立ち上げるのは何も間違ってなくね?
むしろもっとあるべきだろ
0203名無しさん@お腹いっぱい。 (ワッチョイ 0f8e-N2O4)
垢版 |
2022/12/17(土) 14:56:32.27ID:qcuAuRfZ0
なんでツイカスの方を貼るのかさっぱりだな自演か
普通はこっち貼るだろ?儀重t系の板なのに手間が増えるだけ
https://holara.ai/
ぱっと見1girlタグとか使ってる時点でNAI系というかDanbooruな訳だな
NAIと同じくマスピとucが裏で設定されて、ClipSkipも2のままだろう
中国のNAIクローンの別モデル版と何が違うのかさっぱりだ
何の目新しさもないマネタリングのひとつじゃね?
https://holara.ai/guide/
0223名無しさん@お腹いっぱい。 (ワッチョイ ea10-zw/P)
垢版 |
2022/12/17(土) 21:12:52.37ID:d7ZUSjac0
>>219
DBもHNとかみたいに途中経過保存する機能あったはずや(めちゃ容量食うけど)
あと最近出たloraって技術使えば数MBのptファイルでDBに近いことできるらしい
0226名無しさん@お腹いっぱい。 (ワッチョイ db2d-N2O4)
垢版 |
2022/12/17(土) 23:49:04.90ID:7uYv5Wal0
Stable Diffusion3.0では、アーティストが自分の作品をAIのトレーニングに利用されないようにする事が出来るかも知れない

キタ━━━━━';・(゚Д´(〇=(゚∀゚)=〇)`Д゚)・;'━━━━━ッ!!!!的に
0228名無しさん@お腹いっぱい。 (ワッチョイ ea10-zw/P)
垢版 |
2022/12/18(日) 00:28:24.89ID:8aS0iFY00
artstationも利用規約でNoAI定めたから、実効性はともかく一定の法的拘束力はありそう
まぁこのままほっとくと、誰もネットに作品をあげなくなる勢いだったからしゃあないのかね
0230名無しさん@お腹いっぱい。 (ワッチョイ 377d-ZR1D)
垢版 |
2022/12/18(日) 00:34:53.74ID:k9WJMk2S0
colabに4GB超えるファイル入れれないけど
こういうもんなの?
0231名無しさん@お腹いっぱい。 (ワッチョイ ea10-zw/P)
垢版 |
2022/12/18(日) 00:43:45.81ID:8aS0iFY00
>>230
直接ぶち込もうとすると回線終わってて死ぬ
一旦driveにダウンロードしてマウントするか、web上のやつだったらwgetやgit cloneを使う
0232名無しさん@お腹いっぱい。 (ワッチョイ 377d-ZR1D)
垢版 |
2022/12/18(日) 00:59:41.27ID:k9WJMk2S0
>>231
回答ありがとうございます
マウントってプログラミング知識がないと難しそうですね
0233名無しさん@お腹いっぱい。 (ワッチョイ ea10-zw/P)
垢版 |
2022/12/18(日) 01:26:02.43ID:8aS0iFY00
>>232
めちゃくちゃ簡単だから一回ググってくれ
ボタン二回押すだけだから
0234名無しさん@お腹いっぱい。 (ワッチョイ ea10-zw/P)
垢版 |
2022/12/18(日) 01:27:52.47ID:8aS0iFY00
aiやってからcolabに初めて触れたけど、GoogleのUI設計の簡単さに震えたよね
黒背景にちっこい文字のコマンドプロンプトしかないんだと思ってた
0236名無しさん@お腹いっぱい。 (ワッチョイ 9710-65Bv)
垢版 |
2022/12/18(日) 02:05:54.12ID:UtGJFCEK0
AI生成周りは規制厳しくして良いと思う
その分「だから使って良いよね」ってなるし

もちろん度を越えた方らは閾値を示す意味合いで務所送りになって尊い犠牲やったなって役立っていただければ言うことはない
0237名無しさん@お腹いっぱい。 (ワッチョイ 377d-ZR1D)
垢版 |
2022/12/18(日) 04:13:16.29ID:k9WJMk2S0
>>233
ググってもコード書けと出ますわ
どのボタンでしょうか?
0242名無しさん@お腹いっぱい。 (ワッチョイ ff7f-NRGM)
垢版 |
2022/12/18(日) 08:39:07.87ID:oECdNzBm0
>>241
添えるコメントもAIでっていうのは普通に良さそう

っていうのをAIに文章化してもらった。最初の一文以外は勝手に足されたんだけど学校の先生みたい

『確かに、AIによる投稿やコメントも検討する価値はありそうですね。でも人間の要素を完全に排除することは、AIマイスターとして目指すべきではないと思います。人間の知恵や思考、感情を反映させた文章やコメントも大切ですからね。』
0246名無しさん@お腹いっぱい。 (ワッチョイ ea10-5d6s)
垢版 |
2022/12/18(日) 10:21:23.87ID:8aS0iFY00
ChatGPTくんのおかげで、automaticで動かないところが出てきたときに諦めなくてよくなった
アートの民主化より前にプログラミングの民主化が来ちゃったな
0248名無しさん@お腹いっぱい。 (ワッチョイ 377d-ZR1D)
垢版 |
2022/12/18(日) 12:12:10.26ID:k9WJMk2S0
>>243
ありがとうございます
それは読んだんですけど
コード書くと思ってました
0252名無しさん@お腹いっぱい。 (ワッチョイ 3b01-zN+2)
垢版 |
2022/12/18(日) 15:37:44.97ID:yz0H+sJG0
>>249
ドット絵って動かす前提だし「それが何なのか」をキャラ名とかユニット名込みで表現するから、「ドット絵っぽい何か」だけ大量にあっても扱いに困りそう

プロンプトとどのくらい紐づいてるか次第では動作アニメーション用の差分含めて使い勝手よさそう
0253名無しさん@お腹いっぱい。 (ワッチョイ eabe-e5AJ)
垢版 |
2022/12/18(日) 16:07:48.84ID:C5/aAgnB0
>>250
ハギングフェィスに投げとけばいい
0255名無しさん@お腹いっぱい。 (ワッチョイ 2620-ihXz)
垢版 |
2022/12/18(日) 22:51:32.80ID:W6DDzodQ0
こういうのって規制が入る前に参入して
スタンダードになった奴が次のスーパー金持ちになる
後続を潰せる規制を作る側になるから
0259名無しさん@お腹いっぱい。 (ワッチョイ 6a7d-ZR1D)
垢版 |
2022/12/19(月) 06:46:26.18ID:6wr4Alre0
colabの学習を解説してるので
実際に学習できたところあります?
いくつか試したけど上手くいかない
wikiのやり方も動かない
0261名無しさん@お腹いっぱい。 (ワッチョイ 6a7d-ZR1D)
垢版 |
2022/12/19(月) 07:08:49.56ID:6wr4Alre0
>>260
wikiにあったcolabのwebui1111で学習させようとすると失敗するんです
ここ数日、何回も試して辛いです
0262名無しさん@お腹いっぱい。 (ワッチョイ ea10-5d6s)
垢版 |
2022/12/19(月) 07:51:19.41ID:F4Ls25Te0
俺もautomaticのdreamboothうまくいかないんだよな
ChatGPTくんの言う通りファイル書き換えたら起動はしたけど、新しいモデル作る段階でテキストエンコーダーのマージ?が終わらない
0266名無しさん@お腹いっぱい。 (ワッチョイ e662-eaDT)
垢版 |
2022/12/19(月) 09:25:19.26ID:OSLnPW1h0
ちょっと質問失礼します。
NovelAIのサブスク(最上位)に登録してnaisguiでrandom構文加えて回してたんですけど
流石に多く回しすぎたのか無料生成に規制が入ってしまいました。これは別垢作れば回避できますかね?
しょうもない質問であれですが同じような人で回避できた方いたら返信よろしくお願いいたします。
0269名無しさん@お腹いっぱい。 (ワッチョイ 37e4-z22/)
垢版 |
2022/12/19(月) 11:23:57.77ID:2EOcDggU0
automaticのは使ったことないから分からないけど
ColaboのやつでXformers使ってる場合はColaboのバージョンが変わったらしくて
適切なXformersをインストールしないとうごかなくなっているっぽいね
0270名無しさん@お腹いっぱい。 (ワッチョイ 6a7d-ZR1D)
垢版 |
2022/12/19(月) 11:26:07.42ID:6wr4Alre0
>>263-264
ありがとうございます
FastDB使ってみたんですけど
何か上手くいかないですね
0278名無しさん@お腹いっぱい。 (ガックシ 06e6-zw/P)
垢版 |
2022/12/19(月) 12:54:59.39ID:z4zB7jbX6
>>277
3Dアニメはともかく、2Dは中割りがあるからなぁ
0279名無しさん@お腹いっぱい。 (ワッチョイ 6a7d-ZR1D)
垢版 |
2022/12/19(月) 13:07:45.27ID:6wr4Alre0
ColaboのFastDB全く学習してないなあ
2回やってもダメだった
動画で解説してる人も失敗してるような
0280名無しさん@お腹いっぱい。 (ワッチョイ eabe-e5AJ)
垢版 |
2022/12/19(月) 13:20:55.39ID:zZGy9WMT0
>>279
うそーん俺はこれで人物ごとのモデル作ってるけど
0281名無しさん@お腹いっぱい。 (ワッチョイ 6a7d-ZR1D)
垢版 |
2022/12/19(月) 13:25:11.29ID:6wr4Alre0
>>280
何がダメなんでしょうね
動画の解説どおりにやって
colabも課金してるのに
0283名無しさん@お腹いっぱい。 (ワッチョイ 6a7d-ZR1D)
垢版 |
2022/12/19(月) 13:33:25.05ID:6wr4Alre0
>>282
wikiに書いてるloraの使い方やると
数日前からckpt追加されなくなりましたね
前はckpt追加されたのに
0286名無しさん@お腹いっぱい。 (ガックシ 06e6-5d6s)
垢版 |
2022/12/19(月) 15:20:46.99ID:ZH6RwbPn6
colab最高!って思ってたけど、開発者の人がノートブックまで手が回らんくて更新されんケースが多いんだよな(開発者とノートブック作ってる人が別なこともあるし)
だから結局、colabにしろローカルにしろ自分でコード打ち込んでゼロから環境構築するしかない
0287名無しさん@お腹いっぱい。 (ワッチョイ 6a7d-ZR1D)
垢版 |
2022/12/19(月) 15:26:49.13ID:6wr4Alre0
>>286
colabは時間経つと使えなくなるんですかね
0288名無しさん@お腹いっぱい。 (ガックシ 06e6-5d6s)
垢版 |
2022/12/19(月) 15:30:28.25ID:ZH6RwbPn6
>>287
そんなことないけど、Pythonのバージョンが変わったり色々あってバグった時に、開発者の人が治してくれないことはある
0290名無しさん@お腹いっぱい。 (ガックシ 06e6-5d6s)
垢版 |
2022/12/19(月) 15:39:28.01ID:ZH6RwbPn6
>>289
俺もプログラミングさっぱりだからわからんが
ChatGPTにエラー文打ち込むと四割から五割くらいは解決する
0291名無しさん@お腹いっぱい。 (ガックシ 06e6-5d6s)
垢版 |
2022/12/19(月) 15:43:37.78ID:ZH6RwbPn6
ChatGPTは間違いなくもっといろいろやれるのに、openaiがブレーキかけてるんだよな
Webに繋げてくれればもっと正確に質問に答えられるようになるし、パソコンに常駐してデータ全部見てくれればエラー改善率も絶対もっと上がる
文字数制限なくしてくれればもっとすげえコードも書けるしな
そうなったら月一万でも課金するわ
0293名無しさん@お腹いっぱい。 (アウアウウー Sa9f-BGor)
垢版 |
2022/12/19(月) 17:10:46.52ID:iTTSLeE6a
今は「東京タワーの隣にエッフェル塔がある」って言ったらそのまま書いちゃうんだよな
本来はそんなことは物理的にあり得ません。って答えるAIじゃないといけない
これが出来ないと人間のイラストレーターを超えることはできない
0294名無しさん@お腹いっぱい。 (ワッチョイ 8a6d-8Cre)
垢版 |
2022/12/19(月) 17:26:51.07ID:Srzje3Vk0
1111でdreamartistやってるんですが、step何回くらいまわすもんでしょうか。
512*512の画像1枚でキャラ覚えさせたいんですが、1500くらいから後は
プレビュー画像がなんかぼやけた感じで、キャラの特徴も表現できてるのか
できてないのか微妙な感じ。とりあえず13000くらいまで回してるけど
あまり変わらない。
HNやDBの時はまぐれ当たりで効果でたんですが・・
0297名無しさん@お腹いっぱい。 (オッペケ Srb3-zN+2)
垢版 |
2022/12/19(月) 18:10:59.40ID:MuHwS8j4r
>>293
それはむしろ人間の絵師でも隣に書く指定では?
ITエンジニアでもそうだけど発注する側が狂ってたら人間でもAIでもどうしようもない
ていうか「物理的」にはあり得るし

まぁ最終到達点が「発注すらできない人間のサポートをして何が欲しいのかを明確化してくれる」っていうコンサルめいた、慣れたデザイナーがしょうがなくやってることをAIがやってくれるようになるってのはそうかもしれないが
0302名無しさん@お腹いっぱい。 (ワッチョイ a301-8Cre)
垢版 |
2022/12/19(月) 18:43:13.42ID:c6KZmh1J0
我非技術民です
Tokenizerまたはプロンプトの右にあるトークン数カウンターの数字を自作スクリプトで得たいのですが
非技術畑の人間にはこれがどこから得られる値なのかわからないのです

この値を得る最小の方法をご存じの方、よろしければ教えてくださると助かります……
0310名無しさん@お腹いっぱい。 (ワッチョイ 3bbd-ZR1D)
垢版 |
2022/12/19(月) 22:52:02.23ID:rG02Vf+N0
HNとかDAみたいに負荷の大きいものはcolabで回したいと思って
いろいろやってみたんだが、
DAのタブを出すとこまではできた。
しかし
RuntimeError: indices should be either on cpu or on the same device as the indexed tensor (cpu) colab
というエラーが出て止まるんだ・・・。
なんでじゃろか。
だれか知らん?
ログからするに、提示した画像は読み込んでるし
ログフォルダの中に保存構造もできてるんだが
学習ステップ数が進まず停止して 少ししたら上記のエラーが出るのよ。
0311名無しさん@お腹いっぱい。 (ワッチョイ ea10-zw/P)
垢版 |
2022/12/19(月) 23:10:46.90ID:F4Ls25Te0
このエラーは、PyTorchで使用されるTensorオブジェクトに対して、異なるデバイス上のインデックスを使用しようとしたときに発生する可能性があります。この場合、インデックスとテンソルが異なるデバイス(CPUまたはGPU)であるため、エラーが発生しています。

このエラーを修正するには、次のようにします。

インデックスを同じデバイス上のテンソルと同じデバイスに移動します。
インデックスをCPU上に移動して、テンソルをCPU上に移動することもできます。
インデックスをGPU上に移動して、テンソルをGPU上に移動することもできます。
具体的には、次のようにします。

# インデックスをCPU上に移動する場合
index = index.cpu()
# テンソルをCPU上に移動する場合
tensor = tensor.cpu()

# インデックスをGPU上に移動する場合
index = index.cuda()
# テンソルをGPU上に移動する場合
tensor = tensor.cuda()
また、テンソルとインデックスが同じデバイス上にあることを確認するには、次のようにします。

# テンソルがGPU上にあるかどうかを確認する
tensor.is_cuda

# インデックスがGPU上にあるかどうかを確認する
index.is_cuda


だとよ
0313名無しさん@お腹いっぱい。 (ワッチョイ 3bbd-ZR1D)
垢版 |
2022/12/19(月) 23:33:49.47ID:rG02Vf+N0
>>311
AIに聞くやつなw
俺も聞いて聞いて2日粘ったがなんぼやってもエラーエラーで
どんどん遠い方向に飛ばされていくばかりだった。
まだまだ「AIくん!!いい感じに何とかして!!」とはいかないもんだな。
せめてファイルごと提示できれば塩梅よくやってくれるんだろうが・・・。
進化待ちやね。

>>312
サンクス。そこもっかい挑戦してみるわ。

とっしのまとめにも似たような例があってやってみたんだけど
最後の方でエラー吐いてうまくいかんかったんだよなぁ。
「長いから省略!!」ってなってた部分に何かがあるんだろうかな・・・
0314名無しさん@お腹いっぱい。 (ワッチョイ ea10-5d6s)
垢版 |
2022/12/19(月) 23:40:47.89ID:F4Ls25Te0
俺のlora、1step学習するのに1分かかってるんだが

!accelerate launch train_lora_dreambooth.py \
--pretrained_model_name_or_path="/content/sample_data/model" \
--instance_data_dir="/content/instance_data" \
--output_dir="/content/output" \
--instance_prompt="sls girl" \
--train_text_encoder \
--resolution=512 \
--train_batch_size=1 \
--gradient_accumulation_steps=1 \
--learning_rate=1e-4 \
--learning_rate_text=5e-5 \
--color_jitter \
--lr_scheduler="constant" \
--lr_warmup_steps=0 \
--max_train_steps=4800

でなんか設定間違ってる?
colabだからGPUは問題ないはず
0315名無しさん@お腹いっぱい。 (ワッチョイ ea10-5d6s)
垢版 |
2022/12/19(月) 23:57:26.22ID:F4Ls25Te0
解決した
GPU環境じゃなかったwww
0316名無しさん@お腹いっぱい。 (ワッチョイ ea10-5d6s)
垢版 |
2022/12/20(火) 00:13:35.11ID:23NENbwR0
lora、学習自体は始まった
ただまだ普通の速さだな。公式colab見ると異常な学習率と異常なstep数の少なさで時間短縮してる感じか?
バッチサイズがtraining batch size とは無関係に学習率を割ってるのがよくわからん
0317名無しさん@お腹いっぱい。 (ワッチョイ 6a7d-ZR1D)
垢版 |
2022/12/20(火) 00:55:20.56ID:xB8sjws00
colabとローカルの学習どっちが簡単かな?
colabは全く上手くいかないわ
0318名無しさん@お腹いっぱい。 (ワッチョイ ea10-5d6s)
垢版 |
2022/12/20(火) 01:12:24.60ID:23NENbwR0
>>317
ローカルわからん......ろくなPCないもんで

lora 結果が出ました
結論から言うと、step数自体はdreamboothと似たような数いるらしい。1000とかじゃダメ
だから時間はそんな劇的には早くならない

精度はdreamboothと大差ない。満足してる
6MBでデータを管理できるの便利すぎる。こっちがメインの利点
あと8bitadamとかもしかしたらいらんかも

https://imgur.com/a/T8zIlyd
WD1.3.5、画像8枚4800step 正則化画像なし
0320名無しさん@お腹いっぱい。 (ワッチョイ ea10-5d6s)
垢版 |
2022/12/20(火) 02:17:55.73ID:23NENbwR0
>>319
ほらよ
https://imgur.com/a/eFn0o3o

まぁ学習画像8枚だしちょっとステップ数多くて過学習気味かもしれんが、その辺はDBも一緒やからな

それにしてもcolabのextensionのdreambooth全然だめだな、もともとのモデルすら読み込まへん
0321名無しさん@お腹いっぱい。 (ワッチョイ 6a7d-ZR1D)
垢版 |
2022/12/20(火) 02:29:43.79ID:xB8sjws00
>>318
良いですね!
これは自分のPCで作ったんでしょうか?
0322名無しさん@お腹いっぱい。 (ワッチョイ ea10-5d6s)
垢版 |
2022/12/20(火) 02:45:18.94ID:23NENbwR0
>>321
いんやcolab 普通にdiffuserで

でもダメだな
diffuserモデルにloraマージして、ckptに変換して、automatic持ってきたけど
automatic本体がckptを読み込んでくれなくて一生loadingしてる

automaticで使えなきゃ意味ないんよなぁ
0323名無しさん@お腹いっぱい。 (ワッチョイ 6a7d-ZR1D)
垢版 |
2022/12/20(火) 02:56:20.67ID:xB8sjws00
>>322
おお! colabですか!
よろしければ、使ったcolabのURL教えて頂けませんか?
私が使ってるのはどれも使えなくて・・・
0325名無しさん@お腹いっぱい。 (ワッチョイ 6a7d-ZR1D)
垢版 |
2022/12/20(火) 03:37:31.62ID:xB8sjws00
>>324
ありがとうございます
やはりコードいじれないとcolab使うのは難しそうですね
0327名無しさん@お腹いっぱい。 (ワッチョイ bef2-zxNf)
垢版 |
2022/12/20(火) 08:20:41.43ID:4npTSf0n0
コードをいじるといっても他の人が作ったのを切り貼りするだけですよ
自分も1111を動かして、生成された画像やconfig.jsonをGoogleドライブに保存したりするcolabはあちこちからのコピペで作ったよ
0328名無しさん@お腹いっぱい。 (アウアウウー Sa9f-fzMu)
垢版 |
2022/12/20(火) 10:15:16.02ID:kEXwdYTIa
>>313
こっちはPaperspace環境で同じエラー出てwebui実行中にddpm.pyに1行追加をしても駄目だった
リポジトリのソース変更後にインストールするとこからやり直したら治ったな
0337名無しさん@お腹いっぱい。 (ワッチョイ eabe-e5AJ)
垢版 |
2022/12/20(火) 21:56:39.75ID:05mz4WVf0
>>333
これほんとに512x512の1枚にかかる秒数?なんか多くない?
0343名無しさん@お腹いっぱい。 (ワッチョイ d718-JDfe)
垢版 |
2022/12/20(火) 22:24:36.70ID:G0rzPkqC0
始めたばかりの初心者です。
automaticでモデルは雄姿の方がマージしてくれたbloodOrange~~というのを使っています。
素朴な疑問なんですが、呪文と言われる物を使った方がGPU負荷が抑えられるのでしょうか?
今は呪文+「this is boy,he is black hair」みたいなので描かせています。
ガチャは一応意図した物が出るので、不満は無いのですが、呪文覚えた方が効率いいなら呪文にしようかと思いまして
0349名無しさん@お腹いっぱい。 (ワッチョイ 1f02-ZR1D)
垢版 |
2022/12/20(火) 23:19:13.87ID:o9GBmY4+0
>>343
呪文と言っているのは「masterpiece, best quality,」のような定番のプロンプトを指して言ってるのでしょうか
あるなしで生成結果に違いは出ますが絶対必要なものではなくまたGPU負荷とは関血Wないものです
「NovelAI プロンプト 自動」あたりでググればボタンぽちぽちでプロンプト生成してくれるページが見つかるのでそれらから慣れていくと良いのではないでしょうか
0352名無しさん@お腹いっぱい。 (ワッチョイ ea10-zw/P)
垢版 |
2022/12/21(水) 07:56:44.84ID:+AusdQGi0
WD1.4、機材トラブルにより延期へ
一方、WD1.3.5は再チャレンジ開始
明日明後日くらいにはアップロードされるらしい
0353名無しさん@お腹いっぱい。 (オッペケ Srb3-zN+2)
垢版 |
2022/12/21(水) 08:24:48.35ID:OpWKGP+Br
>>343
そもそもプロンプトという概念をまだ知らないのですね
呪文=プロンプト全般の総称なので「this is boy」も呪文だし、GPU負荷とも関係しません

以下の5chwikiなどを一通り読んでみることをお勧めします(NAI用なのでモデルはズレるけど基本概念は大体同じ)
初心者の頃は一つずつ質問するより(基本が終わるまでに200回ぐらい質問することになると思います)、まとまった資料で基本を学ぶのが効率的かと
https://seesaawiki.jp/nai_ch/d/%A5%C8%A5%C3%A5%D7%A5%DA%A1%BC%A5%B8
0359名無しさん@お腹いっぱい。 (ワッチョイ ea10-zw/P)
垢版 |
2022/12/21(水) 10:40:56.23ID:+AusdQGi0
dreamboothとか拡張じゃなくて本体に入れて欲しいわ
0360名無しさん@お腹いっぱい。 (ワッチョイ bef2-zxNf)
垢版 |
2022/12/21(水) 10:44:52.42ID:0ChE/9ec0
>356
試してみたら普通に起動して使えたよ
--autolaunchという起動オプションがあることを知った
自動アップデートはgit pullするだけみたいだから、最初のセットアップがすんだらあとは自分でインストールしたのと変わらなさそう
ランチャーにある、起動のたびにoutputsフォルダを空にするオプションは恐ろしくて隠しておきたいくらいだが、どういう状況で便利なんだろう?
0361名無しさん@お腹いっぱい。 (ワッチョイ be8e-N2O4)
垢版 |
2022/12/21(水) 11:17:35.52ID:VejxfDCr0
無知から始めるなら自動インストールか独学つったってどこかのサイトの情報を頼ることになるからなぁ
プログラム経験あるならgitやgithubの使い方やインストール先も管理できるだろうけど…そこまで覚えれば怖いものないんだがな
AUTOMATICは追加した生成データはすぐに数万枚単位になるし、プラグイン削除したり、モデルぶっこんだり、学習データ見たり
その後も管理はあるので怠けないほうがいいとは思う
ましてや自動とは言えあのインストールの注意書き全部読んだり覚えるだけで、インストール終ると思いますわよ(笑)
0365名無しさん@お腹いっぱい。 (オッペケ Srb3-Fu+n)
垢版 |
2022/12/21(水) 11:44:58.80ID:wzL6noOHr
因みに環境構築は「そうだAI画像生成環境、作ろう」のノリで5chで情報貰ってblog系の記事見て、2時間で出来た
パソコンは詳しい方だと思うが、gitとか何もわからん
pythonも「単語はたまに仕事で聞くなぁ」程度だった

環境構築できるか心配な人は無難にCドライブに構築が良い
変にドライブを別に指定すると、だいたいドツボにハマると思う
0371名無しさん@お腹いっぱい。 (ガックシ 06e6-5d6s)
垢版 |
2022/12/21(水) 15:57:44.68ID:hTO0CvNZ6
loraについてさらなる追記
色々頑張ってlora済みモデルをautomaticで使えるようにしたんだけど、diffuserで試した時と明らかに質が違う
公式のやり方に従ってloraをdiffuserモデルにマージ、そのdiffuserモデルをckptに変換、このどちらかの工程で何かがおかしくなってる
Twitterでもlora公称より質低くね?って報告とうまくいってる報告が混在してるけど、多分これが原因(diffuserでやってるかckptに変換してwebuiでやってるか)
0372名無しさん@お腹いっぱい。 (ガックシ 06e6-5d6s)
垢版 |
2022/12/21(水) 15:58:54.39ID:hTO0CvNZ6
seed同じにして実験して画像付きでプルリクするやる気が俺にはないので、誰か熱意がある人がいたら試してみてくれ
0375名無しさん@お腹いっぱい。 (アウアウウー Sa9f-Ihjc)
垢版 |
2022/12/21(水) 17:38:03.18ID:lwGBrw1ta
>>371
automaticのextensionの方が間違えてると思うわ
数日前までtext encoderにチェック入れると画質が劣化するバグがあった
しかも.ptと_txt.ptの2つあるのにckpt作るとき1つしか選べない
他にも怪しい動きがあるからdiffuserの方があってると思うわ
0376名無しさん@お腹いっぱい。 (ガックシ 06e6-5d6s)
垢版 |
2022/12/21(水) 17:49:22.93ID:4rdOq5Bo6
>>375
diffuserの方が質が高いのは間違いない
extentionがcolabで使えないから、https://note.com/kohya_ss/n/n374f316fe4adのプログラムでckptにしてるけど
そういえば昨日、diffuserにptファイルをマージした時点で推論して、そん時にはもうおかしかったことを思い出した
>しかも.ptと_txt.ptの2つあるのにckpt作るとき1つしか選べない
これだと思う。テキストエンコーダーの学習がckpt作るときに反映されていなくて、それをautomaticで読み込む術がない
TIのptファイル突っ込むところに突っ込んでも読み込まれないしな
0377名無しさん@お腹いっぱい。 (ガックシ 06e6-5d6s)
垢版 |
2022/12/21(水) 17:55:43.70ID:4rdOq5Bo6
lora的にはテキストエンコーダーの学習がupdateによる後付けで、ckptへの変換もupdateで(SD2.1だけだけど)追加したことから想定外なんだろうな
automaticが公式にloraによる推論をサポートしてくれればいいけど、更新ないからなぁ
もうやる気なくしたんかな
0379名無しさん@お腹いっぱい。 (アウアウウー Sa9f-Ihjc)
垢版 |
2022/12/21(水) 18:25:48.63ID:eRa6QsVfa
>>377
本家の方にckpt変換ツールがあって
--text_encoderのオプションに対応してるように見える
https://github.com/cloneofsimo/lora/blob/master/lora_diffusion/cli_lora_add.py

readmeに使用方法が載ってないから合ってるかわからん
https://github.com/cloneofsimo/lora#mergigng-full-model-with-lora-and-changing-to-original-ckpt-format
0380名無しさん@お腹いっぱい。 (アウアウウー Sa9f-Ihjc)
垢版 |
2022/12/21(水) 18:37:45.80ID:kuqUYZmga
>>379
違ったわ
--with_text_lora
か?すまん使い方わからんわ
0382名無しさん@お腹いっぱい。 (アウアウウー Sa9f-Ihjc)
垢版 |
2022/12/21(水) 19:11:03.33ID:btUe/vaSa
やっぱりloraのckpt変換はreadmeに全部書いてあるわ
多すぎてわからん
0383名無しさん@お腹いっぱい。 (ワッチョイ ea10-zw/P)
垢版 |
2022/12/21(水) 19:13:14.60ID:+AusdQGi0
>>380
More bash examples with Text Encoder Lora:

$ lora_add --path_1 stabilityai/stable-diffusion-2-base --path_2 lora_kiriko.pt --mode upl-ckpt-v2 --alpha 1.2 --with_text_lora --output_path merged_model.ckpt
: This will build a merged_model.ckpt with LoRA merged with
α
=
1.2
and text encoder LoRA.

の項目見逃してたわごめん
だって3optionとか言うから......
りどみは全部読もうね!
0384名無しさん@お腹いっぱい。 (ワッチョイ ea10-zw/P)
垢版 |
2022/12/21(水) 19:13:40.64ID:+AusdQGi0
また実験してみる
0385名無しさん@お腹いっぱい。 (ワッチョイ ce01-IBS7)
垢版 |
2022/12/21(水) 19:35:44.17ID:fJln8Dag0
>>369
世間一般的な感覚だと、君の言ってることすら難しい専門用語の羅列になるんだよ
世間は君が想像している以上にパソコンに詳しくないものなのさ
お絵描きは今までPCに疎かった人達も興味を持ったから特にそういう人達が多いだろうね
0386名無しさん@お腹いっぱい。 (ワッチョイ be8e-N2O4)
垢版 |
2022/12/21(水) 19:56:08.38ID:VejxfDCr0
>>385
インストール解説ページを見て理解しよう使えるようになりたいって思えば義務教育で習う範囲の知識で何とかなるわけだしな
自分の理解力と時間で好きな道を選べばいいし、自動が欲しい人は誰かがいつか作ってくれるまで待てばいい

新しいものをすぐ使いたい人は自分で学ぶしかないからねぇ
とくにマネタイズ絡んでる人は出遅れると致命傷だからライバルが少ないうちに物事を進めるのは基本だ
次は3Dが待ってる
https://note.com/npaka/n/n8121e382d51e
0387名無しさん@お腹いっぱい。 (アウアウウー Sa9f-Ihjc)
垢版 |
2022/12/21(水) 20:06:59.03ID:hB1nkFxca
>>386
AI界隈速すぎて笑うわ

それ試したが文章から点群を作ったはいいが保存ができない
公式を見たが保存する例がないから文章から点群作って3Dのメッシュを作ってblenderに読み込む一連の流れができない

2,3分で作れるから流行るかもしれないわ
3Dの小物作れそうだし
0388名無しさん@お腹いっぱい。 (アウアウウー Sa9f-Ihjc)
垢版 |
2022/12/21(水) 20:12:58.67ID:hB1nkFxca
試してる人が少ないんだろうな
でも声を大きくして言いたい

肝心の点群を保存したいんだができないじゃん!
0389名無しさん@お腹いっぱい。 (アウアウウー Sa9f-Ihjc)
垢版 |
2022/12/21(水) 20:19:44.95ID:hB1nkFxca
あっ保存しなければいいのか
pcってのがポイントクラウドで
そのままメッシュに変換すればええやん
0390名無しさん@お腹いっぱい。 (ワッチョイ ea10-5d6s)
垢版 |
2022/12/21(水) 20:23:14.70ID:+AusdQGi0
https://imgur.com/a/w9cehO3

できた
開発者さん誠にごめんなさい
0391名無しさん@お腹いっぱい。 (ワッチョイ ea10-5d6s)
垢版 |
2022/12/21(水) 20:24:52.04ID:+AusdQGi0
>>386
どっかの企業が3d生成ベータテストしてたよな
そこにモロ被せてくるopenaiさん流石w
2,3分でできるのすごいな、もっと時間かかると思ってた
0393名無しさん@お腹いっぱい。 (ワッチョイ ea10-5d6s)
垢版 |
2022/12/21(水) 21:05:10.26ID:+AusdQGi0
>>392
サンタどころかお年玉にも間に合わなさそうだぞ
0394名無しさん@お腹いっぱい。 (ワッチョイ ea10-zw/P)
垢版 |
2022/12/22(木) 08:45:20.89ID:/Y8aG60v0
嘘だろ!?unstable diffusionのクラファン、Kickstarter側が勝手に停止しやがった
あほくさ!
0396名無しさん@お腹いっぱい。 (ワッチョイ ea10-zw/P)
垢版 |
2022/12/22(木) 08:55:44.48ID:/Y8aG60v0
お気持ちでこんなんされたら自前で開発してるクローズドを利するだけやんけ
結局違法じゃない以上開発は止められないんやから
0397名無しさん@お腹いっぱい。 (ワッチョイ 6aa7-JMjI)
垢版 |
2022/12/22(木) 09:01:12.99ID:zaonJMIR0
集めてる額自体は大した事なかったんだけどな
反AIに粘着されて法的にどうかとかきちんと精査もせずとりあえず折れるってのはクラファンプラットフォームとしてそれで良いのかとは思うが
0398名無しさん@お腹いっぱい。 (ワッチョイ 633e-e5AJ)
垢版 |
2022/12/22(木) 09:05:05.97ID:DdAirSYJ0
日本でも物議を醸しているけど比じゃないくらい海外はより過激だからな
猛烈な抗議が寄せられているだろうし立ち位置を表明したいんだろう
それにしても惜しいなあ別の場所でどうにか立ち消えずに続けてほしいもんだ
0401名無しさん@お腹いっぱい。 (ガックシ 06e6-5d6s)
垢版 |
2022/12/22(木) 10:48:24.97ID:a5qghV766
そうこうしている間にnovelaiが2.0モデル出して終戦
0402名無しさん@お腹いっぱい。 (ガックシ 06e6-5d6s)
垢版 |
2022/12/22(木) 10:49:44.58ID:a5qghV766
ていうかそうか、midjourneyもポルノ禁止だから、novelaiがエロ生成界隈の最後の砦なのか
0403名無しさん@お腹いっぱい。 (ワッチョイ a301-913D)
垢版 |
2022/12/22(木) 10:54:07.35ID:SCtkPF8f0
kickstarterの本件に関する表明
https://updates.kickstarter.com/ai-current-thinking/

ざっくり言うと

・プロジェクトページ記載から学習元のデータをどう入手するかよく分からん
・公序良俗に反しないかどうかも判断つかん
だからとりあえず差し止め中

って感じかな?
英語苦手すぎてニュアンス分からんが
0405名無しさん@お腹いっぱい。 (ガックシ 06e6-5d6s)
垢版 |
2022/12/22(木) 10:58:25.93ID:a5qghV766
>>404
fullにしてnsfw入れるだけで出るで
見たくもないのに勝手に出ないようになっとるだけ
0406名無しさん@お腹いっぱい。 (ガックシ 06e6-5d6s)
垢版 |
2022/12/22(木) 11:00:20.21ID:a5qghV766
Is a project copying or mimicking an artist’s work? We must consider not only if a work has a straightforward copyright claim, but also evaluate situations where it's not so clear — where images that are owned or created by others might not be on a Kickstarter project page, but are in the training data that makes the AI software used in the project, without the knowledge, attribution, or consent of creators.
終わってんな
0409名無しさん@お腹いっぱい。 (ガックシ 06e6-5d6s)
垢版 |
2022/12/22(木) 11:56:39.99ID:a5qghV766
>>408
指は細かいとこだからなかなか治らんなぁ
手動修正かimpaintガチャが丸い

それよりも構図の指定をもっと正確にやってほしいね
depth2imgがイラストに最適化されてWDに実装されたらいいね
0414名無しさん@お腹いっぱい。 (ワッチョイ ea10-zw/P)
垢版 |
2022/12/22(木) 12:43:41.64ID:/Y8aG60v0
>>413
未来永劫実装しないとまで言ったからなクリスタ
でも大企業が絵師に媚びて日和始めた今、吉と出るか凶と出るか
0418名無しさん@お腹いっぱい。 (ワッチョイ 2e7c-CeKG)
垢版 |
2022/12/22(木) 13:11:28.96ID:nF/wKrnA0
前から要望来てる機能散々後に後に送ってた上にちょうどサブスク移行した所らしいからリソース割くなアホはもっともではあると思う 中身知らずに批判すんの嫌いだから一応言っとくけど
0419名無しさん@お腹いっぱい。 (ワッチョイ becf-YQe4)
垢版 |
2022/12/22(木) 13:22:06.83ID:jsRXFXsn0
SDをローカルで動かすクリスタのプラグインなら数か月前に公開してるユーザーがおるみたいやけど
リークモデルを含めて色んなモデルが使えなきゃダメとか、クリスタのクラウド上で処理してくれなきゃダメとか、そういう話なんかな
0420名無しさん@お腹いっぱい。 (アウアウウー Sa9f-JDfe)
垢版 |
2022/12/22(木) 13:31:57.66ID:7LRTq9aha
クリスタにAI機能が標準搭載されると そのソフトを使ってる=AI厨 って認定される。クリスタ使ってるだけで手描きと認めらない
でもAI機能標準搭載でなく外部プラグインならAI認定されない
ってこと
意味不明だけどそういう図式なんだよ
0423名無しさん@お腹いっぱい。 (ワッチョイ becf-YQe4)
垢版 |
2022/12/22(木) 14:23:40.53ID:jsRXFXsn0
emad他が絵描きを煽らないで、補助ツールになることを目指すって言ってたらこんなに反発も起きなかったろうにな
最初はそんなに反発もなかったし
これでなんで俺たちを受け入れないんだっていうのはちょっとアレだろうなと思う
0425名無しさん@お腹いっぱい。 (ワッチョイ becf-YQe4)
垢版 |
2022/12/22(木) 14:34:35.22ID:jsRXFXsn0
単に想像力が足りてないだけやと思うけど
0426名無しさん@お腹いっぱい。 (ワッチョイ ea10-zw/P)
垢版 |
2022/12/22(木) 14:35:37.32ID:/Y8aG60v0
結局danbooru使用と絵柄コピー(デジタル贋作って言うんだっけ?w)の時点でアウトだったと思う
むしろ絵師に媚びた分だけ自分の言ったことに首絞められて機能制限とかさせられそう
0427名無しさん@お腹いっぱい。 (ワッチョイ ea10-zw/P)
垢版 |
2022/12/22(木) 14:37:44.33ID:/Y8aG60v0
もっと言うなら、日本で一番燃えたのはmimicだけど、アメリカで一番燃えたのはミドジャが賞取った時だから
賞取るくらいクオリティ高い絵の完成品を描けてしまう時点でもうダメそう
0429名無しさん@お腹いっぱい。 (スププ Sd8a-zw/P)
垢版 |
2022/12/22(木) 14:43:19.76ID:90t/HnPKd
>>428
絵師のお気持ちの話をしています
0430名無しさん@お腹いっぱい。 (スププ Sd8a-zw/P)
垢版 |
2022/12/22(木) 14:43:54.45ID:90t/HnPKd
Kickstarterが著作権なんて関係ねぇって言いだしたからな
0431名無しさん@お腹いっぱい。 (ワッチョイ 2e7c-CeKG)
垢版 |
2022/12/22(木) 14:44:37.66ID:nF/wKrnA0
こっそりエロ絵出力したいだけなんだがSDもmidもお偉いさんが爆弾発言かますわNFTマンみたいな胡散臭いのが寄ってくるわでどんどん燃える
SDって開発はrunawayなんだろ? どっかもっと安定した所に引き継…いたらクローズドにされそうだな…
0433名無しさん@お腹いっぱい。 (ワッチョイ becf-YQe4)
垢版 |
2022/12/22(木) 14:55:22.58ID:jsRXFXsn0
>>432
もうちょっと想像力があればな
0440名無しさん@お腹いっぱい。 (ワッチョイ ea32-e5AJ)
垢版 |
2022/12/22(木) 19:57:35.73ID:cyVboUP00
NovelAIはdanbooruの画像を学習してるから~以前に
そもそもSDの時点でtwitterもpixivも含めたインターネット全体からスクレイピングした学習データで作られてるわけで
「無断でデータ学習したAIで金儲けするな!」という意見の人達を満足させるにはクリーンじゃない画像生成AI全部の商用利用を中止しなきゃいけない

そんなこと今更出来ないだろうしEmadのやったもん勝ちやね
0441名無しさん@お腹いっぱい。 (オッペケ Srb3-Fu+n)
垢版 |
2022/12/22(木) 20:07:08.20ID:xj4e8/25r
>>440
だよな
正直NovelAIの「絶対悪」みたいに一部から思われてくれてるからこそ、「そもそもAI画像生成って殆ど無断で取得してるものばっかりだよね?」っていう本質をぼかして他モデルが相対的にクリーンに見えてる現状は、なんともいえんものはある
0443名無しさん@お腹いっぱい。 (ワッチョイ ea10-5d6s)
垢版 |
2022/12/22(木) 20:14:48.60ID:/Y8aG60v0
>>439
https://equilibriumai.com/index.html

自前でクラファンやり直した 熱いメッセージ付き
もともと5万7000ドル集めてたうちの1万5000ドルは現時点で回収しなおした
熱意のある方はどうぞ
0445名無しさん@お腹いっぱい。 (ワッチョイ e662-eaDT)
垢版 |
2022/12/22(木) 21:11:45.22ID:TFRvE4L90
流れ切るようで申し訳ないがちょっと質問すみません
Paperspaceでnaiモデル動かしてるんだけどどうもオリジナルのように再現できない
同じ環境でコツや設定知ってる人いればご教授願いたいです
0448名無しさん@お腹いっぱい。 (ワッチョイ ea10-5d6s)
垢版 |
2022/12/22(木) 21:32:18.60ID:/Y8aG60v0
>>447
特典が見当たらないんだよな なくなったか?
値段は自由に変えられる
0451名無しさん@お腹いっぱい。 (ササクッテロラ Spb3-dmI4)
垢版 |
2022/12/22(木) 22:03:06.04ID:erc1LuW3p
佐藤航陽 著書「世界2.0 メタバースの歩き方と創り方」 @ka2aki86 (2022/12/22 16:12:31) [返信:フォロー/@のみ]
リンクアンドモチベーション様と資本提携を実施し、累計15億円超の資金調達ラウンドが完了。両社で「自律分散型」の未来の組織の在り方を作っていきます。

「テクノロジーで新しい宇宙を作る」をビジョンに掲げる株式会社スペースデータへの出資について
https://www.lmi.ne.jp/news/release/detail.php?id=797
https://video.twimg.com/ext_tw_video/1605823537893105669/pu/vid/1080x720/QwCdF4IDflwYRxfT.mp4
https://pbs.twimg.com/ext_tw_video_thumb/1605823537893105669/pu/img/HDqVb7fObsLaAR-0.jpg
https://ohayua.cyou/tweet/1605823583883653120/ka2aki86
0452名無しさん@お腹いっぱい。 (ササクッテロラ Spb3-dmI4)
垢版 |
2022/12/22(木) 22:04:40.42ID:erc1LuW3p
ベンチャー・インキュベーションに関するお知らせ | ニュースリリース | Link and Motivation Inc. 株式会社リンクアンドモチベーション

株式会社スペースデータは、「宇宙 × データ」をテーマとした研究開発を行う目的で設立された宇宙スタートアップです。「テクノロジーで新しい宇宙を作る」をビジョンに掲げ、「①衛星データ活用」「②AI技術」「③3DCG技術」という三つの異なる分野のテクノロジーを融合させることで、現実世界をバーチャル空間上に再構築するAIの開発を進めています。

メタバース(仮想空間)や(仮想空間で現実世界を再現する)デジタルツイン等の3D仮想空間技術はまだ黎明期であり、VRやゲームなどの消費者向け需要から、都市開発や自動運転などの大企業の需要、防衛防災や宇宙開発などの国家の需要まで、多種多様な領域への応用が期待されています。
https://www.lmi.ne.jp/news/release/detail.php?id=797
0456名無しさん@お腹いっぱい。 (ワッチョイ 9710-65Bv)
垢版 |
2022/12/23(金) 01:29:31.45ID:2DtHBUxD0
仕切り直し版のwd1.35触ってみたけど直近の有名他モデルに比べるとジャジャ馬感があってワクワクする
ただモデル自体にプロンプトをうまく仕込むより自然言語処理をIFにしてdanbooruタグ系でやった方が機械的にうまく行けそうなんじゃないかなと思うけど難しい話はよくわかんない
0457名無しさん@お腹いっぱい。 (ワッチョイ ea10-zw/P)
垢版 |
2022/12/23(金) 01:34:03.08ID:9R+BAxyO0
でりだからほとんど変わってないように思えるのだがどう?
0458名無しさん@お腹いっぱい。 (ワッチョイ ea10-zw/P)
垢版 |
2022/12/23(金) 01:35:54.70ID:9R+BAxyO0
というか目下automaticでhypernetworkの学習ができないんだけどみんなどうですか
0459名無しさん@お腹いっぱい。 (ワッチョイ 6a20-z22/)
垢版 |
2022/12/23(金) 03:02:55.04ID:K8w7nGjK0
そもそも画風なんて著作権対象じゃないのに
やたらクリーンなAIとかクリーンな学習っていう奴が多くてげんなり
ADOBEがそれを言うのは対象物がほぼ実写だから言えるんだろう

厳密な事を言い出したらGoogleの画像検索に出てくる奴なんてアウトでしかない
それに広告載せて稼いでるんだから
0462名無しさん@お腹いっぱい。 (スプッッ Sd2a-r5QQ)
垢版 |
2022/12/23(金) 06:40:26.91ID:K8WrxKdZd
adobe researchの出したCustom Diffusionってどう?
dreamboothより良いって主張してるらしいけど

https://github.com/adobe-research/custom-diffusion
0469名無しさん@お腹いっぱい。 (アウアウウー Sa9f-I+Ed)
垢版 |
2022/12/23(金) 09:01:20.93ID:NbvMq6g7a
自分の絵の学習ならSDで商業あり?
SDの学習ライブラリの親学習データに使ったの絵の著作権とか問題ないのかな?
0470名無しさん@お腹いっぱい。 (ガックシ 06e6-zw/P)
垢版 |
2022/12/23(金) 09:03:06.67ID:uapGSEMJ6
>>468
箱庭のそれずっと追っててDiscordにもいるけど、まだこんなクオリティの画像を出せる段階にない。
前にもボカロのヴァンパイアのmvそっくりの絵をあげてたことがあって、たぶん何かしらi2iかそれに近いことしてる
0471名無しさん@お腹いっぱい。 (ガックシ 06e6-zw/P)
垢版 |
2022/12/23(金) 09:06:17.76ID:uapGSEMJ6
俺の予想ではniji journeyのイメージプロンプト
0482名無しさん@お腹いっぱい。 (ワッチョイ 1f02-8Cre)
垢版 |
2022/12/23(金) 12:09:28.79ID:2SiTlEYk0
>>478のスレ書き込めなかったわ
0485名無しさん@お腹いっぱい。 (ワッチョイ d718-JDfe)
垢版 |
2022/12/23(金) 21:42:44.56ID:HR/OArw50
呪文がダメなだけかもしれませんが、男性の局部があんまりリアルじゃないので追加学習させてみたいのですがそもそも画像がモザイクかかってる・・・
人間の奴なら手に入りそうですが、実写でも大丈夫なのでしょうか
0488名無しさん@お腹いっぱい。 (ワッチョイ ff8e-yL8W)
垢版 |
2022/12/24(土) 01:00:00.49ID:QPKpNmsV0
>>483
あの猿版は学習っていうより画像取り込んだくらいの性能だよね
その分他のモデルで転用とかした場合の汎用性は落ちてるけど
実写でやると数枚で再現できて簡単にエロ名誉棄損できちゃうレベル
0490名無しさん@お腹いっぱい。 (ワッチョイ 0b01-UeFn)
垢版 |
2022/12/24(土) 02:10:53.17ID:JXDFzs290
再現率は高いと思う。
AnythingやElysiumと相性がいいのもあるかもしれないが、元にしたキャラが一目でわかる。

hypernetwork strengthを低めにしないとぶっこわれるので初めは失敗したかと思ったが。

副作用として指や足の奇形が出やすくなってしまうので整えたければInpaintなり加筆修正してimg2imgは必要だと思う。
0492名無しさん@お腹いっぱい。 (ワッチョイ 8f5f-MkkF)
垢版 |
2022/12/24(土) 06:45:44.08ID:z+y8Ix1W0
再現率の高さはAIの発展的には好ましくないんだよなあ
著作権どうこうじゃなくて単に過学習ってことだから
ぶっちゃけコラやトレスのレベルならAIガチャしなくてもいいわけで
流行り絵の再現や改変で話題になってもね…
ある程度の自由さや独自性がないと
AIだから著作権セーフみたいなロンダリングにもなりかねない
0493名無しさん@お腹いっぱい。 (ワッチョイ 7310-K87r)
垢版 |
2022/12/24(土) 12:16:55.69ID:ad4OowX/0
なんか、技術と全く関係ない書き込みが有ってワロタ
場が読めない人だね
0494名無しさん@お腹いっぱい。 (ワッチョイ 7310-K87r)
垢版 |
2022/12/24(土) 12:16:55.97ID:ad4OowX/0
なんか、技術と全く関係ない書き込みが有ってワロタ
場が読めない人だね
0498名無しさん@お腹いっぱい。 (アウアウウー Sadd-MEtO)
垢版 |
2022/12/24(土) 15:25:04.24ID:EKShf34Ba
導入どっちが楽かってくらいじゃね
colabとかだとcurlでモデルもvaeもtempフォルダ作って同じ場所に落として
mv ./* {dist}みたいに1行で移動できるからそっち使うこともある
でもローカルで手作業の温もりを感じながらやる場合はvaeはVAEに仕分けてる
0503名無しさん@お腹いっぱい。 (ワッチョイ ff8e-yL8W)
垢版 |
2022/12/24(土) 16:17:57.66ID:QPKpNmsV0
2週間後くらいにリリース予定の速度だけは25倍になるよって話だけ本当なら他は多少ズレたところで…
問題はどこまで細部がつぶれて奇形が増えるかっていうネガティブな部分だな
速度そのままで高解像度で奇形や破綻しにくい物の方を優先してもらいたいものだが
とりま、今更だがWDは延びないと思ってる人の方が少ないでしょ(笑)
根拠のないこのくらいで出したいねぇっていうのを雑談を拾った人が勝手にリリース予定だ!って勝手に決定事項のようにハードル上げただけだ

トリアントとNAIリークの派生品混ぜてどやって公開するような人だぞ?
それを抜いたWD1.3.5rev2は話題に出ないくらいの性能と使いにくさで、NAI系Danbooruのプロンプトは壊滅で組み直し別の味わいがあるって言い訳してる状態
0505名無しさん@お腹いっぱい。 (ワッチョイ 9ba7-Q8t3)
垢版 |
2022/12/24(土) 16:29:36.91ID:9fcAaTPp0
WDは趣味でやってくれてるの忘れたらイカンね
他だとUDが反対派に攻撃されてクラファンやpatreon締め出されたり大変な中で自前で大規模なモデル作りしてくれてるんだから感謝しかねえわ
0506名無しさん@お腹いっぱい。 (ワッチョイ 8d69-aH43)
垢版 |
2022/12/24(土) 17:02:56.15ID:lB74mPzf0
colab用の1111のnotebookってどれ使うのが良いんだろう?
某wikiにnotebook集があるけど、とりあえずTheLastBenは起動できなかった
古くて最新のに対応してないとかがやっぱあるのかな?
0513名無しさん@お腹いっぱい。 (ワッチョイ 3b5f-mGaa)
垢版 |
2022/12/24(土) 21:45:28.98ID:FgUo1cuL0
UDの寄付について言い出しっぺなのでUDのdiscordで質問してきたよ
現在寄付送っても確認のメールが来ないのは仕様らしい
近日中により詳細をオーバーホールしたウェブサイトを立ち上げるそう
この回答をシェアしても良いとの回答ももらったので
貼り付けておくよ

https://i.imgur.com/sLufzlw.jpg
0523名無しさん@お腹いっぱい。 (ワッチョイ 7310-4rUk)
垢版 |
2022/12/25(日) 14:18:34.76ID:ULYknKsB0
>>521
waifu1.4booruおすすめ
唯一NAIに認可されたNAIマージモデルでネガで古い絵柄死滅させればNAI成分出てくる
まぁanythingで仕事取ってる奴までいるしヨシ!とも思うけど
0529名無しさん@お腹いっぱい。 (ワッチョイ 7310-K87r)
垢版 |
2022/12/25(日) 15:58:03.99ID:RPsqw8JL0
此処は技術について語る場所だけど、関係ない話題を語らないでくれる?
0533名無しさん@お腹いっぱい。 (ワッチョイ ab8e-yL8W)
垢版 |
2022/12/25(日) 18:50:38.10ID:nkDLPtjQ0
周回遅れのモラルうんたらかんたらは技術スレで発言する前に他のスレも見てきた方がいいわな
タメになることはないと思うけど、同類は見つかるかもしれんし
雑談スレと技術スレくらいの区別はつくだろう
0534名無しさん@お腹いっぱい。 (ワッチョイ 0b01-dxp0)
垢版 |
2022/12/25(日) 20:08:36.19ID:YwWzwW7w0
SD2.1ベースのアニメ絵モデルらしい。WDは先越されちゃったか
ただし、動作させるのに改造版SDがいるとかで導入難易度はやや高め
https://medium.com/@enryu9000/anifusion-sd-91a59431a6dd

>>524
マルウェア疑惑のほとんどはアンチマルウェアソフトの誤検出
今は安全でロードが高速化されたsafetensorsモデルも配布されてる
0541名無しさん@お腹いっぱい。 (ワッチョイ 1902-aH43)
垢版 |
2022/12/26(月) 01:27:13.36ID:9ODg8SL60
画像生成AIくんに「これは 日本人 です」と言って中国人の写真を学習させれば
prompt:日本人 で中国人が出てくるようになる
その程度のもん
すべてはバイアス モデルが持つ偏見だ
0547名無しさん@お腹いっぱい。 (ワッチョイ 8dd7-k8mI)
垢版 |
2022/12/26(月) 09:04:31.29ID:rVtfmx2m0
人間が描いてても指6本あったりするしな
0551名無しさん@お腹いっぱい。 (ワッチョイ b156-4hSR)
垢版 |
2022/12/26(月) 10:38:43.73ID:oMaxytDV0
いっそトレスをaiアートですって言い張ったほうが早いな
0562名無しさん@お腹いっぱい。 (ワッチョイ 57f2-dxp0)
垢版 |
2022/12/27(火) 10:17:15.55ID:xAPWriY80
git pullしたらmodelフォルダに「VAE-approx」フォルダが追加されて200KBのmodel.ptが配置された
目的や効能を調べるにはどこを見たらいいの?

あと起動オプションに --ckpt-dir を使っているんだけど、git pullではVAE-approxフォルダが指定ディレクトリに作られない(当たり前か)なので自分で移動した
0565名無しさん@お腹いっぱい。 (アウアウウー Sa1f-Zgou)
垢版 |
2022/12/27(火) 11:12:53.18ID:8RggYn66a
>>564
ちゃんと説明書いてるんだな

Approx NNはめっちゃ速いが画質が4分の1
Approx cheapもめっちゃ速いが画質が8分の1

いい構図を高速で探す感じかな
0568名無しさん@お腹いっぱい。 (ワッチョイ 6d01-jXNG)
垢版 |
2022/12/27(火) 12:13:39.22ID:4Z8IUEWl0
生成中のプレビューで使うやつだねそれ
プレビュー簡略化で生成速度早くなるぞ
0569名無しさん@お腹いっぱい。 (ワッチョイ 57f2-dxp0)
垢版 |
2022/12/27(火) 13:15:54.49ID:xAPWriY80
設定の
Image creation progress preview mode
のところにFull/Approx NN/Approx cheapのラジオボタンがあるんだね

Show image creation progress every N sampling steps.…が4の設定でcheapにしたら生成時間21秒が17秒になったから、2割くらい早くなったことになる

プレビューとしての見た目は確かにやや落ちるようだけど生成中の構図をざっくり見る分には十分と感じた
この設定でいこうっと
0570名無しさん@お腹いっぱい。 (ワッチョイ 7dad-s0Sd)
垢版 |
2022/12/27(火) 16:46:57.27ID:Dvfuwh0f0
この人、なんでWaifuだけ叩いてるの?うらみでもあるんかな

https://i.imgur.com/YVvjdzM.png

Cool Japan何とかもたいした画像出せないし、
最高性能だとかビッグマウスのわりにずっと開発中だしw
技術力あっても正義感を振り回して足引っ張るタイプか
0575名無しさん@お腹いっぱい。 (ワッチョイ bb8e-yL8W)
垢版 |
2022/12/27(火) 17:27:15.34ID:Hg/XEGWh0
SDの元画像の23億枚だっけ?の公開求めて裁判起こして訴える気力がないならここでごねても仕方がない
検索で引っかかるクローズドじゃないネットデータのAI学習自体は法で規制されていないのだからその手の議論やお気持ち表明は
このスレじゃないとスレタイ見てわからん新参者ですかと
こんなスレで仲間求めてただディスってるだけの人は底辺な負け犬にしか見えなくて気持ちが悪いと俺もお気持ち表明したくなるわ
0576名無しさん@お腹いっぱい。 (ワッチョイ 1902-aH43)
垢版 |
2022/12/27(火) 17:33:30.34ID:8wSfBdBy0
あるふはクリエイターに寄り添ってる風を演出しながら画像生成AIの技術を潰されないよう立ち回ってるだけやろ
このままだと一部からの嫌悪が大きすぎて全部巻き込み規制されるかもしれんからそれだけは避けようとしてる
AIは凄いが無断学習反対なのか 根本的にAI反対なのか
反AI民の本音を暴くリトマス紙としては優秀
0582名無しさん@お腹いっぱい。 (ワッチョイ 4f82-5eIH)
垢版 |
2022/12/27(火) 19:04:46.24ID:oJfwjX1z0
AI生成の絵なんてずっとまえからあったの知らんの?
その頃は悪夢みたいなグロ画像しか生成出来ず笑いネタでしかなかった
なぜ今になって騒いでるかというと著作権でも名誉でもなく品質が急激に上がったことによる恐怖
0583名無しさん@お腹いっぱい。 (ワッチョイ 0b02-s0Sd)
垢版 |
2022/12/27(火) 19:49:35.13ID:/KT3tdyq0
1111でBatch i2iすると最初の十数枚は早いけどだんだん演算の開始が遅い、
演算スタートするまで数秒止まった感じになるんだけどおま環なんだろうか
いつも遅くなったら中断して進んだとこまでの元画像退避させて再スタートとかしてるんだけど・・・
0587名無しさん@お腹いっぱい。 (ワッチョイ 8d69-aH43)
垢版 |
2022/12/27(火) 22:43:54.06ID:Z+Hl6Sse0
すみません、colabの話ってここで良いですか?
としあきdiffusionのColab版AUTOMATIC1111導入ってのをやってみたんですが、以下リンクで紹介されてるColabが
全部WebUI起動できずに途中でエラーを起こして止まってしまいます
最終更新が3週間前みたいなんですが、今でも使えるColabをどなたか知らないでしょうか
https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Online-Services
0588名無しさん@お腹いっぱい。 (アウアウウー Sadd-MEtO)
垢版 |
2022/12/27(火) 22:54:12.02ID:84nyV/bQa
そこのddpnのやつ動くよ
ほかのは知らないけどA1111のWebUIはモデルを格納するフォルダが空っぽだと起動しない
無心で実行するとモデルを落とさない設定になっているNotebookは多そう(偏見)だから
設定を見直すかモデルをモデル格納用フォルダに詰め込むセルを追加しよう
0595名無しさん@お腹いっぱい。 (ワッチョイ 1b32-s0Sd)
垢版 |
2022/12/28(水) 00:40:26.19ID:ifcnyleB0
あかんだめだ
昨日(一昨日)まで1111のWebUIを使えてたのに
今日立ち上げようとしたらエラー吐いて止まる

ttps://ossan-gamer.net/post-82301/
↑参考にしてインスコして、エラーはいてから全デリしてもう一回落としてみたけど治らない
Pyton初心者マンなのでわけがわからない。誰か助けてくれないか

https://i.imgur.com/3nvUhZ8.jpeg
https://i.imgur.com/RlEwfJd.jpeg
0599名無しさん@お腹いっぱい。 (アウアウウー Sadd-MEtO)
垢版 |
2022/12/28(水) 01:33:41.67ID:eTprT2eJa
経験則的に少なくとも二枚目のメモリエラーは根本の原因では無い
なんらかの原因でtorch1.12とtorchvision0.13.1とcuda1.13がインストールできねえぞってところがエラーの発端
なんなんだろうな
0600名無しさん@お腹いっぱい。 (アウアウウー Sadd-MEtO)
垢版 |
2022/12/28(水) 01:46:46.59ID:eTprT2eJa
いや嘘やっぱ自信ないわ
メモリ増やそ

あとgithubのリポジトリのwiki見ながらもう1回やろ
問題ないならpythonとgitまでアンインストールしたり環境変数のとこのpythonとかgit関連全部削除して見たりしてからまっさらな状態でやってもダメだったらもうお手上げ
0601名無しさん@お腹いっぱい。 (ワッチョイ bb8e-yL8W)
垢版 |
2022/12/28(水) 02:48:51.44ID:/SBWz0Il0
>>595
再構築してみた。エラー再現しないんでログ貼っとくわ(再構築環境前提)

Gitが古かったのでついでに更新 Git-2.39.0.2-64-bit.exe
CUDA SDKが11.7だったので11.8を入れる [cuda_11.8.0_522.06_windows.exe]
https://i.imgur.com/9J54Ch2.png
pythonもついでに再インスコ入れる※PATHを通す [python-3.10.8-amd64.exe]
指定フォルダにソース持ってくる
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
https://i.imgur.com/XVbNt53.png
webui-user.bat起動→5分くらいでmodelがないって怒られる
https://i.imgur.com/bJmHUZn.png
model入れてついでに起動オプション変更して再起動
https://i.imgur.com/3K824G3.png
帰省先のRTX2060-6GBでも幸せになれる(遅い…)
https://i.imgur.com/Hyx9pjK.png
0603595 (ワッチョイ 1b32-aH59)
垢版 |
2022/12/28(水) 04:24:36.93ID:ifcnyleB0
みんなありがとう
昨日いっぱい画像出力したからそのせいかな…エラー吐き出したときに半分くらい消したんだけど
メモリ不足で起動がクラッシュしたくさいけど、なにが壊れてるかわからん…
0604595 (アウアウウー Saed-aH59)
垢版 |
2022/12/28(水) 07:59:29.33ID:za/9S03Ua
requirementsでナニかした覚えはない…何をやってるかわからないとも言うけど
根本はグラボが古すぎるのが問題だろうけど、一応一週間は稼働してたんだよな…
0605名無しさん@お腹いっぱい。 (ワッチョイ 2b01-MkkF)
垢版 |
2022/12/28(水) 10:13:05.16ID:YYYQuW6x0
プロンプトの質問ってここでしてもよい?
エビ反り(絶頂)がどうしても出ない(´;ω;`)
何か良いプロンプトは無いでしょうか・・・
0607名無しさん@お腹いっぱい。 (スププ Sdaf-mZjW)
垢版 |
2022/12/28(水) 13:09:26.70ID:+63tXHKbd
すみません初心者の質問です
automatic1111でマージしたモデルを使うと生成される画像の発色が薄くなるのですが解決方法はありますでしょうか?
単体のモデルでは正常に出力されるのですが、マージをするとほとんどの組み合わせで薄くなってしまいます
(NovelAI、anything、インスタ系などを主にマージしました)
公開されているマージ済みのモデルをダウンロードして出力しても同様でした
解決方法が既出でしたら申し訳ありませんが、誘導していただけると助かります
こういった場で質問するのは初めてで何の情報を開示すれば良いのか分からなかった為、もし情報が足りなければそれも教えていただけると助かります
0609名無しさん@お腹いっぱい。 (アウアウウー Sadd-MEtO)
垢版 |
2022/12/28(水) 13:29:55.64ID:eTprT2eJa
A.
何が原因かは分かりませんが、特定のモデルはVAEというものを使用しないと推論の結果色が薄くなったり、滲みのようなノイズが入ることがあるようです。
このようなことが起きるモデルをマージしても同様のことが起きます。

AUTOMATIC1111版WebUIではVAEの使用方法が2通りほどあります。
a
a_1.Stable Diffusionのリポジトリや、Waifuなどのリポジトリから200~800MBの「.vae.pt」ないしは「.ckpt」を落とします。
a_2.WebUIフォルダの中のmodels/Stable-Diffusion/に画像生成用のモデルなどが入っているはずなので、VAEのファイル名部分(拡張子は含まない)を画像生成用のモデルのファイル名に合わせます。
a_3.設定終了です。再起動するかモデルを再度読み込みしてください。
以降、何もしなければそのモデルは今回設定したVAEが使用されます。

b_1.まずはa_1同様にVAEを落としてきます。
b_2.WebUIフォルダの中のmodels/VAEに落としてきたVAEをわかりやすいファイル名に変更して配置します。
b_3.Quicksettings listの設定をします。sd_vaeの追加を行った事のある人は無視してください。
WebUIを起動し、Settings > Quicksettings listというテキストボックスの中身の末尾に「, sd_vae」を手入力で追加します。
入力後、必ず変更をSettingsタブ内上部のapplyから設定を適用します。
b_4.WebUIを再起動し、WebUI上部のQuicksettings listにsd_vaeが追加されているのでそこから好きなVAEを選んで画像を生成できます。
0610名無しさん@お腹いっぱい。 (スププ Sdaf-mZjW)
垢版 |
2022/12/28(水) 13:30:43.69ID:+63tXHKbd
>>608
回答ありがとうございます
やはり既出の問題だったのですね申し訳ありませんでした
お恥ずかしながらvacファイルの使い方(作り方?)がわからない為過去スレを漁ったりして調べてみます
もしそれでも分からなければ恥を忍んでまたこのスレの方々に助けを求めるかもしれませんがその時は申し訳ありませんがよろしくお願いします
0613名無しさん@お腹いっぱい。 (スププ Sdaf-mZjW)
垢版 |
2022/12/28(水) 18:50:22.32ID:+63tXHKbd
>>607 です
とりあえず手近にあったNovelAIのvaeをコピぺ&リネームしてみたら発色が良くなりました!
本当に感謝です!ありがとうございました!

重ねての質問で心苦しいのですが、今回とりあえずでnovel aiのを使って上手くいったので出来れば環境を変えたく無いのですが、上で書かれているStable DiffusionやWaifuのvae の方が後々の事を考えると良かったりするのでしょうか?
それともvaeならどれでも変わらない感じですか?
0614名無しさん@お腹いっぱい。 (アウアウウー Sadd-MEtO)
垢版 |
2022/12/28(水) 19:59:35.88ID:eTprT2eJa
trinart、kl f8 anime2は彩度がめちゃくちゃ持ち上がって若干はっきりする
kl f8 animeは上2つほど彩度は持ち上がらないけどなんか色んな色が混ざる
animevaeはやや薄めでかつ若干はっきりする
stable diffusionのやつは忘れた

今の所ぶっちゃけランダム色変換器みたいなものだから使用することだけは前提として
どれを使うかは好み
0616595 (ワッチョイ 1b32-s0Sd)
垢版 |
2022/12/28(水) 20:53:47.81ID:ifcnyleB0
昨日お騒がせした者だけど、結局何PythonとかGITとか何入れ直してもあかんかった上に
色々モジュールを追加してたらCドラもストレージもレッドゾーンに達してやばくなったので素直にパソコン買い替えることにしたわ
Cドラ200GB、グラボGTX980でAI画像作ろうとするのはやっぱ無謀だったんやなって

それとは別件でちょっと聞きたいんだけど、
StabelDiffusionのT2IやI2Iで作った画像をI2Iに送って、
できた画像をまたI2Iでブラッシュアップ…ってやってなんどかI2Iをループすると
画像全体がどんどん暗くなっていくんだけどこれって仕様?
画面を明るくする系統の呪文追加しても全然効かないし、回避する方法ってないの?
0617名無しさん@お腹いっぱい。 (ワッチョイ e34d-vV7l)
垢版 |
2022/12/28(水) 22:20:28.37ID:70gn/PYj0
>>616
うちはグラボ960だけど、cpu使用率常時100だしゴリラによくなるよ
鼻がうまくかけないみたい。あたらしい環境でやるとおこらないはずだよ。cドライブはssdにしたほうがいいよ。衣装と背景はきちんとできるのに顔はゴリラ
0622595 (アウアウウー Sa2f-aH59)
垢版 |
2022/12/29(木) 14:11:09.95ID:7DmQvk7ua
>>620
ネガにdarkとかblack colorsとか強調してぶち込んでも変わらなかったわ
やっはフォトショ必須かぁ
0624名無しさん@お腹いっぱい。 (ワッチョイ 0b01-SmSv)
垢版 |
2022/12/29(木) 18:42:32.75ID:P8FfkPVN0
novel aiをつい最近始めた初心者なんですが、コイカツで作ったオリジナルキャラの再現に困っています。特殊な髪型をうまく再現できないときがあります
強調の{}がめちゃくちゃかもしれませんがプロンプトは以下の通りです。どこを修正したり、なにを追加したりすればいいでしょうか?
{brown dark skin}, {white hair}, black glasses, {{swept bangs}}, {{{{hair pulled back}}}}, [[[[forehead]]]], {{{black latex bodysuit}}}, {{{black open body suit}}}, cleavage, {{1girl}}, {{high quality}}, {{{masterpiece}}, long hair, black eyes, 16 years old, girl, large breasts, delicate beautiful face, black eyebrows,

↓再現したいキャラ
https://i.imgur.com/cxT02YA.jpg

↓成功例
https://i.imgur.com/Q3McGWa.png
https://i.imgur.com/a2HvZ55.png

↓うまくいかなかった失敗例
https://i.imgur.com/3msFLNs.jpg
https://i.imgur.com/aB7hIw6.png
0626名無しさん@お腹いっぱい。 (ワッチョイ bfe0-/RRk)
垢版 |
2022/12/29(木) 19:11:42.82ID:61n+ZMJJ0
AIには描けない絵もあるってのはだんだん分かってきて
それは手とか構図とかじゃなくて画風レベルでの話なんだけど
そういう上手い具合にAIに潰されにくい画風身に着けてる同業者は伸びてるわ
0628名無しさん@お腹いっぱい。 (オッペケ Srd9-effZ)
垢版 |
2022/12/29(木) 19:56:58.49ID:cWTLojZOr
HNやDBの元ネタが本人しかいなかったら基本劣化版だからな
絵師再現とか何とか言っても、よくできたマージモデル以外は現時点では業務水準には到達しなかった印象
>>624
へそ出し指定とか?
正直学習なし、i2iなしのNAIでt2iならそこらが限界だとは思う

元絵がある以上構図・デザイン再現に一番早いのはi2iだろうね
0631名無しさん@お腹いっぱい。 (ワッチョイ a320-/RRk)
垢版 |
2022/12/30(金) 00:09:47.64ID:07Om5WvQ0
I2Iに左右反転した画像を通すと、なんか下手になる時あるよな
AIのくせに右利き左利きとかあるのかしら??
0634名無しさん@お腹いっぱい。 (ワッチョイ 0b01-SmSv)
垢版 |
2022/12/30(金) 02:00:14.94ID:RYq4q2iH0
>>628
i2iとt2iとシード値を使っていじった結果なんとか似せることができました。あと衣装も変えました!(プロンプトは水着を入れてボディスーツの呪文を消しました)
ただ別問題が出て、キャラが二人出てしまいます。前回同様 1 girl をちゃんと入れています。
これって{}を増やした分だけ、元の{}も増やしたほうが良いですか?bikiniとembarrassedで{}を3つ追加したので、元のプロンプト全体もその分{}を増やした方がいいですか?

元のプロント {brown dark skin}, {white hair}, black glasses, {{swept bangs}}, {{{{hair pulled back}}}}, [[[[forehead]]]], {{{black latex bodysuit}}}, {{{black open body suit}}}, cleavage, {{1girl}}, {{high quality}}, {{{masterpiece}}, long hair, black eyes, 16 years old, girl, large breasts, delicate beautiful face, black eyebrows,
追加した呪文 {{{bikini}}}, beach,{{{embarrassed}}},

>>633
すみません、誤送信しました。画像はそこから参照してください
0635名無しさん@お腹いっぱい。 (ワッチョイ bfe0-/RRk)
垢版 |
2022/12/30(金) 04:57:46.83ID:iZFACMy80
waifuが完全に行き詰ってて結局品質上げるにはNAIやMJのように
元絵の完コピするしかないってことが分かってきてつまらんな
AIに創造性はないは事実だった、同時に絵に創造性はいらない(100%パクリでOK)だっただけで
0637名無しさん@お腹いっぱい。 (ワッチョイ a320-/RRk)
垢版 |
2022/12/30(金) 05:56:41.94ID:07Om5WvQ0
>>635
そもそもwaifuってアニキャラを嫁というのが原点だし
それを名乗るなら元絵を追求する事になるのは自明の理
オリジナルや創造性は求められてないモデルだろう

必然的に人間が制作するファンアートや二次創作でも同じでしょ
元ネタにどこまで寄せるのが正解なのか?って問題
0644名無しさん@お腹いっぱい。 (ワッチョイ bfe0-/RRk)
垢版 |
2022/12/30(金) 11:17:57.32ID:iZFACMy80
AIは自然なエロコラ作るには滅茶苦茶役に立つんだよな
img2imgで作った有名絵師のエロコラがどんどん海外サイトで広がってる
よく知らない人が見たら本人が描いたとしか思えないレベル
その点だけは人間より明らかに上手いし
0647名無しさん@お腹いっぱい。 (オッペケ Srd9-effZ)
垢版 |
2022/12/30(金) 12:31:39.37ID:JopF5Dzir
>>643
というかアーリーアダプターが軍事とエロからなのは三大欲求とか的に当然なんじゃね、メインストリームまで行く頃には他の需要も開拓されてるけど
>>637
「嫁」にオリキャラが該当しないと思うのも、衣装チェンジから微細な顔つきまで「俺の中の俺の嫁」の再創造までも『解釈違い』を生まない理想像の追求が「元絵に寄せる」で終わると思ってるのは甘い

というか根本的に同人誌や二次創作は「元のキャライメージを再現して再創造する」であって「トレスして済む」みたいな需要は元からない
0651595 (ワッチョイ 1b32-aH59)
垢版 |
2022/12/30(金) 13:55:47.50ID:I6PXHcCl0
マイナー作品のマイナーキャラの特殊性壁絵を供給する手段として期待してるわ
0654名無しさん@お腹いっぱい。 (ワッチョイ bb8e-yL8W)
垢版 |
2022/12/30(金) 15:02:27.06ID:01cF1NNL0
>>637
その元キャラを引っ張り出せないうえにNAIの汎用性もないからな
すでに車輪の再開発状態に入ってるのに、3か月遅れの同じダンボールとは思えんわ
模写とトレス&コピーが同レベルの人とはこれ以上突っ込んでも仕方ないけど
0657名無しさん@お腹いっぱい。 (ワッチョイ ad20-/RRk)
垢版 |
2022/12/30(金) 15:15:58.18ID:JGe0TTZz0
>>654
車輪の再発明と言いたいの?手法が違う再開発にも意味がある
車輪一つでもホイール、シャフト、タイヤと技術的進化は必要なんだが
複製するにも模写、トレース、コピーと手法が違うようにね
0659名無しさん@お腹いっぱい。 (オッペケ Sr1f-Ry1K)
垢版 |
2022/12/30(金) 15:32:34.33ID:pr15MH6Kr
正直i2i機能がある時点で「生成できない」発言は甘え

本来なら「出来ない」と豪語する前に「出来る方法について」を模索、語るべきな「技術スレ」なのに、
こういう話の流れになるあたり「雑談スレ」感強いよな
0660名無しさん@お腹いっぱい。 (ワッチョイ 1701-jXNG)
垢版 |
2022/12/30(金) 15:43:34.63ID:YW94SLBh0
フォトショで雑コラ→i2iのループで大抵のものは作れるし
DBHNTIで作業効率が加速していってる

あと出来ないのは中間絵の制作ぐらいだ
これができればアニメが作れるのに
作り方が全く思いつかない
0665名無しさん@お腹いっぱい。 (オッペケ Sr1f-Ry1K)
垢版 |
2022/12/30(金) 16:02:46.87ID:pr15MH6Kr
>>663
貴方はいったい何で自分が「ゴミ」と思ってる専用スレに赴いて、わざわざネガキャンしながら良くわからん勝ち組アピールしてるんだ
さっさと巣に帰るか、崇高な自分の仕事に関する知識を集めてきなさい
年末年始に無駄なことしてるんじゃないよ

こんな目に見えない相手しかいない無い場所でしか自慢できないのか…‥かっがり……
0667名無しさん@お腹いっぱい。 (ワッチョイ 1701-jXNG)
垢版 |
2022/12/30(金) 16:10:36.87ID:YW94SLBh0
DBさせたキャラを前コマと後コマを50%透過で重ね合わせてi2iするのが中割り生成でつなげるのか
背景は普通のアニメのようにでっかい絵を1枚作ればいいし
頑張れば、既にアニメもできないことはないのか
3Dアニメとどっちが楽かってというのは置いといて
0670名無しさん@お腹いっぱい。 (ワッチョイ ed63-StZe)
垢版 |
2022/12/30(金) 16:57:58.26ID:ytjfa7gC0
ID:uZxYDVgjM (ワントンキン MM1f-hQLM)は10年前くらいから休日平日関係なく一日中イラレ板荒らしてる可哀想な人だよ
ここ半年はお絵描きAI関連に釣られてここら辺にも生えてきたからスルーが1番だよ
0672名無しさん@お腹いっぱい。 (アウアウウー Sa1f-vXyR)
垢版 |
2022/12/30(金) 18:54:48.35ID:0LB3I1QTa
今のAIは文法を理解しているわけではないからプロンプトにbreastsが含まれてるとほぼbreastsが出力に含まれるよ
例えば「This is not an apple」と入れるとりんごが出てくる
胸や乳首という単語を使わずに手ブラを表現しないといけない
0675名無しさん@お腹いっぱい。 (ワッチョイ bfe0-/RRk)
垢版 |
2022/12/30(金) 20:41:43.26ID:iZFACMy80
小さなパーツが苦手という問題はベース解像度の問題だからまだ克服できないんだよな
いくら高解像度出力しても内部的には512×512でしかないから口の中とかは全然描けない
解像度アップしたSD2は全然期待外れだったしなぁ
0677名無しさん@お腹いっぱい。 (ワッチョイ 7fbb-Sx0s)
垢版 |
2022/12/30(金) 21:18:59.96ID:fBM0iCIu0
rtx4090買ったからローカルでstable diffusion弄りはじめた
欲しいキャラが出せなくてdreamboothに手を出したんだが512x512の画像50枚1000stepで学習開始したら6時間掛かるんだがそんなものなのか?
0678名無しさん@お腹いっぱい。 (ワッチョイ 676a-bOg1)
垢版 |
2022/12/30(金) 21:36:22.47ID:aiu370md0
>>677
それmax stepの数字だから初期値の1枚あたり100stepでいいと思う

俺もちょうど今日からやってるから聞きたいが、dteam boothって1モデルにどんどんキャラ突っ込んでいくんじゃなくて、改変は1キャラ1モデルにしたほうがいい感じ?
1キャラ学習させたら1girlしかプロンプト指定してないのに全部キャルちゃんぽくなっちゃう
0681名無しさん@お腹いっぱい。 (ワッチョイ 0b01-zX7+)
垢版 |
2022/12/30(金) 22:35:09.16ID:M1yqONFG0
中断して適用してみればいいんじゃないの?
てか学習回すときは適当な回数ごとに出力して画像みるようにしたほうがいいよ。

うちだと4090用にDLL入れ替えたりTorchのバージョン変えたりして以降、学習の確認のときにtxt2imgの内容を反映するところにチェック入れると何故かエラーになるから確認できないんだけど・・・(#゚Д゚)
0682名無しさん@お腹いっぱい。 (ワッチョイ ab8e-peqZ)
垢版 |
2022/12/31(土) 00:14:15.52ID:L7wXfmwU0
4090のDLL差し替えは面倒やしなぁ…
今でこそAUTOMATIC1111更新頻度減ったから不都合原因は見つけやすいけど
うまく動かないプラグインがあると一ヶ月くらい前までプラグインが原因なのか環境が原因なのか追うのをあきらめてたもんな
0687名無しさん@お腹いっぱい。 (ワッチョイ ab8e-peqZ)
垢版 |
2022/12/31(土) 04:29:11.66ID:Ri+14Ztq0
別スレで対策研究されて改善版も出てるね
https://huggingface.co/wooden-ufo/Fixed-Elysium
Elysium_Anime_V3.safetensorsやMidjorney-v4やf222とかをそのまま使ったりマージのベースモデルにすると起きる
今週上がったMixモデルは差し替えられてる感じだ
階層マージ使える人なら自分でもfixできるけど、何を混ぜるかによって生成結果が変わってくるので注意が必要
>sleepy,1girl,seiza(トークン数8) ddim strps:20 CFG:7 ネガ無しvae無し
https://i.imgur.com/MeNPMV8.jpeg
0688名無しさん@お腹いっぱい。 (ワッチョイ 7601-X3cQ)
垢版 |
2022/12/31(土) 06:07:21.81ID:4Nc8c58a0
>>673
試したけどそれっぽくなった。>>673の画像みたいな手で胸を隠すような感じじゃなく、胸の上に手を置いてるようなポーズ、手ではなく腕で隠すようなポーズになった
それで呪文変えてhands on own nipple, hand covering nipples,でやった結果、運次第で手ブラを再現してくれる。タグ強調すればもっとそれっぽくなるかな?
版権キャラの手ブラって限られるからnovel aiで作れるのありがたい
0689名無しさん@お腹いっぱい。 (ワッチョイ 6301-NQKQ)
垢版 |
2022/12/31(土) 07:29:51.80ID:XWYmTYAz0
手が苦手な時点で現状無理だとは思うが手袋をカッコよくギュッと嵌めてる絵がいつか作りたいわ
0696名無しさん@お腹いっぱい。 (アウアウウー Sac7-SjZ9)
垢版 |
2022/12/31(土) 17:04:10.55ID:D6aAwVu7a
結局AIは人間レベルの描画能力を手に入れたけど当たり前だが人間にできないことはAIにもできない
とあるキャラの正面図だけ渡して「後ろ姿描いて」なんてことは不可能
あらゆる角度、あらゆるポーズの画像を学習させなければ好きなポーズや構図というのは不可能
0700名無しさん@お腹いっぱい。 (ワッチョイ 4e10-ssxH)
垢版 |
2022/12/31(土) 17:45:56.43ID:WlZdvZCE0
年末にすまない
出したい構図があるんだけどなかなか出なくて困ってます

目を閉じた子が両腕を広げて、昇天するみたいな構図を作りたいんですがいい呪文が見つかりません
参考画像があればいいんだけど、それも見つからなくて
どなたかお助け下さい
0705名無しさん@お腹いっぱい。 (ワッチョイ a3ad-TwI4)
垢版 |
2022/12/31(土) 18:37:38.05ID:e8/joC+h0
>>701
背景がワンパターンでなければ余計な処理はいらない
機械学習は共通する特徴を抽出して学習するものだからAIから見た時に教師データの共通点は何かで考えればいい
それを踏まえて収集できる教師データがどうしても偏る場合は学習時に使われるpromptで調整するしかない
0706名無しさん@お腹いっぱい。 (ワッチョイ 6301-kFRU)
垢版 |
2022/12/31(土) 19:23:23.60ID:J89Q4Ler0
>>705
なるほど分かりやすい 有難う
ついでに質問して申し訳ないんだけど、例えば絵師Aと絵師Bの絵どっちも教師データに入れた場合って「この辺に目と鼻と口あるな」的な共通項で認識されるんじゃなくて何も共通項ないと判断されて学習失敗するもんなのかな
0707名無しさん@お腹いっぱい。 (ワッチョイ 63bd-9yt5)
垢版 |
2022/12/31(土) 20:00:45.10ID:59iKp0Pr0
>>704
アニメーターはちゃんとキャラデザを済ませてから描いとるんやで。
プリキュアとかの設定資料集中古で買ってみ。
まず最低限どの程度の情報が必要とか そういうのがなんとなくわかるようになる。
ツインテキャラがポニテになりがちな場合も、横や後ろの資料をぶち込めば
結構ちゃんとやってくれるようになる。

現状だとDBやって
描かせて
「違うそうじゃない」って部分をインペイントでやり直しさせてを繰り返し
数枚作りきって
そいつを更にDB学習素材にぶち込んで
というのを繰り返して、AIと二人三脚でオリキャラモデルとかを作り出していく感じや。
ただ、DBだけに頼るとオーバーフィッティングしがちだから
7割DBで「ざっくり目的のキャラの感じ」になったら
残りの30%はDAで埋めると結構理想的な具合になる。
なによりオーバーフィッティングを避けられるのでキャラに柔軟性を持たせられる。
オーバーフィッティングすると、ガチで学習材料にした絵そのものしか吐き出さなくなるからな・・・。
0708名無しさん@お腹いっぱい。 (ワッチョイ 63bd-9yt5)
垢版 |
2022/12/31(土) 20:07:36.65ID:59iKp0Pr0
>>700
まずその頭の中にある絵を
「小学生1年生のマリオペイント」レベルでいいから絵に起こせ。
線画とかいらん。色だけでいいから。

次にその質問を AI先生にぶつけろ。
そしたら大体それっぽいプロンプトを提示してくれる。

自分で用意した幼児芸術とプロンプトで i2i にかけると
大体の場合は 望んだものになる。
イメージありきで作る場合、自分は基本そうしている。
0709名無しさん@お腹いっぱい。 (ワッチョイ 6301-TwI4)
垢版 |
2022/12/31(土) 20:08:24.26ID:d5i/kKDj0
Anifusion-SD、技術的に面白いし、生成画像も良いんだけど
改造版SDとWebUIがまだ未成熟で使い勝手は微妙
開発者も言ってるように、クオリティはAnything V3.0>Anifusion-SD>WD1.3な感じ
Anifusion-SDは絵柄に多様性があるのと、エロゲー風というか、色気がある絵で個人的には好き

Prompt augmentation機能が独特で、例えばhatsune_mikuで生成すると
vocaloid, very_long_hair, aqua_hair, aqua_eyesとかのDanbooruタグが自動生成されて
クオリティが上がるらしい。実際、初音ミクに限らず人気キャラの再現度はかなり高い
しかし、white_backgroundやsimple_backgroundで単色背景になったり
作品名やキャラ名、アーティスト名で既視感がある絵になったり、ランダム性が強すぎるところもある
一応内部的にブラックリストがあるけど、デフォルトのは少ないし
追加するにはソースを弄る必要がある。自動生成プロンプトが自動的に保存されないのもだるい
とはいえ、なにが出るかわからない生成ガチャはなかなか楽しい

NSFW?をExplicitにすると自動生成プロンプトがエロくなるけど
Safeにしても水着や下着とかの微エロ率が高くて割とガバガバ
Score Percentileは高評価率?下げると素人絵っぽくなる

Score Percentile=100 Unbiased Score Percentile=100 ネガティブなし
https://i.imgur.com/23sLUdP.png
Score Percentile=100 Unbiased Score Percentile=100 HD微改変ネガティブ
https://i.imgur.com/n9r8Pii.png
Score Percentile=10 Unbiased Score Percentile=10 ネガティブなし
https://i.imgur.com/rv9Ixf9.png
0710名無しさん@お腹いっぱい。 (ワッチョイ 6301-TwI4)
垢版 |
2022/12/31(土) 20:11:36.85ID:d5i/kKDj0
>>700
Anifusion-SDで作ってみた。なぜか東方キャラになっちゃったけど
https://i.imgur.com/Pism0fd.png

2行目からは自動生成プロンプト
1girl, solo, closed_eyes, outstretched_arms, spread_arms, full_body, singing, blue_sky, rating_s, score_perc_100, adjusted_score_perc_100,
blonde_hair, highres, cloud, sleeveless, sleeveless_dress, sandals, jewelry, commentary, bracelet, touhou,
smile, music, outdoors, sky, long_hair, sundress, grass, open_mouth, absurdres, dress, day, standing,
alternate_costume, :d, rumia, standing_on_one_leg, pink_dress, necklace, fang, bare_legs, bare_shoulders,
petals, flower, sunflower, wind, bare_arms, armpits, blush, collarbone

Steps: 50, Sampler: Euler a, CFG scale: 8, Seed: 31408337, Size: 768x768, Model hash: 1ed9ba0b
0712名無しさん@お腹いっぱい。 (ワッチョイ a3ad-TwI4)
垢版 |
2022/12/31(土) 20:46:51.48ID:e8/joC+h0
>>706
つまるところキャラ学習する際に絵師AとBを混ぜても大丈夫か?って質問なら一応問題は無い
えっと、質問の内容がAIから見た特徴って何?と同義だから絶対こうだよって言い切れないから難しいんだけど
一応大本のSD自体が十分な汎化性と一通りの特徴を捉える能力を持ってるからそこまで厳密さは必要ない
ただAIからどういうものを特徴としてどう捉えるかっていうのははっきり言って不明というか結果からの推測しかできないから
とりあえず人間の曖昧なキャラならこういう特徴を持ってるとかで判断して学習してみて、失敗したら失敗した結果から原因を推測してっ試行錯誤するしかないと思う

もしAIから見た特徴の認識の仕方を人間の認識に合わせて定量的に評価する手法が一般化できるならAIの学習アルゴリズムのブレイクスルーになるレベルの発見だから
とりあえず自分の感覚で学習させたい特徴が共通してそうな物を学習させて試行錯誤するしかないと思う
0714名無しさん@お腹いっぱい。 (ワッチョイ f368-peqZ)
垢版 |
2022/12/31(土) 21:02:41.12ID:eVLBOtVH0
AIって透過画像を透過画像として認識してるのか?
仮にそうだとして、背景透過のキャラ画像を過学習した場合でも背景だけは汎用性あるモデル作れんの?
そうでないなら別に白背景でいいと思うけどな
0715名無しさん@お腹いっぱい。 (ワッチョイ a3ad-TwI4)
垢版 |
2022/12/31(土) 21:17:34.27ID:e8/joC+h0
>>714
そもそもSDの画像入力チャンネルサイズは3
白背景は工夫によってある程度学習抑制できなくはないとか学習後の生成時に制御が完全に不可能ってわけじゃないってだけで
全部白背景にした時それを共通の特徴として学習するのを完全に防げるわけじゃない
キャラを十分なレベルまで学習させるとたいていの場合白背景も学習される
されない場合は白背景もがちがちに学習してしまう前にキャラの学習が十分できるような元のモデルと相性がいいキャラの場合くらいじゃない?
0718名無しさん@お腹いっぱい。 (ワッチョイ ab8e-peqZ)
垢版 |
2022/12/31(土) 21:54:29.23ID:fx2qd2aS0
>>716
構造なんて全く理解してないし男も女も識別できないから1girl, penisでチンポ生えるやろ
後ろからハグした状態で1girlってタグが付いた学習すると腕が4本と学習するだけだよ
ただ単にAIが馬鹿なんじゃなくて用意してあるデータが間違っているわけだ
0719名無しさん@お腹いっぱい。 (ワッチョイ 5a7c-f0KQ)
垢版 |
2022/12/31(土) 21:54:49.44ID:X334f3kC0
>>716
そもそもAIは人を人だと認識せずに描いてる
なので腕が1本だとか2本だとかも理解してない
学習した画像に腕が2本の人物絵が多かったからそれを再現してるだけ
なので学習元の画像によっては誤解も起きる
指も同じ
0721名無しさん@お腹いっぱい。 (ワッチョイ a3ad-TwI4)
垢版 |
2022/12/31(土) 22:19:34.61ID:e8/joC+h0
>>720
3Dを活用したモデルを作るには演算コストや教師データの用意がとてつもなく高いハードルになる
それにSDは別にキャラ絵だけを目的にしてるわけじゃないから立体構造を合わせる場合、キュビズム、モダンアートとかの意味不明系どうする?ってなるだろ
それでもSD2.0からdepthマップ対応モデル出してはいるから将来的には空間構造理解も仕組みに取り込まれる可能性はあるけど
0724名無しさん@お腹いっぱい。 (ワッチョイ 6301-kFRU)
垢版 |
2022/12/31(土) 23:26:13.31ID:J89Q4Ler0
>>712
詳しく有難う
正にその AIってどういう風に特徴を割り出して認識してるの?が疑問だったんだけど
今のところ結果見ながら推測していくしかない感じなんやね
公式画像だけとか公式+画風似たファンアートで学習させてる例ばっか見るから絵師混ぜるの自体ご法度なんかと思ってたけど、とりあえず自分から見て共通してそうなラインの物集めて学習させてみようと思う
0729名無しさん@お腹いっぱい。 (ワッチョイ a3ad-TwI4)
垢版 |
2023/01/01(日) 01:49:37.60ID:HencJBxj0
あけおめ

>>727
もしかして画像データとかそういうの詳しくない?
透過ってつまりアルファチャンネルが必要だからRGBAの4チャンネル必要でSDが扱えるのはRGBの3チャンネルまで
じゃあ透過画像を読み込む場合に実際どう処理されるかは画像ロード処理によって変わってくるんだけどpython実装なら大抵は黒地の上に読み込んでるはず

で聞きたいのは結局背景どうするのが一番なの?って事だと思うけまず前提として一般化できる常に最適となる解はない
というのもモデルと教師データの相性、用意できる教師データの内容、学習させたい内容によって答えが変わる
でAI学習っていうのは基本的に教師データから共通となる特徴を学ぶようになってる
なんで上記前提に基づいて自分である程度考えて試行錯誤は必要

とりあえず例を挙げるなら
同じような背景ばかりでなければ面倒な処理はいらない、ただキャラと背景の境界が(AIにとって)はっきりしない場合は白背景(若しくは黒背景)にしたほうがしっかりとキャラを捉えられる場合もある
学習しなくてもある程度似た造形が出せるなら白背景化しても白背景が紐づく前に十分な精度を得られる場合もある
画風も寄せたいなら背景もあったほうが生成時にキャラだけ浮かないような画風も学びやすい
とかそんな感じで学習させたい内容と用意した画像みて自分で考えれ
年明け早々に長文でごめん
0735名無しさん@お腹いっぱい。 (ワッチョイ 4ef2-Rnhi)
垢版 |
2023/01/01(日) 11:10:42.45ID:LMOSeVwH0
>>730
i2iに通すには髪や服の色やボリュームを本人に近づけなければ…モデリングがきちんとできないと…
テクスチャも本人らしく…ライティング…レンダリングも…
とやっているうちに3Dで上出来なのができたりして
0737名無しさん@お腹いっぱい。 (ワッチョイ 6301-TwI4)
垢版 |
2023/01/01(日) 15:33:21.66ID:KfeNk+Tg0
>>734
>>534

なんかWD1.4は絵柄が古いような
今のところAnifusion-SDの方がクオリティ高い気がする
つうか、WD1.4はなぜか東方キャラが出せないけど、学習してないのかな?
プロンプトにinaba tewiやreisen udongein inabaを入れてるんだけどな

Waifu Diffusion v1.4 Epoch 1
https://i.imgur.com/urqQuM8.png
https://i.imgur.com/SaJziQK.png
https://i.imgur.com/31SWnNG.png
https://i.imgur.com/IN4YukG.png

Anifusion-SD
https://i.imgur.com/n9r8Pii.png
https://i.imgur.com/XgCiMR1.png
https://i.imgur.com/iICMCyX.png
https://i.imgur.com/g3Zb8ao.png
0742名無しさん@お腹いっぱい。 (ワッチョイ 9710-2Lqa)
垢版 |
2023/01/01(日) 21:44:02.10ID:NDBIVbj40
SDで一分位以上の生成時間が有ると
結果プレビュー表示されなくなったんですけど
画像保存設定してないとそのまま結果が見れずじまいなんですが
一分未満だと普通に表示されるんですけどね
0743名無しさん@お腹いっぱい。 (ワッチョイ bb5f-9j0N)
垢版 |
2023/01/01(日) 23:39:00.20ID:9mpIg0Us0
novelAIでどうあがいても男キャラにチンポ生やせないんだがなぜなんだ?
0746名無しさん@お腹いっぱい。 (ワッチョイ ab8e-peqZ)
垢版 |
2023/01/02(月) 00:56:07.03ID:suWmw8D20
金があるならって言うほど高いおもちゃでもないと思うわ
絵の生成なんて今まで全く絵に興味がなかった人が突然参入してくる世界でもないし
中古の3060環境が高いとか言い出すならローカルはやめたほうがいい
0750名無しさん@お腹いっぱい。 (ワッチョイ df10-9yt5)
垢版 |
2023/01/02(月) 04:13:32.63ID:aTAXpZVX0
>>748
toolがありすぎて頭てんやわんやだけど
一枚絵から人とかのオブジェクトを特定できるAIとかあった気がするので
i2iとかでしっかり画を作っていきたい人には使えそうかと
(こういう調整で高品質なのはPhotoShopだろうけど)

そういうので〇を切り抜いて背景は別枠で作って後ほど合成とか
ライティングが難儀するかもしれんけど
0751名無しさん@お腹いっぱい。 (ワッチョイ 076e-xuma)
垢版 |
2023/01/02(月) 06:44:53.87ID:qXuYpt7C0
素朴な疑問なんだけどローカル環境で画像生成する時って見本として読み込んだ画像はどこにもアップロードや共有はされないの?
もしそうなら児童ポルノ画像もOKになってしまうのでは
0752名無しさん@お腹いっぱい。 (アウアウウー Sac7-SjZ9)
垢版 |
2023/01/02(月) 06:55:22.31ID:RWbT8GzKa
AI以前にマイクロソフトはローカルのファイルのハッシュをチェックして児童ポルノリストと付き合わせて確認することも可能だよ
単に「MSはそんなことせんやろw」とみんな思い込んでるだけ
禁止する法律も何もない
0754名無しさん@お腹いっぱい。 (ワッチョイ 076e-xuma)
垢版 |
2023/01/02(月) 07:51:40.19ID:qXuYpt7C0
いやローカル生成環境の仕様の話ね。。。
0763名無しさん@お腹いっぱい。 (ワッチョイ 4e10-zTFP)
垢版 |
2023/01/02(月) 13:55:56.61ID:e44v/7La0
>>762
1024モデルを使うなら、1024で出力してから縮小なりすれば良くないか?
1024モデルで512サイズを出力する意味がわからない
それで動かしたとしてもモデル本来のいい絵は出ないよ
あえてその歪んだ感じを効果として使いたいならいいだろうけどさ