【StableDiffusion】AI画像生成技術12【NovelAI】

2022/12/13(火) 11:34:39.73

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

入力されたテキストから画像を生成するAI技術に関して語るスレです
StableDiffusion： google colabやローカル環境で実行可能なAI画像生成
NovelAI：有料サブスク型AI画像生成サービス
（DALLE・Craiyon・Midjourneyの話題もOK）

★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然としたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】します
（以下のスレッドへ移動してください）
【Midjourney】AI関連総合24【StableDiffusion】
https://mevius.5ch.net/test/read.cgi/cg/1670840740/
AIイラスト　愚痴、アンチ、賛美スレ part17
https://mevius.5ch.net/test/read.cgi/illustrator/1670392645/
テンプレまとめ
https://rentry.co/zqr4r
編集コード「5ch」

前スレ
【StableDiffusion】AI画像生成技術11【NovelAI】
https://mevius.5ch.net/test/read.cgi/cg/1669278997/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

2022/12/13(火) 11:44:17.51

いちょつ

2022/12/13(火) 11:45:58.40

いちおつ

前スレの続きだがAIが特徴だと認識出来るものは既に十分学習している物との「相違」なんだろうな

Blood borneの例は事前学習物との相違が多すぎて画像の全要素を特徴だと認識してしまったんだろう

俺もElysium V1に手錠という要素がほとんどなかったので30枚程度の手錠画像から学習させようとしたけど、背景や表情や服装しか学習されなかった

2022/12/13(火) 11:50:39.16

リンゴの絵画をリンゴとして教えると額とか画用紙も含めてリンゴと認識してしまうってことでいい？

2022/12/13(火) 12:03:21.33

>>4
基本的にはそういう事かと
その結果リンゴを描かせようとしたら額縁に収まった女の肖像画が出て来たりね

2022/12/13(火) 12:25:46.23

実際のところ「りんご」の絵を描けと言われたらリンゴの木を描いたらいいのかリンゴの実を描けばいいのか切り分けられて皿に盛られたりんごを描けばいいのか人間でも判断できんだろ

2022/12/13(火) 12:29:43.52

リンゴだけの画像渡してリンゴだけ学習してくれればいいけどついでに背景色を覚えてしまったりとなかなか曲者よ

2022/12/13(火) 12:38:55.31

いうてブラボは大ヒットゲーだしそんな偏るもんか？って思ったが
考えてみると例の絵以外のイメージないな

2022/12/13(火) 13:35:47.36

座ってる大仏の絵ばかりだから走らせるのに苦労したみたいなツイートもあったしな

2022/12/13(火) 14:51:00.65

一乙です
crop不要と聞いてモンキーパッチ拡張機能というのを導入してみたんですが、これってどういう原理なんでしょう？
タグ付けされた背景までの描画差を学習対象にしている(からテキストに背景タグも付けた方が良い)という認識は正しいですか？

2022/12/13(火) 16:40:58.94

>>4
an apple drawn on framed canvas みたいないラベルが付いてれば
リンゴのみをリンゴとして学ぶはず。結局品質のいいラベルが重要なんだよな
ラベルが不正確だったり不完全だと学習もそれに応じて質が下がる

2022/12/13(火) 17:27:22.48

ラベル付けも大事だけど結局要は学習量でしょ　凄い詳しいラベル付けした学習データあってもそれと関連したラベル付いた学習データ大量に無いと統計予測上手く出来なくて機能しないだろうし

2022/12/13(火) 18:15:56.11

物量が一番大事なのはその通りだな。あとSDの場合は学習済みCLIPに依存する問題もあるだろうな
だから2.0でCLIP変えたんだろうけど

2022/12/13(火) 18:20:13.59

ちょっと試したらホンマに出たわブラボ

https://i.imgur.com/GpupW6p.jpg

2022/12/13(火) 18:51:34.22

BorderlandsとPUBGも何度か生成すると公式絵がほぼそのまま出てくる
ゲーム系はやばいの多そうだな

2022/12/13(火) 19:10:18.88

リンゴ情報が全くない状態で、白い背景にリンゴがポンと置かれた物をappleと学習させると、

・日本国旗と類似
・白い背景
・画面に対してどのくらいのサイズの赤い丸
・丸の下側には影がある
・光が右上方から差し込んでいる

みたいなのを特徴だと認識して、girl with appleで巨大な国旗振ってる女
girl holding an appleでは巨大リンゴに抱きついてる女
みたいになるだろうな

2022/12/13(火) 19:11:28.98

>>14のさ、背景だけ変えられる？
何でもいいけど全く関係ないものに
もし変えられないならブラボに背景まで紐付いてる

2022/12/13(火) 19:18:56.07

なんか形から見るにちんこがラーメンに置き換わった画像あったけど何をどうしたらそうなるんだろ

2022/12/13(火) 19:41:34.40

いろいろ調べてるけど結局DBで使う正則化画像って、どういう画像を使えばいいのか誰も説明してくれないの
どういうことなん？　みんな雰囲気でやってるのかよ

2022/12/13(火) 19:54:24.58

>>19
初期のredditから追ってるが
似せる画像を用意する必要がある派と
自動生成で似せなくてもいい派に分かれる
正則化画像の影響も小さいしどっちがいいのかわからん

2022/12/13(火) 19:55:41.89

>>20
☓似せる画像
○似た画像

2022/12/13(火) 19:57:16.01

Automatic1111の sd dreambooth extention なら正則化画像を必要数勝手に作ってくれる
理屈はわからん！賢い人説明よろしく

2022/12/13(火) 20:19:43.73

>>17
bloodborne game art with Japanese shrine back ground
https://i.imgur.com/QNW0NUi.jpg

ちょっと建物が日本ぽくなったが変わらないな　他の単語でも同様

2022/12/13(火) 20:24:45.80

正則化画像はオーバーフィッティングを防ぐ意味があるから
どちらかと言えば似てない方が良いんじゃないの？
似てないって言っても上位概念の画像であるのが前提だろうけど

2022/12/13(火) 20:33:47.60

https://majinai.art/i/R2Ep9Rh.png
余裕で背景変えられる

2022/12/13(火) 21:21:59.52

>>19
DreamBoothのやり方は最初に実装されたXavierXiao版のGitHubでほぼ説明されてるからな
緑の大きいゴミコンテナを学習させるのに正則化画像としてコンテナ画像を生成してる
https://github.com/XavierXiao/Dreambooth-Stable-Diffusion

ただ、sksは銃の名前と被ってるから現在は非推奨
https://twitter.com/kohya_ss/status/1587574306082521089
https://twitter.com/5chan_nel (5ch newer account)

2022/12/13(火) 21:56:28.41

作品名や商品名を指定している時点でそれを最もよく伝えるイメージが出てくるのはある意味正常と言えるかも知れん

2022/12/13(火) 22:42:08.64

りんご覚えさせるのって
白背景にリンゴ1個あるやつ +付属txtにホワイトバックグラウンド　
で　「この画像　-　白背景　=　リンゴ」って感じで
学習させるのではいかんの?

2022/12/13(火) 22:42:38.11

学習元が出てくると鼻息荒げるヤツはせめて出力した環境を書けよ

>>19
正則化画像が無いと過学習になって失敗するぞ
大抵の場合はデフォで用意してくれてると思う
自分で数字弄ったら知らん

2022/12/13(火) 22:54:41.17

ただあれだ
正則化画像不要なタイプのDBもあるからな。
https://colab.research.google.com/github/TheLastBen/fast-stable-diffusion/blob/main/fast-DreamBooth.ipynb#scrollTo=qEsNHTtVlbkV
こことか。
俺はここが最初だったから、結局正則化画像って準備したことないわ。

2022/12/13(火) 23:42:47.71

TIやDA試してるけどキャラによって思うような結果が得られない
やっぱりDBがいい？
1111のエクステのやつで試したけどエラー吐いてスタートできないんだよね
3060じゃ無理？

2022/12/13(火) 23:48:15.37

>>28
TIみたいに「リンゴ」のワードだけ学習させるならそれで足りる
が、DBは「ホワイトバックグラウンド」の意味も学習し直して、そっちにリンゴの意味が染み込んでしまう
正則化画像に白背景の画像(+「ホワイトバックグラウンド」キャプション)を含ませておけば、「ホワイトバックグラウンド」が白背景という意味だと思い返してくれる

ざっくりとした俺の理解だとこう

2022/12/14(水) 10:35:38.62

>>31
両方同時にやるんやで。
まずDBでキャラの要素そのものを新たに覚えさせ
そいつをDAで引っ張り出す。
DAは知らないものは引っ張り出せないが、
知っているものについてはそれなりに有能に正しく引き出してくれるからね。
--------------------------------------------------------------------------------
呪文は(DB:1.0),(DA:0.8),
ぐらいがバランス良いなと個人的には思う。
DAの方を0.8より強めると絵が荒くなったりポーズが学習素材を真似しがちになる。
学習素材の枚数・質・学習ステップはまだ模索中。
----------------------------------------------------------------------------------------------
一応自キャラを　自分の上位互換同系統の絵柄で再現できている現状だと
DBは30枚　3000ステップ　DAは同じ素材30枚　4万ぐらい　って感じだ。
画風についてはHNの担当なので　ガチで『こんな感じの絵柄で　うちの子を』となると
結局3つとも重ねることになる。
初期ごろはポーズにも限度がついて回るが
そうやって出てきた絵を更に餌としてバージョンを更新していけば
そのうち好きな動きをさせられるようになるんでないかな。
ポーズそのものについてはblenderあたりを軽く学習して『雑なモデル』でいいから作れるようになれれば
結構いけるはず。
つまり最終的にはi2iも視野に入れる。　なんやかんやあるもの全部使うことになるんや。

2022/12/14(水) 11:13:18.23

>>25
変わったっていうか別の物が混じったというか
キャラも変わってるし

2022/12/14(水) 13:14:32.94

>>33
TIよりDA使った方が良いのか？

2022/12/14(水) 13:23:05.22

DAて、これが標準的で定番の設定だっていうのは見つかってるの？

2022/12/14(水) 14:23:46.55

WD1.3.5、0.3エポックでこれ！？すげえええって思ってたらベースにeimis混ざってるって聞いて興醒め

2022/12/14(水) 14:33:27.86

なんかとりさんまも混ざってるとか何とか

2022/12/14(水) 14:36:04.64

WD1.3.5はTrinArtがベース
WD1.4はSD2.1ベース予定

2022/12/14(水) 14:38:51.60

と思ったら、なんか今からharuがNAIの中の人に「eimisってNAIのリーク派生？大丈夫そ？」って聞くらしい
面白くなってきたな

2022/12/14(水) 14:41:51.68

えぇ……いや、まあ、本命はSD2.1ベースの方だからいいけど……なんかゴチャついてんなぁ……

2022/12/14(水) 14:43:26.33

Hugging Faceから消えてる

2022/12/14(水) 14:43:54.85

リーク気にしない人は今更WDなんて追わずにanything3.0にんほってるわけで
1.4はともかく1.3.5に期待してた人はリークに少なからず嫌悪感ある人たちだと思うんだよな
haruはこのモデルをGPUのテストくらいにしか考えてなかったらしいからちょっと温度差があるかも

2022/12/14(水) 14:48:47.63

混ぜてから大丈夫か聞くのか

2022/12/14(水) 14:53:20.68

もしかしてだけどこの人、eimisがNAI派生であることを知らなかった？（いや、確定はしてないんだが）
ピュアピュアか？

2022/12/14(水) 14:54:26.95

もう1.4だけに集中した方がいい気がする
ここまで待ってるんだし延長しようが何しようが待つがな

2022/12/14(水) 14:54:56.13

絵柄がNAIとは全く違うように見えた、NAI派生だとしたら何でんなもんhaggingfaceに載ってるんだ！シット！
って言ってるように見える
俺が盛大に翻訳間違えてる可能性もあるが

2022/12/14(水) 14:59:40.63

・1.3.5はharuが1人で作ってて、他のメンバーは何も知らん
・目的は新しく使えるようになった高性能のGPUのテスト
・テストで0から学習するのもなんだから、ある程度完成されてるとりんさまをベースに使った

ここまでは日本語情報出てて確定
そこになんでeimis混ぜたのかわからんくて皆ブチ切れてる
なぜかharuもブチ切れてる

2022/12/14(水) 15:01:55.30

本命は1.4で、1.4はsd2.1ベースなのは変わらず
こっちはチームで作ってるから、今回のゴタゴタとはまた別の話だと信じてるけど

2022/12/14(水) 15:14:13.04

まぁ何にせよいい感じのができればいいじゃん（いいじゃん）

2022/12/14(水) 15:37:22.67

>>34
そりゃお花畑追加したブラボ描いてなんて言えばAIも迷うわ
ブラボ感強くしろって強調すればそれっぽくはなるかな
https://majinai.art/i/-ChtJCJ.png
https://majinai.art/i/NKADXNR.png
https://majinai.art/i/Idvls8A.png

2022/12/14(水) 15:38:41.42

>>51
実際のゲームにこういう場面ないこともないけどね。

2022/12/14(水) 16:06:55.17

1.35はこのまま消えそうだな…

2022/12/14(水) 16:42:36.18

waifuは結局、1.2が最高だったつーか今となってはこれでしか出ない独特の風味があって良いというか

2022/12/14(水) 16:59:04.98

AIの話だと究極のAIが開発されて全部それで済む見たいな想像してる人いるけど大量のAIがあってその中から選ばないといけないのが当たり前だよね。。。

2022/12/14(水) 17:38:15.72

一つで済ませられる方法もないわけじゃないけど99.999999%以上いらないものまで一緒になるわけでな

2022/12/14(水) 18:18:01.27

>>40
これワンチャンNAIからお墨付きもらえる
そしたら法律的にこれ使うしかないわ

2022/12/14(水) 18:19:47.65

NAIが認める可能性は高いぞ
なぜなら2ヶ月前にオープンソースにすると言っているから

2022/12/14(水) 18:22:23.89

NAIがモデル出したら問題の9割が解決するな

2022/12/14(水) 18:54:45.54

NAIがオープンソース化する中にモデルは含まないって言ってなかったか

2022/12/14(水) 18:56:46.66

学習のコツみたいなんが共有されたらNAIに匹敵するようなのが出てくるんかな

2022/12/14(水) 18:59:08.76

WD1.2は本当にちょうどよかった
SD1.4から程々に全部二次元に寄った感じで

そこからガラリと変えようとするとSD1.4の学習結果がボロボロ消えていくからうまく学習させないと微妙な方向にしか行かないんだろうな

2022/12/14(水) 19:34:04.78

wd1.3.5の現状　東方aiから
・haruが1人でテスト感覚で作ってた
・haruはeimisがNAI派生だと本気で思わなかった
・wd1.4はチームで作ってて、間違いなくsd2.1ベース　NAIや派生は使わない
・1.3.5は開発中止ではない？NAIの人に確認取ってokもらったら続行かも

まぁ1.3.5なんてモデルは最初からなかったものだとして考えるしかない
一番最悪なのは、これで1.4がズッコケて1.3.5が一番よかったってなること

2022/12/14(水) 19:36:21.10

色々不安なsd2.1ベースで、一気にdanbooruの外にまで学習画像を広げて、本当にNAI以上のものを作れるのかすごく不安
だからこそ、一回NAIと同じやり方でNAIと同じものを作っといて欲しかった.....

2022/12/14(水) 19:37:52.39

id変わってるけどkdcMfuWH6と同一人物
なんか間違ってたらごめんね

2022/12/14(水) 19:40:40.15

WD1.4は完全別ラインで動いてるしスタッフが相当金注ぎ込んでるんだな
1.4でなくSDに合わせて2.0とでもした方が良いのでは
1.35の方がむしろharu氏が深く関わったdanbooruでのトレーニングモデルだし継続するなら1.4の名がふさわしい

2022/12/14(水) 20:19:03.16

素のSD2.1である程度萌え絵が生成できるのにそれより劣化したらさすがに笑う

2022/12/14(水) 22:11:56.87

実写が問題ありすぎて使い物にならんからなぁ
人物なんて怖くて使えんだろ。魔法使い系のワード入れるとたまにエマワトソン出てくるしな
知らない人物がひょいと出てそれ知り合いじゃんって連絡されたら、著作権肖像権うんぬんより名誉棄損の方が問題わ
今のまま2D特化でマージして遊べる方が気楽でいい

2022/12/15(木) 00:04:00.09

流石にポジ変えるのは怖いので解消だけして手持ちのSPXSをロングに張り直してみたがさてどうなるやら
FOMCはともかくパウエルがナメた事抜かしかねないのがもうね

2022/12/15(木) 00:04:19.22

間違えたm(_ _)m

2022/12/15(木) 00:33:43.71

SD1.4ベースでAnything V3.0の生成画像を学習したアニメ絵モデルらしい
いよいよ将棋AIみたいなシンギュラリティ感が出てきたな
https://huggingface.co/JosephusCheung/ACertainModel
https://huggingface.co/JosephusCheung/ACertainThing

2022/12/15(木) 01:21:04.08

やる男の直撮りAA思い出した
前スレでNJに継続課金しなくても出力した画像食わせれば良くね？ってレスに数千枚程度じゃ全然変わらないよってやり取りを見たな

2022/12/15(木) 02:09:57.41

>>71
kdcMfuWH6です
さっきは省いたけど、東方aiでそこの作者が陰謀論めいた話をして暴れ回ってて
その中で、a certainthingについてはwd1.4と同じことをした、とゲロってる
つまりeimisなどリーク派生モデルをマージした可能性がある
実際、modelとthingで明らかに生成画像の質が異なる
生成画像を学習しただけでここまでのクオリティが出せるのかは大いに疑問

2022/12/15(木) 02:12:56.49

>>72
それを箱庭がまさに今やってる
リーガルだし面白い試みだとは思ってるけど、生成物は.....。
少なくとも簡単なプロンプトで神絵が出ることはない＝NJの代わりには全然ならない
興味があれば追ってみては

2022/12/15(木) 02:15:28.67

NJ、MJに関しては、remixをはじめとした、automaticにない独自機能がたくさんあるから、SDで代替は不可能な気はする
絵柄だけ似ても全然意味ない
逆にmjで普通のimg2imgは（多分）できない、追加学習もできないので、完全に分岐したなと

2022/12/15(木) 02:47:55.96

journey系はUIがなあ……

2022/12/15(木) 02:49:42.69

NAIの人の回答が出た
・eimisの作者は、NAIリークの使用を明確に否定
・NAIの人は、eimisがNAI派生かを明言せず
・でも、「色々と加工して作られていること」と故意でないことを理由に1.3.5の配布を一応認める
・しかし、haruは今回の件でナーバスになっており、2.1ベースで学習をやり直したいと主張

一応、今回の件で1.3.5は完全にシロのお墨付きがついた
eimis自体はグレーなまま

2022/12/15(木) 03:01:04.65

>>77
Eimisの作者ええ度胸しとるわw

2022/12/15(木) 03:12:50.78

連投規制のためまたID変わったけど

長々と連投すまん
個人的にWDには並々ならぬ思い入れというか期待があるので、つい熱くなってしまった
完全な公認というより、内々でまぁいいけど......って言われたくらいのノリらしいので、あくまで自己責任で

最後に、エロスレの方にはあったけど、はぎんぐに残ってる1.3.5のログを
https://huggingface.co/hakurei/waifu-diffusion-v1-4/blob/9fa4a42a9c4a0948472fa909e6c1a39be0dda699/models/wd-1-4-float32-booru-110k.ckpt
今もダウンロードできる
作者が消したものをダウンロードする倫理的問題はしらん

2022/12/15(木) 03:13:24.19

変わってなかった

2022/12/15(木) 03:30:23.62

まーEimisはアレでNAI混ぜてないって無理があるわな
それよりかharu氏がピュア民な事に驚いたが。いやこれも建前なのかな…？

2022/12/15(木) 03:33:54.15

単なるプロレスなのかすっとぼけなのかは知らんが
良くも悪くも癖のある連中やな

2022/12/15(木) 04:00:40.91

WDの中身が何かのマージだっていう事がショックだけどな
いくらテストだって言ってもwd-1-4-float32-booru-110k.ckptこの名前でマージ品それも2種混合を出してきてるわけだし
よほど学習がうまくいってないかプライドが低いのかわからんけどWD1.2以降ずっとグダグダで
仕切り直してくれると思ったらもっとぐだぐだになってたっていうね
リリースできない言い訳に内情ごたごたですとか、NAIリークは攻撃か宣伝か知らんけど、別の意味で知名度下げて世界に恥晒すだけだから…

2022/12/15(木) 04:26:12.40

叩かれたから学習はこれ以上やらないだろうし配布も無理だろうな
NAIが問題ないなら俺はそれでいいのにな
叩いた奴らは謝ってこいよ

2022/12/15(木) 04:36:12.07

世界に恥を晒すなら日本人が足の引っ張り合いしてる方が恥さらしだな

2022/12/15(木) 07:28:50.38

今更だけどNAIの開発の1人から別に似てないしいいんじゃないっていう曖昧な返答が帰ってきたそうだ
その人は以前NAIリークモデルにキレ散らかしてた人

2022/12/15(木) 07:36:23.17

お互い足引っ張り合っても利益がないと踏んだか
まあぶっちゃけどっちも他人のフンドシで相撲とってるようなもんだがな

2022/12/15(木) 07:39:36.56

すまんだいぶうろ覚えでレスしたわ
とにかく開発のmuruなんとかみたいな人からはダメとは言われなかったと言っていたのは間違いない
ソースは各々waifuの鯖で確認してくれ

2022/12/15(木) 07:40:29.39

kurumuzか

2022/12/15(木) 07:54:42.55

>>72
画風固定ならHNでなんとかなりそう

2022/12/15(木) 08:20:59.35

novelAIはSD2.1ベース版を開発していないのだろうか?

2022/12/15(木) 08:49:27.99

>>91
SD公式と組んでて2.1対応やってないとは思えないけどねぇ
そもそも今2.1の派生モデルってどんだけ出てるんだろ

2022/12/15(木) 09:37:17.21

EimisはNAIリークじゃないって言ってるんだけど
疑ってたやつおるｗｗｗｗ

どっからどう見てもNAIだろ

2022/12/15(木) 09:42:27.86

天下のharuが画風全然違うって言ってるから......

2022/12/15(木) 09:43:53.36

そう……(無関心)

2022/12/15(木) 10:26:38.28

つまりEimisはシロなんですね（にっこり

2022/12/15(木) 10:29:38.14

外野が一人残らずシロと言わない限り収まらないよ！
と言うかAIを糾弾すること自体が目的化してるｗ

2022/12/15(木) 10:52:09.76

AIを糾弾してるんじゃなくてリークを糾弾してるんだけど
もはやマージやら何やらでぐちゃぐちゃになって、確実性のある判別手段を失ってるので、全部グレーになってしまっているという
なんでオープンソースのコンテンツでこんなことになってるんですか？（すっとぼけ）

2022/12/15(木) 10:58:09.03

リーク以前のモデルしか使っちゃダメだよ🤗
girlって入れたら女の子が出てくるのはNovelAIリークの特徴だからね🤗🤗🤗

2022/12/15(木) 11:01:10.60

もはやこのレベルだろ
白いAIイラストやりたきゃnijiなりNAIなり課金しろってわけよ
アホらしwリーク使うわ

2022/12/15(木) 11:04:21.71

NAI側もゴネればまた標的にされると思って強く言わないだけだろな
露骨なもんにはDMCAテイクダウンした事あるし

2022/12/15(木) 11:09:34.08

ツイッターで漫画のコマとか好き勝手貼りまくって会話してるような奴らが急に版権意識高くなるの滑稽だよな

2022/12/15(木) 11:20:30.18

まあ他人の作品パクって二次創作は正義でその絵をAIが学習するのはまかりならんって人たちなので……

2022/12/15(木) 11:21:23.29

それはそれとして最近技術革新ないな......
dreamboothが速くなるloraってやつくらい？
技術者も皆WD1.4（などの、sd2.1ベースのアニメモデル）待ち？

2022/12/15(木) 11:24:51.51

ここまでの技術革新ですら十分に理解して扱えていて活用出来ていて新しい技術ばっちこいという体勢であるとは
自分はとても言えないのでwd1.4までこの間まなだらかであってくれと祈るばかり

2022/12/15(木) 11:26:19.33

NAIはそりゃ裏でSD2.1ベースのバージョン2を開発してるだろうけど
それをまたクローズドにしたら、またハッキングされない限り
2.1ベースのアニメモデルは現状WDとunstableしか発表されてない
しかもunstableがどこまでイラストに寄ってくれるかも定かじゃない
WDがコケたら進化が完全に止まるおそれもある

2022/12/15(木) 11:26:56.29

>>103
これまんまnaiに当てはまってるのが笑える
どこがフェアユースなんだと

2022/12/15(木) 11:29:18.37

例えばdepthがあれば適当にかけ算するだけで座標がわかるから
今まで画像1枚だった背景に奥行きを与えてブラーなどのポストプロセスをかけられたり
パーティクルを跳ねさせたりできるわけじゃん？
VFX的にはすごく面白いと思うんだけど実際に手を動かしてはいない…………………………………………………………………………………………………………………………

2022/12/15(木) 11:30:52.52

いやまあdepth estimationは前からあったけど
とてもアーティストにおすすめできるお手軽さではなかった

2022/12/15(木) 11:45:19.84

>>108
ちょっと気になるからすまんけど紹介記事かなんかのリンク貼ってほしい
技術系、一度アンテナから漏らすとググり方がわからん

2022/12/15(木) 12:02:50.87

座標の再構成は
reconstruction of world position from depth

ポストプロセスはかかる強さをdepthをそのままかけ算するだけ

パーティクルを跳ねさせるのは座標の再構成できるんならパーティクルの座標がそこを下回ったり上回ったりでコリジョンが起きるようなんか上手く出来ないかなっていう妄想
多分できるけどまだやってない

2022/12/15(木) 12:03:06.85

多分ググればすぐ出てくる

2022/12/15(木) 12:06:59.76

大陸の方は国のAIコンテンツ規制来た
https://gigazine.net/news/20221213-china-ban-ai-content/

今の所規制はそれなりに常識レベルではあるけど

2022/12/15(木) 12:18:55.25

>>113
ファーウェイから通信事業奪ったとか業界2位の建築屋潰すとかでかいニュースにってからだな
当面はmeituがミスって潰されるようなことでもなければ影響ないというか周知できんだろ
AI生成で著作権違反？ディープフェイク？ニッチな世界で悪い事してる奴らが潰されて当然なわけで

2022/12/15(木) 12:21:11.40

中国共産党と絡めてヘイト煽ってる記事だが常識レベルの規制だな

**名無しさん＠お腹いっぱい。** (JP 0Hcb-68uo) · 2022/12/15(木) 12:27:20.89

蒸留バージョン早くこねーかな

2022/12/15(木) 13:07:18.02

>>111
ありがとう
ググったら出てきたけど何がなんだかさっぱりで
俺には過ぎた代物だということがわかった
blenderかじったくらいじゃ太刀打ちできないよう

2022/12/15(木) 13:21:31.04

Certainの作者がモデル類似度計算機を公開してEimisとNAIの類似度は99.92%だって言ってて草生える

https://huggingface.co/JosephusCheung/ACertainModel

2022/12/15(木) 13:24:07.70

URLこっちか
https://huggingface.co/JosephusCheung/ASimilarityCalculatior

2022/12/15(木) 13:29:21.30

よし、１００じゃないから白だな
1.35落としそこねたから再アップロードしろ

2022/12/15(木) 13:32:54.55

そいつ本当に外国人なのか怪しい
シードに114514使うか？
淫夢ネタじゃないのか？
いや海外で流行ってるのならあり得るのか…

2022/12/15(木) 13:33:36.77

>>118
WD側はその計算機を、全部SDベースだからモデルが似るのは当たり前って話はしてるな
この製作者、これ持って東方aiチャットで暴れてるから

>>120
>>79からダウンロードできる

2022/12/15(木) 13:34:00.31

NAIをベースに見てsd1.4が83%類似とか、もうこれわかんねぇな
人と猿の遺伝子が99%類似、ってのと何が違うのか判らん

2022/12/15(木) 13:35:06.21

>>123
まさにまったく同じ話をWDの人もしてる

2022/12/15(木) 13:47:49.60

sdではなくNAIベースに見ててもなんもおかしいことはない

2022/12/15(木) 14:04:04.71

>>120
一応正規のリンクから落とせるぞ
wd1.2のとこ

2022/12/15(木) 14:10:56.05

135は結局中止か

2022/12/15(木) 14:12:08.58

中止かどうかって発表あったっけ

2022/12/15(木) 14:12:32.39

1.4の下ごしらえ終わるまではやってんじゃない？

2022/12/15(木) 14:14:03.52

>>106
NovelAIとniji journeyの有料サービスどうしが競争する健全な市場に

2022/12/15(木) 14:17:14.31

>>130
不健全なんだよなぁ

2022/12/15(木) 14:18:30.21

>>125
SD1.4ベースだと腰から上ぐらいのショットは良いけれど全身だと解像度が足りない感じ。
アウトペイントを上手く使えば良いのかもしれないけれど

2022/12/15(木) 14:21:30.13

中国の規制は人間の顔とか現実的なもの生成する時はマーク付けろって感じで2次元は対象に入ってる感はないな
国外向けコンテンツはこの規制気にすんなって言ってる辺りAIそのものを規制する感はあんまり無さげ

2022/12/15(木) 15:52:56.99

なんかgradioが重過ぎ
こういう時どうすりゃいいんだっけ

2022/12/15(木) 15:55:59.92

タブ再起動とグリッド関連オプション全無効化

2022/12/15(木) 15:58:08.40

それはやったけどダメだ
ジェネレートフォーエバーが2から6枚くらいで止まる

2022/12/15(木) 16:04:32.12

PC買い替え

2022/12/15(木) 16:12:42.34

colabだぜ

2022/12/15(木) 16:48:29.03

ngrok使うといいかも
ngrok AUTOMATIC1111で検索すればやり方出てくる

2022/12/15(木) 16:56:01.04

>>139
おお、これは有用そう
ありがとう！

2022/12/15(木) 17:30:11.61

http://dng65.com/blog-entry-10270.html
どんどんボロが出てきてしまいましたなぁ

2022/12/15(木) 17:40:47.74

automatic1111で、Depth-guided modelの512-depth-ema.ckptに対応したというので試しているけど、
なんかうまくいかん。具体的にはこれどうやって使うん？深度マップの画像はdepth map scriptなんかで作れば良いの？

2022/12/15(木) 17:43:36.30

>>118
sd1.2とwd1.4が68%程似てるなら99.000%～99.999%の幅って結構ある気がする

2022/12/15(木) 20:25:09.54

>>141
i2i使ったツイカス自演は日本でも初期に大量に起きてただろ…俺の絵大人気！AIで盗作されたって
懸念っていうような話でも何でもない、削除依頼出して対応しなければ訴ええばいいという結論で終わってる
ネットで騒いでるだけで怖くない存在になってきてるからな、盗作する奴は気兼ねなくやる

2022/12/15(木) 20:52:47.70

いつものi2iえんじょいやーか
ちょっと前のブラボまんま出てくる件なみの情報じゃないとただの運子だぬ

2022/12/15(木) 21:01:40.58

パクリ主張するならモデル、seed、プロンプトは必須だわな

2022/12/15(木) 21:30:10.35

>>106
Unstable DiffusionはSD2.0モデルを活用するとしか発表してない
AphroditeAIとかいう謎のシステムを使って
シンプルなプロンプトで高品質な生成をできるようにするらしいから
長文プロンプト必須のSDベースではない可能性もある

>>116
Emadが来週と言ってたらしいぞ
海外ではそろそろクリスマス休暇に入るから予定通りに出るかは微妙だけど

2022/12/15(木) 21:41:16.49

ChatGPTと繋げて、対話で「そこもうちょっと足長くしてよ」みたいに
指示出しながら絵を描く、みたいなシステム出てこないかな

2022/12/15(木) 21:52:12.81

たぶんその内出ると思うけど
マウスのほうがはえーわって言ってる未来が見える

2022/12/15(木) 22:00:01.92

音声で指示出せるようになればええな

2022/12/15(木) 22:06:19.52

英語出来るならねえ

2022/12/15(木) 22:25:29.51

ネイティブレベルの英語能力ないと使えない罠

2022/12/15(木) 23:04:00.49

>>121
ループの3,11も謎だが由来あんのかな。震災？

2022/12/15(木) 23:21:08.76

あ、ごめん普通に意味あった。transformer_blocksの数字か…

2022/12/15(木) 23:45:46.33

>>150
処理速度が上がって即反映なら
近未来の映画とかでそういうのあったね

2022/12/16(金) 08:31:17.21

>>148
これイラストレータースレで最初期に言われてたけどchatGPT出たから現実的になったな

つってもプロが満足する品質が出せるか？とは思わないでもないが
まぁプロンプト練る部分とか、調整前提で基本設定組んでくれるだけでも楽になるか

2022/12/16(金) 09:45:31.78

画像と文字の関連付け（文字→画像ではなく画像→文字）がまだ全然不十分だからな
chatGPT(対話)よりもそっちが何とかならない限り現実的じゃない

2022/12/16(金) 09:48:13.43

適当に頼む→ChatGPTがプロンプトに変換して画像生成AIに入力
これは間違いなく出来そうだが
プロンプトでコントロールできない部分はそもそもどうにもならないわな

2022/12/16(金) 09:54:50.63

もはやchatGPTにもi2i的な感じで画像で指示したいわ
この絵のこんな感じを再現できるように適切に言語化してくれみたいな
んで出来た絵を元にもっとこうしてみたいな追加指示できたら

2022/12/16(金) 09:57:34.19

chatGPTの文脈を理解する力はかなり高いからこの調子でもうちょっと技術が進歩したらイラストの世界でもキャラクターとか背景の文脈を保った出力ができるようになるかもなあ

2022/12/16(金) 10:31:47.49

人間「ここがバーンでドカーンなんだよ！お前のはギビギビなの！こんなの使えねえんだよ！」
お絵描きAI「申し訳ございません。これでどうですか？」
人間「そうそう、いい感じ、あとはここら辺にひまわりっぽいタンポポを散らしといて」
お絵描きAI「わかりました」

2022/12/16(金) 11:23:17.89

人間「後ろ向きで膝裏を見せながら振り返って胸と脇と顔を見せて耳の横で髪を結んで」
AI「？？？？？？」
人間「あ、ピカソ禁止ね」
AI「🤬」

2022/12/16(金) 12:41:08.59

chatGPTは「AIの真似をする人間」を学習データとして与えてるそうなのでイラストAIも「お絵描きAIっぽい絵を描く人間」を学習データとして与えれば良いと思う

2022/12/16(金) 12:42:13.49

chatGPTは人雇って出力の評価してた
画像生成AIも、そのうちGAFAが何千万の画像に全部人力でキャプションつけて学習させるぞ

2022/12/16(金) 12:44:26.60

そう考えるとdanbooruがどれだけAI学習に理想的なデータかわかるな
正味danbooru学習規制されたらアニメモデルは終わると思う

2022/12/16(金) 13:12:12.59

ダンボールのメリットは大規模学習データを整えやすい(理想的なデータとは言ってない)ってのと
あれがユーザーズマニュアルとして機能するから程度だし
つぶれても終わることはないよ

2022/12/16(金) 13:15:07.47

>>166
blipやdeepdanbooruがつけるキャプションのゴミさに対して、段ボールは人力で全ての画像に基準が一貫した正確なキャプションが既についている
この学習におけるメリットはデカいと思う

2022/12/16(金) 13:16:37.18

英語文法無視して単語で直接収束するものを引っ張ってこれるからなぁ
結果的にあいまいさとガチャっていう無駄な時間が生まれてるわけだが

**名無しさん＠お腹いっぱい。** (JP 0Hcb-68uo) · 2022/12/16(金) 13:18:21.29

danbooruはキャプションじゃなくてタグだしタグ自体の語彙も全然足らんよ
理想的とは程遠い

2022/12/16(金) 13:19:44.22

SDで理解不能な難解さだったプロンプトが、WDからNAIにかけてで、段ボールタグコピペで大体どうにかなるようになったのもデカい
元素法典も中身は大体段ボールのタグだしな

2022/12/16(金) 13:22:03.40

自然言語じゃないのとタグの語彙が足りないのはそうだけど
全部人力なんてさっきも言った通り大企業でもないと無理なんだから、今の技術での現実的にはかなり理想的に近いのでは

2022/12/16(金) 13:23:46.95

GAFAMは今ちょっと厳しいだろ
元々AI関連のラベル付けはギグワーカーぶん投げてるケースが多い
アホみたいにコストかかるんで

2022/12/16(金) 13:25:55.99

まぁ言語問題もあるけど、構造上3Dを理解してエミュレートしてるわけじゃないから
ダメな元絵だけじゃなく指が隠れたりする構図の画像学習すると指の本数が減っても異常だと感じなくなっちゃうしな
depthとは言わず奥行きで学習よりもレイヤー分けや人体だけでも3D構造理解させて描かせたいわ
SD3.0には期待している

2022/12/16(金) 13:29:44.38

初期の画像生成は自然言語理解のレベルを測るための指標にしか過ぎなかったわけだけど(机の上にあるりんご、りんごが机の下にありますなど)
画像生成という点だけで見れば別に自然言語理解は不要だからね、正確な指示を与えたいという話ならjavascriptでも使った方が早い

2022/12/16(金) 13:33:07.31

そもそも指の問題は言葉による分類が出来なさすぎなところにありそう
LAIONのデータセットも単に画像のalt属性使ってるだけでしょ

2022/12/16(金) 14:02:55.55

>>159,161
ドラえもんとか映画ウォーリーで機械が何でもやってくれるから体力が退化して自力で歩けなくなった人類みたいなのがいたけど、そんな感じだな、ウォーリーは知能も低下してたし
実際Google検索とタップで文字書かなくなるので似たようなもんか

逆にその分スマホ使うのに特化して脳発達してるけど、ＡＩ以降はなんかしら発達するんだろうか

2022/12/16(金) 14:04:51.00

>>174
「指」クラスで本数指定して、「目」クラスで目の色と形のパターン指定して、ができるだけでだいぶ使いやすくなるからなぁ

2022/12/16(金) 15:33:04.74

スクリプトまでいかなくても
なんかjson的な文法でidとpromptみたいなプロパティの簡単な構造体作れて
object,behaviour,sceneみたいにブロック分けて書けたらいいなとか思ったりしてる

2022/12/16(金) 15:59:27.56

学習用のタグとして美術記述言語みたいなスクリプトがあってもいいだろうけど、
プロンプトでそんなの弄りたくないな。そういう細かい部分こそAIにお任せしたい
バカみたいだけど、>>161みたいな指示出しに対応してくれるAIがやっぱ理想形だと思う

2022/12/16(金) 17:39:22.12

>>179
でも、それが今のガチャに時間取られるっていう現実を生んでるわけで…
iPhoneに楽しくなれる曲かけて！って言って楽しくなったことがないって文句言うだけの人が増えるだけ
後ろ向きな性格な人やルーズな人間を満足させるAIは100年たっても無理だと思うぽ

2022/12/16(金) 17:54:56.48

ディープラーニングが軌道に乗って10年、画期的だったtensorflowから7年でこれだぞ。100年後はどうなってることやら

2022/12/16(金) 18:10:27.54

SD出たの8月とかだっけ？速度がヤバいわ

2022/12/16(金) 18:47:42.64

NMKDがアプデして1.8になり、AMD製GPUに対応したとかなんとか

https://nmkd.itch.io/t2i-gui/devlog/464336/sd-gui-180

2022/12/16(金) 19:06:12.40

>>179,180
そもそも何をやりたいかなんだと思う
「いちいちプログラミングとか設計なんてめんどくさいしアイデアだけあればそれっぽいアプリ作って欲しい」と同じだと思う
それはノーコードでそこそこ満たせる

でもノーコードのお手軽さとエンジニア使って単価100万かけて(あるいはそのぐらい本格的な個人開発で)設計書にしろアジャイルにしろ何かしらの精度出したい開発はそもそもジャンルが違うから

2022/12/16(金) 19:39:26.67

>>183
ついにWindowsでもGUIソフトでRadeon動かせるのか！
ところでNMKDって1111と機能的にどう違うっけ？

2022/12/16(金) 19:44:08.97

親を人質に取られて脅されてる人が使わされてるやつ
AUTOMATIC1111のリポジトリ開いた瞬間傍で銃持って待機してる人に射殺される

2022/12/16(金) 20:06:01.41

automaticとnmkdとinvokeがあるが
ありとあらゆるextensionがautomaticにしか対応していない
そもそもの機能も足りてない

2022/12/16(金) 20:39:59.25

最初期だけNMKD使ってたがもう戻れんな・・・
今使ってる人は何らかの宗教的理由があるんだと思う

2022/12/16(金) 22:17:07.66

>>185
基本的な画像生成に関してはそんなに違いは無い。
あれこれやりだすと足りなくて、automatic1111に流れていく人が多いし自分もそうだった

>>188
マージやモデル剪定とかでよく使ってるなあ。
1.8ではモデルの形式変換もついたので、そのへんの便利機能は使っていくかもだ

2022/12/16(金) 22:44:31.04

むしろExtensionなしで進化していくNMKDがすごい

2022/12/16(金) 23:47:00.41

ちょっと試したけど、onnxモードだとサンプラーの指定ができない

2022/12/17(土) 07:25:29.98

>>183
NVIDIAの同程度のGPUと速度がどのくらい違うかだな

2022/12/17(土) 08:55:51.05

@Yamkaz: 新しいAIイラスト生成サービス
「HolaraAI」が公開！
https://holara.ai/holara/
より良い色とスタイルを得るため、そして他のすべての人と公平になるために、Stable Diffusion 1.5を多くの独自手法を用いて学習させたものとのこと。以下は個人的に出力したもの、編集なしです #HolaraAI https://twitter.com/Yamkaz/status/1603861730232524800/photo/1
https://twitter.com/5chan_nel (5ch newer account)

2022/12/17(土) 11:21:33.36

またクローズドですか......

2022/12/17(土) 11:38:51.10

出てる絵見るとNAIリーク食わせてませんかね

2022/12/17(土) 12:21:05.67

そもそもこれで生成するメリットって何
絵柄に目新しさも無いi2iも無い、料金も同業他社と比較して安くもない
nijiの幅広さやローカルSDの拡張性に対して勝るとこあるの

2022/12/17(土) 12:27:26.34

何か問題あんの？
象牙の印鑑は違法だとして「象牙風」の印鑑まで規制しろっていう意見？

2022/12/17(土) 12:43:45.43

大した労力使わなくてもモデルマージするだけでサービスインできてほぼ放置で儲かる
そしてNAIまんまだとばれるしやばい（訴えられるなどの可能性ある）けど
NAIマージなら疑われても外部からそれを証明するすべはない
運営側にはメリットしかない

2022/12/17(土) 12:47:09.04

なんか格安SIMの乱立を思い出した
あんな感じでクローズドサービスの客の取り合いが発生しそうだな

2022/12/17(土) 13:12:58.79

マージしなくてもnaianyの出力画像で学習すればクリーンやしな