【StableDiffusion】AI画像生成技術14【NovelAI】

**名無しさん＠お腹いっぱい。** · 2023/01/24(火) 16:47:17.87

入力されたテキストから画像を生成するAI技術に関して語るスレです
StableDiffusion： google colabやローカル環境で実行可能なAI画像生成
NovelAI：有料サブスク型AI画像生成サービス
（DALLE・Craiyon・Midjourneyの話題もOK）

★★★ 注意 ★★★
ここは既存のAI画像生成サービスの【具体的な】技術や動向について語り合うスレです
AI画像生成の未来や、イラストレーターの職権侵害等の漠然とした一般的な話題は明確に【禁止】します
以下のスレッドへ移動してください
【Midjourney】AI関連総合25【StableDiffusion】
https://mevius.5ch.net/test/read.cgi/cg/1671824170/
AIイラスト　愚痴、アンチ、賛美スレ part21
https://mevius.5ch.net/test/read.cgi/illustrator/1672631052/

エロ画像の生成については以下のスレッドへ
【NovelAI】AIｴﾛ画像情報交換 11【Waifu】
https://mercury.bbspink.com/test/read.cgi/erocg/1672908946/
なんJNVA部★125
https://fate.5ch.net/test/read.cgi/liveuranus/1673029370/

テンプレまとめ
https://rentry.co/zqr4r
編集コード「5ch」

前スレ
【StableDiffusion】AI画像生成技術12【NovelAI】
https://mevius.5ch.net/test/read.cgi/cg/1670898879/

【StableDiffusion】AI画像生成技術13【NovelAI】
https://mevius.5ch.net/test/read.cgi/cg/1673148116/

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 10:55:33.75

しかしこんなスレに毎回大量の単発IDが湧いてバレバレなのに良くやるな。それでも構って欲しいのか、それともマゾなのか？

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 10:56:36.22

ランダムシード値で同じ構成の絵が出るまで回し続けたらいつかは同じものが出る
それは同じ絵ではなくてたまたま似ている構成だっただけなんだ
学習データ丸コピーで512x512や768x768の画像を
1億6,000万枚もの保存してたら2GBじゃ無理なんだということを理解しろよ
そんな超圧縮技術があったら動画配信が5MBで2時間映画見れるわｗ

今でもmp4動画でSD画質なら1GB前後だぞ

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 10:56:55.63

コラじゃない！もノイズじゃない！も結局ソース出せないいつもの流れやね
相手してあげている人も狂信者には論理的な思考ができないことを知った方がいいと思う

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:00:46.18

>>852
・仕組み上（劣化とはいえ）画像を記録していて
・劣化とはいえほぼ同一に復元可能な形で抽出できる以上詭弁にしかならんな
stablediffusionが画像の記録学習無しに合成コラージュ以外の方法で画像を出力できればよかったのにな

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:07:19.75

>>839 = >>852
stablediffusionの画像圧縮技術は（劣化ではあるが）相当優秀やぞ
圧縮画像の保存に使おうとする人もいるくらいには

画像生成AI「Stable Diffusion」が実はかなり優秀な画像圧縮を実現できることが判明
https://gigazine.net/news/20220921-stable-diffusion-image-compression/

> ビュールマン氏はStable Diffusionを画像圧縮コーデックとして利用するために、
> VAEで生成された潜在画像表現をどこまで効率よく圧縮できるかを検討しました。
> VAEのデコードは、潜在画像の量子化に対して非常に強いことがわかったそうです。

> VAEで潜在画像を8bitに量子化することで画像表現のデータサイズは64×64×4×8bit=13万1072bit＝約16.4kBとなります。
> さらにフロイド-スタインバーグ・ディザリングを使って256個のパレット化した表現を使うことで、データサイズは64×64×8ビット＋256×4×8ビット＝4万960bit＝約5.12kBとなります。

> 潜在パレットにはフロイド-スタインバーグ・ディザリングによってノイズが発生するため、デコード結果には歪みが発生してしまいます。
> しかし、Stable Diffusionは潜在画像からノイズを除去する仕組みなので、数回の反復を行うことでデコード結果は元画像に近いものになります。

> ただし、Stable Diffusionは画質よりも画像コンテンツそのものに影響を与えるという性質があります。
> 潜在空間に小さな文字や顔を保持できないため、一見画質がキレイであるように見えても、実際はまったく別の画像になってしまっていることもあるとのこと。

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:10:05.02

Stable DiffusionでLoRAを使った学習をしたく、下記サイトの手順に従ってWindows（ローカル環境）でのインストールを試みているのですがどうにもうまくいきません。
まず引っかかったのが、手順Part１のxformersのインストールで、「ERROR: xformers-0.0.14.dev0-cp310-cp310-win_amd64.whl is not a supported wheel on this platform.」
とういエラーが返されました。
この内容は別のスレで「pip install xformers==0.0.16rc425」で大丈夫？という内容を見た気がしたので、これでいったん先に進みました。
次に引っかかったのは、手順Part2でWeb UIに、Taggerのタブが表示された後、「Batch from directory」のディレクトリ入力部分で、正しいディレクトリを入力しても「input path is not a directory」と返されて進みません。
どなたか解決方法ご存じでしょうか。。。？
参考にしたサイトは下記のとおりです。
手順part１：https://murasan-net.com/index.php/2023/05/23/sd-scripts-install/#index_id5
手順Part２：https://murasan-net.com/index.php/2023/05/25/sd-script-lora-train/#index_id4
よろしくお願いします。

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:13:07.64

>>855
なんで小さな文字が復元出来ないか判ってたら反論のソースとしてこれを貼らないんだよな

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:14:47.81

反AIカルトは誹謗中傷だけではなく掲示板の荒しもするみたいだな

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:15:53.42

>>855
>　潜在空間に小さな文字や顔を保持できないため、一見画質がキレイであるように見えても、実際はまったく別の画像になってしまっている

やはりコピーでないということが証明されてたな

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:18:29.13

モデルに元の画像が劣化保存されてる理論だと自分の手持ち写真にinpaintした時の動作とか説明出来なくないか？

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:21:18.10

>>855
ちょうどstablediffusionが画像をノイズ化した実例も載っているな
https://i.imgur.com/ZuAOFKv.jpg
https://i.imgur.com/9KBGWsS.jpg

反AI連呼してる人より仕組みに詳しくてソースも出せるの草なんだ

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:21:29.69

>>855
将来、この技術で動画配信のパケットが削減されたらめちゃくちゃエコだろう
やはり新しい技術は人間が進化する上で必要なんだな

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:22:33.92

それノイズ化じゃなくて符号化した結果

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:23:17.98

>>855
現状のGPUとかでは512✕512サイズの画像を直接扱うには非力すぎるのでVAEで1/8✕1/8にしてSDの処理してまたVAEで戻している。
画像圧縮、伸長はVAEの機能であってSDの（本質部分の）機能ではない。

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:23:58.56

>>862
音声はとっくにやってるな。今の電話の声は元と関係ない合成音だ

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:25:28.72

>>859
所詮は圧縮ぎつじゅつでしかない（劣化コピーに過ぎん）からね🤗

>>861
そもそも自作モデル作っているくらいにはstablediffusion使っているからな
夢見てる生成ボタンポチポチおじさんが「反AIだ～」ってわめいとるだけやろ

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:32:20.31

>>862
仕組みは違うけど動画のアップスケールもかなり研究が進んでいるね

低画質のYouTubeやNetflixなどあらゆるウェブ動画を高解像度にアップスケールできるドライバーをNVIDIAがリリース
https://gigazine.net/news/20230301-rtx-video-super-resolution/

ただStableDiffusion VAEの圧縮復元は現時点でも16x16px→512x512px一枚数十秒以上かかっているので
実用化まで十年で済めばかなり早い方かな

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:32:43.26

単発同士でレスし合ってるのキモいな

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:35:20.80

>>867
使えるケースは限られるけど、Web会議のカメラ画像限定なら事前学習させたモデルを会議前に撒くことで行けそうではあるね

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:37:00.35

>>862>>865
音声のやり方だと再生側に画像の膨大な参照データが必要になる

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:44:02.50

>>865
これが出来るなら名探偵コナンの変声機蝶ネクタイも簡単に作れるんじゃないか？

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:50:40.02

>>856
sd-scriptsのインストールとtaggerの使い方か
taggerのほうは具体的にどう入力したかを示したほうが解決しやすいよ（もしユーザー名が含まれていたらそこだけ○○に置き換えてもいい）

というか質問はこちらのほうがいいよー

【StableDiffusion】画像生成AI質問ｽﾚ11【NovelAI】
https://mevius.5ch.net/test/read.cgi/cg/1684577389/

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:52:48.18

>>856
そういうのは質問スレの範疇

ちなみに「input path is not a directory」とエラーが出てる時点で
ディレクトリの指定そのものが間違ってる

まあよくあるのは / と \ の間違いかなー

あとはダブルクォーテーションが混じっていたりとか

いずれにせよどういうパスを設定してるのかが分からない事には返答しようがないです

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:53:32.27

>>871
どうかねえ。今の技術は辞書から似てる波長を選んでるだけで、言語や声質なんかの観点での解析はしてないからねえ
SDで文字なんかが別物になっちゃう理由に近いけど

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 11:57:36.39

>>871
精度の高いAIボイチェン（RVC）は実用化されているね
「声に権利はないから」という理由で学習記録したデータを販売しようとして差し止め喰らったりしている

”某お嬢様キャラ”AIボイチェン販売で出品者「権利上の心配は無い」も運営により強制非公開へ
https://0115765.com/archives/28307

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 12:02:17.16

>>872
>>873
ありがとうございます。
紹介いただいたスレに行ってみます！

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 14:05:03.60

>>829
九九覚えたばかりの小学生が複素積分の話に出しゃばってきて「そんなことあるわけねえよｗｗｗ」と言ってるような状態だからそもそも技術論にならねえ

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 14:59:45.55

>>875
ハイエナみたいやね…

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 15:56:53.84

今は声や顔を盗む程度だからまだ流石にそれは違法だろって抵抗できるけど
そのうちAIの進化で話しの内容とか文章の癖とかもコピーして盗めるようになって収拾不能になるだろうな
金持ちイケメン以外にはいかなる権利もない社会になるしかないと思うマジで…

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 17:07:24.05

だからハリウッドでストライキする必要があったんですね
いやほんと、これからもAIで遊べるように人権関連は適切な規制を掛けてほしい

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 19:04:25.63

コミケでモデラーの人らが言ってた内容が印象的だった
「AIでメカやガンダムを生成すると
•トリガーに指がかかってない
•関節がプラモ関節(特に腰が顕著
•酷いやつだとボールジョイントみたいなものを生成する
などなど不満点が出てくるから、これに満足しているAI術師もAIを恐れる絵師も自分には理解出来ないって言ってた

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 19:11:24.23

そういう話はなんで修正しない事を前提としてるのか全く理解できない

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 19:21:56.66

>>882
某すくらっぷ含めてAI術師側が全く修正出来てないかららしい

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 20:02:54.69

正確精密であることが問題点ならそうなんだけどなあ
これも正しいようで正しくない話に見える

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 20:21:42.03

実にAI絵的な話だ

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 20:23:52.23

>>881
AI出力物が学習データに入るとモデルが劣化する原因のひとつなんだろうな
AIイラストはどうしても細部が破綻してしまうから

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 20:37:41.01

>>881
エロ画像とかでも同じこと言うと思うぞ
指が変だとか穴の位置があってないとか女の子に棒が生えてくるとか

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 20:44:10.03

>>887
それは自分も思ったから質問したけど、
エロ絵みたいな破綻ではなくて
明らかな『模型』の要素が入るらしい
自分も試しにガンダム絵が安定しているnijiで生成してみたけど
たしかにガンプラみたいなグーの手にライフルもったロボが出て来た

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 20:52:31.11

>>888
なるほど絵だけじゃなくてプラモデルの写真も学習記録しているから
両者を混同したままコラージュ（合成出力）してしまうんだな

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 21:20:07.59

>>889
メカ描ける絵師が少ないうえに描き上げるまでに時間がかかり過ぎるからガンプラの画像の方が下手したら多い可能性はあるよな

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 21:29:36.93

最近LINEの漫画で毎週150P以上のカラーを休載ゼロで連載してる漫画がチラホラあるんだけど
全くAI絵に見えないけどやっぱAI使ってんのかな？だとしたらほんとに人間の時代は終わりなんだな
読者が異常なボリュームに慣れてしまって他の漫画にP数少ないって文句がしょっちゅう書かれるようになってる

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 21:39:27.14

マンガとうの昔からキャラが３Ｄモデル丸出しなものも増えてるし、言い出したらキリ無い

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 21:51:36.67

SDXLのWebUIのControlNetっていつ頃でてくるんだろう結構かかるのかな

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 22:22:50.16

>>825
虚偽情報
SDはそんなこと一言も言ってない

こういう販AI活動は反吐が出るな

　まぁ、反AIは率先して無断頒布しまくってる連中だから当然か

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 22:26:45.38

>>826
一発アウトかどうかはわからんな
少なくとも個人の範疇なら100％セーフ保証されてるし

ぢ●ま某に「大垣脱がしてもいいよ」ってあ●ろが許諾出せるなら、同じレベルのエロをAIで出してもあ●ろは許容するしかなくなる
もちろん、収益の多寡も絡むから単純ではないけど、基本的には大垣はマイクロビキニはすでに許容されてるとみなしていいだろうよ、ぢ●ま某が表紙にしてるくらいには

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 22:32:01.81

>>895
>>827でも突っ込まれているけど著作権法は親告罪だから
許容されるかどうかは権利者次第やで

公開せずに個人利用ならそもそも関知されないから安全だろうけど

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 22:35:58.64

>>827
>性被害にしても著作権にしても友好的な関係を築けている人と悪印象を抱いている相手とじゃ
>許容できる範囲が違うのは当たり前なのに
爆笑

じゃんぽけ斎藤君がこの術にはまってるね
相手女性と親密になったと思ってたら、あっさりフライデーに告発されてしょぼん
普通に考えたら、

　斎藤君が親密な関係にあったわけじゃなく、女性がだます企図だった(無意識でも)

って判断されるわなぁ、斎藤君が訴えたら
つまり、作家Aが無断頒布作家Bにαの追認を、Bと公に対して明示せず出したなら

　作家Aは無条件にαを追認すると市場が善意判断したらからαまでは全員セーフ

って判断になっちゃうんだよ

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 22:42:24.23

>>832
AIは非可逆圧縮の技術を使って情報の圧縮置換を行っている

非可逆圧縮は、非可逆にする部分をホワイトノイズに置き換えることで情報の圧縮を図っている
ホワイトノイズってのは、「情報としてはなんでもいい」という意味
だから、復号の際にどうやっても「(追加された)なんでもいい」の部分が情報に乗っかってくる

AIはこの「なんでもいい」の部分をあいまいな判断として利用するから、ポーズが違ったり語順が違ったり注目度が違ったりするバリエーションを受けている
今のところ、SDでもそうだしchatGPTでもそうだけど、この非可逆圧縮のホワイトノイズ部分をゼロという定数に固定すると、全く使えないものになる
学習結果がCPに反映されなくなるからね、全てゼロ倍にしちゃうから

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 22:44:57.35

>>836
完全なノイズ化ではないんだけど、ホワイトノイズ付加は行っている
疑うなら数学論文みてこい
特に、非可逆圧縮に関する論文をな

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 22:46:18.44

>>838
復唱になるが・・・
完全なノイズ化ではないんだけど、ホワイトノイズ付加は行っている
疑うなら数学論文みてこい
特に、非可逆圧縮に関する論文をな

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 22:50:54.00

>>825
huggingfaceの解説わかりやすいな
tile diffusionみたいなタイル合成をそもそもSD自体がやってるのか

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 23:01:44.40

非可逆圧縮の蘊蓄

たとえば、16itの情報を上位8bitに圧縮してデータを半分にすると、16bitに復元するとき下位の8bitはもとにもどせない
この時、単純に切り落としているように見えてるそれは、

　数学論的には「なんでもいい値だからとある未知不定数Xに置き換えて棄てればいいよね」となる

で、復元するときは

　数学論的には「棄てられてた部分は未知不定数Xだったから、乱数でいいよね」

ってなる
ここで「棄てられてた部分は未知数Xだったから、０でいいよね」ってやっちゃうと、

　Xが定数という定義が発生し、Xが未知不定数だから捨てたという前提と矛盾する

だから、非可逆圧縮時は、圧縮後のデータに計算過程でノイズを必ず付加しないとまともなものが復元できない

pcmなどの音声データの場合は、8bit下位を0にしても「そもそもスピーカーが再現できない(スピーカーと耳との間に空気という混濁を招く原因がある)」ので無視できる
しかし、画像データの場合は人間の眼の優秀さゆえ、8bit下位を0に固定すると、却ってジャギや段々化が露呈してっ劣化が激しくなる
この場合、復号時に8bit下位を乱数化したほうが、人間の眼には心地よく見えるというわけである

AIもやってることは同じ
だから、
・元学習データの概念の一部を乱数として切り落としている
・復元時は学習済みデータに乱数が必ず乗っかってるので、元データは天文学的確率を経ないと再現されない
となる

覚えておきましょう

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 23:03:01.85

>>901
バカでもわかるその解説は、数学論理を語ってない
あれで分かった気になっちゃってる時点で、草

**名無しさん＠お腹いっぱい。** · 2023/08/20(日) 23:03:15.64

webuiのコントロールネットとkohyassのDreamboothってまだ来てないのか
思った以上に時間かかってるな

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 05:15:06.99

ところでコラージュ主張は
損失関数がloss = mse(unet(latents + noise, txt_enc),noise)なのをどうやって画像そのものをそのまま記憶してるって数学的に説明するんだろう？

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 05:25:34.96

ノイズ君、なんか涙目で必死に調べてきた感があるけどやっぱり解釈間違ってる。可哀想な奴だな

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 06:58:29.04

なんで「ノイズ化して劣化保存」とかいうトンデモ論から高域調整用のノイズ付加の話にシレッとすり替えてるのか
>覚えておきましょう
このキメ台詞からア○が滲み出てる

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 08:54:05.52

AIの進化が止まることはないんだからいずれはあらゆるものは法規制すり抜けてコピー可能になる
国家権力に保護された土地・金・地位にしか価値がなく労働者に人権はない社会は確実に来る訳で
どこまでがOKかの論議って意味ないよね、支配階層以外はいずれは全部AIに食われるんだから

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 10:05:40.19

https://asset.watch.impress.co.jp/img/pcw/docs/1524/854/g16.png
https://pc.watch.impress.co.jp/docs/topic/feature/1524854.html

GeForce RTX 3060(12GB版))のAI画像生成つえーな

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 10:27:24.40

GeForce GT 1030(4GB版)のAI画像生成つえーな

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 11:53:05.78

アメリカじゃAIバブルは弾けかけ
ソフト側はほほ死亡
ハード側の需要はまだあるけど

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 12:00:49.89

米もうAIオワコンになりそうなのかよ
まあAIAI言うてただの合成ツールだしもう一押し革新的な何かなけりゃそうなるか

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 12:04:59.71

バブルになる要素ねえだろw
開発してる巨大テック企業以外は使えば使うほどクビ切りになるんだから

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 12:27:27.84

AIつか拡散モデルは将来性無いな

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 13:23:19.23

>>912
マジ？メタバースより終わるの早くね？
AIサービス提供する費用に対し利益が少なすぎるとは言われてたが

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 15:12:07.38

毛唐は権利に敏感､すぐ訴訟で巨額賠償だから
文章はともかく似た絵なんて商業でおいそれとは使えないから割れ扱いらしいぞ

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 15:52:19.32

>>911
AIバブルが弾けたのはMSやグーグルやNvidiaの大手が利益独占するのが明確になったからじゃん
関連ビジネスが花開いたりしないって意味ではそうだけどAI市場の売上自体は爆発的に伸びてる最中だろ

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 15:58:32.05

負のプロンプトが使える拡張。面白そうじゃね？

ttps://github.com/hako-mikan/sd-webui-negpip

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 16:08:29.25

>>889
昨日のAIがメカとプラモの区別を出来ない話
タイムリーなことにAI加筆の作例を反AIに凸されたスタジオぬえの加藤直之がそれっぽい解説してくれてるな

ロボットの絵を描くとき、僕は何を参考に描くのか。

例えばごく身近にある、自動車。ボンネットをあければフレームの中にぎっしり詰まっているエンジン部品。冷却器やパイプ、エアフィルター、バッテリー。それぞれをつなぐ配線。こういったものを（それぞれの形や役割を頭の中で再構築します

https://x.com/naoyukikatoh/status/1693469265293398047?s=46&t=D9BRbmyKL5T1-_0DJddCLA

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 16:22:05.10

あとメカイラスト生成のトリガーとポリキャップ問題はプラモの写真だけじゃなくてpixivに大量にあるプラモのレタッチとトレス絵も原因っぽい
他人のガンプラの写真をトレスしてたのがバレて炎上したガンダム絵師も居たから『タグ分けされてないガンダム絵ではなくガンプラ絵』のイラストがかなりありそう

https://x.com/seskou/status/852078927522738176?s=46&t=D9BRbmyKL5T1-_0DJddCLA

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 17:09:42.19

AIは考える力がある訳じゃないから学習素材に混じったノイズに凄く弱いんだよなぁ
長い橋TOP10を教えてくださいみたいな簡単な質問でもアフィがたまたま氾濫してるお題だと
BingもChatGPTもアホみたいに間違った回答してくる

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 17:50:32.83

3ヶ月前にRTX3060を買って生成してたけど、結局速度に満足できずに4090買っちゃった
1/4くらいの時間で生成出来て幸せなんだけど、真横に温風ヒーター置いてるレベルで熱風出てくる

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 18:13:07.87

>>918
なんで今までなかったのか
LORAのマイナスはあったのに

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 18:29:52.81

>>919-920
面白い

>>766の動画でも語られているけれど
自ら興味を持って学ぶ訳じゃないからプラモデルとロボットの絵の違いも気にならない
受動的に紐付けられた語句と画像を関連付けるだけの「記録」（コピー機の延長）でしかないんだろうな
（それでも技術の進歩としては相当のものだが）

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 21:15:03.73

>>918
child:-2にしてもBBAにはならんし、mature female:-2でも子供にならん

熟女はどうしたら出るんだ

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 21:26:33.57

>>924
danbooruでタグ付けた奴とプラモトレスしてた絵師がプラモデルとメカの違いを理解してなかったのが原因だよな
pixivでプラモのレタッチ絵にはレタッチタグ付いててもdanbooruでは消失してるし、こいつらがもう少し高い精度でタグ付けしたりイラスト描いてればこんな事にはなってなかった

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 22:40:25.62

>>925
negpipは今までのネガティブや負の強調だと反映がいまいちだからネガティブの適応手法を新しく提案してるものであって、そのままマイナス適用するっていうのとは少し違う
たぶんだけどそもそもCLIPの単語ベクトル空間がWord2Vecとは違って単純に単語計算しても想定される結果が得られないらしいので対象のベクトルがマイナス方向に適用されるというより減算されるだけになるんだと思う

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 06:50:54.88

真面目にベクトル演算されてるならマイナスすべきはvitalityとかyouthだろうけど、今のプロンプト見る限りそこまでやってないよね多分

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 07:06:49.20

ベクトルってイメージジェネレータと紐づけするためのブラックボックス的な存在であって
プロンプトの特定の値の正負を逆転して生成したらその値に相当する画像の性質が逆転するなんてことには全く繋がらないと思ってるんだが違うんかな？

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 07:17:05.31

本来のword2vecなら例として良く出る
王-男+女=女王
みたいな演算が出来るけど、SDのプロンプトはそこまできっちりやってなさそうだよね

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 07:48:04.66

最近は日本の大手まで有名絵師の丸コピーLoraを勝手に商業絵に使ってんな
手描きだとちょい構図似てるだけで謝罪から差し替えからの絵師追放コンボなのに
AIだと標的にされた絵師の絵を完コピしてもOKとかAI無罪の風潮が凄すぎるな

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 08:17:03.54

AIの前に田中圭一が問題にならない理由が知りたい。公認じゃないよね？

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 09:03:30.58

>>932
田中圭一と手塚るみ子は仲良くしてるから
実質公認してるに等しいのでは

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 09:30:34.33

問題の事件起こしたのは個人じゃなくて銀〇伝とかビビ〇ドアーミーとか出してるガチの大手だからな
それが国策であるAI推進を盾にすればスルーされるんだから凄い話だ

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 09:43:47.37

>>933
ありがとう。そうなのか。よくあの内容で目溢ししてるな

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 09:45:45.71

>>929
ベクトル演算できることを目的にプロンプトをベクトル化してる訳だから、つながるようにがんばってるってことじゃろ。
実際そこそこつながってると思う。

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 10:14:46.92

>>922
冬暖房になるからええやん

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 10:38:25.66

>>932
絵柄は著作権で保護されないからだよ

ビビッドアーミーの広告にどう見てもあのイラストレーターの絵柄という絵が使われていても、本人の絵をそのまま使ったのではなく絵柄が同じというだけでは少なくとも著作権侵害にはならない

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 10:38:54.28

田中圭一が鉄腕アトムの絵を商業誌に載せたり、手塚の名前で作品を発表したりしたら商標権の侵害になるけど、そこまではやってないでしょ

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 10:55:36.04

AnimateDiffを試してるんだけど、RTX4090でも解像度低い画像で3秒くらいしか作れないのね
結構解像度高くて長いアニメーション作ってる人はローカル環境じゃなくて、AWSとかGoogleとかで100GB超えのVRAMでやってるのだろうか

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 11:22:15.22

誰が見てもジョジョだと分かる絵で勝手に商売したらいけないように
誰が見えても石恵のコピーだと一目で分かる絵で商売して言い訳がない
それも人力ではトレスしても不可能なレベルの完コピーだし人間がやったら一発引退もの

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 11:49:06.73

石恵ってなんじゃらほいとググってドン引き
おまえらの興味って常にこういうのなのなｗ

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 11:53:43.59

技術の発展には戦争とエロが大きく関わってるからしゃーない
やはり本能には逆らえん

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 11:54:19.60

うん、漫画やアニメ、ゲーム等に存在するキャラそのまんまか
それに近いとかならその通りだね

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 11:56:56.55

二次創作で稼いでる人が絵柄盗まれたのか

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 12:05:42.17

>>943
エロの問題じゃねーよ、センスの問題だよ
キモ過ぎる
それがわからないおまえもお仲間だｗ

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 12:07:43.89

>>941
> 誰が見てもジョジョだと分かる絵で勝手に商売したらいけないように
商標権の侵害やね

> 誰が見えても石恵のコピーだと一目で分かる絵で商売して言い訳がない
それはジョジョとは事情が違うよ
石恵のこの作品とそっくりな絵を広告に使っている、というのならわかるけど今回は違うでしょ
ほめられた話ではないけど絵柄が似ているだけでは権利の侵害にはならないよ

参考：
知っておきたい写真著作権　「似ている」と「侵害」の距離
https://forbesjapan.com/articles/detail/37958
自民党改憲ポスター「Noritakeさん作風に酷似？」→制作の電通「参考にしてない」 - 弁護士ドットコム https://www.bengo4.com/c_23/n_10650/

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 12:09:34.40

>>727
みたいな石恵の絵を矢吹健太朗だと勘違いしてるノータリンなアホもいるくらいだから
マジでお前ら絵柄とか漫画家とかイラストレーターとかまったく興味ないだろ

AIイラストが合法なのに印象悪いの
目立ってる奴らが絵描きにルサンチマン拗らせすぎた無産だらけってのも原因だと思うわ

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 12:32:14.25

特定のキャラを流用するのはアウトだが、よく似た絵柄はセーフ

極端な話、荒木タッチの絵で勝手に新作漫画を書いて売ってもOKだが、どんなに下手くそでもjojoキャラを書いて売るのはアウト
それが市場に許容されるかどうかは、また別の話

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 13:23:18.03

SDXLでどのプロンプトでもどのモデルでも若手俳優みたいな日本人の若いイケメンを出せなかったから
身体は男だが顔は女なんだと指定したらうまく行った。何か釈然としない
ちなみにフランス人のハンサムマンを指定すると一発で出る。ずるい

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 17:16:23.52

>>938
スクリーンショットやスキャンを用いた流用画像には基本的に賠償命令が出ているので
依拠性が簡単に立証されてしまうLoRAを使用せずに再現できない場合は著作権侵害保護されるかはかなり怪しい

裁判なら著作権者がLoRA使用した類似画像をいくつか用意して
ビビッドアーミーのCTW株式会社側がLoRAを使わずに広告画像を再現できなかった場合
（もしくは証明を放棄した場合でも）手描きと同じ基準なら賠償命令が出る可能性が非常に高い