【Wan2.2】動画生成AI質問スレ3

1名無しさん@お腹いっぱい。 (ワッチョイ c20d-RaAf)
垢版 |
2025/11/18(火) 02:06:17.22ID:+eBu+NBv0
!extend:checked:vvvvv

Wan2.2をはじめとする動画生成AIに関する質問用のスレッドです
次スレは>>980が立ててください。
EasyWan22に関する内容は下記関連スレを利用してください 質問する人はなるべく情報開示してください

質問する人はなるべく情報開示してください

・使っているアプリケーション(どこから/何を読んでインストールしたか)や使っている学習モデルを明記する
・状況の説明は具体的に。「以前と違う動画が出力される」「変になった」では回答しようがない。どう違うのか、どう変なのかを書く
・思うように生成されないときはその出力動画をhttps://catbox.moe/にアップロードしURLをここに貼る
・エラーメッセージはhttps://rentry.co/に書いてURLをここに貼る
・ローカルならマシンの構成(GPUの種類は必須、VRAM容量やメインメモリの容量、CPUの種類もなるべく)を書く

関連スレ
【EasyWan22専用】動画生成質問スレ 2
https://mevius.5ch.net/test/read.cgi/cg/1759780410/

前スレ
【Wan2.2】動画生成AI質問スレ2
https://mevius.5ch.net/test/read.cgi/cg/1757715153/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
202名無しさん@お腹いっぱい。 (ワッチョイ 8761-CVzB)
垢版 |
2025/11/25(火) 23:20:22.16ID:peQwV6yG0
>>201
動くか動かないかで言うとうちでは動いてるよ
RTX 5090, CUDA 12.9, Python 3.10.11
sageattention 2.2.0+cu128torch2.9.0.post3
torch 2.9.1+cu128
triton-windows 3.3.0.post19

Stability Matrixを使ったから特に苦労無し
203名無しさん@お腹いっぱい。 (ワッチョイ 8761-CVzB)
垢版 |
2025/11/25(火) 23:26:30.61ID:peQwV6yG0
>>202
ComfyUIは複数環境あるんだけどvenvがPython 3.12.11の環境はtritonのバージョンが違った
triton-windows 3.5.0.post21
他は同じ
204名無しさん@お腹いっぱい。 (ワッチョイ dfe7-j3nM)
垢版 |
2025/11/25(火) 23:34:20.39ID:X9f7yxy50
今のとこstable diffusionでの画像生成しか手をつけれてない初心者なのですが、LORA学習とかで今のGPU(3060ti・VRAM8g)で非力でクッソ時間かかるのでGPUの更新を検討してます。
で、将来的には動画生成もやってみたいとは思っているのですが、GPU以外のスペックがPCIe4.0とDDR4メモリ32Gしかないんですがこれで動画生成ってできますかね?(最近メモリの値上がり酷すぎんだろ・・・)
動画生成も出来そうならGPUを5070tiにしようと思うのですが、無理そうなら大人しく画像生成専用で5060tiのVRAM16gにしようかなと・・・
動画に関しては時間がかかっても生成できればいいんですが、ちもろぐさんのブログ見てるとスワップ現象やらで最悪SSDの寿命をゴリゴリ削ってくらしいのでそれは避けたいです。
2025/11/25(火) 23:39:14.95ID:m0GjofLW0
>>204
スレチ
206名無しさん@お腹いっぱい。 (ワッチョイ 8761-CVzB)
垢版 |
2025/11/25(火) 23:42:47.72ID:peQwV6yG0
>>204
PCIeとDDRは4で問題ないよ
PCIe 5.0とDDR5に変えてもメインメモリ→VRAMの転送速度が上がるだけなので処理時間全体では数%短くなる程度の差しかない
メインメモリ32GBは動画生成では最低レベル、いろんなことをやろうとすると不足を感じると思うのでできれば64GBは欲しい、128GBあれば今はほぼ問題ない
32GBでもQ3くらいの圧縮度の高いGGUFモデルを使って解像度とフレーム数を抑えればスワップなく動画生成はできるのでとりあえず試しにやってみたらいいんじゃない?
207名無しさん@お腹いっぱい。 (ワッチョイ 47ed-7i60)
垢版 |
2025/11/25(火) 23:44:52.53ID:cWrYIbOC0
>>204
メモリが無くてもSSDを犠牲にする覚悟があればなんとかなるよ。
うちの場合、退役した256GBのM.2 SSDを完全に仮想メモリ専用にしてある。
このクラスのSSDは何個も退役しているので、壊れたら入れ替える覚悟w
遅いのは受け入れるしかないね。
夜間などに処理する分には良いけど、プロンプトの調整なんかは結構な苦行になるだろうね。
208名無しさん@お腹いっぱい。 (ワッチョイ dfe7-j3nM)
垢版 |
2025/11/25(火) 23:57:32.25ID:X9f7yxy50
>>206 さん >>207 さん 回答ありがとうございます。やっぱりキツそうなんですね・・・ EasyWan22をインストールしたのとは別のSSDを仮想メモリに割り当てるってことなんですかね。ちょっと調べてみます
2025/11/26(水) 00:11:36.80ID:OX9fa0/X0
>>208
最近まで、VRAM8GB(RTX2070s)、RAM32GBで使ってたけど、SmoothMixのGGUF Q4KSで割と普通に動いていたよ。
あと、EsayWanは高機能だけど重くて、最近のComfyUIで使える高性能なメモリ管理も使えないんで、ポータブル版かstability matrixから入れ直した方が良いぞ。
210名無しさん@お腹いっぱい。 (ワッチョイ 0740-j3nM)
垢版 |
2025/11/26(水) 00:13:23.25ID:SONSMB/U0
お前らにちょっと良いこと教えたるか
pcie gen7になったらパソコン絶対に買い替えろよ
もう2度は言わねえからな
211名無しさん@お腹いっぱい。 (ワッチョイ 0740-j3nM)
垢版 |
2025/11/26(水) 00:27:27.47ID:SONSMB/U0
rtx 6000シリーズ150万も出せねえよ!
ってやつはpcie gen7に絶対に変えとけ
以上
212名無しさん@お腹いっぱい。 (ワッチョイ 0740-j3nM)
垢版 |
2025/11/26(水) 00:28:58.34ID:SONSMB/U0
すなわちエヌビディアが暴落するときでもあるからな
まぁここに株やってるやつはいねえだろうがな
213名無しさん@お腹いっぱい。 (ワッチョイ dfe7-j3nM)
垢版 |
2025/11/26(水) 00:46:27.66ID:zY+rk/f70
>>209 情報サンクスです 検討してみます
214名無しさん@お腹いっぱい。 (ワッチョイ 27db-CVzB)
垢版 |
2025/11/26(水) 04:27:37.44ID:P0jefl4A0
>>142
easywanから卒業するのに初心者でもわかりそうなワークフローって何かあるんですかね?
215名無しさん@お腹いっぱい。 (ワッチョイ 5ff7-nnTA)
垢版 |
2025/11/26(水) 06:06:01.99ID:uPVT4ase0
初カキコ。stable diffusionをたまたまゲームちょこっと出来ればいいかって買った4070ti ram32gbで動かして、面白さで動画生成にも興味持ってeasywan22入れて、なんかごちゃごちゃしてるなってcomfyUI でsmoothmix wan入れた後、エラー連発してここの過去ログ見ながらなんとか動かせるまでに。ほんとここのスレ民には感謝しかない。

ggufのQ8使ってるけど、使用メモリがssdまで漏れるから寿命考えて16×2を追加購入。64gbならもう少し快適になってくれると思いたい。
216名無しさん@お腹いっぱい。 (ワッチョイ 8788-IDt/)
垢版 |
2025/11/26(水) 10:18:36.80ID:gBTWs0fl0
>>202
ありがとうございます
Stability matrixで別環境にしてみます
217名無しさん@お腹いっぱい。 (ワッチョイ 4704-WIyy)
垢版 |
2025/11/26(水) 12:07:15.25ID:X/ldpMLU0
チビタイでいい感じの動画落とすとほぼ毎回違うワークフローが出てきて、その都度モジュール追加インストしてlightningのrank違いの物やloraを書いてある名前から検索して発掘してると毎回半日くらいかかる…
もっと簡略化するかできんかな?
2025/11/26(水) 12:53:58.86ID:twKg7E4J0
チビタイでX-Ray LoRAが外人どもに大受けw 日本のエロ文化はすごいのぉ
219名無しさん@お腹いっぱい。 (ワッチョイ 5fff-j3nM)
垢版 |
2025/11/26(水) 13:30:48.35ID:lxdlRBYP0
>>185
あるよ
同じサービス内でもVEO3.1モデルだけは乳首出しは生成後に弾かれたけどね
2025/11/26(水) 13:40:19.33ID:yk8kz3og0
>>217
最初だけよ
その内大体のファイル揃ってくる
WF無いファイル落としてくれるComfy便利だけど
LoRAとかUnetとかフォルダに移動してくれやとは思うけどね
2025/11/26(水) 15:11:44.13ID:mrEV4Yb30
>>214
自分はSmoothmixのワークフロー使っているよ
多機能の巨大なワークフローよりシンプルな小さめのワークフローの方が初心者にはいいと思う
222名無しさん@お腹いっぱい。 (ワッチョイ 4719-WIyy)
垢版 |
2025/11/26(水) 16:11:16.63ID:X/ldpMLU0
>>220
いやもう結構WFあるよw
動画だけじゃなく色々やってるせいもあってマジでセッティング大変だわ⋯
てかlightnIngってrank32,64,256もあるしI2V,T2VもあってWAN用だけで8つもあるけどなんでこんなにあるの?
2025/11/26(水) 17:27:34.17ID:08S5PT9C0
64GB2枚に32GB1枚を足して96GBにしたいのですが不具合とかありますか?
224名無しさん@お腹いっぱい。 (ワッチョイ 477b-7i60)
垢版 |
2025/11/26(水) 17:51:09.13ID:3Ar0Cf7o0
>>223
自作PCなどの場合はマザーボードの説明書を確認すると、メモリスロットの対応表があるので確認すること。
一般的な回答だと、チャンネルが不均衡になるとデュアルチャンネルアクセスからシングルチャンネルアクセスになってメモリアクセス速度が落ちる。
AIの用途だとメモリの速度はあまり問題にならないので、速度低下のデメリットより容量増加のメリットの方が大きいと思う。
もし動かなかった場合はさらに32GB足して128GBにする覚悟をしておくことが重要だろうね。
2025/11/26(水) 18:02:08.90ID:08S5PT9C0
>>224
ありがとうございます!そんな仕様があるんですね、奮発して128GBにしてみます
それか高額にはなりますが64GBの2つセットを買って128にすることも考えてみます
2025/11/26(水) 18:59:49.62ID:Uudr4zqH0
>>225
刺すスロット端から順に刺しているとか
マザボによって刺す順番が決まっているぞ
2025/11/26(水) 19:32:57.01ID:RUTUZ2AE0
デュアルチャネル無視の増設・・・wwww
2025/11/26(水) 19:36:46.77ID:08S5PT9C0
>>226
そうなんですね…
もう一つ質問したいのですがメーカーは別でもいいですか?
メモリ容量とメモリ規格とメモリインターフェイスは同じです
2025/11/26(水) 19:42:19.45ID:RUTUZ2AE0
>>228
DDR4? DDR5?
DDR5の場合は同一メーカー同一チップ(出来れば同一ロット)でないと
4枚挿しの場合は上手く動かいことが多い
(2枚挿しの場合は2枚セットを買うこと)
230名無しさん@お腹いっぱい。 (ワッチョイ 27db-CVzB)
垢版 |
2025/11/26(水) 20:03:43.61ID:P0jefl4A0
>>228
4枚は相性めちゃくちゃシビアだよ 別々にしてるほうが少ないっていうかそのレベルで増設するのか・・・
2025/11/26(水) 20:07:23.35ID:Uudr4zqH0
PC初心者スレで聞いた方が良いんじゃね
2025/11/26(水) 20:09:37.60ID:08S5PT9C0
>>229 >>230
BTOでしか買ったことが無かったので無知でした
DDR5になります
そこまで厳しいんですね…全く同じのが見つからなかった場合48x2か64x2で探してみます
ありがとうございました!
233名無しさん@お腹いっぱい。 (ワッチョイ 87f2-iYpt)
垢版 |
2025/11/26(水) 20:13:33.35ID:nKusmxGW0
>>232
DDR5の4枚挿しは速度低下しやすいけど動作しないほど厳しくないぞ
正しいことを言ってるかどうか分からん5ちゃん住人の言うことを信じるより自分で調べた方がいい
234名無しさん@お腹いっぱい。 (ワッチョイ 477b-7i60)
垢版 |
2025/11/26(水) 20:13:44.35ID:3Ar0Cf7o0
もし、2枚づつ違う違うロットorメーカーのメモリを刺す場合、チャンネルで揃える事。
意外と知られていないけど、メモリはチャンネル別にタイミング調整可能らしい。
チャンネルに挿すメモリは揃える事。
※CPUやチップセットで機能が変わってくるけど、基本はこれ
235名無しさん@お腹いっぱい。 (ワッチョイ 477b-7i60)
垢版 |
2025/11/26(水) 20:17:41.64ID:3Ar0Cf7o0
例えばDIMMスロットが、A1 A2 B1 B2 とある場合、2枚挿す時にA1 B1 に挿せと書いてあるなら、
A1 A2 が同一チャンネル。B1 B2 が同一チャンネルだね。
2025/11/26(水) 20:19:14.81ID:RUTUZ2AE0
謳ってる速度が出せない=上手く動かない ってことなんだけどなw

まぁ、2枚挿しの方が安心っちゃ安心
2025/11/26(水) 20:29:11.07ID:08S5PT9C0
>>235
今あるPCを見てみたらA1 A2 B1 B2と4つスロットがあってA2とB2に刺さってました
詳しくありがとうございました!
2025/11/26(水) 21:05:39.39ID:u2i15nZo0
メモリ増やすときはXMPについても調べてから買ったほうがええで
チャッピーに聞いたらええ
2025/11/26(水) 21:27:41.08ID:FHNdcUdj0
>>223
(64x2)+32=96?😳
240名無しさん@お腹いっぱい。 (ワッチョイ 070f-7i60)
垢版 |
2025/11/26(水) 21:56:22.71ID:ybMLtVi70
ローカルでWAN2.2を動かしたいんだけれど、ComfyUI以外でない?
241名無しさん@お腹いっぱい。 (ワッチョイ 87f2-iYpt)
垢版 |
2025/11/26(水) 21:59:57.80ID:nKusmxGW0
>>240
forge neo
2025/11/27(木) 11:54:59.39ID:vEsHIZaX0
プロンプトって言語何で書いてる?
面倒だから日本語で書いて翻訳ノード嚙ましてるけど
やっぱ最初から英語か中国語の方がいいかな?
AIに聞くと中国語より英語の方が効きやすいっていうけど
ネットだと中国語のが効くって人もいるよね
個人的には英語のが効く気がするけどほかの人はどうしてる?
243名無しさん@お腹いっぱい。 (ワッチョイ 5f77-Gjxk)
垢版 |
2025/11/27(木) 12:10:24.98ID:MyBdNvF60
他人のコピペで繋ぎ合わせ
244名無しさん@お腹いっぱい。 (ワッチョイ 6727-BvuA)
垢版 |
2025/11/27(木) 12:21:57.02ID:FEuQHOBz0
日本語は言語仕様が良くないので翻訳元の言語には向かない
245名無しさん@お腹いっぱい。 (ワッチョイ 87cc-CVzB)
垢版 |
2025/11/27(木) 12:34:10.24ID:Ng8rUlTD0
>>242
プロンプトの言語を気にする人がいるけどそれよりも文法が正しいかや主語を省略してないかといったプロンプトの品質の方が大事だと思う
Wan 2.xにしろ他の動画生成にしろテキストエンコーダー (UMT5) は多言語対応しているので
事前にGoogle翻訳やDeepLでプロンプトを英語や中国語に翻訳しても自分で修正せずそのままコピペするだけなら日本語で書いてテキストエンコーダーに任せるのと変わらないよ
246名無しさん@お腹いっぱい。 (ワッチョイ 87cc-CVzB)
垢版 |
2025/11/27(木) 12:41:57.36ID:Ng8rUlTD0
>>245
そういう理屈なので個人的には中国語のスキルは無いけど英語ならそれなりに自信があるので英語でプロンプトを書いてる
中国語にも英語にも自信が無いなら事前に翻訳するにしろプロンプトに直接書くにしろ主語や述語を省略しない翻訳を意識した正しい日本語で書けばいい
2025/11/27(木) 12:59:06.77ID:cY9wF8+a0
>>244
英語は語彙が少な過ぎて微妙な表現は全て同じになる
248名無しさん@お腹いっぱい。 (ワッチョイ 67e6-CVzB)
垢版 |
2025/11/27(木) 13:01:10.97ID:7A54btUP0
日本人特有の曖昧プロンプトを書くからうまく行かんのでは
249名無しさん@お腹いっぱい。 (ワッチョイ 67e6-CVzB)
垢版 |
2025/11/27(木) 13:01:44.82ID:7A54btUP0
「女性が服を脱ぎます。するとその・・・なんといいますか・・・ふふっ、分かりますよね」
250名無しさん@お腹いっぱい。 (ワッチョイ a7f4-Y1H3)
垢版 |
2025/11/27(木) 13:11:13.09ID:ig+wRq7W0
>>242
外国語ヨワヨワboyならそれでおk
ヨワヨワを克服しないと次のステージにはいけんし
実際に翻訳あった方がいい感じだし
2025/11/27(木) 13:13:03.22ID:cY9wF8+a0
>>248
曖昧と言うか英語は表現が無さ過ぎてどうやって暮らしているのか不思議なレベルだ
指の表現なんてほぼ無いし
だから日本語の単語が英文字でプロンプトになっている物も多いし
2025/11/27(木) 13:17:39.29ID:vEsHIZaX0
なるほど確かに言語云々より
そっちを疎かにするべきではないdのは確かにそう
ってなると自分で修正するのは手間なのでローカルLLM建てて投げる方が楽か
中国語は翻訳そのままだけど不自然な動作多くなる感じするんだよな・・
2025/11/27(木) 14:36:46.39ID:slwGJ5nI0
AIの為に中国語覚えにゃならんのか
中国発のモデルがかなり多くて中国語で運用する合理性はあるんだよな
254名無しさん@お腹いっぱい。 (ワッチョイ 873f-Gjxk)
垢版 |
2025/11/27(木) 14:36:53.98ID:SogmEQfb0
主語とか目的語とか所有格とか、AI的にはそういうの明示してくれないと困るんだろうな
2025/11/27(木) 15:18:38.30ID:Ba0OH2Be0
LLMノードを組み込んでプロンプト生成させればいい
256名無しさん@お腹いっぱい。 (ワッチョイ 7f99-Soof)
垢版 |
2025/11/27(木) 15:51:58.72ID:YYiR7cMy0
ところで 5090 坊やは変色をどうにかできたのか?
257名無しさん@お腹いっぱい。 (ワッチョイ 5f3a-j3nM)
垢版 |
2025/11/27(木) 15:56:57.43ID:jaa6uXbi0
昭和45年ごろのプロ野球中継の映像は日テレが保管しててクラシックとしてCSで放送するけど
当時は投手の後ろから映すセンターカメラが禁止されてて(秘術的に可能であったがサイン盗みを恐れたため)すべてバックネット裏カメラの映像なんだよね
1枚の古い写真から色付けて勝手に動かせるまで進歩したんだから、映像ソースがあるものを別アングルからの映像としてよみがえらせることも可能じゃない?
長嶋茂雄の選手晩年ちょっと前の1970頃のセンターカメラアングルの打席がぜひ見たいんだよね。引退する(74年)がバックネット裏カメラか真横からだけだから
755号756号の映像がセンターカメラで残ってる王と違いその映像がないので実態が分からんのよね。
2025/11/27(木) 16:09:56.74ID:vEsHIZaX0
このVLMいいな
https://huggingface.co/fancyfeast/llama-joycaption-beta-one-hf-llava
画像入力もできてエロプロンプトも生成できる
他に良いVLM知ってる人いたら教えて
2025/11/27(木) 18:02:25.93ID:bcgBUILj0
プロンプトに品質タグとか要りませんよね?
2025/11/27(木) 19:40:59.00ID:78J0teob0
Grokに画像渡すと良い感じにプロンプト作ってくれる
2025/11/27(木) 20:10:54.80ID:Ba0OH2Be0
>>258
VLMと言っていいのかどうか分からんが、
LM-studioでqwen3-v1-30b使ってる
画像入力可能
あと、gemma-3-27bも中々いい
262名無しさん@お腹いっぱい。 (ワッチョイ 5fff-j3nM)
垢版 |
2025/11/27(木) 20:37:04.05ID:nw2/b8Yn0
>>242
一般的には英語の方が表現の強さの優先順位決まっててわかりやすくていいと思うけどね
まあどのみちwan2.2なんてざっくりだから細かい指示してもしゃあないけど
致命的な破綻はめったにないけど、どう指定してもよう似た動きで、やるかやらないか、汁出るかでないかの違いしかないからな
2025/11/27(木) 20:43:25.47ID:b5Dgjssl0
wan2.2でええやんと思ってたけど
最新のクラウドサービスのブロンプト追従度の良さに触れるとダメじゃんってなってしまう
2025/11/27(木) 20:50:06.10ID:Ba0OH2Be0
Wan2.2も高速化Lora通さなければそこそこ追従性も動きもいいのよ・・
どっち(品質 - 生成速度)を採るかで変わってくる 悩ましい
265名無しさん@お腹いっぱい。 (ワッチョイ 87cc-CVzB)
垢版 |
2025/11/27(木) 21:03:41.13ID:Ng8rUlTD0
>>263
エロを生成しないならVeo3/Sora2/Grokのどれかを使えばいいよ
エロを制限なく生成できるのがローカルのいいところだよ
266名無しさん@お腹いっぱい。 (ワッチョイ 7f99-Soof)
垢版 |
2025/11/27(木) 22:50:07.48ID:YYiR7cMy0
色彩に関しては英語は最低なんだが?
また、微笑みなんてのは英語にはないことだぞ。
まぁ、お前らは日本人かもしれないが日本語を理解できてないだけのことであろう。
267名無しさん@お腹いっぱい。 (ワッチョイ 87cc-CVzB)
垢版 |
2025/11/27(木) 23:26:20.30ID:Ng8rUlTD0
こいつ前スレで暴れてた荒らしなのでNGと無視でよろしく頼む

ワッチョイ 7f99-Soof
ID:YYiR7cMy0

949: 名無しさん@お腹いっぱい。(ワッチョイ 6e99-juqw) 2025/11/16(日) 18:28:07.64 ID:8s3w1hfu0
私が RTX-2070Super(8GB) という生成では地雷の GPU で無問題に FLF できているのに
RTX-5090 の輩が何故変色してる、それは昔から言われている
「馬鹿は何やってもダメ」ってことだろ。

984: 名無しさん@お腹いっぱい。(ワッチョイ 6e99-juqw) 2025/11/19(水) 00:22:14.10 ID:Lq0yEJKO0
「俺って RTX-5090 もってるんだぜ」でマウントとった気分なのだろうが
それで「変色してます、困っています」で見知らぬ他人に泣き言いっているのは、いささかアレすぎるだろ。
まだ、それが 4GBなVRAM でなら同情の余地があるぞ。
その RTX-5090 の価格ってのはな貧困家庭の一年の生活費と同等なんだぞ。
人生考えなおせ。

988: 名無しさん@お腹いっぱい。(ワッチョイ 6e99-juqw) 2025/11/19(水) 00:52:23.73 ID:Lq0yEJKO0
ようやく 5090変色坊やが釣れたか。
それでお前ら、変色はなくせたのか?
煽り返すなら少しは具体例をだせよな。
俺様はすでに具体例をだしたぞ。
2025/11/28(金) 00:45:45.41ID:kG2IaFow0
>>261
そこらへんはエロ出力無理なんでは?
269名無しさん@お腹いっぱい。 (ワッチョイ 7f99-Soof)
垢版 |
2025/11/28(金) 01:32:14.81ID:Ws+KspY70
アレな中学生程度の文章しか書けない、実年齢40歳以上の奴が
高齢な両親の年金を使い込んで 5090 買ったんだろ。
いい加減目をさませ。
いつまでもあると思うな親の年金!!
2025/11/28(金) 02:47:43.48ID:UDuTdW7m0
さっそく >>269 が釣れてる件
心も財布も貧しいことよ
271名無しさん@お腹いっぱい。 (ワッチョイ 5f8f-Gjxk)
垢版 |
2025/11/28(金) 06:02:13.91ID:EcKxHN0Q0
TikTokとかの動画の服脱がせるワークフローえぐいな
272名無しさん@お腹いっぱい。 (ワッチョイ bf97-WIyy)
垢版 |
2025/11/28(金) 09:04:19.15ID:tijXwKX70
>>249
www
273名無しさん@お腹いっぱい。 (ワッチョイ 8770-CUg+)
垢版 |
2025/11/28(金) 12:01:10.36ID:OpLWli1w0
>>255
Geminiのapiだとエロ弾かれるっぽい
なんか良い解決法はないものか…
274名無しさん@お腹いっぱい。 (ワッチョイ 8743-CVzB)
垢版 |
2025/11/28(金) 12:16:51.09ID:/IN87eKs0
>>273
そら、そうよ
ローカルにNSFWがOKなLLMを構築すればいいんだよ
275名無しさん@お腹いっぱい。 (スッップ Sd7f-Qhq3)
垢版 |
2025/11/28(金) 12:18:20.97ID:xp6zPmqSd
comfyは今のバージョンだと日本語も解るから日本語でしか書いてないな
2025/11/28(金) 12:19:47.35ID:TwJ/0OYf0
>>275
comfyUIのバージョンと日本語理解は関係ないぞ
そんな思い込みどこから出てくるのか
277名無しさん@お腹いっぱい。 (ワッチョイ 8743-CVzB)
垢版 |
2025/11/28(金) 12:26:53.90ID:/IN87eKs0
>>276
ワークフローを拾って使ってるだけの人の認識なんてそんなもんだよ
それぞれのモデルの役割も分かってない
2025/11/28(金) 18:46:58.79ID:TwJ/0OYf0
>>277
なるほど、WF拾ってくるだけの無能ならありえるか
2025/11/28(金) 19:13:05.78ID:cdAnTd6B0
プロンプトの日本語やその他多言語を理解して動画生成に落とし込むのはCLIPモデルじゃないの?
280名無しさん@お腹いっぱい。 (ワッチョイ 8793-iYpt)
垢版 |
2025/11/28(金) 19:32:48.06ID:/IN87eKs0
>>279
そうだよ
動画生成や最近の画像生成はCLIPではなくテキストエンコーダーを採用してることが多いけど
281名無しさん@お腹いっぱい。 (オッペケ Sr3b-ZHdg)
垢版 |
2025/11/28(金) 20:18:14.78ID:Ts1bsKLCr
z-image-turbo君まあまあ普通にnsfw吐き出すな。
ガッツリ行くのは無理ぽいけど
282名無しさん@お腹いっぱい。 (オッペケ Sr3b-ZHdg)
垢版 |
2025/11/28(金) 20:18:16.25ID:Ts1bsKLCr
z-image-turbo君まあまあ普通にnsfw吐き出すな。
ガッツリ行くのは無理ぽいけど
283名無しさん@お腹いっぱい。 (オッペケ Sr3b-ZHdg)
垢版 |
2025/11/28(金) 20:23:24.40ID:Ts1bsKLCr
スレチやったわすまんな
284名無しさん@お腹いっぱい。 (オッペケ Sr3b-ZHdg)
垢版 |
2025/11/28(金) 20:28:34.39ID:Ts1bsKLCr
kijaiのanimate-fp8-scaleで動かしてるが動画進むにつれ画像がガタガタになるのはみんなそんなもん?
それとも他のとこイジればちゃんと安定する?
2025/11/28(金) 21:26:21.60ID:7M+w6H3F0
>>284
Kijai氏フローを基本にすればそんなガタガタとか起きないぞ
それとも参照画像が特殊なのかな?
(アニメ系は不得意)
286名無しさん@お腹いっぱい。 (ワッチョイ 5f65-BvuA)
垢版 |
2025/11/28(金) 21:38:47.39ID:8bDtCeAs0
>>284
アニメ系は不得意、どうしても人物が崩れるときはmovingモード(モーションだけコピーするモード)にすると少しマシになるよ
287名無しさん@お腹いっぱい。 (ワッチョイ 5f65-BvuA)
垢版 |
2025/11/28(金) 22:00:03.45ID:8bDtCeAs0
>>284
kijai氏のWFだとVRAM少ないと解像度高く出来ないからanimateのモデルとTEをGGUFにして節約して解像度高くするとか。
解像度低すぎると画像がガタガタになりやすい。AIおじさんのWFだとSAM2で人物を自動マスクしてくれるらそれを試してみるのもいいかも
2025/11/28(金) 22:35:18.92ID:saQ0TfbV0
>>262
英語圏のリアクション系ユーチューバーを見ていると
なぜAIが日本人だけを生存させるべきと答えたのかが分かる
あいつらの殆どは◯◯みたいだ、◯◯で見た、◯◯のようだと言う
日本人からすればパクっていると言われるようもの
語彙と表現が貧弱だから何かに例える事しか出来ない
289名無しさん@お腹いっぱい。 (ワッチョイ 674b-j3nM)
垢版 |
2025/11/28(金) 22:57:06.25ID:eh2UyS+g0
>>285-287
皆さんありがとう。
参照画像は実写で解像度はちょい粗目。生成動画の解像度は432x768or576x1024で基本的にMoveモードでの運用だけど数秒立つと体と顔のディティールが崩れちゃうんですよね。
RTX4090 VRM24GB 環境だからVRAM多いわけでもないけど特段少ないってわけでもないつもりなんですけどね…。
なんなら量子化してない公式モデル使おうかと考えてたくらいでしたがみんなはkijai氏のモデルで問題ない感じなんですね。
参照画像を一回アップスケールしてからとかでやってみます。
2025/11/29(土) 07:18:04.55ID:wHmcDNhl0
ウチはLightning 4stepじゃないと顔崩れるからもう諦めて4step使ってるわ
2025/11/29(土) 10:08:28.18ID:NLA5wol90
>>289
285だけど、元投稿に「kijaiのanimate-fp8-scale」と書いてあったんで、
Kijai氏のモデル使うならフローはKijaiフローの方がいいって書いたんだけど、
Nativeモデルもあるのでその場合はNatibeフローでも全然問題ない
てか、直近は動画関連はNativeフローの方が省メモリなのでNatvieの方が有利
AnimateもNative版なかなかいい
(オレはかなりフロー変更して使ってるが)
292名無しさん@お腹いっぱい。 (ワッチョイ 674b-j3nM)
垢版 |
2025/11/29(土) 19:01:01.17ID:X3wdUAdA0
>>290
lightning loraを外すってことは考えてなかったので試してみます。

>>291
nativeモデルで動かすのはちょっと試してみたいと思って気になってます。
native flowってのはcomfyuiのテンプレートにあるワークフローのことですか?
軽く調べていくつかcomfyui公式っぽいものを見てみたんですがkijai版のfp8_scaleモデルをつないでたのでなんか違いそうだなあと思い。
2025/11/29(土) 19:16:41.15ID:NLA5wol90
>>292
フロー付き
よければ試してみて
オレ環も4090なので(メモリ容量的には)動くとは思うけど、
もしダメそうならfp8モデルで

https://files.catbox.moe/e7z0qu.mp4
294名無しさん@お腹いっぱい。 (ワッチョイ 877f-Gjxk)
垢版 |
2025/11/29(土) 19:40:33.20ID:FznQ9JgZ0
animateってsoraやgrokで作った健全動画に使えば、裸やセクシー衣装に着せ替えられるってこと?
295名無しさん@お腹いっぱい。 (ワッチョイ 670e-j3nM)
垢版 |
2025/11/29(土) 20:12:26.15ID:X3wdUAdA0
>>293
ありがとうございます。
試しに動かしてみます!

>>294
動画のどこかのフレーム抜き出してQwen-image-editとかで服装変更してからmix or move transfer
296名無しさん@お腹いっぱい。 (ワッチョイ 670e-j3nM)
垢版 |
2025/11/29(土) 20:16:11.14ID:X3wdUAdA0
途中で書き込んでしまった。

>>294
動画のどこかのフレーム抜き出してQwen-image-editとかで服装変更してからmix or move transferすれば近しいことはできるかも。
カットの変更が激しいとかだとmove transferは使えないとかいろいろ制約はあるので詳しくはいくつか転がっている情報を読んでみると概観は理解できると思います。
2025/11/29(土) 20:17:13.32ID:JiUO3mJd0
>>295
animateで崩れが気になるならMoChaを試してみるといいかと思う
WanVideo Context Optionsノードを追加すれば長尺もいけるし
298名無しさん@お腹いっぱい。 (ワッチョイ 5f55-FNA8)
垢版 |
2025/11/29(土) 23:27:35.74ID:j1zDdMGs0
一貫性保ちたきゃスタート画像やエンドフレーム画像を作成していくしかなくね。で外部有料ソフトでアプスケやフレーム補完やai修正に動画編集。ワークフローにアプスケやフレーム補完が入ってたら質下げるのと調整が面倒だから外す。解像度低いフレーム低い方が良い場面もあるし。
299名無しさん@お腹いっぱい。 (ワッチョイ 5f34-Gjxk)
垢版 |
2025/11/29(土) 23:33:38.76ID:s+X7V4KN0
>>294
できるでTikTok動画で最近やってる
300名無しさん@お腹いっぱい。 (ワッチョイ f919-bqBf)
垢版 |
2025/11/30(日) 02:56:51.32ID:6Ex7OHpf0
>>293
パッケージの依存関係とかでちょっとてこずりましたがとりあえず動作させて軽い検証するところまではいけました。
使ってるモデルはLightning Loraが自分が今まで使ってたのに比べて高ランクだったこと以外基本の動きに違いなさそうですが生成物明らかにくっきりしているような気がしますね。
今まで使ってなかったノード周辺の効果かなと思うので(RMBGで元画像のBG抜いたりしてるのが効いてる?)自分なりに解読・比較・検証してみます!
ありがとうございました。
301名無しさん@お腹いっぱい。 (ワッチョイ 6a3c-+mjb)
垢版 |
2025/11/30(日) 11:46:31.11ID:67BPpI2H0
こういうクオリティ高い動画ってローカルで作ってますかhttps://youtu.be/ZlqV2W9Hn8c?si=8uB4VdKgYajr1t6G
レスを投稿する

5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況