!extend:checked:vvvvv
Wan2.2をはじめとする動画生成AIに関する質問用のスレッドです
次スレは>>980が立ててください。
EasyWan22に関する内容は下記関連スレを利用してください 質問する人はなるべく情報開示してください
質問する人はなるべく情報開示してください
・使っているアプリケーション(どこから/何を読んでインストールしたか)や使っている学習モデルを明記する
・状況の説明は具体的に。「以前と違う動画が出力される」「変になった」では回答しようがない。どう違うのか、どう変なのかを書く
・思うように生成されないときはその出力動画をhttps://catbox.moe/にアップロードしURLをここに貼る
・エラーメッセージはhttps://rentry.co/に書いてURLをここに貼る
・ローカルならマシンの構成(GPUの種類は必須、VRAM容量やメインメモリの容量、CPUの種類もなるべく)を書く
関連スレ
【EasyWan22専用】動画生成質問スレ 2
https://mevius.5ch.net/test/read.cgi/cg/1759780410/
前スレ
【Wan2.2】動画生成AI質問スレ2
https://mevius.5ch.net/test/read.cgi/cg/1757715153/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
探検
【Wan2.2】動画生成AI質問スレ3
1名無しさん@お腹いっぱい。 (ワッチョイ c20d-RaAf)
2025/11/18(火) 02:06:17.22ID:+eBu+NBv0202名無しさん@お腹いっぱい。 (ワッチョイ 8761-CVzB)
2025/11/25(火) 23:20:22.16ID:peQwV6yG0 >>201
動くか動かないかで言うとうちでは動いてるよ
RTX 5090, CUDA 12.9, Python 3.10.11
sageattention 2.2.0+cu128torch2.9.0.post3
torch 2.9.1+cu128
triton-windows 3.3.0.post19
Stability Matrixを使ったから特に苦労無し
動くか動かないかで言うとうちでは動いてるよ
RTX 5090, CUDA 12.9, Python 3.10.11
sageattention 2.2.0+cu128torch2.9.0.post3
torch 2.9.1+cu128
triton-windows 3.3.0.post19
Stability Matrixを使ったから特に苦労無し
203名無しさん@お腹いっぱい。 (ワッチョイ 8761-CVzB)
2025/11/25(火) 23:26:30.61ID:peQwV6yG0204名無しさん@お腹いっぱい。 (ワッチョイ dfe7-j3nM)
2025/11/25(火) 23:34:20.39ID:X9f7yxy50 今のとこstable diffusionでの画像生成しか手をつけれてない初心者なのですが、LORA学習とかで今のGPU(3060ti・VRAM8g)で非力でクッソ時間かかるのでGPUの更新を検討してます。
で、将来的には動画生成もやってみたいとは思っているのですが、GPU以外のスペックがPCIe4.0とDDR4メモリ32Gしかないんですがこれで動画生成ってできますかね?(最近メモリの値上がり酷すぎんだろ・・・)
動画生成も出来そうならGPUを5070tiにしようと思うのですが、無理そうなら大人しく画像生成専用で5060tiのVRAM16gにしようかなと・・・
動画に関しては時間がかかっても生成できればいいんですが、ちもろぐさんのブログ見てるとスワップ現象やらで最悪SSDの寿命をゴリゴリ削ってくらしいのでそれは避けたいです。
で、将来的には動画生成もやってみたいとは思っているのですが、GPU以外のスペックがPCIe4.0とDDR4メモリ32Gしかないんですがこれで動画生成ってできますかね?(最近メモリの値上がり酷すぎんだろ・・・)
動画生成も出来そうならGPUを5070tiにしようと思うのですが、無理そうなら大人しく画像生成専用で5060tiのVRAM16gにしようかなと・・・
動画に関しては時間がかかっても生成できればいいんですが、ちもろぐさんのブログ見てるとスワップ現象やらで最悪SSDの寿命をゴリゴリ削ってくらしいのでそれは避けたいです。
205名無しさん@お腹いっぱい。 (ワッチョイ 678d-Wc4b)
2025/11/25(火) 23:39:14.95ID:m0GjofLW0 >>204
スレチ
スレチ
206名無しさん@お腹いっぱい。 (ワッチョイ 8761-CVzB)
2025/11/25(火) 23:42:47.72ID:peQwV6yG0 >>204
PCIeとDDRは4で問題ないよ
PCIe 5.0とDDR5に変えてもメインメモリ→VRAMの転送速度が上がるだけなので処理時間全体では数%短くなる程度の差しかない
メインメモリ32GBは動画生成では最低レベル、いろんなことをやろうとすると不足を感じると思うのでできれば64GBは欲しい、128GBあれば今はほぼ問題ない
32GBでもQ3くらいの圧縮度の高いGGUFモデルを使って解像度とフレーム数を抑えればスワップなく動画生成はできるのでとりあえず試しにやってみたらいいんじゃない?
PCIeとDDRは4で問題ないよ
PCIe 5.0とDDR5に変えてもメインメモリ→VRAMの転送速度が上がるだけなので処理時間全体では数%短くなる程度の差しかない
メインメモリ32GBは動画生成では最低レベル、いろんなことをやろうとすると不足を感じると思うのでできれば64GBは欲しい、128GBあれば今はほぼ問題ない
32GBでもQ3くらいの圧縮度の高いGGUFモデルを使って解像度とフレーム数を抑えればスワップなく動画生成はできるのでとりあえず試しにやってみたらいいんじゃない?
207名無しさん@お腹いっぱい。 (ワッチョイ 47ed-7i60)
2025/11/25(火) 23:44:52.53ID:cWrYIbOC0 >>204
メモリが無くてもSSDを犠牲にする覚悟があればなんとかなるよ。
うちの場合、退役した256GBのM.2 SSDを完全に仮想メモリ専用にしてある。
このクラスのSSDは何個も退役しているので、壊れたら入れ替える覚悟w
遅いのは受け入れるしかないね。
夜間などに処理する分には良いけど、プロンプトの調整なんかは結構な苦行になるだろうね。
メモリが無くてもSSDを犠牲にする覚悟があればなんとかなるよ。
うちの場合、退役した256GBのM.2 SSDを完全に仮想メモリ専用にしてある。
このクラスのSSDは何個も退役しているので、壊れたら入れ替える覚悟w
遅いのは受け入れるしかないね。
夜間などに処理する分には良いけど、プロンプトの調整なんかは結構な苦行になるだろうね。
208名無しさん@お腹いっぱい。 (ワッチョイ dfe7-j3nM)
2025/11/25(火) 23:57:32.25ID:X9f7yxy50209名無しさん@お腹いっぱい。 (ワッチョイ 7f4b-i8gL)
2025/11/26(水) 00:11:36.80ID:OX9fa0/X0 >>208
最近まで、VRAM8GB(RTX2070s)、RAM32GBで使ってたけど、SmoothMixのGGUF Q4KSで割と普通に動いていたよ。
あと、EsayWanは高機能だけど重くて、最近のComfyUIで使える高性能なメモリ管理も使えないんで、ポータブル版かstability matrixから入れ直した方が良いぞ。
最近まで、VRAM8GB(RTX2070s)、RAM32GBで使ってたけど、SmoothMixのGGUF Q4KSで割と普通に動いていたよ。
あと、EsayWanは高機能だけど重くて、最近のComfyUIで使える高性能なメモリ管理も使えないんで、ポータブル版かstability matrixから入れ直した方が良いぞ。
210名無しさん@お腹いっぱい。 (ワッチョイ 0740-j3nM)
2025/11/26(水) 00:13:23.25ID:SONSMB/U0 お前らにちょっと良いこと教えたるか
pcie gen7になったらパソコン絶対に買い替えろよ
もう2度は言わねえからな
pcie gen7になったらパソコン絶対に買い替えろよ
もう2度は言わねえからな
211名無しさん@お腹いっぱい。 (ワッチョイ 0740-j3nM)
2025/11/26(水) 00:27:27.47ID:SONSMB/U0 rtx 6000シリーズ150万も出せねえよ!
ってやつはpcie gen7に絶対に変えとけ
以上
ってやつはpcie gen7に絶対に変えとけ
以上
212名無しさん@お腹いっぱい。 (ワッチョイ 0740-j3nM)
2025/11/26(水) 00:28:58.34ID:SONSMB/U0 すなわちエヌビディアが暴落するときでもあるからな
まぁここに株やってるやつはいねえだろうがな
まぁここに株やってるやつはいねえだろうがな
213名無しさん@お腹いっぱい。 (ワッチョイ dfe7-j3nM)
2025/11/26(水) 00:46:27.66ID:zY+rk/f70 >>209 情報サンクスです 検討してみます
214名無しさん@お腹いっぱい。 (ワッチョイ 27db-CVzB)
2025/11/26(水) 04:27:37.44ID:P0jefl4A0 >>142
easywanから卒業するのに初心者でもわかりそうなワークフローって何かあるんですかね?
easywanから卒業するのに初心者でもわかりそうなワークフローって何かあるんですかね?
215名無しさん@お腹いっぱい。 (ワッチョイ 5ff7-nnTA)
2025/11/26(水) 06:06:01.99ID:uPVT4ase0 初カキコ。stable diffusionをたまたまゲームちょこっと出来ればいいかって買った4070ti ram32gbで動かして、面白さで動画生成にも興味持ってeasywan22入れて、なんかごちゃごちゃしてるなってcomfyUI でsmoothmix wan入れた後、エラー連発してここの過去ログ見ながらなんとか動かせるまでに。ほんとここのスレ民には感謝しかない。
ggufのQ8使ってるけど、使用メモリがssdまで漏れるから寿命考えて16×2を追加購入。64gbならもう少し快適になってくれると思いたい。
ggufのQ8使ってるけど、使用メモリがssdまで漏れるから寿命考えて16×2を追加購入。64gbならもう少し快適になってくれると思いたい。
216名無しさん@お腹いっぱい。 (ワッチョイ 8788-IDt/)
2025/11/26(水) 10:18:36.80ID:gBTWs0fl0217名無しさん@お腹いっぱい。 (ワッチョイ 4704-WIyy)
2025/11/26(水) 12:07:15.25ID:X/ldpMLU0 チビタイでいい感じの動画落とすとほぼ毎回違うワークフローが出てきて、その都度モジュール追加インストしてlightningのrank違いの物やloraを書いてある名前から検索して発掘してると毎回半日くらいかかる…
もっと簡略化するかできんかな?
もっと簡略化するかできんかな?
218名無しさん@お腹いっぱい。 (ワッチョイ 4701-MbZ3)
2025/11/26(水) 12:53:58.86ID:twKg7E4J0 チビタイでX-Ray LoRAが外人どもに大受けw 日本のエロ文化はすごいのぉ
219名無しさん@お腹いっぱい。 (ワッチョイ 5fff-j3nM)
2025/11/26(水) 13:30:48.35ID:lxdlRBYP0220名無しさん@お腹いっぱい。 (ワッチョイ 0718-whpx)
2025/11/26(水) 13:40:19.33ID:yk8kz3og0221名無しさん@お腹いっぱい。 (ワッチョイ a7ad-BvuA)
2025/11/26(水) 15:11:44.13ID:mrEV4Yb30222名無しさん@お腹いっぱい。 (ワッチョイ 4719-WIyy)
2025/11/26(水) 16:11:16.63ID:X/ldpMLU0 >>220
いやもう結構WFあるよw
動画だけじゃなく色々やってるせいもあってマジでセッティング大変だわ⋯
てかlightnIngってrank32,64,256もあるしI2V,T2VもあってWAN用だけで8つもあるけどなんでこんなにあるの?
いやもう結構WFあるよw
動画だけじゃなく色々やってるせいもあってマジでセッティング大変だわ⋯
てかlightnIngってrank32,64,256もあるしI2V,T2VもあってWAN用だけで8つもあるけどなんでこんなにあるの?
223名無しさん@お腹いっぱい。 (ワッチョイ df66-Soof)
2025/11/26(水) 17:27:34.17ID:08S5PT9C0 64GB2枚に32GB1枚を足して96GBにしたいのですが不具合とかありますか?
224名無しさん@お腹いっぱい。 (ワッチョイ 477b-7i60)
2025/11/26(水) 17:51:09.13ID:3Ar0Cf7o0 >>223
自作PCなどの場合はマザーボードの説明書を確認すると、メモリスロットの対応表があるので確認すること。
一般的な回答だと、チャンネルが不均衡になるとデュアルチャンネルアクセスからシングルチャンネルアクセスになってメモリアクセス速度が落ちる。
AIの用途だとメモリの速度はあまり問題にならないので、速度低下のデメリットより容量増加のメリットの方が大きいと思う。
もし動かなかった場合はさらに32GB足して128GBにする覚悟をしておくことが重要だろうね。
自作PCなどの場合はマザーボードの説明書を確認すると、メモリスロットの対応表があるので確認すること。
一般的な回答だと、チャンネルが不均衡になるとデュアルチャンネルアクセスからシングルチャンネルアクセスになってメモリアクセス速度が落ちる。
AIの用途だとメモリの速度はあまり問題にならないので、速度低下のデメリットより容量増加のメリットの方が大きいと思う。
もし動かなかった場合はさらに32GB足して128GBにする覚悟をしておくことが重要だろうね。
225名無しさん@お腹いっぱい。 (ワッチョイ df66-Soof)
2025/11/26(水) 18:02:08.90ID:08S5PT9C0226名無しさん@お腹いっぱい。 (ワッチョイ 7fb2-fcev)
2025/11/26(水) 18:59:49.62ID:Uudr4zqH0227名無しさん@お腹いっぱい。 (ワッチョイ c7da-CVzB)
2025/11/26(水) 19:32:57.01ID:RUTUZ2AE0 デュアルチャネル無視の増設・・・wwww
228名無しさん@お腹いっぱい。 (ワッチョイ df66-Soof)
2025/11/26(水) 19:36:46.77ID:08S5PT9C0229名無しさん@お腹いっぱい。 (ワッチョイ c7da-CVzB)
2025/11/26(水) 19:42:19.45ID:RUTUZ2AE0230名無しさん@お腹いっぱい。 (ワッチョイ 27db-CVzB)
2025/11/26(水) 20:03:43.61ID:P0jefl4A0 >>228
4枚は相性めちゃくちゃシビアだよ 別々にしてるほうが少ないっていうかそのレベルで増設するのか・・・
4枚は相性めちゃくちゃシビアだよ 別々にしてるほうが少ないっていうかそのレベルで増設するのか・・・
231名無しさん@お腹いっぱい。 (ワッチョイ 7fb2-fcev)
2025/11/26(水) 20:07:23.35ID:Uudr4zqH0 PC初心者スレで聞いた方が良いんじゃね
232名無しさん@お腹いっぱい。 (ワッチョイ df66-Soof)
2025/11/26(水) 20:09:37.60ID:08S5PT9C0233名無しさん@お腹いっぱい。 (ワッチョイ 87f2-iYpt)
2025/11/26(水) 20:13:33.35ID:nKusmxGW0234名無しさん@お腹いっぱい。 (ワッチョイ 477b-7i60)
2025/11/26(水) 20:13:44.35ID:3Ar0Cf7o0 もし、2枚づつ違う違うロットorメーカーのメモリを刺す場合、チャンネルで揃える事。
意外と知られていないけど、メモリはチャンネル別にタイミング調整可能らしい。
チャンネルに挿すメモリは揃える事。
※CPUやチップセットで機能が変わってくるけど、基本はこれ
意外と知られていないけど、メモリはチャンネル別にタイミング調整可能らしい。
チャンネルに挿すメモリは揃える事。
※CPUやチップセットで機能が変わってくるけど、基本はこれ
235名無しさん@お腹いっぱい。 (ワッチョイ 477b-7i60)
2025/11/26(水) 20:17:41.64ID:3Ar0Cf7o0 例えばDIMMスロットが、A1 A2 B1 B2 とある場合、2枚挿す時にA1 B1 に挿せと書いてあるなら、
A1 A2 が同一チャンネル。B1 B2 が同一チャンネルだね。
A1 A2 が同一チャンネル。B1 B2 が同一チャンネルだね。
236名無しさん@お腹いっぱい。 (ワッチョイ c7da-CVzB)
2025/11/26(水) 20:19:14.81ID:RUTUZ2AE0 謳ってる速度が出せない=上手く動かない ってことなんだけどなw
まぁ、2枚挿しの方が安心っちゃ安心
まぁ、2枚挿しの方が安心っちゃ安心
237名無しさん@お腹いっぱい。 (ワッチョイ df66-Soof)
2025/11/26(水) 20:29:11.07ID:08S5PT9C0238名無しさん@お腹いっぱい。 (ワッチョイ 7f10-y3o6)
2025/11/26(水) 21:05:39.39ID:u2i15nZo0 メモリ増やすときはXMPについても調べてから買ったほうがええで
チャッピーに聞いたらええ
チャッピーに聞いたらええ
239名無しさん@お腹いっぱい。 (ワッチョイ 678d-Wc4b)
2025/11/26(水) 21:27:41.08ID:FHNdcUdj0 >>223
(64x2)+32=96?😳
(64x2)+32=96?😳
240名無しさん@お腹いっぱい。 (ワッチョイ 070f-7i60)
2025/11/26(水) 21:56:22.71ID:ybMLtVi70 ローカルでWAN2.2を動かしたいんだけれど、ComfyUI以外でない?
241名無しさん@お腹いっぱい。 (ワッチョイ 87f2-iYpt)
2025/11/26(水) 21:59:57.80ID:nKusmxGW0 >>240
forge neo
forge neo
242名無しさん@お腹いっぱい。 (ワッチョイ c7f4-j3nM)
2025/11/27(木) 11:54:59.39ID:vEsHIZaX0 プロンプトって言語何で書いてる?
面倒だから日本語で書いて翻訳ノード嚙ましてるけど
やっぱ最初から英語か中国語の方がいいかな?
AIに聞くと中国語より英語の方が効きやすいっていうけど
ネットだと中国語のが効くって人もいるよね
個人的には英語のが効く気がするけどほかの人はどうしてる?
面倒だから日本語で書いて翻訳ノード嚙ましてるけど
やっぱ最初から英語か中国語の方がいいかな?
AIに聞くと中国語より英語の方が効きやすいっていうけど
ネットだと中国語のが効くって人もいるよね
個人的には英語のが効く気がするけどほかの人はどうしてる?
243名無しさん@お腹いっぱい。 (ワッチョイ 5f77-Gjxk)
2025/11/27(木) 12:10:24.98ID:MyBdNvF60 他人のコピペで繋ぎ合わせ
244名無しさん@お腹いっぱい。 (ワッチョイ 6727-BvuA)
2025/11/27(木) 12:21:57.02ID:FEuQHOBz0 日本語は言語仕様が良くないので翻訳元の言語には向かない
245名無しさん@お腹いっぱい。 (ワッチョイ 87cc-CVzB)
2025/11/27(木) 12:34:10.24ID:Ng8rUlTD0 >>242
プロンプトの言語を気にする人がいるけどそれよりも文法が正しいかや主語を省略してないかといったプロンプトの品質の方が大事だと思う
Wan 2.xにしろ他の動画生成にしろテキストエンコーダー (UMT5) は多言語対応しているので
事前にGoogle翻訳やDeepLでプロンプトを英語や中国語に翻訳しても自分で修正せずそのままコピペするだけなら日本語で書いてテキストエンコーダーに任せるのと変わらないよ
プロンプトの言語を気にする人がいるけどそれよりも文法が正しいかや主語を省略してないかといったプロンプトの品質の方が大事だと思う
Wan 2.xにしろ他の動画生成にしろテキストエンコーダー (UMT5) は多言語対応しているので
事前にGoogle翻訳やDeepLでプロンプトを英語や中国語に翻訳しても自分で修正せずそのままコピペするだけなら日本語で書いてテキストエンコーダーに任せるのと変わらないよ
246名無しさん@お腹いっぱい。 (ワッチョイ 87cc-CVzB)
2025/11/27(木) 12:41:57.36ID:Ng8rUlTD0 >>245
そういう理屈なので個人的には中国語のスキルは無いけど英語ならそれなりに自信があるので英語でプロンプトを書いてる
中国語にも英語にも自信が無いなら事前に翻訳するにしろプロンプトに直接書くにしろ主語や述語を省略しない翻訳を意識した正しい日本語で書けばいい
そういう理屈なので個人的には中国語のスキルは無いけど英語ならそれなりに自信があるので英語でプロンプトを書いてる
中国語にも英語にも自信が無いなら事前に翻訳するにしろプロンプトに直接書くにしろ主語や述語を省略しない翻訳を意識した正しい日本語で書けばいい
247名無しさん@お腹いっぱい。 (ワッチョイ 0731-fcev)
2025/11/27(木) 12:59:06.77ID:cY9wF8+a0 >>244
英語は語彙が少な過ぎて微妙な表現は全て同じになる
英語は語彙が少な過ぎて微妙な表現は全て同じになる
248名無しさん@お腹いっぱい。 (ワッチョイ 67e6-CVzB)
2025/11/27(木) 13:01:10.97ID:7A54btUP0 日本人特有の曖昧プロンプトを書くからうまく行かんのでは
249名無しさん@お腹いっぱい。 (ワッチョイ 67e6-CVzB)
2025/11/27(木) 13:01:44.82ID:7A54btUP0 「女性が服を脱ぎます。するとその・・・なんといいますか・・・ふふっ、分かりますよね」
250名無しさん@お腹いっぱい。 (ワッチョイ a7f4-Y1H3)
2025/11/27(木) 13:11:13.09ID:ig+wRq7W0251名無しさん@お腹いっぱい。 (ワッチョイ 0731-fcev)
2025/11/27(木) 13:13:03.22ID:cY9wF8+a0252名無しさん@お腹いっぱい。 (ワッチョイ c7f4-j3nM)
2025/11/27(木) 13:17:39.29ID:vEsHIZaX0 なるほど確かに言語云々より
そっちを疎かにするべきではないdのは確かにそう
ってなると自分で修正するのは手間なのでローカルLLM建てて投げる方が楽か
中国語は翻訳そのままだけど不自然な動作多くなる感じするんだよな・・
そっちを疎かにするべきではないdのは確かにそう
ってなると自分で修正するのは手間なのでローカルLLM建てて投げる方が楽か
中国語は翻訳そのままだけど不自然な動作多くなる感じするんだよな・・
253名無しさん@お腹いっぱい。 (ワッチョイ 5f7c-CVzB)
2025/11/27(木) 14:36:46.39ID:slwGJ5nI0 AIの為に中国語覚えにゃならんのか
中国発のモデルがかなり多くて中国語で運用する合理性はあるんだよな
中国発のモデルがかなり多くて中国語で運用する合理性はあるんだよな
254名無しさん@お腹いっぱい。 (ワッチョイ 873f-Gjxk)
2025/11/27(木) 14:36:53.98ID:SogmEQfb0 主語とか目的語とか所有格とか、AI的にはそういうの明示してくれないと困るんだろうな
255名無しさん@お腹いっぱい。 (ワッチョイ c796-CVzB)
2025/11/27(木) 15:18:38.30ID:Ba0OH2Be0 LLMノードを組み込んでプロンプト生成させればいい
256名無しさん@お腹いっぱい。 (ワッチョイ 7f99-Soof)
2025/11/27(木) 15:51:58.72ID:YYiR7cMy0 ところで 5090 坊やは変色をどうにかできたのか?
257名無しさん@お腹いっぱい。 (ワッチョイ 5f3a-j3nM)
2025/11/27(木) 15:56:57.43ID:jaa6uXbi0 昭和45年ごろのプロ野球中継の映像は日テレが保管しててクラシックとしてCSで放送するけど
当時は投手の後ろから映すセンターカメラが禁止されてて(秘術的に可能であったがサイン盗みを恐れたため)すべてバックネット裏カメラの映像なんだよね
1枚の古い写真から色付けて勝手に動かせるまで進歩したんだから、映像ソースがあるものを別アングルからの映像としてよみがえらせることも可能じゃない?
長嶋茂雄の選手晩年ちょっと前の1970頃のセンターカメラアングルの打席がぜひ見たいんだよね。引退する(74年)がバックネット裏カメラか真横からだけだから
755号756号の映像がセンターカメラで残ってる王と違いその映像がないので実態が分からんのよね。
当時は投手の後ろから映すセンターカメラが禁止されてて(秘術的に可能であったがサイン盗みを恐れたため)すべてバックネット裏カメラの映像なんだよね
1枚の古い写真から色付けて勝手に動かせるまで進歩したんだから、映像ソースがあるものを別アングルからの映像としてよみがえらせることも可能じゃない?
長嶋茂雄の選手晩年ちょっと前の1970頃のセンターカメラアングルの打席がぜひ見たいんだよね。引退する(74年)がバックネット裏カメラか真横からだけだから
755号756号の映像がセンターカメラで残ってる王と違いその映像がないので実態が分からんのよね。
258名無しさん@お腹いっぱい。 (ワッチョイ c7f4-j3nM)
2025/11/27(木) 16:09:56.74ID:vEsHIZaX0 このVLMいいな
https://huggingface.co/fancyfeast/llama-joycaption-beta-one-hf-llava
画像入力もできてエロプロンプトも生成できる
他に良いVLM知ってる人いたら教えて
https://huggingface.co/fancyfeast/llama-joycaption-beta-one-hf-llava
画像入力もできてエロプロンプトも生成できる
他に良いVLM知ってる人いたら教えて
259名無しさん@お腹いっぱい。 (ワッチョイ bf8c-CUg+)
2025/11/27(木) 18:02:25.93ID:bcgBUILj0 プロンプトに品質タグとか要りませんよね?
260名無しさん@お腹いっぱい。 (ワッチョイ a7be-rsiU)
2025/11/27(木) 19:40:59.00ID:78J0teob0 Grokに画像渡すと良い感じにプロンプト作ってくれる
261名無しさん@お腹いっぱい。 (ワッチョイ c796-CVzB)
2025/11/27(木) 20:10:54.80ID:Ba0OH2Be0262名無しさん@お腹いっぱい。 (ワッチョイ 5fff-j3nM)
2025/11/27(木) 20:37:04.05ID:nw2/b8Yn0 >>242
一般的には英語の方が表現の強さの優先順位決まっててわかりやすくていいと思うけどね
まあどのみちwan2.2なんてざっくりだから細かい指示してもしゃあないけど
致命的な破綻はめったにないけど、どう指定してもよう似た動きで、やるかやらないか、汁出るかでないかの違いしかないからな
一般的には英語の方が表現の強さの優先順位決まっててわかりやすくていいと思うけどね
まあどのみちwan2.2なんてざっくりだから細かい指示してもしゃあないけど
致命的な破綻はめったにないけど、どう指定してもよう似た動きで、やるかやらないか、汁出るかでないかの違いしかないからな
263名無しさん@お腹いっぱい。 (ワッチョイ bf45-Nrlb)
2025/11/27(木) 20:43:25.47ID:b5Dgjssl0 wan2.2でええやんと思ってたけど
最新のクラウドサービスのブロンプト追従度の良さに触れるとダメじゃんってなってしまう
最新のクラウドサービスのブロンプト追従度の良さに触れるとダメじゃんってなってしまう
264名無しさん@お腹いっぱい。 (ワッチョイ c796-CVzB)
2025/11/27(木) 20:50:06.10ID:Ba0OH2Be0 Wan2.2も高速化Lora通さなければそこそこ追従性も動きもいいのよ・・
どっち(品質 - 生成速度)を採るかで変わってくる 悩ましい
どっち(品質 - 生成速度)を採るかで変わってくる 悩ましい
265名無しさん@お腹いっぱい。 (ワッチョイ 87cc-CVzB)
2025/11/27(木) 21:03:41.13ID:Ng8rUlTD0266名無しさん@お腹いっぱい。 (ワッチョイ 7f99-Soof)
2025/11/27(木) 22:50:07.48ID:YYiR7cMy0 色彩に関しては英語は最低なんだが?
また、微笑みなんてのは英語にはないことだぞ。
まぁ、お前らは日本人かもしれないが日本語を理解できてないだけのことであろう。
また、微笑みなんてのは英語にはないことだぞ。
まぁ、お前らは日本人かもしれないが日本語を理解できてないだけのことであろう。
267名無しさん@お腹いっぱい。 (ワッチョイ 87cc-CVzB)
2025/11/27(木) 23:26:20.30ID:Ng8rUlTD0 こいつ前スレで暴れてた荒らしなのでNGと無視でよろしく頼む
ワッチョイ 7f99-Soof
ID:YYiR7cMy0
949: 名無しさん@お腹いっぱい。(ワッチョイ 6e99-juqw) 2025/11/16(日) 18:28:07.64 ID:8s3w1hfu0
私が RTX-2070Super(8GB) という生成では地雷の GPU で無問題に FLF できているのに
RTX-5090 の輩が何故変色してる、それは昔から言われている
「馬鹿は何やってもダメ」ってことだろ。
984: 名無しさん@お腹いっぱい。(ワッチョイ 6e99-juqw) 2025/11/19(水) 00:22:14.10 ID:Lq0yEJKO0
「俺って RTX-5090 もってるんだぜ」でマウントとった気分なのだろうが
それで「変色してます、困っています」で見知らぬ他人に泣き言いっているのは、いささかアレすぎるだろ。
まだ、それが 4GBなVRAM でなら同情の余地があるぞ。
その RTX-5090 の価格ってのはな貧困家庭の一年の生活費と同等なんだぞ。
人生考えなおせ。
988: 名無しさん@お腹いっぱい。(ワッチョイ 6e99-juqw) 2025/11/19(水) 00:52:23.73 ID:Lq0yEJKO0
ようやく 5090変色坊やが釣れたか。
それでお前ら、変色はなくせたのか?
煽り返すなら少しは具体例をだせよな。
俺様はすでに具体例をだしたぞ。
ワッチョイ 7f99-Soof
ID:YYiR7cMy0
949: 名無しさん@お腹いっぱい。(ワッチョイ 6e99-juqw) 2025/11/16(日) 18:28:07.64 ID:8s3w1hfu0
私が RTX-2070Super(8GB) という生成では地雷の GPU で無問題に FLF できているのに
RTX-5090 の輩が何故変色してる、それは昔から言われている
「馬鹿は何やってもダメ」ってことだろ。
984: 名無しさん@お腹いっぱい。(ワッチョイ 6e99-juqw) 2025/11/19(水) 00:22:14.10 ID:Lq0yEJKO0
「俺って RTX-5090 もってるんだぜ」でマウントとった気分なのだろうが
それで「変色してます、困っています」で見知らぬ他人に泣き言いっているのは、いささかアレすぎるだろ。
まだ、それが 4GBなVRAM でなら同情の余地があるぞ。
その RTX-5090 の価格ってのはな貧困家庭の一年の生活費と同等なんだぞ。
人生考えなおせ。
988: 名無しさん@お腹いっぱい。(ワッチョイ 6e99-juqw) 2025/11/19(水) 00:52:23.73 ID:Lq0yEJKO0
ようやく 5090変色坊やが釣れたか。
それでお前ら、変色はなくせたのか?
煽り返すなら少しは具体例をだせよな。
俺様はすでに具体例をだしたぞ。
268名無しさん@お腹いっぱい。 (ワッチョイ c727-j3nM)
2025/11/28(金) 00:45:45.41ID:kG2IaFow0 >>261
そこらへんはエロ出力無理なんでは?
そこらへんはエロ出力無理なんでは?
269名無しさん@お腹いっぱい。 (ワッチョイ 7f99-Soof)
2025/11/28(金) 01:32:14.81ID:Ws+KspY70 アレな中学生程度の文章しか書けない、実年齢40歳以上の奴が
高齢な両親の年金を使い込んで 5090 買ったんだろ。
いい加減目をさませ。
いつまでもあると思うな親の年金!!
高齢な両親の年金を使い込んで 5090 買ったんだろ。
いい加減目をさませ。
いつまでもあると思うな親の年金!!
270名無しさん@お腹いっぱい。 (ワッチョイ 7fcd-Wc4b)
2025/11/28(金) 02:47:43.48ID:UDuTdW7m0 さっそく >>269 が釣れてる件
心も財布も貧しいことよ
心も財布も貧しいことよ
271名無しさん@お腹いっぱい。 (ワッチョイ 5f8f-Gjxk)
2025/11/28(金) 06:02:13.91ID:EcKxHN0Q0 TikTokとかの動画の服脱がせるワークフローえぐいな
272名無しさん@お腹いっぱい。 (ワッチョイ bf97-WIyy)
2025/11/28(金) 09:04:19.15ID:tijXwKX70 >>249
www
www
273名無しさん@お腹いっぱい。 (ワッチョイ 8770-CUg+)
2025/11/28(金) 12:01:10.36ID:OpLWli1w0274名無しさん@お腹いっぱい。 (ワッチョイ 8743-CVzB)
2025/11/28(金) 12:16:51.09ID:/IN87eKs0275名無しさん@お腹いっぱい。 (スッップ Sd7f-Qhq3)
2025/11/28(金) 12:18:20.97ID:xp6zPmqSd comfyは今のバージョンだと日本語も解るから日本語でしか書いてないな
276名無しさん@お腹いっぱい。 (ワッチョイ 7f2b-Wc4b)
2025/11/28(金) 12:19:47.35ID:TwJ/0OYf0277名無しさん@お腹いっぱい。 (ワッチョイ 8743-CVzB)
2025/11/28(金) 12:26:53.90ID:/IN87eKs0278名無しさん@お腹いっぱい。 (ワッチョイ 7f2b-Wc4b)
2025/11/28(金) 18:46:58.79ID:TwJ/0OYf0 >>277
なるほど、WF拾ってくるだけの無能ならありえるか
なるほど、WF拾ってくるだけの無能ならありえるか
279名無しさん@お腹いっぱい。 (ワッチョイ 87e8-CUg+)
2025/11/28(金) 19:13:05.78ID:cdAnTd6B0 プロンプトの日本語やその他多言語を理解して動画生成に落とし込むのはCLIPモデルじゃないの?
280名無しさん@お腹いっぱい。 (ワッチョイ 8793-iYpt)
2025/11/28(金) 19:32:48.06ID:/IN87eKs0281名無しさん@お腹いっぱい。 (オッペケ Sr3b-ZHdg)
2025/11/28(金) 20:18:14.78ID:Ts1bsKLCr z-image-turbo君まあまあ普通にnsfw吐き出すな。
ガッツリ行くのは無理ぽいけど
ガッツリ行くのは無理ぽいけど
282名無しさん@お腹いっぱい。 (オッペケ Sr3b-ZHdg)
2025/11/28(金) 20:18:16.25ID:Ts1bsKLCr z-image-turbo君まあまあ普通にnsfw吐き出すな。
ガッツリ行くのは無理ぽいけど
ガッツリ行くのは無理ぽいけど
283名無しさん@お腹いっぱい。 (オッペケ Sr3b-ZHdg)
2025/11/28(金) 20:23:24.40ID:Ts1bsKLCr スレチやったわすまんな
284名無しさん@お腹いっぱい。 (オッペケ Sr3b-ZHdg)
2025/11/28(金) 20:28:34.39ID:Ts1bsKLCr kijaiのanimate-fp8-scaleで動かしてるが動画進むにつれ画像がガタガタになるのはみんなそんなもん?
それとも他のとこイジればちゃんと安定する?
それとも他のとこイジればちゃんと安定する?
285名無しさん@お腹いっぱい。 (ワッチョイ c75f-CVzB)
2025/11/28(金) 21:26:21.60ID:7M+w6H3F0286名無しさん@お腹いっぱい。 (ワッチョイ 5f65-BvuA)
2025/11/28(金) 21:38:47.39ID:8bDtCeAs0 >>284
アニメ系は不得意、どうしても人物が崩れるときはmovingモード(モーションだけコピーするモード)にすると少しマシになるよ
アニメ系は不得意、どうしても人物が崩れるときはmovingモード(モーションだけコピーするモード)にすると少しマシになるよ
287名無しさん@お腹いっぱい。 (ワッチョイ 5f65-BvuA)
2025/11/28(金) 22:00:03.45ID:8bDtCeAs0 >>284
kijai氏のWFだとVRAM少ないと解像度高く出来ないからanimateのモデルとTEをGGUFにして節約して解像度高くするとか。
解像度低すぎると画像がガタガタになりやすい。AIおじさんのWFだとSAM2で人物を自動マスクしてくれるらそれを試してみるのもいいかも
kijai氏のWFだとVRAM少ないと解像度高く出来ないからanimateのモデルとTEをGGUFにして節約して解像度高くするとか。
解像度低すぎると画像がガタガタになりやすい。AIおじさんのWFだとSAM2で人物を自動マスクしてくれるらそれを試してみるのもいいかも
288名無しさん@お腹いっぱい。 (ワッチョイ df41-ZDdT)
2025/11/28(金) 22:35:18.92ID:saQ0TfbV0 >>262
英語圏のリアクション系ユーチューバーを見ていると
なぜAIが日本人だけを生存させるべきと答えたのかが分かる
あいつらの殆どは◯◯みたいだ、◯◯で見た、◯◯のようだと言う
日本人からすればパクっていると言われるようもの
語彙と表現が貧弱だから何かに例える事しか出来ない
英語圏のリアクション系ユーチューバーを見ていると
なぜAIが日本人だけを生存させるべきと答えたのかが分かる
あいつらの殆どは◯◯みたいだ、◯◯で見た、◯◯のようだと言う
日本人からすればパクっていると言われるようもの
語彙と表現が貧弱だから何かに例える事しか出来ない
289名無しさん@お腹いっぱい。 (ワッチョイ 674b-j3nM)
2025/11/28(金) 22:57:06.25ID:eh2UyS+g0 >>285-287
皆さんありがとう。
参照画像は実写で解像度はちょい粗目。生成動画の解像度は432x768or576x1024で基本的にMoveモードでの運用だけど数秒立つと体と顔のディティールが崩れちゃうんですよね。
RTX4090 VRM24GB 環境だからVRAM多いわけでもないけど特段少ないってわけでもないつもりなんですけどね…。
なんなら量子化してない公式モデル使おうかと考えてたくらいでしたがみんなはkijai氏のモデルで問題ない感じなんですね。
参照画像を一回アップスケールしてからとかでやってみます。
皆さんありがとう。
参照画像は実写で解像度はちょい粗目。生成動画の解像度は432x768or576x1024で基本的にMoveモードでの運用だけど数秒立つと体と顔のディティールが崩れちゃうんですよね。
RTX4090 VRM24GB 環境だからVRAM多いわけでもないけど特段少ないってわけでもないつもりなんですけどね…。
なんなら量子化してない公式モデル使おうかと考えてたくらいでしたがみんなはkijai氏のモデルで問題ない感じなんですね。
参照画像を一回アップスケールしてからとかでやってみます。
290名無しさん@お腹いっぱい。 (ワッチョイ 5f10-whpx)
2025/11/29(土) 07:18:04.55ID:wHmcDNhl0 ウチはLightning 4stepじゃないと顔崩れるからもう諦めて4step使ってるわ
291名無しさん@お腹いっぱい。 (ワッチョイ c7c9-CVzB)
2025/11/29(土) 10:08:28.18ID:NLA5wol90 >>289
285だけど、元投稿に「kijaiのanimate-fp8-scale」と書いてあったんで、
Kijai氏のモデル使うならフローはKijaiフローの方がいいって書いたんだけど、
Nativeモデルもあるのでその場合はNatibeフローでも全然問題ない
てか、直近は動画関連はNativeフローの方が省メモリなのでNatvieの方が有利
AnimateもNative版なかなかいい
(オレはかなりフロー変更して使ってるが)
285だけど、元投稿に「kijaiのanimate-fp8-scale」と書いてあったんで、
Kijai氏のモデル使うならフローはKijaiフローの方がいいって書いたんだけど、
Nativeモデルもあるのでその場合はNatibeフローでも全然問題ない
てか、直近は動画関連はNativeフローの方が省メモリなのでNatvieの方が有利
AnimateもNative版なかなかいい
(オレはかなりフロー変更して使ってるが)
292名無しさん@お腹いっぱい。 (ワッチョイ 674b-j3nM)
2025/11/29(土) 19:01:01.17ID:X3wdUAdA0293名無しさん@お腹いっぱい。 (ワッチョイ c7c9-CVzB)
2025/11/29(土) 19:16:41.15ID:NLA5wol90 >>292
フロー付き
よければ試してみて
オレ環も4090なので(メモリ容量的には)動くとは思うけど、
もしダメそうならfp8モデルで
https://files.catbox.moe/e7z0qu.mp4
フロー付き
よければ試してみて
オレ環も4090なので(メモリ容量的には)動くとは思うけど、
もしダメそうならfp8モデルで
https://files.catbox.moe/e7z0qu.mp4
294名無しさん@お腹いっぱい。 (ワッチョイ 877f-Gjxk)
2025/11/29(土) 19:40:33.20ID:FznQ9JgZ0 animateってsoraやgrokで作った健全動画に使えば、裸やセクシー衣装に着せ替えられるってこと?
295名無しさん@お腹いっぱい。 (ワッチョイ 670e-j3nM)
2025/11/29(土) 20:12:26.15ID:X3wdUAdA0296名無しさん@お腹いっぱい。 (ワッチョイ 670e-j3nM)
2025/11/29(土) 20:16:11.14ID:X3wdUAdA0 途中で書き込んでしまった。
>>294
動画のどこかのフレーム抜き出してQwen-image-editとかで服装変更してからmix or move transferすれば近しいことはできるかも。
カットの変更が激しいとかだとmove transferは使えないとかいろいろ制約はあるので詳しくはいくつか転がっている情報を読んでみると概観は理解できると思います。
>>294
動画のどこかのフレーム抜き出してQwen-image-editとかで服装変更してからmix or move transferすれば近しいことはできるかも。
カットの変更が激しいとかだとmove transferは使えないとかいろいろ制約はあるので詳しくはいくつか転がっている情報を読んでみると概観は理解できると思います。
297名無しさん@お腹いっぱい。 (ワッチョイ 5f75-Soof)
2025/11/29(土) 20:17:13.32ID:JiUO3mJd0298名無しさん@お腹いっぱい。 (ワッチョイ 5f55-FNA8)
2025/11/29(土) 23:27:35.74ID:j1zDdMGs0 一貫性保ちたきゃスタート画像やエンドフレーム画像を作成していくしかなくね。で外部有料ソフトでアプスケやフレーム補完やai修正に動画編集。ワークフローにアプスケやフレーム補完が入ってたら質下げるのと調整が面倒だから外す。解像度低いフレーム低い方が良い場面もあるし。
299名無しさん@お腹いっぱい。 (ワッチョイ 5f34-Gjxk)
2025/11/29(土) 23:33:38.76ID:s+X7V4KN0 >>294
できるでTikTok動画で最近やってる
できるでTikTok動画で最近やってる
300名無しさん@お腹いっぱい。 (ワッチョイ f919-bqBf)
2025/11/30(日) 02:56:51.32ID:6Ex7OHpf0 >>293
パッケージの依存関係とかでちょっとてこずりましたがとりあえず動作させて軽い検証するところまではいけました。
使ってるモデルはLightning Loraが自分が今まで使ってたのに比べて高ランクだったこと以外基本の動きに違いなさそうですが生成物明らかにくっきりしているような気がしますね。
今まで使ってなかったノード周辺の効果かなと思うので(RMBGで元画像のBG抜いたりしてるのが効いてる?)自分なりに解読・比較・検証してみます!
ありがとうございました。
パッケージの依存関係とかでちょっとてこずりましたがとりあえず動作させて軽い検証するところまではいけました。
使ってるモデルはLightning Loraが自分が今まで使ってたのに比べて高ランクだったこと以外基本の動きに違いなさそうですが生成物明らかにくっきりしているような気がしますね。
今まで使ってなかったノード周辺の効果かなと思うので(RMBGで元画像のBG抜いたりしてるのが効いてる?)自分なりに解読・比較・検証してみます!
ありがとうございました。
301名無しさん@お腹いっぱい。 (ワッチョイ 6a3c-+mjb)
2025/11/30(日) 11:46:31.11ID:67BPpI2H0 こういうクオリティ高い動画ってローカルで作ってますかhttps://youtu.be/ZlqV2W9Hn8c?si=8uB4VdKgYajr1t6G
レスを投稿する
ニュース
- タワマンに戻りたい…子どものため“郊外の庭付き一軒家”に引っ越した世帯年収1,600万円の40代パワーカップル「心底後悔しています」 [樽悶★]
- カズレーザー「サンタクロースはいない」「買ってくれた親に感謝」発言に“視聴者から苦情”で「バカじゃねーの?って本当に思う」 [muffin★]
- 【酒】外国人は呆れている…「酒に酔って潰れる日本人」が海外で“めちゃくちゃ軽蔑”されるワケ [ごまカンパチ★]
- NY円、一時157円台半ばに下落 日銀総裁の利上げ慎重姿勢を警戒 ★4 [蚤の市★]
- 河野太郎氏「オフレコでの発言を了解も取らずに報道する姿勢が大きな問題」官邸幹部核発言報道に★4 [♪♪♪★]
- 「刑務所よりひどい」"切り身1切れ"の小学校給食に保護者絶句 給食無償化でさらなる予算削減も ★5 [少考さん★]
- 年金10万円の81歳男性、週5で食品配布会や炊き出し通い。13時間かけて都内3カ所を回ってくる日も。これあた [545512288]
- 幹部のちんぽをしゃぶるお🏡🌸
- なぜヤフコメは意見が偏るのか [357264179]
- おさかなさんあつまれえ
- 退職を拒否する方法
- 新こち亀のアニメの両津役はケンドーコバヤシに決定www
