>>742
1.5は厳選した20~25枚くらいの学習画像でいい
「3Dとして認識しててデータがあるほど精度が上がる」みたいなものではないので、大量に入れても意味がない
正面、斜め顔、左右の横顔、服覚えさせたいなら全身も入れて、後ろは出さないなら入れなくてもOK
表情は2D系ならデザインによる、リアルに近いなら素の顔だけでも大体出してくれる
デフォルメ系は要注意(taggerが認識しにくい)、最悪キャプションを自分でいじる必要まである
複雑なポーズは1.5ではどのみち上手く出ないので、ないほうがいいかも
強度1で使うとガビガビ、減らすと顔が似なくなる、って壁にぶち当たったらlora block weightを使う

XLはわからない・・1.5のやり方が全く通用しない、lbwも適用しにくい
しかも時間もかかるので試行錯誤が辛い