文章

ICCV 2025 | 小红书 AIGC 团队提出图像和视频可控人脸生成新算法 DynamicFace
小红书技术REDtech
08-18
9795 字 (约 40 分钟)
AI 评分: 82
⭐⭐⭐⭐

文章详细介绍了小红书 AIGC 团队在 ICCV 2025 上发表的全新可控人脸生成方法 DynamicFace。该方法旨在解决现有换脸技术中身份与运动耦合、身份一致性差以及视频质量受损等核心难题。DynamicFace 通过将扩散模型与可组合的 3D 人脸先验深度融合,实现了身份、姿态、表情、光照及背景等条件的精细化解耦,从而实现精准控制。其创新点包括:可组合三维面部先验的显式条件解耦,通过 Mixture-of-Guiders 注入扩散模型;身份-细节双流注入机制,利用 Face Former 和 ReferenceNet 分别注入高级语义和细节特征;以及即插即用时序一致性模块 FusionTVO,解决长视频生成中的帧间跳动问题。文章通过在 FaceForensics++ 和 FFHQ 数据集上的定量实验,证明 DynamicFace 在身份一致性和运动一致性上均优于现有 SOTA 方法,并提供了丰富的图像和视频对比结果及消融实验,验证了其组件的有效性。最终,该方法为定制化图像和视频生成提供了强大的控制力和灵活性。

软件编程中文人脸生成扩散模型AIGC计算机视觉视频生成
没有更多文章了