HiFiVFS 腾讯联合VIVO推出的高保真视频换脸框架

HiFiVFS是什么

HiFiVFS（High Fidelity Video Face Swapping）是腾讯和VIVO公司推出的高保真视频换脸框架，HiFiVFS基于Stable Video Diffusion（SVD）框架，用多帧输入和时间注意力机制确保视频生成的稳定性。框架在训练阶段引入细粒度属性学习（FAL）和详细身份学习（DIL），增强属性控制和身份相似性。FAL基于身份去敏感化和对抗学习实现属性解耦，DIL用更适合换脸的身份特征提升相似度。HiFiVFS在潜在空间进行训练和测试，为展示效果，所有过程都在原始图像空间中可视化。

HiFiVFS的主要功能高保真视频换脸：将源图像中的人脸身份特征替换到目标视频中，同时保留目标视频的属性，如姿势、表情、照明和背景。时序稳定性：在多帧视频上应用时间注意力机制，确保视频帧之间的连续性和稳定性，避免传统方法中可能出现的时序抖动问题。细粒度属性控制：基于细粒度属性学习（FAL），提取和控制视频中的细粒度属性，如照明和化妆，这些在以往的换脸技术中往往难以保持。身份相似性增强：基于详细身份学习（DIL），用更详细的面部识别特征提高换脸后人脸与源图像身份的相似度。HiFiVFS的技术原理基于SVD框架：建立在Stable Video Diffusion（SVD）框架之上，SVD框架专为高分辨率文本到视频和图像到视频合成而设计。多帧输入：与仅处理单帧图像的方法不同，HiFiVFS处理多帧视频输入，有助于保持视频的时序稳定性。时间注意力机制：基于时间注意力机制加强视频帧之间的关联性，进一步提升视频稳定性。细粒度属性学习（FAL）：属性解耦：基于身份去敏感化和对抗学习，FAL能提取与身份解耦的细粒度属性特征。增强属性控制：FAL基于对抗学习增强对属性的控制，让换脸后的视频能更好地保留目标视频的属性。详细身份学习（DIL）：身份特征提取：DIL用面部识别模型的更深层次特征，获取更详细的面部身份信息。身份相似性提升：DIL基于将这些详细的身份特征注入到换脸过程中，提高换脸结果与源身份的相似度。HiFiVFS的项目地址项目官网：cxcx1996.github.io/HiFiVFSarXiv技术论文：https://arxiv.org/pdf/2411.18293v1HiFiVFS的应用场景电影和视频制作：在电影和视频制作中，替换或改变演员的面部表情和身份，用在适应特定的剧情需要，或用于特效制作。游戏开发：在游戏开发中，用在创建逼真的角色面部动画，提供更加丰富和真实的交互体验。虚拟现实（VR）和增强现实（AR）：在VR和AR应用中，用在生成或修改用户虚拟形象的面部特征，提供个性化的沉浸式体验。社交媒体：在社交媒体平台上，用户能进行娱乐性质的面部替换，如换脸滤镜或表情变化，增加互动乐趣。广告和营销：广告商将名人或模特的面部特征应用到广告中，提高广告的吸引力和个性化。

HiFiVFS 腾讯联合VIVO推出的高保真视频换脸框架

360Zhinao2-7B 360 推出自研360智脑大模型的升级版

MVGenMaster 复旦联合阿里等实验室推出的多视图扩散模型

HiFiVFS 腾讯联合VIVO推出的高保真视频换脸框架

360Zhinao2-7B 360 推出自研360智脑大模型的升级版

MVGenMaster 复旦联合阿里等实验室推出的多视图扩散模型

相关文章