
摘要
面部交换技术既有积极的应用,如娱乐、人机交互等,也有消极的应用,如DeepFake对政治、经济等领域的威胁。然而,为了生成高质量的面部交换图像以训练DeepFake检测算法,有必要深入了解先进的面部交换方法及其方案。本文提出了一种首次实现百万像素级单次面部交换(简称MegaFS)的方法。首先,MegaFS通过扩展的潜在空间中的分层表示人脸编码器(Hierarchical Representation Face Encoder, HieRFE)组织人脸表示,以保留更多的人脸细节,而不仅仅是之前面部交换方法中使用的压缩表示。其次,提出了一种精心设计的面部传输模块(Face Transfer Module, FTM),该模块通过非线性轨迹将源图像的身份信息转移到目标图像上,无需显式特征解耦。最后,利用StyleGAN2的强大生成能力和训练稳定性合成人脸交换图像。MegaFS的每一部分都可以单独训练,因此我们的模型在进行百万像素级面部交换时可以满足对GPU内存的需求。总之,完整的人脸表示、稳定的训练过程以及有限的内存使用是本方法成功的三个创新贡献。大量实验验证了MegaFS的优势,并且首次发布了百万像素级的面部交换数据库供公众领域内的DeepFake检测和人脸图像编辑研究使用。数据集链接如下。注:文中提到的技术术语如“DeepFake”、“StyleGAN2”等均为领域内通用译法。其他不常见术语已在括号中标注原文。