11 天前
用于生成逼真且保持身份一致的头像图像的双智能体GAN
{Panasonic Karlekar Jayashree, Lin Xiong, Jian Zhao, Zhecan Wang, Jianshu Li, Fang Zhao, Panasonic Shengmei Shen, Jiashi Feng, Shuicheng Yan, Panasonic Sugiri Pranata}

摘要
合成逼真侧脸图像在大规模无约束人脸识别任务中具有重要应用前景,能够通过生成极端姿态样本有效提升深度姿态不变模型的训练效率,同时避免繁琐的人工标注。然而,由于合成图像与真实图像在分布上存在差异,直接基于合成数据进行学习往往难以达到理想性能。为缩小这一分布差距,本文提出一种双智能体生成对抗网络(Dual-Agent Generative Adversarial Network, DA-GAN),该模型能够在不依赖标注信息的前提下,利用未标注的真实人脸图像提升人脸生成器的输出逼真度,同时在提升真实感的过程中保持身份信息的完整性。DA-GAN中的双智能体专门设计用于同时区分真实与伪造图像,并识别身份信息。具体而言,本文采用现成的3D人脸模型作为生成器,以生成具有不同姿态的侧脸图像。DA-GAN采用全卷积网络作为生成器,用于生成高分辨率图像;同时,其判别器基于自编码器结构,并集成双智能体机制。除新颖的网络架构外,本文还对标准GAN进行了多项关键改进,以有效保留姿态与纹理特征、维持身份一致性并稳定训练过程,主要包括:(i)姿态感知损失(pose perception loss);(ii)身份感知损失(identity perception loss);(iii)引入边界平衡正则项的对抗损失(adversarial loss with boundary equilibrium regularization)。实验结果表明,DA-GAN不仅在视觉感知质量上表现优异,而且在大规模、高挑战性的NIST IJB-A无约束人脸识别基准测试中显著超越现有最先进方法。此外,所提出的DA-GAN模型在解决通用迁移学习问题方面也展现出良好潜力,可作为一种高效的新范式。