
摘要
基于风格的生成对抗网络(StyleGAN)架构在生成高质量图像方面取得了最先进的成果,但其对相机姿态缺乏明确和精确的控制。最近提出的基于神经辐射场(NeRF)的生成对抗网络在3D感知生成器方面取得了显著进展,但它们尚无法生成高质量的图像。本文介绍了CIPS-3D,这是一种结合了浅层NeRF网络和深层隐式神经表示(INR)网络的基于风格的3D感知生成器。该生成器独立合成每个像素值,无需任何空间卷积或上采样操作。此外,我们诊断了镜像对称问题,这表明存在次优解,并通过引入辅助判别器来解决这一问题。CIPS-3D在原始单视图图像上进行训练,在FFHQ数据集上以256×256分辨率生成的图像达到了令人印象深刻的FID分数6.97,创下了3D感知图像合成的新纪录。我们还展示了CIPS-3D在迁移学习和3D感知面部风格化等方面的几个有趣方向。为了更好地展示合成结果,我们建议读者查看我们的GitHub项目:https://github.com/PeterouZh/CIPS-3D