
摘要
从单张图像估计三维人脸形状必须对光照、头部姿态、表情、胡须、化妆和遮挡等因素的变化具有鲁棒性。鲁棒性需要一个包含大量野外图像的大规模训练集,而这些图像本身缺乏真实的三维形状数据。为了在没有任何二维到三维监督的情况下训练网络,我们提出了RingNet,该网络能够从单张图像中学习计算三维人脸形状。我们的关键观察是,无论表情、姿态、光照等因素如何变化,一个人的脸部形状在不同图像中是恒定的。RingNet利用了同一个人的多张图像以及自动检测到的二维面部特征。它采用了一种新颖的损失函数,该损失函数鼓励当身份相同时脸部形状相似,而当身份不同时脸部形状则有所不同。通过使用FLAME模型表示脸部,我们实现了对表情的不变性。训练完成后,我们的方法可以接收单张图像并输出FLAME模型的参数,这些参数可以直接用于动画生成。此外,我们创建了一个新的“接近野外”(Not Quite In-the-Wild, NoW)人脸数据库,其中包含了在各种条件下拍摄的高分辨率图像和3D头部扫描数据。我们评估了公开可用的方法,并发现RingNet比那些使用3D监督的方法更为准确。该数据集、模型和结果已发布供研究使用,网址为http://ringnet.is.tuebingen.mpg.de。