7 个月前

摘要

从单张图像估计三维人脸形状必须对光照、头部姿态、表情、胡须、化妆和遮挡等因素的变化具有鲁棒性。鲁棒性需要一个包含大量野外图像的大规模训练集，而这些图像本身缺乏真实的三维形状数据。为了在没有任何二维到三维监督的情况下训练网络，我们提出了RingNet，该网络能够从单张图像中学习计算三维人脸形状。我们的关键观察是，无论表情、姿态、光照等因素如何变化，一个人的脸部形状在不同图像中是恒定的。RingNet利用了同一个人的多张图像以及自动检测到的二维面部特征。它采用了一种新颖的损失函数，该损失函数鼓励当身份相同时脸部形状相似，而当身份不同时脸部形状则有所不同。通过使用FLAME模型表示脸部，我们实现了对表情的不变性。训练完成后，我们的方法可以接收单张图像并输出FLAME模型的参数，这些参数可以直接用于动画生成。此外，我们创建了一个新的“接近野外”（Not Quite In-the-Wild, NoW）人脸数据库，其中包含了在各种条件下拍摄的高分辨率图像和3D头部扫描数据。我们评估了公开可用的方法，并发现RingNet比那些使用3D监督的方法更为准确。该数据集、模型和结果已发布供研究使用，网址为http://ringnet.is.tuebingen.mpg.de。

源 PDF