2 个月前

DigiFace-1M:100万数字人脸图像用于人脸识别

Gwangbin Bae; Martin de La Gorce; Tadas Baltrusaitis; Charlie Hewitt; Dong Chen; Julien Valentin; Roberto Cipolla; Jingjing Shen
DigiFace-1M:100万数字人脸图像用于人脸识别
摘要

最先进的面部识别模型展示了令人印象深刻的准确性,在“Labeled Faces in the Wild”(LFW)数据集上达到了超过99.8%的准确率。这些模型是在大规模数据集上训练的,这些数据集包含从互联网收集的数百万张真实的人脸图像。网络爬取的人脸图像存在严重的偏差(如种族、光照、化妆等),并且经常包含标签噪声。更重要的是,这些人脸图像是在未获得明确同意的情况下收集的,引发了伦理问题。为避免这些问题,我们引入了一个用于面部识别的大规模合成数据集,该数据集通过计算机图形渲染管道生成数字人脸图像。首先,我们证明了激进的数据增强可以显著减少合成域与真实域之间的差距。由于对渲染管道有完全控制权,我们还研究了每个属性(例如面部姿态的变化、配饰和纹理)如何影响准确性。与最近使用生成对抗网络(GAN)生成的合成人脸图像进行训练的方法SynFace相比,我们在LFW上的错误率降低了52.5%(准确率从91.93%提高到96.17%)。通过在少量合理获得同意的真实人脸图像上微调网络,我们实现了与在数百万张真实人脸图像上训练的方法相当的准确率。

DigiFace-1M:100万数字人脸图像用于人脸识别 | 最新论文 | HyperAI超神经