
摘要
基于深度学习的人脸识别模型遵循了深度神经网络的普遍趋势,即使用计算成本较高的全精度浮点网络。在计算资源受限的应用场景中,部署此类网络通常是不可行的,因为全精度模型需要大量的内存。以往的紧凑型人脸识别方法提出设计特殊的紧凑架构,并使用真实训练数据从头开始训练这些模型,但在实际场景中,由于隐私问题,真实训练数据可能无法获得。本文介绍了一种基于低比特精度格式模型量化的QuantFace解决方案。QuantFace能够在无需设计特定架构或访问真实训练数据的情况下,降低现有面部识别模型所需的计算成本。QuantFace在量化过程中引入了保护隐私的合成面部数据,以缓解潜在的隐私问题和获取真实训练数据的相关难题。通过在七个基准测试集和四种网络架构上进行广泛的评估实验,我们证明了QuantFace可以在不访问真实训练数据集的情况下成功将模型大小减少至多5倍,同时在很大程度上保持了全精度模型的验证性能。