QuantFace : Vers une reconnaissance faciale légère par des données synthétiques Quantification à faible précision

Les modèles de reconnaissance faciale basés sur l'apprentissage profond suivent la tendance générale des réseaux neuronaux profonds en utilisant des réseaux à virgule flottante à précision complète, qui présentent un coût computationnel élevé. Le déploiement de tels réseaux dans des cas d'utilisation soumis à des contraintes computationnelles est souvent impossible en raison de la grande quantité de mémoire requise par le modèle à précision complète. Les approches précédentes pour une reconnaissance faciale compacte ont proposé de concevoir des architectures spéciales et de les entraîner à partir de zéro en utilisant des données d'entraînement réelles, qui peuvent ne pas être disponibles dans un scénario du monde réel en raison de préoccupations liées à la vie privée. Dans ce travail, nous présentons la solution QuantFace basée sur la quantification de modèles à faible précision. QuantFace permet de réduire le coût computationnel requis par les modèles existants de reconnaissance faciale sans nécessiter la conception d'une architecture spécifique ou l'accès à des données d'entraînement réelles. QuantFace introduit des données synthétiques respectueuses de la vie privée dans le processus de quantification afin d'atténuer les préoccupations et les problèmes liés à l'accessibilité aux données d'entraînement réelles. À travers une série d'expériences d'évaluation approfondies sur sept benchmarks et quatre architectures de réseau, nous démontrons que QuantFace peut réussir à réduire la taille du modèle jusqu'à 5 fois tout en maintenant, dans une large mesure, les performances de vérification du modèle à précision complète sans accès aux jeux de données d'entraînement réels.