HyperAIHyperAI
il y a 7 jours

Apprentissage de représentations d'une seule classe pour la détection des attaques par présentation faciale à l'aide de réseaux de neurones convolutifs à plusieurs canaux

Anjith George, Sebastien Marcel
Apprentissage de représentations d'une seule classe pour la détection des attaques par présentation faciale à l'aide de réseaux de neurones convolutifs à plusieurs canaux
Résumé

La reconnaissance faciale s’est développée en tant que modalité biométrique largement utilisée. Toutefois, sa vulnérabilité aux attaques de présentation constitue une menace sérieuse pour la sécurité. Bien que les méthodes de détection des attaques de présentation (PAD) cherchent à résoudre ce problème, elles peinent souvent à généraliser face à des attaques inédites. Dans ce travail, nous proposons un nouveau cadre pour la PAD basé sur un classifieur à une seule classe, où les représentations sont apprises à l’aide d’un réseau de neurones convolutif à plusieurs canaux (MCCNN). Une nouvelle fonction de perte est introduite, qui pousse le réseau à apprendre une représentation compacte pour la classe authentique tout en maintenant une distance significative par rapport aux représentations des attaques. Un modèle de mélanges gaussiens à une seule classe est ensuite appliqué sur ces embeddings pour réaliser la tâche de PAD. Le cadre proposé introduit une approche novatrice pour apprendre un système de PAD robuste à partir des données authentiques et des attaques connues (disponibles). Ce point est particulièrement important, car la collecte de données authentiques et d’attaques simples est bien plus aisée que la collecte d’une grande variété d’attaques coûteuses. Le système proposé est évalué sur la base de données publique WMCA, dédiée à la PAD faciale multi-canal, qui inclut une large gamme d’attaques 2D et 3D. En outre, nous avons mené des expériences sur les bases MLFP et SiW-M en utilisant uniquement les canaux RGB. Les résultats obtenus sur les protocoles d’attaques inédites démontrent l’efficacité de l’approche proposée. Le logiciel, les données et les protocoles permettant de reproduire les résultats sont mis à disposition publiquement.