HyperAIHyperAI
il y a 11 jours

MogFace : Vers une compréhension plus approfondie de la détection faciale

Yang Liu, Fei Wang, Jiankang Deng, Zhipeng Zhou, Baigui Sun, Hao Li
MogFace : Vers une compréhension plus approfondie de la détection faciale
Résumé

Grâce au design innovant des détecteurs d'objets génériques, des progrès significatifs ont été réalisés dans le domaine de la détection faciale. En général, les architectures du module d'arrière-plan (backbone), du niveau de pyramide de caractéristiques et de la tête de détection dans les détecteurs faciaux s'appuient tous sur les meilleures pratiques issues des détecteurs d'objets généraux. Toutefois, plusieurs méthodes efficaces, telles que la stratégie d'attribution des étiquettes (label assignment) et la stratégie d'augmentation de données à plusieurs échelles, ne parviennent pas à maintenir une supériorité constante lorsqu'elles sont appliquées directement aux détecteurs faciaux. Plus précisément, la première stratégie repose sur un grand nombre de hyperparamètres, tandis que la seconde est confrontée au problème du biais de distribution d'échelle entre différentes tâches de détection, ce qui limite leur capacité de généralisation. En outre, afin de fournir des cadres englobants (bounding boxes) faciaux précis pour les tâches ultérieures de traitement facial, le détecteur facial doit impérativement éliminer les fausses alertes. Par conséquent, des solutions pratiques pour l'attribution des étiquettes, l'augmentation de données à plusieurs échelles et la réduction des fausses alertes s'avèrent nécessaires pour améliorer les détecteurs faciaux. Dans cet article, nous nous concentrons sur la résolution de ces trois défis, auxquels les méthodes existantes peinent à répondre, et proposons un nouveau détecteur facial, nommé MogFace. Dans notre approche MogFace, trois composants clés sont introduits de manière indépendante afin d'améliorer les performances : une stratégie d'exploitation adaptative en temps réel et incrémentale du mining d'ancres (Adaptive Online Incremental Anchor Mining Strategy), une stratégie d'amélioration sélective à plusieurs échelles (Selective Scale Enhancement Strategy) et un module hiérarchique sensible au contexte (Hierarchical Context-Aware Module). Enfin, à notre connaissance, MogFace est actuellement le meilleur détecteur facial classé sur le leader-board Wider Face, remportant la première place dans toutes les scénarios d'évaluation. Le code source est disponible à l'adresse suivante : \url{https://github.com/damo-cv/MogFace}.

MogFace : Vers une compréhension plus approfondie de la détection faciale | Articles de recherche récents | HyperAI