Détection précise du visage pour haute performance

La détection de visages a connu des progrès significatifs grâce aux avancées des réseaux neuronaux convolutifs profonds (CNNs). L'enjeu principal ces dernières années est d'améliorer la performance de détection des petits visages. À cet effet, de nombreuses études récentes proposent des stratégies spécifiques, redessinent l'architecture et introduisent de nouvelles fonctions de perte pour la détection d'objets minuscules. Dans ce rapport, nous partons de l'approche populaire RetinaNet en une étape et appliquons certaines astuces récentes pour obtenir un détecteur de visages à haute performance. Plus précisément, nous utilisons la fonction de perte Intersection over Union (IoU) pour la régression, mettons en œuvre une classification et une régression en deux étapes pour la détection, reprenons l'augmentation de données basée sur l'échantillonnage par ancrage pour l'entraînement, utilisons l'opération max-out pour la classification et adoptons une stratégie de test multi-échelle pour l'inférence. En conséquence, la méthode proposée de détection de visages atteint des performances d'état de l'art sur le jeu de données WIDER FACE, le plus populaire et le plus difficile dans le domaine de la détection de visages.