Redistribution d'échantillonnage et de calcul pour une détection faciale efficace

Bien que des progrès considérables aient été accomplis dans la détection faciale non contrôlée, la détection faciale efficace, à la fois à faible coût computationnel et à haute précision, demeure un défi ouvert. Dans cet article, nous montrons que les stratégies de sélection des données d'apprentissage et de répartition du calcul sont les clés d'une détection faciale à la fois efficace et précise. Motivés par ces observations, nous proposons deux méthodes simples mais efficaces : (1) la redistribution d'échantillonnage (SR), qui enrichit les échantillons d'apprentissage pour les étapes les plus nécessaires, en s'appuyant sur les statistiques des jeux de données de référence ; et (2) la redistribution du calcul (CR), qui réalloue le calcul entre le squelette (backbone), le cou (neck) et la tête (head) du modèle, selon une méthodologie de recherche soigneusement définie. Des expériences étendues sur WIDER FACE démontrent que la famille \scrfd proposée atteint un compromis état-de-l'art entre efficacité et précision dans une large gamme de contraintes computationnelles. En particulier, \scrfdf{34} dépasse le meilleur concurrent, TinaFace, de $3,86\%$ (AP sur les épreuves difficiles), tout en étant plus de \emph{3 fois plus rapide} sur GPU pour des images de résolution VGA. Nous mettons également à disposition notre code afin de faciliter les recherches futures.