Command Palette
Search for a command to run...
Perte STAR : Réduction de l’ambiguïté sémantique dans la détection des points d’intérêt faciaux
Perte STAR : Réduction de l’ambiguïté sémantique dans la détection des points d’intérêt faciaux
Zhenglin Zhou extsuperscript1* Huaxia Li extsuperscript2* Hong Liu extsuperscript3* Nanyang Wang extsuperscript2 Gang Yu extsuperscript2 Rongrong Ji extsuperscript1†
Résumé
Récemment, la détection de points clés faciaux basée sur l'apprentissage profond a connu des améliorations significatives. Cependant, le problème d'ambiguïté sémantique dégrade les performances de détection. Plus précisément, l'ambiguïté sémantique entraîne une annotation incohérente et affecte négativement la convergence du modèle, ce qui se traduit par une précision moindre et des prédictions instables. Pour résoudre ce problème, nous proposons une perte d'Réduction d'Ambiguïté Auto-Adaptative (STAR) en exploitant les propriétés de l'ambiguïté sémantique. Nous constatons que l'ambiguïté sémantique provoque une distribution prédite anisotrope, ce qui nous inspire à utiliser cette distribution pour représenter l'ambiguïté sémantique. Sur cette base, nous concevons la perte STAR qui mesure l'anisotropie de la distribution prédite. Comparée à la perte de régression standard, la perte STAR est encouragée à être faible lorsque la distribution prédite est anisotrope, et ainsi atténue de manière adaptative l'impact de l'ambiguïté sémantique. De plus, nous proposons deux méthodes de restriction des valeurs propres qui permettent d'éviter à la fois les changements anormaux de la distribution et la convergence prématurée du modèle. Enfin, des expériences exhaustives montrent que la perte STAR surpasse les méthodes de pointe sur trois benchmarks, à savoir COFW, 300W et WFLW, avec un surcoût de calcul négligeable. Le code est disponible à l'adresse suivante : https://github.com/ZhenglinZhou/STAR.