Command Palette
Search for a command to run...
Sur la représentation et la méthodologie pour l’estimation de la pose de la tête à large et courte portée
Sur la représentation et la méthodologie pour l’estimation de la pose de la tête à large et courte portée
Cobo Alejandro ; Valle Roberto ; Buenaposada José M. ; Baumela Luis
Résumé
L'estimation de la pose de la tête (HPE) est un problème d'intérêt en vision par ordinateur pour améliorer les performances des tâches de traitement facial dans des configurations semi-frontales ou en profil. Les applications récentes nécessitent l'analyse des visages sur une plage de rotation complète de 360°. Les approches traditionnelles utilisées pour résoudre les cas semi-frontaux et en profil ne sont pas directement applicables à la rotation complète. Dans cet article, nous analysons la méthodologie pour l'estimation de la pose de la tête à courte et longue portée, et discutons des représentations et métriques appropriées pour chaque cas. Nous montrons que la représentation populaire des angles d'Euler est un bon choix pour l'estimation de la pose de la tête à courte portée, mais pas pour les rotations extrêmes. Cependant, le problème du blocage cardanique (gimbal lock) des angles d'Euler les empêche d'être utilisés comme une métrique valable dans toute configuration. Nous réexaminons également la méthodologie actuelle d'évaluation inter-bases de données et notons que le manque d'alignement entre les systèmes de référence des bases de données d'entraînement et de test biaise négativement les résultats de tous les articles dans la littérature. Nous introduisons une procédure pour quantifier ce désalignement et une nouvelle méthodologie pour l'estimation inter-bases de données de la pose de la tête qui établit un nouvel état de l'art (SOTA) plus précis pour le benchmark 300W-LP|Biwi. Nous proposons également une généralisation de la métrique de distance angulaire géodésique qui permet la construction d'une fonction perte contrôlant la contribution de chaque échantillon d'entraînement à l'optimisation du modèle. Enfin, nous présentons un benchmark HPE à large portée basé sur le data set CMU Panoptic.