HyperAIHyperAI

Command Palette

Search for a command to run...

Sur la représentation et la méthodologie pour l’estimation de la pose de la tête à large et courte portée

Cobo Alejandro ; Valle Roberto ; Buenaposada José M. ; Baumela Luis

Résumé

L'estimation de la pose de la tête (HPE) est un problème d'intérêt en vision par ordinateur pour améliorer les performances des tâches de traitement facial dans des configurations semi-frontales ou en profil. Les applications récentes nécessitent l'analyse des visages sur une plage de rotation complète de 360°. Les approches traditionnelles utilisées pour résoudre les cas semi-frontaux et en profil ne sont pas directement applicables à la rotation complète. Dans cet article, nous analysons la méthodologie pour l'estimation de la pose de la tête à courte et longue portée, et discutons des représentations et métriques appropriées pour chaque cas. Nous montrons que la représentation populaire des angles d'Euler est un bon choix pour l'estimation de la pose de la tête à courte portée, mais pas pour les rotations extrêmes. Cependant, le problème du blocage cardanique (gimbal lock) des angles d'Euler les empêche d'être utilisés comme une métrique valable dans toute configuration. Nous réexaminons également la méthodologie actuelle d'évaluation inter-bases de données et notons que le manque d'alignement entre les systèmes de référence des bases de données d'entraînement et de test biaise négativement les résultats de tous les articles dans la littérature. Nous introduisons une procédure pour quantifier ce désalignement et une nouvelle méthodologie pour l'estimation inter-bases de données de la pose de la tête qui établit un nouvel état de l'art (SOTA) plus précis pour le benchmark 300W-LP|Biwi. Nous proposons également une généralisation de la métrique de distance angulaire géodésique qui permet la construction d'une fonction perte contrôlant la contribution de chaque échantillon d'entraînement à l'optimisation du modèle. Enfin, nous présentons un benchmark HPE à large portée basé sur le data set CMU Panoptic.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp