Représentation de rotation 6D pour l'estimation de l'orientation de la tête sans contrainte

Dans cet article, nous présentons une méthode pour l'estimation de la pose de tête en bout à bout sans contrainte. Nous abordons le problème des étiquettes de rotation ambigües en introduisant une formalisation par matrice de rotation pour nos données de référence, et proposons une représentation continue en 6D de la matrice de rotation afin d’assurer une régression directe efficace et robuste. Grâce à cette approche, notre méthode est capable d’apprendre la totalité de la rotation, contrairement aux méthodes antérieures qui limitaient la prédiction de la pose à un angle étroit afin d’obtenir des résultats satisfaisants. En outre, nous proposons une fonction de perte basée sur la distance géodésique, qui pénalise notre réseau en tenant compte de la géométrie de la variété SO(3). Des expériences menées sur les jeux de données publics AFLW2000 et BIWI démontrent que notre méthode dépasse significativement les autres approches de pointe, avec une amélioration pouvant atteindre 20 %. Nous mettons à disposition le code d’entraînement et de test ainsi que nos modèles pré-entraînés : https://github.com/thohemp/6DRepNet.