Estimation de la posture 3D du corps entier basée sur un réseau d'attention sur graphe sémantique et sur des informations de distance

Ces dernières années, une grande diversité de méthodes ont été proposées pour l’estimation de la posture 3D. Parmi celles-ci, les mécanismes d’attention auto-attentionnelle et les convolutions sur graphe se sont avérés être des approches efficaces et pratiques. En reconnaissant les forces de ces deux techniques, nous avons développé un nouveau réseau d’attention sur graphe sémantique, capable de tirer parti de la capacité de l’attention auto-attentionnelle à capturer le contexte global, tout en exploitant les convolutions sur graphe pour modéliser les connexions locales et les contraintes structurelles du squelette. Nous avons également conçu un décodeur de parties corporelles, qui aide à extraire et à affiner les informations relatives à des segments spécifiques du corps. En outre, notre approche intègre des informations de distance, renforçant ainsi la capacité du modèle à comprendre et à prédire avec précision les relations spatiales. Enfin, nous introduisons une fonction de perte géométrique, qui impose une contrainte critique sur la structure du squelette corporel, garantissant que les prédictions du modèle respectent les limites naturelles des postures humaines. Les résultats expérimentaux confirment l’efficacité de notre approche, démontrant que chaque composant du système est essentiel pour améliorer les performances d’estimation de posture. En comparaison avec les méthodes de pointe, le travail proposé non seulement atteint mais dépasse les références actuelles.