HyperAIHyperAI

Command Palette

Search for a command to run...

Apprentissage résiduel multiscale de morceaux séquentiels de convolution de graphe pour la prédiction du mouvement humain

Mohsen Zand Ali Etemad Michael Greenspan

Résumé

Une nouvelle méthode est proposée pour la prédiction du mouvement humain en apprenant les dépendances temporelles et spatiales. Récemment, des graphes multiscales ont été développés afin de modéliser le corps humain à des niveaux d'abstraction plus élevés, conduisant à des prédictions de mouvement plus stables. Toutefois, les méthodes actuelles fixent a priori les niveaux d'échelle et combinent des articulations spatialement proches pour générer des échelles plus grossières sur la base de connaissances préalables sur l'anatomie humaine, bien que les motifs de mouvement dans différentes séquences varient considérablement et ne s'alignent pas toujours avec un graphe fixe reliant des articulations spatialement. Un autre problème des méthodes basées sur les réseaux de convolution de graphe réside dans le phénomène de « collapse de modes », où les poses prédites convergent vers une pose moyenne sans mouvement discernable, particulièrement dans les prédictions à long terme. Pour relever ces défis, nous proposons ResChunk, un réseau end-to-end qui explore dynamiquement les composantes du corps corrélées en se basant sur les relations par paires entre toutes les articulations au sein de chaque séquence. ResChunk est entraîné pour apprendre les résidus entre des segments de séquence cible de manière autoregressive, afin de renforcer les connexions temporelles entre segments consécutifs. Il s'agit donc d'un modèle de prédiction séquence-à-séquence prenant en compte les caractéristiques spatio-temporelles dynamiques des séquences à plusieurs échelles. Nos expériences sur deux jeux de données de référence exigeants, CMU Mocap et Human3.6M, démontrent que notre méthode est capable de modéliser efficacement l'information séquentielle pour la prédiction du mouvement et surpasse les techniques existantes, établissant ainsi un nouveau record d'état de l'art. Le code est disponible à l'adresse suivante : https://github.com/MohsenZand/ResChunk.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Apprentissage résiduel multiscale de morceaux séquentiels de convolution de graphe pour la prédiction du mouvement humain | Articles | HyperAI