Command Palette
Search for a command to run...
OmniRetarget : Génération de données préservant les interactions pour la locomotion et la manipulation globale des humanoïdes ainsi que l'interaction avec la scène
Lujie Yang Xiaoyu Huang Zhen Wu Angjoo Kanazawa Pieter Abbeel Carmelo Sferrazza et al

Résumé
Un paradigme dominant pour enseigner aux robots humanoïdes des compétences complexes consiste à rétroprojetter les mouvements humains en références cinématiques afin d’entraîner des politiques d’apprentissage par renforcement (RL). Toutefois, les pipelines de rétroprojection existants peinent souvent à surmonter l’écart d’embodiment significatif entre les humains et les robots, entraînant des artefacts physiquement invraisemblables tels que le glissement des pieds ou les pénétrations. Plus important encore, les méthodes courantes de rétroprojection négligent les interactions riches entre l’humain et les objets, ainsi qu’entre l’humain et l’environnement, qui sont essentielles à une locomotion expressive et à la locomotion-manipulation. Pour remédier à ce problème, nous introduisons OmniRetarget, un moteur de génération de données préservant les interactions, fondé sur un maillage d’interaction qui modélise explicitement et préserve les relations spatiales et de contact cruciales entre l’agent, le terrain et les objets manipulés. En minimisant la déformation laplacienne entre les maillages humain et robot tout en imposant des contraintes cinématiques, OmniRetarget génère des trajectoires cinématiquement réalisables. De plus, la préservation des interactions pertinentes pour la tâche permet une augmentation efficace des données, passant d’une seule démonstration à différentes incarnations robotiques, terrains et configurations d’objets. Nous évaluons de manière exhaustive OmniRetarget en rétroprojetant des mouvements provenant des bases de données OMOMO, LAFAN1 et de nos propres données de motion capture (MoCap), générant ainsi plus de 8 heures de trajectoires qui surpassent les méthodes de référence largement utilisées en termes de satisfaction des contraintes cinématiques et de préservation des contacts. Ces données de haute qualité permettent à des politiques RL proprioceptives d’exécuter avec succès des compétences complexes à horizon long (jusqu’à 30 secondes), telles que des parcours acrobatiques et des tâches de locomotion-manipulation, sur un humanoïde Unitree G1, entraînées uniquement avec 5 termes de récompense et une randomisation de domaine simple partagée par toutes les tâches, sans recours à un curriculum d’apprentissage.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.