Command Palette
Search for a command to run...
PHUMA : Jeu de données de locomotion humanoïde fondé sur le physique
Kyungmin Lee Sibeen Kim Minho Park Hyunseung Kim Dongyoon Hwang Hojoon Lee Jaegul Choo

Résumé
L’imitation du mouvement est une approche prometteuse pour la locomotion des humanoïdes, permettant aux agents d’acquérir des comportements proches de ceux des humains. Les méthodes existantes s’appuient généralement sur des jeux de données de capture de mouvement de haute qualité, tels qu’AMASS, mais ceux-ci sont rares et coûteux, ce qui limite leur échelle et leur diversité. Des études récentes tentent de surmonter cette limitation en exploitant à grande échelle des vidéos issues d’internet, comme illustré par Humanoid-X. Toutefois, ces approches introduisent fréquemment des artefacts physiques tels que des flottements, des pénétrations ou des glissements des pieds, qui entravent une imitation stable. En réponse, nous introduisons PHUMA, un jeu de données de locomotion humanoïde fondé sur des principes physiques, qui exploite à grande échelle des vidéos humaines tout en éliminant les artefacts physiques grâce à une curation rigoureuse des données et à une retargeting contrainte par la physique. PHUMA impose des limites articulaires, garantit le contact avec le sol et élimine les glissements des pieds, produisant ainsi des mouvements à la fois à grande échelle et physiquement fiables. Nous avons évalué PHUMA dans deux scénarios : (i) l’imitation de mouvements inédits à partir de vidéos d’essai enregistrées en propre, et (ii) le suivi de trajectoire guidé uniquement par le bassin. Dans les deux cas, les politiques entraînées sur PHUMA surpassent celles basées sur Humanoid-X et AMASS, réalisant des gains significatifs dans l’imitation de mouvements variés. Le code est disponible à l’adresse suivante : https://davian-robotics.github.io/PHUMA.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.