HyperAIHyperAI
il y a 3 mois

Modèles compositionnels profondément appris pour l'estimation de la posture humaine

{Wei Tang, Ying Wu, Pei Yu}
Modèles compositionnels profondément appris pour l'estimation de la posture humaine
Résumé

Les modèles compositionnels représentent les motifs à l’aide de hiérarchies de parties et sous-parties significatives. Leur capacité à caractériser les relations d’ordre élevé entre les parties du corps permet de résoudre les ambiguïtés de faible niveau présentes dans l’estimation de la posture humaine (HPE). Toutefois, les modèles compositionnels antérieurs reposent sur des hypothèses irréalistes concernant les relations entre sous-parties et parties, ce qui les rend incapables de modéliser des motifs compositionnels complexes. En outre, les espaces d’état de leurs parties de haut niveau peuvent être exponentiellement grands, ce qui complique à la fois l’inférence et l’apprentissage. Pour remédier à ces limitations, cet article présente un nouveau cadre, appelé Modèle Compositionnel Profondément Appris (DLCM), dédié à l’HPE. Ce cadre exploite les réseaux neuronaux profonds afin d’apprendre la compositionnalité des corps humains. Il donne ainsi naissance à un réseau doté d’une architecture compositionnelle hiérarchique et de phases d’inférence ascendante et descendante. Par ailleurs, nous proposons une nouvelle représentation des parties basée sur les os. Elle encode de manière compacte les orientations, les échelles et les formes des parties, tout en évitant les espaces d’état potentiellement très volumineux associés à celles-ci. Grâce à une complexité nettement réduite, notre approche surpasser les méthodes de pointe sur trois jeux de données de référence.