Régression de Pose Cinématique Profonde

L'apprentissage de la posture d'objets articulés est intrinsèquement difficile en raison de la dimension élevée de la posture et des nombreuses contraintes structurelles qu'elle présente. La plupart des travaux existants ne modélisent pas ces contraintes et ne garantissent pas la validité géométrique de leurs estimations de posture, nécessitant ainsi un post-traitement pour récupérer la géométrie correcte si nécessaire, ce qui est fastidieux et sous-optimal. Dans cette étude, nous proposons d'intégrer directement un modèle cinématique d'objet au sein de l'apprentissage par réseau neuronal profond pour l'estimation générale de la posture d'objets articulés. La fonction cinématique est définie sur les variables de mouvement de l'objet adéquatement paramétrées. Elle est différentiable et peut être utilisée dans l'optimisation basée sur la descente de gradient lors de l'entraînement du réseau. Les connaissances a priori sur le modèle géométrique de l'objet sont pleinement exploitées, garantissant ainsi que la structure soit valide. Nous présentons des résultats expérimentaux convaincants sur un exemple simplifié et sur le problème d'estimation de la posture humaine en 3D. Pour ce dernier, nous obtenons des résultats à l'état de l'art sur le jeu de données Human3.6M.