Neural Body Fitting : Unification de l'apprentissage profond et de l'estimation de la posture et de la forme humaine basée sur des modèles

La prédiction directe de la posture et de la forme du corps en 3D reste un défi même pour les modèles d'apprentissage profond hautement paramétrés. La cartographie de l'espace d'image 2D vers l'espace de prédiction est complexe : les ambiguïtés de perspective rendent la fonction de perte bruyante et les données d'entraînement sont rares. Dans cet article, nous proposons une nouvelle approche (Neural Body Fitting (NBF)). Elle intègre un modèle statistique du corps au sein d'un CNN, en exploitant une segmentation sémantique fiable des parties corporelles par le bas et des contraintes robustes du modèle corporel par le haut. Le NBF est entièrement différentiable et peut être entraîné à l'aide d'annotations 2D et 3D. À travers des expériences détaillées, nous analysons comment les composants de notre modèle influencent les performances, en particulier l'utilisation de segmentations de parties comme représentation intermédiaire explicite, et présentons un cadre robuste et efficacement entraînable pour l'estimation de la posture humaine en 3D à partir d'images 2D, avec des résultats compétitifs sur des benchmarks standards. Le code sera mis à disposition sur http://github.com/mohomran/neural_body_fitting.