MetaPose : Estimation rapide de la posture 3D à partir de multiples vues sans supervision 3D

À l'ère de l'apprentissage profond, l'estimation de la posture humaine à partir de plusieurs caméras avec une calibration inconnue n'a guère attiré l'attention jusqu'à présent. Nous démontrons comment entraîner un modèle neuronal pour accomplir cette tâche avec une grande précision et un surcoût de latence minimal. Le modèle proposé prend en compte l'incertitude de la localisation des articulations due aux occultations provenant de multiples vues, et ne nécessite que des données de points clés 2D pour son entraînement. Notre méthode surpasse à la fois les ajustements classiques par bundle et les méthodes mono-oculaires 3D faiblement supervisées sur le jeu de données bien établi Human3.6M, ainsi que sur le jeu de données plus complexe Ski-Pose PTZ (in-the-wild).