Adaptation Prenant en Compte l'Incertain pour l'Estimation de la Posture Humaine 3D Auto-Supervisée

Les progrès dans l'estimation monulaire de la posture humaine en 3D sont dominés par des techniques supervisées nécessitant des annotations de posture 2D/3D à grande échelle. Ces méthodes se comportent souvent de manière erratique en l'absence de toute provision pour rejeter les données hors distribution (out-of-distribution) inconnues. À cette fin, nous formulons l'apprentissage de la posture humaine en 3D comme un problème d'adaptation de domaine non supervisée. Nous introduisons MRP-Net, qui comprend une architecture commune de réseau neuronal profond avec deux têtes de sortie souscrivant à deux configurations distinctes : a) localisation articulaire sans modèle et b) régression paramétrique basée sur un modèle. Cette conception nous permet de dériver des mesures appropriées pour quantifier l'incertitude des prédictions à la fois au niveau de la posture et au niveau articulaire. En ne supervisant que les échantillons synthétiques étiquetés, le processus d'adaptation vise à minimiser l'incertitude pour les images cibles non étiquetées tout en maximisant celle-ci pour un jeu de données extrême hors distribution (backgrounds). Outre l'adaptation de la posture 3D synthétique à réelle, les incertitudes articulaires permettent d'étendre l'adaptation aux images du monde réel, même en présence de scénarios d'occlusion et de troncature. Nous présentons une évaluation exhaustive de l'approche proposée et démontrons des performances d'avant-garde sur des jeux de données de référence.