HyperAIHyperAI
il y a 2 mois

Réseau Générateur Faiblement Supervisé pour Multiples Hypothèses de Pose Humaine en 3D

Chen Li; Gim Hee Lee
Réseau Générateur Faiblement Supervisé pour Multiples Hypothèses de Pose Humaine en 3D
Résumé

L'estimation de la posture humaine en 3D à partir d'une seule image est un problème inverse en raison de l'ambiguïté inhérente à la profondeur manquante. Plusieurs travaux précédents ont abordé ce problème inverse en générant plusieurs hypothèses. Cependant, ces travaux sont fortement supervisés et nécessitent des correspondances 2D-3D véritables qui peuvent être difficiles à obtenir. Dans cet article, nous proposons un réseau neuronal profond faiblement supervisé pour résoudre le problème inverse et éviter la nécessité de disposer de correspondances 2D-3D véritables. À cette fin, nous concevons notre réseau pour modéliser une distribution de proposition que nous utilisons pour approcher la distribution postérieure cible inconnue et multimodale. Nous réalisons cette approximation en minimisant la divergence KL entre les distributions de proposition et cible, ce qui conduit à une erreur de réprojection 2D et un terme de perte a priori qui peuvent être faiblement supervisés. De plus, nous déterminons la solution la plus probable comme le mode conditionnel des échantillons en utilisant l'algorithme du décalage moyen (mean-shift). Nous évaluons notre méthode sur trois jeux de données de référence : Human3.6M, MPII et MPI-INF-3DHP. Les résultats expérimentaux montrent que notre approche est capable de générer plusieurs hypothèses plausibles et atteint des performances au niveau de l'état de l'art par rapport aux approches faiblement supervisées existantes. Notre code source est disponible sur le site web du projet.

Réseau Générateur Faiblement Supervisé pour Multiples Hypothèses de Pose Humaine en 3D | Articles de recherche récents | HyperAI