Auto-entraînement adversarial pour l'estimation de la pose humaine

Ce document présente une approche basée sur l'apprentissage profond pour le problème de l'estimation de la posture humaine. Nous utilisons des réseaux génératifs adverses comme paradigme d'apprentissage, dans lequel nous configurons deux réseaux en forme d'heures-glass (hourglass) empilés ayant la même architecture, l'un agissant comme générateur et l'autre comme discriminateur. Le générateur est utilisé comme estimateur de posture humaine après l'achèvement de l'entraînement. Le discriminateur distingue les cartes thermiques de vérité terrain des cartes thermiques générées, et rétropropage la perte antagoniste au générateur. Ce processus permet au générateur d'apprendre des configurations corporelles humaines plausibles et s'avère utile pour améliorer la précision des prédictions.