Talking Head Generation
La génération de têtes parlantes est une sous-tâche de la vision par ordinateur qui se concentre sur la création de portraits de têtes parlantes dynamiques à partir d'images faciales statiques. L'objectif de cette tâche est de synthétiser des animations faciales réalistes et cohérentes grâce à la technologie d'apprentissage profond, afin d'atteindre une expérience d'interaction homme-machine naturelle. Sa valeur d'application réside dans les présentateurs virtuels, les visioconférences et l'industrie du divertissement, où elle peut considérablement améliorer l'immersion et l'engagement des utilisateurs.
100 sleep nights of 8 caregivers
Ashok
VoxCeleb1 - 1-shot learning
Few-shot Adversarial Model
VoxCeleb1 - 32-shot learning
Few-shot Adversarial Model
VoxCeleb1 - 8-shot learning
Few-shot Adversarial Model
VoxCeleb2 - 1-shot learning
Fast Bi-layer Avatars (medium size)
VoxCeleb2 - 32-shot learning
VoxCeleb2 - 8-shot learning
CainGAN