HyperAI

La génération de têtes parlantes est une sous-tâche de la vision par ordinateur qui se concentre sur la création de portraits de têtes parlantes dynamiques à partir d'images faciales statiques. L'objectif de cette tâche est de synthétiser des animations faciales réalistes et cohérentes grâce à la technologie d'apprentissage profond, afin d'atteindre une expérience d'interaction homme-machine naturelle. Sa valeur d'application réside dans les présentateurs virtuels, les visioconférences et l'industrie du divertissement, où elle peut considérablement améliorer l'immersion et l'engagement des utilisateurs.

VoxCeleb2 - 1-shot learning

Fast Bi-layer Avatars (medium size)

VoxCeleb1 - 1-shot learning

Few-shot Adversarial Model

VoxCeleb1 - 32-shot learning

Few-shot Adversarial Model

VoxCeleb1 - 8-shot learning

Few-shot Adversarial Model

VoxCeleb2 - 8-shot learning

CainGAN

100 sleep nights of 8 caregivers

Ashok