Talking Head Generation
コンピュータビジョンは、機械が画像や動画を解釈し理解する技術です。その目的は、人間の視覚システムを模倣することで複雑なシーンの自動認識と分析を達成することにあります。この技術は、医療画像診断、自動運転、セキュリティ監視などの分野で広く応用されており、効率性と精度を大幅に向上させ、知能社会の発展に貢献しています。
100 sleep nights of 8 caregivers
Ashok
VoxCeleb1 - 1-shot learning
Few-shot Adversarial Model
VoxCeleb1 - 32-shot learning
Few-shot Adversarial Model
VoxCeleb1 - 8-shot learning
Few-shot Adversarial Model
VoxCeleb2 - 1-shot learning
Fast Bi-layer Avatars (medium size)
VoxCeleb2 - 32-shot learning
VoxCeleb2 - 8-shot learning
CainGAN