Talking Face Generation
توليد الوجه المتحدث هو جزء من مجال الرؤية الحاسوبية يهدف إلى إنشاء سلسلة من الصور الوجهية المتناظرة من معاني الكلام المعطاة. الهدف من هذه المهمة هو تحقيق دمج طبيعي بين الصوت والفيديو، مما يضمن أن الوجه المُنشأ يعكس حركات الشفاه والتغيرات في التعبير أثناء الكلام بدقة، مما يعزز واقعية وتجربة التفاعل للشخصيات الافتراضية. ويحمل هذا الأمر أهمية كبيرة في التطبيقات مثل التفاعل بين الإنسان والحاسوب، الترفيه، والاتصال عن بعد.