تدريب غير مشرف لنموذج القابلية للتغير ثلاثي الأبعاد

نقدم طريقة لتدريب شبكة الانحدار من بيكسلات الصور إلى إحداثيات نموذج التحول ثلاثي الأبعاد باستخدام صور فوتوغرافية غير مصنفة فقط. تعتمد دالة الخسارة للتدريب على خصائص شبكة التعرف على الوجه، والتي يتم حسابها في الوقت الفعلي عن طريق تجهيز الوجوه المتوقعة باستخدام محرك تجهيز قابل للمفاضلة. لجعل التدريب من الخصائص ممكناً وتجنب آثار خداع الشبكة، نقدم ثلاثة أهداف: خسارة توزيع الدفعة التي تشجع على أن يتطابق توزيع الإخراج مع توزيع نموذج التحول، وخسارة العودة التي تضمن قدرة الشبكة على إعادة تفسير إخراجها بشكل صحيح، وخسارة الهوية متعددة الزوايا التي تقارن بين خصائص الوجه ثلاثي الأبعاد المتوقع والصورة الفوتوغرافية المدخلية من زوايا مشاهدة متعددة. نقوم بتدريب شبكة الانحدار باستخدام هذه الأهداف، ومجموعة من الصور الفوتوغرافية غير المصنفة، ونموذج التحول نفسه، ونظهر نتائجًا رائدة في مجالها (state-of-the-art).