الحفاظ على واقعية الفيديو الأصلي: استبدال الوجه عالي الجودة لجودة سينمائية
الحفاظ على واقعية الفيديو الأصلي: استبدال الوجه عالي الجودة لجودة سينمائية
Zekai Luo Zongze Du Zhouhang Zhu Hao Zhong Muzhi Zhu Wen Wang Yuling Xi Chenchen Jing Hao Chen Chunhua Shen

الملخص
إن استبدال الوجه في الفيديو يُعد أمرًا بالغ الأهمية في إنتاج الأفلام والترفيه، حيث لا يزال تحقيق الدقة العالية والاتساق الزمني على طول تسلسلات فيديو طويلة ومعقدة يمثل تحديًا كبيرًا. مستوحاة من التطورات الحديثة في تحرير الصور الموجهة بالمرجع، نستكشف ما إذا كان من الممكن استغلال السمات البصرية الغنية من مقاطع الفيديو المصدرية بشكل مشابه لتعزيز الدقة والاتساق الزمني في استبدال الوجه في الفيديو. بناءً على هذه الرؤية، تقدم هذه الدراسة نموذج LivingSwap، أول نموذج لاستبدال الوجه في الفيديو يعتمد على المرجع المرئي. تعتمد طريقة عملنا على استخدام الإطارات الرئيسية كإشارات توجيهية لحقن الهوية المستهدفة، مما يتيح تحريرًا مرنًا وقابلًا للتحكم. وبدمج التوجيه بالمرجع المرئي مع التوجيه بالإطارات الرئيسية، يقوم النموذج بعملية التوصيل الزمني لضمان الحفاظ المستقر على الهوية وإعادة بناء عالية الدقة عبر تسلسلات فيديو طويلة. ولحل مشكلة ندرة البيانات الخاصة بالتدريب الموجه بالمرجع، قمنا ببناء مجموعة بيانات مزدوجة لاستبدال الوجه تُسمى Face2Face، وتم أيضًا عكس أزواج البيانات لضمان رقابة صحيحة على القيمة الحقيقية (ground-truth). أظهرت التجارب الواسعة أن طريقة عملنا تحقق نتائج من الطراز الرائد، حيث تدمج بسلاسة الهوية المستهدفة مع تعابير وضوء وحركة مقطع الفيديو المصدر، مع تقليل كبير في الجهد اليدوي المطلوب في سير العمل الإنتاجي. صفحة المشروع: https://aim-uofa.github.io/LivingSwap
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.