منذ 2 أشهر

الملخص

النماذج الحالية القائمة على الانتشار (diffusion-based) لترميز الوجوه تركز بشكل رئيسي على تحسين الجودة البصرية وواقعية التعبيرات، مع تجاهل مسألة زمن التوليد والأداء في الوقت الفعلي، مما يحد من نطاق تطبيقاتها في سيناريوهات البث المباشر. نقترح منصة "PersonaLive"، وهي إطار عمل جديد قائمة على الانتشار، مصمم لتوليد تعبيرات وجوه حية في الوقت الفعلي، باستخدام وصفات تدريب متعددة المراحل. بشكل محدد، نستخدم في البداية إشارات ضمنية هجينة، تشمل تمثيلات وجوه ضمنية ونقاط مفاتيح ثلاثية الأبعاد ضمنية، لتحقيق تحكم دقيق في الحركة على مستوى الصورة. ثم نقترح استراتيجية استخلاص مظهرية بخطوات أقل للقضاء على التكرار في المظهر أثناء عملية إزالة الضوضاء، مما يحسن بشكل كبير كفاءة الاستنتاج. وأخيرًا، نقدم نموذجًا جديدًا للبث التلقائي على شكل وحدات صغيرة (micro-chunk streaming generation) يعتمد على التوليد التكراري (autoregressive)، مزودًا بخوارزمية تدريب منزلقة وآلية لحفظ الإطارات الرئيسية السابقة، مما يمكّن من توليد مقاطع فيديو طويلة بتأخير منخفض وثبات عالٍ. أظهرت التجارب الواسعة أن "PersonaLive" تحقق أداءً متفوقًا على المستويات الحالية، مع تسريع يصل إلى 7-22 مرة مقارنة بالنماذج السابقة القائمة على الانتشار لتوليد تعبيرات الوجوه.

ملف PDF المصدر عرض الكود

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Zhiyuan Li Chi-Man Pun Chen Fang Jue Wang Xiaodong Cun

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Zhiyuan Li Chi-Man Pun Chen Fang Jue Wang Xiaodong Cun

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Zhiyuan Li Chi-Man Pun Chen Fang Jue Wang Xiaodong Cun

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

PersonaLive! توليد حركة صورة الوجه التعبيرية للبث الحي

Zhiyuan Li Chi-Man Pun Chen Fang Jue Wang Xiaodong Cun

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

PersonaLive! توليد حركة صورة الوجه التعبيرية للبث الحي

Zhiyuan Li Chi-Man Pun Chen Fang Jue Wang Xiaodong Cun

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

PersonaLive! توليد حركة صورة الوجه التعبيرية للبث الحي

Zhiyuan Li Chi-Man Pun Chen Fang Jue Wang Xiaodong Cun

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters