HyperAIHyperAI

Command Palette

Search for a command to run...

لينكس: نحو توليد فيديو شخصي عالي الدقة

Shen Sang Tiancheng Zhi Tianpei Gu Jing Liu Linjie Luo

الملخص

نقدّم نموذج "ليكس" (Lynx)، وهو نموذج عالي الدقة لإنشاء مقاطع فيديو شخصية من صورة إدخال واحدة. تم بناء ليكس على نموذج أساسي مفتوح المصدر يُعرف بـ "مُحول التشتت" (Diffusion Transformer - DiT)، حيث يُقدّم ليكس مكونين خفيفي الوزن (أداة تكييف) لضمان الحفاظ على الهوية. تُستخدم أداة الهوية (ID-adapter) مع مُحوّل "بيروسيفر" (Perceiver Resampler) لتحويل المُدمجات الوجهية المستمدة من خوارزمية ArcFace إلى رموز هوية مدمجة، تُستخدم كشرط لتحديد الهوية. أما أداة المرجع (Ref-adapter)، فهي تدمج ميزات VAE الكثيفة من مسار مرجعي ثابت، وتنقل تفاصيل دقيقة عبر جميع طبقات المحول من خلال الانتباه المتقاطع (cross-attention). يُسهم هذان المكوّنان معًا في ضمان الحفاظ القوي على الهوية، مع الحفاظ على اتساق الزمنية وواقعية الصورة البصرية. وقد أظهر ليكس أداءً متفوقًا في تقييمه على معيار مُختَرَق يشمل 40 موضوعًا و20 مطالبة غير متحيزة، ما أنتج 800 حالة اختبار، حيث أثبت تشابهًا عالياً في ملامح الوجه، واتباعًا جيدًا للمطالبات، ونوعية فيديو قوية، مما يُعدّ تقدماً ملموسًا في مجال إنشاء مقاطع فيديو شخصية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
لينكس: نحو توليد فيديو شخصي عالي الدقة | مستندات | HyperAI