الملخص

إن سعي تحقيق التحكم كمعيار أعلى في إنشاء المحتوى المرئي قد أدى إلى تقدم ملحوظ في توليد الصور القابلة للتخصيص. ومع ذلك، لا يزال تحقيق توليد الفيديو القابل للتحكم يُعد تحديًا كبيرًا نظرًا لتنوع الديناميات الزمنية الكبير والمتطلبات المرتبطة بالاتساق الزمني عبر الإطارات المختلفة. استنادًا إلى نموذج التوليد التجميعي، تقدم هذه الدراسة نموذج VideoComposer الذي يتيح للمستخدمين تجميع فيديو بطرق مرنة باستخدام شروط نصية، وشروط مكانية، والأهم من ذلك شروط زمنية. وبشكل خاص، وبما أن بيانات الفيديو تتميز بخصائص معينة، نُدخل متجه الحركة المستخلص من الفيديوهات المُضغطة كإشارة تحكم صريحة لتوجيه الديناميات الزمنية. بالإضافة إلى ذلك، طوّرنا ما يُعرف بـ "مُشفر الشروط المكانية والزمنية" (STC-encoder)، الذي يعمل كواجهة موحدة لدمج العلاقات المكانية والزمنية للإدخالات المتسلسلة بشكل فعّال، مما يمكّن النموذج من الاستفادة الأفضل من الشروط الزمنية، وبالتالي تحقيق اتساق أعلى بين الإطارات. تشير النتائج التجريبية الواسعة إلى أن VideoComposer قادر على التحكم في الأنماط المكانية والزمنية معًا داخل الفيديو المولّد بأشكال متعددة، مثل الوصف النصي، أو سلسلة من الرسومات التخطيطية، أو فيديو مرجعي، أو حتى حركات مُصممة يدويًا. سيتم الإفصاح عن الكود والنماذج المستخدمة بشكل عام عبر الرابط التالي: https://videocomposer.github.io.

ملف PDF المصدر عرض الكود

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Command Palette

VideoComposer: تركيب إنتاج الفيديو مع التحكم في الحركة

Xiang Wang Hangjie Yuan Shiwei Zhang Dayou Chen Jiuniu Wang Yingya Zhang Yujun Shen Deli Zhao Jingren Zhou

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

VideoComposer: تركيب إنتاج الفيديو مع التحكم في الحركة

Xiang Wang Hangjie Yuan Shiwei Zhang Dayou Chen Jiuniu Wang Yingya Zhang Yujun Shen Deli Zhao Jingren Zhou

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

VideoComposer: تركيب إنتاج الفيديو مع التحكم في الحركة

Xiang Wang Hangjie Yuan Shiwei Zhang Dayou Chen Jiuniu Wang Yingya Zhang Yujun Shen Deli Zhao Jingren Zhou

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters