Jingxi Chen Zongxia Li Zhichao Liu Guangyao Shi Xiyang Wu Fuxiao Liu Cornelia Fermuller Brandon Y. Feng Yiannis Aloimonos

الملخص
ما الدور الذي تلعبه الإطار الأول في نماذج توليد الفيديو؟ يُنظر Traditionally إلى الإطار الأول باعتباره النقطة الابتدائية المكانية-الزمنية للفيديو، ويعتبر ببساطة بذرة للتحريك اللاحق. في هذا العمل، نكشف عن منظور جذري مختلف: فالموديلات الفيديوية تُعامل الإطار الأول ضمنيًا كمُخزن مفاهيمي يخزن الكيانات البصرية لإعادة استخدامها لاحقًا أثناء التوليد. وباستغلال هذا التوصّل، نُظهر إمكانية تحقيق تخصيص محتوى فيديو قوي وشامل في سيناريوهات متنوعة، باستخدام فقط 20-50 مثالًا تدريبيًا، دون الحاجة إلى تغيير في البنية المعمارية أو التدريب المُعدّل على نطاق واسع. هذا يكشف عن قدرة قوية ومُهملة في نماذج توليد الفيديو لتمكين التخصيص القائم على المراجع.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.