Command Palette
Search for a command to run...

الملخص
تطورت توليد الفيديو في الفضاء المستمر بسرعة كبيرة، بينما تأخرت النماذج المنفصلة بسبب تراكم الأخطاء وعدم الاتساق في السياقات الطويلة. في هذا العمل، نعيد النظر في نمذجة التوليد المنفصلة ونقدم نموذج "URSA" (URSA: توليد تفريقي موحد مع مسار مترِّي) – وهي إطار عمل بسيط لكنه قوي، يُسهم في تضييق الفجوة بين النماذج المنفصلة والمستمرة من حيث التوليد القابل للتوسع للفيديو. في جوهره، يُصِرُّ URSA على صيغة مُتكررة لتحسين عالمي لرموز الفضاء-الزمن المنفصلة. ويتضمن هذا النموذج تصميمين رئيسيين: "مسار مترِّي مُخطَّط" و"آلية تزامن خطوات زمنية تعتمد على الدقة". تُمكّن هذه التصاميم URSA من التوسع بكفاءة في توليد صور عالية الدقة ومقاطع فيديو طويلة المدة، مع تقليل كبير في عدد خطوات الاستنتاج. علاوةً على ذلك، نُقدِّم استراتيجية تدريب دقيق زمني غير متزامن تُوحِّد مهام متعددة ضمن نموذج واحد، بما في ذلك التداخل الزمني وتوليد الفيديو من صورة. أظهرت التجارب الواسعة على معايير صعبة لتوليد الفيديو والصور أن URSA يتفوّق باستمرار على الطرق المنفصلة الحالية، ويحقق أداءً يُقارَن بأفضل النماذج المستمرة الحديثة. يمكن الاطلاع على الكود والنموذج على الرابط: https://github.com/baaivision/URSA
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.