منذ 8 أشهر

الملخص

نقدم نهجًا بسيطًا يمكن من خلاله تحويل مُشفِّر ViT إلى نموذج فيديو فعّال، قادر على العمل بسلاسة مع مدخلات الصور والفيديوهات. من خلال أخذ عينات مدخلات متباعدة، يكون النموذج قادرًا على التدريب والاستدلال من كلا المدخلات. يتميز النموذج بمرونته وقابليته للتوسع، ويمكن تكييفه مع ViTs المدربة مسبقًا على نطاق واسع دون الحاجة إلى إعادة تدريب كامل. حقق النموذج أفضل النتائج الحالية (SOTA)، وسيتم إتاحة الكود كمصدر مفتوح.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار