HyperAIHyperAI

Command Palette

Search for a command to run...

إعادة التفكير في شبكات ViTs الفيديوية: أنابيب الفيديو النادرة للتعلم المشترك للصور والفيديو

AJ Piergiovanni Weicheng Kuo Anelia Angelova

الملخص

نقدم نهجًا بسيطًا يمكن من خلاله تحويل مُشفِّر ViT إلى نموذج فيديو فعّال، قادر على العمل بسلاسة مع مدخلات الصور والفيديوهات. من خلال أخذ عينات مدخلات متباعدة، يكون النموذج قادرًا على التدريب والاستدلال من كلا المدخلات. يتميز النموذج بمرونته وقابليته للتوسع، ويمكن تكييفه مع ViTs المدربة مسبقًا على نطاق واسع دون الحاجة إلى إعادة تدريب كامل. حقق النموذج أفضل النتائج الحالية (SOTA)، وسيتم إتاحة الكود كمصدر مفتوح.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
إعادة التفكير في شبكات ViTs الفيديوية: أنابيب الفيديو النادرة للتعلم المشترك للصور والفيديو | مستندات | HyperAI