HyperAIHyperAI

Command Palette

Search for a command to run...

إطلاق إمكانات CLIP لاكتشاف مقاطع الفيديو المميزة

Donghoon Han Seunghyeon Seo Eunhwan Park Seong-Uk Nam Nojun Kwak

الملخص

النماذج متعددة الوسائط والنماذج اللغوية الكبيرة (LLMs) قد غيرت من مفهوم استخدام المعرفة في العالم المفتوح، مكشوفةً إمكانات جديدة في مجموعة متنوعة من المهام والتطبيقات. ومن بين هذه المجالات، استفاد مجال الفيديو بشكل كبير من قدراتها. في هذا البحث، نقدم طريقة HL-CLIP (Highlight-CLIP)، وهي طريقة مصممة للتفوق في مهمة كشف النقاط البارزة في الفيديو عن طريق الاستفادة من المعرفة المدربة مسبقًا التي تضمنها النماذج متعددة الوسائط. من خلال تحسين النموذج المُشفر متعدد الوسائط فقط مع تقنية التجميع البارزة التي ابتكرناها، تمكنا من تحقيق أفضل الأداء حتى الآن في مهمة كشف النقاط البارزة، وفقًا لمعيار QVHighlight Benchmark، حسب علم us.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
إطلاق إمكانات CLIP لاكتشاف مقاطع الفيديو المميزة | مستندات | HyperAI