HyperAIHyperAI

Command Palette

Search for a command to run...

DETR الموجه بالبروز لاسترجاع اللحظات وكشف النقاط البارزة

Gordeev Aleksandr ; Dokholyan Vladimir ; Tolstykh Irina ; Kuprashevich Maksim

الملخص

الطرق الحالية لاسترجاع اللحظات في الفيديو وكشف النقاط المهمة غير قادرة على مواءمة الخصائص النصية والفيديو بكفاءة، مما يؤدي إلى أداء غير راضٍ واستخدام محدود في الإنتاج. لحل هذه المشكلة، نقترح هندسة جديدة تستفيد من النماذج الأساسية الحديثة المصممة لهذا النوع من المواءمة. بالاشتراك مع آلية الانتباه الموجه بالبروز (Saliency-Guided Cross Attention) وهندسة DETR الهجينة، يعزز نهجنا الأداء بشكل كبير في مهام استرجاع اللحظات وكشف النقاط المهمة. لتحقيق تحسين أفضل، طورنا مجموعة بيانات InterVid-MR ذات نطاق واسع وجودة عالية للتدريب الأولي. باستخدامها، تحقق هندستنا نتائجًا رائدة على مقاييس QVHighlights وCharades-STA وTACoS. يوفر النهج المقترح حلًّا فعالًا وقابلًا للتوسع لكل من السيناريوهات الصفرية (zero-shot) وتغليظ التدريب (fine-tuning) في مهام الفيديو واللغة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp