HyperAIHyperAI

Command Palette

Search for a command to run...

TriDet: الكشف عن الإجراءات الزمنية مع نمذجة الحدود النسبية

Dingfeng Shi Yujie Zhong Qiong Cao Lin Ma Jia Li Dacheng Tao

الملخص

في هذه الورقة، نقدم إطارًا أحادي المرحلة يُدعى TriDet للكشف عن الأفعال الزمنية. تُعاني الطرق الحالية غالبًا من توقعات غير دقيقة لحدود الأفعال بسبب غموض حدود الأفعال في مقاطع الفيديو. وللتخفيف من هذه المشكلة، نقترح رأسًا جديدًا يُسمى Trident-head لتمثيل حدود الفعل من خلال توزيع احتمالي نسبي مقدر حول الحدود. وفي هرم الميزات الخاص بـ TriDet، نقترح طبقة فعالة تُسمى Perception بدرجة تكيفية قابلة للتوسع (SGP) لتقليل مشكلة فقدان الرتبة الناتجة عن الانتباه الذاتي التي تحدث في ميزات الفيديو، بالإضافة إلى جمع المعلومات عبر درجات زمنية مختلفة. وبفضل الرأس Trident-head وهرم الميزات المستند إلى SGP، يحقق TriDet أداءً متقدمًا على مستوى الحالة في ثلاث بيئات صعبة: THUMOS14 وHACS وEPIC-KITCHENS 100، مع تكاليف حسابية أقل مقارنة بالطرق السابقة. على سبيل المثال، يحقق TriDet متوسط دقة تقييم (mAP) قدره 69.3% على THUMOS14، متفوقًا على أفضل نتيجة سابقة بنسبة 2.5%، مع استهلاك فقط 74.6% من زمن التأخير الخاص بها. تم إصدار الكود على الرابط التالي: https://github.com/sssste/TriDet.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp