HyperAIHyperAI
منذ 16 أيام

AutoLoc: التحديد الزمني للإجراءات الضعيف المُعلَّم في مقاطع الفيديو غير المُقَصَّصة

{Shih-Fu Chang, Kazuyuki Miyazawa, Hang Gao, Zheng Shou, Lei Zhang}
AutoLoc: التحديد الزمني للإجراءات الضعيف المُعلَّم في مقاطع الفيديو غير المُقَصَّصة
الملخص

التحديد الزمني للإجراءات (TAL) في الفيديوهات غير المُعدّلة مهم جدًا لعدة تطبيقات. ولكن من المكلف جدًا إجراء التسمية على مستوى المقاطع (فئة الإجراء والحدود الزمنية). هذا يُثير اهتمامًا بمعالجة TAL باستخدام الإشراف الضعيف، أي أن التسميات فقط على مستوى الفيديو متاحة أثناء التدريب. ومع ذلك، فإن الطرق المتطورة حاليًا لـ TAL ذات الإشراف الضعيف تركز فقط على إنشاء تسلسل تفعيل الفئة (CAS) الجيد عبر الزمن، ثم تستخدم تجاوزًا بسيطًا على CAS لتحديد مواقع الإجراءات. في هذا البحث، نطور أولًا إطار عمل جديد لـ TAL ذات الإشراف الضعيف يُسمى AutoLoc، والذي يُنبِّئ مباشرةً بحدود الزمن لكل حالة إجراء. ونُقدّم خسارة جديدة تُسمى خسارة التقابل الخارجي-الداخلي (OIC) لاستكشاف تلقائي للإشراف على مستوى المقاطع الضروري لتدريب نموذج التنبؤ بالحدود الزمنية. تُظهر نتائج طريقتنا تحسنًا كبيرًا: عند حد التداخل بين الوحدات (IoU) 0.5، تُحسّن طريقتنا متوسط دقة التصنيف (mAP) على THUMOS'14 من 13.7% إلى 21.2%، وتحسّن mAP على ActivityNet من 7.4% إلى 27.3%. كما يُعدّ أمرًا مُحفّزًا جدًا أن طريقة الإشراف الضعيف لدينا تحقق نتائج مماثلة لبعض الطرق ذات الإشراف الكامل.

AutoLoc: التحديد الزمني للإجراءات الضعيف المُعلَّم في مقاطع الفيديو غير المُقَصَّصة | أحدث الأوراق البحثية | HyperAI