شبكة السياق الزمني لتحديد موقع النشاط في الفيديوهات

نقدم شبكة السياق الزمني (Temporal Context Network - TCN) لتحديد مواقع الأنشطة البشرية بدقة زمنية. مماثلةً لتصميم شبكات الـ Faster-RCNN، يتم وضع مقترحات بفواصل متساوية في الفيديو تغطي مقياسًا زمنيًا متعددًا. نقترح تمثيلًا جديدًا لتقييم هذه المقترحات. حيث أن جمع الخصائص داخل القطعة الزمنية فقط ليس كافيًا للتنبؤ بحدود النشاط، نقوم ببناء تمثيل يلتقط بشكل صريح السياق المحيط بالمقترح لتقييمه. بالنسبة لكل قطعة زمنية داخل المقترح، يتم أخذ عينات من الخصائص بمقياسين بشكل موحد وإدخالها إلى شبكة التعلم العصبي التلافيفية الزمنية (temporal convolutional neural network) للتصنيف. بعد تقييم المقترحات، يتم تطبيق تقنية القمع غير القصوى (non-maximum suppression) ويتم التصنيف للحصول على الكشف النهائي. تتفوق الشبكة الزمنية للسياق (TCN) على أفضل الأساليب الحالية في مجموعة بيانات ActivityNet ومجموعة بيانات THUMOS14.