العثور على أنابيب الإجراء باستخدام إطار نموذجي من كثافة منخفضة إلى كثافة عالية

أصبحت مهمة الكشف عن الأفعال الفضائية-الزمنية موضوعًا يجذب اهتمامًا متزايدًا بين الباحثين. تعتمد الطرق السائدة الحالية على المعلومات القصيرة الأجل والكشف الكثيف المتسلسل لكل إطار أو مقطع على حدة لحل هذه المشكلة. وعلى الرغم من فعاليتها، إلا أن هذه الطرق أظهرت استخدامًا غير كافٍ للمعلومات الطويلة الأجل، كما أنها عرضة للبطء وعدم الكفاءة. في هذه الورقة، نقترح لأول مرة إطار عمل كفؤًا يُولِّد اقتراحات أنبوب الأفعال من تدفقات الفيديو بمرور واحد فقط، وبطريقة نادرة-كثيفة. تتميز هذه البنية بخاصيتين رئيسيتين: (1) يتم استخدام المعلومات القصيرة الأجل والطويلة الأجل بشكل صريح داخل شبكتنا الفضائية-الزمنية، (2) تم تصميم وحدة جديدة لاستخلاص الميزات الديناميكية (DTS) لتقريب إخراج الأنبوب بشكل فعّال مع الحفاظ على قابلية النظام للتعامل. تم تقييم فعالية نموذجنا على مجموعات بيانات المعايير UCF101-24 وJHMDB-21 وUCFSports، وحقق نتائج واعدة تُعدّ منافسة للطرق الرائدة في مجالها. وقد أدى الاستراتيجية النادرة-الكثيفة المقترحة إلى جعل إطارنا أكثر كفاءة بحوالي 7.6 مرة مقارنة بالمنافس الأقرب له.