HyperAIHyperAI
منذ 2 أشهر

شبكة الانتباه غير المحلية الفعالة مكانيًا وزمانيًا لإعادة التعرف على الأشخاص في الفيديو

Chih-Ting Liu; Chih-Wei Wu; Yu-Chiang Frank Wang; Shao-Yi Chien
شبكة الانتباه غير المحلية الفعالة مكانيًا وزمانيًا لإعادة التعرف على الأشخاص في الفيديو
الملخص

التعريف بإعادة تحديد الهوية الشخصية القائمة على الفيديو (Re-ID) يهدف إلى مطابقة سلاسل الفيديو للمشاة عبر كاميرات غير متداخلة. إنها مهمة عملية ومعقدة تتعلق بكيفية دمج المعلومات المكانية والزمانية للفيديو في تمثيله الخصائصي. بينما تتعلم معظم الطرق الحالية خصائص الفيديو من خلال جمع الخصائص الصورية وتصميم آليات الانتباه في الشبكات العصبية، فإنها تستكشف فقط الارتباط بين الإطارات على مستوى الخصائص العليا. في هذا العمل، نستهدف تحسين الخصائص الوسيطة بالإضافة إلى الخصائص العليا باستخدام عمليات انتباه غير محلية ونقدم مساهمتين رئيسيتين: (i) نقترح شبكة انتباه الفيديو غير المحلية (NVAN) لدمج خصائص الفيديو في التمثيل على مستويات خصائص متعددة. (ii) نقدم أيضًا شبكة انتباه الفيديو غير المحلية ذات الكفاءة المكانية والزمانية (STE-NVAN) لتقليل التعقيد الحسابي من خلال استكشاف الأثر الزائد المكاني والزماني الموجود في مقاطع الفيديو للمشاة. أظهرت التجارب الواسعة أن شبكتنا NVAN تتفوق على أفضل الأساليب الحالية بنسبة 3.8% في دقة الرتبة الأولى على مجموعة بيانات MARS، كما أكدت أن شبكتنا STE-NVAN تتميز بتأثير حسابي أقل بكثير مقارنة بالأساليب الموجودة.注释:- "Video-based person re-identification" 翻译为 "التعريف بإعادة تحديد الهوية الشخصية القائمة على الفيديو"- "Non-local Video Attention Network" 翻译为 "شبكة انتباه الفيديو غير المحلية (NVAN)"- "Spatially and Temporally Efficient Non-local Video Attention Network" 翻译为 "شبكة انتباه الفيديو غير المحلية ذات الكفاءة المكانية والزمانية (STE-NVAN)"- "MARS dataset" 翻译为 "مجموعة بيانات MARS"

شبكة الانتباه غير المحلية الفعالة مكانيًا وزمانيًا لإعادة التعرف على الأشخاص في الفيديو | أحدث الأوراق البحثية | HyperAI