Command Palette
Search for a command to run...
ديفت: تضمينات الكشف للتتبع
ديفت: تضمينات الكشف للتتبع
Mohamed Chaabane Peter Zhang J. Ross Beveridge Stephen O' Hara
الملخص
تتبع العديد من الأنظمة الحديثة لتحديد الكائنات المتعددة (MOT) مبدأ التتبع عبر الكشف، والذي يتكون من كاشف يتبعه أسلوب لربط الكشفات بمسارات متعاقبة. تعود تاريخ محاولات دمج خصائص الحركة والملامح البصرية لتعزيز المقاومة أمام الظلال والتحديات الأخرى إلى فترة طويلة، لكن هذا النهج غالبًا ما يترافق مع تكلفة تتمثل في تعقيد التنفيذ وانخفاض السرعة. تشير النتائج الحديثة على معايير تتبع ثنائية الأبعاد الشهيرة إلى أن يمكن تحقيق أعلى الدرجات باستخدام كاشف حديث جدًا وطرق بسيطة نسبيًا للربط تعتمد على الانزلاقات المكانية في إطار واحد فقط، حيث تتفوق بشكل ملحوظ على الأساليب المعاصرة التي تعتمد على ملامح بصرية مُدرَّبة لمساعدة إعادة تحديد المسارات المفقودة. في هذه الورقة، نقترح نموذجًا فعّالًا متكاملًا للكشف والتعقب يُسمى DEFT، أو "الإدخالات البصرية لتعقب الكائنات". يعتمد نهجنا على شبكة تطابق كائنات تعتمد على الملامح البصرية، تُدرَّب بشكل مشترك مع شبكة كشف كائنات أساسية، كما تم إضافة شبكة LSTM لالتقاط قيود الحركة. يُظهر DEFT دقة وسرعة مماثلة للأساليب الرائدة في معايير التتبع الزمني الفعلي ثنائية الأبعاد، مع مزايا كبيرة من حيث المقاومة عند تطبيقه على بيانات تتبع أكثر تحديًا. كما يُحدث DEFT تقدمًا كبيرًا في تحدّي التتبع ثلاثي الأبعاد باستخدام كاميرا واحدة (nuScenes)، حيث يضاعف الأداء بأكثر من الضعف مقارنة بالطريقة الرائدة السابقة. تم إتاحة الشفرة المصدرية للعامة.