Command Palette
Search for a command to run...
ريتيناتراك: الكشف والتعقب المشترك على مرحلة واحدة في الوقت الفعلي
ريتيناتراك: الكشف والتعقب المشترك على مرحلة واحدة في الوقت الفعلي
Zhichao Lu Vivek Rathod Ronny Votel Jonathan Huang
الملخص
بشكل تقليدي، تُجرى عملية تتبع الكائنات متعددة وتحديد الكائنات باستخدام أنظمة منفصلة، حيث ركّزت معظم الدراسات السابقة بشكل حصري على أحد الجانبين على حساب الآخر. ورغم أن أنظمة التتبع تستفيد بوضوح من الوصول إلى نتائج كشف دقيقة، إلا أن هناك أدلة وافرة في الأدبيات تشير إلى أن أنظمة الكشف نفسها يمكن أن تستفيد من التتبع، الذي يمكنه مثلاً تحسين تمهيد التنبؤات عبر الزمن. في هذا البحث، نركّز على نموذج التتبع من خلال الكشف في سياق القيادة الذاتية، حيث يُعد كلا المهمتين حاسمين لنجاح النظام. نقترح نموذجًا متكاملًا بسيطًا من حيث المفهوم وفعالًا من حيث الأداء، يُسمى RetinaTrack، والذي يُعدّل منهجية RetinaNet الشهيرة ذات المرحلة الواحدة بحيث تصبح قابلة لتدريب التضمين على مستوى الكائنات (instance-level embedding). ونُظهر، من خلال تقييمات على مجموعة بيانات Waymo Open Dataset، أننا نتفوّق على خوارزمية تتبع حديثة من أحدث التقنيات، مع استهلاك أقل بكثير من الموارد الحسابية. نعتقد أن نهجنا البسيط لكن الفعّال يمكن أن يُشكّل قاعدة قوية للدراسات المستقبلية في هذا المجال.