MotionTrack: تعلّم مؤشر الحركة لتعقب الكائنات المتعددة

تم تحقيق تقدم مهم في مجال التتبع متعدد الكائنات (MOT) بفضل التطور المستمر في تقنيات الكشف وتمييز الهوية (ReID). وعلى الرغم من هذه التطورات، لا يزال التتبع الدقيق للكائنات في السيناريوهات التي تتميز بملامح ظاهرية متشابهة وحركات متنوعة يشكل تحديًا. ويُعزى هذا التحدي إلى عاملين رئيسيين: ضعف تمييز ميزات ReID، واستخدام نماذج الحركة الخطية بشكل سائد في أنظمة التتبع متعدد الكائنات. وفي هذا السياق، نقدّم مُتتبعًا جديدًا يعتمد على الحركة، يُسمّى MotionTrack، ويتمحور حول مُقدّر حركة قابل للتعلّم، يعتمد حصريًا على معلومات مسار الكائن. ويُدمج هذا المُقدّر بشكل شمولي ميزات الحركة على مستويين من الدقة، بهدف تحسين نمذجة الديناميكيات الزمنية وتمكين التنبؤ الدقيق بحركة الكائنات المستقبلية. وبشكل خاص، تُستخدم آلية الانتباه الذاتي (self-attention) لالتقاط المعلومات على مستوى الرموز (token-level)، بينما تُستخدم طبقة MLP الديناميكية (Dynamic MLP) لنمذجة الميزات على مستوى القنوات (channel-level). ويُعدّ MotionTrack منهجية بسيطة وقابلة للتشغيل في الوقت الفعلي. وتشير النتائج التجريبية إلى أن MotionTrack يحقق أداءً متميزًا على مستويات متقدمة على مجموعات بيانات مثل Dancetrack وSportsMOT، التي تميّز بحركة كائنات معقدة للغاية.