LMOT: كشف وتعقب خفيف الوزن وفعال في الحشود
تُعدّ تتبع الكائنات المتعددة عنصراً أساسياً في العديد من تطبيقات الروبوتات ورؤية الحاسوب. ومع ذلك، فإن التقنيات الحالية لتتبع الكائنات المتعددة تُقدّم تنازلاً بين زمن التشغيل الحسابي ودقة التتبع، مما يُشكّل تحدياً في نشر هذه العمليات في التطبيقات الزمنية الحقيقية. في هذا البحث، نقدّم نموذجاً جديداً في الزمن الحقيقي يُسمّى LMOT، أي مُتتبع الكائنات المتعددة الخفيف، والذي يقوم بتنفيذ الكشف عن المشاة والتتبع بشكل متكامل. يُقدّم LMOT شبكة مشفرة مبسطة من نوع DLA-34 لاستخراج ميزات الكشف عن الصورة الحالية بطريقة حسابية فعّالة. علاوة على ذلك، نُولّد ميزات تتبع فعّالة باستخدام محول خطي (linear transformer) للإطار السابق للصورة والخريطة الحرارية المقابلة للكشف. ثم، يُدمج LMOT خريطة ميزات الكشف وخرائط ميزات التتبع في بنية متعددة الطبقات، ويُنفّذ ارتباطاً بياناتياً آنياً مكوناً من مرحلتين يعتمد على مرشح كالمان لإنشاء مسارات التتبع (tracklets). تم تقييم نموذجنا على مجموعات بيانات واقعية صعبة تشمل MOT16/17/20، حيث أظهر أن LMOT يتفوّق بشكل كبير على أحدث النماذج في سرعة الأداء الحسابي مع الحفاظ على مرونة عالية. ففي المتوسط، يُعدّ LMOT أسرع بعشرة أضعاف من النماذج الرائدة، مع تفوق بنسبة 3.8% فقط في الدقة، ما يجعله نموذجاً أكثر خفة من حيث الحوسبة.