QDTrack: التعلم الشبه كثيف للتشابه في التتبع المتعدد للكائنات فقط بناءً على المظهر

تم الاعتراف بتعلم التشابه كخطوة حاسمة في تتبع الأشياء. ومع ذلك، فإن الطرق الحالية لتتبع الأشياء المتعددة تستخدم فقط تطابقًا نادرًا للحقائق الحقيقية كهدف تدريب، مما يتجاهل معظم المناطق المفيدة في الصور. في هذا البحث، نقدم تعلم التشابه شبه الكثيف (Quasi-Dense Similarity Learning)، الذي يُعدّ عينات كثيفة من مئات من مناطق الكائنات على زوج من الصور لغرض التعلم المقارن. ونُدمج هذا التعلم في التشابه مع عدد من كاشفات الأشياء الحالية لبناء نظام تتبع شبه كثيف (QDTrack)، والذي لا يتطلب انحدار التبديل (displacement regression) أو افتراضات حركية (motion priors). وجدنا أن الفضاء المميز الناتج يسمح بإجراء بحث بسيط عن أقرب الجيران (nearest neighbor search) في وقت الاستدلال لربط الأشياء. علاوةً على ذلك، نُظهر أن مخطط تعلم التشابه لدينا ليس محدودًا بالبيانات المرئية (الفيديوهات)، بل يمكنه تعلُّم التشابه الفعّال بين الكائنات حتى من مدخلات ثابتة، مما يُمكّن من تحقيق أداء تنافسي في التتبع دون الحاجة إلى تدريب على مقاطع فيديو أو استخدام مراقبة تتبع. أجرينا تجارب واسعة النطاق على مجموعة واسعة من معايير تتبع الأشياء الشهيرة (MOT benchmarks). ووجدنا أن، بالرغم من بساطته، يُنافس QDTrack أداء أفضل الطرق الحديثة في جميع المعايير، ويُحقّق حالة جديدة من التميز على معيار BDD100K MOT الكبير النطاق، مع إدخال حمل حوسبة ضئيل جدًا على كاشف الأشياء.