ربط الهدف المرمي بالمرشحين للحفاظ على تتبع ما لا ينبغي تتبعه

تُشكّل وجود كائنات تشبه الهدف المُتتبع بشكل مُربك تحديًا جوهريًا في تتبع البصرية القائمة على المظهر. فهناك احتمال كبير أن تُصنف هذه الكائنات المشتتة خطأً على أنها الهدف نفسه، مما يؤدي في النهاية إلى فشل التتبع. في حين أن معظم الطرق تسعى إلى كبح تأثير هذه الكائنات من خلال نماذج مظهر أكثر قوة، نتبع نهجًا بديلًا.نُقترح متابعة الكائنات المشتتة من أجل الاستمرار في تتبع الهدف. ولتحقيق ذلك، نُقدّم شبكة ارتباط مُدرّبة، تُمكّننا من نقل هويات جميع المرشحين للهدف من إطار إلى آخر. ولحل مشكلة عدم توفر تطابق حقيقي (ground-truth) بين الكائنات المشتتة في تتبع البصرية، نُقترح استراتيجية تدريب تجمع بين التصنيفات الجزئية والرقابة الذاتية (self-supervision). وقد أجرينا تقييمًا تجريبيًا شاملاً وتحليلًا دقيقًا لنهجنا على عدة مجموعات بيانات صعبة. ويُحقّق مُتتبعنا حالة متقدمة جديدة (state-of-the-art) على ستة معايير، حيث بلغت درجة AUC 67.1% على مجموعة LaSOT، وحقق مكسبًا مطلقًا قدره +5.8% على مجموعة OxUvA الطويلة الأمد.