الانحدار المحوّل المستهدف للتعقب الدقيق

يظل التتبع الدقيق مهمةً صعبة بسبب التغيرات في المظهر، وتغيرات الوضع والزاوية، والتغيرات الهندسية للهدف في الفيديوهات. تقدم المُتتبعات الحالية الخالية من المُثبتات (anchor-free) آلية انحدار فعالة، لكنها تفشل في إنتاج تقدير دقيق لمربعات الحدود. ولحل هذه المشكلات، يُعيد هذا البحث استخدام فرع انحدار يشبه مُحول (Transformer-alike)، يُسمى بالانحدار المُحوَّل للهدف (TREG)، لتحسين التتبع الخالي من المُثبتات بدقة. يكمن جوهر TREG في نمذجة العلاقة الثنائية بين العناصر في نموذج الهدف ومنطقة البحث، واستخدام التمثيل البصري المُحسّن للهدف الناتج لانحدار دقيق لمربعات الحدود. يُمكن لهذا التمثيل السياقي للهدف تعزيز المعلومات المتعلقة بالهدف، مما يساعد على تحديد حدود المربع بدقة، كما يُمكنه التصدي لتغيرات شكل الهدف إلى حد ما بفضل آلية المطابقة المحلية الكثيفة. بالإضافة إلى ذلك، تم تطوير آلية بسيطة لتحديث النموذج على الإنترنت لاختيار نماذج موثوقة، مما يعزز المقاومة أمام التغيرات في المظهر والتغيرات الهندسية للهدف مع مرور الوقت. أظهرت النتائج التجريبية على مجموعات معايير التتبع البصري، بما في ذلك VOT2018، VOT2019، OTB100، GOT10k، NFS، UAV123، LaSOT، وTrackingNet، أن TREG يحقق أداءً من الدرجة الأولى، حيث بلغ معدل النجاح 0.640 على LaSOT، مع سرعة تشغيل تقارب 30 إطارًا في الثانية. سيتم إتاحة الكود والنموذج على الرابط: https://github.com/MCG-NJU/TREG.