ATOM: تتبع دقيق من خلال تعظيم التداخل

في السنوات الأخيرة، شهدنا تحسينات مذهلة في صلابة تتبع الصور، ولكن التقدم في دقة التتبع كان محدودًا. حيث تم توجيه الاهتمام نحو تطوير تصنيفات قوية، تم إهمال مشكلة تقدير حالة الهدف بدقة إلى حد كبير. في الواقع، يتجه معظم أنظمة التتبع إلى استخدام بحث متعدد المقياس بسيط من أجل تقدير صندوق الحدود للهدف. نحن نعتقد أن هذا النهج محدود جوهريًا لأن تقدير الهدف هو مهمة معقدة تتطلب معرفة عالية المستوى حول الكائن.لمعالجة هذه المشكلة، نقترح هندسة تتبع جديدة تتكون من مكونات متخصصة لتقدير الهدف والتصنيف. يتم دمج المعرفة عالية المستوى في تقدير الهدف من خلال التعلم الواسع خارج الخط (offline). يتم تدريب مكون تقدير الهدف لدينا على التنبؤ بمدى التداخل بين الكائن المستهدف وصندوق الحدود المقدر. عن طريق دمج المعلومات الخاصة بالهدف بعناية، يحقق نهجنا دقة غير مسبوقة لصندوق الحدود. كما نقدم مكون تصنيف يتم تدريبه عبر الإنترنت لضمان قوة تمييزية عالية في وجود المشتتات. يحدد إطار عمل التتبع النهائي لدينا مستوى جديد من الطليعة في خمسة مقاييس تحدي صعبة. على مجموعة البيانات الجديدة ذات نطاق كبير TrackingNet، يحقق نظام التتبع الخاص بنا ATOM زيادة نسبية قدرها 15% مقارنة بأفضل طريقة سابقة، بينما يعمل بمعدل أكثر من 30 إطارًا في الثانية (FPS). يمكن الحصول على الرموز والموديلات من https://github.com/visionml/pytracking.