HyperAIHyperAI
منذ 2 أشهر

MOTRv2: تحسين تتبع الأهداف المتعددة من النهاية إلى النهاية باستخدام محددات الأهداف المدربة مسبقًا

Zhang, Yuang ; Wang, Tiancai ; Zhang, Xiangyu
MOTRv2: تحسين تتبع الأهداف المتعددة من النهاية إلى النهاية باستخدام محددات الأهداف المدربة مسبقًا
الملخص

في هذا البحث، نقترح نظام MOTRv2، وهو خط أنابيب بسيط ومعتدل الأداء لتعزيز تتبع الأجسام المتعددة من النهاية إلى النهاية باستخدام محدد أهداف مُدرب مسبقًا (pretrained object detector). تُعاني الطرق الحالية التي تتبع من النهاية إلى النهاية، مثل MOTR و TrackFormer، من أداء ضعيف في الكشف عن الأهداف، مما يجعلها أقل فعالية مقارنة بنظيراتها التي تعتمد على الكشف ثم التتبع (tracking-by-detection). هدفنا هو تحسين MOTR من خلال دمج محدد أهداف إضافي بشكل أنيق. نبدأ بتبني صيغة الرموز المرجعية (anchor formulation) للطلبات (queries)، ثم نستخدم محدد أهداف إضافي لتوليد اقتراحات كرموز مرجعية، مما يوفر أولوية الكشف لمجموعة MOTR. هذه التعديلات البسيطة تخفف بشكل كبير الصراع بين تعلم المهام المشتركة للكشف عن الأهداف وربطها في MOTR. يحافظ نظام MOTRv2 على خاصية انتشار الطلبات (query propagation) ويؤدي بشكل جيد في المقاييس الكبيرة. حاز نظام MOTRv2 على المركز الأول (73.4% HOTA على DanceTrack) في تحدي تتبع الأشخاص المتعددين أثناء الرقص الجماعي الأول. بالإضافة إلى ذلك، حقق نظام MOTRv2 أفضل الأداء الحالي على مجموعة بيانات BDD100K. نأمل أن يوفر هذا الخط الأنابيب البسيط والفعال بعض الرؤى الجديدة للمجتمع العلمي المعني بتتبع الأجسام المتعددة من النهاية إلى النهاية. يمكن الوصول إلى الشفرة البرمجية عبر الرابط \url{https://github.com/megvii-research/MOTRv2}.

MOTRv2: تحسين تتبع الأهداف المتعددة من النهاية إلى النهاية باستخدام محددات الأهداف المدربة مسبقًا | أحدث الأوراق البحثية | HyperAI