HyperAIHyperAI

Command Palette

Search for a command to run...

MOTRv2: تحسين تتبع الأهداف المتعددة من النهاية إلى النهاية باستخدام محددات الأهداف المدربة مسبقًا

Yuang Zhang extsuperscript1* Tiancai Wang extsuperscript2 Xiangyu Zhang extsuperscript2,3

الملخص

في هذا البحث، نقترح نظام MOTRv2، وهو خط أنابيب بسيط ومعتدل الأداء لتعزيز تتبع الأجسام المتعددة من النهاية إلى النهاية باستخدام محدد أهداف مُدرب مسبقًا (pretrained object detector). تُعاني الطرق الحالية التي تتبع من النهاية إلى النهاية، مثل MOTR و TrackFormer، من أداء ضعيف في الكشف عن الأهداف، مما يجعلها أقل فعالية مقارنة بنظيراتها التي تعتمد على الكشف ثم التتبع (tracking-by-detection). هدفنا هو تحسين MOTR من خلال دمج محدد أهداف إضافي بشكل أنيق. نبدأ بتبني صيغة الرموز المرجعية (anchor formulation) للطلبات (queries)، ثم نستخدم محدد أهداف إضافي لتوليد اقتراحات كرموز مرجعية، مما يوفر أولوية الكشف لمجموعة MOTR. هذه التعديلات البسيطة تخفف بشكل كبير الصراع بين تعلم المهام المشتركة للكشف عن الأهداف وربطها في MOTR. يحافظ نظام MOTRv2 على خاصية انتشار الطلبات (query propagation) ويؤدي بشكل جيد في المقاييس الكبيرة. حاز نظام MOTRv2 على المركز الأول (73.4% HOTA على DanceTrack) في تحدي تتبع الأشخاص المتعددين أثناء الرقص الجماعي الأول. بالإضافة إلى ذلك، حقق نظام MOTRv2 أفضل الأداء الحالي على مجموعة بيانات BDD100K. نأمل أن يوفر هذا الخط الأنابيب البسيط والفعال بعض الرؤى الجديدة للمجتمع العلمي المعني بتتبع الأجسام المتعددة من النهاية إلى النهاية. يمكن الوصول إلى الشفرة البرمجية عبر الرابط \url{https://github.com/megvii-research/MOTRv2}.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp