MOTS: تتبع وتقسيم الأهداف المتعددة

يقوم هذا البحث بتوسيع المهمة الشائعة لتتبع الأهداف المتعددة إلى تتبع الأهداف المتعددة والتقسيم (MOTS). لتحقيق هذا الهدف، نقوم بإنشاء شروحات بكثافة على مستوى البكسل لواحدين من مجموعات البيانات الموجودة باستخدام إجراء شروحات شبه آلي. تشتمل شروحاتنا الجديدة على 65,213 قناع بكسل لـ 977 هدفًا متميزًا (سيارات ومشاة) في 10,870 إطار فيديو. للتقدير، نوسع المقاييس الحالية لتتبع الأهداف المتعددة لهذه المهمة الجديدة. علاوة على ذلك، نقترح طريقة أساسية جديدة تتعامل بشكل مشترك مع الكشف والتتبع والتقسيم باستخدام شبكة تلافيفية واحدة. نظهر قيمة مجموعات البيانات الخاصة بنا من خلال تحقيق تحسينات في الأداء عند التدريب باستخدام شروحات MOTS. نعتقد أن مجموعات البيانات والمقاييس والطريقة الأساسية الخاصة بنا ستكون مصدرًا ثمينًا لتطوير أساليب تتبع الأهداف المتعددة التي تتجاوز الصناديق الحدودية ثنائية الأبعاد. نوفر شروحاتنا وكود البرمجة ونماذجنا عبر الرابط https://www.vision.rwth-aachen.de/page/mots.