HyperAIHyperAI
منذ 2 أشهر

جسر الفجوة بين تتبع الأشياء المتعددة من النهاية إلى النهاية وخارج ذلك

Feng Yan; Weixin Luo; Yujie Zhong; Yiyang Gan; Lin Ma
جسر الفجوة بين تتبع الأشياء المتعددة من النهاية إلى النهاية وخارج ذلك
الملخص

الطرق الحالية للتعقب متعدد الأهداف من النهاية إلى النهاية (e2e-MOT) لم تتفوق على طرق التعقب بالكشف غير المتكاملة. أحد الأسباب المحتملة هو استراتيجية تعيين العلامات خلال التدريب، والتي تقوم بتوصيل الأهداف المتعقبة بشكل مستمر مع استعلامات التعقب ثم تعيين القليل من الأهداف الجديدة لاستعلامات الكشف. باستخدام مطابقة ثنائية جزئية واحدة إلى واحدة، سيؤدي هذا التعيين إلى تدريب غير متوازن، أي نقص في العينات الإيجابية لاستعلامات الكشف، خاصة في المشاهد المغلقة، حيث يظهر معظم الأهداف الجديدة في بداية الفيديوهات. لذلك، سيكون من السهل أن ينتج e2e-MOT نقطة نهاية للتعقب دون التجديد أو إعادة التهيئة مقارنة بطرق التعقب الأخرى بالكشف.للتخفيف من هذه المشكلة، نقدم Co-MOT، وهي طريقة بسيطة وفعالة لتسهيل e2e-MOT من خلال استراتيجية جديدة لتعيين العلامات تعتمد على مفهوم التعاون والمنافسة (coopetition) مع مفهوم الظل. تحديداً، نضيف الأهداف المتعقبة إلى أهداف المطابقة لاستعلامات الكشف عند تنفيذ تعيين العلامات لتدريب الشفرات الوسيطة. بالنسبة لتثبيت الاستعلامات، نوسع كل استعلام بمجموعة من الاستعلامات المقابلة لها بظل مع اضطراب محدود لنفسها.بفضل اختبارات إلغاء متعددة ومكثفة، حققت Co-MOT أداءً فائقًا بدون تكاليف إضافية، مثل نسبة HOTA 69.4% على DanceTrack ونسبة TETA 52.8% على BDD100K. بشكل مثير للإعجاب، تحتاج Co-MOT فقط إلى 38% من العمليات العائمة (FLOPs) التي يحتاجها MOTRv2 لتحقيق أداء مشابه، مما يؤدي إلى سرعة استدلال أسرع بنسبة 1.4 مرة.

جسر الفجوة بين تتبع الأشياء المتعددة من النهاية إلى النهاية وخارج ذلك | أحدث الأوراق البحثية | HyperAI