HyperAIHyperAI
منذ 16 أيام

الانحدار الاحتمالي للتتبع البصري

Martin Danelljan, Luc Van Gool, Radu Timofte
الانحدار الاحتمالي للتتبع البصري
الملخص

تُعدّ التتبع البصري مشكلة جوهرية تتمثل في استخلاص حالة الهدف في كل إطار من إطارات الفيديو. وعلى الرغم من التقدم الكبير الذي تم تحقيقه، تظل المُتتبعات عرضة للفشل والدقة المنخفضة. ولذلك، أصبح من الضروري تمثيل عدم اليقين في تقدير حالة الهدف. وعلى الرغم من أن النماذج المهيمنة حاليًا تعتمد على تقدير قيمة موثوقية تعتمد على الحالة، فإن هذه القيمة تفتقر إلى تفسير احتمالي واضح، مما يُعقّد استخدامها.لذلك، نقترح في هذه الدراسة صيغة انحدار احتمالي ونطبّقها على التتبع. يتنبأ شبكتنا بـكثافة الاحتمال الشرطي لحالة الهدف بالاعتماد على صورة إدخال معطاة. وتميّز هذه الصيغة بقدرتها على نمذجة الضوضاء في التسميات الناتجة عن التسميات غير الدقيقة والغموض الموجود في المهمة. يتم تدريب شبكة الانحدار عن طريق تقليل انحراف كولبكار-ليبلر (Kullback-Leibler divergence). عند تطبيقها على التتبع، لا تسمح هذه الصيغة فقط بتمثيل احتمالي للناتج، بل تُحسّن أيضًا بشكل كبير الأداء. ويُعدّ مُتتبعنا الأفضل على مستوى الحالات الراهنة (state-of-the-art) على ستة مجموعات بيانات، حيث حقق 59.8% من AUC على LaSOT و75.8% من النجاح على TrackingNet. يمكن الوصول إلى الكود والنماذج عبر الرابط: https://github.com/visionml/pytracking.

الانحدار الاحتمالي للتتبع البصري | أحدث الأوراق البحثية | HyperAI