HyperAIHyperAI
منذ 2 أشهر

هل المهام المختلفة للتتبع تتطلب نماذج مظهر مختلفة؟

Zhongdao Wang; Hengshuang Zhao; Ya-Li Li; Shengjin Wang; Philip H.S. Torr; Luca Bertinetto
هل المهام المختلفة للتتبع تتطلب نماذج مظهر مختلفة؟
الملخص

تعقب الأهداف المهمة في الفيديو هو أحد أكثر المشكلات شعبية وتطبيقاتها الواسعة في رؤية الحاسوب. ومع مرور السنوات، أدت الانفجار الكامبري للحالات الاستخدامية والمعايير إلى تجزئة المشكلة في العديد من الترتيبات التجريبية المختلفة. نتيجة لذلك، أصبحت الأدبيات مجزأة أيضًا، والآن غالبًا ما تكون الأساليب الجديدة التي تقترحها المجتمع متخصصة لتتناسب مع ترتيب تجريبي محدد فقط. لفهم مدى ضرورة هذه التخصصية، نقدم في هذا العمل UniTrack، وهو حل يهدف إلى التعامل مع خمس مهام مختلفة ضمن الإطار نفسه. يتكون UniTrack من نموذج واحد ومجرد للظهور (appearance model) يمكن تعلمه بطريقة إشرافية أو ذاتية الإشراف، وعديد من "الرؤوس" (heads) التي تعالج المهام الفردية ولا تتطلب التدريب. نوضح كيف يمكن حل معظم مهام التعقب ضمن هذا الإطار، وكيف يمكن استخدام نفس نموذج الظهور بنجاح للحصول على نتائج تنافسية مقابل الأساليب المتخصصة لأغلب المهام المدروسة. يتيح لنا الإطار أيضًا تحليل النماذج الظاهرية التي تم الحصول عليها باستخدام أحدث الأساليب ذاتية الإشراف، مما يمتد تقييمها ومقارنتها إلى مجموعة أكبر من المشكلات الهامة.

هل المهام المختلفة للتتبع تتطلب نماذج مظهر مختلفة؟ | أحدث الأوراق البحثية | HyperAI