HyperAIHyperAI
منذ 11 أيام

تتبع طويل الأمد عالي الأداء مع مُحدّث ميتا

Kenan Dai, Yunhua Zhang, Dong Wang, Jianhua Li, Huchuan Lu, Xiaoyun Yang
تتبع طويل الأمد عالي الأداء مع مُحدّث ميتا
الملخص

تحظى التتبع البصري طويل الأمد باهتمام متزايد نظرًا لأنه أقرب بكثير إلى التطبيقات العملية مقارنة بالتتبع قصير الأمد. تعتمد معظم مُتتبعات الطول المدى ذات التصنيفات العُليا على هياكل سيماسية تم تدريبها مسبقًا (offline-trained)، وبالتالي لا تستفيد من التطورات الكبيرة التي حققتها مُتتبعات قصيرة الأمد التي تعتمد على التحديث عبر الإنترنت (online update). ومع ذلك، فإن إدخال مُتتبعات قائمة على التحديث عبر الإنترنت بشكل مباشر لحل مشكلات التتبع طويل الأمد يُعد خطرًا كبيرًا، نظرًا لوجود ملاحظات غير مؤكدة وضجيجية على مدى فترات طويلة. في هذا العمل، نقترح مُحدِّثًا متعدد الأغراض (Meta-Updater) مُدرَّبًا مسبقًا، بهدف معالجة مشكلة مهمة ولكنها لم تُحل بعد: هل المُتتبع جاهز للتحديث في الإطار الحالي؟ يمكن للمُحدِّث المتعدد الأغراض المقترح دمج معلومات هندسية، وتمييزية، ومرئية بشكل تسلسلي، ثم استخراج المعلومات التسلسلية باستخدام وحدة LSTM متسلسلة مصممة خصيصًا. يتعلم هذا المُحدِّث مخرجًا ثنائيًا لتوجيه عملية التحديث في المُتتبع، ويمكن دمجه بسهولة في مختلف المُتتبعات. كما يقدّم هذا العمل إطارًا للاستدلال طويل الأمد يتضمن مُتتبعًا محليًا عبر الإنترنت، ومُحقِّقًا عبر الإنترنت، ومُعاد اكتشافًا مبنيًا على SiamRPN، بالإضافة إلى المُحدِّث المتعدد الأغراض المذكور أعلاه. تُظهر النتائج التجريبية الواسعة على معايير VOT2018LT، VOT2019LT، OxUvALT، TLP، وLaSOT أداءً متميزًا للمُتتبع المقترح مقارنةً بالخوارزميات التنافسية الأخرى. يمكن الوصول إلى المشروع عبر الموقع الإلكتروني: https://github.com/Daikenan/LTMU.

تتبع طويل الأمد عالي الأداء مع مُحدّث ميتا | أحدث الأوراق البحثية | HyperAI