HIPTrack: التتبع البصري باستخدام موجهات تاريخية

الراقبات التي تتبع نموذج سيماسي تعتمد على مطابقة التشابه بين خصائص المنطقة النموذجية والمنطقة البحثية لتنفيذ التتبع. وقد تم استكشاف العديد من الطرق لتحسين أداء التتبع من خلال دمج تاريخ التتبع، بهدف التعامل بشكل أفضل مع السيناريوهات التي تشهد تغيرات في مظهر الهدف، مثل التشوه والانسداد. ومع ذلك، فإن استخدام المعلومات التاريخية في الطرق الحالية غير كافٍ وشامل، وغالبًا ما يتطلب تدريبًا متكررًا ويُدخل كمية كبيرة من الحسابات. في هذه الورقة، نُظهر أنه من خلال تزويد راقبة تتبع تتبع نموذج سيماسي بمعلومات تاريخية دقيقة ومحدثة، يمكن تحقيق تحسن كبير في الأداء دون أي تغيير في المعاملات. استنادًا إلى ذلك، نقترح شبكة توجيه تاريخية (Historical Prompt Network) تستخدم قناعات خلفية مُحسَّنة تاريخيًا وخصائص بصرية تاريخية للهدف لتوفير توجيهات شاملة ودقيقة للراقبة. ونُنشئ راقبة جديدة تُسمى HIPTrack بناءً على شبكة التوجيه التاريخية، والتي تحقق تحسنًا ملحوظًا في الأداء دون الحاجة إلى إعادة تدريب النموذج بالكامل. أجرينا تجارب على سبعة مجموعات بيانات، وأظهرت النتائج التجريبية أن طريقةنا تتفوق على أفضل الراقبات الحالية على مجموعات البيانات LaSOT وLaSOText وGOT-10k وNfS. علاوةً على ذلك، يمكن دمج شبكة التوجيه التاريخية بشكل سلس كوحدة قابلة للتركيب (plug-and-play) في الراقبات الحالية، مما يُحدث تحسينات في الأداء. تم إتاحة الشفرة المصدرية على الرابط: https://github.com/WenRuiCai/HIPTrack.