تتبع حسب المُتَّبِعِين بنموذج مُهَدَّى ومُعزَّز

تم التعامل عادةً مع تتبع الأشياء البصرية من خلال الاستدلال بشكل مستقل على خوارزميات معالجة سريعة، وطرق متطورة دقيقة للتكيف في الوقت الفعلي، ودمج متابعي الأشياء. في هذه الورقة، نوحد هذه الأهداف من خلال اقتراح منهجية تتبع جديدة تستفيد من متابعي الأشياء البصرية الأخرى، سواء بشكل مسبق (offline) أو في الوقت الفعلي (online). تم تدريب نموذج طالب مكثف من خلال دمج تبادل المعرفة (knowledge distillation) والتعلم بالتعزيز (reinforcement learning). يسمح الأول بنقل وضغط معرفة تتبع متابعي الأشياء الآخرين، بينما يمكّن الثاني من تعلم مقاييس تقييم تُستَخدَم لاحقًا في الوقت الفعلي. وبعد عملية التعلم، يمكن استخدام الطالب في النهاية لبناء (أ) متابع سريع جدًا يعمل في عملية واحدة (single-shot)، (ب) متابع يتمتع بآلية تكيف في الوقت الفعلي بسيطة وفعالة، (ج) متابع يقوم بدمج متابعي أشياء أخرى. وأظهرت التحقق الواسع أن الخوارزميات المقترحة تنافس متابعي الحالة الحالية للعمل في الوقت الفعلي.