ما وراء مرشحات كالمان: مرشحات تعتمد على التعلم العميق لتحسين تتبع الأجسام

تُستخدم أنظمة التتبع القائمة على الكشف التقليدية بشكل شائع مرشحات كالمان (KF) لتقدير الحالة. ومع ذلك، فإن مرشح كالمان يتطلب خيارات تصميم محددة حسب المجال، وهو غير مناسب جيدًا لمعالجة أنماط الحركة غير الخطية. لمعالجة هذه القيود، نقترح طريقتين جديدتين تعتمدان على البيانات. تستخدم الطريقة الأولى مرشحًا بايزية مزودًا بنموذج حركة قابل للتدريب لتنبؤ موقع الكائن في المستقبل، وتُدمج تنبؤاتها مع الملاحظات المستمدة من كاشف الكائنات لتحسين دقة توقع مربعات الحدود. علاوةً على ذلك، تُقلل هذه الطريقة إلى حد كبير من الحاجة إلى خيارات تصميم محددة حسب المجال التي تميز مرشح كالمان. أما الطريقة الثانية، فهي مرشح قابل للتدريب من الطرف إلى الطرف، وتذهب خطوة أبعد من خلال تعلُّم تصحيح أخطاء الكاشف، مما يقلل بشكل إضافي من الحاجة إلى الخبرة المتخصصة. بالإضافة إلى ذلك، نقدّم مجموعة من هياكل نماذج الحركة المستندة إلى الشبكات العصبية التكرارية (Recurrent Neural Networks)، والمعادلات التفاضلية العصبية (Neural Ordinary Differential Equations)، وعمليات الشبكة العصبية الشرطية (Conditional Neural Processes)، والتي تُدمج مع الطرق المرشحة للتصفية. تُظهر تقييماتنا الواسعة عبر عدة مجموعات بيانات أن المرشحات المقترحة تتفوّق على مرشح كالمان التقليدي في تتبع الكائنات، خصوصًا في حالات الحركة غير الخطية — وهي الحالة التي تكون فيها المرشحات المقترحة أكثر ملاءمة. كما قمنا بتحليل مقاومة المرشحات للضوضاء، وأظهرت النتائج نتائج إيجابية مقنعة. ونُقدّم أيضًا دالة تكلفة جديدة لربط الملاحظات بالمسارات. يتفوّق مُتتبعنا، الذي يدمج هذه الدالة الجديدة مع المرشحات المقترحة، على طريقة SORT التقليدية وأدوات تتبع الكائنات الأخرى القائمة على الحركة، من حيث عدة مقاييس في مجموعتي بيانات DanceTrack وSportsMOT الغنيتين بالحركة.