تتبع كائنات متعددة من خلال المظهر من خلال تجميع المسارات بشكل هرمي

تعتمد النهج الحالية في تتبع الكائنات المتعددة (MOT) على التماسك المكاني الزمني بين الكشفات، مع دمج مظهر الكائن لربط الكائنات عبر الإطارات المتتالية. في هذه الدراسة، نستكشف تقنية تتبع الكائنات المتعددة باستخدام مظهر الكائن كمصدر رئيسي للارتباط بين الكائنات في الفيديو، مع استخدام الاحتمالات المكانية والزمنية كعوامل وزن. نُشكّل المسارات الأولية (tracklets) باستغلال الفكرة القائلة بأن الكائنات من نفس النوع التي تظهر قريبة في الزمن يجب أن تكون متشابهة من حيث المظهر، ثم نبني المسارات النهائية للكائنات من خلال دمج هذه المسارات بطريقة هرمية. أجرينا تجارب واسعة النطاق أظهرت فعالية طريقتنا على ثلاث معايير مختلفة لتتبع الكائنات المتعددة: MOT17 وMOT20 وDanceTrack، حيث أظهرت أداءً تنافسيًا في MOT17 وMOT20، وحققت نتائج من الدرجة الأولى (state-of-the-art) في DanceTrack.