واحدة من التحويلات الهندسية هي كل ما تحتاجه: تقدير الحالة المشتركة للتحويل الهندسي والعديد من الأهداف باستخدام نموذج IMM

يُقترح خوارزمية جديدة لتعقب الأهداف المتعددة عبر الإنترنت، وهي تقدير الحالة المتجانسة المشتركة باستخدام مرشح IMM (IMM-JHSE). يستخدم IMM-JHSE تقديرًا مبدئيًا للحالة المتجانسة كالمعلومات الثلاثية البعد الإضافية الوحيدة، بينما تستخدم طرق التعقب الثلاثية البعد الأخرى قياسات ثلاثية بُعد عادية. من خلال نمذجة مصفوفة الحالة المتجانسة وديناميكيتها كجزء من متجهات حالة المسار بشكل مشترك، يزيل IMM-JHSE التأثير الصريح لتقنيات تعويض حركة الكاميرا على حالات موقع المسار المتوقعة، وهو ما كان شائعًا في الطرق السابقة. بناءً على هذا، يتم دمج نماذج حركة الكاميرا الثابتة والديناميكية باستخدام مرشح IMM. يتم استخدام نموذج حركة صندوق الحدود البسيط لتوقع مواقع صناديق الحدود بغرض دمج معلومات المستوى الصوري. بالإضافة إلى تطبيق IMM على حركة الكاميرا، يتم تطبيق نهج غير قياسي لـ IMM حيث يتم مزج درجات BIoU المستندة إلى صناديق الحدود مع المسافات الماهالانوبيس المستندة إلى المستوى الأرضي بطريقة مشابهة لـ IMM لأداء عملية الجمع فقط، مما يجعل IMM-JHSE متينًا أمام الحركات بعيدًا عن المستوى الأرضي. أخيرًا، يستخدم IMM-JHSE تقنيات تقدير الضوضاء الديناميكية للمعالجة والقياس.يعمل IMM-JHSE على تحسين التقنيات ذات الصلة مثل UCMCTrack و OC-SORT و C-BIoU و ByteTrack في مجموعتي بيانات DanceTrack و KITTI-car، حيث يزيد من HOTA بمقدار 2.64 و 2.11 على التوالي، مع تقديم أداء تنافسي في مجموعات البيانات MOT17 و MOT20 و KITTI-pedestrian. باستخدام الاكتشافات المتاحة للعامة، يتفوق IMM-JHSE على معظم طرق تعقب الأهداف المتعددة ثنائية البُعد الأخرى ويتم تفوقه فقط من قبل طرق التعقب الثلاثية البُعد - بعضها يعمل دون اتصال بالإنترنت - في مجموعة بيانات KITTI-car. بالمقارنة مع طرق التعقب بواسطة الانتباه، يظهر IMM-JHSE أداءً مشابهًا بشكل ملفت للنظر في مجموعة بيانات DanceTrack ويتفوق عليها في مجموعة بيانات MOT17. الرمز البرمجي متاح للعامة:https://github.com/Paulkie99/imm-jhse.