تجاوز تتبع التوأمي ثلاثي الأبعاد: نموذج يركز على الحركة لتتبع كائن واحد ثلاثي الأبعاد في السحابات النقطية

تعتبر متابعة الكائنات الفردية ثلاثية الأبعاد (3D SOT) في سحابات نقاط LiDAR عاملاً أساسياً في القيادة الذاتية. تتبع جميع الأساليب الحالية النموذج السامي (Siamese) القائم على مطابقة المظهر. ومع ذلك، فإن سحابات نقاط LiDAR عادة ما تكون خالية من النسيج وغير كاملة، مما يعرقل عملية مطابقة المظهر بشكل فعال. بالإضافة إلى ذلك، تتجاهل الطرق السابقة بشكل كبير التلميحات الحركية الحرجة بين الأهداف. في هذا العمل، وبعيد عن متابعة 3D السامية، نقدم نموذجاً مركزياً للحركة لمعالجة متابعة الكائنات الفردية ثلاثية الأبعاد من وجهة نظر جديدة. وفقاً لهذا النموذج، نقترح متابعاً ثنائياً بدون مطابقة يُسمى M^2-Track. في المرحلة الأولى، يقوم M^2-Track بتتبع الهدف داخل الإطارات المتتالية عبر تحويل الحركة. ثم يقوم بتحسين صندوق الهدف من خلال إكمال الشكل بمساعدة الحركة في المرحلة الثانية. تؤكد التجارب الواسعة أن M^2-Track يتفوق بشكل كبير على أفضل الأساليب السابقة في ثلاثة قواعد بيانات كبيرة الحجم بينما يعمل بمعدل 57 إطاراً في الثانية (بنسب زيادة دقة تبلغ حوالي 8٪ و17٪ و22٪ على قواعد بيانات KITTI وNuScenes وWaymo Open Dataset على التوالي). كما تثبت التحليلات الإضافية فعالية كل مكون وتظهر إمكانات النموذج المركز حول الحركة الواعدة عند الجمعه مع مطابقة المظهر.