3D-FCT: الكشف والتعقب الثلاثي الأبعاد المتزامن باستخدام الارتباط المميز

لا تزال الكشف عن الأجسام ثلاثية الأبعاد باستخدام بيانات ليدار مهمة أساسية لتطبيقات مثل القيادة الذاتية والروبوتات. على عكس الحال في الصور ثنائية الأبعاد، تُجمع بيانات ليدار غالبًا على مدار فترة زمنية. ومع ذلك، ركّزت معظم الدراسات في هذا المجال على إجراء الكشف بشكل مستقل عن المجال الزمني. في هذه الورقة، نقدم بنية شبكة سياميز تُسمى 3D-FCT، التي تستخدم المعلومات الزمنية لأداء المهام المرتبطة بشكل متزامن، وهي الكشف عن الأجسام ثلاثية الأبعاد والتتبع. تم تدريب الشبكة لتوقع حركة الجسم بناءً على خصائص الارتباط الناتجة عن النقاط المميزة المستخرجة عبر الزمن. يُمكن من خلال حساب الارتباط بين النقاط المميزة فقط تحقيق كشف حقيقي الزمن. ونُوسع بشكل أكبر الهدف متعدد المهام ليشمل خسارة الانحدار للتتبع. وأخيرًا، نُنتج كشفًا دقيقًا من خلال ربط مسارات الأجسام القصيرة الأمد إلى مسارات طويلة الأمد بناءً على المسارات المُتنبأ بها. تم تقييم phương pháp المقترح على مجموعة بيانات تتبع KITTI، حيث أُظهر أنه يحقق تحسنًا بنسبة 5.57٪ في متوسط الدقة (mAP) مقارنةً بأفضل طريقة حالية.