كشف الكائنات ثلاثية الأبعاد الدقيق باستخدام نماذج الطاقة

الكشف الدقيق عن الأجسام ثلاثية الأبعاد (3DOD) يُعد أمرًا بالغ الأهمية لضمان التنقل الآمن في البيئات المعقدة بواسطة الروبوتات ذاتية القيادة. ومع ذلك، يُعدّ استخلاص صناديق حدود ثلاثية الأبعاد دقيقة بناءً على بيانات ليدار نادرة في البيئات المزدحمة مشكلة بالغة الصعوبة. نعالج هذه المهمة من خلال استكشاف التطورات الحديثة في نماذج الطاقة الشرطية (EBMs) للاستدلال الاحتمالي. وعلى الرغم من أن الأساليب التي تستخدم نماذج EBM في الاستدلال العددي قد أظهرت أداءً ملحوظًا في الكشف عن الأجسام ثنائية الأبعاد في الصور، إلا أن هذه التقنيات لا يمكن تطبيقها مباشرة على الصناديق الحدودية ثلاثية الأبعاد. ولذلك، نصمم في هذا العمل مشغل تجميع قابل للتفاضل للصناديق الحدودية ثلاثية الأبعاد، والذي يُعد الوحدة الأساسية في شبكتنا القائمة على نموذج EBM. كما ندمج هذا النهج العام في أحدث مُكشف عن الأجسام ثلاثية الأبعاد، وهو SA-SSD. وعلى مجموعة بيانات KITTI، يتفوّق نهجنا المقترح باستمرار على الأساس (baseline) الخاص بـ SA-SSD في جميع مقاييس الكشف عن الأجسام ثلاثية الأبعاد، مما يُظهر الإمكانات الكامنة للاستدلال القائم على نماذج EBM لتحقيق كشف ثلاثي الأبعاد دقيق للغاية. يمكن الوصول إلى الشفرة المصدرية من خلال الرابط التالي: https://github.com/fregu856/ebms_3dod.