GS3D: إطار كفء للكشف عن الأشياء ثلاثية الأبعاد في القيادة الذاتية

نقدم إطارًا فعّالًا للكشف عن الأجسام ثلاثية الأبعاد باستخدام صورة RGB واحدة في سياق القيادة الذاتية. تتركز جهودنا على استخراج المعلومات ثلاثية الأبعاد الكامنة وراء الصورة ثنائية الأبعاد وتحديد صندوق الحدود الثلاثي الأبعاد الدقيق للجسم دون الحاجة إلى بيانات السحابة النقطية أو البيانات الاستريو. بفضل استخدام محدد الأجسام ثنائية الأبعاد الجاهز، نقترح نهجًا مبتكرًا للحصول بفعالية على مكعب خشن لكل صندوق حدود ثنائي أبعاد متوقع. يوفر المكعب الخشن دقة كافية لإرشادنا لتحديد صندوق الحدود الثلاثي الأبعاد للجسم من خلال التحسين. على عكس الأساليب الرائدة سابقًا التي تستخدم فقط الميزات المستخرجة من صندوق الحدود الثنائي الأبعاض للتحسين، نستكشف معلومات الهيكل ثلاثي الأبعاض للجسم من خلال استخدام الميزات البصرية للأسطح المرئية. يتم استخدام الميزات الجديدة من الأسطح للتخلص من مشكلة الغموض في التمثيل الناجمة عن استخدام صندوق الحدود الثنائي الأبعاض فقط. بالإضافة إلى ذلك، ندرس طرق مختلفة لتحسين صندوق الحدود الثلاثي الأبعاض ونكتشف أن الصيغة التصنيفية مع خسارة مراعية للجودة لديها أداء أفضل بكثير من الانحدار. تم تقييم نهجنا على مقاييس KITTI، حيث أظهر تفوقه على الأساليب الرائدة حاليًا في الكشف عن الأجسام ثلاثية الأبعاض باستخدام صورة RGB واحدة.