كشف الأجرام ثلاثية الأبعاد باستخدام كاميرا واحدة: نهج يعتمد على إزالة المعاملات الخارجية

كشف الأجسام ثلاثية الأبعاد باستخدام كاميرا واحدة هو مهمة مهمة في القيادة الذاتية. وقد يصبح هذا التحدي صعب التحقيق بسهولة عندما يحدث تغير في وضعية السيارة الذاتية بالنسبة لسطح الأرض، وهو أمر شائع نظرًا للتقلبات الطفيفة في سلاسة الطريق وانحداره. وبسبب قلة الفهم العميق في التطبيقات الصناعية، تتجاهل الطرق الحالية المبنية على مجموعات بيانات مفتوحة معلومات وضعية الكاميرا، مما يؤدي بشكل لا مفر منه إلى جعل الكاشف عرضة لتغيرات المعلمات الخارجية للكاميرا. وغالبًا ما تظهر التشوهات في مواقع الأجسام في معظم الحالات الواقعية للقيادة الذاتية بالنسبة للمنتجات الصناعية. ولحل هذه المشكلة، نقترح طريقة جديدة لاستخلاص معلومات وضعية الكاميرا، بهدف تشكيل كاشف لا يتأثر بالتشوهات الخارجية. وبشكل محدد، يتنبأ الإطار المقترح بمعاملات الوضع الخارجي للكاميرا من خلال كشف نقطة الانهيار (vanishing point) وتغير الخط الأفقي (horizon). كما تم تصميم محول (converter) لتصحيح الميزات المشوهة في الفضاء الخفي. وبذلك، يعمل كاشفنا ثلاثي الأبعاد بشكل مستقل عن التغيرات في المعلمات الخارجية، ويُنتج نتائج دقيقة في الحالات الواقعية، مثل الطرق المثقوبة أو غير المستوية، حيث يفشل تقريبًا جميع الكاشفات ثلاثية الأبعاد ذات الكاميرا الواحدة الحالية في التعامل معها. وتُظهر التجارب أن طريقةنا تحقق أفضل أداء مقارنةً بالطرق المتطورة الأخرى بفارق كبير على كلا مجموعتي البيانات KITTI 3D وnuScenes.