HyperAIHyperAI
منذ 3 أشهر

التحليل الهندسي للمسافة للكشف ثلاثي الأبعاد باستخدام كاميرا واحدة

Xuepeng Shi, Qi Ye, Xiaozhi Chen, Chuangrong Chen, Zhixiang Chen, Tae-Kyun Kim
التحليل الهندسي للمسافة للكشف ثلاثي الأبعاد باستخدام كاميرا واحدة
الملخص

يُعدّ الكشف عن الكائنات ثلاثية الأبعاد باستخدام عدسة واحدة أمرًا ذا أهمية كبيرة للقيادة الذاتية، لكنه ما زال يشكل تحديًا كبيرًا. والتحدي الأساسي يتمثل في توقع المسافة بين الكائنات في غياب معلومات العمق الصريحة. على عكس الطرق الحالية التي تُعدّ المسافة كمتغير واحد، نقترح طريقة جديدة تعتمد على الهندسة لتفكيك المسافة بهدف استرجاعها من خلال عواملها. حيث يُفكّك مفهوم المسافة إلى متغيرات تمثيلية ومستقرة للغاية، وهي الارتفاع المادي للكائن والارتفاع البصري المُسقط على مستوى الصورة. علاوةً على ذلك، يُحافظ التفكيك على التوافق الذاتي بين الارتفاعين، مما يؤدي إلى توقع دقيق للمسافة حتى عند عدم دقة التوقعات في كليهما. كما يمكّن هذا التفكيك من تتبع أسباب عدم اليقين في توقع المسافة في سيناريوهات مختلفة. ويُعدّ هذا التفكيك عاملًا مساعِدًا في جعل توقع المسافة قابلاً للتفسير، دقيقًا، ومقاومًا للعوامل المُربكة. تعتمد طريقة العمل لدينا على توقع صناديق الحدود ثلاثية الأبعاد مباشرة من صور RGB باستخدام بنية مدمجة، مما يجعل التدريب والاستنتاج بسيطين وفعالين. وأظهرت النتائج التجريبية أن طريقة العمل تحقق أداءً متقدمًا على مستوى الحالة الحالية في مهام الكشف عن الكائنات ثلاثية الأبعاد باستخدام عدسة واحدة ومهام رؤية الطيور (Birds Eye View) على مجموعة بيانات KITTI، كما تُظهر قدرة على التعميم على صور ذات معاملات بصرية (camera intrinsics) مختلفة.