Command Palette
Search for a command to run...
الكشف ثلاثي الأبعاد النقطي الافتراضي متعدد الوسائط
الكشف ثلاثي الأبعاد النقطي الافتراضي متعدد الوسائط
Tianwei Yin Xingyi Zhou Philipp Krähenbühl
الملخص
تُشكّل الاستشعار القائم على ليدار محرك المركبات الذاتية القيادة الحالية. وعلى الرغم من التقدم السريع، لا تزال أجهزة الاستشعار بالليدار تتخلف بعشرين عامًا عن الكاميرات الملونة التقليدية من حيث الدقة والتكلفة. بالنسبة للقيادة الذاتية، يعني ذلك أن الأجسام الكبيرة القريبة من المستشعرات تكون مرئية بسهولة، لكن الأجسام البعيدة أو الصغيرة تُمثل فقط قياسًا واحدًا أو اثنين. وهذا يُعد مشكلة، خاصة عندما تُظهر هذه الأجسام لاحقًا كونها مخاطر على القيادة. من ناحية أخرى، تظهر هذه الأجسام بوضوح في أجهزة الاستشعار الملونة المدمجة (RGB). في هذا العمل، نقدّم منهجية لدمج سلس لأجهزة الاستشعار RGB في التعرف ثلاثي الأبعاد القائم على ليدار. تعتمد منهجيتنا على مجموعة من الكشف ثنائي الأبعاد لإنشاء نقاط افتراضية ثلاثية الأبعاد كثيفة، بهدف تعزيز السحابة ثلاثية الأبعاد النادرة الناتجة عن ليدار. تُدمج هذه النقاط الافتراضية بشكل طبيعي في أي كاشف ثلاثي الأبعاد قائم على ليدار، إلى جانب القياسات العادية من ليدار. ويُنتج هذا الكاشف متعدد الوسائط نتائج بسيطة وفعّالة. تُظهر النتائج التجريبية على مجموعة بيانات nuScenes الضخمة أن إطارنا يُحسّن كاشف CenterPoint القوي بفارق ملحوظ قدره 6.6 نقطة MAP، ويتفوّق على مناهج الدمج التنافسية الأخرى. يمكن الاطلاع على الكود والتصاميم البصرية الإضافية عبر الرابط: https://tianweiy.github.io/mvp/