HyperAIHyperAI
منذ 16 أيام

العمق الاحتمالي والهندسي: اكتشاف الأجسام في المنظور

Tai Wang, Xinge Zhu, Jiangmiao Pang, Dahua Lin
العمق الاحتمالي والهندسي: اكتشاف الأجسام في المنظور
الملخص

كشف الكشف عن الأجسام ثلاثية الأبعاد عن قدرة مهمة مطلوبة في تطبيقات عملية متعددة مثل أنظمة المساعدة للسائق. يُعد الكشف ثلاثي الأبعاد من منظور منظور واحد (Monocular 3D detection) نموذجًا رائدًا ضمن المنهجيات القائمة على الصور، حيث يوفر حلاً أكثر اقتصاداً مقارنة بالأساليب التقليدية التي تعتمد على أجهزة ليدار، لكنه ما زال يُظهر نتائج غير مرضية. تقدم هذه الورقة دراسة منهجية أولية لهذا المشكل. نلاحظ أن الكشف الثلاثي الأبعاد من منظور واحد يمكن تبسيطه إلى مشكلة تقدير عمق المثيل (instance depth estimation): فعندما يكون تقدير عمق المثيل غير دقيق، فإنه يعيق تحسين توقعات جميع الخصائص الثلاثية الأبعاد الأخرى، مما يحد من تحسين الأداء العام للكشف. علاوة على ذلك، تُقدِّم الطرق الحديثة تقديرات عمق مباشرة بناءً على مثيلات منفصلة أو بكسلات منفصلة، مع تجاهل العلاقات الهندسية بين الأجسام المختلفة. لمعالجة هذه المشكلة، نُنشئ رسومًا هندسية للعلاقات بين الأجسام المُقدَّرة، ونستخدم هذه الرسوم لدعم تقدير العمق. وبما أن تقدير العمق الأولي لكل مثيل يكون عادة غير دقيق في هذا السياق غير المحدد جيدًا (ill-posed setting)، فإننا ندمج تمثيلًا احتماليًا لالتقاط درجة عدم اليقين، مما يوفر مؤشرًا مهمًا لتحديد التوقعات الموثوقة، ويدعم بعدها انتشار تقديرات العمق. وعلى الرغم من بساطة الفكرة الأساسية، فإن طريقتنا، المُسمّاة PGD، تحقق تحسينات كبيرة على معايير KITTI وnuScenes، وتُحقِّق المركز الأول بين جميع الطرق التي تعتمد فقط على الرؤية البصرية من منظور واحد، مع الحفاظ على الكفاءة الزمنية الحقيقية (real-time efficiency). سيتم نشر الكود والنماذج على الرابط: https://github.com/open-mmlab/mmdetection3d.

العمق الاحتمالي والهندسي: اكتشاف الأجسام في المنظور | أحدث الأوراق البحثية | HyperAI