HyperAIHyperAI

Command Palette

Search for a command to run...

العمق الاحتمالي والهندسي: اكتشاف الأجسام في المنظور

Tai Wang Xinge Zhu Jiangmiao Pang Dahua Lin

الملخص

كشف الكشف عن الأجسام ثلاثية الأبعاد عن قدرة مهمة مطلوبة في تطبيقات عملية متعددة مثل أنظمة المساعدة للسائق. يُعد الكشف ثلاثي الأبعاد من منظور منظور واحد (Monocular 3D detection) نموذجًا رائدًا ضمن المنهجيات القائمة على الصور، حيث يوفر حلاً أكثر اقتصاداً مقارنة بالأساليب التقليدية التي تعتمد على أجهزة ليدار، لكنه ما زال يُظهر نتائج غير مرضية. تقدم هذه الورقة دراسة منهجية أولية لهذا المشكل. نلاحظ أن الكشف الثلاثي الأبعاد من منظور واحد يمكن تبسيطه إلى مشكلة تقدير عمق المثيل (instance depth estimation): فعندما يكون تقدير عمق المثيل غير دقيق، فإنه يعيق تحسين توقعات جميع الخصائص الثلاثية الأبعاد الأخرى، مما يحد من تحسين الأداء العام للكشف. علاوة على ذلك، تُقدِّم الطرق الحديثة تقديرات عمق مباشرة بناءً على مثيلات منفصلة أو بكسلات منفصلة، مع تجاهل العلاقات الهندسية بين الأجسام المختلفة. لمعالجة هذه المشكلة، نُنشئ رسومًا هندسية للعلاقات بين الأجسام المُقدَّرة، ونستخدم هذه الرسوم لدعم تقدير العمق. وبما أن تقدير العمق الأولي لكل مثيل يكون عادة غير دقيق في هذا السياق غير المحدد جيدًا (ill-posed setting)، فإننا ندمج تمثيلًا احتماليًا لالتقاط درجة عدم اليقين، مما يوفر مؤشرًا مهمًا لتحديد التوقعات الموثوقة، ويدعم بعدها انتشار تقديرات العمق. وعلى الرغم من بساطة الفكرة الأساسية، فإن طريقتنا، المُسمّاة PGD، تحقق تحسينات كبيرة على معايير KITTI وnuScenes، وتُحقِّق المركز الأول بين جميع الطرق التي تعتمد فقط على الرؤية البصرية من منظور واحد، مع الحفاظ على الكفاءة الزمنية الحقيقية (real-time efficiency). سيتم نشر الكود والنماذج على الرابط: https://github.com/open-mmlab/mmdetection3d.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp