HyperAIHyperAI
منذ 3 أشهر

إلى التقدير الهرمي التلقائي للعمق المطلق من منظور واحد باستخدام التعلم غير المراقب لتطبيقات القيادة الذاتية

Feng Xue, Guirong Zhuo, Ziyuan Huang, Wufei Fu, Zhuoyue Wu, Marcelo H. Ang Jr
إلى التقدير الهرمي التلقائي للعمق المطلق من منظور واحد باستخدام التعلم غير المراقب لتطبيقات القيادة الذاتية
الملخص

في السنوات الأخيرة، أصبحت الطرق ذاتية التعلّم لتقدير العمق من صورة واحدة فرعًا مهمًا جدًا في مهمة تقدير العمق، خاصة في التطبيقات المتعلقة بالقيادة الذاتية. وعلى الرغم من الدقة العالية التي تم تحقيقها بشكل عام، ما زالت الطرق الحالية تعاني من مشكلتين رئيسيتين: أ) تقدير غير دقيق للعمق على مستوى الكائنات، و ب) عامل مقياس غير مؤكد. تؤدي المشكلة الأولى إلى ظهور تكرار للنسيج (texture copy) أو إعطاء حدود كائنية غير دقيقة، بينما تؤدي الثانية إلى الحاجة إلى مستشعر إضافي مثل LiDAR لتوفير بيانات حقيقية للعمق، أو استخدام كاميرا ستيريو كمدخلات تدريب إضافية، مما يجعل هذه الطرق صعبة التنفيذ. في هذا العمل، نقترح معالجة هاتين المشكلتين معًا من خلال تقديم DNet. تتمثل مساهماتنا في جوانب متعددة: أ) نُقدّم طبقة تنبؤ متصلة كثيفة (DCP) جديدة لتحسين تقدير العمق على مستوى الكائنات، و ب) وبشكل خاص في السياقات المتعلقة بالقيادة الذاتية، نُدخل قيودًا هندسية كثيفة (DGC) بحيث يمكن استرجاع عامل المقياس الدقيق دون تكلفة إضافية للمركبات ذاتية القيادة. أُجريت تجارب واسعة، وأُثبت أن كل من طبقة DCP والوحدة DGC فعّالة في حل المشكلتين المذكورتين على التوالي. كما أُظهر أن أداء استخدام DGC لاسترجاع المقياس يعادل أداء استخدام المعلومات الحقيقية (ground-truth)، عند معرفة ارتفاع الكاميرا، وعندما تمثل النقاط المرجعية للأرض أكثر من 1.03% من عدد البكسلات. يُمكن الاطلاع على الشفرة المصدرية عبر الرابط: https://github.com/TJ-IPLab/DNet.