HyperAIHyperAI
منذ 2 أشهر

MonoDTR: الكشف عن الأشياء ثلاثية الأبعاد باستخدام متحول يدرك العمق

Huang, Kuan-Chih ; Wu, Tsung-Han ; Su, Hung-Ting ; Hsu, Winston H.
MonoDTR: الكشف عن الأشياء ثلاثية الأبعاد باستخدام متحول يدرك العمق
الملخص

الكشف عن الأشياء ثلاثية الأبعاد باستخدام كاميرا واحدة هو مهمة مهمة ومعقدة في مجال القيادة الذاتية. بعض الأساليب الحالية تستفيد من معلومات العمق المقدمة بواسطة مقدر عمق جاهز لمساعدة الكشف ثلاثي الأبعاد، ولكنها تعاني من العبء الحسابي الإضافي والأداء المحدود الناجم عن عدم دقة معلومات العمق الأولية. لحل هذه المشكلة، نقترح نظام MonoDTR، وهو شبكة تحويلية جديدة تعرف بالعمق وتعمل من النهاية إلى النهاية للكشف عن الأشياء ثلاثية الأبعاد باستخدام كاميرا واحدة. يتكون النظام بشكل أساسي من مكونين: (1) وحدة تعزيز الميزات المعتمدة على العمق (DFE) التي تتعلم بشكل ضمني ميزات معتمدة على العمق بمساعدة الرقابة المساعدة دون الحاجة إلى حسابات إضافية، و(2) وحدة التحويل المعتمد على العمق (DTR) التي تقوم بدمج سياقات وميزات معتمدة على العمق بشكل شامل. بالإضافة إلى ذلك، وبخلاف الترميز الموضعي التقليدي لكل بكسل، نقدم ترميزًا موضعيًا جديدًا معتمدًا على العمق (DPE) لإدخال إشارات موقعية معتمدة على العمق إلى الشبكات التحويلية. يمكن تكامل الوحدات المعتمدة على العمق المقترحة بسهولة في الكاشفات الحالية للأشياء ثلاثية الأبعاد باستخدام كاميرا واحدة فقط لتحسين الأداء. أظهرت التجارب الواسعة على مجموعة بيانات KITTI أن نهجنا يتفوق على الأساليب السابقة القائمة على الكاميرا الواحدة ويحقق الكشف الفوري. يمكن الحصول على الرمز البرمجي من الرابط التالي:https://github.com/kuanchihhuang/MonoDTR

MonoDTR: الكشف عن الأشياء ثلاثية الأبعاد باستخدام متحول يدرك العمق | أحدث الأوراق البحثية | HyperAI