Command Palette
Search for a command to run...
EdgeNet: إكمال المشهد الدلالي من صورة واحدة RGB-D
EdgeNet: إكمال المشهد الدلالي من صورة واحدة RGB-D
Zhonghao Zhao Xiaoyang Li Zeynep Akata
الملخص
إكمال المشهد الدلالي هو مهمة التنبؤ بتمثيل ثلاثي الأبعاد كامل للاحتلال الحجمي مع العلامات الدلالية المقابلة لمشهد من نقطة واحدة للرؤية. الدراسات السابقة في إكمال المشهد الدلالي باستخدام بيانات RGB-D استخدمت إما العمق فقط أو العمق مع اللون من خلال إسقاط الصورة ثنائية الأبعاد في الحجم الثلاثي الأبعاد، مما أدى إلى تمثيل بيانات نادرة الكثافة. في هذا العمل، نقدم استراتيجية جديدة لترميز معلومات اللون في الفضاء الثلاثي الأبعاد باستخدام كشف الحواف والمسافة الموقعة المقلوبة (flipped truncated signed distance). كما نقدم EdgeNet، وهي هندسة شبكة عصبية جديدة من النهاية إلى النهاية قادرة على التعامل مع الخصائص المولدة من دمج معلومات العمق والحواف. تظهر النتائج التجريبية تحسينًا بنسبة 6.9% على أفضل نتيجة معاصرة باستخدام البيانات الحقيقية، بالنسبة للطرق من النهاية إلى النهاية.