HyperAIHyperAI
منذ 2 أشهر

EdgeNet: إكمال المشهد الدلالي من صورة واحدة RGB-D

Aloisio Dourado; Teofilo Emidio de Campos; Hansung Kim; Adrian Hilton
EdgeNet: إكمال المشهد الدلالي من صورة واحدة RGB-D
الملخص

إكمال المشهد الدلالي هو مهمة التنبؤ بتمثيل ثلاثي الأبعاد كامل للاحتلال الحجمي مع العلامات الدلالية المقابلة لمشهد من نقطة واحدة للرؤية. الدراسات السابقة في إكمال المشهد الدلالي باستخدام بيانات RGB-D استخدمت إما العمق فقط أو العمق مع اللون من خلال إسقاط الصورة ثنائية الأبعاد في الحجم الثلاثي الأبعاد، مما أدى إلى تمثيل بيانات نادرة الكثافة. في هذا العمل، نقدم استراتيجية جديدة لترميز معلومات اللون في الفضاء الثلاثي الأبعاد باستخدام كشف الحواف والمسافة الموقعة المقلوبة (flipped truncated signed distance). كما نقدم EdgeNet، وهي هندسة شبكة عصبية جديدة من النهاية إلى النهاية قادرة على التعامل مع الخصائص المولدة من دمج معلومات العمق والحواف. تظهر النتائج التجريبية تحسينًا بنسبة 6.9% على أفضل نتيجة معاصرة باستخدام البيانات الحقيقية، بالنسبة للطرق من النهاية إلى النهاية.

EdgeNet: إكمال المشهد الدلالي من صورة واحدة RGB-D | أحدث الأوراق البحثية | HyperAI