HyperAIHyperAI

Command Palette

Search for a command to run...

EdgeNet: إكمال المشهد الدلالي من صورة واحدة RGB-D

Zhonghao Zhao Xiaoyang Li Zeynep Akata

الملخص

إكمال المشهد الدلالي هو مهمة التنبؤ بتمثيل ثلاثي الأبعاد كامل للاحتلال الحجمي مع العلامات الدلالية المقابلة لمشهد من نقطة واحدة للرؤية. الدراسات السابقة في إكمال المشهد الدلالي باستخدام بيانات RGB-D استخدمت إما العمق فقط أو العمق مع اللون من خلال إسقاط الصورة ثنائية الأبعاد في الحجم الثلاثي الأبعاد، مما أدى إلى تمثيل بيانات نادرة الكثافة. في هذا العمل، نقدم استراتيجية جديدة لترميز معلومات اللون في الفضاء الثلاثي الأبعاد باستخدام كشف الحواف والمسافة الموقعة المقلوبة (flipped truncated signed distance). كما نقدم EdgeNet، وهي هندسة شبكة عصبية جديدة من النهاية إلى النهاية قادرة على التعامل مع الخصائص المولدة من دمج معلومات العمق والحواف. تظهر النتائج التجريبية تحسينًا بنسبة 6.9% على أفضل نتيجة معاصرة باستخدام البيانات الحقيقية، بالنسبة للطرق من النهاية إلى النهاية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
EdgeNet: إكمال المشهد الدلالي من صورة واحدة RGB-D | مستندات | HyperAI