HyperAIHyperAI

Command Palette

Search for a command to run...

الشبكات العصبية الرسومية ثلاثية الأبعاد للتحليل الدلالي لصور RGBD

Raquel Urtasun Xiaojuan Qi Sanja Fidler Jiaya Jia Renjie Liao

الملخص

يتطلب التصنيف الدلالي لـ RGBD استنتاجًا متكاملًا حول المعلومات البصرية ثنائية الأبعاد والهندسية ثلاثية الأبعاد. في هذه الورقة، نقترح شبكة عصبية رسمية ثلاثية الأبعاد (3DGNN) تقوم ببناء رسم بياني يعتمد على أقرب جيران (k-nearest neighbor) فوق سحابة نقاط ثلاثية الأبعاد. يتوافق كل عقدة في الرسم البياني مع مجموعة من النقاط، ومرتبطة بمتجه تمثيل خفي تم تهيئته باستخدام ميزة بصرية تم استخلاصها بواسطة شبكة عصبية أحادية (unary CNN) من الصور ثنائية الأبعاد. تعتمد العقدة على دوال تكرارية (recurrent functions) لتحديث تمثيلها الخفي ديناميكيًا بناءً على الحالة الحالية والرسائل الواردة من جيرانها. يتم تطبيق نموذج الانتشار هذا على مدى عدد محدد من خطوات الزمن، ويُستخدم التمثيل النهائي لكل عقدة في التنبؤ بفئة الدلالة لكل بكسل. ونستخدم التدريب عبر التراجع الزمني (back-propagation through time) لتدريب النموذج. أظهرت التجارب الواسعة على مجموعتي بيانات NYUD2 وSUN-RGBD فعالية النهج المُقترح.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
الشبكات العصبية الرسومية ثلاثية الأبعاد للتحليل الدلالي لصور RGBD | مستندات | HyperAI