HyperAIHyperAI
منذ 19 أيام

شبكة موجهة بالمعلومات المكانية وذات سياق تكيفي واعٍ للسياق لتقسيم الدلالة RGB-D الفعّال

Yang Zhang, Chenyun Xiong, Junjie Liu, Xuhui Ye, Guodong Sun
شبكة موجهة بالمعلومات المكانية وذات سياق تكيفي واعٍ للسياق لتقسيم الدلالة RGB-D الفعّال
الملخص

لقد حظيت التصنيف الدلالي RGB-D الفعّال باهتمام كبير في الروبوتات المتنقلة، حيث يلعب دورًا حاسمًا في تحليل وتمييز المعلومات البيئية. وفقًا للدراسات السابقة، يمكن لبيانات العمق توفير العلاقات الهندسية المقابلة للأجسام والمشاهد، لكن البيانات الحقيقية للعمق غالبًا ما تكون مليئة بالضوضاء. ولتجنب التأثيرات السلبية على دقة التصنيف والحساب، من الضروري تصميم إطار فعّال للاستفادة من العلاقات المتقاطعة بين الوسائط والمؤشرات المكملة. في هذا البحث، نقترح شبكة مشفرة-فكّر خفيفة الوزن وفعّالة تقلل من عدد المعاملات الحسابية وتحافظ على متانة الخوارزمية. وباستخدام وحدات انتباه تُدمج القنوات والمساحة، تُمكّن شبكتنا من التقاط ميزات RGB-D متعددة المستويات بشكل فعّال. كما نقترح وحدة سياقية محلية ذات ارتباط موجه عالميًا للحصول على معلومات سياقية عالية المستوى كافية. ويستخدم فكّر الشبكة وحدة تفرع خفيفة الوزن تدمج المعلومات القصيرة والطويلة المدى مع عدد قليل من العمليات الزائدة. أظهرت النتائج التجريبية على مجموعات بيانات NYUv2 وSUN RGB-D وCityscapes أن طريقةنا تحقق توازنًا أفضل بين دقة التصنيف، ووقت الاستدلال، وعدد المعاملات مقارنةً بالأساليب الحالية المتطورة. وسيتم نشر الكود المصدري على الرابط: https://github.com/MVME-HBUT/SGACNet

شبكة موجهة بالمعلومات المكانية وذات سياق تكيفي واعٍ للسياق لتقسيم الدلالة RGB-D الفعّال | الأوراق البحثية | HyperAI