HyperAIHyperAI
منذ 3 أشهر

A2dele: مُدرِّس عمق مُتكيف ومُنتبه للكشف الفعّال عن الكائنات البارزة في الصور الملونة ذات الأبعاد العميقة

{ Huchuan Lu, Weisong Ren, Miao Zhang, Zhengkun Rong, Yongri Piao}
A2dele: مُدرِّس عمق مُتكيف ومُنتبه للكشف الفعّال عن الكائنات البارزة في الصور الملونة ذات الأبعاد العميقة
الملخص

تستكشف الطرق الحديثة المتطورة للكشف عن الكائنات المميزة باستخدام بيانات RGB-D بناءً على بنية ذات تدفقين، حيث يُطلب استخدام شبكة فرعية منفصلة لمعالجة بيانات العمق. هذا يؤدي حتمًا إلى تكاليف حسابية إضافية واستهلاك ذاكرة أكبر، كما أن استخدام بيانات العمق أثناء الاختبار قد يعيق التطبيقات العملية للكشف عن الكائنات المميزة باستخدام RGB-D. لحل هذين التحديين، نقترح مُدرّس العمق (A2dele) الذي يستخدم التنبؤ بالشبكة والانتباه كجسرَين لنقل المعرفة المتعلقة بالعمق من تدفق العمق إلى تدفق RGB. أولاً، من خلال تقليل الفروق التلقائية بين التنبؤات الناتجة عن تدفق العمق وتدفق RGB، نحقق السيطرة المطلوبة على نقل معرفة العمق على مستوى البكسل إلى تدفق RGB. ثانيًا، لنقل معرفة التوضع إلى ميزات RGB، نشجع التوافق بين التنبؤ المُمدد من تدفق العمق وخريطة الانتباه الناتجة من تدفق RGB. في النتيجة، نحقق بنية خفيفة الوزن لا تستخدم بيانات العمق عند الاختبار من خلال دمج A2dele. تُظهر تقييماتنا التجريبية الواسعة على خمسة معايير أن تدفق RGB لدينا يحقق أداءً متميزًا على المستوى العالمي، حيث يقلل من حجم النموذج بنسبة 76% ويُسرّع الأداء بنسبة 12 مرة مقارنة بأفضل طريقة موجودة. علاوة على ذلك، يمكن تطبيق A2dele على الشبكات RGB-D الحالية لتحسين كفاءتها بشكل كبير مع الحفاظ على الأداء (زيادة في معدل الإطارات بالثانية (FPS) بنسبة تقارب المضاعفة في DMRA، وثلاث مرات في CPFP).

A2dele: مُدرِّس عمق مُتكيف ومُنتبه للكشف الفعّال عن الكائنات البارزة في الصور الملونة ذات الأبعاد العميقة | الأوراق البحثية | HyperAI