DPANet: شبكة انتباه مُوجَّهة بوعي بالقدرة العميقة ومحفزة بالمنطق للكشف عن الكائنات البارزة في الصور الملونة ذات الأعماق

تتعرض الكشف عن الكائنات البارزة في الصور RGB-D لمشكلتين رئيسيتين: (1) كيفية دمج الفوائد التكميلية الناتجة عن بيانات RGB-D عبر النماذج بشكل فعّال؛ و(2) كيفية منع تأثير التلوث الناتج عن الخريطة العميقة غير الموثوقة. في الواقع، ترتبط هاتان المشكلتان ببعضهما البعض وتتشابكان، لكن الطرق السابقة تميل إلى التركيز فقط على المشكلة الأولى وتجاهل تقييم جودة خريطة العمق، مما قد يؤدي إلى دخول النموذج في حالة غير مثلى. في هذه الورقة، نعالج هاتين المشكلتين ضمن نموذج متكامل بشكل تآزري، ونُقدّم شبكة جديدة تُسمى DPANet، والتي تُنمذج بشكل صريح الإمكانية الكامنة في خريطة العمق وتدمج الفوائد التكميلية بين النماذج بشكل فعّال. من خلال إدخال آلية استشعار "الإمكانيّة العميقة"، يمكن للشبكة اكتشاف الإمكانية الكامنة في المعلومات العميقة بطريقة تعتمد على التعلّم، وتوجيه عملية الدمج بين البيانات ذات النمطين لمنع حدوث التلوث. كما يستخدم وحدة الانتباه متعددة النماذج ذات المُتحكم بالبوابات في عملية الدمج آلية الانتباه مع مُتحكم بوابات لاستكشاف الاعتماديات طويلة المدى من منظور عبر النماذج. أظهرت النتائج التجريبية، التي تم مقارنتها مع 15 طريقة من أحدث الطرق على 8 مجموعات بيانات، صحة المنهجية المقترحة من حيث الجوانب الكمية والكيفية.