الدمج المُتَقَدِّم للسياق والهرم السائل للكشف عن الكائنات البارزة في الصور الملونة مع البيانات العمقية

توفر أجهزة الاستشعار العميقة الكثيرة كمية كبيرة من المعلومات المكملة القيّمة للكشف عن الكائنات البارزة (SOD) في الصور من نوع RGBD. ومع ذلك، نظرًا للفرق الجوهري بين المعلومات الملونة (RGB) والعمق، فإن استخلاص الميزات من قناة العمق باستخدام نماذج أساسية مُدرّبة مسبقًا على ImageNet ودمجها مباشرة مع ميزات RGB ليس هو الحل الأمثل. في هذه الورقة، نُدخل مُسبَق التباين (contrast prior)، الذي كان يُعدّ مُؤشّرًا رئيسيًا في الطرق القائمة على الكشف عن الكائنات البارزة غير القائمة على التعلم العميق، إلى هيكلية مبنية على الشبكات العصبية التلافيفية (CNNs) لتعزيز المعلومات العميقة. ثم يتم دمج هذه الميزات العميقة المُحسَّنة مع ميزات RGB للكشف عن الكائنات البارزة باستخدام طريقة جديدة تُسمى "دمج الهرم السائل" (fluid pyramid integration)، التي تُمكّن من الاستفادة الأفضل من الميزات متعددة المقاييس عبر القنوات المختلفة. أظهرت التجارب الشاملة على خمسة مجموعات معيارية صعبة الأداء تفوق البنية المُقترحة CPFP على تسع طرق حديثة متطورة أخرى.