الميزات العميقة غير المحلية للكشف عن الكائنات البارزة

تهدف الكشف عن البارزية إلى تسليط الضوء على الكائنات الأكثر صلة في الصورة. تعاني الطرق التي تعتمد على النماذج التقليدية من صعوبة في التعامل مع الكائنات البارزة التي تُظهر على خلفية مزدحمة، في حين تعاني الشبكات العصبية العميقة من تعقيد زائد وسرعة تقييم بطيئة. في هذا البحث، نقترح شبكة عصبية تلافيفية مبسطة تدمج المعلومات المحلية والعالمية من خلال هيكل متعدد الدقة على شكل شبكة 4×5. بدلًا من فرض التماسك المكاني باستخدام نموذج الحقول العشوائية الترابطية (CRF) أو مكونات الفائقة (superpixels) كما هو شائع، قمنا بتنفيذ دالة خسارة مستوحاة من الدالة المومفورد-شاح (Mumford-Shah) التي تُعاقب الأخطاء على الحدود. تم تدريب نموذجنا على مجموعة بيانات MSRA-B، وتم اختباره على ستة مجموعات معيارية مختلفة للكشف عن البارزية. تُظهر النتائج أن طريقةنا تُنافس أحدث التقنيات، مع تقليل وقت الحساب بنسبة تصل إلى 18 إلى 100 مرة، ما يمكّن من تحقيق كشف عن البارزية بجودة عالية وفي زمن شبه فعلي.