التعلم العميق بالتناقض للكشف عن الأشياء البارزة

شهد اكتشاف الأشياء البارزة تقدماً كبيراً مؤخراً بفضل الخصائص القوية المستخرجة باستخدام شبكات العصبونات التلافيفية العميقة (CNNs). ومع ذلك، تعمل الأساليب الحالية القائمة على CNN على مستوى القطع بدلاً من المستوى البكسلي. تكون خرائط البارزة الناتجة عادة ضبابية، خاصة بالقرب من حدود الأشياء البارزة. بالإضافة إلى ذلك، يتم معالجة قطع الصورة كعينات مستقلة حتى عندما تكون متداخلة، مما يؤدي إلى إهدار كبير في الحساب والتخزين. في هذا البحث المقدم لمؤتمر CVPR 2016، نقترح شبكة تباين عميقة من النهاية إلى النهاية للتغلب على هذه القيود المذكورة. تتكون شبكتنا العميقة من مكونين متكاملين، تيار تلفيفي كامل على مستوى البكسل وتيار تجميع فضائي حسب القطعة. ينتج التيار الأول مباشرة خريطة بارزة بدقة على مستوى البكسل من صورة مدخلة. يستخرج التيار الثاني الخصائص حسب القطعة بكفاءة عالية ويحسن نمذجة عدم الاستمرارية في البارزة على طول حدود الأشياء. أخيراً، يمكن اختيارياً دمج نموذج CRF المتصل بالكامل لتحسين التجانس الفضائي وتحديد الحواف في النتيجة المدمجة من هذين التيارين. تظهر النتائج التجريبية أن نموذجنا العميق يحسن بشكل كبير على أحدث ما وصلت إليه التقنيات في هذا المجال.