تعلم شبكة ميزات تمييزية للتقسيم الدلالي

معظم الطرق الحالية للتقطيع الدلالي لا تزال تعاني من تحديين رئيسيين: عدم التجانس داخل الفئة وصعوبة التمييز بين الفئات. لمعالجة هذين التحديين، نقترح شبكة ميزات تمييزية (Discriminative Feature Network - DFN)، والتي تتكون من شبكتين فرعيتين: شبكة النعومة (Smooth Network) وشبكة الحدود (Border Network). بصفة خاصة، للتعامل مع مشكلة عدم التجانس داخل الفئة، قمنا بتصميم شبكة النعومة خصيصًا باستخدام كتلة انتباه القنوات (Channel Attention Block) والتوسيط الشامل عالميًا لاختيار الميزات الأكثر تمييزًا. بالإضافة إلى ذلك، نقترح شبكة الحدود لجعل الميزات الثنائية على طول الحدود قابلة للتمييز باستخدام الإشراف العميق على الحدود الدلالية. بناءً على شبكتنا المقترحة DFN، حققنا أداءً يتفوق على أفضل الأداء السابق بنسبة 86.2% من متوسط تقاطع فوق الاتحاد (IOU) في مجموعة بيانات PASCAL VOC 2012 و80.3% من متوسط IOU في مجموعة بيانات Cityscapes.