شبكة التصنيف الدلالي المُدرَّسة بشكل ضعيف مع نمو المنطقة المُشبَّعة العميقة

يدرس هذا البحث مشكلة تدريب شبكات التجزئة الدلالية للصور باستخدام علامات مستوى الصورة فقط كمصدر للإشراف، وهي مشكلة ذات أهمية كبيرة لأنها تقلل بشكل كبير من جهود التسمية البشرية. تُظهر الطرق الحديثة الأفضل في هذا المجال أن تُستَنتج مناطق نادرة وتمييزية لكل فئة كائن باستخدام شبكة تصنيف عميقة، ثم يتم تدريب شبكة التجزئة الدلالية باستخدام هذه المناطق التمييزية كمصدر للإشراف. مستوحى من الطرق التقليدية لتجزئة الصور القائمة على نمو المناطق المُبَدَّأَة، نقترح تدريب شبكة تجزئة دلالية بدءًا من المناطق التمييزية، وزيادة تدريجية للإشراف على مستوى البكسل باستخدام خوارزمية نمو المناطق المُبَدَّأَة. يتم دمج وحدة نمو المناطق المُبَدَّأَة داخل شبكة تجزئة عميقة ويمكنها الاستفادة من السمات العميقة. على عكس الشبكات العميقة التقليدية التي تمتلك علامات ثابتة/ثابتة، فإن الشبكة المُشرَّفة ضعيفًا المقترحة تُولِّد علامات جديدة باستخدام المعلومات السياقية داخل الصورة. تتفوّق الطريقة المقترحة بشكل كبير على الطرق المُشرَّفة ضعيفًا التي تعتمد على علامات ثابتة، وتحصل على أداءً من الدرجة الأولى في المجال، حيث تصل إلى 63.2% من متوسط مقياس التداخل بين التوقع والواقع (mIoU) على مجموعة بيانات PASCAL VOC 2012، و26.0% على مجموعة بيانات COCO.