تقليل عائق المعلومات للفصل الدلالي المُراقب ضعيفًا

يُنتج التجزئة الدلالية الضعيفة التدريب تحديدًا على مستوى البكسل من خلال العلامات الفئوية؛ ومع ذلك، فإن فئة التصنيف التي تم تدريبها على هذه العلامات قد تركز على منطقة صغيرة تمييزية ضمن الكائن المستهدف. نفسر هذه الظاهرة باستخدام مبدأ الحد الأقصى للمعلومات: فإن الطبقة النهائية للشبكة العصبية العميقة، التي تُفعّل باستخدام دوال التنشيط السigmoidal أو السومنتيك، تُحدث ما يُعرف بـ "الحاجز المعلوماتي"، وبالتالي يتم نقل جزء فقط من المعلومات ذات الصلة بالمهام إلى المخرجات. ندعم هذا الحجة أولًا من خلال تجربة نموذجية محاكاة، ثم نقترح طريقة لتقليل هذا الحاجز المعلوماتي عن طريق إزالة دالة التنشيط الأخيرة. علاوة على ذلك، نقدم طريقة تجميع جديدة تعزز بشكل أكبر نقل المعلومات من المناطق غير التمييزية إلى عملية التصنيف. تُظهر التقييمات التجريبية أن هذه التعديلات البسيطة تُحسّن بشكل ملحوظ جودة خرائط التحديد على كل من مجموعتي بيانات PASCAL VOC 2012 وMS COCO 2014، مُظهرة أداءً جديدًا على مستوى التقنية في مجال التجزئة الدلالية الضعيفة التدريب. يمكن الوصول إلى الكود من خلال: https://github.com/jbeomlee93/RIB.