MARS: إزالة الكائنات المتحيزة المستقلة عن النموذج دون إشراف إضافي للتحليل التصنيفي الضعيف للسياق

تهدف التجزئة الدلالية ذات الإشراف الضعيف إلى تقليل تكاليف التصنيف من خلال تدريب نماذج التجزئة الدلالية باستخدام إشراف ضعيف، مثل تسميات فئة الصورة على مستوى الصورة. ومع ذلك، يعاني معظم النماذج من صعوبة في إنتاج خرائط توصيف دقيقة، كما أنها تعاني من تنبؤات خاطئة في الخلفيات المرتبطة بالفئات (أي الكائنات المتحيزة)، مثل اكتشاف سكة حديد بفئة القطار. تُعد النماذج الحديثة التي تزيل الكائنات المتحيزة محدودة التطبيق، حيث تتطلب إشرافًا إضافيًا لتحديد الكائنات المتحيزة يدويًا لكل فئة مشكلة، بالإضافة إلى جمع مجموعات البيانات من خلال مراجعة التنبؤات، مما يحد من قابليتها للتطبيق على مجموعات بيانات واقعية تحتوي على علامات متعددة والعلاقات المعقدة التي تؤدي إلى التحيز. استنادًا إلى الملاحظة الأولى التي تفيد بأن الخصائص المتحيزة يمكن فصلها وإزالتها من خلال مطابقة الكائنات المتحيزة مع الخلفيات في نفس المجموعة، نقترح إطارًا تلقائيًا بالكامل وغير مرتبط بنموذج معين يُسمى MARS (Model-Agnostic biased object Removal without additional Supervision)، والذي يستخدم الخصائص المتميزة من تقنية غير مراقبة لإزالة الكائنات المتحيزة من العلامات الوهمية. بشكل مفاجئ، نُظهر أن MARS يحقق نتائج جديدة في مستوى الحد الأقصى على بنيتين شهيرتين، PASCAL VOC 2012 (val: 77.7٪، test: 77.2٪) وMS COCO 2014 (val: 49.4٪)، من خلال تحسين أداء العديد من نماذج WSSS بشكل متسق بنسبة لا تقل عن 30٪ دون الحاجة إلى إشراف إضافي.