استنتاج خريطة الاستجابة المشروطة بالفئة للفصل الدلالي المراقب بشكل ضعيف

التفكيك الدلالي الضعيف المُستند إلى الصور (WSSS) يعتمد على خرائط التنشيط الفئة (CAMs) لإنشاء تسميات وهمية (Pseudo Labels). وبما أن CAMs تُركّز فقط على المناطق الأكثر تمييزًا للأجسام، فإن التسميات الوهمية الناتجة تكون عادةً غير مرضية للاستخدام المباشر كبيانات تدريب مراقبة. لحل هذه المشكلة، تتبع معظم الطرق الحالية نموذجًا متعدد التدريب لإعادة تحسين CAMs بهدف توليد تسميات وهمية أفضل، ويشمل ذلك: 1) إعادة تدريب نموذج التصنيف لإنتاج CAMs؛ 2) معالجة ما بعد CAMs للحصول على التسميات الوهمية؛ و3) تدريب نموذج التفكيك الدلالي باستخدام التسميات الوهمية المُكتسبة. ومع ذلك، يتطلب هذا النموذج المتعدد التدريب تعديلات معقدة ووقتًا إضافيًا. ولحل هذه المشكلة، نقترح استراتيجية استنتاج شرطي حسب الفئة، ودالة خسارة مُحسّنة لتحسين الأقنعة تعتمد على التنشيط، لتكوين تسميات وهمية أفضل دون الحاجة لإعادة تدريب المصنف. وتُقدّم الاستراتيجية المُستندة إلى الزمن الاستنتاجي الشرطي حسب الفئة للكشف بشكل منفصل ومتكرر عن التنشيطات الخفية للجسم داخل الشبكة التصنيفية، بهدف إنتاج خرائط استجابة أكثر شمولاً. علاوةً على ذلك، تقدّم دالتنا الجديدة لتحسين الأقنعة المُستندة إلى التنشيط طريقة مبتكرة لاستغلال خرائط الجاذبية (Saliency Maps) أثناء تدريب التفكيك الدلالي، وتحسين أقنعة الكائنات الأمامية دون قمع الكائنات الخلفية. تحقق طريقة التوصية نتائج متفوقة في التفكيك الدلالي الضعيف المُستند إلى الصور، دون الحاجة إلى إعادة تدريب المصنف.