التحليل الدلالي المُراقب بشكل ضعيف باستخدام بيانات خارج التوزيع

تُبنى غالبًا طرق التجزئة الدلالية الضعيفة التدريب (WSSS) على خرائط تحديد المواقع على مستوى البكسل المستمدة من فئة تصنيفية. ومع ذلك، فإن التدريب باستخدام العلامات الفئوية وحدها يُعاني من الارتباط الوهمي بين ملامح الكائن الأمامي والخلفية (مثل القطار والمسار)، مما يحد بشكل جوهري من أداء WSSS. سبق أن بذلت جهود سابقة لمعالجة هذه المشكلة من خلال إدخال مراقبة إضافية. نقترح مصدرًا جديدًا للمعلومة لتمييز الكائن الأمامي عن الخلفية: بيانات خارج التوزيع (OoD)، أو الصور التي لا تحتوي على فئات الكائن الأمامي. وبشكل خاص، نستخدم البيانات OoD الصعبة التي من المرجح أن تُنتج تنبؤات إيجابية خاطئة من قبل الفئة التصنيفية. غالبًا ما تحمل هذه العينات ميزات بصرية مهمة في الخلفية (مثل المسار) التي تُخلط غالبًا من قبل الفئة التصنيفية مع الكائن الأمامي (مثل القطار)، مما يمكّن الفئة من قمع ملامح الخلفية الوهمية بشكل صحيح. لا يتطلب الحصول على هذه البيانات OoD الصعبة جهدًا كبيرًا في التسمية؛ إذ يقتصر التكلفة الإضافية على عدد قليل من تسميات المستوى الصوري فوق الجهد الأصلي المبذول لجمع العلامات الفئوية. نقترح طريقة تُسمى W-OoD لاستخدام البيانات OoD الصعبة. وتُظهر W-OoD أداءً متفوقًا على مستوى الحد الأقصى من الأداء في مجموعة بيانات Pascal VOC 2012.