استغلال المعلومات على مستويات المثيل والصورة والمجموعة للتحليل التجزئي للInstances تحت إشراف ضعيف
الانقسام الضعيف للسياق الوظيفي للInstances باستخدام فقط تسميات مستوى الصورة، بدلًا من الاعتماد على خرائط بيكسلية مكلفة أو تسميات مربعات حدودية، يُعدّ مشكلة مهمة تُخفّف من الطبيعة المُستهلكة للبيانات في التعلم العميق. في هذه الورقة، نتناول هذه المشكلة الصعبة من خلال تجميع المعلومات على مستوى الصورة من جميع الصور التدريبية في رسم بياني معرفي كبير، واستغلال العلاقات الدلالية المستمدة من هذا الرسم. بشكل محدد، تبدأ مبادرتنا بمقترحات كائنية قائمة على التجزئة (SOP) عامة دون افتراضات مسبقة بالنسبة للتصنيف. نقترح إطارًا يعتمد على التعلم المتعدد المثالي (MIL)، يمكن تدريبه بطريقة متكاملة (end-to-end) باستخدام صور تدريب مُسَمّاة بمستوى الصورة فقط. بالنسبة لكل مقترح، يمكن لهذا الإطار حساب توزيعات احتمالية وسمات دلالية واعية بالتصنيف في آنٍ واحد، مما يمكّننا من صياغة رسم بياني غير موجه كبير. ويشمل هذا الرسم البياني أيضًا تصنيف الخلفية، بهدف التخلص من عدد هائل من المقترحات الكائنية الضوضائية. وباستخدام تقسيم متعدد الطرق الأمثل لهذا الرسم البياني، يمكن تخصيص تسمية تصنيف موثوقة لكل مقترح. ويمكن اعتبار المقترحات المُنظفة (SOP) المُسَمّاة بتصنيفها كتقسيم وهمي للInstances للصور التدريبية، والتي تُستخدم لتدريب نماذج مُدرّبة بشكل كامل. ويُظهر النهج المقترح أداءً متقدمًا على مستوى العالم في كل من التقسيم الضعيف للInstances والتقسيم الدلالي.