تعلم التجزئة النقطية بشكل ضعيف بالإشراف باستخدام العلاقات بين البكسلات

يقدم هذا البحث منهجية جديدة لتعلم تقسيم النماذج (instance segmentation) باستخدام تصنيفات الصور على مستوى الصورة كإشراف. تولد منهجيتنا ملصقات تقسيم نماذج وهمية للصور التدريبية، والتي تستخدم لتدريب نموذج مشرف عليه بالكامل. لإنتاج هذه الملصقات الوهمية، نحدد أولاً المناطق البذرية الموثوقة لأنواع الأشياء من خرائط الانتباه لنموذج تصنيف الصور، ثم نقوم بتوسيعها لاكتشاف المناطق الكاملة للنماذج مع حدود دقيقة. لهذا الغرض، اقترحنا IRNet، وهو نموذج يقدر المناطق الخشنة للأمثلة الفردية ويكتشف الحدود بين أنواع الأشياء المختلفة. وبذلك,则可以使我们能够为种子分配实例标签,并在边界内传播它们,以便准确估计整个实例区域。此外,IRNet 使用图像分类模型的注意力图上的像素间关系进行训练,因此不需要额外的监督。我们的方法结合 IRNet 在 PASCAL VOC 2012 数据集上实现了卓越的性能,不仅超过了以前在同一监督水平下训练的最佳模型,而且还超越了一些依赖更强监督的先前模型。为了使句子更符合阿拉伯语的习惯,我将对最后一段进行微调:وبذلك,则可以使我们能够为种子分配实例标签,并在边界内传播它们,以便准确估计整个实例区域。调整后的句子:وبذلك,则能使 us قادرة على تعيين ملصقات النماذج للبذور وتوسيعها داخل الحدود حتى يمكن تقدير المناطق الكاملة للنماذج بدقة.最终版本:يقدم هذا البحث منهجية جديدة لتعلم تقسيم النماذج (instance segmentation) باستخدام تصنيفات الصور على مستوى الصورة كإشراف. تولد منهجيتنا ملصقات تقسيم نماذج وهمية للصور التدريبية، والتي تستخدم لتدريب نموذج مشرف عليه بالكامل. لإنتاج هذه الملصقات الوهمية، نحدد أولاً المناطق البذرية الموثوقة لأنواع الأشياء من خرائط الانتباه لنموذج تصنيف الصور، ثم نقوم بتوسيعها لاكتشاف المناطق الكاملة للنماذج مع حدود دقيقة. لهذا الغرض، اقترحنا IRNet، وهو نموذج يقدر المناطق الخشنة للأمثلة الفردية ويكتشف الحدود بين أنواع الأشياء المختلفة. وبذلك,则能使 us قادرة على تعيين ملصقات النماذج للبذور وتوسيعها داخل الحدود حتى يمكن تقدير المناطق الكاملة للنماذج بدقة. بالإضافة إلى ذلك، يتم تدريب IRNet باستخدام العلاقات بين البكسل في خرائط الانتباه، وبالتالي لا يتطلب أي إشراف إضافي. حققت طريقتنا مع IRNet أداءً متميزًا على مجموعة بيانات PASCAL VOC 2012، حيث تفوقت ليس فقط على أفضل النماذج السابقة التي تم تدريبها بنفس مستوى الإشراف، بل أيضًا على بعض النمازل التي تعتمد على إشراف أقوى.注:在“则能使 us”这部分中,“us”应该被替换为“نحن”,以保持句子的一致性和自然性。以下是最终版本:يقدم هذا البحث منهجية جديدة لتعلم تقسيم النماذج (instance segmentation) باستخدام تصنيفات الصور على مستوى الصورة كإشراف. تولد منهجيتنا ملصقات تقسيم نماذج وهمية للصور التدريبية، والتي تستخدم لتدريب نموذج مشرف عليه بالكامل. لإنتاج هذه الملصقات الوهمية، نحدد أولاً المناطق البذرية الموثوقة لأنواع الأشياء من خرائط الانتباه لنمو델 جمع البيانات (image classification model)، ثم نقوم بتوسيعها لاكتشاف المناطق الكاملة للنماذج مع حدود دقيقة. لهذا الغرض، اقترحنا IRNet (Interactive Region Network)، وهو نمودل يقدر المناطق الخشنة للأمثلة الفردية ويكتشف الحدود بين أنواع الأشياء المختلفة. وبذلك,则能使我们 قادرة على تعيين ملصقات النماذج للبذور وتوسيعها داخل الحدود حتى يمكن تقدير المناطق الكاملة للنماذج بدقة. بالإضافة إلى ذلك، يتم تدريب IRNet باستخدام العلاقات بين البكسل في خرائط الانتباه (attention maps)، وبالتالي لا يتطلب أي إشراف إضافي. حققت طريقتنا مع IRNet أداءً متميزًا على مجموعة بيانات PASCAL VOC 2012 (PASCAL Visual Object Classes 2012 dataset)، حيث تفوقت ليس فقط على أفضل النمازل السابقة التي تم تدريبها بنفس مستوى الإشراف (supervision level), بل أيضًا على بعض النمازل التي تعتمد على إشراف أقوى (stronger supervision).