كشف التمييز المشترك باستخدام الشبكات التلافيفية الكاملة الموجهة بالقناع مع نعومة التسمية متعددة المقياس

في مشكلة الكشف عن التميّز المشترك للصور، يُعدُّ أحد القضايا الأساسية كيفية نمذجة الأنماط المتزامنة للأجزاء المتميزة مشتركًا، التي تظهر داخل كل صورة وفي الوقت نفسه عبر جميع الصور ذات الصلة. في هذه الورقة، نقترح إطارًا هرميًا للكشف عن التميّز المشترك للصور، كاستراتيجية من المستوى الأولي إلى الدقيق، لالتقاط هذه الأنماط. نبدأ بعرض بنية شبكة متعددة التحويلات الكاملة موجهة بالقناع، بهدف إنتاج نتيجة أولية للكشف عن التميّز المشترك. ويُستخدم القناع لإزالة الخلفية، وهو يُتعلم من خرائط استجابة الميزات عالية المستوى الناتجة عن الشبكة المُدرَّبة مسبقًا VGG-net. ثم نقترح نموذجًا متعدد المقياس لتنعيم التسميات، بهدف تحسين النتيجة النهائية للكشف. ويُحسّن هذا النموذج بشكل مشترك سلاسة تسميات البكسلات والسوبربكسلات. وتُظهر نتائج التجارب على ثلاث مجموعات بيانات شهيرة لاختبار الكشف عن التميّز المشترك للصور، تشمل iCoseg وMSRC وCosal2015، الأداء المتميز مقارنةً بالأساليب الرائدة في مجالها.