طبقة استخراج منطقة الاهتمام الجديدة لتقسيم المثيل

بالنظر إلى الانتشار الواسع لهياكل الشبكات العصبية العميقة في المهام المرتبطة بالرؤية الحاسوبية، أصبحت العديد من التطبيقات الجديدة الآن أكثر قابلية للتحقيق. ومن بين هذه التطبيقات، حظيت التجزئة الفردية (instance segmentation) باهتمام خاص مؤخرًا، وذلك من خلال استغلال النتائج التي تحققها الشبكات ذات المراحل الثنائية (مثل Mask R-CNN أو Faster R-CNN)، التي تُشتق من R-CNN. في هذه الهياكل المعقدة، تؤدي طبقة استخراج مناطق الاهتمام (Region of Interest - RoI) دورًا محوريًا، حيث تُخصص لاستخراج مجموعة متسقة من السمات من طبقة واحدة فقط ضمن شبكة الهرم المميز (Feature Pyramid Network - FPN) المرتبطة فوق الهيكل الأساسي (backbone).يُحفَّز هذا البحث بالحاجة إلى التغلب على القيود التي تواجه مُستخرجي RoI الحالية، والتي تختار فقط طبقة واحدة (الأفضل) من FPN. وتنبع فكرتنا من أن جميع طبقات FPN تحتفظ بمعلومات مفيدة. وبالتالي، تم اقتراح طبقة جديدة تُسمى "مُستخرج RoI عام" (Generic RoI Extractor - GRoIE)، والتي تدمج كتلًا غير محلية (non-local building blocks) وآليات الانتباه (attention mechanisms) لتعزيز الأداء.تم إجراء دراسة تحليلية شاملة على مستوى المكونات لتحديد أفضل مجموعة من الخوارزميات والبارامترات المناسبة لطبقة GRoIE. علاوةً على ذلك، يمكن دمج GRoIE بشكل سلس مع أي هيكل ثنائي المراحل لمهام كشف الكائنات والتجزئة الفردية. ونتيجة لذلك، تم تقييم التحسينات التي تُحققها طبقة GRoIE عند استخدامها في هياكل حديثة حديثة متقدمة. وتكشف النتائج أن الطبقة المقترحة تُسهم في تحقيق تحسن يصل إلى 1.1% في دقة التصنيف (AP) للكشف عن المربعات المحيطة (bounding box)، وتحسين يصل إلى 1.7% في دقة التجزئة الفردية (AP).يمكن الوصول إلى الشفرة المصدرية بشكل عام عبر مستودع GitHub على الرابط التالي: https://github.com/IMPLabUniPr/mmdetection/tree/groie_dev