سمات السياق المُقابلة والتكامل المُتعدد المقياس المُتحكّم ببوابة لتقسيم المشهد

يُعد تصنيف المشهد مهمة صعبة، حيث يتطلب تسمية كل بكسل في الصورة. ومن الضروري استغلال السياق التمييزي وجمع السمات متعددة المقياس لتحقيق تقسيم أفضل. في هذه الورقة، نُقدّم أولًا ميزة موضعية مُقابلة للسياق جديدة، والتي لا تُستغل فقط السياق المعلوماتي، بل تُبرز أيضًا المعلومات المحلية من خلال التمييز عنها بالنسبة للسياق. تُحسّن هذه الميزة الموضعية المُقابلة للسياق أداء التحليل بشكل كبير، خاصةً في حالة الكائنات غير البارزة والمواد الخلفية. علاوةً على ذلك، نُقدّم خطة مُعتمدة على الجمع المشروط (gated sum) لجمع السمات متعددة المقياس بشكل انتقائي لكل موقع فراغي. حيث تتحكم البوابات في هذه الخطة في تدفق المعلومات بين السمات المختلفة على المقياس، وتُولَّد قيمها من الصورة المُختبرة بواسطة الشبكة المُقترحة التي تعلمت من البيانات التدريبية، مما يجعلها مُتكيفة ليس فقط مع البيانات التدريبية، بل أيضًا مع الصورة المُختبرة المحددة. وبلا إضافات مُبهرة، تحقق الطريقة المقترحة أداءً مُتفوّقًا على المستويات المتقدمة (state-of-the-art) بشكل متسق على ثلاث مجموعات بيانات شهيرة لتصنيف المشهد: Pascal Context و SUN-RGBD و COCO Stuff.