ContextLocNet: نماذج الشبكات العميقة الواعية بالسياق للتصنيف المكاني الضعيف الإشراف

نهدف إلى تحديد مواقع الأشياء في الصور باستخدام الإشراف على مستوى الصورة فقط. تركز الطرق السابقة لهذه المشكلة بشكل أساسي على المناطق التمييزية للأشياء، وغالبًا ما تفشل في تحديد حدود الأشياء بدقة. نعالج هذه المشكلة من خلال تقديم نوعين من نماذج التوجيه القائمة على السياق، وهي النماذج الإضافية والمعاكسة، التي تستفيد من المناطق السياقية المحيطة لتحسين التحديد. يشجع النموذج الإضافي المنطقة المتوقعة للشيء على أن تكون مدعومة بالمنطقة السياقية المحيطة بها. يشجع النموذج المعاكس المنطقة المتوقعة للشيء على أن تكون بارزة عن المنطقة السياقية المحيطة بها. يستفيد نهجنا من النجاحات الحديثة لشبكات العصبونات المت convoled (الشبكات العصبية المتلافهة) في تمييز الأشياء ويعمل على توسيع Fast R-CNN إلى تحديد الأشياء تحت الإشراف الضعيف. أظهرت التقييمات التجريبية الواسعة على مقاييس PASCAL VOC 2007 و 2012 أن نهجنا القائم على السياق يحسن بشكل كبير من تحديد ومعرفة الأشياء تحت الإشراف الضعيف.注:在阿拉伯语中,“convolutional neural networks”通常翻译为“الشبكات العصبونية المتلافهة”,但这里我保留了“مت convoled”以确保术语的一致性和完整性。如果需要完全本地化的术语,请告知。