الترابط المكاني مع الخصائص المتسقة مع الفئة وانتشار المسافة الجيوديسية

التحديد المشترك (Co-localization) هو مشكلة تحديد مواقع الأشياء من نفس الفئة باستخدام مجموعة الصور التي تحتوي عليها فقط. هذه مهمة صعبة لأن يجب بناء كاشف الأشياء دون أمثلة سلبية يمكن أن تؤدي إلى إشارات مراقبة أكثر إفادة. الفكرة الرئيسية لطريقتنا هي تجميع فضاء الخصائص لشبكة عصبية اصطناعية تم تدريبها بشكل عام، للعثور على مجموعة من خصائص الشبكة العصبية الاصطناعية التي يتم تنشيطها بثبات وبكثافة عالية لفئة معينة، والتي نطلق عليها اسم الخصائص المتسقة مع الفئة (Category-consistent CNN Features). بعد ذلك، نقوم بنشر خريطة التنشيط المركبة الخاصة بهم باستخدام المسافات الجيوديسية للمجموعات الفرعية البكسلية (Superpixel Geodesic Distances) للتحديد المشترك. في مجموعة تجاربنا الأولى، نظهر أن الطريقة المقترحة تحقق أداءً يتفوق على أفضل ما وصل إليه العلم حتى الآن في ثلاثة مقاييس ذات صلة: PASCAL 2007، PASCAL-2012، ومجموعة بيانات اكتشاف الأشياء (Object Discovery Dataset). كما نظهر أن طرقتنا قادرة على اكتشاف وتتبع فئات حقيقية لم يتم رؤيتها سابقًا، حيث حققت دقة أعلى بكثير من أفضل ما وصل إليه العلم حتى الآن في ست فئات محتجزة من ImageNet. نجاح نهجنا الحدسي يتم دون أي مقترحات للمناطق أو كاشفات أشياء ويمكن أن يستند إلى شبكة عصبية اصطناعية تم تدريبها بشكل خالص على مهام تصنيف الصور دون ضبط دقيق إضافي.