Top-DB-Net: Top DropBlock لتعزيز النشاط في إعادة تحديد الأشخاص

تُعد مهمة التعرف على الأشخاص (Person Re-Identification) مهمة صعبة تهدف إلى استرجاع جميع حالات الصورة الاستعلامية عبر نظام من الكاميرات غير المتقاطعة. وبسبب التغيرات القصوى في الزاوية المرئية، يُعد من الشائع أن تُكبح المناطق المحلية التي يمكن استخدامها للتوافق بين الأشخاص، ما يؤدي إلى حالة يتطلب فيها النهج تقييم تشابه الصور بناءً على مناطق أقل إفادة. في هذا العمل، نُقدّم طريقة تُسمى Top-DB-Net، وهي طريقة تعتمد على Top DropBlock، وتُشجّع الشبكة على التركيز على الخلفية الأمامية للصورة، مع التركيز الخاص على المناطق الأكثر صلة بالمهام، وفي الوقت نفسه تُشفّر المناطق منخفضة الإفادة لتقديم تمييز عالي. تتكوّن Top-DB-Net من ثلاثة مسارات: (i) مسار عالمي يُشفر معلومات صورة غنية من خلال هيكل أساسي (backbone)، (ii) مسار Top DropBlock الذي يشجع الهيكل الأساسي على تشفير المناطق منخفضة الإفادة باستخدام ميزات تمييزية عالية، و (iii) مسار تنظيم يساعد في التعامل مع الضوضاء الناتجة عن عملية الحذف في المسار الثاني، حيث تُستخدم المسارات الأولى والثانية أثناء الاختبار. أظهرت التجارب الواسعة على ثلاث مجموعات بيانات صعبة قدرات منهجنا مقارنةً بالأساليب الرائدة في المجال. كما أظهرت النتائج النوعية أن منهجنا يُظهر خرائط تنشيط أفضل، تركز على الأجزاء الموثوقة في الصور المدخلة.