شبكة الانتباه المتناسق لإعادة تعريف الشخص

الطرق الحالية لإعادة التعرف على الأشخاص (إعادة التعرف - Re-ID) إما تفترض توفر صور مربعات حدودية للأشخاص محاذاة بشكل جيد كمدخلات للنموذج، أو تعتمد على آليات اختيار انتباه مقيدة لتصحيح الصور غير المنسقة. ولذلك، فهي غير مثلى لإعادة التعرف على الأشخاص في صور غير منسقة بشكل عشوائي قد تحتوي على تباينات كبيرة في وضعيات الجسم وأخطاء الكشف التلقائي غير المقيدة. في هذا البحث، نوضح المزايا التي يمكن تحقيقها من خلال تعلم الانتباه واختيار الخصائص بشكل مشترك في شبكة عصبية تقنية (CNN) عن طريق زيادة المعلومات المكملة لأنواع مختلفة من الانتباه البصري وفقًا لقيود التعلم التمييزي لإعادة التعرف. تحديدًا، نقوم بوضع نموذج جديد لشبكة العناية المتناسقة (HA-CNN) لتحقيق تعلم مشترك للانتباه البيكسل الناعم والانتباه الإقليمي القاسي مع تحسين متزامن لتمثيلات الخصائص، بهدف تحسين إعادة التعرف على الأشخاص في الصور الغير خاضعة للرقابة (غير المحاذاة). تم إجراء تقييمات مقارنة واسعة النطاق أثبتت تفوق هذا النموذج الجديد HA-CNN لإعادة التعرف على الأشخاص على مجموعة متنوعة من الأساليب المتقدمة في ثلاثة مقاييس كبيرة هي CUHK03 وMarket-1501 وDukeMTMC-ReID.