تجميع التمثيلات العميقة الهرمية لتحديد هوية الشخص

يُعدّ تعلُّم تمثيلات تمييزية، ومستقلة عن الزاوية المرئية، ومتعددة المقاييس لشكل الشخص على مستويات معنوية مختلفة أمرًا بالغ الأهمية في مسألة التعرف على الأشخاص (Re-ID). وقد بذلت المجتمع العلمي جهودًا كبيرة لتطوير نماذج Re-ID العميقة التي تلتقط تمثيلًا متكاملًا لسمات على مستوى معنوي واحد. ولتحسين النتائج المحققة، تم النظر في سمات بصرية إضافية ونماذج مدعومة بمناطق جسمية (body part-driven). ومع ذلك، تتطلب هذه النهج عملاً يدويًا واسع النطاق في التصنيف البشري، أو تتطلب جهودًا حسابية إضافية. ونُجادل بأن طريقة مُستوحاة من الهيكل الهرمي، التي تلتقط معلومات متعددة المقاييس، قد تتجاوز هذه المتطلبات. وبشكل دقيق، يمكن لشريحة متعددة المقاييس تمثل المعلومات البصرية للشخص أن تُستخدم في معمارية جديدة تقوم بتحليلها إلى عوامل تمييزية خفية على عدة مستويات معنوية. كما يُدمج خسارة متعددة المهام مع استراتيجية تعلم منهجي (curriculum learning) لتعلم تمثيل شخصي تمييزي ومستقل، والذي يُستَخدم لتعلم التشابه الثلاثي (triplet-similarity learning). وقد أظهرت النتائج على ثلاث مجموعات بيانات معيارية لـ Re-ID تفوق الأداء مقارنة بالطرق الحالية (مثل دقة تزيد عن 90٪ على مجموعة بيانات Duke-MTMC).