من الوضعيات إلى الهوية: إعادة تحديد الهوية الشخصية دون تدريب من خلال تمركز الميزات

تهدف إعادة تحديد الهوية (ReID) إلى استخراج ميزات تمثيل دقيقة للهوية. ومع ذلك، فإن العينات الفردية تتأثر بالضرورة بالضوضاء (الخلفية، والاختناقات، وقيود النموذج) أثناء استخراج الميزات. وبما أن الميزات الناتجة عن نفس الهوية تتبع توزيعًا طبيعيًا حول مراكز الهوية بعد التدريب، نقترح إطارًا لـ ReID يعتمد على تجميع الميزات دون الحاجة إلى التدريب (Pose2ID)، من خلال جمع ميزات نفس الهوية لتقليل الضوضاء الفردية وتعزيز استقرار تمثيل الهوية، مع الحفاظ على التوزيع الأصلي للميزات لاستخدامه في استراتيجيات لاحقة مثل إعادة الترتيب. وبشكل خاص، لاستخلاص عينات من نفس الهوية، نُدخل مكوّنين: توليد المشاة الموجه بالهوية: من خلال استخدام ميزات الهوية لتوجيه عملية التوليد، نحصل على صور عالية الجودة بوضعيات متنوعة، مما يضمن التماسك في الهوية حتى في السيناريوهات المعقدة مثل الأشعة تحت الحمراء والاختناقات. تجميع الميزات المجاورة: يستكشف هذا المكوّن العينات الإيجابية المحتملة لكل عينة من منطقتها المجاورة. تُظهر التجارب أن نموذج التوليد لدينا يتمتع بقدرات تعميم قوية ويحافظ على اتساق عالٍ في الهوية. وباستخدام إطار تجميع الميزات، نحقق أداءً مبهرًا حتى باستخدام نموذج مُدرّب مسبقًا على ImageNet دون تدريب خاص بـ ReID، حيث نصل إلى مقياس mAP/Rank-1 البالغ 52.81/78.92 على مجموعة Market1501. علاوة على ذلك، يُعدّ أسلوبنا الأفضل عالميًا في المهام القياسية، وعبر الأنواع المختلفة، والمهام المُعَرَّضة للاختناقات، مما يُظهر مرونتَه القوية.