دمج ميزات التعلم للتعريف بالشخص التكيفي غير الخاضع للإشراف عبر المجالات

لقد اكتسبت إعادة التعرف على الأشخاص باستخدام التكيف بين المجالات غير المراقب (UDA) اهتمامًا متزايدًا بفضل فعاليتها في مجال الهدف دون الحاجة إلى تسميات يدوية. تركز معظم الطرق المستندة إلى التحسين الدقيق (fine-tuning) لـ UDA لإعادة التعرف على الأشخاص على تشفير السمات العالمية لتوليد التسميات الوهمية، مع إغفال السمات المحلية التي يمكن أن توفر معلومات دقيقة جدًا. لمعالجة هذه المشكلة، نقترح إطارًا يُسمى "دمج السمات التعلّمية" (LF2) لتعلم تلقائي لدمج السمات العالمية والمحليّة بهدف الحصول على تمثيل مُدمج أكثر شمولاً للسمات. بشكل خاص، نقوم أولاً بتدريب النموذج مسبقًا في مجال المصدر، ثم نُحسّن النموذج على مجال الهدف غير المُعلَّم باستخدام استراتيجية التدريب بين المُدرّس والطالب. يُصمَّم الشبكة المُدرّسة ذات الوزن المتوسط لتمثيل السمات العالمية، بينما تكون الشبكة الطالبة، التي تُحدَّث في كل تكرار، مسؤولة عن تمثيل السمات المحلية الدقيقة. وبدمج هذه السمات متعددة الزوايا، نستخدم تجميعًا متعدد المستويات لتوليد تسميات وهمية متنوعة. وبالتحديد، نقترح وحدة دمج قابلة للتعلّم (FM) لتسليط الضوء على المعلومات المحلية الدقيقة ضمن السمات العالمية، بهدف تجنب التعلّم الغامض لعدة تسميات وهمية. أظهرت التجارب أن إطارنا المُقترح LF2 يتفوّق على أحدث التقنيات، حيث حقق 73.5% في mAP و83.7% في Rank1 على مهمة Market1501 إلى DukeMTMC-ReID، كما حقق 83.2% في mAP و92.8% في Rank1 على مهمة DukeMTMC-ReID إلى Market1501.