مسح الميزات وشبكة التفتيت لإعادة تحديد الشخص المغطى

التعريف بإعادة تحديد الأشخاص المغطّين (ReID) يهدف إلى مطابقة صور الأشخاص المغطّين مع الصور الشاملة عبر وجهات نظر مختلفة للكاميرات. يتم عادةً تضليل الأشخاص المستهدفين (TP) بواسطة العناصر غير البشرية المغطّية (NPO) والأشخاص غير المستهدفين (NTP). ركزت الطرق السابقة بشكل أساسي على زيادة قوة نموذج التعلم ضد NPO بينما أغفلت التلوث الناتج عن الخصائص من NTP. في هذا البحث، نقترح شبكة جديدة لإزالة الخصائص وتوسيعها (FED) للتعامل مع NPO وNTP بشكل متزامن. بوجه خاص، يتم القضاء على خصائص NPO من خلال وحدة إزالة الغطاء المقترحة لدينا (OEM)، والتي تُساعد فيها استراتيجية تعزيز NPO التي تحاكي NPO على صور المشاة الشاملة وتولّد أقنعة غطاء دقيقة. بعد ذلك، نوسع تمثيلات المشاة بخصائص أخرى محفوظة لتصنيع خصائص NTP في الفضاء الخطي، وهو ما يتم تحقيقه من خلال وحدة توسيع الخصائص الجديدة (FDM) عبر آلية انتباه متقاطع قابلة للتعلم. تحت إرشاد درجات الغطاء من OEM، يتم تنفيذ عملية توسيع الخصائص بشكل أساسي على أجزاء الجسم المرئية، مما يضمن جودة خصائص NTP المصطنعة. من خلال تحسين OEM وFDM بشكل مشترك في شبكتنا المقترحة FED، يمكننا تحسين قدرة النموذج على الإدراك نحو TP بشكل كبير وتخفيف تأثير NPO وNTP. بالإضافة إلى ذلك، تعمل الوحدة المقترحة FDM كوحدة مساعدة فقط أثناء التدريب وسيتم التخلّي عنها في مرحلة الاستدلال، مما يؤدي إلى زيادة طفيفة جداً في الحسابات اللازمة للاستدلال. أظهرت التجارب على مقاييس إعادة تحديد الأشخاص المغطّين والشاملة أن FED أفضل من أفضل التقنيات الموجودة حالياً، حيث حققت FED دقة رتبة 1 بنسبة 86.3% على Occluded-REID، مما يتفوق على الآخرين بمقدار لا يقل عن 4.7%.