استكشاف مشاركة المعلمات وخسارة الثلاثي القائمة على المركز غير المتجانس لاعتراف الشخص في البيئات المرئية والحرارية

يركز هذا البحث على مهمة إعادة تعريف الشخص عبر الأصناف المرئية والحرارية (VT Re-ID)، والتي تهدف إلى مطابقة صور الأشخاص بين الصنف المرئي في النهار والصنف الحراري في الليل. يتم عادةً اعتماد الشبكة ذات التيارين لمعالجة الاختلاف بين الأصناف، وهو المشكلة الأكثر تحديًا في VT Re-ID، من خلال تعلم خصائص الشخص المتعددة الأصناف. في هذا البحث، نستكشف عدد المعلمات التي يجب أن تشترك فيها الشبكة ذات التيارين، وهي نقطة لم يتم دراستها بشكل جيد في الأدبيات الحالية.من خلال تقسيم نموذج ResNet50 بشكل جيد لبناء شبكة استخراج الخصائص الخاصة بالصنف وشبكة تضمين الخصائص المشتركة بين الأصناف، نقوم بتجربة تأثير مشاركة المعلمات في الشبكة ذات التيارين لـ VT Re-ID. بالإضافة إلى ذلك، ضمن إطار تعلم خصائص الشخص على مستوى الأجزاء، نقترح خسارة الثلاثي القائمة على مركز غير متجانس (hetero-center based triplet loss) لتخفيف القيود الصارمة للخسارة التقليدية للثلاثي من خلال استبدال مقارنة العنصر الرئيسي (anchor) بكل العينات الأخرى بمقارنة مركز العنصر الرئيسي (anchor center) بمراكز العينات الأخرى. باستخدام وسائل بسيطة للغاية، يمكن للطريقة المقترحة أن تحسن بشكل كبير أداء VT Re-ID.تظهر النتائج التجريبية على قاعدتي بيانات أن الطريقة المقترحة لدينا تتقدم بشكل واضح على أفضل الأساليب الحالية بأرقام كبيرة، خاصةً على قاعدة بيانات RegDB حيث حققت أداءً فائقًا بنسبة رتبة 1 / mAP / mINP 91.05٪ / 83.28٪ / 68.84٪. يمكن أن تكون هذه الطريقة أساسًا جديدًا لـ VT Re-ID مع استراتيجية بسيطة ولكن فعالة.