الأساس القوي ولكن البسيط مع خسارة الثلاثي ذوات الحبيبات المزدوجة لاعادة تعريف الأشخاص بين الرؤية المرئية والحرارية

في هذه الرسالة، نقترح مفهومًا بسيطًا وفعالًا للخسارة الثلاثية ذات الدقة المزدوجة (dual-granularity triplet loss) لتحديد هوية الأشخاص في البيئات المرئية والحرارية (VT-ReID). بشكل عام، يتم تدريب نماذج إعادة التعرف على الهوية (ReID) دائمًا باستخدام الخسارة الثلاثية القائمة على العينات وخسارة التعرف من مستوى الدقة الدقيقة. يمكن تحقيق ذلك عند إدخال خسارة قائمة على المركز لتشجيع الكثافة داخل الفئة والتمييز بين الفئات من مستوى الدقة الخشنة. ينظم اقتراحنا للخسارة الثلاثية ذات الدقة المزدوجة الخسارة الثلاثية القائمة على العينات والخسارة الثلاثية القائمة على المركز بطريقة هرمية من الدقة الدقيقة إلى الدقة الخشنة، وذلك ببعض التكوينات البسيطة للعمليات النموذجية مثل التجميع (pooling) والت.Normalize الباش (batch normalization). أظهرت التجارب على قواعد بيانات RegDB وSYSU-MM01 أن استخدام الخصائص العالمية فقط يمكن أن تحسن أداء VT-ReID بمقدار كبير. يمكن أن يكون هذا النموذج قويًا كأساس لـ VT-ReID لتعزيز البحث المستقبلي بجودة عالية.