تحسين التعرف على الشخص بناءً على البارزة والتحليل الدلالي باستخدام نماذج الشبكات العصبية العميقة

عندما يتم التقاط مقطع فيديو أو صورة لشخص بواسطة كاميرا، فإن عملية إعادة التعرف على الشخص هي عملية استرجاع جميع حالات نفس الشخص من مقاطع الفيديو أو الصور التي تم التقاطها بواسطة كاميرا مختلفة ذات مجال رؤية غير متداخل. تجد هذه المهمة تطبيقات في مجالات متنوعة مثل المراقبة، والأدلة الجنائية، والروبوتات، والإعلام المتعدد.في هذا البحث، نقدم إطارًا جديدًا يُسمى إعادة التعرف باستخدام التحليل الدلالي للعناصر البارزة (SSP-ReID)، يستفيد من قدرات كل من العناصر البارزة وخرائط التحليل الدلالي لتوجيه شبكة عصبية تقنية التعلم العميق (CNN) الأساسية لتعلم تمثيلات مكملة تحسن النتائج فوق الشبكات الأصلية. فكرة دمج عناصر متعددة تستند إلى سيناريوهات معينة فيها استجابة واحدة تكون أفضل من الأخرى، مما يجعل الجمع بينهما يزيد من الأداء.بفضل تعريفه، يمكن تطبيق إطارنا بسهولة على مجموعة واسعة من الشبكات، وعلى عكس الأساليب التنافسية الأخرى، يتبع عملية التدريب بروتوكولات بسيطة ومعيارية. نقدم تقييمًا شاملًا لنهجنا عبر خمس شبكات أساسية وثلاثة مقاييس. تظهر النتائج التجريبية فعالية إطارنا لإعادة التعرف على الشخص. بالإضافة إلى ذلك، نجمع بين إطارنا وتقنيات إعادة الترتيب لتحقيق أفضل النتائج الحالية في ثلاثة مقاييس.