مُحاكاة واعية بالكاميرا للتعريف غير المُشرَّف بالشخص

يُعالج هذا البحث مشكلة إعادة التعرف على الأشخاص دون تدريب مراقب (Re-ID) بالكامل، والتي لا تتطلب أي تسميات توضيحية. اعتمدت بعض الطرق السابقة تقنيات التجميع لتكوين تسميات وهمية، واستخدمت هذه التسميات الناتجة لتدريب نماذج Re-ID بشكل تدريجي. تُعد هذه الطرق بسيطة نسبيًا وفعّالة، لكن معظم الطرق القائمة على التجميع تُعامل كل مجموعة كفئة وهمية تمييزية فردية، مما يتجاهل التباين الكبير داخل الفئة (intra-ID) الناتج أساسًا عن تغير زوايا الكاميرات. ولحل هذه المشكلة، نقترح تقسيم كل مجموعة واحدة إلى عدة وُجهات تمثيلية (proxies) متعددة، بحيث تمثل كل وَجهة تمثيلية الحالات القادمة من نفس الكاميرا. تُمكّن هذه الوجهات المُتَعَلِّمة بالكاميرا من التعامل مع التباين الكبير داخل الفئة، وتحسن من موثوقية التسميات الوهمية الناتجة لعملية التعلم. بناءً على هذه الوجهات المُتَعَلِّمة بالكاميرا، نصمم مكونين تعلميَين تباينيين: واحد داخلي بين الكاميرات، وآخر بين الكاميرات، بهدف تحسين قدرة النموذج على التمييز بين الهويات داخل الكاميرات وعبرها. إلى جانب ذلك، تم تصميم استراتيجية عينة متوازنة للوجهات، والتي تُسهم في تحسين عملية التعلم بشكل إضافي. أظهرت التجارب الواسعة على ثلاث مجموعات بيانات كبيرة لـ Re-ID أن النهج المقترح يتفوق على معظم الطرق غير المراقبة بفارق كبير. وبالتحديد، حقق تحسينًا بنسبة 14.3% في التصنيف الأول (Rank-1) و10.2% في متوسط الدقة (mAP) مقارنة بالمركز الثاني على مجموعة البيانات الصعبة MSMT17. يمكن الوصول إلى الكود من خلال: \texttt{https://github.com/Terminator8758/CAP-master}.