ReMix: تدريب التعرف على الهوية الشخصية المعممة على مزيج من البيانات

تُعاني طرق التعرف على الشخص الحديثة (Re-ID) من قدرة تعميم ضعيفة وتواجه انخفاضًا كبيرًا في الدقة عند تغيير بيئات التقاط الصور. ويرجع السبب في ذلك إلى أن مجموعات البيانات المتعددة الكاميرات الحالية محدودة الحجم والتنوع، نظرًا لصعوبة الحصول على مثل هذه البيانات. وفي الوقت نفسه، هناك كميات هائلة من السجلات غير المصنفة التي تم التقاطها بكاميرا واحدة متاحة. يمكن جمع مثل هذه البيانات بسهولة، وبالتالي فهي أكثر تنوعًا. حاليًا، يتم استخدام بيانات الكاميرا الواحدة فقط للتدريب الذاتي الأولي لطرق Re-ID. ومع ذلك، فإن التنوع في بيانات الكاميرا الواحدة يُقمع من خلال التدريب الدقيق على بيانات متعددة الكاميرات محدودة بعد التدريب الأولي. في هذا البحث، نقترح ReMix، وهي طريقة معممة للتعرف على الشخص يتم تدريبها بشكل مشترك على خليط من بيانات متعددة الكاميرات المحدودة ومصنفة وبيانات كبيرة وغير مصنفة من كاميرا واحدة. يتم تحقيق التدريب الفعال لطريقتنا من خلال استراتيجية عينية جديدة للبيانات ودوال خسارة جديدة تم تكييفها للاستخدام المشترك مع نوعي البيانات. تظهر التجارب أن ReMix تتمتع بقدرة تعميم عالية وتتفوق على أفضل الطرق الحالية في التعرف على الشخص القابل للتعميم. حسب علمنا، هذا هو أول عمل يستكشف التدريب المشترك على خليط من بيانات متعددة الكاميرات وبيانات كاميرا واحدة في مجال التعرف على الشخص (Re-ID).