HyperAIHyperAI
منذ 17 أيام

التدريب المسبق غير المراقب لتحديد الأشخاص إعادة التعرف

Dengpan Fu, Dongdong Chen, Jianmin Bao, Hao Yang, Lu Yuan, Lei Zhang, Houqiang Li, Dong Chen
التدريب المسبق غير المراقب لتحديد الأشخاص إعادة التعرف
الملخص

في هذه الورقة، نقدم مجموعة بيانات كبيرة غير مُسَمَّاة لتحديد الأشخاص (Re-ID) تُسمَّى "LUPerson"، ونُقدِّم المحاولة الأولى لإجراء التدريب المُسبق غير المُشرَف لتحسين قدرة التعميم لتمثيل الميزات المستخلصة في تحديد الأشخاص. ويُعد هذا النهج محاولة لمعالجة المشكلة التي تعاني منها جميع مجموعات البيانات الحالية لتحديد الأشخاص، حيث تُعدّ محدودة الحجم بسبب الجهد الكبير المطلوب في التسمية التلقائية للبيانات. سبق أن حاولت الأبحاث السابقة الاستفادة من النماذج المُدرَّبة مسبقًا على ImageNet لتخفيف نقص بيانات تحديد الأشخاص، لكنها تعاني من الفجوة الكبيرة بين مجالات ImageNet وبيانات تحديد الأشخاص. أما LUPerson فهي مجموعة بيانات غير مُسَمَّاة تتضمن 4 ملايين صورة لـ 200 ألف هوية على الأقل، أي أنها تزيد عن 30 مرة في الحجم عن أكبر مجموعة بيانات موجودة حاليًا لتحديد الأشخاص. كما تغطي أيضًا طيفًا واسعًا من بيئات التصوير المختلفة (مثل إعدادات الكاميرات، والمشاهد، وغيرها). بناءً على هذه المجموعة، نُجري دراسة منهجية للعوامل الأساسية في تعلم ميزات تحديد الأشخاص من منظورين: تكبير البيانات (data augmentation) والخسارة التقابلية (contrastive loss). وتبين أن التدريب المُسبق غير المُشرَف على هذه المجموعة الكبيرة يُنتج تمثيلًا عامًا لميزات تحديد الأشخاص، يمكنه تعزيز جميع الطرق الحالية لتحديد الأشخاص. وباستخدام نموذجنا المُدرَّب مسبقًا ضمن بعض الإطارات الأساسية، نحقق نتائج متفوقة على مستوى الحد الأقصى (state-of-the-art) دون الحاجة إلى تعديلات إضافية على أربع مجموعات بيانات شائعة لتحديد الأشخاص: CUHK03 وMarket1501 وDukeMTMC وMSMT17. كما تُظهر النتائج أن تحسين الأداء يكون أكثر وضوحًا في مجموعات بيانات الهدف الصغيرة أو في ظل ظروف التدريب القليلة (few-shot setting).

التدريب المسبق غير المراقب لتحديد الأشخاص إعادة التعرف | أحدث الأوراق البحثية | HyperAI