التعلم العميق للارتباطات لتمييز الأشخاص في الفيديو بدون إشراف

بدأت طرق التعلم العميق في الهيمنة على تقدم البحث في إعادة تحديد هوية الأشخاص المستندة إلى الفيديو (إعادة التعرف - Re-ID). ومع ذلك، فإن معظم الطرق الحالية تركز على التعلم الإشرافي، الذي يتطلب جهودًا يدوية مكثفة لتصنيف البيانات الثنائية عبر وجهات النظر المختلفة. ولذلك، تعاني هذه الطرق بشدة من نقص القابلية للتوسع والعملية في تطبيقات المراقبة المرئية الحقيقية. في هذا العمل، لمعالجة مهمة إعادة تحديد هوية الشخص في الفيديو، قمنا بوضع مخطط جديد للتعلم الجمعي العميق (DAL)، وهو أول طريقة تعلم عميق من النهاية إلى النهاية لا تتطلب أي ملصقات هوية في مرحلتي المبادرة والتدريب للنموذج. يقوم DAL بتعلم نموذج مطابقة إعادة التعرف العميق عن طريق تحسين خسارة جمعيتين هامشيتين بشكل مشترك ومن النهاية إلى النهاية، مما يقيّد فعّالياً ارتباط كل إطار بأفضل تمثيل داخلي للمستشعر وتمثيل عبر المستشعرات. يمكن استخدام الشبكات العصبية التقليدية (CNNs) بسهولة ضمن مخططنا DAL. تظهر نتائج التجارب أن طريقة DAL المقترحة لدينا تتفوق بشكل كبير على أفضل الطرق غير الإشرافية الحالية لإعادة تحديد هوية الأشخاص في الفيديو على ثلاثة مقاييس مرجعية: PRID 2011، iLIDS-VID وMARS.