التعلم المتناقض غير المراقب الموجه بالتحلل لتحديد الأشخاص

يهدف التعرف على الأشخاص دون تدريب مراقب (Re-ID) إلى تطابق صور المشاة من زوايا كاميرات مختلفة في بيئة غير مراقبة. غالبًا ما تُبنى الطرق الحالية للتعريف بالأشخاص دون تدريب مراقب على العلامات الوهمية الناتجة عن التجميع (clustering). ومع ذلك، فإن جودة التجميع تعتمد بشكل كبير على جودة الميزات المُتعلمة، والتي تُهيمن عليها ألوان الصور بشكل كبير، خصوصًا في البيئة غير المراقبة. في هذه الورقة، نقترح منهجية تُسمى التعلم التبايني غير المتماثل الموجه بالتركيبات (CACL) للتعريف بالأشخاص دون تدريب مراقب، حيث يتم استخدام بنية التجميع لتوجيه عملية تعلم الميزات ضمن إطار تعلم تبايني غير متماثل مُصمم بشكل مناسب. وبشكل دقيق، نقترح خسارة تباينية على مستوى التجميع، تساعد الشبكة الثنائية (siamese network) على استخلاص التماثل في تعلم الميزات بفعالية، مع مراعاة البنية التجميعية داخل الأنواع المختلفة وبينها، وذلك بالنسبة لوجهات التحويلات المختلفة للبيانات. أظهرت التجارب الواسعة التي أُجريت على ثلاث مجموعات بيانات معيارية أداءً متفوقًا لاقتراحنا.