إعادة التفكير في استراتيجيات العينة لتحديد الأشخاص غير المُدرَّس بشكل غير مراقب

تظل إعادة التعرف على الأشخاص بدون إشراف (re-ID) مهمةً صعبة. وعلى الرغم من التوجه الكبير نحو تصميم الهياكل ووظائف الخسارة، يُظهر هذا البحث أن استراتيجية العينة تلعب دورًا مماثلًا في الأهمية. نقوم بتحليل الأسباب الكامنة وراء الفروق في الأداء بين استراتيجيات العينة المختلفة ضمن نفس الإطار ووظيفة خسارة واحدة. ونُقترح أن التدهور الناتج عن التعلم الزائد (over-fitting) يُعد عاملًا مهمًا يُسبب الأداء الضعيف، وأن تعزيز الاستقرار الإحصائي يمكن أن يُصحح هذه المشكلة. مستلهمين من ذلك، نقترح منهجًا بسيطًا وفعّالًا يُسمّى "العينة المجمّعة" (group sampling)، والذي يجمّع العينات من نفس الفئة في مجموعات. يتم بذلك تدريب النموذج باستخدام عينات مُوحّدة ضمن المجموعات، مما يُخفّف من الأثر السلبي للعينات الفردية. كما أن العينة المجمّعة تُحدّث عملية توليد التسميات الوهمية (pseudo-label generation) من خلال ضمان تصنيف العينات بشكل أكثر كفاءة في الفئات الصحيحة. كما تُنظّم عملية تعلّم التمثيل، وتعزّز الاستقرار الإحصائي في تمثيل الميزات بطريقة تدريجية. أظهرت التجارب الواسعة على مجموعات البيانات Market-1501 وDukeMTMC-reID وMSMT17 أن العينة المجمّعة تحقق أداءً يُنافس أفضل الطرق الحالية، وتفوق التقنيات الحالية في البيئات التي لا تعتمد على الكاميرات (camera-agnostic). تم إتاحة الشفرة المصدرية على الرابط: https://github.com/ucas-vg/GroupSampling.