إعادة تحديد الهوية في الرياضة: تحسين إعادة تحديد هوية اللاعبين في مقاطع البث التلفزيوني للرياضات الجماعية

يُركّز هذا العمل على إعادة تحديد اللاعبين في مقاطع الفيديو البثية لرياضات الفريق. وبشكل خاص، نركز على تحديد اللاعب نفسه في الصور التي تم التقاطها من وجهات نظر كاميرات مختلفة خلال أي لحظة معينة من المباراة. يختلف هذا المهمة عن التطبيقات التقليدية لإعادة التعرف على الأشخاص (person re-id) بطرق مهمة عدة. أولاً، يرتدي لاعبو الفريق نفسه ملابس متشابهة جدًا، مما يجعل من الصعب التمييز بينهم. ثانيًا، يوجد عدد قليل جدًا من العينات لكل هوية، مما يُعقّد عملية تدريب نظام إعادة التعرف. ثالثًا، تكون دقة الصور غالبًا منخفضة جدًا وتختلف بشكل كبير. وعندما تُضاف إلى ذلك الازدحام الشديد والحركة السريعة للرياضيين، تزداد التحديات المفروضة على مهمة إعادة التعرف بشكل كبير. في هذه الورقة، نقترح إجراءًا بسيطًا لكنه فعّالًا للعينة الهرمية للبيانات، ووظيفة خسارة مركزية (centroid loss function)، حيث تؤدي هذه العناصر معًا إلى زيادة في الدقة المتوسطة الحسابية (mAP) بنسبة 7–11.5%، وزيادة في الترتيب الأول (Rank-1) بنسبة 8.8–14.9%، دون أي تغيير في البنية الشبكية أو المعلمات الفائقة المستخدمة. يُحسّن إجراء العينة البيانات لدينا تشابه التوزيعات بين البيانات التدريبية والاختبارية، وبالتالي يُسهم في تحسين تقديرات مراكز المُدمجات (أو متجهات الميزات). ولفت الانتباه، تُظهر دراستنا أن وجود بيانات محدودة جدًا، كما هو الحال في تطبيقنا، يُؤدي إلى أن وظيفة الخسارة المركزية البسيطة القائمة على المسافات الإقليدية تتفوّق بشكل كبير على دالة الخسارة الشهيرة (triplet-centroid loss function). ونُظهر تحسينات مماثلة لكل من الشبكات التلافيفية (convolutional networks) ونماذج المحولات البصرية (vision transformers). يُعدّ منهجنا من بين الأفضل في قائمة التصنيف الخاصة بتحدي إعادة التعرف على SoccerNet 2022 (القسم المُختبئ للاختبار)، حيث حقق mAP قدره 86.0 وR1 قدره 81.5. أما في القسم المُختبئ للتحدي، فقد حقق mAP قدره 84.9 وR1 قدره 80.1. تُعدّ الأبحاث المتعلقة بإعادة التعرف في التطبيقات المرتبطة بالرياضة محدودة جدًا، وتمثّل هذه الدراسة واحدة من أولى المناقشات في الأدبيات العلمية حول هذا الموضوع.