17 天前

体育赛事重识别:提升团队运动广播视频中球员的重识别性能

Bharath Comandur
体育赛事重识别:提升团队运动广播视频中球员的重识别性能
摘要

本研究聚焦于团队运动广播视频中的球员重识别任务。具体而言,我们致力于在比赛任意时刻,从不同摄像机视角捕捉到的图像中识别出同一球员。该任务与传统行人重识别(person re-id)应用存在若干关键差异。首先,同一球队的球员穿着高度相似的服装,导致区分难度显著增加;其次,每个身份的样本数量极为有限,这给重识别系统的训练带来了挑战;第三,图像分辨率通常较低且差异较大,加之球员频繁出现遮挡和快速运动,进一步加剧了重识别的难度。本文提出了一种简单但高效的分层数据采样策略,以及一种基于中心点(centroid)的损失函数。二者结合使用后,在不改变网络结构或超参数的前提下,使平均精度均值(mAP)提升了7至11.5个百分点,排名1准确率(R1)提升了8.8至14.9个百分点。所提出的采样方法有效提升了训练集与测试集分布的相似性,从而有助于更准确地估计嵌入特征(或特征向量)的中心点。令人意外的是,我们的研究表明,在数据严重受限的情况下(如本研究所涉及的应用场景),基于欧几里得距离的简单中心点损失函数,显著优于当前流行的三元组-中心点损失函数。该方法在卷积神经网络与视觉Transformer模型上均取得了相当的性能提升。在SoccerNet重识别挑战赛2022年的公开测试集排行榜中,我们的方法位列前列,取得mAP为86.0、R1为81.5的优异成绩;在封闭的挑战测试集上,亦达到了mAP 84.9和R1 80.1的性能表现。目前,面向体育应用的重识别研究仍十分有限,本工作为该领域提供了文献中最早的系统性探讨之一。