SoccerNet-v2 : Un jeu de données et des benchmarks pour une compréhension globale des vidéos de soccer diffusées à la télévision

Comprendre les vidéos de diffusion est une tâche complexe en vision par ordinateur, car elle nécessite des capacités de raisonnement générique pour apprécier le contenu offert par l'édition vidéo. Dans cette étude, nous proposons SoccerNet-v2, un nouveau corpus d'annotations manuelles à grande échelle pour le jeu de données vidéo SoccerNet, accompagné de défis ouverts visant à encourager davantage de recherches sur la compréhension du football et la production de diffusions. Plus précisément, nous mettons à disposition environ 300 000 annotations au sein des 500 vidéos non coupées de diffusions de football de SoccerNet. Nous étendons les tâches actuelles dans le domaine du football pour inclure la détection d'actions, la segmentation des plans caméra avec détection des limites, et nous définissons une nouvelle tâche de contextualisation des replays (replay grounding). Pour chaque tâche, nous fournissons et discutons des résultats de référence qui peuvent être reproduits grâce à nos implémentations adaptées et open-source des travaux les plus pertinents dans ce domaine. SoccerNet-v2 est présenté à la communauté scientifique plus large afin d'aider à rapprocher la vision par ordinateur des solutions automatiques pour une compréhension et une production vidéo plus générales.