SoccerNet-v2: Ein Datensatz und Benchmarks für ein umfassendes Verständnis von Fußballübertragungen

Das Verstehen von Sendevideos ist eine herausfordernde Aufgabe im Bereich der Computer Vision, da es generische Schlussfolgerungsfähigkeiten erfordert, um den Inhalt zu würdigen, den die Videobearbeitung bietet. In dieser Arbeit schlagen wir SoccerNet-v2 vor, ein neues großes Korpus manueller Annotationen für den SoccerNet-Videodatensatz, zusammen mit offenen Herausforderungen, um mehr Forschung im Bereich des Fußballverstehens und der Sendeproduktion zu fördern. Insbesondere veröffentlichen wir etwa 300.000 Annotationen innerhalb von 500 ungeschnittenen Fußballsendevideos von SoccerNet. Wir erweitern die aktuellen Aufgaben im Bereich des Fußballs um die Aktionserkennung (action spotting), die Kameraeinstellungssegmentierung mit Randdetektion und definieren eine neue Aufgabe zur Replay-Verankerung (replay grounding). Für jede Aufgabe stellen wir Benchmark-Ergebnisse bereit und diskutieren diese, die mit unseren Open-Source-adaptierten Implementierungen der relevantesten Arbeiten auf diesem Gebiet reproduzierbar sind. SoccerNet-v2 wird der breiteren Forschungsgemeinschaft vorgestellt, um Computer Vision näher an automatisierte Lösungen für allgemeinere Videoverstehens- und Produktionsszenarien heranzuführen.