il y a 2 mois
Méthode de référence CNN spatio-temporelle pour la tâche de vidéo sportive du benchmark MediaEval 2021
Pierre-Etienne Martin

Résumé
Ce document présente la méthode de référence proposée pour la tâche Sports Video du benchmark MediaEval 2021. Cette tâche comprend deux sous-tâches : la détection de coups (stroke detection) et la classification de coups (stroke classification). La méthode de référence aborde les deux sous-tâches. L'architecture CNN spatio-temporelle et le processus d'entraînement du modèle sont adaptés en fonction de la sous-tâche traitée. Le but de cette méthode est d'aider les participants à résoudre la tâche et non d'atteindre des performances de pointe. Néanmoins, pour la sous-tâche de détection, la méthode de référence performe mieux que les autres participants, ce qui souligne la difficulté d'une telle tâche.