HyperAI

Weakly Supervised Temporal Action

La localisation temporelle d'actions faiblement supervisée est une sous-tâche dans le domaine de la vision par ordinateur qui se concentre sur l'entraînement à l'aide de labels au niveau vidéo pour identifier et situer les moments précis où les actions se produisent dans les vidéos. L'objectif de cette tâche est de déterminer avec précision les horodatages de début et de fin des actions en apprenant les caractéristiques globales de la vidéo, sans s'appuyer sur des annotations au niveau des images ou des segments. Cela réduit non seulement le coût de l'annotation des données, mais améliore également la capacité de généralisation du modèle, ce qui le rend précieux pour l'analyse et la compréhension à grande échelle des vidéos.