HyperAI

Weakly Supervised Action Segmentation

La Segmentation d'Actions Faiblement Supervisée (Transcription) est une sous-tâche dans le domaine de la vision par ordinateur qui vise à segmenter temporellement les actions dans des vidéos en utilisant uniquement des descriptions de haut niveau des séquences d'actions, telles que des transcriptions textuelles. L'objectif de cette tâche est d'identifier et de localiser précisément les points de début et de fin de diverses actions au sein d'une vidéo, sans dépendre de grandes quantités de données finement annotées. La segmentation d'actions faiblement supervisée peut considérablement réduire le coût de l'annotation des données et améliorer la capacité de généralisation des modèles, ce qui la rend précieuse dans des applications telles que la compréhension des vidéos, l'analyse du comportement et l'interaction homme-machine.