HyperAI

Procedure Step Recognition

La Reconnaissance des Étapes Procédurales (REP) est une sous-tâche dans le domaine de la vision par ordinateur qui se concentre sur l'identification de l'exécution correcte et de l'ordre des étapes procédurales. L'objectif de la REP est d'extraire toutes les étapes correctement réalisées par une personne jusqu'à un temps $t$, en se basant sur les entrées des capteurs $X_t=(x_t, x_{t-1}, \dots, x_{t-h})$ à ce temps $t$ et sur l'ensemble des actions procédurales à exécuter $\mathcal{P}=\{a_0, a_1, \dots, a_n\}$. Contrairement à la reconnaissance traditionnelle des actions, qui peut se concentrer sur l'exécution partielle des actions, la REP met l'accent sur le statut d'achèvement et la correction des étapes procédurales. Cela offre une perspective plus significative pour comprendre les vidéos procédurales et présente une valeur d'application importante.