RICA2 : Évaluation Informée par des Critères, Calibrée des Actions

La capacité à quantifier la qualité avec laquelle une action est réalisée, également connue sous le nom d'évaluation de la qualité des actions (AQA), a suscité un intérêt récent au sein de la communauté de la vision par ordinateur. Malheureusement, les méthodes précédentes ignorent souvent le barème utilisé par les experts humains et échouent à quantifier l'incertitude des prédictions du modèle. Pour combler ce fossé, nous présentons RICA² - un modèle probabiliste profond qui intègre le barème et tient compte de l'incertitude des prédictions pour l'AQA.Au cœur de notre méthode se trouve l'embedding stochastique des étapes d'action, défini sur une structure de graphe qui encode le barème. Ces embeddings diffusent une densité probabiliste dans l'espace latent, permettant à notre méthode de représenter l'incertitude du modèle. Le graphe encode les critères de notation, sur la base desquels les scores de qualité peuvent être décodés. Nous montrons que notre méthode établit un nouvel état de l'art sur des benchmarks publics, notamment FineDiving, MTL-AQA et JIGSAWS, avec des performances supérieures en prédiction de scores et en calibration d'incertitude.Notre code est disponible à l'adresse suivante : https://abrarmajeedi.github.io/rica2_aqa/