Attention Guidée pour le Prochain Objet Actif @ Défi EGO4D STA

Dans ce rapport technique, nous décrivons la solution basée sur le mécanisme de Guided-Attention pour relever le défi de l'anticipation à court terme (STA) dans le cadre du défi EGO4D. Cette solution combine les détections d'objets et les caractéristiques spatio-temporelles extraites des extraits vidéo, en améliorant les informations de mouvement et contextuelles, puis en décodant les informations centrées sur les objets et les mouvements pour aborder le problème de l'anticipation à court terme dans les vidéos égocentriques. Pour ce défi, nous avons construit notre modèle sur la base de StillFast, en appliquant la Guided-Attention au réseau rapide. Notre modèle obtient de meilleures performances sur l'ensemble de validation et atteint également des résultats d'état de l'art (SOTA) sur l'ensemble de test du défi EGO4D Short-Term Object Interaction Anticipation.