HyperAIHyperAI

Command Palette

Search for a command to run...

LSTA : Attention à court et long terme pour la reconnaissance d'actions égocentriques

Swathikiran Sudhakaran Sergio Escalera Oswald Lanz

Résumé

La reconnaissance d'activités égocentriques est l'une des tâches les plus complexes dans l'analyse vidéo. Elle nécessite une discrimination fine de petits objets et de leurs manipulations. Bien que certaines méthodes s'appuient sur une supervision forte et des mécanismes d'attention, elles sont soit très consommatrices d'annotations, soit ne prennent pas en compte les motifs spatio-temporels. Dans cet article, nous proposons LSTA comme un mécanisme permettant de se concentrer sur les caractéristiques des parties spatialement pertinentes tout en suivant l'attention de manière fluide au fil de la séquence vidéo. Nous démontrons l'efficacité de LSTA pour la reconnaissance d'activités égocentriques grâce à une architecture à deux flux entièrement entraînable en fin à fin, atteignant des performances de pointe sur quatre benchmarks standards.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp