HyperAIHyperAI

Command Palette

Search for a command to run...

Réseau de relations de proposition pour la détection d’actions temporelles

Xiang Wang Zhiwu Qing Ziyuan Huang Yutong Feng Shiwei Zhang Jianwen Jiang Mingqian Tang Changxin Gao Nong Sang

Résumé

Ce rapport technique présente notre solution pour la tâche de détection d’actions temporelles dans le cadre du ActivityNet Challenge 2021. L’objectif de cette tâche consiste à localiser et identifier les actions d’intérêt dans des vidéos longues non coupées. Le défi majeur provient du fait que la durée temporelle des actions varie considérablement, et que les actions cibles sont généralement intégrées dans un contexte de activités non pertinentes. Notre approche s’appuie sur BMN et comporte principalement trois étapes : 1) classification d’actions et encodage des caractéristiques à l’aide de SlowFast, CSN et ViViT ; 2) génération de propositions. Nous améliorons BMN en intégrant un réseau de relations de propositions (Proposal Relation Network, PRN), permettant ainsi de générer des propositions de haute qualité ; 3) détection d’actions. Les résultats de détection sont calculés en associant chaque proposition à son résultat de classification correspondant. Enfin, nous combinons les résultats obtenus sous différentes configurations, atteignant ainsi un score de 44,7 % sur l’ensemble de test, soit une amélioration de 1,9 % par rapport au résultat du vainqueur du ActivityNet 2020 en termes de mAP moyen.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Réseau de relations de proposition pour la détection d’actions temporelles | Articles | HyperAI