HyperAIHyperAI

Command Palette

Search for a command to run...

Réseaux à deux étapes efficaces pour la segmentation d’actions temporelles

Shenglan Liu YuHan Wang Li Xu Jie Zhu Lianyu Hu Lin Feng Kaiyuan Liu Zhuben Dong Yunheng Li

Résumé

En raison des ambiguïtés aux limites et des problèmes de sur-segmentation, l’identification de toutes les trames dans des vidéos longues non coupées reste un défi. Pour relever ces difficultés, nous proposons un réseau efficace en deux étapes, appelé ETSN, composé de deux composants. La première étape consiste en un réseau pyramidale de séries temporelles efficace (ETSPNet), qui capte à la fois les caractéristiques locales et globales au niveau des trames, et fournit des prédictions précises des limites de segmentation. La deuxième étape est une nouvelle approche non supervisée, nommée suppression locale de Burr (LBS), qui réduit de manière significative les erreurs de sur-segmentation. Nos évaluations expérimentales sur plusieurs benchmarks, notamment 50Salads, GTEA et Breakfast, démontrent que ETSN surpasse de manière notable les méthodes de pointe actuelles.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp