HyperAIHyperAI
il y a 11 jours

Réseaux à deux étapes efficaces pour la segmentation d’actions temporelles

{Shenglan Liu, YuHan Wang, Li Xu, Jie Zhu, Lianyu Hu, Lin Feng, Kaiyuan Liu, Zhuben Dong, Yunheng Li}
Résumé

En raison des ambiguïtés aux limites et des problèmes de sur-segmentation, l’identification de toutes les trames dans des vidéos longues non coupées reste un défi. Pour relever ces difficultés, nous proposons un réseau efficace en deux étapes, appelé ETSN, composé de deux composants. La première étape consiste en un réseau pyramidale de séries temporelles efficace (ETSPNet), qui capte à la fois les caractéristiques locales et globales au niveau des trames, et fournit des prédictions précises des limites de segmentation. La deuxième étape est une nouvelle approche non supervisée, nommée suppression locale de Burr (LBS), qui réduit de manière significative les erreurs de sur-segmentation. Nos évaluations expérimentales sur plusieurs benchmarks, notamment 50Salads, GTEA et Breakfast, démontrent que ETSN surpasse de manière notable les méthodes de pointe actuelles.

Réseaux à deux étapes efficaces pour la segmentation d’actions temporelles | Articles de recherche récents | HyperAI