HyperAIHyperAI

Command Palette

Search for a command to run...

Réseaux en cascade sensibles aux frontières pour la segmentation temporelle des actions

Li-Min Wang Gangshan Wu Ziteng Gao Zhifeng Li Zhenzhi Wang

Résumé

L’identification des segments d’actions humaines dans une vidéo non coupée reste un défi en raison des ambiguïtés aux frontières et des problèmes de sur-segmentation. Pour relever ces défis, nous proposons un nouveau réseau en cascade sensible aux frontières, en introduisant deux composants novateurs. Premièrement, nous proposons un nouveau paradigme en cascade, appelé Stage Cascade, qui permet à notre modèle d’acquérir des champs réceptifs adaptatifs et des prédictions plus fiables pour les trames ambigües. Deuxièmement, nous concevons une opération de lissage générale et fondée sur des principes, nommée pooling par barrière locale, permettant d’agréger les prédictions locales en exploitant les informations sémantiques des frontières. En outre, ces deux composants peuvent être ajustés conjointement de manière end-to-end. Nous menons des expériences sur trois jeux de données exigeants : 50Salads, GTEA et Breakfast, démontrant que notre cadre surpasser significativement les méthodes actuelles de l’état de l’art. Le code est disponible à l’adresse suivante : https://github.com/MCG-NJU/BCN.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Réseaux en cascade sensibles aux frontières pour la segmentation temporelle des actions | Articles | HyperAI