HyperAIHyperAI
il y a 2 mois

Défi de Détection des Frontières d'Événements Génériques au CVPR 2021 Rapport Technique : Réseau d'Attention Temporelle en Cascade (CASTANET)

Hong, Dexiang ; Li, Congcong ; Wen, Longyin ; Wang, Xinyao ; Zhang, Libo
Défi de Détection des Frontières d'Événements Génériques au CVPR 2021 Rapport Technique : Réseau d'Attention Temporelle en Cascade (CASTANET)
Résumé

Ce rapport présente l'approche utilisée pour la soumission au défi de détection des frontières d'événements génériques (GEBD) lors de la conférence CVPR21. Dans ce travail, nous avons conçu un réseau de neurones à attention temporelle en cascade (CASTANET) pour la GEBD, composé de trois parties : le réseau principal, le module d'attention temporelle et le module de classification. Plus précisément, le réseau convolutif séparé par canaux (CSN) est utilisé comme réseau principal pour extraire les caractéristiques, tandis que le module d'attention temporelle est conçu pour obliger le réseau à se concentrer sur les caractéristiques discriminantes. Ensuite, une architecture en cascade est utilisée dans le module de classification afin de générer des frontières plus précises. De plus, une stratégie d'agrégation est employée pour améliorer encore davantage les performances de la méthode proposée. La méthode proposée atteint un score F1 de 83,30 % sur l'ensemble de test Kinetics-GEBD, ce qui représente une amélioration de 20,5 % du score F1 par rapport à la méthode de base. Le code source est disponible à l'adresse suivante : https://github.com/DexiangHong/Cascade-PC.