Command Palette
Search for a command to run...
Segmentation rapide d'objets vidéo par réseau de ciblage dynamique
Segmentation rapide d'objets vidéo par réseau de ciblage dynamique
You He Huchuan Lu Jianming Zhang Zhe Lin Lu Zhang
Résumé
Nous proposons un nouveau modèle pour la segmentation d'objets vidéo rapide et précise. Il se compose de deux réseaux neuronaux convolutifs : un Réseau de Ciblage Dynamique (DTN) et un Réseau de Raffinement de Masque (MRN). Le DTN localise l'objet en se concentrant dynamiquement sur les régions d'intérêt entourant l'objet cible. La région cible est prédite par le DTN à l'aide de deux sous-flux : la Propagation de Boîtes (BP) et la Ré-identification de Boîtes (BR). Le flux BP est plus rapide, mais moins efficace pour les objets présentant de grandes déformations ou des occlusions. Le flux BR se comporte mieux dans des scénarios difficiles, au prix d'un coût computationnel plus élevé. Nous proposons un Module de Décision (DM) pour déterminer de manière adaptative, pour chaque trame, quel sous-flux utiliser. Enfin, le MRN est exploité pour prédire la segmentation à l'intérieur de la région cible. Les résultats expérimentaux sur deux jeux de données publics montrent que le modèle proposé dépasse significativement les méthodes existantes en termes de précision et d'efficacité, sans nécessiter d'apprentissage en ligne, et atteint une précision comparable aux méthodes basées sur l'apprentissage en ligne, tout en étant d'un ordre de grandeur plus rapide.