HyperAIHyperAI
il y a 2 mois

Réseaux de Pyramides de Caractéristiques pour la Détection d'Objets

Tsung-Yi Lin; Piotr Dollár; Ross Girshick; Kaiming He; Bharath Hariharan; Serge Belongie
Réseaux de Pyramides de Caractéristiques pour la Détection d'Objets
Résumé

Les pyramides de caractéristiques sont un élément fondamental des systèmes de reconnaissance pour détecter les objets à différentes échelles. Cependant, les détecteurs d'objets récents basés sur l'apprentissage profond ont évité les représentations pyramidales, en partie parce qu'ils sont gourmands en calcul et en mémoire. Dans cet article, nous exploitons la hiérarchie pyramidale inhérente aux réseaux de convolution profonde pour construire des pyramides de caractéristiques avec un coût supplémentaire marginal. Une architecture ascendante avec des connexions latérales est développée pour générer des cartes de caractéristiques sémantiques de haut niveau à toutes les échelles. Cette architecture, appelée Feature Pyramid Network (FPN), montre une amélioration significative en tant que générateur de caractéristiques générique dans plusieurs applications. En utilisant le FPN dans un système Faster R-CNN basique, notre méthode atteint des résultats d'avant-garde pour un seul modèle sur le banc d'essai de détection COCO, sans recours à des techniques avancées, surpassant toutes les entrées existantes pour un seul modèle, y compris celles des vainqueurs du défi COCO 2016. De plus, notre méthode peut fonctionner à 5 images par seconde (FPS) sur une carte graphique (GPU) et constitue donc une solution pratique et précise pour la détection d'objets multi-échelles. Le code sera rendu publiquement disponible.