HyperAIHyperAI
vor 2 Monaten

Feature-Pyramiden-Netzwerke für Objekterkennung

Tsung-Yi Lin; Piotr Dollár; Ross Girshick; Kaiming He; Bharath Hariharan; Serge Belongie
Feature-Pyramiden-Netzwerke für Objekterkennung
Abstract

Merkmalspyramiden sind ein grundlegendes Element in Erkennungssystemen zur Detektion von Objekten in verschiedenen Skalen. Allerdings haben aktuelle Objekterkennungsverfahren des tiefen Lernens Pyramidenrepräsentationen weitgehend vermieden, teilweise aufgrund ihrer hohen Rechen- und Speicheranforderungen. In dieser Arbeit nutzen wir die inhärente mehrskalige, pyramidenförmige Hierarchie tiefer Faltungsnetze, um Merkmalspyramiden mit nur geringfügig erhöhtem Aufwand zu konstruieren. Eine top-down-Architektur mit lateralen Verbindungen wurde entwickelt, um hochstufige semantische Merkmalskarten in allen Skalen zu erstellen. Diese Architektur, als Feature Pyramid Network (FPN) bezeichnet, zeigt erhebliche Verbesserungen als generischer Merkmalsextraktor in mehreren Anwendungen. Die Verwendung von FPN in einem grundlegenden Faster R-CNN-System ermöglicht es unserer Methode, die besten Einzelmodellergebnisse auf dem COCO-Detektionsbenchmark ohne zusätzliche Optimierungen zu erzielen und alle bestehenden Einzelmodell-Einträge einschließlich der Gewinner des COCO 2016-Challenges zu übertreffen. Zudem kann unsere Methode eine Geschwindigkeit von 5 Bildern pro Sekunde (FPS) auf einer GPU erreichen und stellt daher eine praktische und genaue Lösung für die mehrskalige Objekterkennung dar. Der Quellcode wird öffentlich zugänglich gemacht.

Feature-Pyramiden-Netzwerke für Objekterkennung | Neueste Forschungsarbeiten | HyperAI