HyperAIHyperAI

Command Palette

Search for a command to run...

Feature-Pyramiden-Netzwerke für Objekterkennung

Tsung-Yi Lin Piotr Dollár Ross Girshick Kaiming He Bharath Hariharan Serge Belongie

Zusammenfassung

Merkmalspyramiden sind ein grundlegendes Element in Erkennungssystemen zur Detektion von Objekten in verschiedenen Skalen. Allerdings haben aktuelle Objekterkennungsverfahren des tiefen Lernens Pyramidenrepräsentationen weitgehend vermieden, teilweise aufgrund ihrer hohen Rechen- und Speicheranforderungen. In dieser Arbeit nutzen wir die inhärente mehrskalige, pyramidenförmige Hierarchie tiefer Faltungsnetze, um Merkmalspyramiden mit nur geringfügig erhöhtem Aufwand zu konstruieren. Eine top-down-Architektur mit lateralen Verbindungen wurde entwickelt, um hochstufige semantische Merkmalskarten in allen Skalen zu erstellen. Diese Architektur, als Feature Pyramid Network (FPN) bezeichnet, zeigt erhebliche Verbesserungen als generischer Merkmalsextraktor in mehreren Anwendungen. Die Verwendung von FPN in einem grundlegenden Faster R-CNN-System ermöglicht es unserer Methode, die besten Einzelmodellergebnisse auf dem COCO-Detektionsbenchmark ohne zusätzliche Optimierungen zu erzielen und alle bestehenden Einzelmodell-Einträge einschließlich der Gewinner des COCO 2016-Challenges zu übertreffen. Zudem kann unsere Methode eine Geschwindigkeit von 5 Bildern pro Sekunde (FPS) auf einer GPU erreichen und stellt daher eine praktische und genaue Lösung für die mehrskalige Objekterkennung dar. Der Quellcode wird öffentlich zugänglich gemacht.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp