HyperAIHyperAI
vor 2 Monaten

Geschwindigkeits-/Genauigkeit-Kompromisse für moderne Faltungsobjekterkennungsdetektoren

Jonathan Huang; Vivek Rathod; Chen Sun; Menglong Zhu; Anoop Korattikara; Alireza Fathi; Ian Fischer; Zbigniew Wojna; Yang Song; Sergio Guadarrama; Kevin Murphy
Geschwindigkeits-/Genauigkeit-Kompromisse für moderne Faltungsobjekterkennungsdetektoren
Abstract

Das Ziel dieser Arbeit ist es, als Leitfaden für die Auswahl einer Detektionsarchitektur zu dienen, die das optimale Verhältnis von Geschwindigkeit, Speicher und Genauigkeit für eine gegebene Anwendung und Plattform erreicht. Zu diesem Zweck untersuchen wir verschiedene Methoden, um in modernen Faltungsnetzwerken für Objekterkennung Genauigkeit gegen Geschwindigkeit und Speicherverbrauch einzutauschen. In den letzten Jahren wurden zahlreiche erfolgreiche Systeme vorgeschlagen, jedoch sind direkte Vergleiche aufgrund unterschiedlicher Basis-Feature-Extraktoren (z.B. VGG, ResNet), verschiedener Standardbildauflösungen sowie unterschiedlicher Hardware- und Softwareplattformen schwierig. Wir präsentieren eine einheitliche Implementierung der Systeme Faster R-CNN [Ren et al., 2015], R-FCN [Dai et al., 2016] und SSD [Liu et al., 2015], die wir als "Meta-Architekturen" betrachten, und verfolgen die Geschwindigkeits-/Genauigkeits-Kompromisskurve, die durch den Einsatz alternativer Feature-Extraktoren und die Variation anderer kritischer Parameter wie Bildgröße innerhalb jeder dieser Meta-Architekturen entsteht. Am einen Ende dieses Spektrums, wo Geschwindigkeit und Speicherplatz entscheidend sind, präsentieren wir einen Detektor, der Echtzeitgeschwindigkeiten erreicht und auf einem mobilen Gerät eingesetzt werden kann. Am anderen Ende, wo Genauigkeit entscheidend ist, präsentieren wir einen Detektor, der den aktuellen Stand der Technik im COCO-Detektionsaufgabe erreicht.