HyperAIHyperAI
vor 17 Tagen

EAutoDet: Effiziente Architektursuche für Objektdetektion

Xiaoxing Wang, Jiale Lin, Junchi Yan, Juanping Zhao, Xiaokang Yang
EAutoDet: Effiziente Architektursuche für Objektdetektion
Abstract

Die Schulung von CNNs für die Objektdetektion ist aufgrund großer Datensätze und komplexer Netzwerkmodule zeitaufwendig, wodurch die direkte Suche nach Architekturen auf Detektionsdatensätzen schwerfällt und üblicherweise enorme Suchkosten verursacht (typischerweise zehn bis hundert GPU-Tage). Im Gegensatz dazu stellt dieser Artikel einen effizienten Rahmen namens EAutoDet vor, der es ermöglicht, praktikable Backbone- und FPN-Architekturen für die Objektdetektion innerhalb von lediglich 1,4 GPU-Tagen zu entdecken. Konkret bauen wir einen Supernet sowohl für Backbone- als auch für FPN-Module auf und nutzen eine differenzierbare Methode. Um den GPU-Speicherverbrauch und die Rechenkosten zu reduzieren, schlagen wir eine Kernel-Wiederverwendungs-Technik vor, bei der die Gewichte der Kandidatoperationen auf einer Kante gemeinsam genutzt und in eine einzige Konvolution zusammengefasst werden. Zudem wird eine dynamische Kanalverfeinerungsstrategie eingeführt, um die Anzahl der Kanäle zu suchen. Umfangreiche Experimente belegen die erhebliche Wirksamkeit und Effizienz unseres Ansatzes. Insbesondere übertrifft die entdeckte Architektur die bisher besten NAS-Methoden für Objektdetektion und erreicht eine mAP von 40,1 bei 120 FPS sowie 49,2 mAP bei 41,3 FPS auf dem COCO test-dev-Set. Wir übertragen die entdeckten Architekturen zudem auf die Aufgabe der Rotationsdetektion und erzielen dabei eine mAP$_{\text{50}}$ von 77,05 auf dem DOTA-v1.0-Testset mit 21,1 M Parametern.