HyperAIHyperAI
vor 17 Tagen

FemtoDet: Eine Objektdetektions-Benchmark für den Energie-Leistungs-Tradeoff

Peng Tu, Xu Xie, Guo AI, Yuexiang Li, Yawen Huang, Yefeng Zheng
FemtoDet: Eine Objektdetektions-Benchmark für den Energie-Leistungs-Tradeoff
Abstract

Effiziente Detektoren für Edge-Geräte werden häufig auf Parameteranzahl oder Geschwindigkeitsmetriken optimiert, die jedoch nur eine schwache Korrelation mit dem Energieverbrauch der Detektoren aufweisen.Doch bei bestimmten Anwendungen der convolutionalen neuronalen Netze, wie beispielsweise ständig aktiven Überwachungskameras, sind Energiebeschränkungen von entscheidender Bedeutung.Dieser Artikel zielt darauf ab, eine Basis zu schaffen, indem Detektoren entworfen werden, die zwischen Energieverbrauch und Leistungsfähigkeit ein optimales Gleichgewicht herstellen – aus zwei Perspektiven:1) Wir führen eine umfassende Analyse verschiedener CNN-Architekturen durch, um energiesparende Strukturen zu identifizieren, einschließlich der Auswahl geeigneter Aktivierungsfunktionen, Faltungsoperatoren sowie Merkmalsfusionsschemata in den Neck-Teilen. Diese in früheren Arbeiten oft vernachlässigten Details beeinflussen den Energieverbrauch von Detektoren erheblich;2) Um das Dilemma zwischen Energieverbrauch und Leistung zu überwinden, schlagen wir einen ausgewogenen Detektor vor, der auf den entdeckten energiesparenden Komponenten basiert und als \textit{FemtoDet} bezeichnet wird.Zusätzlich zur innovativen Architektur optimieren wir FemtoDet durch Verbesserungen im Bereich der Faltungsoperationen und der Trainingsstrategie.Insbesondere entwickeln wir ein neues Modul zur Verbesserung der Objektränder (Instance Boundary Enhancement, IBE), um den Widerspruch zwischen der begrenzten Kapazität von CNNs und den Anforderungen an die räumliche Repräsentation in Detektionsaufgaben zu überwinden, und stellen einen rekursiven Warm-Restart-Ansatz (RecWR) vor, um die Trainingsstrategie zu optimieren und so die Suboptimierung leichter Detektoren zu vermeiden, die durch gängige Daten-Augmentierungen verursacht wird.Als Ergebnis erreicht FemtoDet mit lediglich 68,77 k Parametern eine konkurrenzfähige Genauigkeit von 46,3 AP50 auf dem PASCAL VOC-Datensatz und eine Leistung von 1,11 W sowie 64,47 FPS auf Plattformen mit Qualcomm Snapdragon 865 CPU.Umfangreiche Experimente auf den Datensätzen COCO und TJU-DHD zeigen, dass die vorgeschlagene Methode in unterschiedlichen Szenarien konkurrenzfähige Ergebnisse erzielt.