HyperAIHyperAI

Command Palette

Search for a command to run...

FemtoDet: Eine Objektdetektions-Benchmark für den Energie-Leistungs-Tradeoff

Peng Tu Xu Xie Guo AI Yuexiang Li Yawen Huang Yefeng Zheng

Zusammenfassung

Effiziente Detektoren für Edge-Geräte werden häufig auf Parameteranzahl oder Geschwindigkeitsmetriken optimiert, die jedoch nur eine schwache Korrelation mit dem Energieverbrauch der Detektoren aufweisen.Doch bei bestimmten Anwendungen der convolutionalen neuronalen Netze, wie beispielsweise ständig aktiven Überwachungskameras, sind Energiebeschränkungen von entscheidender Bedeutung.Dieser Artikel zielt darauf ab, eine Basis zu schaffen, indem Detektoren entworfen werden, die zwischen Energieverbrauch und Leistungsfähigkeit ein optimales Gleichgewicht herstellen – aus zwei Perspektiven:1) Wir führen eine umfassende Analyse verschiedener CNN-Architekturen durch, um energiesparende Strukturen zu identifizieren, einschließlich der Auswahl geeigneter Aktivierungsfunktionen, Faltungsoperatoren sowie Merkmalsfusionsschemata in den Neck-Teilen. Diese in früheren Arbeiten oft vernachlässigten Details beeinflussen den Energieverbrauch von Detektoren erheblich;2) Um das Dilemma zwischen Energieverbrauch und Leistung zu überwinden, schlagen wir einen ausgewogenen Detektor vor, der auf den entdeckten energiesparenden Komponenten basiert und als \textit{FemtoDet} bezeichnet wird.Zusätzlich zur innovativen Architektur optimieren wir FemtoDet durch Verbesserungen im Bereich der Faltungsoperationen und der Trainingsstrategie.Insbesondere entwickeln wir ein neues Modul zur Verbesserung der Objektränder (Instance Boundary Enhancement, IBE), um den Widerspruch zwischen der begrenzten Kapazität von CNNs und den Anforderungen an die räumliche Repräsentation in Detektionsaufgaben zu überwinden, und stellen einen rekursiven Warm-Restart-Ansatz (RecWR) vor, um die Trainingsstrategie zu optimieren und so die Suboptimierung leichter Detektoren zu vermeiden, die durch gängige Daten-Augmentierungen verursacht wird.Als Ergebnis erreicht FemtoDet mit lediglich 68,77 k Parametern eine konkurrenzfähige Genauigkeit von 46,3 AP50 auf dem PASCAL VOC-Datensatz und eine Leistung von 1,11 W sowie 64,47 FPS auf Plattformen mit Qualcomm Snapdragon 865 CPU.Umfangreiche Experimente auf den Datensätzen COCO und TJU-DHD zeigen, dass die vorgeschlagene Methode in unterschiedlichen Szenarien konkurrenzfähige Ergebnisse erzielt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp