HyperAIHyperAI
vor 3 Monaten

YOLOv12: Eine Aufschlüsselung der Schlüsselarchitekturmerkmale

Mujadded Al Rabbani Alif, Muhammad Hussain
YOLOv12: Eine Aufschlüsselung der Schlüsselarchitekturmerkmale
Abstract

Diese Arbeit präsentiert eine architektonische Analyse von YOLOv12, einem bedeutenden Fortschritt im Bereich der einstufigen, Echtzeit-Objekterkennung, der die Stärken seiner Vorgänger nutzt und gleichzeitig wesentliche Verbesserungen einführt. Das Modell integriert einen optimierten Backbone (R-ELAN), 7×7 separable Faltungen sowie FlashAttention-getriebene, bereichsbasierte Aufmerksamkeit, was die Merkmalsextraktion verbessert, die Effizienz steigert und robustere Erkennungen ermöglicht. Mit mehreren Modellvarianten, wie bei seinen Vorgängern, bietet YOLOv12 skalierbare Lösungen sowohl für latency-kritische als auch für hochgenaue Anwendungen. Experimentelle Ergebnisse zeigen konsistente Verbesserungen hinsichtlich des mittleren Genauigkeitsmaßes (mAP) und der Inferenzgeschwindigkeit, wodurch YOLOv12 eine überzeugende Wahl für Anwendungen in autonomen Systemen, der Sicherheit und Echtzeit-Analysen darstellt. Durch die Erzielung eines optimalen Gleichgewichts zwischen rechnerischer Effizienz und Leistung setzt YOLOv12 eine neue Benchmark für Echtzeit-Computer Vision und erleichtert die Bereitstellung auf vielfältigen Hardwareplattformen – von Edge-Geräten bis hin zu Hochleistungs-Clustern.