PP-YOLOE-R: Ein effizienter anchor-freier Rotationsobjektdetektor

Die Erkennung beliebig ausgerichteter Objekte ist eine grundlegende Aufgabe in visuellen Szenen, insbesondere bei Luftbildern und Szenentext. In diesem Bericht stellen wir PP-YOLOE-R vor, einen effizienten, anchor-free-orientierten Objekterkennungsalgorithmus auf Basis von PP-YOLOE. Wir integrieren eine Reihe nützlicher Techniken in PP-YOLOE-R, um die Erkennungsgenauigkeit mit nur geringfügigem zusätzlichen Parameter- und Rechenaufwand zu verbessern. Als Ergebnis erreichen PP-YOLOE-R-l und PP-YOLOE-R-x jeweils 78,14 bzw. 78,28 mAP auf dem DOTA 1.0-Datensatz bei Einzelmaßstab-Training und -Test, wodurch sie fast alle anderen Rotations-Objekterkennungsmethoden übertreffen. Bei mehrskaligem Training und Test steigern sich die Genauigkeiten weiter auf 80,02 (PP-YOLOE-R-l) und 80,73 (PP-YOLOE-R-x) mAP. In diesem Fall übertrifft PP-YOLOE-R-x alle anchor-free-Methoden und zeigt wettbewerbsfähige Leistung gegenüber den aktuellen state-of-the-art anchor-basierten zweistufigen Modellen. Zudem ist PP-YOLOE-R für die Bereitstellung geeignet: PP-YOLOE-R-s/m/l/x erreichen jeweils 69,8 / 55,1 / 48,3 / 37,1 FPS auf einer RTX 2080 Ti mit TensorRT und FP16-Präzision. Der Quellcode und vortrainierte Modelle sind unter https://github.com/PaddlePaddle/PaddleDetection verfügbar, die von https://github.com/PaddlePaddle/Paddle unterstützt werden.