PP-YOLOE: Eine entwickelte Version von YOLO

In diesem Bericht stellen wir PP-YOLOE vor, einen hochleistungsfähigen und benutzerfreundlichen Objekterkennungsdetektor, der den aktuellen Stand der Technik in der Industrie darstellt. Wir haben Optimierungen auf Basis des früheren PP-YOLOv2 durchgeführt, wobei wir das anchor-freie Paradigma, ein leistungsstärkeres Backbone-Modell sowie einen Hals (Neck) mit CSPRepResStage, ET-Head und dem dynamischen Label-Zuordnungsalgorithmus TAL verwendet haben. Für verschiedene praktische Szenarien bieten wir Modelle in den Größen s/m/l/x an. Das Modell PP-YOLOE-l erreicht dabei eine mAP von 51,4 auf COCO test-dev und 78,1 FPS auf Tesla V100, was im Vergleich zu den bisherigen Stand-der-Technik-Modellen PP-YOLOv2 und YOLOX eine bemerkenswerte Verbesserung um (+1,9 AP, +13,35 % Geschwindigkeitssteigerung) und (+1,3 AP, +24,96 % Geschwindigkeitssteigerung) darstellt. Des Weiteren erreicht die Inferenzgeschwindigkeit von PP-YOLOE bei Verwendung von TensorRT und FP16-Präzision 149,2 FPS. Um die Effektivität unserer Designs zu überprüfen, haben wir umfangreiche Experimente durchgeführt. Der Quellcode und die vortrainierten Modelle sind unter https://github.com/PaddlePaddle/PaddleDetection verfügbar.