YOLOX: Übertreffen der YOLO-Serie im Jahr 2021

In diesem Bericht präsentieren wir einige erfahrene Verbesserungen am YOLO-Serien-Modell, die zu einem neuen hochleistungsfähigen Detektor – YOLOX – führen. Wir wandeln den YOLO-Detektor von einer anchor-basierten auf eine anchor-freie Architektur um und integrieren weitere fortschrittliche Detektionstechniken, darunter einen entkoppelten Kopf sowie die führende Label-Zuweisungsstrategie SimOTA, um state-of-the-art Ergebnisse über einen breiten Bereich von Modellgrößen zu erzielen: Für YOLO-Nano mit lediglich 0,91 M Parameter und 1,08 G FLOPs erreichen wir eine AP von 25,3 % auf COCO, was eine Verbesserung von 1,8 % AP gegenüber NanoDet darstellt; für YOLOv3, einen der am häufigsten in der Industrie eingesetzten Detektoren, steigern wir die AP auf 47,3 % auf COCO, was die aktuell beste Praxis um 3,0 % AP übertrifft; für YOLOX-L mit etwa gleichem Parameterumfang wie YOLOv4-CSP und YOLOv5-L erreichen wir eine AP von 50,0 % auf COCO bei einer Geschwindigkeit von 68,9 FPS auf einer Tesla V100, was eine Verbesserung von 1,8 % AP gegenüber YOLOv5-L darstellt. Darüber hinaus erzielten wir den 1. Platz beim Streaming Perception Challenge (Workshop on Autonomous Driving bei CVPR 2021) mit einem einzigen YOLOX-L-Modell. Wir hoffen, dass dieser Bericht Entwicklern und Forschern in praktischen Anwendungsszenarien wertvolle Erfahrungen vermittelt, und stellen zudem Deploy-Versionen mit Unterstützung für ONNX, TensorRT, NCNN und OpenVINO bereit. Der Quellcode ist unter https://github.com/Megvii-BaseDetection/YOLOX verfügbar.