HyperAIHyperAI
vor 2 Monaten

YOLOv7: Trainierbare Bag-of-Freebies stellt neue Referenzstandards für Echtzeit-Objekterkennungsdetektoren auf

Chien-Yao Wang; Alexey Bochkovskiy; Hong-Yuan Mark Liao
YOLOv7: Trainierbare Bag-of-Freebies stellt neue Referenzstandards für Echtzeit-Objekterkennungsdetektoren auf
Abstract

YOLOv7 übertrifft alle bekannten Objekterkennungssysteme sowohl in Bezug auf Geschwindigkeit als auch auf Genauigkeit im Bereich von 5 bis 160 FPS und erreicht die höchste Genauigkeit von 56,8 % AP unter allen bekannten Echtzeit-Objekterkennungssystemen mit 30 FPS oder höher auf einem GPU V100. Der Objekterkennungsdetektor YOLOv7-E6 (56 FPS V100, 55,9 % AP) übertreffen den transformer-basierten Detektor SWIN-L Cascade-Mask R-CNN (9,2 FPS A100, 53,9 % AP) um 509 % in der Geschwindigkeit und um 2 % in der Genauigkeit sowie den konvolutionsbasierten Detektor ConvNeXt-XL Cascade-Mask R-CNN (8,6 FPS A100, 55,2 % AP) um 551 % in der Geschwindigkeit und um 0,7 % AP in der Genauigkeit. Darüber hinaus übertrifft YOLOv7 auch: YOLOR, YOLOX, Scaled-YOLOv4, YOLOv5, DETR, Deformable DETR, DINO-5scale-R50, ViT-Adapter-B und viele andere Objekterkennungssysteme in Bezug auf Geschwindigkeit und Genauigkeit. Zudem trainieren wir YOLOv7 ausschließlich vom Scratch auf dem MS COCO-Datensatz ohne die Verwendung anderer Datensätze oder vorab trainierter Gewichte. Der Quellcode wurde veröffentlicht unter https://github.com/WongKinYiu/yolov7.

YOLOv7: Trainierbare Bag-of-Freebies stellt neue Referenzstandards für Echtzeit-Objekterkennungsdetektoren auf | Neueste Forschungsarbeiten | HyperAI