2달 전

YOLOv7: 학습 가능한 무료 기술들의 집합이 실시간 객체 검출기의 새로운 최고 수준을 설정하다

Chien-Yao Wang; Alexey Bochkovskiy; Hong-Yuan Mark Liao
YOLOv7: 학습 가능한 무료 기술들의 집합이 실시간 객체 검출기의 새로운 최고 수준을 설정하다
초록

YOLOv7은 5 FPS에서 160 FPS 범위에서 알려진 모든 객체 검출기보다 속도와 정확도에서 우수하며, GPU V100에서 30 FPS 이상의 모든 알려진 실시간 객체 검출기 중 가장 높은 정확도인 56.8% AP를 기록하였습니다. YOLOv7-E6 객체 검출기(56 FPS V100, 55.9% AP)는 트랜스포머 기반 검출기인 SWIN-L Cascade-Mask R-CNN(9.2 FPS A100, 53.9% AP)보다 속도에서 509%, 정확도에서 2% 우수하며, 컨벌루션 기반 검출기인 ConvNeXt-XL Cascade-Mask R-CNN(8.6 FPS A100, 55.2% AP)보다 속도에서 551%, 정확도에서 0.7% AP 우수합니다. 또한, YOLOv7은 YOLOR, YOLOX, Scaled-YOLOv4, YOLOv5, DETR, Deformable DETR, DINO-5scale-R50, ViT-Adapter-B 등 많은 다른 객체 검출기들보다 속도와 정확도 면에서 더 나은 성능을 보입니다. 더욱이, 우리는 YOLOv7을 다른 데이터셋이나 사전 학습된 가중치를 사용하지 않고 MS COCO 데이터셋만을 사용하여 처음부터 훈련시켰습니다. 소스 코드는 https://github.com/WongKinYiu/yolov7 에서 제공됩니다.

YOLOv7: 학습 가능한 무료 기술들의 집합이 실시간 객체 검출기의 새로운 최고 수준을 설정하다 | 최신 연구 논문 | HyperAI초신경