YOLOv6: 산업 응용을 위한 단일 단계 객체 탐지 프레임워크

수년간 YOLO 시리즈는 효율적인 객체 탐지 분야에서 산업 표준으로 자리매김해 왔다. YOLO 커뮤니티는 다양한 하드웨어 플랫폼과 다수의 응용 시나리오에서의 활용을 풍부하게 발전시켜 왔다. 본 기술 보고서에서는 산업 적용을 위한 확고한 의지를 바탕으로 YOLO 기술의 한계를 더욱 뛰어넘어 다음 단계로 나아가고자 한다.실제 환경에서 요구되는 속도와 정확도의 다양성에 기반하여, 산업계 및 학계의 최신 객체 탐지 기술 동향을 광범위하게 분석하였다. 특히 최근의 네트워크 설계, 훈련 전략, 추론 기법, 양자화 기술 및 최적화 방법들로부터 많은 영감을 얻어 이를 적극적으로 통합하였다. 이러한 기반 위에서 우리만의 통찰과 실무 경험을 융합하여 다양한 규모의 배포용 네트워크 패키지를 구축함으로써 다양한 사용 사례에 대응할 수 있도록 하였다. YOLO 개발자들의 넉넉한 허락을 받아 이 새로운 모델을 YOLOv6라 명명하였다. 또한 사용자 및 기여자 여러분의 지속적인 개선에 진심으로 환영한다.성능을 한눈에 살펴보기 위해, YOLOv6-N은 NVIDIA Tesla T4 GPU에서 1234 FPS의 처리 속도로 COCO 데이터셋에서 35.9%의 AP를 달성하였으며, YOLOv6-S는 495 FPS에서 43.5%의 AP를 기록하여 동일 규모의 주류 탐지기들(예: YOLOv5-S, YOLOX-S, PPYOLOE-S)을 능가하였다. 또한 YOLOv6-S의 양자화 버전은 869 FPS에서 43.3%의 AP를 기록하며, 새로운 최고 성능 기록을 달성하였다. 더불어 YOLOv6-M/L은 유사한 추론 속도를 갖는 다른 탐지기들보다 더 높은 정확도(각각 49.5%, 52.3%)를 달성하였다. 각 구성 요소의 효과성을 확인하기 위해 철저한 실험을 수행하였다. 관련 코드는 https://github.com/meituan/YOLOv6 에 공개되어 있다.