HyperAI초신경

YOLOv10 실시간 엔드투엔드 객체 감지

YOLOv10은 청화대학교 연구진이 개발한 최신 세대의 실시간 종단간 객체 감지 시스템입니다. Ultralytics Python 패키지를 기반으로 구축되었으며, 이전 YOLO 버전의 후처리 및 모델 아키텍처의 결함을 해결하는 것을 목표로 합니다. YOLOv10은 비최대 억제(NMS)를 제거하고 다양한 모델 구성 요소를 최적화함으로써 최첨단 성능을 달성하는 동시에 계산 오버헤드를 크게 줄였습니다. 연구팀은 논문을 발표했다. 「YOLOv10: 실시간 엔드투엔드 객체 감지」연구 프레임워크가 자세히 설명되어 있습니다.

배경

지난 몇 년 동안 YOLO는 계산 비용과 감지 성능 간의 효과적인 균형을 이루었기 때문에 실시간 객체 감지 분야에서 지배적인 패러다임이 되었습니다. 연구자들은 YOLO의 아키텍처 설계, 최적화 목표, 데이터 향상 전략 등을 탐구하여 상당한 진전을 이루었습니다. 그러나 사후 처리를 위해 비최대 억제(NMS)에 의존하면 YOLO의 종단 간 배포가 방해를 받고 추론 지연에 부정적인 영향을 미칩니다. 또한 YOLO의 각 구성 요소의 설계에는 포괄적이고 철저한 검토가 부족하여 명백한 계산 중복이 발생하고 모델의 기능이 제한됩니다. 이는 성능 향상의 잠재력이 상당히 있는 반면, 효율성은 최적이 아닙니다.

YOLOv10 연구 소개

이 연구에서 연구팀은 후처리와 모델 아키텍처의 두 가지 측면에서 YOLO의 성능 효율성 경계를 더욱 넓히는 것을 목표로 합니다. 이를 위해 연구팀은 먼저 YOLO NMS 없는 학습을 위한 일관된 이중 할당을 제안했는데, 이는 경쟁력 있는 성능과 낮은 추론 지연 시간을 모두 제공합니다. 또한 연구팀은 YOLO에 대한 전반적인 효율성-정확도 중심의 모델 설계 전략을 도입했습니다. 연구팀은 효율성과 정확성의 관점에서 YOLO의 각 구성 요소를 종합적으로 최적화하여 계산 오버헤드를 크게 줄이고 성능을 향상시켰습니다. 연구팀의 노력의 결과로 실시간 엔드투엔드 객체 감지를 위한 차세대 YOLO 제품군인 YOLOv10이 탄생했습니다. 광범위한 실험을 통해 YOLOv10은 다양한 모델 크기에서 최첨단 성능과 효율성을 달성한다는 것이 밝혀졌습니다. 예를 들어, 연구팀의 YOLOv10-S는 COCO에서 비슷한 AP를 제공하는 RT-DETR-R18보다 1.8배 더 빠릅니다. YOLOv10-B는 동일한 성능으로 YOLOv9-C와 비교했을 때 지연 시간을 46%, 매개변수를 25% 줄였습니다. 

YOLOv10의 아키텍처는 다음과 같은 주요 구성 요소를 포함합니다.

  1. 백본 네트워크: CSPNet(Cross Stage Partial Network)의 향상된 버전을 사용하여 그래디언트 흐름을 개선하고 계산 중복을 줄이는 기능 추출을 담당합니다.
  2. : PAN(Path Aggregation Network) 계층을 통해 다양한 규모의 기능을 집계하고 효과적인 다중 규모 기능 융합을 달성하도록 설계되었습니다.
  3. 일대다: 훈련 중에 각 객체에 대한 여러 예측을 생성하여 풍부한 감독 신호를 제공하고 학습 정확도를 개선합니다.
  4. 일대일: NMS 없이 추론 중에 각 객체에 대한 단일 최적 예측을 생성하여 지연 시간을 줄이고 효율성을 향상시킵니다.

YOLOv10은 다양한 애플리케이션 요구 사항을 충족하기 위해 여러 가지 모델 크기를 제공합니다.

  • YOLOv10-N: 나노 버전은 자원이 매우 제한된 환경에 적합합니다.
  • YOLOv10-S: 속도와 정확성의 균형을 맞춘 소형 버전입니다.
  • YOLOv10-M: 중간 버전으로 일반적인 사용에 적합합니다.
  • YOLOv10-B: 더 나은 정밀도를 위해 폭을 늘린 균형 잡힌 버전입니다.
  • YOLOv10-L: 컴퓨팅 리소스를 늘리는 대신 정확도를 높이는 대규모 버전입니다.
  • YOLOv10-X: 최고의 정밀도와 성능을 위한 특대형 버전입니다.

YOLOv10은 COCO와 같은 표준 벤치마크에서 광범위하게 테스트되어 이전 버전 및 기타 최신 감지기에 비해 지연 시간과 정확도가 크게 개선되어 뛰어난 성능과 효율성을 입증했습니다.

참고문헌

【1】YOLOv10: 실시간 엔드투엔드 객체 감지

【2】https://docs.ultralytics.com/zh/models/yolov10/