HyperAI초신경

YOLOv10 실시간 엔드투엔드 객체 감지

YOLOv10은 객체 감지 알고리즘의 모범 사례로서 성능과 효율성을 모두 향상시킵니다!


이 튜토리얼은 YOLOv10을 위한 그라디오 애플리케이션 튜토리얼입니다.

소개

YOLO(You Only Look Once) 시리즈는 현재 가장 대중적인 엣지 사이드 객체 감지 알고리즘입니다. 이것은 조셉 레드먼과 다른 사람들에 의해 처음 제안되었습니다. 이 방법은 계산 비용과 탐지 성능 간의 효과적인 균형을 이루기 때문에 실시간 객체 탐지 분야의 벤치마크가 되었습니다. 시간이 지남에 따라 YOLO 알고리즘 시리즈는 지속적으로 개발되고 개선되었으며, 여러 버전이 출시되었습니다. 각 버전은 아키텍처 설계, 최적화 목표, 데이터 강화 전략 등에서 상당한 진전을 이루었습니다.

YOLOv10은 Tsinghua University의 연구자들이 Ultralytics Python 패키지를 기반으로 개발한 실시간 타겟 감지 방법으로, 이전 YOLO 버전의 후처리 및 모델 아키텍처의 결함을 해결하는 것을 목표로 합니다. YOLOv10은 비최대 억제(NMS)를 제거하고 다양한 모델 구성 요소를 최적화함으로써 최첨단 성능을 달성하는 동시에 계산 오버헤드를 크게 줄였습니다. 연구팀은 논문을 발표했다. 「YOLOv10: 실시간 엔드투엔드 객체 감지」연구 프레임워크가 자세히 설명되어 있습니다.

YOLOv10의 주요 기능은 다음과 같습니다.

  • NMS 없는 학습: 일관된 이중 할당을 활용하여 NMS가 필요 없게 함으로써 추론 지연 시간을 줄입니다.
  • 전체적인 모델 설계: 경량 분류 헤드, 공간 채널 분리 다운 샘플링, 랭크 기반 블록 설계를 포함하여 효율성과 정확성의 관점에서 다양한 구성 요소를 종합적으로 최적화했습니다.
  • 향상된 모델 기능: 대규모 커널 합성 및 부분적 자기 주의 모듈을 통합하여 상당한 계산 비용을 추가하지 않고도 성능을 향상시킵니다.

효과 표시

PR_1단계

실행 방법

1. 컨테이너를 복제한 후 시스템이 리소스를 할당할 때까지 기다리십시오.

PR_1단계

2. 이미지 감지 수행

PR_1단계