Command Palette

Search for a command to run...

12일 전

YOLOv13: 고차원 그래프 기반 적응형 시각 인지 강화를 통한 실시간 객체 탐지

Mengqi Lei Siqi Li Yihong Wu Han Hu You Zhou Xinhu Zheng Guiguang Ding Shaoyi Du Zongze Wu Yue Gao

YOLOv13: 고차원 그래프 기반 적응형 시각 인지 강화를 통한 실시간 객체 탐지

초록

YOLO 시리즈 모델은 뛰어난 정확도와 계산 효율성 덕분에 실시간 객체 탐지 분야에서 최고의 위치를 차지하고 있다. 그러나 YOLO11 및 이전 버전의 합성곱 아키텍처와 YOLOv12에서 도입된 영역 기반 자기주의(attention) 메커니즘은 모두 국소적 정보 집계 및 쌍별 상관관계 모델링에 국한되어 있으며, 복잡한 시나리오에서 전역적인 다대다 고차 상관관계를 포착할 수 있는 능력이 부족하다는 한계를 지닌다. 본 논문에서는 정확도와 경량성 모두를 갖춘 객체 탐지기인 YOLOv13을 제안한다. 위의 문제점을 해결하기 위해, 잠재적인 고차 상관관계를 적응적으로 활용하고 기존의 하이퍼그래프 기반 쌍별 상관관계 모델링에 국한된 방법의 한계를 극복하는 하이퍼그래프 기반 적응형 상관관계 강화(Hypergraph-based Adaptive Correlation Enhancement, HyperACE) 메커니즘을 제안한다. 이를 통해 효율적인 전역적 크로스-위치 및 크로스-스케일 특징 융합 및 강화를 달성하였다. 이후, HyperACE 기반의 전체 파이프라인 집계-분배(Full-Pipeline Aggregation-and-Distribution, FullPAD) 패러다임을 제안하며, 상관관계 강화 특징을 전체 네트워크 파이프라인에 분배함으로써 세밀한 정보 흐름과 표현의 상호보완성을 효과적으로 실현하였다. 마지막으로, 일반적인 대커널 합성곱 대신 깊이 분리형 합성곱(depthwise separable convolutions)을 활용하고, 성능 저하 없이 파라미터 수와 계산 복잡도를 크게 감소시키는 일련의 블록을 설계하였다. 제안한 방법은 널리 사용되는 MS COCO 벤치마크에서 광범위한 실험을 수행하였으며, 실험 결과는 더 적은 파라미터와 FLOPs로 최신 기술 수준의 성능을 달성함을 입증하였다. 특히, YOLOv13-N은 YOLO11-N 대비 mAP에서 3.0%, YOLOv12-N 대비 1.5% 향상된 성능을 보였다.

코드 저장소

wandahangfy/yolov11-rgbt
pytorch
GitHub에서 언급됨
imoonlab/yolov13
공식
pytorch
GitHub에서 언급됨

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
YOLOv13: 고차원 그래프 기반 적응형 시각 인지 강화를 통한 실시간 객체 탐지 | 연구 논문 | HyperAI초신경