17일 전
흐릿한 것에서 뛰어난 탐지로: 슈퍼 리졸루션을 활용한 YOLOv5 기반 항공 객체 탐지
Ragib Amin Nihal, Benjamin Yen, Katsutoshi Itoyama, Kazuhiro Nakadai

초록
드론 및 위성 기술의 보편적 사용과 함께 항공 영상에서 정확한 객체 탐지에 대한 수요가 급증하고 있다. 기존의 객체 탐지 모델은 대형 객체에 치우친 데이터셋으로 학습되어, 소형이며 밀집된 객체가 흔한 항공 환경에서는 최적의 성능을 발휘하기 어려운 문제가 있다. 이 문제를 해결하기 위해, 초해상도 기술과 개선된 경량 YOLOv5 아키텍처를 결합한 혁신적인 접근 방식을 제안한다. 다양한 데이터셋, 즉 VisDrone-2023, SeaDroneSee, VEDAI, NWPU VHR-10을 활용하여 모델의 성능을 평가하였다. 본 연구에서 제안하는 초해상도 YOLOv5 아키텍처는 트랜스포머 인코더 블록을 포함하고 있어, 전역적 맥락 정보를 효과적으로 포착할 수 있어, 특히 밀집도가 높거나 가림 현상이 발생하는 조건에서도 탐지 성능이 향상된다. 이 경량 모델은 높은 정확도를 제공할 뿐만 아니라 자원 활용 효율성도 보장하여 실시간 응용에 적합하다. 실험 결과는 소형 및 밀집된 객체 탐지에서 본 모델이 뛰어난 성능을 보임을 입증하며, 특히 데이터셋 선택과 아키텍처 적응이 이와 같은 특정 과제에 있어 매우 중요한 요소임을 강조한다. 특히 VisDrone 데이터셋에서 mAP 52.5%를 달성하여 기존 최고 성능의 방법들을 초월하였다. 본 연구에서 제안하는 방법은 항공 영상 내 객체 탐지 기술을 크게 발전시킬 잠재력을 지니며, 다양한 실제 응용 분야에서 더 정확하고 신뢰할 수 있는 결과를 제공하는 데 기여할 것으로 기대된다.