17일 전

회전 객체 탐지를 위한 적응형 회전 컨볼루션

Yifan Pu, Yiru Wang, Zhuofan Xia, Yizeng Han, Yulin Wang, Weihao Gan, Zidong Wang, Shiji Song, Gao Huang
회전 객체 탐지를 위한 적응형 회전 컨볼루션
초록

회전된 객체 탐지(Rotated object detection)는 이미지 내에서 임의의 방향을 가진 객체를 식별하고 위치를 파악하는 것을 목표로 한다. 이 과정에서 서로 다른 이미지 간에 객체의 방향이 크게 달라지며, 한 이미지 내에서도 여러 가지 방향을 가진 객체가 동시에 존재할 수 있다. 이러한 본질적인 특성은 기존의 표준 백본 네트워크가 이러한 임의의 방향을 가진 객체의 고품질 특징을 효과적으로 추출하는 데 어려움을 겪게 만든다. 본 논문에서는 이러한 도전 과제를 해결하기 위해 적응형 회전 컨볼루션(Adaptive Rotated Convolution, ARC) 모듈을 제안한다. 제안한 ARC 모듈에서는 컨볼루션 커널이 이미지에 따라 적응적으로 회전하여 다양한 방향을 가진 객체의 특징을 효과적으로 추출하며, 이미지 내에서 발생하는 큰 방향 변동을 처리할 수 있도록 효율적인 조건부 계산 메커니즘이 도입된다. 두 가지 설계는 회전된 객체 탐지 문제에서 원활하게 작동한다. 또한 ARC 모듈은 다양한 시각 백본 네트워크에 손쉽게 통합되어, 방향성 객체 탐지에 대한 표현 능력을 향상시킬 수 있다. 일반적으로 사용되는 벤치마크(DOTA 및 HRSC2016)에서의 실험 결과, 백본 네트워크에 제안한 ARC 모듈을 적용함으로써 여러 인기 있는 회전된 객체 탐지기의 성능이 크게 향상됨을 확인할 수 있었다(예: Rotated RetinaNet에서 +3.03% mAP, CFA에서 +4.16% mAP). 또한 매우 경쟁력 있는 방법인 Oriented R-CNN과 결합했을 때, 제안한 방법은 DOTA 데이터셋에서 81.77% mAP의 최상위 성능을 달성하였다. 코드는 다음 URL에서 제공된다: \url{https://github.com/LeapLabTHU/ARC}.

회전 객체 탐지를 위한 적응형 회전 컨볼루션 | 최신 연구 논문 | HyperAI초신경