17일 전

ReDet: 공중 객체 탐지를 위한 회전 등변성 탐지기

Jiaming Han, Jian Ding, Nan Xue, Gui-Song Xia
ReDet: 공중 객체 탐지를 위한 회전 등변성 탐지기
초록

최근 컴퓨터 비전 분야에서 항공 이미지 내 객체 탐지에 대한 관심이 높아지고 있다. 자연 이미지의 객체와 달리 항공 이미지 내 객체는 일반적으로 임의의 방향으로 분포되어 있다. 따라서 객체 탐지기는 방향 정보를 더 정확히 표현하기 위해 더 많은 파라미터를 필요로 하는데, 이러한 파라미터는 종종 중복적이며 비효율적이다. 게다가 기존의 일반적인 CNN은 방향 변화를 명시적으로 모델링하지 않기 때문에 정확한 객체 탐지기를 학습하기 위해 대량의 회전 증강 데이터가 필요하다. 본 논문에서는 이러한 문제를 해결하기 위해 회전 동치성(translation-equivariance)과 회전 불변성(rotation invariance)을 명시적으로 표현하는 회전 동치 탐지기(ReDet)를 제안한다. 구체적으로, 회전 동치 특징을 추출할 수 있도록 회전 동치 네트워크를 탐지기 내부에 통합하였으며, 이는 방향을 정확히 예측할 수 있게 하여 모델 크기를 크게 줄일 수 있다. 또한, 회전 동치 특징을 기반으로, RoI의 방향에 따라 적응적으로 회전 불변 특징을 추출하는 회전 불변 RoI Align(RiRoI Align)을 제안하였다. DOTA-v1.0, DOTA-v1.5, HRSC2016 등 여러 도전적인 항공 이미지 데이터셋에서 실시한 광범위한 실험 결과, 제안한 방법이 항공 객체 탐지 작업에서 최고 수준의 성능을 달성함을 확인하였다. 기존 최고 성능 대비, DOTA-v1.0, DOTA-v1.5, HRSC2016에서 각각 1.2, 3.5, 2.6 mAP 향상 효과를 얻었으며, 파라미터 수는 60% 감소(313 Mb → 121 Mb)하였다. 코드는 다음 링크에서 공개되어 있다: \url{https://github.com/csuhan/ReDet}.

ReDet: 공중 객체 탐지를 위한 회전 등변성 탐지기 | 최신 연구 논문 | HyperAI초신경