oriented objects를 탐지하기 위한 RoI Transformer 학습

공중 이미지에서의 객체 검출은 새 시점, 복잡한 배경, 그리고 객체들의 다양한 모양 때문에 컴퓨터 비전 분야에서 활발하면서도 도전적인 작업입니다. 특히 공중 이미지에서 밀집된 객체를 감지할 때, 일반적인 객체 검출을 위한 수평 제안 방법들은 관심 영역(RoIs)과 객체 사이에 불일치를 초래하는 경우가 많습니다. 이는 최종 객체 분류 신뢰도와 위치 결정 정확도 사이의 일반적인 불일치로 이어집니다. 회전 앵커를 사용하여 이러한 문제를 해결하려고 시도하였지만, 그 설계는 항상 앵커의 수를 증가시키고 계산 복잡성을 크게 높였습니다. 본 논문에서는 이러한 문제들을 해결하기 위해 RoI 변환기(RoI Transformer)를 제안합니다. 구체적으로, 관심 영역 제안의 품질을 개선하기 위해 먼저 수평 관심 영역(HRoI)을 회전된 관심 영역(RRoI)으로 변환하는 회전 RoI 학습기(RRotated RoI Learner)를 설계하였습니다. RRoIs 기반으로, 우리는 회전 불변 특성을 추출하여 후속 분류 및 회귀 성능을 향상시키기 위한 회전 위치 민감 RoI 맞춤(RPS-RoI-Align) 모듈을 제안하였습니다. 우리의 RoI 변환기는 가볍고 방향성 객체 검출기에 쉽게 내장될 수 있습니다. RoI 변환기의 간단한 구현은 DOTA와 HRSC2016라는 두 가지 일반적이면서도 도전적인 공중 데이터셋에서 최신 성능을 달성하였으며, 감지 속도에는 거의 영향을 미치지 않았습니다. 방향성 바운딩 박스 주석이 제공되는 경우, 우리의 RoI 변환기는 변형 위치 민감 RoI 풀링(deformable Position Sensitive RoI pooling)보다 우수한 성능을 보여주었습니다. 광범위한 실험을 통해 우리의 RoI 변환기가 유연하고 효과적임이 입증되었습니다. 결과는 다른 감지기 아키텍처와 쉽게 통합될 수 있으며 성능을 크게 향상시킬 수 있음을 보여줍니다.