
초록
최근 최고 수준의 두 단계(detector)는 시간이 많이 소요되는 방식을 통해 방향성 제안(oriented proposals)을 생성한다. 이는 검출기의 속도를 저하시켜 고급 방향성 객체 검출 시스템에서 계산상의 병목 현상이 되고 있다. 본 연구는 뛰어난 정확도와 효율성을 동시에 갖춘 일반적인 두 단계 방향성 객체 검출 프레임워크인 Oriented R-CNN을 제안한다. 구체적으로, 첫 번째 단계에서는 방향성 영역 제안 네트워크(oriented RPN)를 제안하여 거의 비용 없이 고품질의 방향성 제안을 직접 생성한다. 두 번째 단계는 방향성 영역 관심 영역(oriented RoIs)을 정밀하게 보정하고 인식하는 Oriented R-CNN 헤드로 구성된다. 복잡한 기법 없이도, ResNet50 기반의 Oriented R-CNN은 DOTA(75.87% mAP) 및 HRSC2016(96.50% mAP)와 같은 일반적으로 사용되는 두 가지 방향성 객체 검출 데이터셋에서 최고 성능을 달성하며, 단일 RTX 2080Ti에서 1024×1024 이미지 크기로 15.1 FPS의 속도를 제공한다. 본 연구가 방향성 검출기 설계에 대한 재고를 촉진하고, 방향성 객체 검출의 기준 기반(baseline)이 되기를 기대한다. 코드는 https://github.com/jbwang1997/OBBDetection 에서 제공된다.