동적 앵커 학습을 이용한 임의 방향 객체 검출

자연 환경, 항공 사진, 원격 감지 이미지 등에서 임의 방향의 객체가 널리 나타나므로, 임의 방향 객체 검출은 상당한 주목을 받고 있습니다. 현재 많은 회전 검출기들은 다양한 방향의 많은 앵커를 사용하여 지상 진실 박스와 공간적으로 일치시키고, 이후 교차 영역 비율(Intersection-over-Union, IoU)을 적용하여 훈련용 양성 및 음성 후보 샘플을 선택합니다. 그러나 우리는 회귀 후에도 선택된 양성 앵커가 항상 정확한 검출을 보장하지 못하며, 일부 음성 샘플이 정확한 위치 결정을 달성할 수 있다는 것을 관찰하였습니다. 이는 IoU를 통해 앵커의 품질을 평가하는 것이 적절하지 않으며, 이로 인해 분류 신뢰도와 위치 결정 정확도 사이에 불일치가 발생함을 시사합니다. 본 논문에서는 새로운 매칭 정도를 정의하여 앵커들의 위치 결정 가능성을 종합적으로 평가하고 더 효율적인 라벨 할당 과정을 수행하는 동적 앵커 학습(Dynamic Anchor Learning, DAL) 방법을 제안합니다. 이를 통해 검출기는 동적으로 고품질 앵커를 선택하여 정확한 객체 검출을 달성할 수 있으며, 분류와 회귀 간의 차이도 완화될 것입니다. 새로 도입된 DAL을 통해 우리는 수평으로 사전 설정된 몇 개의 앵커만으로도 임의 방향 객체에 대해 우수한 검출 성능을 달성하였습니다. HRSC2016, DOTA, UCAS-AOD 세 가지 원격 감지 데이터셋과 장면 텍스트 데이터셋 ICDAR 2015에서 실험 결과 본 방법이 기준 모델에 비해 실질적인 개선을 이루었음을 확인하였습니다. 또한 우리의 접근법은 수평 바운드 박스를 사용한 객체 검출에도 보편적으로 적용 가능합니다. 코드와 모델은 https://github.com/ming71/DAL에서 이용할 수 있습니다.