회전 객체 검출을 위한 고정밀 경계상자 학습: 쿨백-라이블러 발산을 통한 방법

기존의 회전 객체 탐지기는 수평 객체 탐지 기법에서 유래한 경우가 대부분이며, 후자는 이미 잘 발전된 분야로 진화해왔다. 그러나 이러한 탐지기는 특히 큰 폭장비율(Aspect Ratio)을 가진 객체에 대해 높은 정밀도 탐지 성능을 발휘하기 어려운데, 이는 현재 회귀 손실 함수 설계의 한계 때문이다. 수평 탐지는 회전 객체 탐지의 특수한 경우라는 관점을 바탕으로, 본 논문에서는 회전 회귀 손실 함수의 설계 철학을 유도적 접근(inductive paradigm)에서 연역적 접근(deductive methodology)으로 전환하는 것을 목표로 한다. 이는 회전과 수평 탐지 간의 관계를 고려한 것이다. 우리는 핵심적인 도전 과제가 회전 회귀 손실 내 결합된 파라미터들을 어떻게 조절할 것인지에 있음을 보여준다. 이는 동적 공동 최적화 과정에서 추정된 파라미터들이 상호작용할 수 있도록 적응적이고 상호보완적인 방식으로 영향을 미치게 하기 위함이다. 구체적으로, 먼저 회전된 경계 상자(oriented bounding box)를 2차원 가우시안 분포로 변환한 후, 두 가우시안 분포 간의 클로즈비-레이블리 발산(Kullback-Leibler Divergence, KLD)을 회귀 손실로 사용한다. 각 파라미터의 기울기(gradient)를 분석함으로써, KLD 및 그 도함수들이 객체의 특성에 따라 파라미터 기울기를 동적으로 조정할 수 있음을 입증한다. 특히, 폭장비율에 따라 각도 파라미터의 중요도(기울기 가중치)를 자동 조절함으로써, 큰 폭장비율을 가진 객체의 경우 미세한 각도 오차만으로도 정확도가 크게 저하되는 문제를 효과적으로 완화할 수 있다. 더욱 중요한 점은, KLD 손실이 척도 불변성(scale invariance)을 보임을 증명했다는 것이다. 또한, KLD 손실이 수평 탐지에 널리 사용되는 $l_{n}$-노름 손실로 축소될 수 있음을 보여주었다. 다양한 탐지기와 함께 7개의 데이터셋에서 수행된 실험 결과는 본 방법이 일관되게 우수한 성능을 보임을 입증하였으며, 관련 코드는 https://github.com/yangxue0827/RotationDetection 및 https://github.com/open-mmlab/mmrotate 에 공개되어 있다.