3달 전

점들을 축에 투영하기: 점-축 표현을 통한 방향성 물체 탐지

Zeyang Zhao, Qilong Xue, Yuhang He, Yifan Bai, Xing Wei, Yihong Gong
점들을 축에 투영하기: 점-축 표현을 통한 방향성 물체 탐지
초록

이 논문은 방향성 물체 검출을 위한 점-축 표현(point-axis representation)을 제안하며, 두 가지 핵심 구성 요소인 점과 축을 통해 유연성과 기하학적으로 직관적인 특성을 강조한다. 1) 점들은 물체의 공간적 범위와 윤곽을 명확히 하여 세밀한 형태 정보를 제공한다. 2) 축은 물체의 주요 방향성을 정의하며, 정밀한 검출에 필수적인 방향성 정보를 제공한다. 점-축 표현은 위치와 회전을 분리함으로써 전통적인 경계상자 기반 접근 방식에서 흔히 발생하는 손실 불연속성 문제를 해결한다. 추가적인 레이블을 도입하지 않고도 효과적인 최적화를 가능하게 하기 위해, 점 집합 학습을 감독하기 위한 최대 투영 손실(max-projection loss)과 강건한 축 표현 학습을 위한 교차축 손실(cross-axis loss)을 제안한다. 또한 이 표현을 기반으로, DETR 프레임워크를 원활하게 통합하여 정확한 점-축 예측과 엔드투엔드 검출을 수행하는 방향성 DETR 모델을 제시한다. 실험 결과, 방향성 물체 검출 작업에서 의미 있는 성능 향상이 입증되었다.