17일 전
다이나믹 헤드: 어텐션을 통한 객체 탐지 헤드의 통합
Xiyang Dai, Yinpeng Chen, Bin Xiao, Dongdong Chen, Mengchen Liu, Lu Yuan, Lei Zhang

초록
객체 탐지에서 위치 추정과 분류를 통합하는 복잡한 특성은 다양한 방법의 급속한 발전을 이끌어냈다. 기존 연구들은 다양한 객체 탐지 헤드에서 성능을 향상시키려 시도했지만, 통합적인 관점을 제시하지 못했다. 본 논문에서는 주목력(attention)을 활용하여 객체 탐지 헤드를 통합하는 새로운 동적 헤드 프레임워크를 제안한다. 다양한 특징 수준 간의 다중 자기 주목(self-attention) 메커니즘을 일관성 있게 결합하여 척도 인지 능력(scale-awareness)을 확보하고, 공간 위치 간의 주목을 통해 공간 인지 능력(spatial-awareness)을, 출력 채널 내부의 주목을 통해 작업 인지 능력(task-awareness)을 구현함으로써, 계산 부담 없이 객체 탐지 헤드의 표현 능력을 크게 향상시킨다. 추가 실험을 통해 제안된 동적 헤드가 COCO 기준에서 뛰어난 효과성과 효율성을 입증하였다. 표준 ResNeXt-101-DCN 백본을 사용할 경우, 기존 인기 있는 객체 탐지기보다 성능을 크게 향상시켜 54.0 AP의 새로운 최고 성능을 달성하였다. 더 나아가 최신 트랜스포머 백본과 추가 데이터를 활용하면, 현재까지의 COCO 최고 성능을 60.6 AP로 새로운 기록으로 끌어올릴 수 있다. 코드는 https://github.com/microsoft/DynamicHead 에 공개될 예정이다.