19일 전

NMS가 반격한다

Jeffrey Ouyang-Zhang, Jang Hyun Cho, Xingyi Zhou, Philipp Krähenbühl
NMS가 반격한다
초록

감지 트랜스포머(Detection Transformer, DETR)는 학습 중에 일대일 이분 매칭을 사용하여 쿼리를 직접 고유한 객체로 변환함으로써 엔드투엔드 객체 탐지가 가능하다. 최근 이 모델들은 COCO에서 전통적인 탐지기보다 뚜렷한 우아함으로 성능을 뛰어넘었다. 그러나 모델 아키텍처와 학습 스케줄링을 포함한 여러 측면에서 전통적인 탐지기와 다름을 보이며, 이로 인해 일대일 매칭의 효과성에 대한 이해가 완전하지 못한 상황이다. 본 연구에서는 DETR에서 사용하는 일대일 헝가리안 매칭과 비최대 억제(Non-Maximum Suppression, NMS)를 사용하는 전통적 탐지기의 다대일 레이블 할당 간에 엄격한 비교를 수행하였다. 놀랍게도, 동일한 설정 하에서 NMS를 사용한 다대일 할당이 표준 일대일 매칭보다 일관되게 더 높은 성능을 보였으며, 최대 2.5 mAP의 유의미한 성능 향상을 기록했다. 본 연구에서 제안한 탐지기는 전통적인 IoU 기반 레이블 할당을 사용하여 Deformable-DETR를 학습함으로써, ResNet50 백본을 사용하여 12 에포크(1x 스케줄) 내에 COCO mAP 50.2를 달성하였으며, 이는 해당 설정에서 기존의 모든 전통적 또는 트랜스포머 기반 탐지기보다 우수한 성능을 보였다. 다양한 데이터셋, 학습 스케줄, 아키텍처에서 일관되게, 이분 매칭이 성능이 우수한 탐지 트랜스포머에 필수적이지 않음을 입증하였다. 더불어, 탐지 트랜스포머의 성공은 그 표현력이 뛰어난 트랜스포머 아키텍처에 기인한다고 분석하였다. 코드는 https://github.com/jozhang97/DETA 에서 공개되어 있다.

NMS가 반격한다 | 연구 논문 | HyperAI초신경