11일 전
트랜스포머를 활용한 다객체 추적을 위한 대조 학습
Pierre-François De Plaen, Nicola Marinello, Marc Proesmans, Tinne Tuytelaars, Luc Van Gool

초록
객체 탐지 기술의 새로운 가능성을 열었던 DETR(Detection Transformer)는 이미지 특징을 객체 수준의 표현으로 변환하는 번역 작업으로서 객체 탐지를 모델링하였다. 기존의 연구들은 일반적으로 다중 객체 추적(Multi-Object Tracking, MOT)을 수행하기 위해 DETR에 비용이 많이 드는 모듈을 추가함으로써 복잡한 아키텍처를 구성해왔다. 본 연구에서는 이러한 복잡성을 피하고, 개체 수준의 대조 손실(instance-level contrastive loss), 개선된 샘플링 전략, 그리고 경량 할당 방법을 활용하여 DETR을 MOT 모델로 전환하는 방법을 제안한다. 제안하는 학습 방식은 탐지 성능을 유지하면서 객체의 외형 특징을 학습할 수 있으며, 거의 추가적인 부담 없이 수행된다. 이 방법은 도전적인 BDD100K 데이터셋에서 기존 최고 성능을 +2.6 mMOTA의 성능 향상으로 초월하였으며, MOT17 데이터셋에서는 기존의 트랜스포머 기반 방법들과 경쟁 가능한 성능을 보였다.