2달 전
MOTRv2:事전 학습된 객체 검출기로 엔드투엔드 다중 객체 추적 부트스트래핑
Zhang, Yuang ; Wang, Tiancai ; Zhang, Xiangyu

초록
본 논문에서는 MOTRv2를 제안합니다. 이는 사전 훈련된 객체 검출기와 함께 사용하여 엔드투엔드 다중 객체 추적을 부트스트랩하는 간단하면서도 효과적인 파이프라인입니다. 기존의 엔드투엔드 방법론인 MOTR과 TrackFormer는 주로 떨어진 객체 검출 성능으로 인해 검출 후 추적 방식에 비해 열등합니다. 우리는 MOTR의 성능을 개선하기 위해 우아하게 추가적인 객체 검출기를 통합하려고 합니다. 먼저 쿼리의 앵커 포맷을 채택한 후, 추가적인 객체 검출기를 사용하여 앵커로서 제안(proposals)을 생성합니다. 이를 통해 MOTR에게 검출 사전 정보를 제공합니다. 이 간단한 수정은 MOTR에서 객체 검출과 연관성 작업의 공동 학습 간의 충돌을 크게 완화시킵니다. MOTRv2는 쿼리 전파 특성을 유지하며 대규모 벤치마크에서도 잘 확장됩니다. MOTRv2는 그룹 댄스 도전 과제인 1차 다중 사람 추적에서 1위(73.4% HOTA on DanceTrack)를 차지하였으며, BDD100K 데이터셋에서도 최신 수준의 성능을 보여주었습니다. 우리는 이 간단하고 효과적인 파이프라인이 엔드투엔드 다중 객체 추적 커뮤니티에 새로운 통찰력을 제공할 수 있기를 바랍니다. 코드는 \url{https://github.com/megvii-research/MOTRv2}에서 확인할 수 있습니다.