2달 전

Strong-TransCenter: Transformer와 밀집 표현을 활용한 개선된 다중 객체 추적

Amit Galor; Roy Orfaig; Ben-Zion Bobrovsky
Strong-TransCenter: Transformer와 밀집 표현을 활용한 개선된 다중 객체 추적
초록

최근 몇 년 동안 트랜스포머 네트워크는 다양한 분야에서 연구의 중심이 되어왔으며, 다른 컴퓨터 비전 작업에서 최고 수준의 성능을 초월할 수 있는 능력을 보여주었습니다. 그러나 다중 객체 추적(Multiple Object Tracking, MOT) 작업에서는 트랜스포머의 잠재력을 활용하는 것이 아직 상대적으로 탐구되지 않았습니다. 이 영역에서 선구적인 노력 중 하나인 TransCenter는 밀집된 객체 쿼리를 사용하는 트랜스포머 기반 MOT 아키텍처로, 뛰어난 추적 능력을 보여주면서도 합리적인 실행 시간을 유지하였습니다. 그럼에도 불구하고, MOT에서 중요한 측면 중 하나인 추적 이동량 추정은 연관 오류를 더욱 줄일 여지가 있습니다.이에 대한 도전에 대응하여, 본 논문에서는 TransCenter에 대한 새로운 개선점을 제시합니다. 우리는 Track-by-Detection 패러다임을 기반으로 하는 후처리 메커니즘을 제안하여, 추적 이동량 추정을 개선하고자 합니다. 우리의 접근 방식은 트랜스포머 출력을 측정 오차 추정에 통합하는 정교하게 설계된 칼만 필터(Kalman filter)와 대상 재식별을 위한 임베딩 네트워크(embedding network)를 사용하는 것을 포함합니다. 이 복합 전략은 추적 과정의 정확성과 견고성을 크게 향상시키는 결과를 가져옵니다.우리는 MOTChallenge 데이터셋인 MOT17과 MOT20에서 포괄적인 실험을 통해 우리의 기여를 검증하였으며, 제안된 접근 방식이 다른 트랜스포머 기반 추적기보다 우수한 성능을 보였습니다. 코드는 공개적으로 이용 가능하며, 다음 주소에서 확인할 수 있습니다: https://github.com/amitgalor18/STC_Tracker