
초록
이미지 분류 작업에서 학습된 의미 특성(Semantic features)과 유사도 매칭 작업에서 학습된 외관 특성(Appearance features)이 서로 보완한다는 점을 관찰하여, 실시간 객체 추적을 위한 이중 시아메즈 네트워크인 SA-Siam을 구축하였습니다. SA-Siam은 의미 지점(semantic branch)과 외관 지점(appearance branch)으로 구성되어 있습니다. 각 지점은 유사도 학습 시아메즈 네트워크입니다. SA-Siam의 중요한 설계 선택 중 하나는 두 지점을 별도로 훈련시켜 두 유형의 특성이 서로 다른 성질(heterogeneity)을 유지하는 것입니다. 또한, 우리는 의미 지점에 채널 주의 메커니즘(channel attention mechanism)을 제안합니다. 채널별 가중치는 대상 위치 주변의 채널 활성화에 따라 계산됩니다. SiamFC \cite{SiamFC}에서 상속된 아키텍처는 우리의 추적기가 실시간보다 빠르게 작동할 수 있게 하며, 이중 설계와 주의 메커니즘은 추적 성능을 크게 개선합니다. 제안된 SA-Siam은 OTB-2013/50/100 벤치마크에서 모든 다른 실시간 추적기보다 크게 우수한 성능을 보입니다.