2달 전
TrickVOS: 비디오 객체 분할을 위한 트릭들의 집합
Evangelos Skartados; Konstantinos Georgiadis; Mehmet Kerim Yucel; Koskinas Ioannis; Armando Domi; Anastasios Drosou; Bruno Manganelli; Albert Saa-Garriga

초록
시공간 메모리(Space-time memory, STM) 네트워크 방법은 그들의 뛰어난 성능으로 인해 반감독 비디오 객체 분할(semi-supervised video object segmentation, SVOS)에서 주도적인 위치를 차지하고 있습니다. 본 연구에서는 이러한 방법들을 개선할 수 있는 세 가지 핵심 측면을 식별하였습니다: i) 감독 신호, ii) 사전 학습, iii) 공간 인식. 이를 바탕으로 우리는 각 측면을 다루는 일반적이고 방법론에 종속되지 않는 트릭의 집합인 TrickVOS를 제안합니다; i) 구조 인식 하이브리드 손실 함수, ii) 간단한 디코더 사전 학습 체계, iii) 모델 예측에 공간 제약을 부과하는 저렴한 추적기. 마지막으로, 우리는 경량화된 네트워크를 제안하고, TrickVOS로 훈련시켰을 때 이 네트워크가 DAVIS 및 YouTube 벤치마크에서 최신 방법들과 경쟁력 있는 결과를 얻으며, 모바일 기기에서 실시간으로 실행될 수 있는 첫 번째 STM 기반 SVOS 방법 중 하나임을 보여줍니다.