17일 전
기준 마스크 유도를 통한 빠른 비디오 객체 세그멘테이션
{Joon-Young Lee, Seoung Wug Oh, Seon Joo Kim, Kalyan Sunkavalli}

초록
우리는 반감독 학습 기반의 영상 객체 분할을 위한 효율적인 방법을 제안한다. 제안하는 방법은 기존 최첨단 기법들과 경쟁 가능한 정확도를 달성하면서도, 다른 방법들에 비해 훨씬 짧은 시간 내에 실행될 수 있다. 이를 위해 마스크 전파와 객체 탐지의 장점을 활용하면서도 두 접근 방식의 단점을 피할 수 있도록 설계된 깊은 시아모이즈 인코더-디코더 네트워크를 제안한다. 본 네트워크는 합성 데이터와 실제 데이터를 모두 활용하는 두 단계의 훈련 과정을 통해 학습되며, 온라인 학습이나 후처리 없이도 안정적으로 작동한다. 제안된 방법은 단일 객체 및 다중 객체 분할을 모두 커버하는 네 가지 벤치마크 세트에서 검증되었으며, 모든 벤치마크 세트에서 경쟁 가능한 정확도를 보이며, 실행 시간은 수량급(orders of magnitude)으로 빠르다. 또한, 프레임워크의 성능을 분석하고 평가하기 위해 광범위한 아블레이션 및 추가 실험을 제공한다.