2달 전

동작을 옵션으로 취급하여 비지도 학습 비디오 객체 분할에서의 동작 의존성 감소

Suhwan Cho; Minhyeok Lee; Seunghoon Lee; Chaewon Park; Donghyeong Kim; Sangyoun Lee
동작을 옵션으로 취급하여 비지도 학습 비디오 객체 분할에서의 동작 의존성 감소
초록

비지도 비디오 객체 분할(VOS)은 비디오 시퀀스에서 픽셀 단위로 가장 눈에 띄는 객체를 검출하는 것을 목표로 합니다. 비지도 VOS에서는 대부분의 최신 방법들이 배경과 비교하여 주요 객체가 일반적으로 독특한 움직임을 가지고 있다는 특성을 활용하기 위해 광학 흐름 맵에서 얻은 움직임 신호와 외관 신호를 함께 사용합니다. 그러나 이러한 방법들은 움직임 신호에 지나치게 의존하므로, 일부 경우에서 신뢰성이 떨어질 수 있어 안정적인 예측을 달성하지 못합니다. 이를 해결하기 위해, 우리는 움직임 신호를 선택적으로 활용하는 새로운 모션-옵션 네트워크를 제안합니다. 또한, 제안된 네트워크의 움직임이 항상 필요한 것은 아니라는 특성을 충분히 활용하기 위해 협력적 네트워크 학습 전략을 도입하였습니다. 모든 공개 벤치마크 데이터셋에서 우리의 제안된 네트워크는 실시간 추론 속도와 함께 최상의 성능을 제공합니다.