2달 전
비디오 객체 분할을 위한 간단하면서도 강력한 전역 최적화 방법
Georgy Ponimatkin; Nermin Samet; Yang Xiao; Yuming Du; Renaud Marlet; Vincent Lepetit

초록
우리는 비디오에서 비지도 객체 분할을 위한 간단하면서도 강력한 접근 방식을 제안합니다. 입력 시퀀스 전체에서 주요 주목할 만한 객체의 마스크를 나타내는 목적 함수를 소개합니다. 이 방법은 독립적인 이미지 특징과 광학 흐름에만 의존하며, 이러한 특징들은 오프더셀프 자기지도 학습 방법을 사용하여 얻을 수 있습니다. 이 목적 함수는 슈퍼픽셀이나 희소화 없이 시퀀스의 길이에 따라 확장되며, 특정 학습 없이도 다양한 데이터셋에 일반화됩니다. 실제로 이 목적 함수는 전체 비디오에 적용된 스펙트럼 클러스터링의 형태에서 유도될 수 있습니다. 우리의 방법은 표준 벤치마크(DAVIS2016, SegTrack-v2, FBMS59)에서 최신 기술과 동등한 성능을 달성하면서 개념적이고 실용적으로 훨씬 더 단순합니다. 코드는 https://ponimatkin.github.io/ssl-vos 에서 제공됩니다.