17일 전

움직임 기반 양방향 네트워크를 이용한 비지도 동영상 객체 세그멘테이션

{C. -C. Jay Kuo, Xuejing Lei, Siyang Li, Bryan Seybold, Alexey Vorobyov}
움직임 기반 양방향 네트워크를 이용한 비지도 동영상 객체 세그멘테이션
초록

본 연구에서는 이동하는 객체를 사전 지식 없이 세그멘테이션하는 비지도 비디오 객체 세그멘테이션 문제를 다룬다. 먼저, 객체가 아닌 영역의 움직임 패턴을 기반으로 배경을 추정하는 운동 기반 양방향 네트워크를 제안한다. 양방향 네트워크는 배경 객체를 정확히 식별함으로써 오류 긍정 영역을 줄이는 데 기여한다. 이후, 양방향 네트워크에서 추정한 배경 정보와 인스턴스 임베딩을 그래프에 통합하여, 서로 다른 프레임의 픽셀 간을 연결하는 그래프 엣지를 통해 다중 프레임 추론이 가능하게 한다. 그래프 노드는 비용 함수를 정의하고 최소화함으로써 분류되며, 노드 레이블을 기반으로 비디오 프레임을 세그멘테이션한다. 제안하는 방법은 DAVIS 2016 및 FBMS-59 데이터셋에서 기존 최고 수준의 비지도 비디오 객체 세그멘테이션 방법들을 능가한다.