2달 전
FODVid: 비디오에서 흐름 안내된 객체 발견
Singh, Silky ; Deshmukh, Shripad ; Sarkar, Mausoom ; Jain, Rishabh ; Hemani, Mayur ; Krishnamurthy, Balaji

초록
비디오에서 객체 분할은 모션 블러링, 시차, 가림 현상, 조명 변화 등의 미묘한 차이로 인해 도전적입니다. 이러한 미묘한 차이를 개별적으로 처리하는 대신, 우리는 개별적인 복잡성에 과적합을 피하면서 일반화할 수 있는 솔루션 구축에 초점을 맞춥니다. 이러한 솔루션은 비디오 코퍼스의 인간 주석 작업에 소요되는 막대한 자원을 절약하는 데도 도움이 될 것입니다. 비지도 환경에서 비디오 객체 분할(VOS) 문제를 해결하기 위해, 우리는 플로우-가이드 그래프 컷과 시간 일관성을 활용하여 분할 결과를 안내하는 새로운 파이프라인(FODVid)을 제안합니다. 기본적으로, 우리는 고려 중인 객체의 프레임 내 외관 유사성과 플로우 유사성, 그리고 프레임 간 시간 연속성을 통합하는 분할 모델을 설계하였습니다. 우리는 이 단순한 방법론을 표준 DAVIS16 비디오 벤치마크에서 광범위하게 실험적으로 분석하였습니다. 단순함에도 불구하고, 우리의 접근 방식은 비지도 VOS에서 기존 최고 접근 방식들과 비교 가능한 결과(약 2 mIoU 범위 내)를 생성합니다. 우리 기술의 단순성과 효과성은 비디오 영역에서 연구의 새로운 방향을 열어줍니다.