2달 전

FODVid: 비디오에서 흐름 안내된 객체 발견

Singh, Silky ; Deshmukh, Shripad ; Sarkar, Mausoom ; Jain, Rishabh ; Hemani, Mayur ; Krishnamurthy, Balaji
FODVid: 비디오에서 흐름 안내된 객체 발견
초록

비디오에서 객체 분할은 모션 블러링, 시차, 가림 현상, 조명 변화 등의 미묘한 차이로 인해 도전적입니다. 이러한 미묘한 차이를 개별적으로 처리하는 대신, 우리는 개별적인 복잡성에 과적합을 피하면서 일반화할 수 있는 솔루션 구축에 초점을 맞춥니다. 이러한 솔루션은 비디오 코퍼스의 인간 주석 작업에 소요되는 막대한 자원을 절약하는 데도 도움이 될 것입니다. 비지도 환경에서 비디오 객체 분할(VOS) 문제를 해결하기 위해, 우리는 플로우-가이드 그래프 컷과 시간 일관성을 활용하여 분할 결과를 안내하는 새로운 파이프라인(FODVid)을 제안합니다. 기본적으로, 우리는 고려 중인 객체의 프레임 내 외관 유사성과 플로우 유사성, 그리고 프레임 간 시간 연속성을 통합하는 분할 모델을 설계하였습니다. 우리는 이 단순한 방법론을 표준 DAVIS16 비디오 벤치마크에서 광범위하게 실험적으로 분석하였습니다. 단순함에도 불구하고, 우리의 접근 방식은 비지도 VOS에서 기존 최고 접근 방식들과 비교 가능한 결과(약 2 mIoU 범위 내)를 생성합니다. 우리 기술의 단순성과 효과성은 비디오 영역에서 연구의 새로운 방향을 열어줍니다.

FODVid: 비디오에서 흐름 안내된 객체 발견 | 최신 연구 논문 | HyperAI초신경