2달 전

가짜 플로우 생성을 통한 비지도 동영상 객체 분할 개선

Suhwan Cho; Minhyeok Lee; Jungho Lee; Donghyeong Kim; Seunghoon Lee; Sungmin Woo; Sangyoun Lee
가짜 플로우 생성을 통한 비지도 동영상 객체 분할 개선
초록

비지도 비디오 객체 분할(VOS, Video Object Segmentation) 또는 비디오 주요 객체 검출은 비디오에서 픽셀 단위로 가장 눈에 띄는 객체를 감지하는 것을 목표로 합니다. 최근에는 RGB 이미지와 광학 흐름 맵을 모두 활용하는 두 스트림 접근 방식이 큰 관심을 받고 있습니다. 그러나 제한된 양의 학습 데이터는 여전히 중요한 도전 과제입니다. 본 연구에서는 단일 이미지에서 가짜 광학 흐름을 시뮬레이션하여 안정적인 네트워크 학습을 위한 대규모 학습 데이터를 생성하는 새로운 데이터 생성 방법을 제안합니다. 광학 흐름 맵이 깊이 맵에 크게 의존한다는 관찰에서 영감을 받아, 각 이미지의 추정된 깊이 맵을 개선하고 확장하여 가짜 광학 흐름을 생성합니다. 우리의 시뮬레이션된 이미지-흐름 쌍을 통합함으로써 복잡한 모듈에 의존하지 않고 모든 공개 벤치마크 데이터셋에서 새로운 최고 성능을 달성하였습니다. 우리는 이 데이터 생성 방법이 미래 VOS 연구의 잠재적 돌파구가 될 것으로 믿습니다.

가짜 플로우 생성을 통한 비지도 동영상 객체 분할 개선 | 최신 연구 논문 | HyperAI초신경