2달 전
동작 유도 자기 감독 객체 발견 기법 연구
Shuangrui Ding; Weidi Xie; Yabo Chen; Rui Qian; Xiaopeng Zhang; Hongkai Xiong; Qi Tian

초록
본 논문에서는 비디오에서 감독되지 않은 객체 발견 작업을 다룹니다. 이전 연구들은 광학 흐름을 처리하여 객체를 분할하는 방법으로 유망한 결과를 보여주었습니다. 그러나 광학 흐름을 입력으로 사용하면 두 가지 단점이 있습니다. 첫째, 객체가 정지 상태이거나 부분적으로 가려져 있을 때 충분한 정보를 포착하기 어렵습니다. 둘째, 질감 정보가 부족하기 때문에 광학 흐름만을 입력으로 사용할 때 시간적 일관성을 확립하는 것이 어려워집니다.이러한 제약 조건을 해결하기 위해, 우리는 연속적인 RGB 프레임을 직접 처리하고, 각 프레임 쌍 사이의 광학 흐름을 계층적 표현을 사용하여 추론하는 모델을 제안합니다. 여기서 불투명도 채널은 분할로 취급됩니다. 또한 객체의 영속성을 강제하기 위해, 서로 다른 속도로 움직이는 무작위 쌍의 프레임에서 추론된 마스크에 시간적 일관성 손실 함수를 적용하여 현재 시점에서 움직이지 않는 객체라도 모델이 분할하도록 유도합니다.실험적으로, 우리는 세 개의 공개 비디오 분할 데이터셋(DAVIS2016, SegTrackv2, FBMS-59)에서 기존 최신 방법들보다 우수한 성능을 보임을 입증하였으며, 광학 흐름 계산의 부담 없이 계산 효율성이 뛰어남을 확인하였습니다.