16일 전
비감독 비디오 객체 분할을 위한 CRF를 이용한 구분 가능한 특징 학습
Mingmin Zhen, Shiwei Li, Lei Zhou, Jiaxiang Shang, Haoan Feng, Tian Fang, Long Quan

초록
이 논문에서는 비지도 비디오 객체 분할 작업을 해결하기 위해 새로운 네트워크인 구분 특징 네트워크(Discriminative Feature Network, DFNet)를 제안한다. 영상 프레임 간 내재된 상관관계를 효과적으로 포착하기 위해, 입력 이미지로부터 전역적 관점에서 특징 분포를 드러내는 구분 특징(D-features)을 학습한다. 학습된 D-features는 조건부 확률장(CRF, Conditional Random Field) 설정 하에 테스트 이미지의 모든 특징과 대응 관계를 형성하는 데 사용되며, 이는 픽셀 간 일관성을 강제하는 데 기여한다. 실험 결과 DFNet은 평균 IoU 스코어 83.4%로 최신 기법들을 크게 앞서며, DAVIS-2016 리더보드에서 1위를 기록하였다. 또한 파라미터 수가 훨씬 적고 추론 단계에서 훨씬 더 효율적인 성능을 달성하였다. 추가로 FBMS 데이터셋과 비디오 주목성 데이터셋 ViSal에서 DFNet을 평가한 결과, 새로운 최고 성능을 기록하였다. 본 프레임워크의 일반화 능력을 further 검증하기 위해, DFNet은 이미지 객체 동시 분할(image object co-segmentation) 작업에도 적용되었다. 도전적인 PASCAL-VOC 데이터셋에서 실험을 수행한 결과, DFNet의 우수성이 확인되었다. 철저한 실험을 통해 DFNet이 이미지 간 내재된 관계를 효과적으로 포착하고, 공통된 전경 객체를 탐지할 수 있음을 입증하였다.