16일 전

비감독 비디오 객체 분할을 위한 CRF를 이용한 구분 가능한 특징 학습

Mingmin Zhen, Shiwei Li, Lei Zhou, Jiaxiang Shang, Haoan Feng, Tian Fang, Long Quan
비감독 비디오 객체 분할을 위한 CRF를 이용한 구분 가능한 특징 학습
초록

이 논문에서는 비지도 비디오 객체 분할 작업을 해결하기 위해 새로운 네트워크인 구분 특징 네트워크(Discriminative Feature Network, DFNet)를 제안한다. 영상 프레임 간 내재된 상관관계를 효과적으로 포착하기 위해, 입력 이미지로부터 전역적 관점에서 특징 분포를 드러내는 구분 특징(D-features)을 학습한다. 학습된 D-features는 조건부 확률장(CRF, Conditional Random Field) 설정 하에 테스트 이미지의 모든 특징과 대응 관계를 형성하는 데 사용되며, 이는 픽셀 간 일관성을 강제하는 데 기여한다. 실험 결과 DFNet은 평균 IoU 스코어 83.4%로 최신 기법들을 크게 앞서며, DAVIS-2016 리더보드에서 1위를 기록하였다. 또한 파라미터 수가 훨씬 적고 추론 단계에서 훨씬 더 효율적인 성능을 달성하였다. 추가로 FBMS 데이터셋과 비디오 주목성 데이터셋 ViSal에서 DFNet을 평가한 결과, 새로운 최고 성능을 기록하였다. 본 프레임워크의 일반화 능력을 further 검증하기 위해, DFNet은 이미지 객체 동시 분할(image object co-segmentation) 작업에도 적용되었다. 도전적인 PASCAL-VOC 데이터셋에서 실험을 수행한 결과, DFNet의 우수성이 확인되었다. 철저한 실험을 통해 DFNet이 이미지 간 내재된 관계를 효과적으로 포착하고, 공통된 전경 객체를 탐지할 수 있음을 입증하였다.

비감독 비디오 객체 분할을 위한 CRF를 이용한 구분 가능한 특징 학습 | 최신 연구 논문 | HyperAI초신경