
초록
본 연구에서는 유효 객체에 대한 인스턴스 수준의 세그멘테이션 마스크를 자동으로 생성하고 비디오 내에서 이를 추적하는 비감독 비디오 객체 세그멘테이션을 위한 새로운 접근법을 제안한다. 기존 방법에서 발생하는 시간적 전파, 추적, 새로운 객체 추가 과정 중 발생하는 드리프트 문제를 효율적으로 해결한다. 이를 위해, 마스크의 품질을 점검하는 역할을 수행하는 다양한 기준들의 앙상블을 활용하여 온라인 방식으로 마스크를 개선하는 새로운 아이디어를 제안한다. 또한, 마스크 품질을 평가하기 위해 신경망 기반의 '선택기 네트워크(Selector Net)'를 도입한다. 제안된 네트워크는 다양한 데이터셋에 대해 일반화될 수 있도록 학습되며, 비디오 전반에 걸쳐 누적되는 노이즈를 효과적으로 제한할 수 있다. 이에 따라 Davis 2019 비감독 챌린지 데이터셋에서 J&F 평균 점수 61.6%의 최신 기술 수준 성능을 달성하였다. 또한 FBMS 및 SegTrack V2와 같은 다른 데이터셋에서도 기존 방법들과 비교하여 우수하거나 동등한 성능을 보였다.