
초록
소수 샘플 분할(few-shot segmentation)은 지원 이미지와 쿼리 이미지 내 객체의 외형 및 자세가 크게 다를 수 있기 때문에 도전적이다. 지원 이미지에서 직접 얻은 단일 프로토타입을 사용하여 쿼리 이미지를 분할하면 의미적 모호성이 발생한다. 본 논문에서는 다양한 이미지 영역을 다수의 프로토타입과 연관지어 프로토타입 기반의 의미 표현을 강화하는 프로토타입 혼합 모델(Prototype Mixture Models, PMMs)을 제안한다. 기대값 최대화(Expectation-Maximization) 알고리즘을 통해 추정된 PMMs는 제한된 지원 이미지로부터 풍부한 채널별 및 공간적 의미 정보를 통합한다. PMMs는 표현 및 분류기로 활용되어, 쿼리 이미지 내 객체를 활성화하면서 동시에 배경 영역을 이중적인 방식으로 억제함으로써 의미 정보를 극대화한다. Pascal VOC 및 MS-COCO 데이터셋에서 실시한 광범위한 실험 결과, PMMs는 기존 최고 성능 기법들에 비해 상당한 성능 향상을 보였다. 특히, MS-COCO에서 5샷 분할 성능을 최대 5.82% 향상시켰으며, 모델 크기와 추론 속도에 대한 부담은 적은 수준에 머물렀다.