
초록
소수 샘플(sematic) 세그멘테이션은 타겟 클래스의 몇몇 레이블링된 지원 이미지(support images)만을 이용해 쿼리 이미지(query image)에서 타겟 객체를 분할하는 것을 목표로 한다. 이 도전적인 작업은 시각적 신호의 다양한 수준을 이해하고, 쿼리 이미지와 지원 이미지 간의 미세한 대응 관계를 분석하는 능력이 필요하다. 본 연구에서는 다중 수준의 특징 상관관계와 효율적인 4차원(4D) 합성곱을 활용하는 하이퍼상관 수축 네트워크(Hypercorrelation Squeeze Networks, HSNet)를 제안한다. HSNet은 중간 합성곱 계층의 다양한 수준에서 다양한 특징을 추출하고, 이를 바탕으로 4차원 상관 텐서(즉, 하이퍼상관)의 집합을 구성한다. 피라미드 구조에서 효율적인 중심-피벗(center-pivot) 4D 합성곱을 사용함으로써, 본 방법은 거시적에서 미시적(macro-to-micro) 방식으로 하이퍼상관의 고수준 의미 정보와 저수준 기하학적 정보를 점진적으로 수축하여 정밀한 세그멘테이션 마스크를 생성한다. PASCAL-5i, COCO-20i, FSS-1000과 같은 표준 소수 샘플 세그멘테이션 벤치마크에서의 뚜렷한 성능 향상은 제안된 방법의 유효성을 입증한다.