다수의 유사성 기반 하이퍼관계 네트워크를 활용한 소량 샘플 분할

소수 샘플(semi-supervised) 의미 분할은 보기(지원) 이미지에 대해 단지 몇 개의 레이블링된 예시를 제공받아 미지 카테고리의 객체 영역을 인식하는 것을 목표로 한다. 소수 샘플 분할의 핵심은 지원 이미지와 쿼리 이미지 간에 강력한 의미적 관계를 형성하고, 과적합(overfitting)을 방지하는 것이다. 본 논문에서는 소수 샘플 의미 분할 문제를 해결하기 위한 효과적인 다중 유사도 초관계망(Multi-similarity Hyperrelation Network, MSHNet)을 제안한다. MSHNet에서는 새로운 생성형 프로토타입 유사도(Generative Prototype Similarity, GPS)를 도입하며, 이는 코사인 유사도와 함께 지원 이미지와 쿼리 이미지 간 강력한 의미적 관계를 구축하는 데 기여한다. 전역 특징을 기반으로 지역적으로 생성된 프로토타입 유사도는 국소적 특징을 기반으로 한 전역 코사인 유사도와 논리적으로 보완 관계를 형성하며, 두 유사도를 동시에 활용함으로써 쿼리 이미지와 지원 이미지 간의 관계를 더욱 포괄적으로 표현할 수 있다. 또한, MSHNet 내에서 다층, 다샷, 다유사도 초관계 특징을 효율적으로 통합하기 위해 대칭 병합 블록(Symmetric Merging Block, SMB)을 제안한다. MSHNet은 특정 카테고리 특징이 아닌 유사도 기반으로 설계되어, 더 일반적인 통일성을 달성하고 과적합을 효과적으로 줄일 수 있다. Pascal-5i와 COCO-20i 두 가지 벤치마크 의미 분할 데이터셋에서 MSHNet은 1샷 및 5샷 의미 분할 작업에서 새로운 최고 성능을 달성하였다.