MSANet: 적은 샘플 분할 성능 향상을 위한 다중 유사성 및 주의력 가이드라인

소수 샘플 분할(Few-shot segmentation, FSS)은 단지 몇 개의 밀집 레이블링된 샘플만을 제공받아도 미지 클래스 객체를 분할하는 것을 목표로 한다. 기존의 프로토타입 학습(prototype learning) 기법은 지원 이미지(지원 샘플)의 전역 및 국소적 객체 정보를 평균화하여 단일 또는 다수의 프로토타입을 생성하는 방식으로 FSS에서 널리 사용되어 왔다. 그러나 단지 프로토타입 벡터만을 활용하는 것은 모든 학습 데이터의 특징을 충분히 표현하기에 부족할 수 있다. 보다 풍부한 특징을 추출하고 정밀한 예측을 가능하게 하기 위해, 다중 유사도 모듈과 주의 메커니즘 모듈을 포함한 새로운 네트워크 구조인 다중 유사도 및 주의 네트워크(Multi-Similarity and Attention Network, MSANet)를 제안한다. 다중 유사도 모듈은 지원 이미지와 질의 이미지의 여러 특징 맵을 활용하여 정확한 의미적 관계를 추정한다. 주의 모듈은 네트워크가 클래스 관련 정보에 집중하도록 유도한다. 제안된 MSANet은 표준 FSS 데이터셋인 PASCAL-5i 1-shot, PASCAL-5i 5-shot, COCO-20i 1-shot, COCO-20i 5-shot에서 평가되었으며, ResNet-101을 백본으로 사용한 MSANet은 모든 4개의 벤치마크 데이터셋에서 최신 기술(SOTA) 성능을 달성하여, 평균 교차율(mIoU) 기준으로 각각 69.13%, 73.99%, 51.09%, 56.80%의 성능을 기록했다. 코드는 https://github.com/AIVResearch/MSANet 에 공개되어 있다.