소수 샘플 세그멘테이션을 위한 특징 모호성 제거

최근 소수 샘플 분할(Few-shot Segmentation, FSS) 분야의 발전은 쿼리와 서포트 특징 간 픽셀 단위 매칭을 활용해 왔으며, 이는 일반적으로 크로스 어텐션 기반으로 이루어져, 동일 클래스의 서포트 전경(FG) 특징과 대응하는 쿼리 전경 특징을 선택적으로 활성화한다. 그러나 백본의 깊은 계층에서 큰 수용 영역(Receptive Field)으로 인해 추출된 쿼리 및 서포트 전경 특징은 불가피하게 배경(BG) 특징과 혼합되며, 이로 인해 크로스 어텐션 내의 전경-전경(FG-FG) 매칭이 방해받는다. 결과적으로 쿼리 전경 특징은 상대적으로 적은 수의 서포트 전경 특징과 융합되며, 서포트 정보의 효율적인 활용이 제한된다.본 논문에서는 기존의 크로스 어텐션 기반 FSS 방법에 쉽게 통합할 수 있는 새로운 플러그인 모듈인 '모호성 제거 네트워크(ambiguity elimination network, AENet)'를 제안한다. 주요 아이디어는 모호한 전경 특징을 보정하기 위해 구분력 있는 쿼리 전경 영역을 탐색하고, 전경 정보의 비율을 높여 배경 특징의 부정적 영향을 억제하는 것이다. 이를 통해 자연스럽게 전경-전경 매칭 성능이 향상된다. 제안된 AENet을 CyCTR, SCCAN, HDMNet 세 가지 기준 모델에 적용하여 평가한 결과, 각각의 성능이 크게 향상되었으며, 특히 SCCAN의 1-샷 성능은 PASCAL-5$^i$와 COCO-20$^i$에서 각각 3.0% 이상 향상되었다. 코드는 https://github.com/Sam1224/AENet 에서 공개되어 있다.