자기지도형 소수 샘플 학습을 통한 의미 분할: 주석 없는 접근 방식

소수 샘플(semantic) 분할(Few-shot semantic segmentation, FSS)은 제한된 학습 데이터로 정확한 객체 분할을 가능하게 하여 의료 영상 분석 분야에서 큰 잠재력을 지닌다. 그러나 기존의 FSS 기법은 주로 레이블링된 의미적 클래스에 의존하기 때문에, 의료 영상에서 레이블 데이터가 부족한 상황에서는 적용이 어려운 실정이다. 이러한 문제를 해결하기 위해 다음과 같은 다수의 기여를 제안한다. 첫째, 스펙트럼 분해 기법을 영감으로 삼아 영상 분해 문제를 그래프 분할 문제로 재정의한다. 자기지도 학습 네트워크의 특징 유사성 행렬로부터 도출된 라플라시안 행렬의 고유벡터를 분석하여, 지원 이미지(support image) 내 관심 객체의 분포를 추정한다. 둘째, 어떤 종류의 레이블도 필요 없이 작동하는 새로운 자기지도 기반 FSS 프레임워크를 제안한다. 이 프레임워크는 지원 이미지로부터 얻은 고유벡터를 활용하여 쿼리 이미지의 마스크를 적응적으로 추정한다. 이 방법은 수동적인 레이블링이 필요 없으며, 레이블 데이터가 제한된 의료 영상에 특히 적합하다. 셋째, 지원 이미지에서 제공하는 정보를 바탕으로 쿼리 이미지의 복원을 더욱 향상시키기 위해 다중 스케일 대커널 주의 모듈(multi-scale large kernel attention module)을 도입한다. 이 모듈은 관련 특징과 세부 정보에 대해 선택적으로 강조함으로써 분할 과정을 개선하고, 더 정밀한 객체 경계 추출에 기여한다. 자연 영상 및 의료 영상 데이터셋에서의 평가 결과는 제안된 방법의 효율성과 효과성을 입증한다. 더불어, 본 방법은 일반성과 모델 무관성(model-agnostic)을 갖추고 있어 다양한 딥 아키텍처와 원활하게 통합될 수 있다. 코드는 공개적으로 \href{https://github.com/mindflow-institue/annotation_free_fewshot}{\textcolor{magenta}{GitHub}}에서 제공된다.