자기지도 대비 학습을 통한 전체 슬라이드 이미지 분류를 위한 이중 스트림 다중 예제 학습 네트워크

우리는 전체 슬라이드 이미지(WSI) 분류라는 도전적인 문제에 대해 다룹니다. WSI는 매우 높은 해상도를 가지며 일반적으로 국소적 레이블이 부족합니다. 슬라이드 수준의 레이블만 제공되는 경우, WSI 분류는 다중 예제 학습(MIL) 문제로 간주할 수 있습니다. 본 연구에서는 국소적 레이블이 필요 없이 WSI 분류 및 종양 탐지에 활용 가능한 MIL 기반의 새로운 방법을 제안합니다. 제안하는 방법은 세 가지 주요 구성 요소로 구성됩니다. 첫째, 학습 가능한 거리 측정을 갖춘 이중 흐름 아키텍처를 활용하여 인스턴스 간의 관계를 모델링하는 새로운 MIL 아그리게이터를 도입합니다. 둘째, WSI는 크거나 비균형적인 백(bag)을 생성할 수 있어 MIL 모델의 학습을 방해할 수 있으므로, 자기지도형 대비 학습(self-supervised contrastive learning)을 활용하여 MIL에 적합한 표현을 추출하고, 큰 백에 따른 과도한 메모리 비용 문제를 완화합니다. 셋째, 다중 해상도 WSI 특징을 위한 피라미드형 융합 기법을 도입하여 분류 및 국소화 정확도를 추가로 향상시킵니다. 제안한 모델은 두 가지 대표적인 WSI 데이터셋에서 평가되었으며, 완전히 지도 학습 기반 방법과 비교해 거의 2% 미만의 정확도 차이를 보이며 우수한 성능을 나타냅니다. 또한, 기존의 모든 MIL 기반 방법보다 뛰어난 결과를 달성했습니다. 표준 MIL 데이터셋을 활용한 추가 벤치마크 결과는 제안하는 MIL 아그리게이터가 일반적인 MIL 문제에 있어서 뛰어난 성능을 보임을 더욱 입증합니다. GitHub 레포지토리: https://github.com/binli123/dsmil-wsi