15일 전
다양한 병리 데이터셋에서의 자기지도 학습 평가
Mingu Kang, Heon Song, Seonwook Park, Donggeun Yoo, Sérgio Pereira

초록
계산병리학은 인간의 생명을 구할 수 있는 잠재력을 지니고 있지만, 모델은 레이블링된 데이터에 크게 의존하며, 병리학 이미지의 레이블링은 전통적으로 매우 비용이 많이 드는 과정이다. 자기지도 학습(self-supervised learning, SSL)은 레이블이 없는 데이터를 효과적으로 활용할 수 있는 방법으로 주목받고 있으며, 병리학 분야에 적용될 경우 하류 작업에 큰 도움이 될 수 있다. 그러나 현재까지 병리학에 적합한 SSL 방법들을 체계적으로 비교하거나, 이를 병리학 환경에 어떻게 적응시킬지에 대한 체계적인 연구는 부족한 실정이다. 이러한 문제를 해결하기 위해, 본 연구는 현재까지 가장 대규모로 병리학 이미지 데이터에 대한 SSL 사전학습에 대한 종합적인 연구를 수행한다. 본 연구에서는 다양한 하류 작업에서 4가지 대표적인 SSL 방법을 활용하여 실험을 수행하였으며, 병리학 분야에서 대규모의 도메인 정렬 사전학습이 ImageNet 기반 사전학습보다 표준 SSL 설정(선형 평가 및 미세조정 평가)뿐 아니라, 레이블이 극히 적은 상황에서도 일관되게 우수한 성능을 보임을 입증하였다. 더불어, 병리학 도메인에 특화된 기법들을 제안하였으며, 실험을 통해 이들이 성능 향상에 기여함을 확인하였다. 마지막으로, 본 연구는 자기지도 학습을 핵 구분 인스턴스 세그멘테이션이라는 도전적인 과제에 처음으로 적용하여, 다양한 환경에서 큰 및 일관된 성능 향상을 보였다.