16일 전
내시경 영상 분석을 위한 자기지도 학습
Roy Hirsch, Mathilde Caron, Regev Cohen, Amir Livne, Ron Shapiro, Tomer Golany, Roman Goldenberg, Daniel Freedman, Ehud Rivlin

초록
자기지도학습(self-supervised learning, SSL)은 레이블이 없는 대량의 데이터로부터 학습할 수 있도록 해줌으로써 컴퓨터 비전 분야에서 중요한 돌파구를 가져왔다. 이러한 특성은 데이터 레이블링에 높은 전문 지식이 요구되는 생의학 분야에서 핵심적인 역할을 할 수 있다. 그러나 SSL은 아직 많은 의료 분야에서 충분히 탐색되지 않았다. 그 중 하나가 내시경 검사이다. 내시경은 감염, 만성 염증성 질환 또는 암 등을 진단하고 치료하는 데 널리 사용되는 최소 침습적 절차이다. 본 연구에서는 내시경 영상 분석(예: 대장내시경 및 복강경 검사)에 있어 선도적인 SSL 프레임워크인 마스킹 시아모이즈 네트워크(Masked Siamese Networks, MSNs)의 활용을 탐구한다. SSL의 잠재력을 극대화하기 위해 MSNs 학습을 위한 대규모 레이블 없는 내시경 영상 데이터셋을 구축하였다. 이러한 강력한 이미지 표현은 제한된 레이블 데이터셋을 활용한 2차 학습 기반으로 작용하여, 복강경 수술 단계 인식이나 대장내시경 폴립 특성 분석과 같은 내시경 벤치마크에서 최신 기술 수준의 성능을 달성하였다. 또한, 성능을 저하시키지 않은 채 레이블 데이터 크기를 50% 감소시키는 성과를 거두었다. 따라서 본 연구는 SSL이 내시경 분야에서 레이블링 데이터의 필요성을 극적으로 줄일 수 있음을 실증적으로 보여준다.