전체 슬라이드 이미지에서 생물학적 표지자 예측으로: 계산 생검학에서 엔드투엔드 딥러닝을 위한 프로토콜

히마토시린 및 에오신(H&E) 염색을 한 전체 슬라이드 이미지(WSI)는 암 진단의 기초가 되며, 최근 계산 병리학 분야에서 딥러닝 기반 기법의 발전으로 WSI로부터 생물학적 마커를 직접 예측하는 것이 가능해졌다. 그러나 정밀 종양학에서 복잡한 생물학적 마커를 대중화하기 위해서는 대규모로 조직 형질(phenotype)과 생물학적 마커를 정확히 연관지어주는 것이 여전히 핵심적인 과제이다. 본 프로토콜은 고체 종양 연관 모델링을 위한 실용적 워크플로우인 병리학적 고체 종양 연관 모델링(STAMP)을 제시하며, 딥러닝을 활용해 WSI로부터 생물학적 마커를 직접 예측할 수 있도록 한다. STAMP 워크플로우는 생물학적 마커에 독립적이며, 조직병리학 이미지 외에도 유전적 및 임상병리학적 표 형식 데이터를 추가 입력으로 포함할 수 있다. 이 프로토콜은 성공적으로 다양한 연구 문제에 적용된 다섯 가지 주요 단계로 구성되어 있다: 문제 정의, 데이터 전처리, 모델링, 평가 및 임상적 전환. STAMP 워크플로우는 임상의와 엔지니어가 함께 사용할 수 있는 협업 기반 프레임워크로서, 계산 병리학 분야의 연구 프로젝트를 수립하는 데 유용하다는 점에서 차별화된다. 예시로, 우리는 STAMP를 대장암에서 미세위상불안정성(MSI) 상태 예측에 적용하여 MSI-고 수준 종양의 정확한 식별이 가능함을 보였다. 또한, 전 세계 여러 병원에서 계산 병리학 워크플로우를 구축하기 위해 배포된 오픈소스 코드베이스를 함께 제공한다. STAMP 워크플로우는 실질적인 컴퓨팅 실행에 하루가 소요되며, 기본적인 커맨드 라인 지식이 필요하다.